ES2582554T3 - Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas - Google Patents

Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas Download PDF

Info

Publication number
ES2582554T3
ES2582554T3 ES13722968.8T ES13722968T ES2582554T3 ES 2582554 T3 ES2582554 T3 ES 2582554T3 ES 13722968 T ES13722968 T ES 13722968T ES 2582554 T3 ES2582554 T3 ES 2582554T3
Authority
ES
Spain
Prior art keywords
oligonucleotide
sequence
amplification
region
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13722968.8T
Other languages
English (en)
Inventor
Harlan S. Robins
Christopher S. Carlson
Robert J. Livingston
Ryan O. Emerson
Anna Sherwood
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adaptive Biotechnologies Corp
Original Assignee
Adaptive Biotechnologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adaptive Biotechnologies Corp filed Critical Adaptive Biotechnologies Corp
Application granted granted Critical
Publication of ES2582554T3 publication Critical patent/ES2582554T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Abstract

Una composición para la normalización de la eficacia de la amplificación de un conjunto de cebadores oligonucleótidos para amplificar secuencias de ácidos nucleicos reordenadas que codifican uno o más receptores del sistema inmunitario adaptativo en una muestra biológica obtenida de células linfoides de un sujeto mamífero, comprendiendo cada receptor del sistema inmunitario adaptativo una región variable y una región de unión, comprendiendo la composición: una pluralidad de oligonucleótidos molde sintéticos, teniendo cada oligonucleótido molde sintético una concentración conocida antes de la amplificación y una secuencia de oligonucleótido de una fórmula general: 5'-U1-B1-V-B2-R-B3-J-B4-U2-3' (I) en donde: (a) V es una secuencia de oligonucleótido que comprende al menos 20 y como máximo 1000 nucleótidos contiguos de una región variable (V) de receptor del sistema inmunitario adaptativo, o su complementario, y comprendiendo cada V una secuencia de oligonucleótido de región V única; (b) J es una secuencia de oligonucleótido que comprende al menos 15 y como máximo 600 nucleótidos contiguos de una región de unión (J) de receptor del sistema inmunitario adaptativo, o su complementario, y comprendiendo cada J una secuencia de oligonucleótido de región J única; (c) U1 es nada o comprende una secuencia de oligonucleótido que se selecciona de (i) una primera secuencia de oligonucleótido adaptador universal, y (ii) una primera secuencia de oligonucleótido específico de plataforma de secuenciación, que está unida a y situada 5' respecto a una primera secuencia de oligonucleótido adaptador universal; (d) U2 es nada o comprende una secuencia de oligonucleótido que se selecciona de (i) una segunda secuencia de oligonucleótido adaptador universal, y (ii) una segunda secuencia de oligonucleótido específico de plataforma de secuenciación, que está unida a y situada 5' respecto a una segunda secuencia de oligonucleótido adaptador universal; (e) está presente al menos uno de B1, B2, B3 y B4 y cada uno de B1, B2, B3 y B4 comprende un oligonucleótido que comprende una secuencia de código de barras de 3-25 nucleótidos contiguos que identifica de forma única, como una combinación emparejada, (i) la secuencia de oligonucleótido de la región V única de (a), y (ii) la secuencia de oligonucleótido de la región J única de (b); (f) R es nada o comprende un sitio de reconocimiento de enzima de restricción que comprende una secuencia de oligonucleótido que está ausente de (a)-(e), y en donde: (g) la pluralidad de oligonucleótidos molde sintéticos comprende una serie de al menos a o al menos b secuencias de oligonucleótidos únicas, la que sea mayor, en donde a es el número de segmentos génicos que codifican la región V de receptor del sistema inmunitario adaptativo única en el sujeto y b es el número de segmentos génicos que codifican la región J de receptor del sistema inmunitario adaptativo única en el sujeto. y la composición comprende al menos un oligonucleótido molde sintético para la secuencia de oligonucleótido de región V única y al menos un oligonucleótido molde sintético para cada secuencia de oligonucleótido de región J única.

Description

5
10
15
20
25
30
35
40
45
50
55
DESCRIPCION
Composiciones y metodo para medir y calibrar el sesgo de la amplificacion en reacciones de PCR multiplexadas Antecedentes de la invencion Campo de la invencion
La presente descripcion se refiere en general a la secuenciacion de alta capacidad cuantitativa de ADN que codifica receptores del sistema inmunitario adaptativo (p. ej., ADN que codifica receptores de linfocitos T (TCR) e inmunoglobulinas (IG)) en reacciones de amplificacion de acido nucleico multiplexadas. En particular, las composiciones y metodos descritos en la presente memoria superan distorsiones indeseables en la cuantificacion de las secuencias que codifican receptores del sistema inmunitario adaptativo que pueden ser resultado del uso sesgado en mayor cantidad y/o uso en menor cantidad de cebadores de oligonucleotidos espedficos en la amplificacion de ADN multiplexada.
Descripcion de la tecnica relacionada
El sistema inmunitario adaptativo usa varias estrategias para generar un repertorio de receptores de antfgenos de linfocitos T y B, es decir, receptores del sistema inmunitario adaptativo, con suficiente diversidad para reconocer el universo de potenciales patogenos. La capacidad de los linfocitos T para reconocer el universo de antigenos asociados con diferentes canceres u organismos infecciosos es conferida por su receptor de antigeno de linfocitos T (TCR), que es un heterodfmero de una cadena a (alfa) del locus de TCRA y una cadena p (beta) del locus de TCRB, o un heterodfmero de una cadena y (gamma) del locus de TCRG y una cadena 6 (delta) del locus de TCRD. Las protemas que componen estas cadenas son codificadas por ADN, que en celulas linfoides usa un mecanismo de reordenacion unico para generar una diversidad tremenda de TCR. Este receptor de reconocimiento inmunitario de multiples subunidades se asocia con el complejo CD3 y se une a peptidos presentados por las protemas del complejo mayor de histocompatibilidad (MHC) de clase I o MHC de clase II en la superficie de las celulas presentadoras de antfgeno (APC). La union del TCR al peptido antigenico en la APC es el suceso central en la activacion de los linfocitos T, que ocurre en una sinapsis inmunologica en el punto de contacto entre el linfocito T y la APC.
Cada peptido TCR contiene regiones determinantes de la complementariedad (CDR) variables, asf como regiones armazon (FR) y una region constante. La diversidad de secuencias de los linfocitos T ap esta determinada en gran medida por la secuencia de aminoacidos de los bucles de la tercera region determinante de la complementariedad (CDR3) de los dominios variables de las cadenas ay p, cuya diversidad es resultado de la recombinacion entre los segmentos genicos variable (Vp), de diversidad (Dp), y de union (Jp) en el locus de la cadena p, y entre segmentos genicos Va y Ja analogos en el locus de la cadena a, respectivamente. La existencia de multiples segmentos genicos en los locus de la cadena a y p del TCR permite que sea codificado un gran numero de secuencias de CDR3 distintas. La diversidad de secuencia del CDR3 aumenta mas por la adicion y eliminacion independientes de nucleotidos en las uniones Vp-Dp, Dp-Jp, y Va-Ja durante el proceso de la reorganizacion de genes del TCR. En relacion con esto, hay inmunocompetencia derivada de la diversidad de TCR.
El heterodfmero de TCR y6 se distingue del de TCR ap en que codifica un receptor que interacciona estrechamente con el sistema inmunitario innato, y reconoce al antfgeno de una forma no dependiente de HLA. El TCRy6 es expresado pronto en el desarrollo, y tiene una distribucion anatomica especializada, especificidades unicas de patogeno y molecula pequena, y un amplio espectro de interacciones celulares innatas y adaptativas. Se establece pronto en la ontogenia un patron sesgado de la expresion de los segmentos V y J del TCRy. Por consiguiente, el repertorio diverso de TCRy en tejidos adultos es el resultado de expansion periferica amplia despues de estimulacion por exposicion ambiental a moleculas patogenas y toxicas.
Las inmunoglobulinas (Igs o IG), tambien denominadas en la presente memoria receptores de linfocitos B (BCR), son protemas expresadas por linfocitos B que consisten en 4 cadenas de polipeptidos, dos cadenas pesadas (cadenas H) del locus IGH y dos cadenas ligeras (cadenas L) del locus IGK o del iGl, que forman una estructura H2L2. Las cadenas H y L contiene cada una tres regiones determinantes de la complementariedad (CDR) implicadas en el reconocimiento de antfgenos, asf como regiones armazon y un dominio constante, analogo al tCr. Las cadenas H de las Ig son expresadas inicialmente como isoformas unidas a membrana, usando los exones de las regiones constantes IGM o IGD, pero despues del reconocimiento del antfgeno, la region constante puede cambiar de clase a varios isotipos adicionales, que incluyen IGG, IGE e IGA. Como con los TCR, la diversidad de las Ig indiferenciadas en un individuo se determina principalmente por las regiones determinantes de la complementariedad hipervariables (CDR). Similar al TCRB, el dominio CDR3 de las cadenas H es creado por la union combinatoria de los segmentos genicos de Vh, Dh, y Jh. La diversidad de secuencia del dominio hipervariable aumenta mas por la adicion y eliminacion independiente de nucleotidos en las uniones Vh-Dh, Dh-Jh y Vh-Jh durante el proceso de reordenacion de genes. Distinto del TCR, la diversidad de secuencia de la Ig aumenta mas por hipermutacion somatica (SHM) por el gen de IG reordenado despues de que un linfocito B indiferenciado reconoce inicialmente un antfgeno. El proceso de la SHM no esta restringido a la CDR3 y por lo tanto puede introducir
5
10
15
20
25
30
35
40
45
50
55
60
cambios en la secuencia de la lmea germinal en las regiones armazon, CDR1 y CDR2, asf como en la CDR3 reordenada somaticamente.
Puesto que el sistema inmunitario adaptativo funciona en parte por expansion clonal de celulas que expresan TCR y BCR unicos, es importante medir con precision los cambios en la abundancia total de cada uno de los clones de linfocitos T o linfocitos B, para entender la dinamica de una respuesta inmunitaria adaptativa. Por ejemplo, un ser humano sano tiene unos pocos millones de cadenas de TCRI3 reordenadas unicas, cada una transportada en cientos a miles de linfocitos T clonales, del casi trillon de linfocitos T en un individuo sano. Usando avances en la secuenciacion de alta capacidad, recientemente ha surgido un nuevo campo de la inmunologfa molecular para el perfil de amplios repertorios de TCR y BCR. Se describen composiciones y metodos para la secuenciacion de secuencias de genes de receptores del sistema inmunitario adaptativo reordenados y para la determinacion del clonotipo en los documentos U.S.A.N. 13/217.126 (US2012058902), U.S.A.N. 12/794.507 (USO2010330571); PCT/US2011/026373 (WO2011106738); PCT/US2011/049012 (WO2012027503); y WO2010053587.
Hasta la fecha, se han usado diferentes estrategias para secuenciar acidos nucleicos que codifican receptores del sistema inmunitario adaptativo cuantitativamente con alto rendimiento, y estas estrategias se pueden distinguir, por ejemplo, por el procedimiento que se usa para amplificar las regiones que codifican el CDR3, y por la eleccion de la secuenciacion del ADN genomico (ADNg) o ARN mensajero (ARNm).
La secuenciacion del ARNm es un metodo potencialmente mas facil que la secuenciacion del ADNg, porque los sucesos de corte y empalme del ARNm eliminan el intron entre los segmentos J y C. Esto permite la amplificacion de los receptores del sistema inmunitario adaptativo (p. ej., TCR o Ig) que tienen diferentes regiones V y regiones J usando un cebador de PCR 3' comun en la region C. Para cada TCRp, por ejemplo, los 13 segmentos J tienen todos menos de 60 pares de bases (pb) de longitud. Por lo tanto, los sucesos de corte y empalme dan secuencias de polinucleotidos identicas que codifican las regiones constantes de TCRp (independientemente de que secuencias V y J se usen) con menos de 100 pb de la union VDJ reordenada. Despues, el ARNm cortado y empalmado se puede transcribir de forma inversa en ADN complementario (ADNc) usando cebadores poli-dT complementarios de la cola de poli-A del ARNm, cebadores pequenos aleatorios (normalmente hexameros o nonameros) u oligonucleotidos espedficos del segmento C. Esto producina una biblioteca no sesgada de ADNc de TCR (porque todos los ADNc son cebados con el mismo oligonucleotido, sea poli-dT, hexamero aleatorio u oligomero espedficos de segmento C), que despues se puede secuenciar para obtener informacion sobre el segmento V y J usado en cada reordenacion, asf como la secuencia espedfica del CDR3. Dicha secuenciacion podna usar tecnologfa de CDR3 que abarca lecturas largas ("lectura larga") individuales, o en su lugar podna implicar el ensamblaje al azar ("shotgun") de las secuencias mas largas usando bibliotecas fragmentadas y lecturas de secuencia mas cortas de mayor rendimiento.
Los esfuerzos para cuantificar el numero de celulas en una muestra que expresan un TCR reordenado particular (o Ig) basado en la secuenciacion de ARNm eran, no obstante, diffciles de interpretar, porque cada celula expresa potencialmente diferentes cantidades de ARNm de TCR. Por ejemplo, los linfocitos T activados in vitro tienen 10-100 veces mas ARNm por celula que los linfocitos T quiescentes. Hasta la fecha, hay informacion muy limitada sobre la cantidad relativa de ARNm de TCR en linfocitos T de diferentes estados funcionales, y por lo tanto, la cuantificacion del ARNm en masa no mide necesariamente de forma precisa el numero de celulas que llevan cada una reordenacion de TCR clonal.
La mayona de los linfocitos T, por otra parte, tienen un gen de TCRa reordenado productivamente y un gen de TCRp reordenado productivamente (o dos tCRy y TCR8 reordenados), y la mayona de los linfocitos B tienen un gen de cadena pesada de Ig reordenado productivamente y un gen de cadena ligera de Ig reordenado productivamente (sea IGK o IGL) de modo que la cuantificacion en una muestra de ADN genomico que codifica los TCR y BCR debena correlacionarse directamente, respectivamente, con el numero de linfocitos T o B en la muestra. La secuenciacion genomica de polinucleotidos que codifican una cualquiera o mas de las cadenas de receptor inmunitario del sistema adaptativo implica convenientemente amplificar con igual eficacia todas de las muchas posibles secuencias de CDR3 reordenadas que estan presentes en una muestra que contiene ADN de celulas linfoides de un sujeto, seguido de secuenciacion cuantitativa, de modo que se puede obtener una medicion cuantitativa de la abundancia relativa de cada clonotipo de CDR3 reordenado.
Sin embargo, se encuentran dificultades con dichos procedimientos, en cuanto que puede no lograrse facilmente las eficacias de amplificacion y secuenciacion para cada clon reordenado usando PCR multiplexada. Por ejemplo, en el TCRB cada clon usa uno de 54 posibles genes que codifican la region V de la lmea germinal y uno de 13 posibles genes que codifican la region J. La secuencia de ADN de los segmentos V y J es necesariamente diversa, con el fin de generar un repertorio inmunitario adaptativo diverso. Esta diversidad de secuencia hace que sea imposible disenar una secuencia de cebador universal unica que se reasocie con todos los segmentos V (o segmentos J) con igual afinidad, y produzca muestras de ADN complejas en las que la determinacion precisa de las multiples secuencias distintas contenidas en las mismas esta impedida por limitaciones tecnicas basadas en la capacidad de cuantificar una pluralidad de especies moleculares simultaneamente usando la amplificacion multiplexada y la secuenciacion de alto rendimiento.
Uno o mas factores pueden dar lugar a artefactos que sesgan la correlacion entre los resultados de datos de secuenciacion y el numero de copias en un clonotipo de entrada, comprometiendo la capacidad de obtener datos
5
10
15
20
25
30
35
40
45
50
55
60
cuantitativos fiables a partir de las estrategias de secuenciacion que se basan en amplificacion multiplexada de un coleccion muy diversa de moldes de genes de TCRp. Estos artefactos a menudo son resultado del uso desigual de diversos cebadores durante la etapa de amplificacion multiplexada. Dicho uso sesgado de uno o mas cebadores oligonucleotidos en una reaccion multiplexada que usa diversos moldes de amplificacion, puede surgir como una funcion de las diferentes cineticas de reasociacion debido a una o mas diferencias en la composicion de bases nucleotidicas de los moldes y/o cebadores oligonucleotidos, diferencias en la longitud de moldes y/o cebadores, la polimerasa particular que se usa, las temperaturas de la reaccion de amplificacion (p. ej., temperaturas de reasociacion, alargamiento y/o desnaturalizacion), y/u otros factores (p. ej., Kanagawa, 2003 J. Biosci. Bioeng. 96:317; Day et al., 1996 Hum. Mol. Genet. 5:2039; Ogino et al., 2002 J. Mol. Diagnost. 4:185; Barnard et al., 1998 Biotechniques 25:684; Aird et al., 2011 Genome Biol. 12:R18).
Claramente, siguen siendo necesarias composiciones y metodos mejorados que permitiran la cuantificacion precisa de la diversidad de secuencias de ADN que codifican receptores del sistema inmunitario adaptativo en muestras complejas, de una forma que evite los resultados sesgados tales como representacion erronea mayor o menos de secuencias individuales debido a sesgos en la amplificacion de moldes espedficos en un conjunto de cebadores oligonucleotidos usado para la amplificacion multiplexada de una poblacion de ADN molde compleja. Las realizaciones aqu descritas abordan esta necesidad y proporcionan otras ventajas relacionadas.
Compendio de la invencion
Una composicion para normalizar la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos, que puede amplificar moleculas de acido nucleico reordenadas que codifican uno o mas receptores del sistema inmunitario adaptativo en una muestra biologica, que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto mairnfero, comprendiendo cada receptor del sistema inmunitario adaptativo una region variable y una region de union, comprendiendo la composicion una pluralidad de oligonucleotidos molde que tienen una pluralidad de secuencias de oligonucleotido de formula general: 5-U1-B1-V-B2-R-B3-J-B4-U2-3' [I] en donde: (a) V es un polinucleotido que comprende al menos 20 y no mas de 1000 nucleotidos contiguos de una region variable (V) del receptor del sistema inmunitario adaptativo, o su complementario, y comprendiendo cada polinucleotido V una secuencia de oligonucleotido unica; (a) J es un polinucleotido que comprende al menos 15 y no mas de 600 nucleotidos contiguos de una region de union (J) del receptor del sistema inmunitario adaptativo, o su complementario, y comprendiendo cada polinucleotido J una secuencia de oligonucleotido unica; (c) U1 es nada o comprende una secuencia de oligonucleotido que se selecciona de (i) una primera secuencia de oligonucleotido adaptador universal, y (ii) una primera secuencia de oligonucleotido espedfico de plataforma de secuenciacion, que esta unida a y situada 5' respecto a una primera secuencia de oligonucleotido adaptador universal; (c) U2 es nada o comprende una secuencia de oligonucleotido que se selecciona de (i) una segunda secuencia de oligonucleotido adaptador universal, y (ii) una segunda secuencia de oligonucleotido espedfico de plataforma de secuenciacion, que esta unida a y situada 5' respecto a una segunda secuencia de oligonucleotido adaptador universal; (e) B1, B2, B3 y B4 son cada uno independientemente nada o cada uno comprende un oligonucleotido B que comprende una secuencia de codigo de barras de 3-25 nucleotidos contiguos, en donde cada B1, B2, B3 y B4 comprende una secuencia de oligonucleotidos que identifica de forma unica, como una combinacion emparejada, (i) la secuencia de oligonucleotido V unica de (a) y (ii) la secuencia de oligonucleotido J unica de (b); (f) R es nada o comprende un sitio de reconocimiento de enzimas de restriccion que comprende una secuencia de oligonucleotido que esta ausente en
(a) -(e), y en donde: (g) la pluralidad de oligonucleotidos molde comprende al menos a o al menos b secuencias de oligonucleotidos unicas, la que sea mas larga, en donde a es el numero de segmentos genicos que codifican la region V de receptor del sistema inmunitario adaptativo unica en el sujeto, y b es el numero de segmentos genicos que codifican la region J del receptor del sistema inmunitario adaptativo unica en el sujeto, y la composicion comprende al menos un oligonucleotido molde para cada polinucleotido V unico y al menos un oligonucleotido molde para cada polinucleotido J unico.
En una realizacion, a es de 1 a un numero de segmentos genicos V maximo en el genoma de marnffero del sujeto. En otra realizacion, b es de 1 a un numero de segmentos genicos J maximo en el genoma de mamffero del sujeto. En otras realizaciones, a es 1 o b es 1.
En algunas realizaciones, la pluralidad de oligonucleotidos molde comprende al menos (a x b) secuencias de oligonucleotidos unicas, donde a es el numero de segmentos genicos que codifican la region V del receptor del sistema inmunitario adaptativo unicos en el sujeto mamffero, y b es el numero de segmentos genicos que codifican la region J del receptor del sistema inmunitario adaptativo unicos en el sujeto mamffero, y la composicion comprende al menos un oligonucleotido molde para cada combinacion posible de un segmento genico que codifica la region V y un segmento genico que codifica la region J. En una realizacion, J comprende una region constante de la secuencia genica que codifica la region J del receptor del sistema inmunitario adaptativo.
En otra realizacion, el receptor del sistema inmunitario adaptativo se selecciona del grupo que consiste en TCRB, TCRG, TCRA, TCRD, IGH, IGK e IGL. En algunas realizaciones, el polinucleotido V de (a) codifica un polipeptido de la region V del receptor TCRB, TCRG, TCRA, TCRD, IGH, IGK o iGl. En otras realizaciones, el polinucleotido J de
(b) codifica un polipeptido de la region J del receptor TCRB, TCRG, TCRA, TCRD, IGH, IGK o IgL.
En algunas realizaciones, hay un codon de parada entre V y B2.
5
10
15
20
25
30
35
40
45
50
55
En una realizacion, cada oligonucleotido molde en la pluralidad de oligonucleotidos moldes esta presente en una cantidad sustancialmente equimolar. En otra realizacion, la pluralidad de oligonucleotidos molde tiene una pluralidad de secuencias de formula general (I) que se selecciona de: (1) la pluralidad de secuencias de oligonucleotidos de formula general (I) en las que los polinucleotidos V y J tienen las secuencias V y J de TCRB expuestas en al menos un conjunto de 68 SEQ ID NO de V y J de TCRB en las figuras 5a-5l como conjunto 1 de V/J de TCRB, conjunto 2 de V/J de TCRB, conjunto 3 de V/J de TCRB, conjunto 4 de V/J de TCRB, conjunto 5 de V/J de TCRB, conjunto 6 de V/J de TCRB, conjunto 7 de V/J de TCRB, conjunto 8 de V/J de TCRB, conjunto 9 de V/J de TCRB, conjunto 10 de V/J de TCRB, conjunto 11 de V/J de TCRB, conjunto 12 de V/J de TCRB y conjunto 13 de V/J de tCrB; (2) la pluralidad de secuencias de oligonucleotidos de formula general (I) en las que los polinucleotidos V y J tienen las secuencias de V y J de TCRG expuestas en al menos un conjunto de 14 SEQ ID NO de V y J de TCRG en las figuras 6a y 6b como conjunto 1 de V/J de TCRG, conjunto 2 de V/J de TCRG, conjunto 3 de V/J de TCRG, conjunto 4 de V/J de TCRG y conjunto 5 de V/J de TCRG; (3) la pluralidad de secuencias de oligonucleotidos de formula general (I) en las que los polinucleotidos V y J tienen las secuencias de V y J de IGH expuestas en al menos un conjunto de 127 SEQ ID NO de V y J de IGH en las figuras 7a-7m como conjunto 1 de V/J de IGH, conjunto 2 de V/J de IGH, conjunto 3 de V/J de IGH, conjunto 4 de V/J de IGH, conjunto 5 de V/J de IGH, conjunto 6 de V/J de IGH, conjunto 7 de V/J de IGH, conjunto 8 de V/J de IGH y conjunto 9 de V/J de IGH; (4)
la pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 3157-4014; (5) pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 4015-4084; (6) pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 4085-5200; (7) pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 5579-5821; (8) pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 5822-6066; y (9) pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 6067-6191.
En algunas realizaciones, V es un polinucleotido que comprende al menos 30, 60, 90, 120, 150, 180 o 210 nucleotidos contiguos de la secuencia genica que codifica la region V del receptor del sistema inmunitario adaptativo, o su complementario. En otra realizacion, V es un polinucleotido que comprende como maximo 900, 800, 700, 600 o 500 nucleotidos contiguos de la secuencia genica que codifica la region V del receptor del sistema inmunitario adaptativo, o su complementario.
En otra realizacion, J es un polinucleotido que comprende al menos 16-30, 31-60, 61-90, 91-120 o 120-150
nucleotidos contiguos de la secuencia genica que codifica la region J del receptor del sistema inmunitario adaptativo,
o su complementario. En otra realizacion, J es un polinucleotido que comprende como maximo 500, 400, 300 o 200
nucleotidos contiguos de la secuencia genica que codifica la region J del receptor del sistema inmunitario adaptativo,
o su complementario.
En algunas realizaciones, cada oligonucleotido molde es menor que 1000, 900, 800, 700, 600, 500, 400, 300 o 200 nucleotidos de longitud.
En otras realizaciones, la composicion incluye un conjunto de cebadores oligonucleotidos que es capaz de amplificar moleculas de acido nucleico reordenadas que codifican uno o mas receptores del sistema inmunitario adaptativo, que comprende una pluralidad a' de cebadores oligonucleotidos del segmento V unicos y una pluralidad b' de cebadores oligonucleotidos del segmento J unicos. En algunas realizaciones a' es de 1 a un numero de segmentos genicos V maximo en el genoma del mairnfero, y b' es de 1 a un numero de segmentos genicos J maximo en el genoma del mamffero. En una realizacion, a' es a. En otra realizacion, b' es b.
En otra realizacion mas, cada cebador oligonucleotido de segmento V y cada cebador oligonucleotido de segmento J en el conjunto de cebadores oligonucleotidos, es capaz de hibridar espedficamente con al menos un oligonucleotido molde en una pluralidad de oligonucleotidos molde. En otras realizaciones, cada cebador oligonucleotido de segmento V comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region V del receptor del sistema inmunitario adaptativo. En otra realizacion, cada cebador oligonucleotido de segmento J comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region J del receptor del sistema inmunitario adaptativo.
En otras realizaciones, la composicion comprende al menos un oligonucleotido molde que tiene una secuencia de oligonucleotido de formula general (I) con la que puede hibridar espedficamente cada cebador oligonucleotido de segmento V, y al menos un oligonucleotido molde que tiene una secuencia de oligonucleotido de formula general (I) con la que puede hibridar espedficamente cada cebador oligonucleotido de segmento J.
La invencion comprende un metodo para determinar el potencial de amplificacion de acido nucleico no uniforme entre miembros de un conjunto de cebadores oligonucleotidos, que es capaz de amplificar moleculas de acido nucleico reordenadas que codifican uno o mas receptores del sistema inmunitario adaptativo, en una muestra biologica que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto mamffero. El metodo incluye etapas de: (a) amplificar la composicion como se describe en la presente memoria en una reaccion de PCR multiplexada para obtener una pluralidad de oligonucleotidos molde amplificados; (b) secuenciar dicha pluralidad de oligonucleotidos molde amplificados para determinar, para cada oligonucleotido molde unico que
5
10
15
20
25
30
35
40
45
50
55
60
comprende dicha pluralidad, (i) una secuencia de oligonucleotido molde y (ii) una frecuencia de aparicion de dicha secuencia de oligonucleotido molde; y (c) comparar una frecuencia de aparicion de cada una de dichas secuencias de oligonucleotido molde con una distribucion esperada, en donde dicha distribucion esperada se basa en relaciones molares predeterminadas de dicha pluralidad de oligonucleotidos molde que comprende dicha composicion, y en donde una desviacion entre dicha frecuencia de aparicion de dichas secuencias de oligonucleotidos molde y dicha distribucion esperada indica una potencial amplificacion de acidos nucleicos no uniforme entre miembros del conjunto de cebadores de amplificacion de oligonucleotidos.
En una realizacion, las relaciones molares predeterminadas son equimolares. En otra realizacion, la distribucion esperada comprende un nivel uniforme de amplificacion para dicho conjunto de oligonucleotidos molde amplificados por dicho conjunto de cebadores oligonucleotidos. En otra realizacion mas, cada molecula de acido nucleico molde amplificada es de menos de 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 90, 80 o 70 nucleotidos de longitud.
El metodo incluye etapas que comprenden para cada miembro del conjunto de cebadores oligonucleotidos que presentan potencial de amplificacion no uniforme con respecto a la distribucion esperada, ajustar la representacion relativa de los miembros cebadores oligonucleotidos en el conjunto de cebadores de amplificacion de oligonucleotidos. En una realizacion, el ajuste comprende aumentar la representacion relativa del miembro en el conjunto de cebadores oligonucleotidos, corrigiendo asf el potencial de amplificacion de acidos nucleicos no uniforme entre los miembros del conjunto de cebadores oligonucleotidos. En otra realizacion, el ajuste comprende disminuir la representacion relativa del miembro en el conjunto de cebadores oligonucleotidos, corrigiendo asf el potencial de amplificacion de acidos nucleicos no uniforme entre los miembros del conjunto de cebadores oligonucleotidos.
En otras realizaciones, el conjunto de cebadores oligonucleotidos no incluye cebadores oligonucleotidos que hibriden espedficamente con un pseudogen u orfon de la region V, o con un pseudogen u orfon de la region J.
El metodo tambien incluye etapas que comprenden: para cada miembro del conjunto de los cebadores oligonucleotidos de amplificacion que presenta potencial de amplificacion no uniforme con respecto a la distribucion esperada, el calculo de una frecuencia proporcionalmente mayor o menor de aparicion de las moleculas de acido nucleico molde amplificadas, cuya amplificacion es promovida por dicho miembro, corrigiendo asf el potencial de amplificacion de acido nucleico no uniforme entre miembros del conjunto de cebadores oligonucleotidos.
La invencion incluye un metodo para cuantificar una pluralidad de moleculas de acido nucleico reordenadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo en una muestra biologica, que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto mairnfero, comprendiendo cada receptor del sistema inmunitario adaptativo una region variable (V) y una region de union (J), comprendiendo el metodo: (A) amplificar moleculas de acido nucleico reordenadas en una reaccion en cadena de la polimerasa (PCR) multiplexada, que comprende: (1) moleculas de acido nucleico reordenadas de la muestra biologica que comprende celulas linfoides del sujeto marnffero; (2) la composicion como se describe en la presente memoria, en donde esta presente un numero conocido de cada uno de la pluralidad de oligonucleotidos molde que tiene una secuencia de oligonucleotido unica; (3) un conjunto de cebadores oligonucleotidos de amplificacion que es capaz de amplificar moleculas de acido nucleico reordenadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo de la muestra biologica.
En algunas realizaciones, el conjunto de cebadores comprende: (a) en cantidades sustancialmente equimolares, una pluralidad de cebadores oligonucleotidos del segmento V que son cada uno independientemente capaces de hibridar espedficamente con al menos un polinucleotido que codifica un polipeptido de la region V del receptor del sistema inmunitario adaptativo o su complementario, en donde cada cebador del segmento V comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region V del receptor del sistema inmunitario adaptativo funcional, y en donde la pluralidad de cebadores del segmento V hibrida espedficamente sustancialmente con todos los segmentos genicos que codifican la region V del receptor del sistema inmunitario adaptativo funcional que estan presentes en la composicion, y (b) en cantidades sustancialmente equimolares, una pluralidad de cebadores oligonucleotidos del segmento J que son independientemente capaces de hibridar espedficamente con al menos un polinucleotido que codifica un polipeptido de la region J del receptor del sistema inmunitario adaptativo o su complementario, en donde cada cebador del segmento J comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region J del receptor del sistema inmunitario adaptativo funcional y en donde la pluralidad de cebadores del segmento J hibridan espedficamente sustancialmente con todos los segmentos genicos que codifican la region J del receptor del sistema inmunitario adaptativo funcional que estan presentes en la composicion.
En otro experimento, los cebadores oligonucleotidos del segmento V y el segmento J son capaces de promover la amplificacion en dicha reaccion en cadena de la polimerasa (PCR) multiplexada de (i) sustancialmente todos los oligonucleotidos molde en la composicion para producir una multiplicidad de oligonucleotidos molde amplificados, siendo suficiente dicha multiplicidad de moleculas de acido nucleico molde amplificadas para cuantificar la diversidad de los oligonucleotidos molde en la composicion, y (ii) sustancialmente todas las moleculas de acido nucleico reordenadas que codifican receptores del sistema inmunitario adaptativo en la muestra biologica, para producir una
5
10
15
20
25
30
35
40
45
50
55
60
multiplicidad de moleculas de ADN reordenadas amplificadas, siendo suficiente dicha multiplicidad de moleculas de acido nucleico reordenadas amplificadas para cuantificar la diversidad de moleculas de acido nucleico reordenadas en el ADN de la muestra biologica.
En una realizacion, cada molecula de acido nucleico amplificada en la pluralidad de oligonucleotidos molde amplificados y en la pluralidad de moleculas de acido nucleico reordenadas amplificadas es de menos de 1000 nucleotidos de longitud; (B) secuenciar cuantitativamente dichos oligonucleotidos molde y dichas moleculas de acido nucleico reordenadas amplificadas para cuantificar (i) un numero de productos molde de oligonucleotidos molde amplificados que contienen al menos una secuencia de oligonucleotido de codigo de barras, y (ii) un numero de productos reordenados de moleculas de acido nucleico reordenadas amplificadas que carecen de una secuencia de oligonucleotido de codigo de barras; (C) calcular un factor de amplificacion dividiendo el numero de productos molde de (B)(i) entre el numero conocido de cada uno de la pluralidad de oligonucleotidos molde que tienen una secuencia de oligonucleotido unica de (A)(2); y (D) dividir el numero de productos reordenados de (B)(ii) entre el factor de amplificacion calculado en (C) para cuantificar el numero de moleculas de acido nucleico reordenadas que codifican receptores del sistema inmunitario adaptativo unicos en la muestra.
En otras realizaciones, el numero cuantificado de moleculas de acido nucleico reordenadas amplificadas que codifican receptores del sistema inmunitario adaptativo unicos en la muestra es el numero de moldes de genoma de linfocitos B unicos o linfocitos T unicos en la muestra.
La invencion incluye un metodo para calcular un factor de amplificacion medio en un ensayo de PCR multiplexado, que comprende: obtener una muestra biologica que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto mairnfero; poner en contacto dicha muestra con una cantidad conocida de oligonucleotidos molde que comprenden una composicion como se describe en la presente memoria; amplificar los oligonucleotidos molde y las moleculas de acido nucleico reordenadas de celulas linfoides del sujeto mamffero en una reaccion de PCR multiplexada para obtener una pluralidad de oligonucleotidos molde amplificados y una pluralidad de moleculas de acido nucleico reordenadas amplificadas; secuenciar dicha pluralidad de oligonucleotidos molde amplificados para determinar, para cada oligonucleotido molde unico que incluye dicha pluralidad, (i) una secuencia de oligonucleotido molde y (ii) una frecuencia de aparicion de dicha secuencia de oligonucleotido molde; y determinar un factor de amplificacion medio para dicha reaccion de PCR multiplexada basado en un numero medio de copias de dicha pluralidad de oligonucleotidos molde amplificados y dicha cantidad conocida de dichos oligonucleotidos molde.
El metodo incluye tambien secuenciar dicha pluralidad de moleculas de acido nucleico reordenadas amplificadas de celulas linfoides del sujeto mamffero para determinar para cada molecula de acido nucleico reordenada unica que incluye dicha pluralidad, i) una secuencia de molecula de acido nucleico reordenada y (ii) un numero de apariciones de dicha secuencia de molecula de acido nucleico reordenada; y determinar el numero de celulas linfoides en dicha muestra, basado en el factor de amplificacion medio para dicha reaccion de PCR multiplexada y dicho numero de apariciones de dichas moleculas de acido nucleico reordenadas.
En otras realizaciones, el metodo comprende determinar el numero de celulas linfoides en dicha muestra, comprende generar una suma del numero de apariciones de cada una de dichas secuencias de acido nucleico reordenadas amplificadas y dividir dicha suma entre dicho factor de amplificacion medio. En algunas realizaciones, la cantidad conocida es una copia de cada uno de dichos oligonucleotidos molde. En una realizacion, 100 < a < 500. En otra realizacion, 100 <b<500.
Se proporciona un metodo para corregir el sesgo de la amplificacion en una reaccion de amplificacion de PCR multiplexada para cuantificar moleculas de acido nucleico reordenadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo en una muestra biologica que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto marnffero, que comprende: (a) poner en contacto dicha muestra con una composicion descrita en la presente memoria para generar dicha muestra enriquecida en moldes, en donde dichos moldes y dichas moleculas de acido nucleico reordenadas comprenden las correspondientes secuencias de la region V y J; (b) amplificar dicha muestra enriquecida en moldes en una reaccion de PCR multiplexada para obtener una pluralidad de oligonucleotidos molde amplificados y una pluralidad de moleculas de acido nucleico reordenadas amplificadas de receptores del sistema inmunitario adaptativo; (c) secuenciar dicha pluralidad de oligonucleotidos molde amplificados para determinar, para cada oligonucleotido molde unico que compone dicha pluralidad, (i) una secuencia de oligonucleotido molde y (ii) una frecuencia de aparicion de dicha secuencia de oligonucleotido molde; (d) secuenciar dicha pluralidad de moleculas de acido nucleico reordenadas amplificadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo, para cada una de las moleculas de acido nucleico reordenadas unicas que codifican dicha pluralidad de receptores del sistema inmunitario adaptativo que componen dicha pluralidad, (i) una secuencia de molecula de acido nucleico reordenada y (ii) una frecuencia de aparicion de dicha secuencia de molecula de acido nucleico reordenada; (e) comparar la frecuencia de aparicion de dichas secuencias de oligonucleotido molde con una distribucion esperada, en donde dicha distribucion esperada se basa en relaciones molares predeterminadas de dicha pluralidad de oligonucleotidos molde que componen dicha composicion, y en donde una desviacion entre dicha frecuencia de aparicion de dichas secuencias de oligonucleotidos molde y dicha distribucion esperada indica una potencial amplificacion de acidos nucleicos no uniforme entre miembros del conjunto de cebadores de amplificacion de oligonucleotidos; (f) generar un conjunto de
5
10
15
20
25
30
35
40
45
50
55
valores de correccion para un conjunto de moleculas molde y secuencias de moleculas de acido nucleico reordenadas amplificadas por dichos miembros del conjunto de cebadores oligonucleotidos de amplificacion que tienen dicho potencial de amplificacion de acido nucleico no uniforme indicado, en donde dicho conjunto de valores de correccion corrige el sesgo de la amplificacion en dicha reaccion de PCR multiplexada; y (g) opcionalmente aplicar dicho conjunto de valores de correccion a dicha frecuencia de aparicion de dichas secuencias de moleculas de acido nucleico reordenadas para corregir el sesgo de la amplificacion en dicha reaccion de PCR multiplexada.
La invencion comprende un kit, que comprende: reactivos que comprenden: una composicion que comprende una pluralidad de oligonucleotidos molde y un conjunto de cebadores oligonucleotidos como se describen en la presente memoria; instrucciones para determinar el potencial de amplificacion de acido nucleico no uniforme entre miembros del conjunto de cebadores oligonucleotidos, que son capaces de amplificar moleculas de acido nucleico reordenadas que codifican uno o mas receptores del sistema inmunitario adaptativo, en una muestra biologica que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto mairnfero.
En otra realizacion, el kit comprende instrucciones para corregir uno o mas miembros del conjunto de cebadores oligonucleotidos que tienen un potencial de amplificacion de acido nucleico no uniforme.
En otras realizaciones, el kit comprende instrucciones para cuantificar el numero de moleculas de acido nucleico reordenadas que codifican receptores del sistema inmunitario adaptativo en la muestra.
Estos y otros aspectos de las realizaciones de la invencion descrita en la presente memoria seran evidentes tras la referencia a la siguiente descripcion detallada y dibujos adjuntos.
Breve descripcion de las diferentes vistas de los dibujos.
Estos y otras caractensticas, aspectos y ventajas de la presente invencion se entenderan mejor con respecto a la siguiente descripcion y dibujos que acompanan, donde:
La figura (Fig.) 1 muestra un diagrama esquematico de un oligonucleotido molde de ejemplo para usar en la normalizacion de la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos que es capaz de amplificar el ADN reordenado que codifica un receptor del sistema inmunitario adaptativo (TCR o BCR). U1, U2, oligonucleotidos adaptadores universales; B1-4, oligonucleotidos de codigo de barras; V, oligonucleotido de la region variable; J, oligonucleotido de la region de union; R, sitio de reconocimiento de enzima de restriccion; S, codon de parada opcional.
La figura 2 muestra frecuencias despues de amplificacion de secuencias de segmentos genicos de V de TCRB individuales amplificadas a partir de una composicion de oligonucleotidos molde normalizada (un grupo equimolar de los moldes expuestos en las SEQ ID NO: 872-1560) usando una mezcla equimolar (no ajustada) de 52 cebadores de PCR (SEQ ID NO: 1753-1804) y cuantitativamente secuenciados en el secuenciador de ADN Illumina HiSeq™. La frecuencia en ausencia de sesgo se calculo como 0,0188.
La figura 3 muestra los resultados de la secuenciacion cuantitativa despues de amplificacion cruzada de los oligonucleotidos molde usando cebadores espedficos de la region V de TCRB. El eje Y indica cebadores de amplificacion individuales (SEQ ID NO: 1753-1804) que estaban presentes en cada reaccion de amplificacion separada con doble concentracion molar (2X) de los otros cebadores del mismo conjunto de cebadores, para la amplificacion de una composicion de oligonucleotidos molde de normalizacion (una mezcka equimolar de los moldes se expone en las in SEQ ID NO: 872-1560); el eje X no esta marcado pero los datos se presentan en el mismo orden que para el eje Y, representando el eje X los correspondientes moldes de genes de V amplificados identificados por secuenciacion cuantitativa. Los cuadrados negros indican que no hay cambio en el grado de amplificacion con el respectivo cebador presente en 2X respecto a las concentraciones equimolares de todos los otros cebadores; los cuadrados blancos indican aumento de 10 veces en la amplificacion; los cuadrados grises indican grados intermedios (en un gradiente de escala de grises) de amplificacion entre cero y 10 veces. La lmea diagonal de cuadrados blancos indica que 2X la concentracion para un cebador dado produda un aumento de aproximadamente 10 veces en la amplificacion del respectivo molde para la mayona de los cebadores. Los cuadrados blancos fuera de la diagonal indican moldes no correspondientes con los que algunos cebadores eran capaces de reasociarse y amplificar.
La figura 4 muestra las frecuencias despues de amplificacion de las secuencias de segmentos genicos de V de TCRB individuales de una composicion de oligonucleotidos molde de normalizacion (un grupo equimolar de los moldes expuesto en las SEQ ID NO: 872-1560), usando concentraciones equimolares de todos los miembros de un conjunto de cebadores de amplificacion de TCRB (SEQ ID NO: 1753-1804) antes del ajuste para el sesgo del uso del cebador (barras negras, todos los cebadores de la region V en concentraciones equimolares), y usando el mismo conjunto de cebadores (SEQ ID NO: 1753-1804) despues de ajustar multiples concentraciones de cebadores individuales para compensar el sesgo (barras grises, las concentraciones de cebadores muy eficaces eran menores y las concentraciones de cebadores poco eficaces eran mayores, vease la tabla 6). Las frecuencias despues de amplificacion se determinaron por secuenciacion cuantitativa en el secuenciador de ADN Illumina HiSeq™.
5
10
15
20
25
30
35
40
45
50
55
Las figuras 5a-5l muestran conjuntos de V/J de TCRB (68 V + 13 J) para usar en composiciones de moldes que comprenden una pluralidad de secuencias de oligonucleotidos de formula general 5'-U1-B1-V-B2-R-B3-J-B4-U2-3' [I], para usar en la normalizacion de la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos que es capaz de amplificar ADN reordenado que codifica uno o una pluralidad de polipeptidos de cadena p de receptor de linfocitos T humanos (TCRB).
Las figuras 6a y 6b muestran conjuntos de V/J de TCRG (14 V + 5 J) para usar en composiciones molde que comprenden una pluralidad de secuencias de oligonucleotidos de formula general 5'-U1-B1-V-B2-R-B3-J-B4-U2-3' [I], para usar en la normalizacion de la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos que es capaz de amplificar ADN reordenado que codifica uno o una pluralidad de cadenas y de receptor de linfocitos T humano (TCRG).
Las figuras 7a-7m muestran conjuntos de V/J de IGH (127 V + 9 J) para usar en composiciones de molde que comprenden una pluralidad de secuencias de oligonucleotidos de formula general 5-U1-B1-V-B2-R-B3-J-B4-U2-3' [I], para usar en la normalizacion de la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos que es capaz de amplificar ADN reordenado que codifica uno o una pluralidad de polipeptidos de cadena pesada de inmunoglobulina humana (IGH).
La Fig. 8 muestra los resultados de calcular un factor de amplificacion para cada pareja VJ en una composicion molde que se anadfa a una amplificacion de PCR multiplexada de secuencias de IGH y despues promediar el factor de amplificacion a traves de todos los moldes sinteticos para calcular el numero de veces de cubrimiento de secuencia a lo largo de las moleculas molde sinteticas.
La Fig. 9 muestra una grafica del numero de linfocitos B que se calculo usando una composicion de molde sintetico y factor de amplificacion como se describe en la presente memoria, frente al numero conocido de linfocitos B usado como una fuente de moldes de ADN naturales.
La Fig. 10 muestra un recuento antes de secuenciacion de amplificacion de PCR para cada una de las 1116 moleculas de control sesgo VJ de IGH y las 243 moleculas de control de sesgo DJ de IGH.
La Fig. 11 muestra las iteraciones de TCRB-cebador para los moldes de VJ de TCRB sinteticos frente al sesgo de amplificacion relativo.
La Fig. 12 muestra las iteraciones de cebador de IGH para los moldes de VJ de IGH sinteticos frente al sesgo de amplificacion relativo.
La Fig. 13 muestra el sesgo de amplificacion relativo para 27 moldes sinteticos de DJ de IGH del gen de V.
Las Figs. 14a-d muestran las iteraciones cebador de TCRG para 55 moldes sinteticos de VJ de TCRG. El sesgo relativo de amplificacion se determino para los cebadores de VJ de TCRG antes de la correccion de control del sesgo qmmico (Fig. 14a), 1a iteracion de la correccion qmmica (Fig. 14b), 2a iteracion de la correccion qmmica (Fig. 14c), e iteracion final de correccion qmmica (Fig. 14d).
Descripcion detallada de la invencion
La presente invencion proporciona, en algunas realizaciones y como se describe en la presente memoria, composiciones y metodos que son utiles para la cuantificacion fiable de poblaciones grandes y estructuralmente diversas de genes reordenados que codifican receptores del sistema inmunitario adaptativo, tales como inmunoglobulinas (Ig) y/o receptores de linfocitos T (TCR). Estos genes reordenados pueden estar presentes en una muestra biologica que contiene ADN de celulas linfoides de un sujeto o fuente biologica, incluyendo un sujeto humano.
Una "molecula de acido nucleico reordenada", como se usa en la presente memoria, puede incluir cualquier ADN genomico, ADNc o ARNm obtenido directa o indirectamente de una lmea de celulas linfoides que incluye secuencias que codifican un receptor del sistema inmunitario adaptativo reordenado.
Se describen en la presente memoria procedimientos inesperadamente ventajosos para la normalizacion y calibracion de conjuntos de cebadores oligonucleotidos complejos que se usan en reacciones de amplificacion de acidos nucleicos multiplexadas para generar una poblacion de moleculas de ADN reordenadas amplificadas de una muestra biologica que contiene genes reordenados que codifican receptores del sistema inmunitario adaptativo, antes de la secuenciacion cuantitativa de alto rendimiento de dichos productos amplificados. La amplificacion multiplexada y la secuenciacion de alto rendimiento de secuencias de ADN reordenadas que codifican tCr y BCR (IG), se describen, por ejemplo en Robins et al., 2009 Blood 114, 4099; Robins et al., 2010 Sci. Translat. Med. 2:47ra64; Robins et al., 2011 J. Immunol. Meth. doi:10.1016/j.jim.2011.09. 001; Sherwood et al. 2011 Sci. Translat. Med. 3:90ra61; U.S.A.N. 13/217,126 (Publicacion US n° 2012/0058902), U.S.A.N. 12/794,507 (Publicacion US n° 2010/0330571), WO/2010/151416, WO/2011/106738 (PCT/US2011/026373), WO2012/027503
(PCT/US2011/049012), U.S.A.N. 61/550.311 (US2013288237), U.S.A.N. 61/569,118(US2013253842); y WO 2010 053587.
5
10
15
20
25
30
35
40
45
50
55
60
Brevemente y de acuerdo con la teona no limitante, los presentes metodos y composiciones superan las imprecisiones que pueden surgir en los metodos actuales que cuantifican la diversidad de genes de TCR y BCR secuenciando los productos de la amplificacion de acidos nucleicos multiplexada. Para acomodar la amplia diversidad de secuencias de moldes de genes de TCR y BCR que pueden estar presentes en una muestra biologica, los conjuntos de cebadores oligonucleotidos usados en las reacciones de amplificacion multiplexada tipicamente comprenden una amplia variedad de longitudes de secuencia y composiciones de nucleotidos (p. ej., contenido GC). Por consiguiente, en un conjunto dado de condiciones de reaccion de amplificacion, las eficacias con las que los cebadores se reasocian a y soportan la amplificacion de sus secuencias molde cognadas, puede diferir notablemente, dando como resultado el uso no uniforme de diferentes cebadores, lo cual conduce a sesgos artificiales en la representacion cuantitativa relativa de los diferentes productos de amplificacion.
Por ejemplo, el uso en exceso relativo de algunos cebadores muy eficaces produce una mayor cantidad de representacion de determinados productos de amplificacion, y el poco uso relativo de algunos otros cebadores de baja eficacia, produce una menor cantidad de representacion de algunos otros productos de amplificacion. La determinacion cuantitativa de la cantidad relativa de cada especie de molde que esta presente en la muestra que contiene ADN de celulas linfoides, que se logra por secuenciacion de los productos amplificados, puede, entonces, dar informacion erronea con respecto a la representacion relativa real de las diferentes especies de molde en la muestra antes de la amplificacion. En estudios piloto, por ejemplo, se observo que la PCR multiplexada, usando un conjunto de cebadores oligonucleotidos disenado para ser capaz de amplificar una secuencia de cada posible gen de la region variable (V) de TCRB humano a partir de moldes de ADN de celulas linfoides humanas, no amplificaba uniformemente los segmentos genicos V de TCRB. En su lugar, algunos segmentos genicos V eran amplificados relativamente en mayor cantidad (representando ~10% de las secuencias totales) y los otros segmentos genicos V eran amplificados relativamente en menor cantidad (representando aproximadamente 4 x 10-3% de las secuencias totales); vease tambien, p. ej., la Fig. 2.
Para superar el problema de dicho uso sesgado de subpoblaciones de cebadores de amplificacion, la presente descripcion proporciona por primera vez una composicion de moldes y metodos para la normalizacion de las eficacias de amplificacion de los miembros de un conjunto de cebadores oligonucleotidos, donde el conjunto de cebadores es capaz de amplificar ADN reordenado que codifica una pluralidad de receptores del sistema inmunitario adaptativo (TCR o Ig) en una muestra biologica que comprende ADN de celulas linfoides. La composicion de moldes comprende una pluralidad de diversos oligonucleotidos molde de formula general (I) como se describe con mayor detalle en la presente memoria:
5'-U1-B1 -V-B2-R-B3-J-B4-U2-3' (I)
Los oligonucleotidos molde constituyentes, de los cuales esta compuesta la composicion de moldes, son diversos con respecto a las secuencias de nucleotidos de los oligonucleotidos molde individuales. Por lo tanto, los oligonucleotidos molde individuales pueden variar en la secuencia de nucleotidos considerablemente entre sf, como una funcion de la variabilidad de secuencia significativa entre el gran numero de posibles polinucleotidos de la region variable (V) y de union (J) de los TCR o BCR. Las secuencias de las especies de oligonucleotidos molde individuales pueden variar entre sf como una funcion de las diferencias de secuencia en los oligonucleotidos U1, U2, B (B1, B2, B3 y B4) y R, que estan incluidos en un molde particular dentro de la pluralidad diversa de moldes.
En algunas realizaciones, los oligonucleotidos codigo de barras B (B1, B2, B3 y B4) pueden comprender independiente y opcionalmente una secuencia de oligonucleotido de codigo de barras, en donde la secuencia de codigo de barras se selecciona para identificar unicamente una combinacion emparejada particular de una secuencia de oligonucleotido V unica particular y una secuencia de oligonucleotido J unica particular. La posicion relativa de los oligonucleotidos codigo de barras B1 y B4 y los adaptadores universales permite ventajosamente la identificacion rapida y cuantificacion de los productos de amplificacion de un oligonucleotido molde unico dado por lecturas de secuencia cortas y secuenciacion de extremos emparejados en secuenciadores de ADN automaticos (p. ej., Illumina HiSeq™ o Illumina MiSEQ®, o GeneAnalyzer™-2, Illumina Corp., San Diego, CA). En particular, estas realizaciones y relacionadas permiten la rapida determinacion de alto rendimiento de combinaciones espedficas de una secuencia de V y una de J que estan presentes en un producto de amplificacion, para asf caracterizar la eficacia de amplificacion relativa de cada cebador espedfico de V y cada cebador espedfico de J, que pueden estar presentes en un conjunto de cebadores que es capaz de amplificar ADN reordenado que codifica tCr o BCR en una muestra. La verificacion de las identidades y/o cantidades de los productos de amplificacion se puede llevar a cabo por lecturas de secuencia mas largas, que incluen opcionalmente lecturas de secuencia que se extienden a B2.
Cuando se usa, cada oligonucleotido molde en la pluralidad de oligonucleotidos molde esta presente en una cantidad sustancialmente equimolar, lo que en algunas realizaciones preferidas incluye preparaciones en las que las concentraciones molares de todos los oligonucleotidos estan dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 o 25 por ciento de cada uno. En algunas otras realizaciones preferidas proporcionadas en la presente memoria, los oligonucleotidos molde se considera que estan presentes en una cantidad sustancialmente equimolar cuando las concentraciones molares de todos los oligonucleotidos estan dentro de un orden de magnitud entre sf, incluyendo las preparaciones en las que la mayor concentracion molar que puede tener cualquier especie de oligonucleotido molde unica, no es mayor que 1000, 900, 800, 700, 600, 500, 440, 400,
5
10
15
20
25
30
35
40
45
50
55
60
350, 300, 250, 200, 150, 100, 90, 80, 70, 60, 50, 40 o 30 por ciento mayor que la concentracion molar a la que esta presente la especie de oligonucleotido molde unica que tiene la concentracion mas baja en la composicion.
De una forma similar, algunas realizaciones descritas en la presente memoria contemplan conjuntos de cebadores oligonucleotidos para la amplificacion, en los que los cebadores componentes se pueden proporcionar en cantidades sustancialmente equimolares. Como tambien se describe en la presente memoria, de acuerdo con algunas otras realizaciones, la concentracion de uno o mas cebadores en un conjunto de cebadores se puede ajustar deliberadamente de modo que algunos cebadores no estan presentes en cantidades equimolares o en cantidades sustancialmente equimolares.
La composicion de moldes descrita en la presente memoria, en realizaciones preferidas, se puede usar como un molde de amplificacion de acidos nucleicos (p. ej., PCR) para caracterizar un conjunto de cebadores oligonucleotidos, tal como los conjuntos complejos de cebadores oligonucleotidos del segmento V y el segmento J, que se pueden usar en la amplificacion multiplexada de los genes de TCR o Ig reordenados, por ejemplo, un conjunto de cebadores como se proporcionan en la presente memoria o cualquiera de los conjuntos de cebadores descritos en Robins et al., 2009 Blood 114, 4099; Robins et al., 2010 Sci. Translat. Med. 2:47ra64; Robins et al., 2011 J. Immunol. Meth. doi:10.1016/j.jim.2011.09. 001; Sherwood et al. 2011 Sci. Translat. Med. 3:90ra61; U.S.A.N. 13/217.126 (publicacion US n° 2012/0058902), U.S.A.N. 12/794.507 (publicacion US n° 2010/0330571), WO/2010/151416, WO/2011/106738 (PCT/US2011/026373), WO2012/027503 (PCT/US2011/049012), U.S.A.N. 61/550.311 (US 2013288237), y U.S.A.N. 61/569.118 (US2013 253842), o similares.
Preferiblemente, todos los moldes en la composicion de moldes para la normalizacion de la eficacia de la amplificacion, que se describe en la presente memoria y que comprende una pluralidad de oligonucleotidos molde que tienen diversas secuencias y la estructura general de la formula general (I), son oligonucleotidos sustancialmente de la misma longitud. Sin querer estar ligados por la teona, se cree en general que en una reaccion de amplificacion de acido nucleico tal como una reaccion en cadena de la polimerasa (PCR), la longitud del ADN molde puede influir en la eficacia de la amplificacion de los cebadores oligonucleotidos afectando a la cinetica de las interacciones entre cebadores y moleculas de ADN molde con las que se reasocian los cebadores por hibridacion espedfica dirigida por secuencia de nucleotidos, por complementariedad de las bases nucleotfdicas. Se considera en general, que los moldes mas largos funcionan menos eficazmente que los moldes relativamente mas cortos. En algunas realizaciones, la composicion de moldes presente descrita para la normalizacion de la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos es capaz de amplificar el ADN reordenado que codifica una pluralidad de TCR y BCR, comprende una pluralidad de oligonucleotidos molde de formula general (l) como se proporcionan en la presente memoria, en donde los oligonucleotidos molde son de una longitud identica o una longitud sustancialmente identica, que es como maximo 1000, 950, 900, 850, 800, 750, 700, 650, 600, 550, 500, 450, 400, 350, 300, 250, 200, 150 o 100 nucleotidos de longitud, incluyendo todos los valores enteros entre estos.
Por consiguiente, con el fin de reducir, eliminar o minimizar la potencial contribucion a sesgos indeseables en el uso de cebadores oligonucleotidos durante la amplificacion multiplexada, realizaciones preferidas descritas en la presente memoria pueden usar una pluralidad de oligonucleotidos molde en donde todos los oligonucleotidos molde en la pluralidad de oligonucleotidos molde de secuencias diversas son sustancialmente de identica longitud. Una pluralidad de oligonucleotidos molde pueden ser de longitud sustancialmente identica cuando todos (p. ej., 100%) o la mayona (p. ej., mayor que 50%) de dichos oligonucleotidos en una composicion de moldes son oligonucleotidos que tiene cada uno exactamente el mismo numero de nucleotidos, o donde uno o mas oligonucleotidos molde en la composicion de moldes pueden variar en longitud entre sf como maximo en 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90 o 100 nucleotidos de longitud. Se apreciara a partir de la presente descripcion que incluso en situaciones donde no todos los oligonucleotidos molde tienen exactamente la misma longitud, las composiciones y metodos descritos en la presente memoria todavfa se pueden usar para determinar y opcionalmente corregir el potencial de amplificacion de acidos nucleicos no uniforme entre miembros de un conjunto de cebadores oligonucleotidos de amplificacion.
De acuerdo con determinadas realizaciones presentes descritas, (i) cada oligonucleotido molde de la composicion de moldes presente descrita se proporciona en una cantidad sustancialmente equimolar, (ii) el conjunto de cebadores oligonucleotidos que es capaz de amplificar el ADN reordenado que codifica una pluralidad de receptores del sistema inmunitario adaptativo, comprende una pluralidad de cebadores oligonucleotidos del segmento V que se proporcionan en cantidades sustancialmente equimolares, (iii) el conjunto de cebadores oligonucleotidos que es capaz de amplificar el ADN reordenado de una pluralidad de receptores del sistema inmunitario adaptativo, comprende una pluralidad de cebadores oligonucleotidos del segmento J que se proporcionan en cantidades sustancialmente equimolares, y (iv) la amplificacion aumenta de scala linealmente con el numero de moldes de partida de una secuencia dada.
Por lo tanto, se puede calcular un rendimiento esperado para el producto de amplificacion de cada molde y asignar arbitrariamente un valor del nivel de amplificacion uniforme teorico de 100%. Despues de permitir que los conjuntos de cebadores amplifiquen las secuencias de los oligonucleotidos molde en una reaccion de amplificacion, cualquier desviacion estadfsticamente significativa de la equivalencia sustancial que se observe entre las proporciones relativas de diferentes productos de amplificacion indica que ha habido un sesgo (es decir, desigual eficacia) en el
5
10
15
20
25
30
35
40
45
50
55
60
uso de cebadores durante la amplificacion. En otras palabras, las diferencias cuantitativas en las cantidades relativas de diferentes productos de amplificacion que se obtienen, indican que no todos los cebadores en el conjunto de cebadores han amplificado sus respectivos moldes con eficacias comparables. Algunas realizaciones contemplan la asignacion de un intervalo de tolerancias por encima y por debajo de un rendimiento teorico de 100%, de modo que cualquier nivel de amplificacion dentro del intervalo de tolerancias se puede considerar como equivalencia sustancial.
En algunas de dichas realizaciones, el intervalo de los rendimientos de productos de amplificacion se puede considerar como sustancialmente equivalente cuando los rendimientos de los productos estan todos dentro del mismo orden de magnitud (p. ej., difieren en menos de un factor de diez). En algunas otras de dichas realizaciones, el intervalo de los rendimiento de los productos de amplificacion se puede considerar sustancialmente equivalente cuando los rendimientos del producto difieren entre sf en no mas de 9 veces, 8 veces, 7 veces, 6 veces, 5 veces, 4 veces o 3 veces. En algunas otras realizaciones, los rendimientos de productos que se pueden considerar que estan dentro de un intervalo de tolerancia aceptable pueden ser mayores o menores que un rendimiento calculado de 100% en tanto como 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 100, o 200%.
Debido a que el metodo implica determinar la secuencia de nucleotidos de cada producto de amplificacion usando tecnicas conocidas como parte del procedimiento de cuantificacion, el o los cebadores responsables de la amplificacion de cada producto unico (definido por la secuencia) se puede identificar y se puede ajustar su o sus cantidades relativas en el conjunto de cebadores (p. ej., aumentar o disminuir de una forma estadfsticamente significativa) en consecuencia. Las concentraciones de cebadores excesivamente eficaces en el conjunto de cebadores se pueden reducir con respecto a las concentraciones de otros cebadores, de modo que el nivel de amplificacion espedfica por dichos cebadores de moldes en la composicion de moldes descrita en la presente memoria es sustancialmente equivalente al nivel de amplificacion suministrado por la mayona de cebadores que suministran el nivel de amplificacion uniforme teorico, o que suministran un nivel que esta dentro del intervalo de tolerancia aceptable. Las concentraciones de cebadores poco eficaces en el conjunto de cebadores se pueden aumentar con respecto a las concentraciones de otros cebadores, de modo que el nivel de amplificacion espedfica por dichos cebadores de moldes en la composicion de moldes descrita en la presente memoria es sustancialmente equivalente al nivel de amplificacion suministrado por la mayona de cebadores que suministran el nivel de amplificacion uniforme teorico, o que suministran un nivel dentro del intervalo de tolerancia aceptable.
Por consiguiente y como se describe en la presente memoria, se proporciona por lo tanto ahora una composicion de moldes para la normalizacion de a eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos que esta disenado para amplificar secuencias codificantes para una repertorio completo de una cadena de TCR o Ig dada, un metodo para determinar la eficacia de amplificacion no uniforme ("potencial de amplificacion no uniforme") entre miembros de dicho conjunto de cebadores, y un metodo para corregir dicho potencial de amplificacion no uniforme. Al proporcionar la composicion de moldes descrita en la presente memoria como una referencia con la que se puede calibrar conjuntos de cebadores oligonucleotidos, y en realizaciones particulares, donde cada oligonucleotido molde esta presente en una cantidad sustancialmente equimolar de modo que se pueden ajustar las concentraciones de cebadores individuales para dar la amplificacion sustancialmente uniforme de una matriz estructuralmente diversa de productos de amplificacion, la presente descripcion supera asf ventajosamente los problemas descritos antes asociados con sesgos en la eficacia de cebadores individuales.
Usando las composiciones y metodos proporcionados en la presente memoria, se pueden identificar cebadores individuales que tienen un potencial de amplificacion no uniforme en virtud de su promocion de la amplificacion no uniforme como se pone de manifiesto por la mayor (p. ej., mayor de una forma estadfsticamente significativa) o menor (p. ej. menor de una forma estadfsticamente significativa) amplificacion de oligonucleotidos molde con respecto al nivel de amplificacion uniforme, a pesar de la presencia en una reaccion de amplificacion (i) de todos los oligonucleotidos molde en cantidades sustancialmente equimolares entre sf, (ii) de todos los cebadores de segmento V en cantidades sustancialmente equivalentes entre sf, y (iii) de todos los cebadores de segmento J en cantidades sustancialmente equimolares entre sf.
Las concentraciones relativas de dichos cebadores se pueden entonces disminuir o aumentar para obtener un conjunto completo de cebadores modificados en el que no todos los cebadores estan presentes en cantidades sustancialmente equimolares unos con respecto a otros, para compensar, respectivamente, el mayor o menor nivel de amplificacion con respecto al nivel de amplificacion uniforme. Despues, se puede volver a ensayar en el conjunto de cebadores su capacidad para amplificar todas las secuencias en la composicion de moldes descrita en la presente memoria en el nivel de amplificacion uniforme, o dentro de un intervalo de tolerancia aceptable.
El procedimiento de ensayo de la capacidad de los conjuntos de cebadores modificados para amplificar la composicion de moldes descrita en la presente memoria, en la que todos los oligonucleotidos molde se proporcionan en cantidades sustancialmente equimolares entre sf, se puede repetir de forma iterativa hasta que se han amplificado todos los productos al nivel de amplificacion uniforme, o dentro de un intervalo de tolerancia aceptable. Mediante dicho procedimiento que usa la composicion de moldes descrita en la presente memoria, se puede normalizar la eficacia de amplificacion de un conjunto de cebadores oligonucleotidos, donde el conjunto de cebadores es capaz de amplificar productivamente el ADN reordenado que codifica uno o una pluralidad de
5
10
15
20
25
30
35
40
45
50
55
receptores del sistema inmunitario adaptativo en una muestra biologica que comprende ADN de celulas linfoides de un sujeto.
Adicional o alternativamente, de acuerdo con la presente descripcion, se puede determinar si cualquier pareja particular de cebadores oligonucleotidos de amplificacion presenta potencial de amplificacion no uniforme, tal como mayor o menor amplificacion de la composicion de moldes con respecto a un nivel de amplificacion uniforme presentado por una mayona de cebadores oligonucleotidos de amplificacion, y entonces se puede usar un factor de ajuste de normalizacion para calcular, respectivamente, una frecuencia proporcionalmente menor o mayor de aparicion de los productos de amplificacion que son promovidos por cada una de dichas parejas de cebadores de amplificacion. Por lo tanto, las presentes composiciones de moldes, en algunas realizaciones, proporcionan un metodo de correccion del potencial de amplificacion de acidos nucleicos no uniforme entre miembros de un conjunto de cebadores oligonucleotidos de amplificacion.
Algunas de dichas realizaciones pueden permitir ventajosamente la correccion, calibracion, estandarizacion, normalizacion, o similares, de datos que se obtienen como consecuencia de sucesos de amplificacion no uniformes. Por lo tanto, las presentes realizaciones permiten la correccion de inexactitudes de datos, tal como pueden resultar del uso sesgado de cebadores oligonucleotidos, sin la necesidad de ajustar iterativamente las concentraciones de uno o mas cebadores de amplificacion y repetir las etapas de amplificacion de las composiciones de moldes descritas en la presente memoria. Por lo tanto, se pueden obtener eficacias ventajosas donde se puede evitar la repeticion de las etapas de secuenciacion cuantitativa de los productos de amplificacion. Sin embargo, algunas otras realizaciones contempladas puede usar dicho procedimiento iterativo.
Por consiguiente, y como se describe en la presente memoria, se proporciona ahora una composicion de moldes para la normalizacion de la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos, junto con metodos para usar dicha composicion de moldes para determinar el potencial de amplificacion de acidos nucleicos no uniforme (p. ej., sesgada) entre los miembros individuales del conjunto de cebadores oligonucleotidos. Tambien se describen en la presente memoria metodos para corregir dichos potenciales de amplificacion de acidos nucleicos no uniformes (p. ej., sesgados) entre miembros del conjunto de cebadores oligonucleotidos. Estas realizaciones y relacionadas explotan los beneficios no reconocidos previamente que se obtienen por la calibracion de conjuntos de cebadores oligonucleotidos completos para compensar sesgos de amplificacion indeseables usando la composicion de moldes para la normalizacion de la eficacia de la amplificacion, que tiene las caractensticas descritas en la presente memoria, y encontrara usos en mejorar la precision con la que se pueden cuantificar secuencias de ADN que codifican TCR y/o Ig clonotfpicos espedficos, con respecto a metodologfas descritas previamente.
Como se ha indicado tambien antes y descrito en otra parte en la presente invencion, antes de la presente descripcion existfan discrepancias insatisfactorias y diffciles de discernir entre (i) la distribucion cuantitativa real de moldes de ADN reordenado que codifican receptores del sistema inmunitario adaptativo que tienen secuencias unicas en una muestra biologica que comprende ADN de celulas linfoides de un sujeto, y (ii) la representacion relativa de los productos de amplificacion de acidos nucleicos de dichos moldes, despues de amplificacion multiplexada usando un conjunto de cebadores oligonucleotidos de amplificacion disenados para amplificar sustancialmente todos los genes de receptores del sistema inmunitario adaptativo reordenados productivamente en la muestra. Debido, por ejemplo, a la heterogeneidad tanto de la poblacion de moldes como del conjunto de cebadores de amplificacion, y como se muestra en la presente memoria, disparidades significativas en las eficacias de amplificacion de diferentes cebadores de amplificacion, puede ser comun conducir al sesgo en las proporciones relativas de los productos de amplificacion que se obtienen y secuencian cuantitativamente despues de una reaccion de amplificacion.
Moldes y cebadores
De acuerdo con algunas realizaciones preferidas se proporciona, por lo tanto, una composicion de moldes para la normalizacion de la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos, que es capaz de amplificar ADN reordenado (que en algunas realizaciones puede referirse a ADN reordenado productivamente, pero que en algunas otras realizaciones no tiene que estar limitado) que codifica uno o una pluralidad de receptores del sistema inmunitario adaptativo en una muestra biologica que comprende ADN de celulas linfoides de un sujeto, comprendiendo la composicion de moldes una pluralidad de oligonucleotidos molde de formula general (I):
5-U1-B1-V-B2-R-B3-J-B4-U2-3' (I)
como se proporciona en la presente memoria. En algunas realizaciones preferidas cada oligonucleotido molde en la pluralidad de oligonucleotidos molde esta presente en una cantidad sustancialmente equimolar, que en algunas realizaciones y como se ha indicado antes, puede referirse a una composicion en la que cada uno de los oligonucleotidos molde esta presente en una concentracion equimolar o en una concentracion molar que se desvfa de la equimolar como maximo en 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 50, 60, 70, 80, 90, 100 o 200% en una base molar, y que en algunas otras realizaciones puede referirse a una composicion en la que todos los oligonucleotidos molde estan presentes en concentraciones molares que estan dentro de un orden de magnitud entre sf. La pluralidad de moldes puede comprender al menos 100, 200, 300, 400,
5
10
15
20
25
30
35
40
500, 600, 700, 800, 900, 1000, 1100 o mas especies de oligonucleotidos discretos, cada uno con secuencia de nucleotidos distinta, incluyendo cada valor entero intermedio entre ellos.
Por lo tanto, la composicion de moldes descrita en la presente memoria, comprende una pluralidad de oligonucleotidos molde de formula general:
5'-U1-B1-V-B2-R-B3-J-B4-U2-3' (I)
en donde, brevemente y como se ha elaborado con mayor detalle en otra parte en la presente memoria, de acuerdo con algunas realizaciones preferidas:
V es un polinucleotido que comprende al menos 20, 30, 60, 90, 120, 150, 180, o 210, y como maximo 1000, 900, 800, 700, 600 o 500 nucleotidos contiguos de una secuencia genica que codifica la region variable (V) del receptor del sistema inmunitario adaptativo, o su complementario, y cada una de la pluralidad de secuencias de oligonucleotidos molde V comprende una secuencia de oligonucleotido unica;
J es un polinucleotido que comprende al menos 15-30, 31-60, 61-90, 91-120, o 120-150, y como maximo 600, 500, 400, 300 or 200 nucleotidos contiguos de una secuencia genica que codifica la region de union (J) del receptor del sistema inmunitario adaptativo, o su complementario, y cada una de la pluralidad de secuencias de oligonucleotidos molde J comprende una secuencia de oligonucleotido unica;
U1 y U2 son cada uno nada o cada uno comprende un oligonucleotido que tiene, independientemente, una secuencia que se selecciona de (i) una secuencia de oligonucleotido adaptador universal, y (ii) una secuencia de oligonucleotido espedfica de la plataforma de secuenciacion que esta unida a y situada 5' respecto a la secuencia de oligonucleotido adaptador universal;
B1, B2, B3 y B4 son cada uno independientemente nada o cada uno comprende un oligonucleotido B que comprende una secuencia de oligonucleotido de codigo de barras de 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 o 1000 nucleotidos contiguos (incluyendo todos los valores enteros entre ellos), en donde cada una de la pluralidad de secuencias de oligonucleotidos molde B comprende una secuencia de oligonucleotido unica que identifica de forma unica, o identifica como una combinacion emparejada, (i) la secuencia de oligonucleotido V unica del oligonucleotido molde, y (ii) la secuencia de oligonucleotido J unica del oligonucleotido molde; y
R es nada o comprende un sitio de reconocimiento de enzima de restriccion que comprende una secuencia de oligonucleotido que esta ausente de V, J, U1, U2, B1, B2, B3 y B4.
En algunas realizaciones, la composicion de oligonucleotidos molde comprende oligonucleotidos adicionales no codificantes o aleatorios. Estos oligonucleotidos se pueden insertar en diferentes secciones entre o dentro de los componentes en la formula general I (5'-U1-B1-V-B2-R-B3-J-B4-U2-3') y ser de diferentes longitudes en tamano.
En una realizacion, a es de 1 a un numero de segmentos genicos V maximo en el genoma de mamffero del sujeto. En otra realizacion, b es de 1 a un numero de segmentos genicos J maximo en el genoma de mamffero del sujeto. En otras realizaciones, a es 1 o b es 1. En algunas realizaciones, a puede estar en el intervalo de 1 segmento genico
V a 54 segmentos genicos V para TCRA, 1-76 segmentos genicos V para TCRB, 1-15 segmentos genicos V para TCRG, 1-7 segmentos genicos V para TCRD, 1-165 segmentos genicos V para IGH, 1-111 para IGK, o 1-79 segmentos genicos V para IGL. En otras realizaciones, b puede estar en el intervalo de 1 segmento genico J a 61 segmentos genicos J para TCRA, 1-14 segmentos genicos J para TCRB, 1-5 segmentos genicos J para TCRG, 1-4 segmentos genicos para TCRD, 1-9 segmentos genicos J para IGH, 1-5 segmentos genicos J para IGK, o 1-11 segmentos genicos J para IGL.
La siguiente tabla cita el numero de segmentos genicos V (a) y segmentos genicos J (b) para cada locus de receptor del sistema inmunitario adaptativo humano, incluyendo segmentos V y J funcionales.
5
10
15
20
25
30
35
40
segmentos V * segmentos V funcionales** segmentos J * segmentos J funcionales**
TCRA
54 45 61 50
TCRB
76 48 14 13
TCRG
15 6 5 5
TCRD
7 7 4 4
IGH
165 51 9 6
IGK
111 44 5 5
IGL
79 33 11 7
*Genes de segmentos variables y de union totales ** Genes de segmentos variables y de union con al menos un alelo funcional
En algunas realizaciones, el polinucleotido J comprende al menos 15-30, 31-60, 61-90, 91-120 o 120-150, y como maximo 600, 500, 400, 300 o 200 nucleotidos contiguos de una region constante J del receptor del sistema inmunitario adaptativo, o su complementary.
En algunas realizaciones, la pluralidad de los oligonucleotidos molde comprende al menos (a x b) secuencias de oligonucleotidos unicas, donde a es el numero de segmentos genicos unicos que codifican la region V del receptor del sistema inmunitario adaptativo en un sujeto, y b es el numero de segmentos genicos unicos que codifican la region J del receptor del sistema inmunitario adaptativo en el sujeto, y la composicion comprende al menos un oligonucleotido molde para cada posible combinacion de un segmento genico que codifica la region V y un segmento genico que codifica la region J.
Sin embargo, la invencion ahora contemplada no se pretende que este asf limitada, de modo que en algunas realizaciones, se puede usar ventajosamente un numero sustancialmente menor de oligonucleotidos molde. En estas y realizaciones relacionadas, donde a es el numero de segmentos genicos unicos que codifican la region V del receptor del sistema inmunitario adaptativo en un sujeto, y b es el numero de segmentos genicos unicos que codifican la region J del receptor del sistema inmunitario adaptativo en el sujeto, el numero mmimo de secuencias de oligonucleotidos unicas de las cuales esta compuesta la pluralidad de oligonucleotidos molde, se puede determinar por el que sea mayor de a y b, con la condicion de que cada secuencia unica de polinucleotido V y cada secuencia unica de polinucleotido J este presente en al menos un oligonucleotido molde en la composicion de moldes. Por lo tanto, de acuerdo con algunas realizaciones relacionadas, la composicion de moldes puede comprender al menos un oligonucleotido molde para cada polinucleotido V unico, p. ej., que incluye uno solo de cada polinucleotido V unico de acuerdo con la formula general (I), y al menos un oligonucleotido molde para cada polinucleotido J unico, p. ej., que incluye uno solo de cada polinucleotido J unico, de acuerdo con una formula general (I).
En algunas otras realizaciones, la composicion de moldes comprende al menos un oligonucleotido molde al que se puede reasociar cada cebador oligonucleotido de amplificacion en un conjunto de cebadores de amplificacion.
Es decir, en algunas realizaciones, la composicion de moldes comprende al menos un oligonucleotido molde que tiene una secuencia de oligonucleotido de formula general (I) con la que puede hibridar espedficamente cada cebador oligonucleotido de segmento V, y al menos un oligonucleotido molde que tiene una secuencia de oligonucleotido de formula general (I) con la que puede hibridar espedficamente cada cebador oligonucleotido de segmento J.
De acuerdo con dichas realizaciones, el conjunto de cebadores oligonucleotidos que es capaz de amplificar el ADN reordenado que codifica uno o una pluralidad de receptores del sistema inmunitario adaptativo, comprende una pluralidad a' de cebadores oligonucleotidos unicos del segmento V y una pluralidad b' de cebadores oligonucleotidos unicos del segmento J. La pluralidad de cebadores oligonucleotidos del segmento V a' son capaces, cada uno independientemente, de reasociarse o hibridar espedficamente con al menos un polinucleotido que codifica un polipeptido de la region V del receptor del sistema inmunitario adaptativo, o su complementario, en donde cada cebador de segmento V comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region V del receptor del sistema inmunitario adaptativo. La pluralidad de cebadores oligonucleotidos del segmento J b' son capaces, cada uno independientemente, de reasociarse o hibridar espedficamente con al menos un polinucleotido que codifica un polipeptido de la region J del receptor del sistema inmunitario adaptativo, o su complementario, en donde cada cebador de segmento J comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es
5
10
15
20
25
30
35
40
45
50
55
60
complementaria de al menos un segmento genico que codifica la region J del receptor del sistema inmunitario adaptativo.
En algunas realizaciones, a' es la misma que a (descrita antes para los oligonucleotidos molde). En otras realizaciones, b' es la misma que b (descrita antes para oligonucleotidos molde).
Por lo tanto, en algunas realizaciones y tambien como se describe en otra parte en la presente memoria, la presente composicion de moldes se puede usar en reacciones de amplificacion con cebadores de amplificacion que se disenan para amplificar todas las secuencias genicas reordenadas que codifican el receptor del sistema inmunitario adaptativo, incluyendo las que no son expresadas, mientras que en algunas otras realizaciones, la composicion de moldes y los cebadores de amplificacion se pueden disenar para que no den productos de amplificacion de genes reordenados que no son expresados (p. ej., pseudogenes, orfones). Se apreciara por lo tanto, que en algunas realizaciones puede amplificarse convenientemente solo un subconjunto de genes reordenados que codifican receptores del sistema inmunitario adaptativo, de modo que se pueden disenar subconjuntos de cebadores de amplificacion adecuados y usar para amplificar solo las secuencias V-J reordenadas que tienen interes. En estas realizaciones y relacionadas, de forma correspondiente se puede usar una composicion de moldes descrita en la presente memoria que comprende solo un subconjunto de secuencias de V-J reordenadas de interes, siempre que la composicion de moldes comprenda al menos un oligonucleotido molde con el que se puede reasociar cada cebador oligonucleotido de amplificacion en un conjunto de cebadores de amplificacion. El numero real de oligonucleotidos molde en la composicion de moldes puede, por lo tanto, variar considerablemente entre las realizaciones contempladas, como una funcion del conjunto de cebadores de amplificacion que se va a usar.
Por ejemplo, en algunas realizaciones relacionadas, en la composicion de moldes la pluralidad de oligonucleotidos molde puede tener una pluralidad de secuencias de formula general (I) que se seleccionan de (1) la pluralidad de secuencias de oligonucleotidos de formula general (I) en la que los polinucleotidos V y J tienen las secuencias V y J de TCRB expuestas en al menos un conjunto de 68 SEQ ID NO de V y J de TCRb, respectivamente, como se expone en las figuras 5a-5l como conjunto 1 de V/J de TCRB, conjunto 2 de V/J de TCRB, conjunto 3 de V/J de TCRB, conjunto 4 de V/J de TCRB, conjunto 5 de V/J de TCRB, conjunto 6 de V/J de TCRB, conjunto 7 de V/J de TCRB, conjunto 8 de V/J de TCRB, conjunto 9 de V/J de TCRB, conjunto 10 de V/J de TCRB, conjunto 11 de V/J de TCRB, conjunto 12 de V/J de TCRB y conjunto 13 de V/J de TCRB; (2) la pluralidad de secuencias de oligonucleotidos de formula general (I) en las que los polinucleotidos V y J tienen las secuencias de V y J de TCRG expuestas en al menos un conjunto de 14 SEQ ID NO de V y J de TCRg, respectivamente, como se expone en la figura 6 como conjunto 1 de V/J de TCRG, conjunto 2 de V/J de TCRG, conjunto 3 de V/J de TCRG, conjunto 4 de V/J de TCRG y conjunto 5 de V/J de TCRG; y (3) la pluralidad de secuencias de oligonucleotidos de formula general (I) en las que los polinucleotidos V y J tienen las secuencias de V y J de IGH expuestas en al menos un conjunto de 127 SEQ ID NO de V y J de IGH, respectivamente, como se expone en la figura 7 como conjunto 1 de V/J de IGH, conjunto 2 de V/J de iGh, conjunto 3 de V/J de IGH, conjunto 4 de V/J de IGH, conjunto 5 de V/J de IGH, conjunto 6 de V/J de IGH, conjunto 7 de V/J de IGH, conjunto 8 de V/J de IGH y conjunto 9 de V/J de IGH.
En algunas realizaciones, V es una secuencia de polinucleotido que codifica al menos 10-70 aminoacidos contiguos de una region V de receptor del sistema inmunitario adaptativo, o su complementario; J es una secuencia de polinucleotido que codifica al menos 5-30 aminoacidos contiguos de una region J de receptor del sistema inmunitario adaptativo, o su complementario; U1 y U2 son cada uno nada o comprenden un oligonucleotido que comprende una secuencia de nucleotidos que se selecciona de (i) una secuencia de oligonucleotido adaptador universal, y (ii) una secuencia de oligonucleotido espedfica de la plataforma de secuenciacion que esta unida a y situada 5' respecto a la secuencia de oligonucleotido adaptador universal; B1, B2, B3 y B4 son cada uno independientemente nada o cada uno comprende un oligonucleotido B que comprende una secuencia de oligonucleotido codigo de barras de 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 nucleotidos contiguos, en donde cada una de la pluralidad de secuencias de oligonucleotidos B comprende una secuencia de oligonucleotido unica que identifica de forma unica, como una combinacion emparejada, (ii) la secuencia de oligonucleotido J unica; y R es nada o comprende un sitio de reconocimiento de enzima de restriccion que comprende una secuencia de oligonucleotido que esta ausente de V, J, U1, U2, B1, B2, B3 y B4. En algunas realizaciones preferidas, la pluralidad de oligonucleotidos molde comprende al menos a o b secuencias de oligonucleotidos unicas, donde a es el numero de segmentos genicos que codifican la region V de receptor del sistema inmunitario adaptativo unicos en el sujeto, y b es el numero de segmentos genicos que codifican la region J del receptor del sistema inmunitario adaptativo unicos en el sujeto, y la composicion comprende una pluralidad de oligonucleotidos molde que comprende al menos el que sea mayor de a o b secuencias de oligonucleotidos molde unicas, con la condicion de que esta incluido al menos un polinucleotido V que corresponde a cada segmento genico que codifica la region V y al menos un polinucleotido J que corresponde a cada segmento genico que codifica la region J.
Se conoce un gran numero de secuencias genicas de region variable (V) y region de union (J) de receptor del sistema inmunitario adaptativo como secuencias de nucleotidos y/o aminoacidos, incluyendo secuencias de ADN genomico no reordenadas o locus de TCR e Ig, y secuencias de ADN reordenadas productivamente en dichos locus y sus productos codificados, y tambien incluidos pseudogenes en estos locus, y tambien incluidos orfones relacionados. Vease, p. ej., U.S.A.N. 13/217,126 (US2012058902); U.S.A.N. 12/794,507 (US2010 330571); PCT/US2011/026373 (WO2011206738), PCT/US2011/049012 (WO2012027503). Estas y otras secuencias conocidas en la tecnica se pueden usar segun la presente descripcion para el diseno y produccion de
5
10
15
20
25
30
35
40
45
50
55
60
oligonucleotidos molde para incluir en la composicion de moldes presente proporcionada para la normalizacion de la eficacia de la amplificacion de un conjunto de cebadores oligonucleotidos, y para el diseno y la produccion del conjunto de cebadores oligonucleotidos que es capaz de amplificar ADN reordenado que codifica cadenas de polipeptidos de TCR e Ig, cuyo ADN reordenado puede estar presente en una muestra biologica que comprende ADN de celulas linfoides.
En la formula (I), V es una secuencia de polinucleotido de al menos 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400 o 450 y no mas de 1000, 900, 800, 700, 600 o 500 nucleotidos contiguos de una secuencia genica de la region variable (V) del receptor del sistema inmunitario adaptativo (p. ej., TCR o BCR), o su complementario, y cada uno de la pluralidad de secuencias de oligonucleotidos V comprende una secuencia de oligonucleotido unica. Las secuencias genomicas para los genes de la region V de TCR y BCR de seres humanos y otras especies se conocen y estan disponibles en bases de datos publicas tales como Genbank; las secuencias genicas de la region V incluyen secuencias de polinucleotidos que codifican los productos de los genes de TCR y BCR reordenados, expresados, y tambien incluyen secuencias de polinucleotidos de pseudogenes que se han identificado en los locus de la region V. Las diversas secuencias de polinucleotidos V que se pueden incorporar en los presentes moldes descritos de formula general (I) pueden variar ampliamente en longitud, en composicion de nucleotidos (p. ej., contenido de GC) y en la secuencia de polinucleotido lineal real, y se sabe, por ejemplo, que incluyen "puntos calientes" o regiones hipervariables que presentan diversidad de secuencia particular.
El polinucleotido V en la formula general (I) (o su complementario) incluye secuencias con las que se pueden reasociar espedficamente miembros de los conjuntos de cebadores oligonucleotidos espedficos para genes de TCR y BCR. Se describen conjuntos de cebadores que son capaces de amplificar ADN reordenado que codifica una pluralidad de TCR o BcR, por ejemplo, en los documentos U.S.A.N. 13/217,126 (US 2012058902), U.S.A.N. 12/794,507 (US 2010330571), PCT/US2011/026373 (WO 2011106738); o PCT/US2011/049012 (WO 2012027503); o similares; o como se describe en los mismos, se pueden disenar para incluir secuencias de oligonucleotidos que pueden hibridar espedficamente con cada uno de los genes V unicos y con cada uno de los genes J en un locus de genes de TCR y BCR particular (p. ej., TCR a, p, y o 6, o IgH p, y, 5, a o £, o IgL k o A). Por ejemplo, a modo de ilustracion y no de limitacion, un cebador oligonucleotido de un conjunto de cebadores oligonucleotidos de amplificacion que es capaz de amplificar el ADN reordenado que codifica uno o una pluralidad de TCR o BCR, tfpicamente puede incluir una secuencia de nucleotidos de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 o 40 nucleotidos contiguos, o mas, y se puede reasociar espedficamente con una secuencia complementaria de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 o 40 nucleotidos contiguos de un polinucleotido V o J proporcionado en la presente memoria. En algunas realizaciones, los cebadores pueden comprender al menos 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 o 30 nucleotidos, y en algunas realizaciones, los cebadores pueden comprender secuencias de no mas de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 o 40 nucleotidos contiguos. Los cebadores y sitios de reasociacion de cebadores de otras longitudes tambien estan contemplados expresamente, como se describe en la presente memoria.
La secuencia de polinucleotido entera de cada polinucleotido V en la formula general (I) puede, pero no necesariamente, consistir exclusivamente en nucleotidos contiguos de cada gen V distinto. Por ejemplo y de acuerdo con algunas realizaciones, en la composicion de moldes descrita en la presente memoria, cada polinucleotido V de formula (I) solo es necesario que tenga al menos una region que comprende una secuencia de oligonucleotido V unica que se encuentra en un gen V y con la cual se puede reasociar espedficamente un cebador de region V individual en el conjunto de cebadores. Por lo tanto, el polinucleotido V de formula (I) puede comprender todas o cualquier parte prescrita (p. ej., al menos 15, 20, 30, 60, 90, 120, 150, 180 o 210 nucleotidos contiguos, o cualquier valor entero entre estos) de una secuencia genica de V natural (incluyendo una secuencia de pseudogen V) con la condicion de que este incluida al menos una region de secuencia de oligonucleotidos V unica (el sitio de reasociacion del cebador) que no este incluida en ningun otro polinucleotido V molde.
En algunas realizaciones puede ser preferido que la pluralidad de polinucleotidos V que esta presente en la composicion de moldes descrita en la presente memoria, tenga longitudes que simulen las longitudes globales de secuencias de nucleotidos de genes V naturales, conocidos, incluso donde las secuencias de nucleotidos espedficas difieren entre la region V molde y cualquier gen V natural. Las longitudes de la region V en los moldes descritos en la presente memoria pueden diferir de las longitudes de genes V naturales en no mas de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 por ciento.
Por lo tanto, el polinucleotido V en la formula (I), en algunas realizaciones, puede comprender una secuencia de nucleotidos que tiene una longitud que es la misma o similar a la longitud de un gen V tfpico desde su codon de inicio a su region codificante de CDR3 y puede, pero no necesariamente, incluir una secuencia de nucleotidos que codifica la region CDR3. La secuencia de nucleotidos que codifica CDR3 y las longitudes de las secuencias pueden variar considerablemente y se han caracterizado mediante varios esquemas de numeracion diferentes (p. ej., Lefranc, 1999 The Immunologist 7:132; Kabat et al., 1991, en: Sequences of Proteins of Immunological Interest, NIH Publication 91-3242; Chothia et al., 1987 J. Mol. Biol. 196:901; Chothia et al., 1989 Nature 342:877; Al-Lazikani et al., 1997 J. Mol. Biol. 273:927; vease tambien, p. ej., Rock et al., 1994 J. Exp. Med. 179:323; Saada et al., 2007 Immunol. Cell Biol. 85:323).
5
10
15
20
25
30
35
40
45
50
55
60
Brevemente, la region CDR3 tfpicamente abarca la parte de polinucleotido que se extiende desde un resto cistema altamente conservado (codificado por el codon trinucleotido TGY; Y = T o C) en el segmento V a un resto fenilalanina altamente conservado (codificado por TTY) en el segmento J de los TCR, o hasta una triptofano altamente conservado (codificado por TGG) en IGH. Mas de 90% de las reordenaciones productivas, naturales en el locus de TCRB tienen una longitud de codificacion de CDR3 por este criterio, de entre 24 y 54 nucleotidos, que corresponde a entre 9 y 17 aminoacidos codificados. Las longitudes de CDR3 de los oligonucleotidos molde sinteticos presentes descritos, para cualquier locus de TCR o BCR dado, debenan estar dentro del mismo intervalo de 95% de reordenaciones que se presentan de forma natural. Por lo tanto, por ejemplo, en una composicion de moldes descrita en la presente memoria, para la normalizacion de la eficacia de amplificacion de un conjunto de cebadores oligonucleotidos que es capaz de amplificar ADN reordenado que codifica una pluralidad de polipeptidos de TCRB, la parte que codifica la CDR3 del polinucleotido V puede tener una longitud de 24 a 54 nucleotidos, incluyendo todos los numeros enteros entre ellos. Los esquemas de numeracion para las regiones que codifican la CDR3 descritos antes indican las posiciones de los codones de cistema, fenilalanina y triptofano conservados, y estos esquemas de numeracion tambien se pueden aplicar a pseudogenes en los que uno o mas codones que codifican estos aminoacidos conservados se han sustituido por codones que codifican aminoacidos diferentes. Para pseusogenes que no usan estos aminoacidos conservados, la longitud de la CDR3 se puede definir con respecto a la correspondiente posicion en la que se habna observado el resto conservado en ausencia de la sustitucion, de acuerdo con uno de los esquemas de numeracion de posiciones de la secuencia de CDR3 establecidos mencionados antes.
En algunas realizaciones, tambien puede ser preferido que la pluralidad de polinucleotidos V que estan presentes en la composicion de moldes descrita en la presente memoria tenga composiciones de nucleotidos (por ejemplo, porcentaje de contenido de GC) que simulen las composiciones de nucleotidos globales de secuencias de genes V naturales conocidas, incluso aunque difieran las secuencias de nucleotidos espedficas. Dichas composiciones de nucleotidos de la region V molde pueden diferir de las composiciones de nucleotidos de secuencias de genes V naturales en no mas de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 por ciento. Opcionalmente y de acuerdo con algunas realizaciones, el polinucleotido V del oligonucleotido molde descrito en la presente memoria incluye un codon de parada en o cerca del extremo 3' de V en la formula general (I).
En la formula (I) J es un polinucleotido que comprende al menos 15-30, 31-60, 61-90, 91-120, o 120-150, y como maximo 600, 500, 400, 300 or 200 nucleotidos contiguos de una secuencia genica que codifica la region de union (J) del receptor del sistema inmunitario adaptativo, o su complementario, y en cada una de la pluralidad de secuencias de oligonucleotidos J comprende una secuencia de oligonucleotido unica.
El polinucleotido J en la formula general (I) (o su complementario) incluye secuencias con las que se pueden reasociar espedficamente miembros de los conjuntos de cebadores oligonucleotidos espedficos para genes de TCR y BCR. Los conjuntos de cebadores que son capaces de amplificar ADN reordenado que codifica una pluralidad de TCR o BCR se describen, por ejemplo, en los documentos U.S.A.N. 13/217.126; U.S.A.N. 12/794.507; PCT/US2011/026373; o PCT/US2011/049012; o similares; o como se describe en los mismos, se pueden disenar para incluir secuencias de oligonucleotidos que pueden hibridar espedficamente con cada uno de los genes V unicos y con cada uno de los genes J unicos en un locus de genes de TCR y BCR particular (p. ej., TCR a, p, y o 6, o IgH |j, y, 6, a o £, o IgL k o A).
La secuencia de polinucleotido entera de cada polinucleotido J en la formula general (I) puede, pero no necesariamente, consistir exclusivamente en nucleotidos contiguos de cada gen J distinto. Por ejemplo y de acuerdo con algunas realizaciones, en la composicion de moldes descrita en la presente memoria, cada polinucleotido J de formula (I) solo es necesario que tenga al menos una region que comprende una secuencia de oligonucleotido J unica que se encuentra en un gen J y con la cual se puede reasociar espedficamente un cebador de region V individual en el conjunto de cebadores. Por lo tanto, el polinucleotido V de formula (I) puede comprender todas o cualquier parte prescrita (p. ej., al menos 15, 20, 30, 60, 90, 120, 150, 180 o 210 nucleotidos contiguos, o cualquier valor entero entre estos) de una secuencia genica de V natural (incluyendo una secuencia de pseudogen V) con la condicion de que este incluida al menos una region de secuencia de oligonucleotidos V unica (el sitio de reasociacion del cebador) que no este incluida en ningun otro polinucleotido J molde.
En algunas realizaciones puede ser preferido que la pluralidad de polinucleotidos J que esta presente en la composicion de moldes descrita en la presente memoria, tenga longitudes que simulen las longitudes globales de secuencias de nucleotidos de genes J naturales, conocidos, incluso donde las secuencias de nucleotidos espedficas difieren entre la region J molde y cualquier gen J natural. Las longitudes de la region J en los moldes descritos en la presente memoria puede diferir de las longitudes de genes J naturales en no mas de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 por ciento.
Por lo tanto, el polinucleotido J en la formula (I) puede, en algunas realizaciones, comprender una secuencia de nucleotidos que tiene una longitud que es la misma o similar a la longitud de un gen J natural tfpico, y puede, pero no necesariamente, incluir una secuencia de nucleotidos que codifica la region CDR3, como se ha descrito antes.
Las secuencias genomicas para los genes de la region J de TCR y BCR de seres humanos y otras especies se conocen y estan disponibles en bases de datos publicas tales como Genbank; las secuencias de genes de la region
5
10
15
20
25
30
35
40
45
50
55
60
J incluyen secuencias de polinucleotidos que codifican los productos de los genes de TCR y BCR reordenados, expresados y no expresados. Las diversas secuencias de polinucleotidos J que se pueden incorporar en los moldes presentes descritos de formula general (I) puede variar ampliamente en longitud, en composicion de nucleotidos (p. ej., contenido de GC) y en la secuencia real de polinucleotido lineal.
Las alternativas para las secuencias de V y J descritas en la presente memoria, para usar en la construccion de los oligonucleotidos molde descritos en la presente memoria y/o los cebadores oligonucleotidos del segmento V y segmento J, los puede seleccionar el experto en la tecnica basandose en la presente descripcion, usando el conocimiento en la tecnica relacionado con las secuencias de genes publicadas para las regiones que codifican V y J de los genes para cada subunidad de TCR e Ig. Las entradas de Genbank de referencia para las secuencias de receptor del sistema inmunitario adaptativo humano incluyen: TCRa: (TCRA/D): NC_000014.8 (chr14:22090057..23021075); TCRp: (TCRB): NC_000007.13 (chr7:141998851..142510972); TCRy: (TCRG): NC_000007.13 (chr7:38279625..38407656); cadena pesada de inmunoglobulina, IgH (IGH): NC_000014.8 (chr14:
106032614.. 107288051); cadena ligera kappa de inmunoglobulina, IgLK (IGK): NC_000002.11 (chr2:
89156874.. 90274235); y cadena ligera lambda de inmunoglobulina, IgLA (IGL): NC_000022.10 (chr22:
22380474.. 23265085). Las entradas de Genbank de referencia para las secuencias de locus de receptor del sistema inmunitario adaptativo de raton incluyen: TCRp: (TCRB): NC_000072.5 (chr6: 40841295..41508370), y cadena pesada de inmunoglobulina, IgH (IGH): NC_000078.5 (chr12:114496979..117248165).
El analisis del diseno de molde y cebador y las consideraciones de seleccion del sitio diana se pueden llevar a cabo, por ejemplo, usando el programa de analisis de cebadores OLIGO y/o el programa de algoritmos BLASTN 2.0.5 (Altschul et al., Nucleic Acids Res. 1997, 25(17):3389-402), u otros programas similares disponibles en la tecnica.
Por consiguiente, basandose en la presente descripcion y en vista de estas secuencias de genes de receptor del sistema inmunitario adaptativo conocidas y metodologfa de diseno de oligonucleotidos, para la inclusion en los presentes oligonucleotidos molde, los expertos en la tecnica pueden disenar una pluralidad de secuencias de polinucleotidos espedficas de la region V y espedficas de la region J que contiene cada una independientemente secuencias de oligonucleotidos que son unicas para un gen V y gen J, respectivamente. De forma similar, a partir de la presente descripcion y en vista de las secuencias conocidas del receptor del sistema inmunitario adaptativo, los expertos en la tecnica tambien pueden disenar un conjunto de cebadores que comprende una pluralidad de cebadores oligonucleotidos espedficos de la region V y espedficos de la region J que son cada uno independientemente capaces de reasocirarse con una secuencia espedfica que es unica para un gen V y gen J, respectivamente, de modo que una pluralidad de cebadores es capaz de amplificar sustancialmente todos los genes V y sustancialmente todos los genes J en un locus dado que codifica el receptor del sistema inmunitario adaptativo (p. ej., un locus de TCR o IgH humano). Dichos conjuntos de cebadores permiten la generacion, en PCR multiplexada (es decir, usando multiples parejas de cebadores directos e inversos), de productos amplificados que tienen un primer extremo que es codificado por un segmento genico que codifica la region V reordenada y un segundo extremo que es codificado por un segmento genico que codifica la region J.
Tfpicamente y en algunas realizaciones, dichos productos de amplificacion pueden incluir una secuencia que codifica la CDR3 aunque la invencion no se pretende que este asf limitada, y contempla productos de amplificacion que no incluyen una secuencia que codifica la CDR3. Los cebadores se pueden disenar preferiblemente para dar productos de amplificacion que tienen suficientes partes de secuencias de V y J y secuencias (B) de codigo de barras V-J como se describe en la presente memoria, de modo que por secuenciacion de los productos (amplicones), se pueden identificar basandose en las secuencias que son unicas para cada segmento genico, (i) el gen V particular, y (ii) el gen J particular en la cercama del cual el gen V sufre reordenacion para dar un gen que codifica el receptor del sistema inmunitario adaptativo funcional. Tfpicamente, y en realizaciones preferidas, los productos de amplificacion de la PCR no tendran mas de 600 pares de bases de tamano, lo cual, de acuerdo con la teona no limitante, excluira los productos de amplificacion de genes de receptor del sistema inmunitario adaptativo no reordenados. En algunas otras realizaciones preferidas, los productos de amplificacion seran como maximo de 500, 400, 300, 250, 200, 150, 125, 100, 90, 80, 70, 60, 50, 40, 30 o 20 de bases de tamano, de modo que se puede proporcionar ventajosamente cuantificacion de alto rendimiento de los amplicones de distinta secuencia por lecturas de secuencia cortas.
En ciertas realizaciones preferidas, la pluralidad de oligonucleotidos molde comprende al menos a o al menos b secuencias de oligonucleotidos unicas, la que sea mas larga, donde a es el numero de segmentos genicos que codifican la region V de receptor del sistema inmunitario adaptativo unicos en el sujeto, y b es el numero de segmentos genicos que codifican la region J del receptor del sistema inmunitario adaptativo unicos en el sujeto, y la composicion comprende al menos un oligonucleotido molde para cada polinucleotido V unico y al menos un oligonucleotido molde para cada polinucleotido J unico. Se apreciara que debido a que los oligonucleotidos molde tienen una pluralidad de secuencias de oligonucleotidos de formula general (I), que incluye un polinucleotido V y que tambien incluye un polinucleotido J, la composicion de moldes puede comprender por lo tanto menos de (a x b) secuencias de oligonucleotidos unicas, pero comprendera al menos el mayor de a o b secuencias de oligonucleotidos unicas. Por consiguiente, la composicion puede acomodar al menos una aparicion de cada secuencia de polinucleotido V unica y al menos una aparicion de cada secuencia de polinucleotido J unica, donde, en algunos casos la al menos una aparicion de un polinucleotido V unico particular estara presente en el mismo oligonucleotido molde en el que se puede encontrar la al menos una aparicion de un polinucleotido J unico particular.
5
10
15
20
25
30
35
40
45
50
55
Asf, por ejemplo, "al menos un oligonucleotido molde para cada polinucleotido V unico y al menos un oligonucleotido molde para cada polinucleotido J unico" en algunos casos puede referirse a un solo oligonucleotido molde en el que estan presentes un polinucleotido V unico y un polinucleotido J unico.
Como se describe tambien en otra parte en la presente memoria, en algunas otras realizaciones preferidas, la composicion de moldes comprende al menos un oligonucleotido molde con el que se puede reasociar cada cebador oligonucleotido de amplificacion en un conjunto de cebadores de amplificacion. Por lo tanto, la composicion puede contener menos de a o b secuencias unicas, por ejemplo, donde un conjunto de cebadores de amplificacion puede no incluir un cebador unico para cada posible secuencia de V y/o J.
Se observara que algunas realizaciones contemplan una composicion de moldes para la normalizacion de la eficacia de amplificacion de un conjunto de cebadores oligonucleotidos que es capaz de amplificar productivamente ADN reordenado que codifica una pluralidad de receptores del sistema inmunitario adaptativo en una muestra biologica que comprende ADN de celulas linfoides de un sujeto como se proporciona en la presente memoria, en donde la composicion de moldes comprende una pluralidad de oligonucleotidos molde que tienen una pluralidad de secuencias de oligonucleotidos de formula general 5'-U1-B1-V-B2-R-B3-J-B4-U2-3' (I) como se describe en la presente memoria. De acuerdo con estas realizaciones y realizaciones asociadas y como se describe tambien en otra parte en la presente memoria, el conjunto de cebadores oligonucleotidos de amplificacion que es capaz de amplificar productivamente ADN reordenado, puede excluir cualesquiera cebadores oligonucleotidos que hibridan espedficamente con un pseudogen u orfon de region V o con un pseudogen u orfon de region J. Por lo tanto, en dichas realizaciones la composicion de moldes excluira de forma conveniente oligonucleotidos molde de formula general (I) en los que las secuencias de oligonucleotidos V unicas y/o las secuencias de oligonucleotidos J unicas son secuencias que son, respectivamente, unicas respecto a un pseudogen u orfon de region V o un pseudogen u orfon de region J.
Una composicion de moldes de TCRB de ejemplo que comprende 858 oligonucleotidos molde distintos se describe en la lista de secuencias en la SEQ ID NO: 3157-4014. Otra composicion de moldes de TCRB de ejemplo que
comprende 871 oligonucleotidos molde distintos se describe en la lista de secuencias en la SEQ ID NO: 1-87l. Otra
composicion de moldes de TCRB de ejemplo que comprende 689 oligonucleotidos molde distintos se describe en la lista de secuencias en la SEQ ID NO: 872-1560.
Una composicion de moldes de TCRG de ejemplo que comprende 70 oligonucleotidos molde distintos se describe en la lista de secuencias en la SEQ ID NO: 4015-4084. Una composicion de moldes de TCRG de ejemplo que
comprende 70 oligonucleotidos molde distintos se describe tambien en la lista de secuencias en la SEQ ID NO:
1561-1630.
Una composicion de moldes de IGH de ejemplo que comprende 1116 oligonucleotidos molde distintos se describe en la lista de secuencias en la SEQ ID NO: 4085-5200. Una composicion de moldes de IGH de ejemplo que comprende 1116 oligonucleotidos molde distintos se describe tambien en la lista de secuencias en la SEQ ID NO: 1805-2920.
Tambien se describen en la presente memoria conjuntos de ejemplo de polinucleotidos V y J para la inclusion en los oligonucleotidos molde descritos en la presente memoria que tienen una pluralidad de secuencias de oligonucleotidos de formula general (I). Para TCRB, la pluralidad de oligonucleotidos molde que pueden tener una pluralidad de secuencias de oligonucleotidos de formula general (I) en las que los polinucleotidos V y J tienen las secuencias de V y J del TCRB expuestas en al menos una de las 68 SEG ID NO de V y J de TCRB, respectivamente, como se expone en la figura 5 como conjunto 1 de V/J de TCRB, conjunto 2 de V/J de TCRB, conjunto 3 de V/J de TCRB, conjunto 4 de V/J de TCRB, conjunto 5 de V/J de TCRB, conjunto 6 de V/J de TCRB, conjunto 7 de V/J de TCRB, conjunto 8 de V/J de TCRB, conjunto 9 de V/J de TCRB , conjunto 10 de V/J de TCRB, conjunto 11 de V/J de TCRB, conjunto 12 de V/J de TCRB y conjunto 13 de V/J de TCRB.
Para TCRG, la pluralidad de oligonucleotidos molde puede tener una pluralidad de secuencias de oligonucleotidos de formula general (I) en las que los polinucleotidos V y J tienen las secuencias V y J de TCRG expuestas en al menos uno de los conjuntos de 14 SEQ ID NO de V y J de TCRG, respectivamente, como se expone en la figura 6, como conjunto 1 de v/j de TCRG V/J, conjunto 2 de V/J de TCRG V/J, conjunto 3 de V/J de TCRG V/J, conjunto 4 de V/J de TCRG V/J y conjunto 5 de V/J de TCRG V/J.
Para IGH, la pluralidad de oligonucleotidos molde puede tener una pluralidad de secuencias de oligonucleotidos de formula general (I) en las que los polinucleotidos V y J tienen las secuencias V y J de IGH expuestas en al menos uno de los conjuntos de 127 SEQ ID NO de V y J de IGH, respectivamente, como se expone en la figura 7 como conjunto 1 de V/J de IGH, conjunto 2 de V/J de IGH, conjunto 3 de V/J de IGH, conjunto 4 de V/J de IGH, conjunto 5 de V/J de IGH, conjunto 6 de V/J de IGH, conjunto 7 de V/J de IGH, conjunto y de V/J de IGH y conjunto 9 de V/J de IGH.
Cebadores
De acuerdo con la presente descripcion, se proporcionan cebadores oligonucleotidos en un conjunto de cebadores oligonucleotidos que comprende una pluralidad de cebadores del segmento V y una pluralidad de cebadores del
5
10
15
20
25
30
35
40
45
50
55
60
segmento J, donde el conjunto de cebadores es capaz de amplificar ADN reordenado que codifica receptores del sistema inmunitario adaptativo en una muestra biologica que comprende ADN de celulas linfoides. Los conjuntos de cebadores adecuados son conocidos en la tecnica y se describen en la presente memoria, por ejemplo, los conjuntos de cebadores en los documentos U.S.A.N. 13/217.126;U.S.A.N. 12/794.507; PCT/US2011/026373; o PCT/US2011/049012; o similares; o los mostrados en la tabla 1. En determinadas realizaciones el conjunto de cebadores se disena para incluir una pluralidad de cebadores espedficos de secuencia de V que incluye, para cada gen de region V unico (incluyendo pseudogenes) en una muestra, al menos un cebador que se puede reasociar espedficamente con una secuencia de region V unica; y para cada gen de region J unico en la muestra, al menos un cebador que se puede reasociar espedficamente con una secuencia de region J unica.
El diseno de cebadores se puede lograr por metodologfas rutinarias en vista de las secuencias genomicas de TCR y BCR conocidas. Por consiguiente, el conjunto de cebadores preferiblemente es capaz de amplificar cada combinacion de V-J posible que puede resultar de las reordenaciones de ADN en los locus de TCR o bCr. Tambien como se describe mas adelante, determinadas realizaciones contemplan conjuntos de cebadores en los que uno o mas cebadores de V pueden ser capaces de reasociarse espedficamente con una secuencia "unica" que puede ser compartida por dos o mas regiones V pero que no es comun a todas las regiones V, y/o en los que uno o mas cebadores de J pueden ser capaces de reasociarse espedficamente con una secuencia "unica" que puede ser compartida por dos o mas regiones J pero que no es comun a todas las regiones J.
En realizaciones, particulares, los cebadores oligonucleotidos para usar en las composiciones y metodos descritos en la presente memoria, pueden comprender o consistir en un acido nucleico de al menos aproximadamente 15 nucleotidos de longitud que tiene la misma secuencia que, o es complementaria de, una secuencia de 15 nucleotidos contiguos de largo del segmento V o J diana (es decir, parte del polinucleotido genomico que codifica un polipeptido de la region V o region J). Cebadores mas largos, por ejemplo, los de aproximadamente 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 45, o 50, nucleotidos de longitud que tienen la misma secuencia que, o la secuencia complementaria de, una secuencia contigua del segmento de polinucleotido que codifica la region V o J diana, tambien seran utiles en determinadas realizaciones. Todas las longitudes intermedias de los cebadores oligonucleotidos presentes descritos estan contempladas para usar en la presente memoria. Como reconocera el experto en la tecnica, los cebadores pueden tener secuencia adicional anadida (p. ej., nucleotidos que pueden no ser iguales que o complementarios del segmento de polinucleotido que codifica la region V o J diana), tal como sitios de reconocimiento de enzimas de restriccion, secuencias adaptadoras para la secuenciacion, secuencias codigos de barras, y similares (vease, p. ej., las secuencias de cebadores proporcionadas en las tablas y lista de secuencias de la presente memoria). Por lo tanto, la longitud de los cebadores puede ser mas larga, tal como aproximadamente 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 80, 85, 90, 95, 100 o mas nucleotidos de longitud o mas, dependiendo del uso o necesidad espedficos.
Tambien estan contemplados para usar en determinadas realizaciones, variantes de cebadores oligonucleotidos del segmento V o segmento J de receptores del sistema inmunitario adaptativo que pueden compartir un grado alto de identidad de secuencia con cebadores oligonucleotidos para los que se presentan en la presente memoria secuencias de nucleotidos, incluyendo las expuestas en la lista de secuencias. Por lo tanto, en estas realizaciones y relacionadas, las variantes de cebadores oligonucleotidos del segmento V o segmento J de receptores del sistema inmunitario adaptativo pueden tener identidad sustancial con secuencias de cebadores oligonucleotidos del segmento V o segmento J de receptores del sistema inmunitario adaptativo descritas en la presente memoria, por ejemplo, dichas variantes de secuencias de oligonucleotidos pueden comprender al menos 70% de identidad de secuencia, preferiblemente al menos 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% o mayor identidad de secuencia comparado con una secuencia de polinucleotido de referencia tal como las secuencias de cebadores oligonucleotidos descritas en la presente memoria, usando los metodos descritos en la presente memoria (p. ej., analisis con BLAST usando parametros estandar). Un experto en esta tecnica reconocera que estos valores se pueden ajustar de forma adecuada para determinar la correspondiente capacidad de una variante de cebador oligonucleotido para reasociarse con un polinucleotido que codifica segmentos del receptor del sistema inmunitario adaptativo, teniendo en cuenta la degeneracion de codones, posicionamiento del marco de lectura, y similares.
Tfpicamente, las variantes de cebadores oligonucleotidos contendran una o mas sustituciones, adiciones, eliminaciones y/o inserciones, preferiblemente de modo que la capacidad de reasociarse con el oligonucleotido variante no disminuya sustancialmente con respecto a la de una secuencia de cebador oligonucleotido del segmento V o segmento J de receptor del sistema inmunitario adaptativo que se expone espedficamente en la presente memoria.
La tabla 1 presenta como un ejemplo no limitante, un conjunto de cebadores oligonucleotidos que es capaz de amplificar productivamente ADN reordenado que codifica cadenas p de TCR (TCRB) en una muestra biologica que comprende ADN de celulas linfoides de un sujeto. En este conjunto de cebadores, los cebadores del segmento J comparten homologfa de secuencia sustancial, y por lo tanto puede haber cebado cruzado entre mas de una secuencia de polinucleotido J diana, pero los cebadores del segmento V se disenan para reasociarse espedficamente con secuencias diana dentro de la region CDR2 de V y por lo tanto son unicos para cada segmento V. Sin embargo, hay una excepcion presente en el caso de varios cebadores de V donde las secuencias dentro de la
5
10
15
20
25
30
35
familia de los genes diana estrechamente relacionados son identicas (p. ej., V6-2 y V6-3 son identicos a nivel de nucleotidos a lo largo de la secuencia codificante del segmento V, y por lo tanto pueden tener un solo cebador, TRB2V6-2/3).
Por lo tanto, se apreciara que en determinadas realizaciones el numero de oligonucleotidos molde diferentes en la composicion de moldes, y/o el numero de cebadores oligonucleotidos diferentes en el conjunto de cebadores, se puede reducir ventajosamente disenando moldes y/o cebadores que aprovechen algunas similitudes conocidas en las secuencias de V y/o J. Por lo tanto, en estas realizaciones y relacionadas, secuencias de oligonucleotidos "unicas" como se describe en la presente memoria, pueden incluir secuencias de polinucleotido V espedficas que son compartidas por 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 oligonucleotidos molde distintos y/o secuencias de polinucleotido J espedficas que son compartidas por 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 o 13 oligonucleotidos molde distintos, donde dichos moldes difieren en secuencia entre sf por secuencias distintas de las de V y/o J compartidas.
De acuerdo con realizaciones presentes contempladas, puede ser util disminuir (p. ej., reducir de una forma estadfsticamente significativa) el sesgo de amplificacion de moldes tal como el potencial de amplificacion de acidos nucleicos no uniformes entre miembros de un conjunto de cebadores de amplificacion, que puede producir eficacias de cebadores desiguales (p. ej., uso de cebadores desigual) solo para un subconjunto limitado de todos los genes V y J naturales. Por ejemplo, en el analisis del repertorio inmunitario de TCR y BCR implicado en una respuesta inmunitaria, si es contra un antfgeno espedfico, como en una vacuna, o contra un tejido, como en una enfermedad autoinmunitaria, pueden ser de interes solo las reordenaciones de TCR e IG productivas. En dichas circunstancias, puede ser economicamente ventajoso identificar y corregir el potencial de amplificacion de acidos nucleicos no uniformes solo para aquellos cebadores de segmentos V y J que contribuyen a reordenaciones productivas del ADN que codifica tCr y bCr, y excluir esfuerzos para corregir la amplificacion no uniforme de pseudogenes y orfones (es decir, segmentos que codifican la region V de TCR o BCR que se han duplicado en otros cromosomas).
En el locus de IGH humano, por ejemplo, la base de datos ImmunoGeneTics (IMGT) (M.-P. LeFranc, Universite Montpellier, Montpellier, Francia;
www.imgt.org) indica 165 genes de segmento V, de los cuales 26 son orfones en otros cromosomas y 139 estan en el locus de IGH en el cromosoma 14. Entre los 139 segmentos V dentro del locus de IGH, 51 tienen al menos un alelo funcional, mientras que 6 son ORF (marcos de lectura abiertos) que pierden al menos un resto de aminoacido altamente conservado, y 81 son pseudogenes. Los pseudogenes pueden incluir segmentos V que contienen un codon de parada en el marco dentro de la secuencia codificante del segmento V, un desplazamiento de marco entre el codon de inicio y la secuencia codificante de CDR3, una o mas inserciones de elementos de repeticion, y eliminaciones de regiones cnticas, tales como el primer exon o RSS. Para caracterizar las reordenaciones de IGH funcionales en una muestra evitando el tiempo y gasto de caracterizacion de pseudogenes y/u orfones, se contempla, por lo tanto, el uso de un subconjunto de los oligonucleotidos molde sinteticos descritos en la presente memoria, que se disena para incluir solo los segmentos V que participan en una reordenacion funcional para codificar TCR o BCR, sin tener que sintetizar o calibrar cebadores de amplificacion y oligonucleotidos molde espedficos para las secuencias de pseudogenes. Ventajosamente, se obtienen asf, entre otros, eficacias respecto al tiempo y gasto.
Tabla 1. Conjunto de cebadores oligonucleotidos de ejemplo (Cebadores de PCR hsTCRB)
Nombre
Secuencia SEQ ID NO:
TRBJ1-1
TTACCTACAACTGTGAGTCTGGTGCCTTGTCCAAA 1631
TRBJ1-2
ACCTACAACGGTTAACCTGGTCCCCGAACCGAA 1632
TRBJ1-3
ACCTACAACAGTGAGCCAACTTCCCTCTCCAAA 1633
TRBJ1-4
CCAAGACAGAGAGCTGGGTTCCACTGCCAAA 1634
TRBJ1-5
ACCTAGGATGGAGAGTCGAGTCCCATCACCAAA 1635
TRBJ1-6
CTGTCACAGTGAGCCTGGTCCCGTTCCCAAA 1636
TRBJ2-1
CGGTGAGCCGTGTCCCTGGCCCGAA 1637
TRBJ2-2
CCAGTACGGTCAGCCTAGAGCCTTCTCCAAA 1638
TRBJ2-3
ACTGTCAGCCGGGTGCCTGGGCCAAA 1639
TRBJ2-4
AGAGCCGGGTCCCGGCGCCGAA 1640
TRBJ2-5
GGAGCCGCGTGCCTGGCCCGAA 1641
ez
SZ9U
VlllOWOOlVOlOOOlVOVOVOOVOlOll 9-zi.Azayi
*Z9I-
OOIWIOOOIVOWIOOVOIOIIVOOI we-zi-Azaai
ez9u
OOIVOIOOOOVOVOIOOVOIOIIVOOO z-zi-Azaai
3Z9U
lOlVOlOOOlVOVOVOOVOlOllVOll i--3i-A3aai
UZ9U
OOOOVWOllOVOlOllWOlVOlVOOll ZAzaai
0Z9U
IVIOOVOOOVOOIOVOOVWOIOOVIIOI *i- Azaai
6991-
lOOWOOOWlOOVOVWOlOOVOVOllV zi-Azaai
8991-
OOOOOVOVWOOOlllWOlOOlOllllV si-Azaai
Z99L-
OOOWOWOOOOOIWOIOIVOIOIIVO i--£3A3aai
9991-
lOOOVOllVWOOOlOOOlOWlOOVOll 9i-A3aai
S99L-
IVOIOOVWOVOVOOIOIOVOIOOVOIO z-eAzaai
*991-
VWIIOVOIOOVWOVOVOOIOIVWIOO i--£A3aai
8991-
VIVIIOOOIOIOOVOVOIOOOOIWOIOO dZAzaai
3991-
OIIVIIOVOIOIOOVOWOOOOOIWOIO e/3-*A3aai
1.991.
OVWIIOIOIOIOOVOWOOOOOIWOIO i.-*Azaai
0991.
OOOOIOIOIOOOVOVIOOOWOIOOVIVI 61- Azaai
699U
VOVOVOVIOIOIOIOVOVIOOOOVOIOOI szAzaai
899U
VIVWOIIOIIIOIVOIVIOOVOVOIOIO 93A3aai
Z99L-
OWWOOIOIOIOVWOVIOOOWOIOOI zzAzaai
9991-
VlWOVOOlOlOVOWOlOVOlOlOOlll i--93A3aai
9991-
VOVOOIOIOIOIOVOVIVOOIVOIOIOIV i--*3A3aai
*991-
OOVOVOOIOIOIOVIVIIOOIVOIOOOIO *-9A3aai
£991-
IIVOVOOIOIOIWOVIOOOIWOOOOIO i--9A3aai
3991-
OIVOVOOIOIOIWOVIOOOIWOOOIIO z-9A3aai
1-991.
OWOVIOOOIWOOOOIOWOVOOVWOVO 9-9A3aai
0991-
OIOIWOVIOOOIWOOOOIOWOVOOW s-9A3aai
6*91.
VIOIWOVIOOOIVOOOOOIOWOVOOW 6-9A3aai
8*91.
OVOOOlllVOOVOVOVOVWllVOVlOlO 8-9A3aai
Z*9I.
WOVIOOOIVOIOOOIOOVOVOOVWOOO e/3-9A3aai
9*91-
OVIVIOOOIVOVOIOIOWOVOOVWOVO e-oi-Azaai
9*91-
loivioooivoooooiowovoovwivo z-oi-Azaai
**91-
OVOVIOOOIVOVOIOIOWOVOOVWOW i--oi-A3aai
8*91-
WOOOOOOOOOOIOOIOOOVOIO z-zraai
3*91.
WOOOOOOOOOOIOOIOOOVOIO 9-zraai
ON Ql 03S
epuenoes 0jqLUO[\l
9U03-Z0-SU
89633Z6I-3
Nombre
Secuencia SEQ ID NO:
TRB2V7-9
GGTTCTCTGCAGAGAGGCCTAAGGGATCT 1676
TRB2V7-8
GCTGCCCAGTGATCGCTTCTTTGCAGAAA 1677
TRB2V7-4
GGCGGCCCAGTGGTCGGTTCTCTGCAGAG 1678
TRB2V7-6/7
ATGATCGGTTCTCTGCAGAGAGGCCTGAGG 1679
TRB2V7-2
AGTGATCGCTTCTCTGCAGAGAGGACTGG 1680
TRB2V7-3
GGCTGCCCAACGATCGGTTCTTTGCAGT 1681
TRB2V7-1
TCCCCGTGATCGGTTCTCTGCACAGAGGT 1682
TRB2V11-123
CTAAGGATCGATTTTCTGCAGAGAGGCTC 1683
TRB2V13
CTGATCGATTCTCAGCTCAACAGTTCAGT 1684
TRB2V5-1
TGGTCGATTCTCAGGGCGCCAGTTCTCTA 1685
TRB2V5-3
TAATCGATTCTCAGGGCGCCAGTTCCATG 1686
TRB2V5-4
TCCTAGATTCTCAGGTCTCCAGTTCCCTA 1687
TRB2V5-8
GGAAACTTCCCTCCTAGATTTTCAGGTCG 1688
TRB2V5-5
AAGAGGAAACTTCCCTGATCGATTCTCAGC 1689
TRB2V5-6
GGCAACTTCCCTGATCGATTCTCAGGTCA 1690
TRB2V9
GTTCCCTGACTTGCACTCTGAACTAAAC 1691
TRB2V15
GCCGAACACTTCTTTCTGCTTTCTTGAC 1692
TRB2V30
GACCCCAGGACCGGCAGTTCATCCTGAGT 1693
TRB2V20-1
ATGCAAGCCTGACCTTGTCCACTCTGACA 1694
TRB2V29-1
CATCAGCCGCCCAAACCTAACATTCTCAA 1695
En algunas realizaciones, los cebadores oligonucleotidos del segmento V y segmento J como se describen en la presente memoria se disenan para incluir secuencias de nucleotidos de modo que este presente informacion adecuada dentro de la secuencia de un producto de amplificacion de un gen del receptor del sistema inmunitario 5 adaptativo reordenado (TCR o Ig) para identificar de forma unica tanto los genes espedficos de V como espedficos de J que dan lugar al producto de amplificacion en el locus del receptor del sistema inmunitario adaptativo reordenado (p. ej., al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 pares de bases de secuencia en la direccion 5' de la secuencia de senal de recombinacion (RSS) del gen V, preferiblemente al menos aproximadamente 22, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 39 o 40 pares de bases de secuencia en la direccion 5' 10 de la secuencia de senal de recombinacion (RSS) del gen V, y en algunas realizaciones preferidas mas de 40 pares de bases de secuencia en la direccion 5' de la secuencia de senal de recombinacion (RSS) del gen V, y al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 pares de bases en la direccion 3' de la RSS del gen J, preferiblemente al menos aproximadamente 22, 24, 26, 28 o 30 pares de bases en la direccion 3' de la RSS del gen J, y en algunas realizaciones preferidas mas de 30 pares de bases en la direccion 3' de la RSS del gen J).
15 Esta caractenstica esta en contraste con los cebadores oligonucleotidos descritos en la tecnica para la amplificacion
de secuencias de genes que codifican TCR o que codifican Ig, que se basan principalmente en la reaccion de amplificacion simplemente para la deteccion de la presencia o ausencia de productos de tamanos adecuados para los segmentos V y J (p. ej., la presencia en productos de reaccion de la PCR de un tamano particular indica la presencia de un segmento V o J, pero no puede proporcionar la secuencia del producto de PCR amplificado y por lo 20 tanto no puede confirmar su identidad, tal como la practica comun de analisis de espectros ("spectratyping")).
Los oligonucleotidos (p. ej., cebadores) se pueden preparar por cualquier metodo adecuado, incluyendo la smtesis qmmica directa por un metodo tal como el metodo del fosforotriester de Narang et al., 1979, Meth. Enzymol. 68:9099; el metodo del fosfotriester de Brown et al., 1979, Meth. Enzymol. 68:109-151; el metodo de la dietilfosforamidita de Beaucage et al., 1981, Tetrahedron Lett. 22:1859-1862; y el metodo del soporte solido de la patente de EE.UU. n°
5
10
15
20
25
30
35
40
45
50
55
60
4.458.066. Se proporciona una revision de metodos de smtesis de conjugados de oligonucleotidos y nucleotidos modificados en Goodchild, 1990, Bioconjugate Chemistry 1(3): 165-187.
El termino "cebador" como se usa en la presente memoria, se refiere a un oligonucleotido capaz de actuar como un punto de inicio de la smtesis de ADN en condiciones adecuadas. Dichas condiciones incluyen aquellas en las que se induce la smtesis de un producto de extension del cebador complementary a una cadena de acido nucleico, en presencia de cuatro trifosfatos de nucleosidos diferentes y un agente para la extension (p. ej., una ADN polimerasa o transcriptasa inversa) en un tampon adecuado y a una temperatura adecuada.
Un cebador preferiblemente es un ADN monocatenario. La longitud adecuada de un cebador depende del uso previsto del cebador, pero tfpicamente esta en el intervalo de 6 a 50 nucleotidos, o en algunas realizaciones, de 1535 nucleotidos. Las moleculas de cebadores cortos en general requieren temperaturas mas fnas para formar complejos hubridos suficientemente estables con el molde. No es necesario que un cebador refleje la secuencia exacta del acido nucleico molde, pero debe ser suficientemente complementario para hibridar con el molde. El diseno de cebadores adecuados para la amplificacion de una secuencia diana dada es bien conocida en la tecnica y se describe en la bibliograffa citada en la presente memoria.
Como se describe en la presente memoria, los cebadores pueden incorporar caractensticas adicionales que permitan la deteccion o inmovilizacion del cebador, pero no alteren la propiedad basica del cebador, la de actuar como un punto de inicio de la smtesis de ADN. Por ejemplo, los cebadores pueden contener una secuencia de acido nucleico adicional en el extremo 5' que no hibrida con el acido nucleico diana, pero que facilita la clonacion, deteccion o secuenciacion del producto amplificado. La region del cebador que es suficientemente complementaria del molde para hibridar, se denomina en la presente memoria la region de hibridacion.
Como se usa en la presente memoria, un cebador es "espedfico" para una secuencia diana, si cuando se usa en una reaccion de amplificacion en condiciones suficientemente restrictivas, el cebador hibrida principalmente con el acido nucleico diana. Tfpicamente, un cebador es espedfico para una secuencia diana si la estabilidad del duplex cebador-diana es mayor que la estabilidad de un duplex formado entre el cebador y cualquier otra secuencia encontrada en la muestra. Un experto en la tecnica reconocera que varios factores, tales como las condiciones salinas asf como la composicion de bases del cebador y la localizacion de los errores de apareamiento, afectaran a la especificidad del cebador, y que en muchos casos sera necesaria la confirmacion experimental rutinaria del cebador. Se pueden elegir condiciones de hibridacion en las que el cebador puede formar duplex estables solo con una secuencia diana. Por lo tanto, el uso de cebadores espedficos de diana en condiciones de amplificacion restrictivas adecuadas permite la amplificacion selectiva de las secuencias diana que contienen los sitios diana de union del cebador.
En realizaciones particulares, los cebadores para usar en los metodos descritos en la presente memoria comprenden o consisten en un acido nucleico de al menos aproximadamente 15 nucleotidos de longitud, que tiene la misma secuencia que, o es complementario de una secuencia contigua de 15 nucleotidos de longitud del segmento V o J diana. Cebadores mas largos, por ejemplo, los de aproximadamente 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 45, o 50, nucleotidos de longitud que tienen la misma secuencia que, o la secuencia complementaria de, una secuencia contigua del segmento V o J diana, tambien seran utiles en determinadas realizaciones. Estan contempladas en la presente memoria todas las longitudes intermedias de los cebadores mencionados en lo que antecede. Como reconocera el experto en la tecnica, los cebadores pueden tener secuencia adicional anadida (p. ej., nucleotidos que pueden no ser iguales que o complementarios del segmento V o J diana), tal como sitios de reconocimiento de enzimas de restriccion, secuencias adaptadoras para la secuenciacion, secuencias codigos de barras, y similares (vease, p. ej., las secuencias de cebadores proporcionadas en la presente memoria y en la lista de secuencias). Por lo tanto, la longitud de los cebadores puede ser mas larga, tal como 55, 56, 57, 58, 59, 60, 65, 70, 75, nucleotidos de longitud dependiendo del uso o necesidad espedficos. Por ejemplo, en una realizacion, los cebadores directos e inversos estan ambos modificados en el extremo 5' con la secuencia de cebador directo universal compatible con un secuenciador de ADN.
Tambien estan contemplados para usar en determinadas realizaciones, variantes de cebadores oligonucleotidos del segmento V o segmento J de receptores del sistema inmunitario adaptativo que pueden compartir un grado alto de identidad de secuencia con cebadores oligonucleotidos para los que se presentan en la presente memoria secuencias de nucleotidos, incluyendo las expuestas en la lista de secuencias. Por lo tanto, en estas realizaciones y relacionadas, las variantes de cebadores oligonucleotidos del segmento V o segmento J de receptores del sistema inmunitario adaptativo pueden tener identidad sustancial con secuencias de cebadores oligonucleotidos del segmento V o segmento J de receptores del sistema inmunitario adaptativo descritas en la presente memoria, por ejemplo, dichas variantes de secuencias de oligonucleotidos pueden comprender al menos 70% de identidad de secuencia, preferiblemente al menos 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% o mayor identidad de secuencia comparado con una secuencia de polinucleotido de referencia tal como las secuencias de cebadores oligonucleotidos descritas en la presente memoria, usando los metodos descritos en la presente memoria (p. ej., analisis con BLAST usando parametros estandar). Un experto en esta tecnica reconocera que estos valores se pueden ajustar de forma adecuada para determinar la correspondiente capacidad de una variante de cebador oligonucleotido para reasociarse con un polinucleotido que codifica segmentos del receptor del
5
10
15
20
25
30
35
40
45
50
55
60
sistema inmunitario adaptativo, teniendo en cuenta la degeneracion de codones, posicionamiento del marco de lectura, y similares.
^picamente, las variantes de cebadores oligonucleotidos contendran una o mas sustituciones, adiciones, eliminaciones y/o inserciones, preferiblemente de modo que la capacidad de reasociarse con el oligonucleotido variante no disminuya sustancialmente con respecto a la de una secuencia de cebador oligonucleotido del segmento V o segmento J de receptor del sistema inmunitario adaptativo que se expone espedficamente en la presente memoria. Como tambien se ha indicado en otra parte en la presente memoria, en realizaciones preferidas, los cebadores oligonucleotidos del segmento V y segmento J de receptores del sistema inmunitario adaptativo se disenan para ser capaces de amplificar una secuencia de TCR o IGH reordenada que incluye la region codificante para CdR3.
De acuerdo con determinadas realizaciones contempladas en la presente memoria, los cebadores para usar en los metodos de PCR multiplexados de la presente descripcion se pueden bloquear funcionalmente para prevenir el cebado no espedfico de secuencias que no son de linfocitos T o B. Por ejemplo, los cebadores se pueden bloquear con modificaciones qmmicas como se describe en la publicacion de la solicitud de patente de EE.UU. US2010/0167353. De acuerdo con determinadas realizaciones descritas en la presente memoria, el uso de dichos cebadores bloqueados en las presentes reacciones de PCR multiplexadas implica cebadores que pueden tener una configuracion inactiva en donde la replicacion del ADN (es decir, extension del cebador) esta bloqueada y una configuracion activada en donde avanza la replicacion del ADN. La configuracion inactiva del cebador esta presente cuando el cebador es monocatenario, o cuando el cebador esta hibridado espedficamente con la secuencia de ADN diana de interes pero la extension del cebador permanece bloqueada por un resto qrnmico que esta unido a o cerca del extremo 3' del cebador.
La configuracion activada del cebador esta presente cuando el cebador esta hibridado con la secuencia de acido nucleico diana de interes y sobre el que posteriormente actua la RNasa H u otro agente de escision para separar el grupo bloqueante 3', dejando asf que una enzima (p. ej., una ADN polimerasa) catalice la extension del cebador en una reaccion de amplificacion. Sin querer estar ligado por la teona, se cree que las cineticas de la hibridacion de dichos cebadores son parecidas a una reaccion de segundo orden, y por lo tanto, son funcion de la concentracion de la secuencia genica de los linfocitos T o linfocitos B en la mezcla. Los cebadores bloqueados minimizan las reacciones no espedficas requiriendo la hibridacion con la diana seguido de escision antes de que pueda proceder la extension del cebador. Si un cebador hibrida de forma incorrecta con una secuencia que esta relacionada con la secuencia diana deseada pero que difiere al tener uno o mas nucleotidos no complementarios que producen apareamiento erroneo de pares de bases, la escision del cebador es inhibida, en especial cuando hay un apareamiento erroneo que esta en o cerca del sitio de escision. Esta estrategia para mejorar la fidelidad de la amplificacion reduce la frecuencia del cebado falso en dichas localizaciones, y por lo tanto aumenta la especificidad de la reaccion. Como reconocera el experto, las condiciones de reaccion, en particular la concentracion de RNasa H y el tiempo permitido para la hibridacion y extension en cada ciclo, se puede optimizar para maximizar la diferencia en las eficacias de escision entre la escision altamente eficaz del cebador cuando esta correctamente hibridado con su secuencia diana verdadera, y la poca escision del cebador cuando hay un apareamiento erroneo entre el cebador y la secuencia molde con la que se puede reasociar de forma incompleta.
Como se describe en el documento US2010/0167353, se conocen una serie de grupos bloqueadores en la tecnica que se pueden poner en o cerca del extremo 3' del oligonucleotido (p. ej., un cebador) para prevenir la extension. Un cebador u otro oligonucleotido se puede modificar en el nucleotido 3'-terminal para prevenir o inhibir el inicio de la smtesis de ADN, por ejemplo, por adicion de un resto de 3'-desoxirribonucleotido (p. ej., cordicepina), un resto de 2',3'-didesoxirribonucleotido, uniones no nucleotfdicas o modificaciones de alcano-diol (patente de EE.UU. n° 5.554.516). Las modificaciones de alcano-diol que se pueden usar para inhibir o bloquear la extension del cebador tambien han sido descritas por Wilk et al., (1990 Nucleic Acids Res. 18 (8):2065), y por Arnold et al. (patente de EE.UU. n° 6.031.091). Los ejemplos adicionales de grupos de bloqueo adecuados incluyen sustituciones en el hidroxilo de 3' (p. ej., 3'-fosfato, 3'-trifosfato o diesteres de 3'-fosfato con alcoholes tales como 3-hidroxipropilo), fosfato 2'3'-dclico, sustituciones en el hidroxilo de 2' de una base de ARN terminal (p. ej., fosfato o grupos estericamente impedidos tales como triisopropilsililo (TIPS) o terc-butildimetilsililo (TBDMS)). Laikhter et al., solicitud de patente de EE.UU. n° de serie 11/686.894 (US2007218490), describen grupos 2'-alquil-sililo tales como TIPS y TBDMS sustituyentes en el extremo 3' de un oligonucleotido. Los sustituyentes con impedimento esterico tambien se pueden incorporar en la base en el resto 3'-terminal del oligonucleotido para bloquear la extension del cebador.
En algunas realizaciones, el oligonucleotido puede comprender un dominio de escision que esta situado en la direccion 5' (p. ej., 5' de) del grupo bloqueante usado para ihibir la extension del cebador. Como ejemplos, el dominio de escision puede ser un dominio de escision de RNasa H, o el dominio de escision pude ser un dominio de escision de RNasa H2 que comprende un solo resto de ARN, o el oligonucleotido puede comprender la sustitucion de la base de ARN con uno o mas nucleosidos alternativos. Se describen dominios de escision ilustrativos adicionales en el documento US2010/0167353.
Por lo tanto, un sistema de PCR multiplexado puede usar 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, o mas cebadores directos, en donde cada cebador directo es complementario de un solo segmento V de TCR o Ig funcional o una pequena familia de segmentos V de TCR o Ig funcionales, p. ej., un segmento Vp de TCR , (vease p. ej., los
5
10
15
20
25
30
35
40
45
50
55
60
cebadores de TCRBV mostrados en la tabla 1, SEQ ID NO: 1644-1695), y, por ejemplo, 13 cebadores inversos, cada uno espedfico de un segmento J de TCR, tal como el segmento Jp de TCR (vease, p. ej., cebadores de TCRBJ en la tabla 1, SEQ ID NO: 1631-1643). En otra realizacion, una reaccion de PCR multiplexada puede usar cuatro cebadores directos cada uno espedfico para uno o mas segmentos V de TCRy funcionales y cuatro cebadores inversos cada uno espedfico para uno o mas segmentos J de TCRy. En otra realizacion, una reaccion de PCR multiplexada puede usar 84 cebadores directos cada uno espedficos para uno o mas segmentos V funcionales y seis cebadores inversos cada uno espedfico para uno o mas segmentos J.
Las condiciones de los ciclos termicos pueden seguir los metodos de los expertos en la tecnica. Por ejemplo, usando un ciclador termino PCR Express™ (Hybaid, Ashford, Reino Unido), se pueden usar las siguientes condiciones de ciclos: 1 ciclo a 95°C durante 15 minutos, de 25 a 40 ciclos a 94°C durante 30 segundos, 59°C durante 30 segundos y 72°C durante 1 minuto, seguido de un ciclo a 72°C durante 10 minutos. Como reconocera el experto en la tecnica, las condiciones de los ciclos termicos se pueden optimizar, por ejemplo, modificando las temperaturas de reasociacion, tiempos de reasociacion, numero de ciclos y tiempos de extension. Como reconocera el experto en la tecnica, la cantidad de cebador y otros reactivos de pCr usados, asf como los parametros de la PCR (p. ej., temperatura de reasociacion, tiempos de extension y numero de ciclos), se pueden optimizar para lograr la eficacia de la amplificacion de PCR deseada.
Alternativamente, en determinadas realizaciones relacionadas tambien se contemplan en la presente memoria, metodos de "PCR digital" que se pueden usar para cuantificar el numero de genomas diana en una muestra, sin necesidad de una curva patron. En la PCR digital, la reaccion de PCR para una sola muestra se lleva a cabo en una multitud de mas de 100 microceldas o gotitas, de modo que cada gotita amplifica (p. ej., la generacion de un producto de amplificacion proporciona pruebas de la presencia de al menos una molecula molde en la microcelda o gotita) o no consigue amplificar (prueba de que el molde no esta presente en una microcelda o gotita dada). Simplemente contando el numero de microceldas positivas, se puede contar directamente el numero de genomas diana que estan presentes en una muestra de entrada.
Los metodos de la PCR digital tfpicamente usan una lectura de punto final, en lugar de una senal de PCR cuantitativa convencional que se mide despues de cada ciclo en la reaccion de ciclos termicos (vease, p. ej., Pekin et al., 2011 Lab. Chip 11(13):2156; Zhong et al., 2011 Lab. Chip 11(13):2167; Tewhey et al., 2009 Nature Biotechnol. 27:1025; 2010 Nature Biotechnol. 28:178; Vogelstein y Kinzler, 1999 Proc. Natl. Acad. Sci. USA 96:9236-41; Pohl y Shih, 2004 Expert Rev. Mol. Diagn. 4(1);41-7, 2004). Comparada con la PCR tradicional, la dPCR tiene las siguientes ventajas: (1) no es necesario basarse en referencias o patrones, (2) se puede lograr la precision deseada aumentando el numero total de replicados de la PCR, (3) es muy tolerante a los inhibidores, (4) es capaz de analizar mezclas complejas, y (5) proporciona una respuesta lineal al numero de copias presentes en una muestra para permitir que se detecte un cambio pequeno en el numero de copias. Por consiguiente, cualquiera de las composiciones (p. ej., composiciones de moldes y conjuntos de cebadores oligonucleotidos espedficos de genes de receptores del sistema inmunitario adaptativo) y metodos descritos en la presente memoria, se pueden adaptar para usar en dicha metodologfa de PCR digital, por ejemplo, el sistema ABI QuantStudio™ 12K Flex (Life Technologies, Carlsbad, CA), el sistema QX100™ Droplet Digital™ PCR (BioRad, Hercules, CA), el sistema QuantaLife™ digital PCR (BioRad, Hercules, CA) o el sistema de PCR digital basado en microgotas RainDance™ (RainDance Technologies, Lexington, MA). Reischl et al., Molecular Biotechnology, vol. 3, 1 Feb. 1995, paginas 55-71, describen metodos de PCR cuantitativa. Henegariu et al., Biotechniques, vol. 23, no. 3, 1 Sept. 1997, paginas 504-511, describen metodos de PCR multiplexada.
Adaptadores
Los oligonucleotidos molde descritos en la presente memoria de formula general (I), en determinadas realizaciones tambien pueden comprender una primera (U1) y una segunda (U2) secuencia de oligonucleotido adaptador universal, o pueden carecer de cualquiera de, o tanto de U1 como U2. Por lo tanto, U1 puede comprender nada o un oligonucleotido que tiene una secuencia que se selecciona de (i) una primera secuencia de oligonucleotido adaptador universal, y (ii) una primera secuencia de oligonucleotido espedfica de plataforma de secuenciacion que esta unida a, y situada 5' respecto a la primera secuencia de oligonucleotido adaptador universal, y U2 puede comprender nada o un oligonucleotido que tiene una secuencia que se selecciona de (i) una segunda secuencia de oligonucleotido adaptador universal, y (ii) una segunda secuencia de oligonucleotido espedfica de plataforma de secuenciacion que esta unida a, y situada 5' respecto a la segunda secuencia de oligonucleotido adaptador universal.
U1 y/o U2 pueden, por ejemplo, comprender secuencias de oligonucleotido de adaptador universal y/o secuencias de oligonucleotidos espedficas de plataforma de secuenciacion, que son espedficas para una tecnologfa de secuenciacion de una sola molecula que se use, por ejemplo, los sistemas HiSeq™ o GeneAnalyzer™-2 (GA-2) (Illumina, Inc., San Diego, CA) u otro conjunto de instrumentacion, reactivos y software adecuado. La inclusion de dichas secuencias adaptadoras espedficas de plataforma permite la secuenciacion cuantitativa directa de la composicion de moldes presente descrita, que comprende una pluralidad de diferentes oligonucleotidos molde de formula general (I), usando una metodologfa de secuenciacion de nucleotidos tal como HiSeq™ o GA2 o equivalente. Por lo tanto, esta caractenstica permite ventajosamente la caracterizacion cualitativa y cuantitativa de la composicion de moldes.
5
10
15
20
25
30
En particular, la capacidad de secuenciar todos los componentes de la composicion de moldes permite directamente la verificacion de que cada uno de los oligonucleotidos molde en la pluralidad de oligonucleotidos molde esta presente en una cantidad sustancialmente equimolar. Por ejemplo, se puede generar un conjunto de los oligonucleotidos molde presentes descritos que tiene secuencias adaptadoras universales en ambos extremos, de modo que las secuencias adaptadoras se pueden usar para incorporar ademas oligonucleotidos espedficos de la plataforma de secuenciacion en cada extremo de cada molde.
Sin querer estar ligados por la teona, se pueden anadir oligonucleotidos espedficos de plataforma en los extremos de dichos moldes usando oligonucleotidos 5' (5'-secuencia de plataforma-secuencia adaptadora universal 1-3') y 3' (5'-secuencia de plataforma-secuencia adaptadora universal 2-3') en tan poco como dos ciclos de desnaturalizacion, reasociacion y extension, de modo que la representacion relativa en la composicion de moldes de cada uno de los oligonucleotidos molde componentes no esta cuantitativamente alterada. Las secuencias identificadoras unicas (p. ej., secuencia B de codigo de barras que comprende secuencias de oligonucleotidos V y B unicas que se asocian con y por lo tanto identifican, respectivamente, regiones V y J individuales, como se describe en la presente memoria) se colocan adyacentes a las secuencias adaptadoras, permitiendo asf la secuenciacion cuantitativa en lecturas de secuencia cortas, con el fin de caracterizar la poblacion de moldes por el criterio de la cantidad relativa de cada secuencia molde unica que esta presente.
Donde dicha secuenciacion cuantitativa directa indica que uno o mas oligonucleotidos particulares pueden estar representados en exceso o en menor cantidad en una preparacion de la composicion de moldes, se puede hacer en consecuencia el ajuste de la composicion de moldes para obtener una composicion de moldes en la que todos los oligonucleotidos estan presentes en cantidades sustancialmente equimolares. La composicion de moldes en la que todos los oligonucleotidos estan presentes en cantidades sustancialmente equimolares, se pueden usar entonces como un patron de calibracion para conjuntos de cebadores de amplificacion, tal como en los presentes metodos descritos para determinar y corregir la potencial amplificacion no uniforme entre los miembros de un conjunto de cebadores.
Ademas de las secuencias adaptadoras descritas en los ejemplos e incluidas en las secuencias molde de ejemplo en la lista de secuencias (p. ej., en los extremos 5' y 3' de las SEQ ID NO: 1-1630), los expertos en la tecnica conoceran otras secuencias de oligonucleotidos que se pueden usar como secuencias adaptadoras universales, en vista de la presente descripcion, incluyendo la seleccion de secuencias de oligonucleotidos adaptadores que son distintas de las secuencias encontradas en otras partes de los moldes descritos en la presente memoria. Se muestran ejemplos no limitantes de secuencias adaptadoras universales en la tabla 2 y se exponen en las SEQ ID NO: 1710-1731.
Tabla 2. Secuencias adaptadoras de ejemplo
Nombre del adaptador (cebador)
Secuencia SEQ ID NO:
Promotor de T7
AATACGACTCACTATAGG 1710
Terminador de T7
GCTAGTTATTGCTCAGCGG 1711
T3
ATTAACCCTCACTAAAGG 1712
SP6
GATTTAGGTGACACTATAG 1713
M13F(-21)
TGTAAAACGACGGCCAGT 1714
M13F(-40)
GTTTTCCCAGTCACGAC 1715
M13R inverso
CAGGAAACAGCTATGACC 1716
AOX1 directo
GACTGGTTCCAATTGACAAGC 1717
AOX1 inverso
GCAAATGGCATTCTGACATCC 1718
pGEX directo (GST 5, pGEX 5')
GGGCTGGCAAGCCACGTTTGGTG 1719
pGEX inverso (GST 3, pGEX3')
CCGGGAGCTGCATGTGTCAGAGG 1720
BGH inverso
AACTAGAAGGCACAGTCGAGGC 1721
GFP (C' terminal, CFP, YFP o BFP)
CACTCTCGGCATGGACGAGC 1722
GFP inverso
TGGTGCAGATGAACTTCAGG 1723
GAG
GTTCGACCCCGCCTCGATCC 1724
5
10
15
20
25
30
35
40
45
GAG inverso
TGACACACATTCCACAGGGTC 1725
CYC1 inverso
GCGTGAATGTAAGCGTGAC 1726
pFastBacF
5'-d(GGATTATTCATACCGTCCCA)-3' 1727
pFastBacR
5'-d(CAAATGTGGTATGGCTGATT)-3' 1728
pBAD directo
5'-d(ATGCCATAGCATTTTTATCC)-3' 1729
pBAD inverso
5'-d (GATTTAATCTGTATCAGG)-3' 1730
CMV-directo
5'-d (CGCAAATGGGCGGTAGGCGTG)-3' 1731
Codigos de barras
Como se describe en la presente memoria, algunas realizaciones contemplan disenar secuencias de oligonucleotidos molde para que contengan secuencias cortas de firma que permiten la identificacion sin ambiguedad de la secuencia molde, y por lo tanto de al menos un primer cebador responsable de la amplificacion de ese molde, sin tener que secuenciar el producto de amplificacion entero. En los oligonucleotidos molde descritos en la presente memoria de formula general (I), B1, B2, B3 y B4 son cada uno independientemente nada o cada uno comprende un oligonucleotido B que comprende una secuencia de oligonucleotido de codigo de barras de 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 o 1000 o mas nucleotidos contiguos (incluyendo todos los valores enteros entre ellos), en donde cada una de la pluralidad de secuencias de oligonucleotidos molde B comprende una secuencia de oligonucleotido unica que identifica de forma unica, como una combinacion emparejada, (i) la secuencia de oligonucleotido de V unica del oligonucleotido molde, y (ii) la secuencia de oligonucleotido de J unica del oligonucleotido molde.
Por lo tanto, por ejemplo, los oligonucleotidos molde que tienen secuencias identificadoras de codigos de barra pueden permitir lecturas de secuencia de producto de amplificacion relativamente cortas, tales como lecturas de secuencias codigos de barras de no mas de 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 90, 80, 70, 60, 55, 50, 45, 40, 35, 30, 25, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4 o menos nucleotidos, seguido de emparejamiento de esta informacion de secuencia de codigo de barras con las secuencias de V y J asociadas, que se incorporan en el molde que tiene el codigo de barras como parte del diseno del molde. Por este procedimiento, se pueden secuenciar parcialmente simultaneamente un gran numero de productos de amplificacion por secuenciacion paralela de alta capacidad, para identificar cebadores que son responsables del sesgo de la amplificacion en un conjunto de cebadores complejo.
Los codigos de barras de ejemplo pueden comprender un primer oligonucleotido codigo de barras de 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o 16 nucleotidos que identifica de forma unica cada polinucleotido V en el molde y un segundo oligonucleotido codigo de barras de 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o 16 nucleotidos que identifica de forma unica cada polinucleotido V en el molde, para proporcionar codigos de barras de, respectivamente, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 o 32 nucleotidos de longitud, pero estas y realizaciones relacionadas no se pretende que esten asf limitadas. Los oligonucleotidos de codigos de barras pueden comprender secuencias de oligonucleotidos de cualquier longitud, con la condicion de que se obtenga una longitud de codigo de barras minima que prevenga la aparicion de una secuencia de codigo de barras en dos o mas oligonucleotidos molde que tienen por lo demas secuencias distintas (p. ej., secuencias V y J).
Por lo tanto, la longitud minima del codigo de barras, para evitar la redundancia entre los codigos de barras que se usan para identificar de forma unica diferentes parejas de secuencias V-J, es X nucleotidos, donde 4x es mayor que el numero de especies de molde distintas que se van a diferenciar basandose en que no hay secuencias identicas. Por ejemplo, para el conjunto de 871 oligonucleotidos molde expuestos en la presente memoria como SEQ ID NO: 1-871, la longitud minima del codigo de barras sena 5 nucleotidos, lo que permitina un total teorico de 1024 (es decir, mas de 871) posibles secuencias de pentanucleotidos diferentes. En la practica, las longitudes de lecturas de secuencias de oligonucleotidos de codigos de barras puede estar limitada solo por los lfmites de longitud de lectura de secuencias del instrumento de secuenciacion de nucleotidos que se use. Para determinadas realizaciones, los oligonucleotidos de codigos de barras diferentes que distinguiran especies individuales de oligonucleotidos molde deben tener al menos dos emparejamientos de nucleotidos (p. ej., una distancia de Hamming minima de 2) cuando se alinean para maximizar el numero de nucleotidos que coinciden en posiciones particulares en las secuencias de oligonucleotidos de codigos de barras.
En realizaciones preferidas, para cada especie de oligonucleotido molde distinta que tiene una secuencia unica dentro de la composicion de moldes de formula general (I), B1, B2, B3, y B4 seran iguales.
El experto en la tecnica estara familiarizado con el diseno, smtesis e incorporacion en un oligonucleotido mayor o construccion de polinucleotido, de secuencias de oligonucleotidos de codigos de barras de, por ejemplo, al menos
5
10
15
20
25
30
35
40
45
50
55
60
3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 70, 80, 90, 100, 200, 300, 300, 500 o mas nucleotidos contiguos, incluyendo todos los valores enteros entre ellos. Para ejemplos no limitantes del diseno e implementacion de estrategias de identificacion de secuencias de oligonucleotidos de codigos de barras, vease, p. ej., de Carcer et al., 2011 Adv. Env. Microbiol. 77:6310; Parameswaran et al., 2007 Nucl. Ac. Res. 35(19):330; Roh et al., 2010 Trends Biotechnol. 28:291.
Tfpicamente, los codigos de barras estan situados en los moldes en posiciones donde no se encuentran de forma natural, es decir, los codigos de barras comprenden secuencias de nucleotidos que son distintas de cualquier secuencia de nucleotidos que se presenta de forma natural, que se pueden encontrar en la proximidad de las secuencias adyacentes a las cuales estan situados los codigos de barras (p. ej., secuencias V y/o J). Dichas secuencias de codigos de barras pueden estar incluidas, de acuerdo con algunas realizaciones descritas en la presente memoria, como elementos B1, B2 y/o B3 de los oligonucleotidos molde presentes descritos de formula general (I). Por consiguiente, algunos de los oligonucleotidos molde de formula general (I) descritos en la presente memoria, en algunas realizaciones tambien pueden comprender uno, dos o los tres codigos de barras B1, B2 y B3, aunque en algunas otras realizaciones algunos o todos estos codigos de barras pueden estar ausentes. En algunas realizaciones, todas las secuencias de codigos de barras tienen contenido de GC identico o similar (p. ej., difieren en el contenido de GC en no mas de 20%, o en no mas de 19, 18, 17, 16, 15, 14, 13, 12, 11 o 10%).
En las composiciones de moldes de acuerdo con algunas realizaciones descritas en la presente memoria, el elemento B que contiene el codigo de barras (p. ej., B1, B2, B3 y/o B4) comprende la secuencia de oligonucleotidos que identifica de forma unica una sola combinacion V-J emparejada. Opcionalmente y en algunas realizaciones, el elemento que contiene el codigo de barras tambien puede incluir un nucleotido aleatorio o una secuencia de polinucleotido aleatoria de al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30" 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 45, 50, 55, 60, 70, 80, 90, 100, 200, 300, 300, 500 o mas nucleotidos contiguos, situados en la direccion 5' y/o en la direccion 3' de la secuencia de codigo de barras espedfica que identifica de forma unica cada combinacion V-J emparejada espedfica. Cuando esta presente tanto en la direccion 5' como en la direccion 3' de la secuencia de codigo de barras espedfica, el nucleotido aleatorio o secuencia de polinucleotido aleatoria, son independientes entre sf, es decir, pueden comprender, pero no necesariamente, el mismo nucleotido o la misma secuencia de polinucleotido.
Sitios de enzimas de restriccion
De acuerdo con algunas realizaciones descritas en la presente memoria, el oligonucleotido molde puede comprender un sitio de reconocimiento de endonucleasa de restriccion (ER) que esta situado entre las secuencias de V y J y no aparece en otra parte en la secuencia de oligonucleotido molde. El sitio de reconocimiento de la ER opcionalmente puede estar adyacente a un sitio de codigo de barras que identifica la secuencia de la region V. El sitio de la ER se puede incluir para cualquiera de una serie de fines, incluyendo sin limitacion, como una caractenstica estructural que se puede aprovechar para destruir moldes selectivamente poniendolos en contacto con la enzima de restriccion adecuada. Puede ser conveniente degradar los presentes oligonucleotidos molde selectivamente poniendolos en contacto con una ER adecuada, por ejemplo, para separar oligonucleotidos molde de otras composiciones en las que se pueden haber introducido de forma deliberada o accidental. Alternativamente, el sitio de la ER se puede aprovechar de forma util en el transcurso de la secuenciacion de oligonucleotidos molde en la composicion de moldes, y/o como un marcador de secuencia de posicion en una secuencia de oligonucleotido molde independientemente de si es o no escindida por una enzima de restriccion. Un sitio de ER de ejemplo es el motivo oligonucleotido GTCGAC, que es reconocido por la enzima de restriccion Sal I. Se conocen en la tecnica un gran numero de enzimas de restriccion adicionales y sus respectivas secuencias del sitio de reconocimiento de la ER y estan disponibles en el comercio (p. ej., New England Biolabs, Beverly, MA). Estas incluyen, por ejemplo, EcoRl (GAATTC) y SphI (GCATGC). Los familiarizados con la tecnica apreciaran que cualquiera de una variedad de dichos sitios de reconocimiento de ER se puede incorporar en realizaciones particulares de los oligonucleotidos molde presentes descritos.
Secuenciacion
La secuenciacion se puede llevar a cabo usando cualquiera de una variedad de maquinas y sistemas disponibles de secuenciacion de moleculas individuales de alta capacidad. Los sistemas de secuencias ilustrativos incluyen sistemas de smtesis por secuencias tales como el analizador Illumina Genome Analyzer e instrumentos asociados (Illumina, Inc., San Diego, CA), Helicos Genetic Analysis System (Helicos BioSciences Corp., Cambridge, MA), Pacific Biosciences PacBio RS (Pacific Biosciences, Menlo Park, CA), u otros sistemas que tienen capacidades similares. La secuenciacion se logra usando un conjunto de oligonucleotidos de secuenciacion que hibridan con una region definida dentro de las moleculas de ADN amplificadas. Los oligonucleotidos de secuenciacion se disenan de modo que los segmentos genicos que codifican V y J pueden ser identificados de forma unica por las secuencias que se generan, basandose en la presente descripcion y en vista de secuencias genicas de receptor de sistema inmunitario adaptativo conocidas que aparecen en bases de datos publicamente disponibles. Vease, por ejemplo, los documentos U.S.A.N. 13/217,126 (US 2012 058902); U.S.A.N. 12/794,507 (US 2010330571); PCT/US2011/026373 (WO 2011106738); PCT/US2011/049012 (WO 2012027503). Se exponen cebadores de secuenciacion de la region J de TCRB de ejemplo en la tabla 3:
5
10
15
20
25
30
35
Tabla 3: Cebadores de secuenciacion de TCRBJ
Cebador
Secuencia SEQ ID NO:
>Jseq1-1
ACAACTGTGAGTCTGGTGCCTTGTCCAAAGAAA 1696
>Jseq1-2
ACAACGGTTAACCTGGTCCCCGAACCGAAGGTG 1697
>Jseq1-3
ACAACAGTGAGCCAACTTCCCTCTCCAAAATAT 1698
>Jseq1-4
AAGACAGAGAGCTGGGTTCCACTGCCAAAAAAC 1699
>Jseq1-5
AGGATGGAGAGTCGAGTCCCATCACCAAAATGC 1700
>Jseq1-6
GTCACAGTGAGCCTGGTCCCGTTCCCAAAGTGG 1701
>Jseq2-1
AGCACGGTGAGCCGTGTCCCTGGCCCGAAGAAC 1702
>Jseq2-2
AGTACGGTCAGCCTAGAGCCTTCTCCAAAAAAC 1703
>Jseq2-3
AGCACTGTCAGCCGGGTGCCTGGGCCAAAATAC 1704
>Jseq2-4
AGCACTGAGAGCCGGGTCCCGGCGCCGAAGTAC 1705
>Jseq2-5
AGCACCAGGAGCCGCGTGCCTGGCCCGAAGTAC 1706
>Jseq2-6
"AGCACGGTCAGCCTGCTGCCGGCCCCGAAAGTC 1707
>Jseq2-7
GTGACCGTGAGCCTGGTGCCCGGCCCGAAGTAC 1708
El termino "gen" significa el segmento de ADN implicado en la produccion de una cadena de polipeptido tal como todo o una parte de un polipeptido de TCR o Ig (p. ej., un polipeptido que contiene CDR3); Incluye regiones que preceden y siguen a la region codificante "lfder y remolque", asf como secuencias intermedias (intrones) entre los segmentos codificantes individuales (exones), y tambien pueden incluir elementos reguladores (p. ej., promotores, potenciadores, represores del sitio de union y similares) y tambien pueden incluir secuencias de senal de recombinacion (RSS) como se describe en la presente memoria.
Los acidos nucleicos de las presentes realizaciones, denominados tambien en la presente memoria polinucleotidos, pueden estar en forma de ARN o en forma de ADN, cuyo ADN incluye ADNc, ADN genomico y ADN sintetico. El ADN puede ser bicatenario o monocatenario, y si es monocatenario puede ser la cadena codificante o no codificante (de sentido contrario). Una secuencia codificante que codifica un TCR o una inmunoglobulina o una region de los mismos (p. ej., una region V, un segmento D, una region J, una region C, etc.) para usar segun las presentes realizaciones, puede ser identica a la secuencia codificante conocida en la tecnica para cualquier region genica o dominio de polipeptido de TCR o inmunoglobulina dado (p. ej., dominios de region V, dominios de CDR3, etc.), o puede ser una secuencia codificante diferente, que como resultado de la redundancia o degeneracion del codigo genetico, codifica la misma region o polipeptido de TCR o inmunoglobulina.
En algunas realizaciones, los segmentos genicos que codifican la region J amplificada, pueden tener cada uno un marcador identificador de secuencia definida de 2, 3, 4, 5, 6, 7, 8, 9, 10 o aproximadamente 15, 20 o mas nucleotidos, situado en una posicion definida respecto al sitio de la RSS. Por ejemplo, se puede usar un marcador de 4 bases, en el segmento que codifica la region Jp de las regiones que codifican la CDR3 del TCRp CDR3, en las posiciones +11 a +14 en la direccion 3' desde el sitio de RSS. Sin embargo, no es necesario que estas y otras realizaciones relacionadas esten asf limitadas y tambien estan contemplados otros marcadores identificadores de secuencia de nucleotidos definida relativamente corta que se pueden detectar en los segmentos genicos que codifican la region J y definidos basandose en sus posiciones relativas respecto a un sitio de RSS. Estas pueden variar entre diferentes locus que codifican receptores del sistema inmunitario adaptativo.
La secuencia de senal de recombinacion (RSS) consiste en dos secuencias conservadas (heptamero, 5-CACAGTG- 3', y nonamero, 5-ACAAAAACC-3'), separadas por un espaciador de 12 +/- 1 pb ("senal 12") o 23 +/- 1 pb ("senal 23"). Se ha identificado una serie de posiciones de nucleotidos como importantes para la recombinacion que incluyen el dinucleotido CA en la posicion 1 y 2 del heptamero, y una C en la posicion 3 del heptamero se ha mostrado que tambien es muy preferida, asf como un nucleotido A en las posiciones 5, 6, 7 del nonamero.(Ramsden et. al 1994; Akamatsu et. al. 1994; Hesse et. al. 1989). Las mutaciones de otros nucleotidos tienen efectos mmimos o inconsecuentes. El espaciador, aunque mas variable, tambien tiene un impacto en la recombinacion, y se ha mostrado que sustituciones de un solo nucleotido tienen un impacto significativo en la eficacia de la recombinacion (Fanning et. al. 1996, Larijani et. al 1999; Nadel et. al. 1998). Se han descrito criterios para identificar secuencias de polinucleotidos de RSS que tienen eficacias de recombinacion significativamente diferentes (Ramsden et. al 1994;
5
10
15
20
25
30
35
40
45
50
55
Akamatsu et. al. 1994; Hesse et. al. 1989 y Cowell et. al. 1994). Por consiguiente, los oligonucleotidos de secuenciacion pueden hibridar adyacentes a un marcador de cuatro bases dentro de los segmentos genicos que codifican J amplificados en las posiciones +11 a +14 en la direccion 3' del sitio de RSS. Por ejemplo, los oligonucleotidos de secuenciacion para TCRB, se pueden disenar para reasociarse con un motivo de nucleotidos consenso observado justo en la direccion 3' de este "marcador", de modo que las primeras cuatro bases de una lectura de secuencia identificaran unicamente el segmento genico que codifica J (vease, p. ej., el documento WO/2012/027503).
La longitud media de la region que codifica la CDR3, para el TCR, definida como los nucleotidos que codifican el polipeptido de TCR entre la segunda cistema conservada del segmento V y la fenilalanina conservada del segmento J, es 35+/-3 nucleotidos. Por consiguiente, y en algunas realizaciones, la amplificacion por PCR usando cebadores oligonucleotidos del segmento V con cebadores oligonucleotidos del segmento J que empiezan desde el marcador del segmento J de una region J particular de TCR o IgH (p. ej., Jp de TCR, Jy de tCr o jH de IgH como se describe en la presente memoria) casi siempre capturara la union V-D-J completa en una lectura de 50 pares de bases. La longitud media de la region CDR3 de IgH, definida como los nucleotidos entre la cistema conservada en el segmento V y la fenilalanina conservada en el segmento J, esta menos restringida que en el locus de TCRp, pero tfpicamente sera de entre aproximadamente 10 y aproximadamente 70 nucleotidos. Por consiguiente, y en algunas realizaciones, la amplificacion por PCR usando cebadores oligonucleotidos del segmento V con cebadores oligonucleotidos del segmento J que empieza a partir del marcador del segmento J de IgH capturara la union V-D-J completa en una lectura de 100 pares de bases.
Los cebadores de PCR que se reasocian y apoyan la extension de polinucleotidos en secuencias molde mal apareadas se denominan cebadores promiscuos. En algunas realizaciones, los cebadores de PCR inversos del segmento J de TCR e Ig se pueden disenar para minimizar el solapamiento con oligonucleotidos de secuenciacion, con el fin de minimizar el cebado promiscuo en el contexto de la PCR multiplexada. En una realizacion, los cebadores inversos del segmento J de TCR e Ig, se pueden anclar en el extremo 3' por reasociacion con el motivo del sitio de corte y empalme consenso, con solapamiento mmimo de los cebadores de secuenciacion. En general, los cebadores del segmento V y J de TCR e Ig se pueden seleccionar para trabajar en la PCR con temperaturas de reasociacion consistentes usando programas de diseno y analisis de secuencia/cebador conocidos con los parametros por defecto.
Para la reaccion de secuenciacion los cebadores de secuenciacion IGHJ de ejemplo extienden tres nucleotidos a traves de las secuencias CAG conservadas, como se describe en el documento WO/2012/027503.
Muestras
El sujeto o fuente biologica de la cual se puede obtener una muestra biologica de ensayo, puede ser un ser humano o animal no humano, o un organismo transgenico o clonado o con tejido modificado geneticamente (incluyendo mediante el uso de citoblastos). En algunas realizaciones preferidas de la invencion, se puede saber que el sujeto o fuente biologica tiene, o se puede sospechar que tiene o estar en riesgo de tener, un tumor solido o en la circulacion u otra afeccion maligna, o una enfermedad autoinmunitaria, o una afeccion inflamatoria y en algunas realizaciones preferidas de la invencion, se puede saber que el sujeto o fuente biologica carece de un riesgo o presencia de dicha enfermedad.
Algunas realizaciones preferidas contemplan un sujeto o fuente biologica que es un sujeto humano tal como un paciente al que se le ha diagnosticado que tiene o tiene riesgo de desarrollar o adquirir cancer de acuerdo con criterios de diagnostico clmico aceptados en la tecnica, tales como los del Instituto Nacional del Cancer de EE.UU. (Bethesda, MD, EE.UU.) o como se describe en De Vita, Hellman, y Rosenberg's Cancer: Principles and Practise of Oncology (2008, Lippincott, Williams and Wilkins, Philadelphia/ Ovid, New York); Pizzo y Poplack, Principles and Practice of Pediatric Oncology (Fourth edition, 2001, Lippincott, Williams and Wilkins, Philadelphia/ Ovid, New York); y Vogelstein y Kinzler, The Genetic Basis of Human Cancer (Segunda edicion, 2002, McGraw Hill Professional, New York); algunas realizaciones contemplan un sujeto humano que se sabe que no tiene riesgo de tener, desarrollar o adquirir cancer por dichos criterios.
Algunas otras realizaciones contemplan un sujeto no humano o fuente biologica, por ejemplo, un primate no humano tal como un macaco, chimpance, gorila, mono vervet, orangutan, babuino y otros primates no humanos, incluyendo dichos sujetos no humanos que pueden ser conocidos en la tecnica como modelos preclmicos, incluyendo modelos preclmicos para tumores solidos y/u otros canceres. Algunas otras realizaciones contemplan un sujeto no humano que es un marnffero, por ejemplo, un raton, rata, conejo, cerdo, oveja, caballo, bovino, cabra, jerbo, hamster, cobaya u otro mamffero; muchos de dichos marnfferos pueden ser sujetos que se conocen en la tecnica como modelos preclmicos para algunas enfermedades o trastornos, incluyendo tumores en la circulacion o solidos, y/u otros canceres (p. ej., Talmadge et al., 2007 Am. J. Pathol. 170:793; Kerbel, 2003 Canc. Biol. Therap. 2(4 Suppl 1):S134; Man et al., 2007 Canc. Met. Rev. 26:737; Cespedes et al., 2006 Clin. Transl. Oncol. 8:318). Sin embargo, no se pretende que la varidad de realizaciones este asf limitada, de modo que se contemplan tambien otras realizaciones en las que la fuente del sujeto o biologica puede ser un vertebrado no mairnfero, por ejemplo, otro vertebrado superior, o una especie de ave, anfibio o reptil, u otro sujeto o fuente biologica.
5
10
15
20
25
30
35
40
45
50
55
60
Se pueden proporcionar muestras biologicas obteniendo una muestra de sangre, muestra de biopsia, explante de tejido, cultivo de organo, fluido biologico o cualquier otra preparacion tisular o celular de un sujeto o una fuente biologica. Preferiblemente, la muestra comprende ADN de celulas linfoides del sujeto o fuente biologica que, a modo de ilustracion y no limitacion, puede contener ADN reordenado en uno o mas locus de TCR o BCR. En algunas realizaciones, se puede obtener una muestra biologica de ensayo de un tejido solido (p. ej., un tumor solido), por ejemplo por reseccion quirurgica, biopsia con aguja u otros medios para obtener una muestra biologica de ensayo que contiene una mezcla de celulas.
De acuerdo con algunas realizaciones, puede ser conveniente aislar celulas linfoides (p. ej., linfocitos T y/o linfocitos B) de acuerdo con cualquiera de una gran serie de metodologfas establecidas, donde las celulas linfoides aisladas son las que se han retirado o separado del tejido, entorno o medio en el que se encuentran de forma natural. Asf se pueden obtener linfocitos T y linfocitos B de una muestra biologica, tal como de una variedad de muestras de tejidos y fluidos biologicos que incluyen medula osea, timo, glandulas linfaticas, ganglios linfaticos, tejidos y sangre perifericos, pero la sangre periferica es la que se consigue mas facilmente. Se puede tomar muestra de cualquier tejido periferico para el ensayo de la presencia de linfocitos B y T, y por lo tanto, esta contemplado para usar en los metodos descritos en la presente memoria. Los tejidos y fluidos biologicos de los que se pueden obtener celulas del sistema inmunitario adaptativo incluyen, pero no se limitan a la piel, tejido epitelial, colon, bazo, una secrecion mucosa, mucosa oral, mucosa intestinal, mucosa vaginal o una secrecion vaginal, tejido del cuello uterino, ganglios, saliva, lfquido cefalorraqrndeo (LCR), medula osea, sangre del cordon umbilical, suero, fluido seroso, plasma, linfa, orina, lfquido ascftico, lfquido pleural, lfquido pericardico, lfquido peritoneal, lfquido abdominal, medio de cultivo, medio de cultivo acondicionado o lfquido de lavado. En algunas realizaciones, las celulas del sistema inmunitario adaptativo se pueden aislar de una muestra de aferesis. Las muestras de sangre periferica se pueden obtener por flebotoirna de sujetos. Las celulas mononucleares de sangre periferica (CMSP) se afslan por tecnicas conocidas para los expertos en la tecnica, p. ej., separacion por gradiente de densidad con Ficoll-Hypaque®. En algunas realizaciones, se usan CMSP enteras para el analisis.
Para la extraccion de acido nucleico, se puede extraer el ADN genomico de celulas usando metodos conocidos en la tecnica y/o kits disponibles en el comercio, p. ej., usando el kit QIAamp® DNA blood Mini Kit (QIAGEN®). La masa aproximada de un genoma haploide es 3 pg. Preferiblemente, se usan al menos de 100.000 a 200.000 celulas para el analisis, es decir, de aproximadamente 0,6 a 1,2 pg de ADN de linfocitos T o B diploides. Usando CMSP como fuente, el numero de linfocitos T se puede calcular que es aproximadamente 30% de las celulas totales. El numero de linfocitos B tambien se puede calcular que es aproximadamente 30% de las celulas totales en una preparacion de CMSP.
Los locus de los genes de Ig y TCR contienen muchos segmentos genicos variable (V), de diversidad (D), y de union (J) diferentes, que se someten a procesos de reordenacion durante la diferenciacion linfoide inicial. Las secuencias de los segmentos genicos V, D y J de Ig y TCR se conocen en la tecnica y estan disponibles en bases de datos publicas tales como GENBANK. Las reordenaciones de V-D-J son mediadas por un complejo de enzima recombinasa en el que las protemas RAG1 y RAG2 tienen una funcion clave reconociendo y cortando el ADN en las secuencias de senales de recombinacion (RSS), que estan situadas 3' de los segmentos genicos V, a ambos lados de los segmentos genicos D y en la direccion 5' de los segmentos genicos J. Las RSS inadecuadas reducen o incluso evitan completamente la reordenacion. La secuencia de senal de recombinacion (RSS) incluye dos secuencias consenso (heptamero, 5'-CACAGTG-3', y nonamero, 5'-ACAAAAACC-3'), separadas por un espaciador de 12 +/-1 pb ("senal 12") o 23 +/-1 pb ("senal 23"). En el extremo 3' del segmento V y el segmento D, la secuencia de RSS es heptamero (CACAGTG)-espaciador-nonamero (ACAAAAACC). En el extremo 5' del segmento J y el segmento D, la secuencia de RSS es nonamero (GGTTTTTGT)-espaciador-heptamero (CACTGTG), con variacion de secuencia sustancial en la secuencia de heptamero y nonamero de cada segmento genico espedfico.
Se ha identificado una serie de posiciones de nucleotidos como importantes para la recombinacion que incluyen el dinucleotido CA en la posicion 1 y 2 del heptamero, y una C en la posicion 3 del heptamero se ha mostrado que tambien es muy preferida, asf como un nucleotido A en las posiciones 5, 6, 7 del nonamero. (Ramsden et. al 1994 Nucl. Ac. Res. 22:1785; Akamatsu et. al. 1994 J. Immunol. 153:4520; Hesse et. al. 1989 Genes Dev. 3:1053). Las mutaciones de otros nucleotidos tienen efectos mmimos o inconsecuentes. El espaciador, aunque mas variable, tambien tiene un impacto en la recombinacion, y se ha mostrado que las sustituciones de un solo nucleotido tienen un impacto significativo en la eficacia de la recombinacion (Fanning et. al. 1996 Cell. Immunol. Immumnopath. 79:1, Larijani et. al 1999 Nucl. Ac. Res. 27:2304; Nadel et. al. 1998 J. Immunol. 161:6068; Nadel et al., 1998, J. Exp. Med. 187:1495). Se han descrito criterios para identificar las secuencias de polinucleotidos RSS que tienen eficacias de recombinacion significativamente diferentes (Ramsden et. al 1994 Nucl. Ac. Res. 22:1785; Akamatsu et. al. 1994, J. Immunol. 153:4520; Hesse et. al. 1989 Genes Dev. 3:1053, y Lee et al., 2003 PLoS 1(1):E1).
El procedimiento de reordenacion en los genes de la cadena pesada (IgH), TCR beta (TCRB), y TCR delta (TCRD) en general empiezan con una reordenacion de D a J seguido de una reordenacion de V a D-J, mientras que las reordenaciones directas de V a J ocurren en los genes de Ig kappa (IgK), Ig lambda (IgL), TCR alfa (TCRA), y TCR gamma (TCRG). Las secuencias entre los segmentos de genes de reordenacion en general se eliminan en forma de un producto de escision circular, llamado tambien drculo de escision de TCR (TREC) o drculo de escision del receptor de linfocitos B (BREC).
5
10
15
20
25
30
35
40
45
50
55
60
Las muchas combinaciones diferentes de segmentos genicos de V, D y J representan el llamado repertorio combinatorio, que se calcula que es ~2x106 para moleculas de Ig, ~3x106 para moleculas de TCRap y ~ 5x103 para TCRy§. En los sitios de union de los segmentos genicos V, D y J, se produce la eliminacion y la insercion aleatoria de nucleotidos durante el procedimiento de reordenacion, dando como resultado regiones de union muy diversas que contribuyen significativamente al repertorio total de moleculas de Ig y TCR, que se calcula que es > 1012 posibles secuencias de aminoacidos.
Los linfocitos B maduros extienden mas su repertorio de Ig tras el reconocimiento del antfgeno en centros germinales por hipermutacion somatica, un proceso que conduce a la maduracion de la afinidad de las moleculas de Ig. El proceso de hipermutacion somatica se centra en el exon V- (D-) J de genes de la cadena ligera de IgH e Ig, y genera principalmente mutaciones de nucleotidos individuales, pero a veces tambien inserciones o eliminaciones de nucleotidos. Los genes de Ig mutados somaticamente tambien se encuentran tfpicamente en tumores malignos de linfocitos B maduros.
En algunas realizaciones descritas en la presente memoria, los cebadores del segmento V y el segmento J se pueden usar en una reaccion de PCR para amplificar regiones de ADN que codifican CDR3 de TCR o BCR en una muestra biologica, en donde cada segmento genico que codifica TCR o Ig funcionales, comprende una secuencia de senal de recombinacion RSS del gen V y cada TCR o segmento genico que codifica J comprende una RSS del gen J. En estas realizaciones y relacionadas, cada molecula de ADN reordenada amplificada puede comprender (i) al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 60o, 700, 800, 900, l0o0 (incluyendo todos los valores enteros entre ellos) o mas nucleotidos contiguos de una cadena codificante del segmento genico que codifica V de TCR o Ig, con los al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o mas nucleotidos contiguos que estan situados 5' de la RSS del gen V y/o cada molecula de ADN amplificada puede comprender (ii) al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500 (incluyendo todos los valores enteros entre ellos) o mas nucleotidos contiguos de una cadena codificante del segmento genico que codifica J de TCR o Ig, con los al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500 o mas nucleotidos contiguos que estan situados 3' de la RSS del gen G.
Determinacion del factor de amplificacion
Ademas del uso de las composiciones de moldes presentes descritas para la normalizacion de la eficacia de la amplificacion de conjuntos de cebadores oligonucleotidos de amplificacion como se describe en la presente memoria, algunas otras realizaciones contemplan el uso de la composicion de moldes para determinar factores de amplificacion para calcular el numero de secuencias que codifican receptores del sistema inmunitario adaptativo reordenadas en una muestra. Estas realizaciones y relacionadas pueden ser utiles para cuantificar el numero de secuencias que codifican receptores del sistema inmunitario adaptativo en una muestra de ADN que se ha obtenido de celulas linfoides, incluyendo celulas linfoides que estan presentes en una mezcla de celulas que comprende celulas en las que el ADN que codifica un receptor del sistema inmunitario adaptativo ha sufrido reordenacion del ADN, pero donde la muestra tambien contiene ADN de celulas en las que no se ha producido dicha reordenacion (p. ej., celulas no linfoides, celulas inmaduras, celulas mesenquemicas, celulas cancerosas, etc.).
El numero total de diferentes miembros de una clase de receptores del sistema inmunitario adaptativos (p. ej., TCR o IG) en un sujeto se puede calcular por la PCR multiplexada usando un conjunto de cebadores de amplificacion de V- J seguido de la secuenciacion cuantitativa de productos de amplificacion. La amplificacion multiplexada y la secuenciacion de alto rendimiento de secuencias de ADN reordenadas que codifican tCr y BCR (IG), se describen, por ejemplo en Robins et al., 2009 Blood 114, 4099; Robins et al., 2010 Sci. Translat. Med. 2:47ra64; Robins et al., 2011 J. Immunol. Meth. doi:10.1016/j.jim.2011.09. 001; Sherwood et al. 2011 Sci. Translat. Med. 3:90ra61; U.S.A.N. 13/217,126 (publicacion US n° 2012/0058902), U.S.A.N. 12/794,507 (publicacion US n° 2010/0330571), WO/2010/151416, WO/2011/106738(PCT/US2011/026373), WO2012/027503 (PCT/US2011/049012), U.S.A.N. 61/550.311 (US 2013288237), y U.S.A.N. 61/569.118 (US 2013253842).
Esta metodologfa tfpicamente implica la toma de muestra de ADN de una subpoblacion de celulas linfoides, tales como celulas linfoides que estan presentes en una muestra de sangre, que se sabe que contiene tambien celulas nucleadas que carecen de ADN reordenado que codifica TCR o IG. Las presentes composiciones y metodos pueden permitir mejorar la exactitud y precision en la determinacion del numero de moleculas de ADN reordenado que codifican tCr y IG. Como se describe en la presente memoria, por ejemplo, enriqueciendo la muestra de ADN con la presente composicion de moldes, se proporciona una referencia de molde de amplificacion interno para evaluar la eficacia relativa a lo largo de la variedad de cebadores oligonucleotidos que estan presentes en el conjunto de cebadores de amplificacion multiplexada. Evaluando de esta forma los productos de amplificacion de la presente composicion de moldes artificiales, que se anade a la reaccion de amplificacion en cantidades conocidas, se puede determinar un factor de amplificacion (p. ej., un factor multiplicativo, normalizante, de aumento de escala o geometrico, etc.) para el conjunto de cebadores oligonucleotidos de amplificacion y despues se puede usar para calcular el numero de moldes de ADN naturales en la muestra.
Como otro ejemplo, estas realizaciones y relacionadas permiten la cuantificacion de la enfermedad residual minima (EMR) en linfoma o leucemia, por deteccion cuantitativa del ADN que codifica TCR o IG reordenado en muestras
5
10
15
20
25
30
35
40
45
50
55
obtenidas a partir de preparaciones mixtas de celulas linfoides y no linfoides, incluyendo celulas de linfoma persistentes o leucemia. Metodos previos determinan la EMR como el numero de celulas malignas que son detectables como una proporcion del numero total de celulas en una muestra. En cambio, los presentes metodos permiten calcular el numero total de celulas en una muestra que tienen ADN que codifica TCR o IG reordenado, de modo que las celulas malignas (p. ej., las que tiene una reordenacion de TCR o IG particular, tales como un clonotipo) se pueden cuantificar como una proporcion de dichas celulas reordenadas en lugar de como una proporcion de todas las celulas. A modo de teona no limitante, se cree que debido a que la representacion de todas las celulas reordenadas en una muestra clmica de un sujeto que tiene o se sospecha que tiene EMR tfpicamente es muy baja, los presentes metodos mejoraran notablemente la sensibilidad con la que se detecta la EMR, incluyendo la mejora de dicha sensibilidad aumentando la relacion de senal a ruido.
Por consiguiente, algunas realizaciones proporcionan asf un metodo para cuantificar moleculas de ADN reordenadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo en una muestra biologica que comprende ADN de celulas linfoides de un sujeto, comprendiendo cada receptor del sistema inmunitario adaptativo una region variable y una region de union. Brevemente, el metodo comprende las etapas de:
(A) en una reaccion de amplificacion multiplexada usando el conjunto de cebadores oligonucleotidos de amplificacion descritos en la presente memoria que es capaz de amplificar sustancialmente todas las combinaciones que codifican V-J para un receptor del sistema inmunitario adaptativo dado, amplificar el ADN de la muestra a la que se ha anadido una cantidad conocida de la composicion de moldes descrita en la presente memoria para la normalizacion de la amplificacion, para obtener productos de amplificacion;
(B) secuenciar cuantitativamente los productos de amplificacion de (A) para cuantificar (i) productos de amplificacion de moldes, que son productos de amplificacion de la composicion de moldes descrita en la presente memoria y seran identificables porque contienen al menos una secuencia de oligonucleotido de codigo de barras, y (ii) productos de amplificacion de secuencias de ADN reordenada que codifican receptores del sistema inmunitario adaptativo en la muestra, que seran identificables porque comprenden secuencias de V y J espedficas pero carecen de una secuencia de oligonucleotido de codigo de barras;
(C) calcular un factor de amplificacion basado en la informacion cuantitativa obtenida en la etapa (B); y
(D) usando el factor de amplificacion de (C) determinar, mediante calculo, el numero de moleculas de ADN que codifican receptores del sistema inmunitario adaptativo unicas en la muestra.
Sin querer estar ligados por la teona, de acuerdo con estos metodos y relacionados, el numero de moleculas de ADN que codifican TCR o IG reordenadas en la muestra que se toma se mide en una reaccion de amplificacion multiplexada. Para hacer esto, se determina un valor de cobertura de la secuencia, p. ej., el numero de lecturas de secuencia de salida que se determina para cada molecula de entrada (molde), y se promedia a lo largo de todo el numero de oligonucleotidos molde diferentes que estan presentes, para obtener un valor medio de cobertura de la secuencia. Dividiendo (i) el numero de lecturas que se obtienen para una secuencia dada entre (ii) el valor medio de cobertura de secuencia, se puede calcular el numero de moleculas reordenadas que estan presentes como moldes al inicio de la reaccion de amplificacion.
Asf, por ejemplo, para calcular el valor de cobertura de secuencias, se anade una cantidad conocida de un conjunto de moleculas sinteticas de la composicion de moldes presente descrita a cada amplificacion de PCR, teniendo los moldes sinteticos la estructura basica de formula (I) 5' U-B1-V-B2-R-(B3)-J-B4-U 3' donde cada V es un segmento de 300 pares de bases que tiene una secuencia que coincide con una secuencia genica de V de TCR o IG y J es un segmento de 100 pares de bases que tiene una secuencia que coincide con un gen J de TCR o IG. B2 una secuencia de oligonucleotido de codigo de barras que identifica de forma unica cada pareja VJ y que tambien diferencia los productos de amplificacion o moldes de ADN sinteticos (que contendran las secuencias de codigo de barras) de los productos de amplificacion de las moleculas de ADN moldes biologicos que se encuentran de forma natural que aporta la muestra de ADN linfoide (que careceran de la secuencia de codigo de barras). En este ejemplo, B3 de la formula (I) no es nada. Despues de la amplificacion por PCR y secuenciacion, se cuenta el numero de cada molecula sintetica secuenciada (es decir, productos de amplificacion que contienen la secuencia de codigo de barras). La cobertura de secuencias de las moleculas sinteticas despues se calcula basandose en el numero conocido de moleculas molde sinteticas usadas para enriquecer la reaccion de amplificacion.
Por ejemplo, se puede anadir a la reaccion de amplificacion un grupo de 5000 moleculas molde que contienen codigo de barras, sinteticas, que comprenden 4-5 copias cada una de 1100 secuencias de oligonucleotidos molde unicas sinteticas (que representan cada posible pareja VJ).Si los productos de amplificacion incluyen 50.000 secuencias que coinciden con las moleculas molde sinteticas, se ha obtenido un valor de cobertura de secuencias de 10X y el factor de amplificacion es 10. Para calcular el numero de moleculas molde reordenadas de VDJ naturales en el ADN obtenido de la muestra, despues el numero de productos de amplificacion de los moldes naturales (es decir, productos de amplificacion que carecen de cualquier secuencia de codigo de barras) se divide entre el factor de amplificacion. Para anadir precision, debido a que en este ejemplo las 5000 moleculas sinteticas son una mezcla compleja de 1100 moleculas que representan cada pareja de VJ, el factor de amplificacion para cada pareja VJ se puede calcular individualmente, Despues, el factor de amplificacion se puede promediar a lo largo
5
10
15
20
25
30
35
40
45
50
55
60
de todas las moleculas sinteticas (Fig. 8). La precision y fiabilidad del metodo se muestra en la figura 9, y se describen detalles mas adelante en el ejemplo 5.
En una realizacion alternativa, identica a la que se ha descrito antes y se describe mas adelante en esta seccion, excepto que difiere en el uso de un subconjunto de la mezcla total de moleculas molde sinteticas, de modo que de como resultado la adicion a una muestra de no mas de 1 copia de un subconjunto de moleculas molde distintas a la muestra. La aplicacion de los metodos estadfsticos de Poisson bien conocidos para el experto en la tecnica, se usan para determinar la cantidad de molde a anadir basandose en las propiedades conocidas de la mezcla (p. ej., el numero total de secuencias distintas y la concentracion de moleculas molde). Por ejemplo, se anaden 200-500 moleculas molde a la reaccion de amplificacion, de modo que como media hay como maximo una copia de cada uno de un subconjunto de moleculas molde presentes en la mezcla.
Por consiguiente, en estas realizaciones el metodo comprende: (A) amplificar el ADN en una reaccion en cadena de la polimerasa (PCR) multiplexada que comprende: (1) ADN de la muestra biologica que comprende celulas linfoides del sujeto, (2) la composicion de moldes de la reivindicacion 1 en la que esta presente un numero conocido de cada uno de una pluralidad de oligonucleotidos molde que tienen una secuencia de oligonucleotidos unica, (3) un conjunto de cebadores oligonucleotidos de amplificacion que es capaz de amplificar ADN reordenado que codifica uno o una pluralidad de receptores del sistema inmunitario adaptativo en el ADN de la muestra biologica, comprendiendo el conjunto de cebadores: (a) en cantidades sustancialmente equimolares, una pluralidad de cebadores oligonucleotidos del segmento V que cada uno es capaz independientemente de hibridar espedficamente con al menos un polinucleotido que codifica un polipeptido de la region V de receptor del sistema inmunitario adaptativo o con el complementario del mismo, en donde cada cebador del segmento V comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region V del receptor del sistema inmunitario adaptativo funcional, y en donde la pluralidad de cebadores del segmento V hibridan espedficamente sustancialmente con todos los segmentos genicos que codifican la region V del receptor del sistema inmunitario adaptativo funcional que estan presentes en la composicion de moldes, y (b) en cantidades sustancialmente equimolares, una pluralidad de cebadores oligonucleotidos del segmento J que cada uno es capaz independientemente de hibridar espedficamente con al menos un polinucleotido que codifica un polipeptido de la region J del receptor del sistema inmunitario adaptativo o con el complementario del mismo, en donde cada cebador del segmento J comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria con al menos un segmento genico que codifica la region J del receptor del sistema inmunitario adaptativo funcional y en donde la pluralidad de cebadores del segmento J hibrida espedficamente con sustancialmente todos los segmentos genicos que codifican la region J del receptor del sistema inmunitario adaptativo funcional que estan presentes en la composicion de moldes, en donde los cebadores oligonucleotidos del segmento V y el segmento J son capaces de promocionar la amplificacion en dicha reaccion en cadena de la polimerasa (PCR) multiplexada de (i) sustancialmente todos los oligonucleotidos molde en la composicion de moldes para producir una multiplicidad de moleculas de ADN molde amplificadas, siendo suficiente dicha multiplicidad de moleculas de ADN molde amplificadas para cuantificar la diversidad de oligonucleotidos molde en la composicion de moldes, y (ii) sustancialmente todas las moleculas de ADN reordenadas que codifican receptores del sistema inmunitario adaptativo en la muestra biologica para producir una multiplicidad de moleculas de ADN reordenadas amplificadas, siendo suficiente dicha multiplicidad de moleculas de ADN amplificadas para cuantificar la diversidad de moleculas de ADN reordenadas de la muestra biologica, y en donde dicha molecula de ADN amplificada en la multiplicidad de moleculas de ADN molde amplificadas y en la multiplicidad de moleculas de ADN reordenadas amplificadas es menor de 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 90, 80 o 70 nucleotidos de longitud;
(B) secuenciar cuantitativamente todas o una parte suficiente de cada una de dichas moleculas de ADN molde amplificadas y cada una de dichas moleculas de ADN reordenadas amplificadas para cuantificar (ii) un numero de productos molde de moleculas de ADN molde amplificadas que contienen al menos una secuencia de oligonucleotido de codigo de barras, y (i) un numero de productos reordenados de moleculas de ADN reordenadas amplificadas que carecen de una secuencia de oligonucleotido de codigo de barras;
(C) calcular un factor de amplificacion dividiendo el numero de productos molde de (B)(i) entre el numero conocido de cada uno de la pluralidad de oligonucleotidos molde que tienen una secuencia de oligonucleotido unica de (A)(2); y
(D) dividir el numero de productos reordenados de (B)(ii) entre el factor de amplificacion calculado en (C) para cuantificar moleculas de ADN que codifican el receptor del sistema inmunitario adaptativo unicas en la muestra.
No se pretende que las realizaciones contempladas esten limitadas al metodo descrito antes, de modo que a partir de la presente descripcion el experto en la tecnica apreciara variaciones que se pueden usar. Un metodo alternativo, por ejemplo, puede no usar la composicion de moldes sinteticos descrita en la presente memoria como un molde de control anadido en la amplificacion de PCR multiplexada de una muestra de ADN que contiene ADN reordenado que codifica TCR y/o IG asf como ADN no reordenado de celulas linfoides. En cambio, de acuerdo con una de dichas alternativas, a la reaccion de amplificacion que usa cebadores de amplificacion de V y J se le puede anadir un conjunto conocido de cebadores oligonucleotidos de amplificacion que amplifican una region de secuencia genomica altamente conservada, distinta. Estos cebadores de control genomico pueden amplificar cada genoma que esta presente en la muestra de ADN independientemente de si contiene o no secuencias reordenadas que codifican TCR
5
10
15
20
25
30
35
40
45
50
55
60
y/o IG, mientras que los cebadores de V y J solo pueden amplificar productos de genomas con una region VDJ reordenada. La relacion entre estas dos clases de moleculas de productos de amplificacion permite la estimacion del numero total de genomas de linfocitos B en la muestra.
La practica de algunas realizaciones de la presente invencion usara, salvo que se indique espedficamente lo contrario, metodos convencionales en microbiolog^a, biologfa molecular, bioqmmica, genetica molecular, biologfa celular, virolog^a y tecnicas de inmunologfa que conoce el experto en la tecnica, a varias de las cuales se hace referencia mas adelante con el proposito de ilustrar. Dichas tecnicas se explican de forma completa en la bibliograffa. Vease, p. ej., Sambrook, et al., Molecular Cloning: A Laboratory Manual (3a Edicion, 2001); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2a Edicion, 1989); Maniatis et al., Molecular Cloning: A Laboratory Manual (1982); Ausubel et al., Current Protocols in Molecular Biology (John Wiley and Sons, actualizado en julio de j2008); Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience; Glover, DNA Cloning: A Practical Approach, vol. I y II (IRL Press, Oxford Univ. Press USA, 1985); Current Protocols in Immunology (Editado por: John E. Coligan, Ada M. Kruisbeek, David H. Margulies, Ethan M. Shevach, Warren Strober 2001 John Wiley & Sons, NY, NY); Real-Time PCR: Current Technology and Applications, Editado por Julie Logan, Kirstin Edwards y Nick Saunders, 2009, Caister Academic Press, Norfolk, UK; Anand, Techniques for the Analysis of Complex Genomes, (Academic Press, New York, 1992); Guthrie y Fink, Guide to Yeast Genetics and Molecular Biology (Academic Press, New York, 1991); Oligonucleotide Synthesis (N. Gait, Ed., 1984); Nucleic Acid Hybridization (B. Hames & S. Higgins, Eds., 1985); Transcription and Translation (B. Hames & S. Higgins, Eds., 1984); Animal Cell Culture (R. Freshney, Ed., 1986); Perbal, A Practical Guide to Molecular Cloning (1984); Next-Generation Genome Sequencing (Janitz, 2008 Wiley-VcH); PCR Protocols (Methods in Molecular Biology) (Park, Ed., 3a Edicion, 2010 Humana Press); Immobilized Cells And Enzyme (IRL Press, 1986); el tratado, Methods In Enzymology (Academic Press, Inc., N.Y.); Gene Transfer Vectors For Mammalian Cells (J. H. Miller and M. P. Calos eds., 1987, Cold Spring Harbor Laboratory); Harlow y Lane, Antibodies, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1998); Immunochemical Methods In Cell And Molecular Biology (Mayer and Walker, eds., Academic Press, London, 1987); Handbook Of Experimental Immunology, Volumenes I-IV (D. M. Weir and CC Blackwell, eds., 1986); Riott, Essential Immunology, 6a Edicion, (Blackwell Scientific Publications, Oxford, 1988); Embryonic Stem Cells: Methods and Protocols (Methods in Molecular Biology) (Kurstad Turksen, Ed., 2002); Embryonic Stem Cell Protocols: Volumen I: Isolation and Characterization (Methods in Molecular Biology) (Kurstad Turksen, Ed., 2006); Embryonic Stem Cell Protocols: Volumen II: Differentiation Models (Methods in Molecular Biology) (Kurstad Turksen, Ed., 2006); Human Embryonic Stem Cell Protocols (Methods in Molecular Biology) (Kursad Turksen Ed., 2006); Mesenchymal Stem Cells: Methods and Protocols (Methods in Molecular Biology) (Darwin J. Prockop, Donald G. Phinney, y Bruce A. Bunnell Eds., 2008); Hematopoietic Stem Cell Protocols (Methods in Molecular Medicine) (Christopher A. Klug, y Craig T. Jordan Eds., 2001); Hematopoietic Stem Cell Protocols (Methods in Molecular Biology) (Kevin D. Bunting Ed., 2008) Neural Stem Cells: Methods and Protocols (Methods in Molecular Biology) (Leslie P. Weiner Ed., 2008).
Salvo que se proporcionen definiciones espedficas, la nomenclatura usada en relacion con y en los procedimientos y tecnicas de laboratorio de biologfa molecular, qmmica analftica, qmmica organica sintetica y qmmica medica y farmaceutica descritos en la presente memoria son los bien conocidos y usados habitualmente en la tecnica. Se pueden usar tecnicas estandar para la tecnologfa de recombinacion, biologfa molecular, microbiologfa, smtesis qmmica, analisis qmmico, preparacion farmaceutica, formulacion y suministro y tratamiento de pacientes.
Salvo que el contexto requiera otra cosa, a lo largo de la presente memoria descriptiva y reivindicaciones, la palabra "comprender" y variaciones de la mismas, tales como "comprende" y "que comprende" deben considerarse en un sentido abierto e inclusivo, es decir, como "que incluye, pero no limitado a". Por "que consiste en" se entiende que incluye, y tfpicamente limitado a, lo que siga en la frase de "que consiste en". Por "que consiste esencialmente en" se entiende que incluye cualquier elemento citado despues de la frase, y limitado a otros elementos que no interfieren con o contribuyen a la actividad o accion especificada en la descripcion para los elementos citados. Por lo tanto, la frase "que consiste esencialmente en" indica que los elementos citados son necesarios u obligatorios, pero que no se requieren otros elementos y que pueden o no estar presentes dependiendo de si afectan o no a la actividad o accion de los elementos citados.
En esta memoria descriptiva y reivindicaciones adjuntas, las formas singulares "un", "una" y "el", "la" incluyen las referencias plurales salvo que el contenido dicte claramente otra cosa. Como se usa en la presente memoria, en realizaciones particulares, el termino "aproximadamente" cuando precede un valor numerico indica el valor mas o menos un intervalo de 5%, 6%, 7%, 8% o 9%. En otras realizaciones, el termino "aproximadamente" cuando precede un valor numerico indica el valor mas o menos un intervalo de 10%, 11%, 12%, 13% o 14%. En otras realizaciones mas, el termino "aproximadamente" cuando precede un valor numerico indica el valor mas o menos un intervalo de 15%, 16%, 17%, 18%, 19% o 20%.
La referencia a lo largo de esta memoria descriptiva a "una realizacion" o "un aspecto" significa que una propiedad, estructura o caractenstica particular descrita en relacion con la realizacion esta incluida en al menos una realizacion de la presente invencion. Por lo tanto, la aparicion de la frase "en una realizacion" en diferentes sitios a lo largo de esta presente memoria descriptiva no se refieren necesariamente todas a la misma realizacion. Ademas, se pueden combinar propiedades, estructuras o caractensticas particulares de cualquier forma en una o mas realizaciones.
5
10
15
20
25
30
35
40
45
50
55
Ejemplos
Ejemplo 1: Diseno de oligonucleotidos molde para calibrar el control del sesgo de la amplificacion
En este y los siguientes ejemplos, se usaron materiales y metodologfas de biologfa y bioqmmica molecular estandar, que incluyen tecnicas descritas en Sambrook, et al., Molecular Cloning: A Laboratory Manual (3a edicion, 2001); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2a Edicion, 1989); Maniatis et al., Molecular Cloning: A Laboratory Manual (1982); Ausubel et at., Current Protocols in Molecular Biology (John Wiley and Sons, actualizado en julio de 2008); Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience; Glover, DNA Cloning: A Practical Approach, vol.
I y II (IRL Press, Oxford Univ. Press USA, 1985); Anand, Techniques for the Analysis of Complex Genomes, (Academic Press, New York, 1992); Oligonucleotide Synthesis (N. Gait, Ed., 1984); Nucleic Acid Hybridization (B. Hames & S. Higgins, Eds., 1985); Transcription and Translation (B. Hames & S. Higgins, Eds., 1984); Perbal, A Practical Guide to Molecular Cloning (1984); Next-Generation Genome Sequencing (Janitz, 2008 Wiley-VCH); PCR Protocols (Methods in Molecular Biology) (Park, Ed., 3a Edicion, 2010 Humana Press);
Un conjunto de oligonucleotidos molde de ADN bicatenario (ADCbc) se diseno como un patron de calibracion para usar como un molde de control que simulaba todas las posibles combinaciones de V/J en un locus del receptor del sistema inmunitario adaptativo (TCR o BCR). Para cada locus de TCR y BCR humano, se compilo una lista de las secuencias de segmentos genomicos V 5' de la RSS, y una lista de los segmentos genomicos J 3' de la RSS. Las secuencias de las cadenas codificantes del molde de ADNbc se presentan aqm para facilidad de interpretacion, de acuerdo con el convenio por el cual la orientacion de 5' a 3' se lee de izquierda a derecha.
Se muestra una representacion esquematica de la estructura general de los oligonucleotidos molde en la figura 1. Para usar en la validacion cruzada de cada identidad de oligonucleotido molde unica en multiples contextos, se incorporo un oligonucleotido de codigo de barras de 16 pb diferente (B) en cada molde que identifica de forma unica el polinucleotido del segmento V del molde con los primeros 8 pb del codigo de barras, y el segmento J con los segundos 8 pb del codigo de barras. Se incorporaron copias de este codigo de barras tres veces: (B3) entre el adaptador externo (U2) y la secuencia del segmento J (J) de modo que una lectura corta de un solo extremo con cebadores de Illumina o Ion convencionales puede poner de manifiesto la identidad de la combinacion unica de secuencias de V y J en cada oligonucleotido molde, (B2) entre los segmentos V y J de modo que una estrategia de secuenciacion convencional (p. ej., Illumina GA-2 o HiSeq™ or MiSEQ®) capturara la combinacion unica de las secuencias V y J en cada oligonucleotido molde, y (B3) entre el segmento V y el otro adaptador externo (U1), de modo que una lectura corta de extremo emparejado puede confirmar la identidad de la combinacion unica de secuencias V y J en cada oligonucleotido molde si asf se desea.
Como se muestra en la figura 1, las secuencias de oligonucleotidos molde empezaban con una secuencia adaptadora (U1) que era capaz de incorporar secuencias de oligonucleotidos cortas espedficas de plataforma de secuenciacion en los extremos de la molecula. En este ejemplo, se usaron los adaptadores de Illumina Nextera™, pero debe observarse que esencialmente ningun par de cebadores de PCR robustos funcionana igual de bien. Como un adaptador de ejemplo, la secuencia de oligonucleotido GCCTTGCCAGCCCGCTCAG [SEQ ID NO: 1746] se unio al extremo del segmento V de U1 (Fig. 1), con el fin de mantener la compatibilidad con el adaptador Nextera™ Illumina (Illumina, Inc., San Diego, CA)
(CAAGCAGAAGACGGCATACGAGATCGGTCTGCCTTGCCAGCCCGCTCAG) [SEQ ID NO: 1747] para anadir un oligonucleotido de Illumina de referencia, que era compatible con las celdas de flujo de Illumina tanto de extremo sencillo como emparejado.
Inmediatamente en la direccion 3' desde U1 (3' a) estaba la primera copia (B1) del oligonucleotido codigo de barras ACACACGTGACACTCT [SEQ ID NO: 1748]. Despues, se incorporo una longitud fija de secuencia del segmento V en el oligonucleotido molde, con todos los moldes en el conjunto de moldes terminando con un numero de bases dado antes de la RSS natural, con el fin de imitar la reordenacion de genes de TCR o BCR naturales que tienen un numero fijo de bases eliminadas en el segmento V. En este ejemplo se eliminaron inicialmente cero bases antes del RSS. Para maximizar la capacidad de reconocimiento de estas secuencias, despues se recortaron todas las secuencias de polinucleotidos del segmento V para eliminar codones parciales adyacentes a la RSS, de modo que las secuencias del segmento V residuales estaban en el marco con el codon de inicio. Las diversas secuencias de segmento V eran las mostradas en los conjuntos de oligonucleotidos molde de ejemplo presentadas en la lista de secuencias (p. ej., un conjunto de segmento V de TCRB dentro de las secuencias de formula (I) del conjunto de oligonucleotidos moldes de TCRB en las SEQ ID NO: 1-871; un conjunto distinto de segmentos V de TCRB dentro de las secuencias de formula (I) del conjunto de oligonucleotidos moldes de TCRB en las SEQ ID NO: 872-1560; un conjunto de segmentos V de TCRG dentro de las secuencias de formula (I) del conjunto de oligonucleotidos moldes de TCRG en las SEQ ID NO: 1561-1630); un solo polinucleotido V de ejemplo era como sigue:
5
10
15
20
25
30
35
40
TCTTATTTTCATAGGCTCCATGGATACTGGAATTACCCAGACACCAAAA TACCTGGTCACAGCAATGGGGAGTAAAAGGACAATGAAACGTGAGCATCTGGGA CATGATTCTATGTATTGGTACAGACAGAAAGCTAAGAAATCCCTGGAGTTCATGT TTTACT AC AACT GT AAGG AATT C ATT G AAA ACA AG ACT GT GCC AAATC ACTT C AC ACCTGAATGCCCTGACAGCTCTCGCTTATACCTTCATGTGGTCGCACTGCAGCAA GAAGACTCAGCTGCGTATCTCTGCACCAGCAG [SEQ ID NO: 1749].
El codon de parada TGA se incorporo en el marco en el extremo 3' de la secuencia de polinucleotido V en cada oligonucleotido molde, para asegurar que las secuencias de oligonucleotidos molde no se consideranan relevantes en el caso de que contaminaran una muestra biologica. En la direccion 3' desde el codon de inicio, entre el segmento V y el segmento J donde estana normalmente NDN, se inserto la segunda copia de la secuencia de codigo de barras B2 identificadora de V/J (SEQ ID NO: 1748). A continuacion se incorporo la secuencia del sitio de reconocimiento de la enzima de restriccion (R) Sal1 GTCGAC; esta secuencia se selecciono basandose en una secuencia que no se encontraba de forma natural en ninguna de las secuencias genomicas de los segmentos V o J de TCRB, confiriendo la capacidad de destruir espedficamente el molde sintetico si se desea, o para usar como un marcador informatico para identificar secuencias sinteticas. El sitio de B3, en esta version del molde, esta vado.
El polinucleotido J (J) se incorporo como una longitud fija de secuencia de un segmento genico J, medido desde un numero de bases fijo despues de la RSS natural para imitar un reordenamiento natural, y en el presente ejemplo extendiendose en el intron J-C. En este ejemplo, se borraron cero bases desde el segmento J, pero en otros disenos de oligonucleotidos molde se uso una eliminacion de 5 pb para hacer sitio para el codigo de barras de VJ (B2) en la union V-J mientras se manterna una longitud total del segmento J en el intervalo natural. Un polinucleotido J de ejemplo era
ACTGAAGCTTTCTTTGGACAAGGCACCAGACTCACAGTTGTAGGTAAG ACATTTTTCAGGTTCTTTTGCAGATCCGTCACAGGGAAAAGTGGGTCCACAG [SEQ ID NO: 1750],
En la direccion 3' desde el polinucleotido del segmento J estaba la tercera copia (B4) del oligonucleotido identificador codigo de barras (B4) (SEQ ID NO: 1748). La secuencia de oligonucleotido molde de ejemplo terminaba con una segunda secuencia adaptadora (U2) que era capaz de incorporar secuencias espedficas de plataforma en los extremos de la molecula. Como se ha indicado antes, se uso un adaptador compatible con Nextera™(CTGATGGCGCGAGGGAGGC) [SEQ ID NO: 1751] en el extremo del segmento J de U2 con el adaptador Nextera™ Illumina (AATGATACGGCGACCACCGAGATCTACACGCCTCCCTCGCGCCATCAG) [SEQ ID NO: 1752] para permitir anadir el oligonucleotido de secuenciacion de Illumina de referencia, que es compatible con celdas de flujo de extremos solos o emparejados.
Se prepararon conjuntos de oligonucleotidos molde de TCRB y TCRG de ejemplo de acuerdo con la presente descripcion, y ternan las secuencias de nucleotidos expuestas en las SEQ ID NO: 1-1630. Los conjuntos de oligonucleotidos molde que tienen las secuencias expuestas en las SEQ ID NO: 1-871 y 1561-1630, basandose en la informacion del diseno de secuencias descrito en la presente memoria, fueron sintetizados por Integrated DNA Technologies, Inc. (Coralville, IA) usando qrnmica de fragmentos genicos de gBlocks™. El conjunto de oligonucleotidos molde que tienen las secuencias expuestas en las SEQ ID NO: 872-1560 se genero mediante un procedimiento en mosaico de PCR descrito en el ejemplo 2.
Oligonucleotidos molde de TCRB (SEQ ID NO: 1-871). Se diseno un conjunto de 871 oligonucleotidos molde de formula general (I) (en la que B3 es nada) usando secuencias de polinucleotidos de V y J de TCRB humano:
5'-U1-B1 -V-B2-R-B3-J-B4-U2-3' (I)
Cada oligonucleotido molde consistfa en una molecula de ADN de 495 pares de bases. Las secuencias de la cadena codificante se presentan como SEQ ID NO: 1-871.
En la figura 1 se muestra un diagrama esquematico que representa el diseno de este conjunto de moldes. Por convenio, el diagrama representa el diseno del oligonucleotido en la direccion de 5' a 3' (de izquierda a derecha). El "segmento V" representa una secuencia genica que codifica la region variable (V) de receptor del sistema inmunitario adaptativo, o su complementaria. El "segmento J" representa la secuencia genica que codifica la region de union (J) de receptor del sistema inmunitario adaptativo. U1 y U2 representan, respectivamente, la primera y segunda secuencias de oligonucleotidos adaptadores universales, que pueden comprender ademas opcionalmente, respectivamente, una primera y segunda secuencias de oligonucleotidos espedficas de plataforma de secuenciacion unidas a y en posicion 5' respecto de la primera y segunda secuencias de oligonucleotidos adaptadores universales. B1, B2 y B4 representan secuencias de oligonucleotidos de codigos de barras que comprende cada una secuencia
5
10
15
20
25
30
35
40
de oligonucleotido de codigo de barras que comprende una secuencia de oligonucleotido unica que identifica de forma unica, como una combinacion emparejada, (i) una secuencia del segmento V unica, y (ii) una secuencia del segmento J unica; En este ejemplo, B3 es nada.
S representa un codon de parada opcional que puede estar en el marco o fuera del marco en el extremo 3' de V. R representa un sitio de reconocimiento de enzima de restriccion opcional. En la SEQ ID NO: 1-871 los adaptadores U1 y U2 inclrnan los oligomeros de 19 unidades como se ha descrito antes (SEQ ID NO: 1746 y 1751, respectivamente) y todas las secuencias de codigo de barras (B) identificadoras de (V+J) (B1, B2, B4) teman 16 nucleotidos de longitud; se incluyeron el codon de parada TGA y el sitio de reconocimiento de la enzima de restriccion Sal1 (GTCGAC).
Oligonucleotidos molde de TCRB (SEQ ID NO: 872-1560). Se diseno un segundo conjunto de 689 oligonucleotidos molde en el que, de acuerdo con la formula general (I), V y J comprendfan, respectivamente, secuencias de polinucleotidos de V y J de TCRB humanos, U1 y U2 comprendfan independientemente distintos sitios de reconocimiento de enzimas de restriccion (R1 y R3), y B1, B3 y B4 eran independientemente nada, para llegar a la formula general (II):
R1-V-B2-R2-J-R3 (II)
en donde B2 era un identificador de codigo de barras de 8 nucleotidos (p. ej., una secuencia de codigo de barras como se expone en la tabla 7); R1, R2 y R3 eran, respectivamente, los sitios de reconocimiento de enzimas de restriccion EcoR1 (GAATTC), Sal1 (GTcGaC) y Sph1 (GCATGC); y V y J eran, respectivamente, polinucleotidos de la region V y region J como se describe en la presente memoria. Cada oligonucleotido molde consistfa en una molecula de ADN de 239 pares de bases. Las secuencias de la cadena codificante se presentan como SEQ ID NO: 872-1560.
Oligonucleotidos molde de TCRG (SEQ ID NO: 1561-1630). Se diseno un tercer conjunto de 70 oligonucleotidos molde de formula general (I) usando secuencias de polinucleotidos de V y J de TCRG humanos. Cada oligonucleotido molde consistfa en una molecula de ADN de 495 pares de bases. Las secuencias de la cadena codificante se presentan como SEQ ID NO: 1561-1630. Los detalles para el conjunto de 70 oligonucleotido de moldes de TCRG (SEQ ID NO: 1561-1630) son representativos y eran como sigue:
Basandose en secuencias genomicas previamente determinadas, se mostro que el locus de TCRG humano contema 14 segmentos Vy que cada uno tema una secuencia de RSS y por lo tanto se consideraron como competentes para la reordenacion. Estos 14 segmentos Vy inclrnan 6 segmentos genicos que se sabfa que expresaban 3 segmentos V que se clasificaron como que teman marcos de lectura abiertos, y 5 pseudogenes V. Los segmentos genicos Vy se unieron a cinco segmentos genicos Jy. Con el fin de incluir todas las posibles combinaciones de genes de V+J para los 14 segmentos V y 5 segmentos J, se disenaron 70 (5 x 14) moldes que representaban todas las posibles combinaciones VJ. Cada molde estaba conforme con la formula general (I) (5'-U1- B1-V-B2-R-(B3)-J-B4-U2-3')(Fig. 1) y por lo tanto, inclrna 9 secciones, un adaptador universal (U1) de 19 pares de bases (pb), un marcador de nucleotido de 16 pb que identifica de forma unica cada combinacion emparejada de segmentos de gen V y gen J (B1), 300 pb de secuencia espedfica del gen V (V), un codon de parada de 3 pb (S), otra copia del marcador de nucleotidos de 16 pb (B2), un marcador de union de 6 pb compartido por todas las moleculas (R), nada para B3, 100 pb de la secuencia espedfica para el gen J (J), una tercera copia del marcador de nucleotidos de 16 pb (B4), y una secuencia adaptadora universal de 19 pb (U2).
Cada uno de los 70 moldes (SEQ ID NO: 1561-1630) se amplifico individualmente usando cebadores oligonucleotidos (Tabla 4; SEQ ID NO: 1732-1745) disenados para reasociarse a las secuencias adaptadoras universales (U1, U2).
Tabla 4. Cebadores de amplificacion de TCRG
Nombre del cebador
Adaptador 5' Secuencia SEQ ID NO:
TCRGV01_dev10
pGEXf GGAGGGGAAGGCCCCACAGTGTCTTC 1732
TCRGV02/3/4/5/8 d ev10
pGEXf GGAGGGGAAGGCCCCACAGCGTCTTC 1733
TCRGV05P_dev10
pGEXf GGAGGGGAAGACCCCACAGCATCTTC 1734
TCRGV06_dev10
pGEXf GGAGGGGAAGGCCCCACAGCATCTTC 1735
TCRGV07_dev10
pGEXf GGCGGGGAAGGCCCCACAGCATCTTC 1736
TCRGV09_dev10
pGEXf TGAAGTCATACAGTTCCTGGTGTCCAT 1737
TCRGV10_dev10
pGEXf CCAAATCAGGCTTTGGAGCACCTGATCT 1738
5
10
15
20
25
TCRGV11_dev10
pGEXf CAAAGGCTTAGAATATTTATTACATGT 1739
TCRGVA_dev10
pGEXf CCAGGTCCCTGAGGCACTCCACCAGCT 1740
TCRGVB_dev10
pGEXf CTGAATCTAAATTATGAGCCATCTGACA 1741
TCRGJP1_dev10
pGEXr GTGAAGTTACTATGAGCTTAGTCCCTTC AGCAAA 1742
TCRGJP2_dev10
pGEXr CGAAGTTACTATGAGCCTAGTCCCTTTT GCAAA 1743
TCRGJ1/2_dev10
pGEXr TGACAACAAGTGTTGTTCCACTGCCAAA 1744
TCRGJP_dev10
pGEXr CTGTAATGATAAGCTTTGTTCCGGGACC AAA 1745
La concentracion resultante de cada producto de oligonucleotido molde amplificado se cuantifico usando un sistema de electroforesis capilar de LabChip GX™ (Caliper Life Sciences, Inc., Hopkinton, MA) de acuerdo con las instrucciones del fabricante. Las frecuencias de aparicion para cada una de las 70 posibles combinaciones de V-J, determinadas por secuenciacion de los codigos de barras B1, se muestran en la tabla 5. Las 70 preparaciones de oligonucleotidos molde amplificados se normalizaron respecto a una concentracion de referencia y despues se mezclaron.
Para verificar que los 70 oligonucleotidos moldes estaban presentes en concentraciones sustancialmente equimolares, la mezcla se secuencio usando la plataforma de secuenciacion Illumina HiSeq™ de acuerdo con las recomendaciones del fabricante. Brevemente, para incorporar secuencias de oligonucleotidos espedficas de plataforma en los oligonucleotidos molde mezclados, se disenaron cebadores adaptados para reasociarse con los sitios de cebado universales (U1, U2) y que teman colas de secuencia adaptadora Illumina Nextera™ como extremo 5'. Despues, se llevo a cabo una reaccion de PCR de 7 ciclos para reasociar los adaptadores de Illumina con los oligonucleotidos molde. Despues, la mezcla de productos de reaccion de la PCR se purifico usando perlas Agencourt® AMPure® XP (Beckman Coulter, Inc., Fullerton, CA) en las condiciones recomendadas por el fabricante. Los primeros 60 pb de los productos de reaccion de la PCR se secuenciaron usando un secuenciador Illumina HiSEQ™ (Illumina, Inc., San Diego, CA) y se analizaron evaluando la frecuencia de cada marcador codigo de barras de 16 pb (B1).
Se calculo que una preparacion sustancialmente equimolar para el conjunto de 70 oligonucleotidos molde contema aproximadamente 1,4% de cada miembro del conjunto, y se deseaba una tolerancia umbral de mas o menos 10 veces la frecuencia (0,14-14%) para todas las especies. La secuenciacion cuantitativa puso de manifiesto que las 70 especies de los oligonucleotidos molde modificados por el adaptador dentro de la mezcla inicial no estaban representados equitativamente.
Por consiguiente, se llevan a cabo el ajuste de las concentraciones de los oligonucleotidos molde individuales y la repeticion de las etapas de secuenciacion cuantitativa hasta que cada molecula esta presente dentro de la concentracion de tolerancia umbral (0,14-14%).
5
10
15
20
25
Tabla 5: Representacion relativa (numero de apariciones de la combinacion V-J indicada) de los productos de amplificacion de cada pareja VJ de TCRG VJ (14 V x 5J) en la mezcla de moldes de preamplificacion
Recuento de seg J
Marcadores B
TCRGJ TCRGJ2 TCRGJ P TCRGJP1 TCRGJP2 n° N/A Suma total
TCRGV01
17 308 1315 741 822 44 3247
TCRGV02
630 781 2394 2009 122 65 6001
TCRGV03
250 166 2119 157 1105 51 3848
TCRGV04
777 37 2031 1490 1443 76 5854
TCRGV05
323 93 2571 716 150 63 3916
TCRGV05P
294 1161 2946 1552 530 111 6594
TCRGV06
164 1280 1809 401 23 40 3717
TCRGV07
16 234 1849 1697 93 78 3967
TCRGV08
2523 653 944 170 134 57 4481
TCRGV09
55 1004 2057 124 228 42 3510
TCRGV10
351 690 814 384 466 36 2741
TCRGV11
505 648 639 330 181 39 2342
TCRGVA
199 475 112 272 437 12 1507
TCRGVB
210 20 423 874 917 24 2468
n° N/A
77 118 309 150 106 531 1291
Suma total
6391 7668 22332 11067 6757 1269 55484
Ejemplo 2: Deteccion del sesgo de amplificacion de genes V de TCRB
Este ejemplo describe como se ensamblo un conjunto de 689 oligonucleotidos molde de TCRB de formula general (I) juntando entre sf cuatro oligonucleotidos monocatenarios de 50-90 nucleotidos para generar un conjunto de moldes que contiene dianas de hibridacion para todas las posibles combinaciones V-J en un conjunto de cebadores oligonucleotidos, que era capaz de amplificar secuencias de TCRB diana. El conjunto de oligonucleotidos molde despues se uso para caracterizar las eficacias de amplificacion relativas de un conjunto de cebadores de amplificacion de V y J de TCRB.
Se sintetizo un conjunto de 689 oligonucleotidos molde de TCRB que conteman secuencias de polinucleotidos que representan todas las posibles combinaciones de V y J reordenadas de forma productiva para cadenas de TCRB humanas, "juntando" entre sf cuatro cebadores de ADN en una reaccion de PCR convencional. Brevemente, se disenaron dos fragmentos de 90 pb (uno en la orientacion "directa" y el otro en la "inversa") para cada segmento genico de V de TCRB, se diseno un fragmento de 90 pb (en la orientacion "inversa") para cada segmento genico J de TCRB, y se diseno un molecula conectora de 50 pb (directa) para unir entre sf los fragmentos V y J. En total, se disenaron 52 V directos y 52 V inversos, 13 J inversos, y 689 moleculas conectoras. Los dos fragmentos de 90 pb (uno directo, uno inverso) que correspondfan a cada uno de los segmentos genicos V teman 39 pb de secuencia complementaria que solapaban. Un extremo de cada fragmento V inverso tema 25 pb de secuencia complementaria que solapaban con la molecula conectora de 50 pb. Los 25 pb restantes en cada una de las moleculas conectoras teman una secuencia que solapaba de forma complementaria con un extremo de la molecula J. Las moleculas se disenaron de modo que las secuencias complementarias podnan reasociarse entre sf y formar ADN bicatenario al que que se podna unir la polimerasa Taq y extender enzimaticamente la molecula.
Cada reaccion de PCR para ensamblar las moleculas juntadas usaba la mezcla de PCR QIAGEN Multiplex PCR master mix (QIAGEN numero de componente 206145, Qiagen, Valencia, CA), solucion Q al 10% Q (QIAGEN), y las cuatro secuencias de oligonucleotidos monocatenarios (dos V de TCRB V, uno J de TCRB y un conector, como se ha descrito antes). Las dos moleculas externas (una V directa y una J inversa) se anadieron con una concentracion
5
10
15
20
25
30
35
final 1 |jM de cada una, mientras que las dos moleculas internas (una V inversa y el conector directo), se anadieron cada una con una concentracion final 0,01 jM. Las condiciones del termociclador eran: 95°C durante 15 minutos, seguido de 35 ciclos de 94°C durante 30 segundos, 59°C durante 30 segundos, y 72°C durante 1 minuto, seguido de 1 ciclo a 72°C durante minutos. Despues de la smtesis, las moleculas se cuantificaron por el sistema de electroforesis capilar LabChip GX™ (Caliper Life Sciences, Inc., Hopkinton, MA) de acuerdo con las instrucciones del fabricante y la concentracion (en ng/jl) de cada banda resultante se calculo usando el software Caliper LabChip GX.
Las secuencias de nucleotidos para el conjunto de 689 TCRB oligonucleotidos molde se exponen en la SEQ ID NO: 872-1560. En las SEQ ID NO: 872-1560, cada secuencia de la region V distinta se identifico por una secuencia de codigo de barras unica de 8 nucleotidos, como se muestra en la tabla 7. Los 689 moldes se normalizaron respecto a una concentracion de referencia de 25 ng/jl, y despues se mezclaron. La mezcla resultante se uso para los ensayos de TCRB descritos en la presente memoria para detectar el uso sesgado (no uniforme) de los cebadores de amplificacion durante la amplificacion del conjunto de 689 oligonucleotidos molde (SEQ ID NO: 872-1560).
Cada uno de los 689 moldes estaba presente en la mezcla de oligonucleotidos molde lo mas cerca posible experimentalmente de la concentracion equimolar, y la mezcla se uso como molde para la reaccion de PCR de amplificacion de TCRB usando una mezcla equimolar de 52 cebadores de region V de TCRB que inclrnan una secuencia compatible con el adaptador de Illumina (SEQ ID NO: 1753-1804, tabla 6) y una mezcla equimolar de 13 cebadores de region J de TCRB J (SEQ ID NO: 1631-1643, Tabla 1). Los miembros de la mezcla de 689 moldes se amplificaron usando una mezcla equimolar de los 52 cebadores de VpF de TCRB (directos) (la "mezcla de VF") y una mezcla equimolar de los 13 cebadores de JpR de TCRB (inversos) (la "mezcla de JR") como se muestra en la tabla 1 (SEQ ID NO: 1631-1695). Las reacciones en cadena de la polimerasa (PCR) (50 jl de cada una) se ajustaron a mezcla de VF 1,0 jM (22 nM para cada cebador de VpF de TCRB unico), mezcla de JR 1,0 jM (77 nM para cada cebador de JpR de TcRb unico), mezcla QIAGEN Multiplex PCR master mix 1 jM (QIAGEN numero de componente 206145, Qiagen Corp., Valencia, CA), solucion Q al 10% (QIAGEN), y ADN genomico 16 ng/jl (ADNg). Se usaron las siguientes condiciones de ciclos termicos en un ciclador termico C100 (Bio-Rad Laboratories, Hercules, CA, EE.UU.): un ciclo a 95°C durante 15 minutos, de 25 a 40 ciclos a 94°C durante 30 segundos, 59°C durante 30 segundos y 72°C durante un minuto, seguido de un ciclo a 72°C durante 10 minutos. Para la obtencion de millones de muestras de locus de CDr de TCRp reordenados, se llevaron a cabo de 12 a 20 pocillos de PCR para cada biblioteca. Como se ha indicado antes, los cebadores de V y J inclrnan una cola que correspondfa a, y era compatible con adaptadores Illumina para la secuenciacion.
Los productos de amplificacion se secuenciaron cuantitativamente en un secuenciador Illumina HiSeq™. Una region de 60 pares de bases de cada molecula producto se secuencio usando los cebadores de secuenciacion de J de referencia (tabla 3) empezando a partir de las moleculas J. Las frecuencias de aparicion de cada secuencia de TCRB en los productos de reaccion se muestran en la figura 2, a partir de la cual era evidente que no todas las secuencias de TCRB se habfan amplificado en un grado comparable.
Tabla 6. Cebadores de amplificacion de TCRB
Nombre del cebador
Secuencia de cebador Relacion molar de cebador relativa ajustada SEQ ID NO:
TRB2V10-1
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TAA CAA AGG AGA AGT CTC AGA TGG CTA CAG 0,77 1753
TRB2V10-2
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGA TAA AGG AGA AGT CCC CGA TGG CTA TGT 1,57 1754
TRB2V10-3
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGA CAA AGG AGA AGT CTC AGA TGG CTA TAG 2,76 1755
TRB2V11- 123
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TCT AAG GAT CGA TTT TCT GCA GAG AGG CTC 1,88 1756
TRB2V12-1
imagen1
1
1757
TRB2V12-2
imagen2
1758
TRB2V12-
3/4
imagen3
3,24
1759
TRB2V12-5
imagen4
1,82
1760
TRB2V13
imagen5
2,14
1761
TRB2V14
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TTC TTA GCT GAA AGG ACT GGA GGG ACG TAT
1,65
1762
TRB2V 15
imagen6
3,77
1763
TRB2V16
imagen7
1,40
1764
TRB2V 17
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TAT TCA CAG CTG AAA GAC CTA ACG GAA CGT
2,87
1765
TRB2V18
imagen8
0,80
1766
TRB2V 19
imagen9
0,84
1767
imagen10
1
TRB2V20-1
imagen11
1,66
1769
TRB2V23-1
imagen12
1770
TRB2V24-1
imagen13
4,01
1771
TRB2V25-1
imagen14
1,29
1772
TRB2V26
imagen15
1773
TRB2V27
imagen16
4,22
1774
TRB2V28
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TTC CTG AGG GGT ACA GTG TCT CTA GAG AGA
2,37
1775
TRB2V29-1
imagen17
1,50
1776
TRB2V2P
imagen18
1777
TRB2V3-1
imagen19
3,35
1778
TRB2V3-2
imagen20
1779
imagen21
1
1
1
1
TRB2V4-1
imagen22
3,32
1781
TRB2V4-2/3
imagen23
3,11
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TTG GTC GAT TCT CAG GGC GCC AGT TCT CTA
1782
TRB2V5-1
1,27
1783
TRB2V5-3
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TTA ATC GAT TCT CAG GGC GCC AGT TCC ATG
1,75
1784
TRB2V5-4
imagen24
1,58
1785
TRB2V5-5
imagen25
0,99
1786
TRB2V5-6
imagen26
0,69
1787
TRB2V5-8
imagen27
3,30
1788
TRB2V6-1
imagen28
1,74
1789
TRB2V6-2/3
imagen29
1,59
1790
TRB2V6-4
imagen30
1,48
1791
imagen31
Nombre del cebador
Secuencia de cebador Relacion molar de cebador relativa ajustada SEQ ID NO:
TRB2V6-6
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGA CAA AGG AGA AGT CCC GAA TGG CTA CAA C 0,41 1793
TRB2V6-7
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGT TCC CAA TGG CTA CAA TGT CTC CAG ATC 2,23 1794
TRB2V6-8
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TCT CTA GAT TAA ACA CAG AGG ATT TCC CAC 1,18 1795
TRB2V6-9
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TAA GGA GAA GTC CCC GAT GGC TAC AAT GTA 0,96 1796
TRB2V7-1
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TTC CCC GTG ATC GGT TCT CTG CAC AGA GGT 0,85 1797
TRB2V7-2
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TAG TGA TCG CTT CTC TGC AGA GAG GAC TGG 0,64 1798
TRB2V7-3
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGG CTG CCC AAC GAT CGG TTC TTT GCA GT 0,84 1799
TRB2V7-4
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGG CGG CCC AGT GGT CGG TTC TCT GCA GAG 0,48 1800
TRB2V7-6/7
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TAT GAT CGG TTC TCT GCA GAG AGG CCT GAG G 1,01 1801
TRB2V7-8
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGC TGC CCA GTG ATC GCT TCT TTG CAG AAA 1,57 1802
TRB2V7-9
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGG TTC TCT GCA GAG AGG CCT AAG GGA TCT 0,49 1803
TRB2V9
CAA GCA GAA GAC GGC ATA CGA GCT CTT CCG ATC TGT TCC CTG ACT TGC ACT CTG AAC TAA AC 3,46 1804
Tabla 7: Secuencias de codigos de barra usadas para identificar regiones V de TCRB en las SEQ ID NO: 872-1560
Nombre de la region V de TCRB de codigo de barras de 8 pb
Secuencia de nucleotidos SEQ ID NO
TCRBV2_8bpBC
CAAGGTCA SEQ ID NO: 6375
TCRBV3-1_8bpBC
TACGTACG SEQ ID NO: 6376
TCRBV4-1_8bpBC
TACGCGTT SEQ ID NO: 6377
TCRBV4-2_8bpBC
CTCAGTGA SEQ ID NO: 6378
TCRBV4-3_8bpBC
GTGTCTAC SEQ ID NO: 6379
TCRBV5-1_8bpBC
AGTACCGA SEQ ID NO: 6380
TCRBV5-3_8bpBC
TTGCCTCA SEQ ID NO: 6381
TCRBV5-4_8bpBC
TCGTTAGC SEQ ID NO: 6382
TCRBV5-5_8bpBC
TGGACATG SEQ ID NO: 6383
TCRBV5-6_8bpBC
AGGTTGCT SEQ ID NO: 6384
TCRBV5-7_8bpBC
GTACAGTG SEQ ID NO: 6385
TCRBV5-8_8bpBC
ATCCATGG SEQ ID NO: 6386
TCRBV6-1_8bpBC
TGATGCGA SEQ ID NO: 6387
TCRBV6-2_8bpBC
GTAGCAGT SEQ ID NO: 6388
TCRBV6-3_8bpBC
GGATCATC SEQ ID NO: 6389
TCRBV6-4_8bpBC
GTGAACGT SEQ ID NO: 6390
TCRBV6-5_BbpBC
TGTCATCG SEQ ID NO: 6391
TCRBV6-6_BbpBC
AGGCTTGA SEQ ID NO: 6392
TCRBV6-7_8bpBC
ACACACGT SEQ ID NO: 6393
TCRBV6-8_8bpBC
TCCACAGT SEQ ID NO: 6394
TCRBV6-9_8bpBC
CAGTCTGT SEQ ID NO: 6395
TCRBV7-1_8bpBC
TCCATGTG SEQ ID NO: 6396
TCRBV7-2_8bpBC
TCACTGCA SEQ ID NO: 6397
TCRBV7-3_8bpBC
CAAGTCAC SEQ ID NO: 6398
TCRBV7-4_8bpBC
TAGACGGA SEQ ID NO: 6399
TCRBV7-6_8bpBC
GAGCGATA SEQ ID NO: 6400
TCRBV7-7_8bpBC
CTCGAGAA SEQ ID NO: 6401
TCRBV7-8_8bpBC
ATGACACC SEQ ID NO: 6402
TCRBV7-9_BbpBC
CTTCACGA SEQ ID NO: 6403
TCRBV9_8bpBC
CGTAGAGT SEQ ID NO: 6404
TCRBV10-1_8bpBC
TCGTCGAT SEQ ID NO: 6405
TCRBV10-2_8bpBC
AGCTAGTG SEQ ID NO: 6406
TCRBV10-3_8bpBC
TGAGACCT SEQ ID NO: 6407
5
10
15
20
25
TCRBV11-1_8bpBC
GATGGCTT SEQ ID NO: 6408
TCRBV11-2_8bpBC
GCATCTGA SEQ ID NO: 6409
TCRBV11-3_8bpBC
GACACTCT SEQ ID NO: 6410
TCRBV12-3_8bpBC
TGCTACAC SEQ ID NO: 6411
TCRBV12-4_8bpBC
TCAGCTTG SEQ ID NO: 6412
TCRBV12-5_8bpBC
TTCGGAAC SEQ ID NO: 6413
TCRBV13_8bpBC
GCAATTCG SEQ ID NO: 6414
TCRBV14_8bpBC
CAAGAGGT SEQ ID NO: 6415
TCRBV15_8bpBC
GAATGGAC SEQ ID NO: 6416
TCRBV16_8bpBC
AACTGCCA SEQ ID NO: 6417
TCRBV17p_8bpBC
CCTAGTAG SEQ ID NO: 6418
TCRBV18_8bpBC
CTGACGTT SEQ ID NO: 6419
TCRBV19_8bpBC
TGCAGACA SEQ ID NO: 6420
TCRBV20-1_8bpBC
AGTTGACC SEQ ID NO: 6421
TCRBV24-1_8bpBC
GTCTCCTA SEQ ID NO: 6422
TCRBV25-1_8bpBC
CTGCAATC SEQ ID NO: 6423
TCRBV27-1_8bpBC
TGAGCGAA SEQ ID NO: 6424
TCRBV28_BbpBC
TTGGACTG SEQ ID NO: 6425
TCRBV29-1_8bpBC
AGCAATCC SEQ ID NO: 6426
TCRBV30_8bpBC
CGAACTAC SEQ ID NO: 6427
Usando los datos que se obtuvieron para generar la figura 2, como se ha descrito antes, se evaluo la capacidad de amplificacion cruzada (capacidad para amplificar un segmento genico V distinto de aquel para el que se habfa disenado espedficamente el cebador, basandose en la complementariedad de la secuencia de reasociacion) para cada cebador de amplificacion que se hada disenado para la reasociacion con un segmento genico V espedfico. Se prepararon 52 mezclas de cebadores de amplificacion independientes, donde cada mezcla de cebadores tema 51 de los cebadores de region V de TCRB de la tabla 6 mezclados en concentraciones equimolares, y el cebador 52 de la region V de TCRB presente en la mezcla con doble concentracion molar que los otros 51 cebadores.Se preparo una mezcla de cebadores de amplificacion separada de modo que hada una mezcla para cada uno de los 52 cebadores de V presentes con doble concentracion que la de los otros cebadores, dando como resultado 52 mezclas de cebadores unicas. Se establecieron entonces 52 reacciones de amplificacion separadas, una para cada una de las mezclas de cebadores de amplificacion unicas, usando cada reaccion el conjunto de los 689 oligonucleotidos molde (SEQ ID NO: 872-1560) descritos antes. Los oligonucleotidos molde estaban presentes en concentracion equimolar unos respecto a otros. La amplificacion y secuenciacion se llevaron a cabo usando las condiciones descritas antes. Los resultados se muestran en la Figura 3.
En la figura 3, los cuadrados negros indicaban que no hada cambio en el grado de amplificacion con el respectivo cebador espedfico de region V de TCRB indicado presente con doble concentracion respecto a las concentraciones equimolares de todos los demas cebadores; los cuadrados blancos indicaban un aumento de 10 veces en la amplificacion; los cuadrados grises indicaban grados intermedios (en un gradiente de escala de grises) de amplificacion entre cero y 10 veces. La lmea diagonal indicaba que la duplicacion de la concentracion molar para un cebador dado produda un aumento de aproximadamente 10 veces en la amplificacion del respectivo oligonucleotido molde que tema la secuencia diana de reasociacion espedfica, en el caso de la mayona de los cebadores de regiones V de TCRB que se ensayaron. Los cuadrados blancos fuera de la diagonal indicaban moldes no correspondientes con los que algunos cebadores eran capaces de reasociarse y amplificar.
Cuando uno o mas de los cebadores presentaban una potencial amplificacion que era significativamente mayor o menor que un intervalo aceptable de potencial amplificacion (p. ej., un intervalo de potencial amplificacion uniforme
5
10
15
20
25
30
35
40
45
50
55
designado), se llevaban a cabo ajustes adicionales de las concentraciones de los oligonucleotidos cebadores individuales y la repeticion de las etapas de amplificacion de molde y secuenciacion cuantitativa, hasta que cada especie de molecula producto estaba presente dentro de un intervalo deseado, que era indicativo de la correccion de la potencial amplificacion no uniforme entre los cebadores dentro de un conjunto de cebadores de amplificacion.
Por consiguiente, las concentraciones de cebadores se ajustaron como se indicaba en la tabla 6, con el fin de determinar si los resultados de la amplificacion sesgada que aparedan en las figuras 2 y 3 se podfan reducir en gravedad por el aumento o disminucion de la presencia relativa de, respectivamente, cebadores de amplificacion muy eficaces o poco eficaces. Para la PCR multiplexada usando un conjunto de cebadores ajustado, las secuencias de cebadores de genes de V segrnan siendo las mismas (secuencia descrita en la tabla 3), sin embargo la concentracion relativa de cada cebador era mayor, si el cebador amplificaba en menor cantidad su molde (Fig. 3), o menor si el cebador amplificaba en mayor cantidad su molde (Fig. 3). Despues la mezcla de cebadores de amplificacion ajustada se usaba en una pCr para amplificar la composicion de moldes que contema, en cantidades equimolares, el conjunto de 689 oligonucleotidos molde (SEQ ID NO: 872-1560) que se usaron para generar los datos en las figuras 2 y 3.
La amplificacion y secuenciacion cuantitativa se llevaron a cabo como se ha descrito antes y los resultados se muestran en la figura 4, que compara la frecuencia con la que se obtuvo cada producto que contiene secuencia de region V amplificada indicado cuando todos los cebadores de amplificacion estaban presentes en concentraciones equimolares (barras negras) con la frecuencia con la que se obtuvo cada uno de dichos productos despues de que se ajustaran las concentraciones de los cebadores de amplificacion (barras grises) a las concentraciones indicadas en la tabla 6.
Se encuentran secuencias de cebadores de hs-TCRB adicionales en las SEQ ID NO: 6192-6264.
Ejemplo 3: Correccion de la potencial amplificacion no uniforme (sesgo de la PCR) en conjuntos de cebadores oligonucleotidos que amplifican TCR
Se disenaron diversos cebadores de amplificacion de TCR para amplificar todas las posibles combinaciones de segmentos genicos V y J de TCR reordenados en una muestra biologica que contiene ADN de celulas linfoides de un sujeto. Se usa una preparacion que contiene concentraciones equimolares de los diversos cebadores de amplificacion en la PCR multiplexada para amplificar una composicion de diversos moldes que comprenden concentraciones equimolares de oligonucleotidos molde espedficos de TCR de acuerdo con la formula (I) con al menos un molde que representa todas las posibles combinaciones de V-J para el locus de TCR. Los productos de amplificacion se secuencian cuantitativamente y se obtiene la frecuencia de aparicion de cada secuencia de producto V-J unica a partir de la frecuencia de aparicion de cada secuencia de codigo de barras molecular de 16 pb (B en la formula (I)) que identifica de forma unica cada combinacion V-J.
Para el TCRG, los oligonucleotidos molde de TCRG (SEQ ID NO: 1561-1630) se amplifican usando cebadores espedficos de V y J de TCRG (SEQ ID NO: 1732-1745, Tabla 4). La independencia del cebador J de los respectivos cebadores V emparejados se identifica amplificando por separado cada uno de los 8 cebadores espedficos del segmento genico V de TCRG con una mezcla de los 5 cebadores espedficos del segmento genico J. Los productos de amplificacion se secuencian cuantitativamente en una plataforma de secuenciacion Illumina HiSeq™ y la frecuencia de aparicion de las secuencias de codigo de barras de 16 pb (B) que identifican de forma unica las combinaciones V-J espedficas permiten la cuantificacion de cada par V-J. La independencia del cebador V de los cebadores J respectivamente emparejados se identifica llevando a cabo la reaccion inversa, es decir, amplificando por separado cada uno de los 5 cebadores de segmentos genicos J de TCRG con una mezcla de 8 cebadores espedficos del segmento genico V.
Para ensayar si los cebadores V o cebadores J de TCRG se amplifican de forma cruzada (p. ej., si los cebadores espedficos de segmento genico se amplifican de forma no espedfica, por ejemplo, para ensayar si el cebador de V disenado espedficamente para amplificar segmentos V7 de TCRG es capaz de amplificar los segmentos genicos tanto V6 de TCRG como V7 de TCRG), se generan mezclas de cebadores independientes que contienen concentraciones equimolares de todos salvo un cebador, y despues se anade el cebador omitido a la mezcla en una concentracion molar doble que la de los otros cebadores. Despues los cebadores se usan para amplificar una composicion de moldes que comprende una pluralidad de oligonucleotidos molde de formula general (I) como se describe en la presente memoria, usando las secuencias de genes V y J de TCRG, respectivamente en los polinucleotidos V y J de formula (I). La secuenciacion cuantitativa pone de manifiesto las identidades de uno cualquiera o mas moldes que estan representados en exceso entre los productos de amplificacion, cuando un solo cebador de amplificacion esta presente en doble concentracion que la de los otros cebadores en la mezcla de cebadores. Despues, la mezcla de cebadores se ajusta para aumentar o disminuir las concentraciones relativas de uno o mas cebadores, para obtener frecuencias de amplificacion en los ciclos iterativos que estan dentro de tolerancias cuantitativas aceptables. La mezcla de cebadores ajustada asf obtenida se considera que se ha corregido para reducir la potencial amplificacion no uniforme entre los miembros del conjunto de cebadores.
Para determinar si una mezcla de cebadores corregida presenta potencial amplificacion sin sesgo cuando se usa para amplificar ADN molde de TCR reordenado en una muestra biologica de celulas linfoides de un sujeto, se
5
10
15
20
25
30
35
40
45
50
55
preparan composiciones molde artificiales como se describe en la presente memoria con todos los pares VJ presentes con una frecuencia similar, y tambien con concentraciones variables de la representacion relativa de determinadas parejas VJ. Cada tipo de preparacion de moldes se ensaya por separado como un molde de amplificacion para un conjunto de cebadores de amplificacion que se ha corregido para reducir el potencial de amplificacion no uniforme entre determinados miembros del conjunto de cebadores. La determinacion cuantitativa de secuencias de los productos de amplificacion identifica que la representacion cuantitativa relativa de secuencias espedficas en la preparacion de moldes se refleja en la representacion cuantitativa relativa de secuencias espedficas entre los productos de amplificacion.
Como una alternativa al proceso iterativo descrito antes, o ademas de dichas etapas de amplificacion iterativas seguido de secuenciacion cuantitativa, tambien se puede corregir el sesgo de la amplificacion por medio informatico. De acuerdo con este procedimiento computacional, se conoce la frecuencia de inicio de cada una de las especies de las secuencias de oligonucleotidos molde en la composicion de moldes sintetizada. La frecuencia de cada una de estas especies de secuencias de oligonucleotidos entre los productos de amplificacion que se obtienen despues de la amplificacion por PCR se determina por secuenciacion cuantitativa. La diferencia entre las frecuencias relativas de las secuencias de oligonucleotidos molde antes de la amplificacion por PCR y sus frecuencias despues de amplificacion por PCR es el "sesgo de la PCR". Esta diferencia es el sesgo de la amplificacion introducido durante la amplificacion, por ejemplo, como consecuencia de diferentes eficacias de amplificacion entre los diferentes cebadores de amplificacion.
Determinado cuantitativamente para cada secuencia de oligonucleotido molde conocida, el sesgo de la PCR para cada cebador se usa para calcular un factor de sesgo de amplificacion (normalizacion) por el cual se corrige la frecuencia para cada producto de amplificacion para reflejar la frecuencia real de la respectiva secuencia molde en la composicion de moldes. Si el sesgo de la PCR para un conjunto de cebadores de amplificacion se detecta empmcamente usando la presente composicion de moldes que esta dentro de un factor de 10, entonces el sesgo se puede corregir computacionalmente en productos de amplificacion obtenidos cuando se usa el mismo cebador de amplificacion para amplificar una muestra de ADN de composicion desconocida. De esta forma se obtiene una mejor precision en la cuantificacion de las especies molde en la muestra de ADN.
Debido a que los cebadores de V y J se ensayan empmcamente y se muestra que son independientes, se puede obtener un factor de sesgo de la amplificacion para cada especie V y para cada especie J, y no es necesario un factor de amplificacion para cada pareja de especies VJ. Por consiguiente, el factor del sesgo de amplificacion para cada especie V y especie J se obtiene usando la presente composicion de moldes. Por el presente metodo, se conocen las frecuencias de las secuencias genicas de V y J en la composicion de moldes (o se pueden calcular basandose en el conocimiento de las concentraciones de cada especie oligonucleotido molde en la composicion de moldes sintetizada) antes de la amplificacion por PCR. Despues de la amplificacion por PCR, se usa la secuenciacion cuantitativa para detectar la frecuencia de cada una de las secuencias de segmentos genicos V y J en los productos de amplificacion. Para cada secuencia, la diferencia en la frecuencia de segmentos genicos es el sesgo de la amplificacion:
Frecuencia inicial/frecuencia final = factor de sesgo de la amplificacion
Los factores de sesgo de la amplificacion se calculan para cada segmento genico V y cada segmento genico J. Estos factores de amplificacion, una vez calculados, se pueden aplicar a muestras, para las que no se conoce la frecuencia inicial de los genes de V y J.
En una poblacion de moldes mixta (tal como una muestra de ADN complejo obtenida a partir de una fuente biologica que comprende ADN de celulas linfoides, que se supone qu contiene ADN que codifica el receptor del sistema inmunitario adaptativo, o una muestra de ADN complejo que comprende ademas ADN de otras celulas que carecen de dichas reordenaciones), donde no se conoce la frecuencia inicial de cada uno de los segmentos genicos V y J, los factores de amplificacion calculados para un primer conjunto que se ha caracterizado usando la presente composicion de moldes, se pueden usar para corregir el sesgo de amplificacion de la PCR residual. Para cada especie de molecula de producto de amplificacion secuenciado, los genes V y J que usa la molecula se determinan basandose en la similitud de secuencia. Para corregir el sesgo de la amplificacion, el numero de veces que se secuencio la molecula se multiplica por los factores de amplificacion tanto de V como de J corregidos. El recuento de secuencia resultante es el conjunto "normalizado" computacionalmente.
Ejemplo 4: Generacion de composiciones de moldes adicionales
Se disenaron y produjeron composiciones de moldes adicionales esencialmente de acuerdo con las metodologfas descritas antes.
Polinucleotidos V y J. Se generaron secuencias de polinucleotidos V y J de TCRB para incluir en la pluralidad de oligonucleotidos molde descritos en la presente memoria y se establecen en conjuntos de 68 SEQ ID NO de V y J de TCRB, respectivamente, como se muestra en las figuras 5a-5l como conjunto 1 de V/J de TCRB, conjunto 2 de V/J de TCRB, conjunto 3 de V/J de TCRB, conjunto 4 de V/J de TCRB, conjunto 5 de V/J de TCRB, conjunto 6 de V/J de
5
10
15
20
25
30
35
40
45
50
55
TCRB, conjunto 7 de V/J de TCRB, conjunto 8 de V/J de TCRB, conjunto 9 de V/J de TCRB, conjunto 10 de V/J de TCRB, conjunto 11 de V/J de TCRB, conjunto 12 de V/J de TCRB y conjunto 13 de V/J de TCRB.
Se generaron secuencias de polinucleotidos V y J de TCRG para incluir en la pluralidad de oligonucleotidos molde descritos en la presente memoria y se establecen en conjuntos de 14 SEQ ID NOS de V y J de TCRG, respectivamente, como se expone en las figuras 6a-6b como conjunto 1 de V/J de TCRG, conjunto 2 de V/J de TCRG, conjunto 3 de V/J de TCRG, conjunto 4 de V/J de TCRG y conjunto 5 de V/J de TCRG.
Se generaron secuencias de polinucleotidos V y J de IGH para incluir en la pluralidad de oligonucleotidos molde descritos en la presente memoria y se establecen en conjuntos de 127 SEQ ID NOS de V y J de IGH, respectivamente, como se expone en las figuras 7a-7m como conjunto 1 de V/J de IGH, conjunto 2 de V/J de IGH, conjunto 3 de V/J de IGH, conjunto 4 de V/J de IGH, conjunto 5 de V/J de IGH, conjunto 6 de V/J de IGH, conjunto 7 de V/J de IGH, conjunto 8 de V/J de IGH y conjunto 9 de V/J de IGH.
Composiciones de moldes. Se preparo una composicion de moldes para la normalizacion de la eficacia de la amplificacion de conjuntos de cebadores de amplificacion de TCRB. La composicion comprendfa una pluralidad de oligonucleotidos moldes que teman una pluralidad de secuencias de oligonucleotidos de formula general (I). La composicion de moldes de TCRB que comprende 858 oligonucleotidos molde distintos se describe en la lista de secuencias en las SEQ ID NO: 3157-4014.
Se preparo una composicion de moldes para la normalizacion de la eficacia de la amplificacion de conjuntos de cebadores de amplificacion de TCRG. La composicion comprendfa una pluralidad de oligonucleotidos moldes que teman una pluralidad de secuencias de oligonucleotidos de formula general (I). La composicion de moldes de TCRg que comprende 70 oligonucleotidos molde distintos se describe en la lista de secuencias en las SEQ ID NO: 40154084.
Se preparo una composicion de moldes para la normalizacion de la eficacia de la amplificacion de conjuntos de cebadores de amplificacion de IGH. La composicion comprendfa una pluralidad de oligonucleotidos moldes que teman una pluralidad de secuencias de oligonucleotidos de formula general (I). La composicion de moldes de iGh que comprende 1116 oligonucleotidos molde distintos se describe en la lista de secuencias en las SEQ ID NO: 40855200. Una composicion de moldes de IGH que comprende un conjunto de 1116 oligonucleotidos molde se describe tambien en la lista de secuencias en las SeQ ID NO: 1805-2920.
Ejemplo 5: Uso de la composicion de moldes para determinar el factor de amplificacion
Este ejemplo describe la cuantificacion de moleculas de ADN reordenadas que codifican una pluralidad de moleculas de IG, usando la composicion de oligonucleotidos molde presente descrita como un molde sintetico "enriquecido en" en una amplificacion de PCR multiplexada de una muestra de ADN que contiene ADN de linfocitos B y fibroblastos.
AND molde biologico: Se usaron 8 muestras biologicas como fuentes de ADN molde, conteniendo cada muestra biologica la misma cantidad de ADN genomico total (ADNg), 300 ng, pero en una proporcion diferente de (i) ADN extrafdo de linfocitos B a (ii) ADN extrafdo de celulas fibroblastos humanos, un tipo de celula en la que los genes que codifican IG y TCR no se reordenan. Las muestras conteman 0, 0,07, 0,3, 1, 4, 18, 75 o 300 ng de ADNg de linfocitos B, suministrando el ADNg de fibroblastos el resto de cada preparacion de ADNg de 300 ng. Se hicieron cuatro repeticiones de cada muestra.
ADN molde sintetico: Para cada reaccion de PCR (a continuacion) se anadieron 5000 moleculas (4-5 moleculas de cada secuencia) de una composicion de oligonucleotidos molde que comprende una mezcla de 1116 moleculas de oligonucleotidos molde de iGh sinteticas (SEQ ID NO: 4085-5200). Una composicion de moldes de IGH que comprende un conjunto de 1116 oligonucleotidos molde se describe tambien en la lista de secuencias como SEQ ID NO: 1805-2920.
Reaccion de PCR: La reaccion de PCR usaba la mezcla QIAGEN Multiplex Plus™ PCR master mix (QIAGEN numero de componentes 206152, Qiagen, Valencia, CA), solucion Q al 10% Q (QIAGEN), y 300 ng de aDn molde biologico (descrito antes). Se anadieron los cebadores de amplificacion mezclados de modo que la reaccion final tema una concentracion de cebador directo agregado 2 pM y una concentracion de cebador inverso agregado 2 pM. Los cebadores directos (SEQ ID NO: 5201-5286) inclrnan 86 cebadores que teman en el extremo 3' un segmento de aproximadamente 20 pb que se reasociaba con la secuencia que codifica el segmento V de IGH, y en el extremo 5' un cebador universal de aproximadamente 20 pb pGEXf. Los cebadores inversos (SEQ ID NO: 5287-5293) inclrnan un agregado de cebadores espedficos del segmento J que teman en el extremo 3' un segmento de aproximadamente 20 pb que se reasociaba con la secuencia que codifica el segmento J de IGH, y en el extremo 5' de los cebadores J habfa un cebador universal pGEXr. Se usaron las siguientes condiciones de ciclos termicos en un ciclador termico C100 (Bio-Rad Laboratories, Hercules, CA, EE.UU.): un ciclo a 95°C durante 10 minutos, 30 ciclos a 94°C durante 30 segundos, 63°C durante 30 segundos y 72°C durante un minuto, seguido de un ciclo a 72°C durante 10 minutos. Cada reaccion se llevo a cabo por cuadruplicado.
5
10
15
20
25
30
35
40
45
50
Para la secuenciacion, se incorporaron adaptadores Illumina (Illumina Inc., San Diego, CA), que tambien inclman un marcador de 6 pb y un conjunto aleatorio de nucleotidos de 6 pb, en los extremos de los productos de reaccion de la PCR en una reaccion de PCR de 7 ciclos. Los reactivos y condiciones de la PCR eran como se han descrito antes, excepto las condiciones del termociclado, que eran: 95°C durante 5 minutos, seguido de 7 ciclos de 95° durante 30 s, 68° durante 90 s y 72° durante 30 s. Despues de los ciclos termicos, las reacciones se mantuvieron durante 10 min a 72°C y los cebadores eran los cebadores de union adaptadores de Illumina (SEQ ID NO: 5387-5578). Las muestras se secuenciaron en un secuenciador Illumina MiSEQ™ usando el cebador Illumina_PE_RD2.
Resultados: Se obtuvieron los datos de las secuencias para cada muestra y los productos de amplificacion de los moldes sinteticos se identificaron por la presencia de la secuencia de oligonucleotido codigo de barras. Para cada muestra, el numero de productos molde se dividio entre el numero de secuencias de oligonucleotidos molde sinteticos unicas (1116) para llegar a un factor de amplificacion de la muestra. El numero total de productos de amplificacion de los moldes biologicos para cada muestra despues se dividio entre el factor de amplificacion para calcular el numero de moleculas de molde biologico reordenadas (p. ej., recombinaciones VDJ) en la reaccion de amplificacion inicial como un calculo del numero de moldes de genoma de linfocitos B unicos. Se representaron graficamente los valores medio con desviaciones estandar frente al numero conocido de moleculas molde biologicas reordenadas basado en la entrada de linfocitos B (Fig. 9). En la figura 9, los puntos representan el factor de amplificacion medio y las barras representan la desviacion estandar a lo largo de las 4 repeticiones. El uso de factores de amplificacion calculados como se describe en la presente memoria para calcular el numero de moleculas que codifican IG con VJ reordenados (como un valor proxy para el numero de linfocitos B) daba determinaciones que estaban de acuerdo con el numero de linfocitos B conocidos al menos hasta una entrada de 100 linfocitos B. Los valores del factor de amplificacion calculados y el factor de amplificacion observado estaban altamente correlacionados (Fig. 9, R2 = 0,9988).
Ejemplo 6: Oligonucleotidos molde de VJ de IgH, moldes de control del sesgo de IgH, IgL e IgK
En una realizacion, se generaron y analizaron oligonucleotidos molde de VJ de IgHSe diseno un conjunto de 1134 oligonucleotidos molde de formula general (I) usando secuencias de polinucleotidos de V y J de IgH humano. Cada oligonucleotido molde consistfa en una molecula de ADN de 495 pares de bases. Los detalles para el conjunto de 1134 oligonucleotidos moldes de IgH son representativos y eran los siguientes.
Basandose en secuencias genomicas previamente determinadas, se mostro que el locus de IgH humano contema 126 segmentos Vh que cada uno tema una secuencia de RSS y por lo tanto se consideraron como competentes para la reordenacion. Estos 126 segmentos Vh inclman 52 segmentos genicos que se sabfa que eran expresados, 5 segmentos V que se clasificaron como que teman marcos de lectura abiertos, y 69 pseudogenes V. Los segmentos genicos Vh se unieron a 9 segmentos genicos Jh. Con el fin de incluir todas las posibles combinaciones de genes de V+J para los 126 segmentos V y 9 segmentos J, se disenaron 1134 (9 x 126) moldes que representaban todas las posibles combinaciones VJ. Cada molde estaba conforme con la formula general (I) (5-U1-B1-V-B2-R-J-B4-U2- 3')(Fig. 1) y por lo tanto, inclma 9 secciones, un adaptador universal (U1) de 19 pares de bases (pb), un marcador de nucleotido de 16 pb que identifica de forma unica cada combinacion emparejada de segmentos de gen V y gen J (B1), 300 pb de secuencia espedfica del gen V (V), un codon de parada de 3 pb (S), otra copia del marcador de nucleotidos de 16 pb (B2), un marcador de union de 6 pb compartido por todas las moleculas (R), nada para B3, 100 pb de la secuencia espedfica para el gen J (J), una tercera copia del marcador de nucleotidos de 16 pb (B4), y una secuencia adaptadora universal de 19 pb (U2). Dos segmentos V eran identicos en nucleotidos a otros dos segmentos V, y por lo tanto no se ordenaron. Esto reduda el numero de segmentos incluidos de 1134 a 1116. La composicion de moldes de IGH que comprende 1116 oligonucleotidos molde distintos se describe en la lista de secuencias en las SEQ ID NO: 4085-5200.
Cada uno de los 1116 moldes se amplifico individualmente usando cebadores oligonucleotidos disenados para reasociarse con las secuencias adaptadoras universales (U1, U2). Estas secuencias de oligonucleotidos pueden ser cualquier cebador universal. Para esta solicitud se uso un cebador universal codificado Nextera.
Tabla 8: Secuencias de cebadores universales incluidas en moldes de control del sesgo
Nombre del cebador
Secuencia de cebador SEQ ID NO
pGEXf
GGGCTGGCAAGCCACGTTTGGTG SEQ ID NO: 6428
pGEXr
CCGGGAGCTGCATGTGTCAGAGG SEQ ID NO: 6429
Las secuencias de cebador universal se pueden reasociar con cualquier secuencia de cebador descrita en la presente memoria. Se muestra a continuacion un ejemplo de los cebadores de PCR incluyendo la secuencia de cebador universal:
Tabla 9: Cebadores de PCR de IGH de ejemplo con secuencias universales (negrilla y subrayadas)
5
10
15
20
25
30
35
40
45
Nombre del cebador
Secuencia de cebador SEQ ID NO
pGEXf_IGHV(II)-
GGGCTGGCAAGCCACGTTTGGTGAGCCCCCAGGGAAGAAGCT SEQ ID
15-1_ver10_01
GAAGTGG NO: 6430
pGEXr_IGHJ1/4/5_ ver10_03
CCGGGAGCTGCATGTGTCAGAGGCACCTGAGGAGACGGTGAC SEQ ID NO: 6431
CAGGGT ‘
La concentracion de cada producto de oligonucleotido molde amplificado se cuantifico usando un sistema de electroforesis capilar de LabChip GX™ (Caliper Life Sciences, Inc., Hopkinton, MA) de acuerdo con las instrucciones del fabricante. Las 1116 preparaciones de oligonucleotidos molde amplificados se normalizaron respecto a una concentracion de referencia y despues se mezclaron.
Para verificar que los 1116 oligonucleotidos moldes estaban presentes en concentraciones sustancialmente equimolares, la mezcla se secuencio usando la plataforma de secuenciacion Illumina MiSeq™ de acuerdo con las recomendaciones del fabricante. Para incorporar secuencias de oligonucleotidos espedficas de plataforma en los oligonucleotidos molde mezclados, se disenaron cebadores adaptados para reasociarse con los sitios de cebado universales (U1, U2) y que teman colas de secuencia adaptadora Illumina como los extremos 5'. Despues, se llevo a cabo una reaccion de PCR de 7 ciclos para reasociar los adaptadores de Illumina con los oligonucleotidos molde. Despues, la mezcla de productos de reaccion de la PCR se purifico usando perlas Agencourt® AMPure® XP (Beckman Coulter, Inc., Fullerton, CA) en las condiciones recomendadas por el fabricante. Los primeros 29 pb de los productos de reaccion de la PCR se secuenciaron usando un secuenciador Illumina MiSEQ™ (Illumina, Inc., San Diego, CA) y se analizaron evaluando la frecuencia de cada marcador codigo de barras de 16 pb (B1).
Se calculo que una preparacion sustancialmente equimolar para el conjunto de 1116 oligonucleotidos molde distintos contema aproximadamente 0,09% de cada miembro del conjunto, y se deseaba una tolerancia umbral de mas o menos 10 veces la frecuencia (0,009%-0,9) para todas las especies. La secuenciacion cuantitativa puso de manifiesto que las 1116 especies de los oligonucleotidos molde modificados por el adaptador dentro de la mezcla inicial no estaban representados equitativamente.
Por consiguiente, se llevan a cabo el ajuste de las concentraciones de los oligonucleotidos molde individuales y la repeticion de las etapas de secuenciacion cuantitativa hasta que cada molecula esta presente dentro de la concentracion de tolerancia umbral (0,009-0,9%).
Oligonucleotidos molde de DJ de IgH
En otra realizacion, se generaron y analizaron oligonucleotidos molde de DJ de IgH. Se diseno un conjunto de 243 oligonucleotidos molde de formula general (I) usando secuencias de polinucleotidos de D y J de IgH humano. Cada oligonucleotido molde consistfa en una molecula de ADN de 382 pares de bases. Las secuencias de los oligonucleotidos molde de DJ de IgH se presentaba en las SEQ ID NO: 5579-5821. Los detalles para el conjunto de 243 oligonucleotidos moldes de IgH son representativos y eran los siguientes.
Basandose en las secuencias genomicas previamente determinadas, se mostro que el locus de IgH humano contema 27 segmentos Dh. Los 27 segmentos genicos Dh se unieron a 9 segmentos genicos Jh. Para incluir todas las posibles combinaciones de genes D+J para los 27 segmentos D y 9 segmentos J, se disenaron 243 (9 x 27) moldes que representaban todas las posibles combinaciones DJ. Cada molde estaba conforme con la formula general (I) (5'-U1-B1-V-B2-R-J-B4-U2-3') (Fig. 1) y por lo tanto inclma 9 secciones, un adaptador universal (U1) de 19 pares de bases (pb), un marcador de nucleotidos de 16 pb que identifica de forma unica cada combinacion emparejada de segmentos de genes D y genes J (B1). Sin embargo, para estas moleculas, los 300 pb de la secuencia espedfica genica V (V) se sustituyeron por un segmento de 182 pb de la secuencia espedfica del gen D. Este segmento inclma segmentos de nucleotidos tanto exonicos como intronicos. Como las otras moleculas, estas inclman un codon de parada de 3 pares de bases (pb) (S), otra copia del marcador de nucleotidos de 16 pb (B2), un marcador de union de 6 pb compartido por todas las moleculas (R), nada para B3, 100 pb para la secuencia espedfica del gen J (J), una tercera copia del marcador de nucleotidos de 16 pb (B4) y una secuencia adaptadora universal de 10 pb (U2).
Cada uno de los 243 moldes (SEQ ID NO: 5579-5821) se amplifico individualmente usando cebadores oligonucleotidos disenados para reasociarse con las secuencias adaptadoras universales (U1, U2; vease la tabla 8). Estas secuencias de oligonucleotidos pueden ser cualquier cebador universal; Para esta solicitud se uso un cebador universal codificado Nextera.
Un ejemplo de los cebadores de PCR con las secuencias adaptadoras universales se muestra en la tabla 10.
5
10
15
20
25
30
35
40
45
Tabla 10: Cebadores de PCR de DJ de IgH de ejemplo con secuencias universales (negrilla y subrayadas)
Nombre del cebador
Secuencia de cebador SEQ ID NO
pGEXf_IGHV(I I)-15- 1_ver10_01
GGGCTGGCAAGCCACGTTTGGTGAGCCCCCAGGG SEQ ID NO: 6432
AAGAAGCTGAAGTGG
pGEXr_IGHJ1/4/5_ ver10_03
CCGGGAGCTGCATGTGTCAGAGGCACCTGAGGAG SEQ ID NO: 6433
ACGGTGACCAGGGT
La concentracion resultante de cada producto de oligonucleotido molde amplificado se cuantifico usando un sistema de electroforesis capilar de LabChip GX™ (Caliper Life Sciences, Inc., Hopkinton, MA) de acuerdo con las instrucciones del fabricante. Las 243 preparaciones de oligonucleotidos molde amplificados se normalizaron respecto a una concentracion de referencia y despues se mezclaron.
Para verificar que los 243 oligonucleotidos moldes estaban presentes en concentraciones sustancialmente equimolares, la mezcla se secuencio usando la plataforma de secuenciacion Illumina MiSeq™ de acuerdo con las recomendaciones del fabricante. Para incorporar secuencias de oligonucleotidos espedficas de plataforma en los oligonucleotidos molde mezclados, se disenaron cebadores adaptados para reasociarse con los sitios de cebado universales (U1, U2) y que teman colas de secuencia adaptadora Illumina como los extremos 5'. Despues, se llevo a cabo una reaccion de PCR de 7 ciclos para reasociar los adaptadores de Illumina con los oligonucleotidos molde. Despues, la mezcla de productos de reaccion de la PCR se purifico usando perlas Agencourt® AMPure® XP (Beckman Coulter, Inc., Fullerton, CA) en las condiciones recomendadas por el fabricante. Los primeros 29 pb de los productos de reaccion de la PCR se secuenciaron usando un secuenciador Illumina MiSEQ™ (Illumina, Inc., San Diego, CA) y se analizaron evaluando la frecuencia de cada marcador codigo de barras de 16 pb (B1).
Se calculo que una preparacion sustancialmente equimolar para el conjunto de 243 oligonucleotidos molde distintos contema aproximadamente 0,4% de cada miembro del conjunto, y se deseaba una tolerancia umbral de mas o menos 4,0 veces la frecuencia (0,04%- 4,0%) para todas las especies. La secuenciacion cuantitativa puso de manifiesto que las 243 especies de los oligonucleotidos molde modificados por el adaptador dentro de la mezcla inicial no estaban representados equitativamente.
Por consiguiente, se llevan a cabo el ajuste de las concentraciones de los oligonucleotidos molde individuales y la repeticion de las etapas de secuenciacion cuantitativa hasta que cada molecula esta presente dentro de la concentracion de tolerancia umbral (0,04 - 4,0%). Despues de normalizacion, este conjunto se combino con un conjunto de control de sesgo de 1116 VJ de IgH para una mezcla de 1359 moldes.
La figura 10 muestra los resultados para un recuento de secuenciacion antes de amplificacion por PCR para cada una de las 1116 moleculas de VJ de IGH de control de sesgo y 243 moleculas DJ de IGH de control de sesgo. Las moleculas de control de sesgo estan a lo largo del eje x. El conjunto incluye las 1116 moleculas de VJ de IGH de control de sesgo y las 243 moleculas de DJ de IGH de control de sesgo para un total de 1359 gBlocks. El eje y es el recuento de secuencias para cada gBlock individual. Este calculo proporciona la cuantificacion de la composicion de la representacion antes de amplificacion de cada pareja VJ. Este dato se usa para calcular el cambio en la frecuencia entre la muestra antes y la muestra despues de la amplificacion por PCR, para calcular el sesgo de la amplificacion introducido por los cebadores.
Oligonucleotidos molde de VJ de IgL
En otra realizacion, se generaron y analizaron oligonucleotidos molde de VJ de IgL. Se diseno un conjunto de 245 oligonucleotidos molde de formula general (I) usando secuencias de polinucleotidos de V y J de IgL humano. Cada oligonucleotido molde consistfa en una molecula de ADN de 495 pares de bases. Los oligonucleotidos molde de IgL se presentan como SEQ ID NO: 5822-6066. Los detalles para el conjunto de 245 oligonucleotidos moldes de IgL son representativos y eran los siguientes.
Basandose en secuencias genomicas previamente determinadas, se mostro que el locus de IgL humano contema 75 segmentos VL que cada uno tema una secuencia de RSS y por lo tanto se consideraron como competentes para la reordenacion. Estos 33 segmentos VL inclman segmentos genicos que se sabfa que eran expresados, 5 segmentos V que se clasificaron como que teman marcos de lectura abiertos, y 37 pseudogenes V. Los segmentos genicos VL se unieron a cinco segmentos genicos de 6 JL. Para incluir todas las posibles combinaciones de genes V+J funcionales y expresadas para los 33 segmentos V funcionales y 6 segmentos J, se disenaron 204 (6 x 33) moldes que representaban todas las posibles combinaciones de VJ expresadas. Ademas, dos de los pseudogenes V eran cuestionables; se disenaron 12 (2 x 6) moldes de VJ adicionales, dando un total de 216. Cada molde estaba conforme con la formula general (I) (5-U1-B1-V-B2-R-J-B4-U2-3') (Fig. 1) y por lo tanto, inclma 9 secciones, un adaptador universal (U1) de 19 pares de bases (pb), un marcador de nucleotidos de 16 pb que identifica de forma
5
10
15
20
25
30
35
40
45
50
55
unica cada combinacion emparejada de segmentos de gen V y gen J (B1), 300 pb de secuencia espedfica del gen V (V), un codon de parada de 3 pb (S), otra copia del marcador de nucleotidos de 16 pb (B2), un marcador de union de 6 pb compartido por todas las moleculas (R), nada para B3, 100 pb de la secuencia espedfica para el gen J (J), una tercera copia del marcador de nucleotidos de 16 pb (B4), y una secuencia adaptadora universal de 19 pb (U2).
Cada uno de los 216 moldes se amplifico individualmente usando cebadores oligonucleotidos disenados para reasociarse con las secuencias adaptadoras universales (U1, U2). Estas secuencias de oligonucleotidos pueden ser cualquier cebador universal; para esta solicitud se uso un cebador universal codificado Nextera.
La concentracion de cada producto de oligonucleotido molde amplificado se cuantifico usando un sistema de electroforesis capilar de LabChip GX™ (Caliper Life Sciences, Inc., Hopkinton, MA) de acuerdo con las instrucciones del fabricante. Las 216 preparaciones de oligonucleotidos molde amplificados se normalizaron respecto a una concentracion de referencia y despues se mezclaron.
Para verificar que los 216 oligonucleotidos moldes estaban presentes en concentraciones sustancialmente equimolares, la mezcla se secuencio usando la plataforma de secuenciacion Illumina MiSeq™ de acuerdo con las recomendaciones del fabricante. Para incorporar secuencias de oligonucleotidos espedficas de plataforma en los oligonucleotidos molde mezclados, se disenaron cebadores adaptados para reasociarse con los sitios de cebado universales (U1, U2) y que teman colas de secuencia adaptadora Illumina como los extremos 5'. Despues, se llevo a cabo una reaccion de PCR de 7 ciclos para reasociar los adaptadores de Illumina con los oligonucleotidos molde. Despues, la mezcla de productos de reaccion de la PCR se purifico usando perlas Agencourt® AMPure® XP (Beckman Coulter, Inc., Fullerton, CA) en las condiciones recomendadas por el fabricante. Los primeros 29 pb de los productos de reaccion de la PCR se secuenciaron usando un secuenciador Illumina MiSEQ™ (Illumina, Inc., San Diego, CA) y se analizaron evaluando la frecuencia de cada marcador codigo de barras de 16 pb (B1).
Se calculo que una preparacion sustancialmente equimolar para el conjunto de 216 oligonucleotidos molde distintos contema aproximadamente 0,46% de cada miembro del conjunto, y se deseaba una tolerancia umbral de mas o menos diez veces la frecuencia (0,046% - 4,6%) para todas las especies. La secuenciacion cuantitativa puso de manifiesto que las 216 especies de los oligonucleotidos molde modificados por el adaptador dentro de la mezcla inicial no estaban representados equitativamente.
Oligonucleotidos molde de VJ de IgK
En una realizacion, se generaron y analizaron oligonucleotidos molde de VJ de IgK. Se diseno un conjunto de 560 oligonucleotidos molde de formula general (I) usando secuencias de polinucleotidos de V y J de IgK humano. Cada oligonucleotido molde consistfa en una molecula de ADN de 495 pares de bases. Los ejemplos de oligonucleotidos molde de IgK se encuentran en la SEQ ID NO: 6067-6191. Los detalles para el conjunto de 560 oligonucleotidos moldes de IgK son representativos y eran los siguientes.
Basandose en secuencias genomicas previamente determinadas, se mostro que el locus de IgK humano contema 112 segmentos Vk que cada uno tema una secuencia de RSS y por lo tanto se consideraron como competentes para la reordenacion. Estos 112 segmentos Vk inclrnan 46 segmentos genicos que se sabfa que eran expresados, 8 segmentos V que se clasificaron como que teman marcos de lectura abiertos, y 50 pseudogenes V. Para esta IgK, solo se analizaron las reordenaciones de VJ de IgK expresadas. Se excluyeron los genes clasificados como pseudogenes y marcos de lectura abiertos. Los segmentos genicos Vk se unieron a 5 segmentos genicos Jk. Esto dejaba 230 reordenaciones de genes VJ (46 x 5). Para incluir todas las posibles combinaciones de genes de V+J funcionales para los 46 segmentos V y 5 segmentos J funcionales, se disenaron 230 (5 x 46) moldes que representaban todas las posibles combinaciones VJ. Cada molde estaba conforme con la formula general (I) (5'-U1- B1-V-B2-R-J-B4-U2-3')(Fig. 1) y por lo tanto, inclrna 9 secciones, un adaptador universal (U1) de 19 pares de bases (pb), un marcador de nucleotido de 16 pb que identifica de forma unica cada combinacion emparejada de segmentos de gen V y gen J (B1), 300 pb de secuencia espedfica del gen V (V), un codon de parada de 3 pb (S), otra copia del marcador de nucleotidos de 16 pb (B2), un marcador de union de 6 pb compartido por todas las moleculas (R), nada para B3, 100 pb de la secuencia espedfica para el gen J (J), una tercera copia del marcador de nucleotidos de 16 pb (B4), y una secuencia adaptadora universal de 19 pb (U2).
Cada uno de los 230 moldes se amplifico individualmente usando cebadores oligonucleotidos disenados para reasociarse con las secuencias adaptadoras universales (U1, U2). Estas secuencias de oligonucleotidos pueden ser cualquier cebador universal - para esta solicitud se uso un cebador universal codificado Nextera.
La concentracion de cada producto de oligonucleotido molde amplificado se cuantifico usando un sistema de electroforesis capilar de LabChip GX™ (Caliper Life Sciences, Inc., Hopkinton, MA) de acuerdo con las instrucciones del fabricante. Las 230 preparaciones de oligonucleotidos molde amplificados se normalizaron respecto a una concentracion de referencia y despues se mezclaron.
Para verificar que los 230 oligonucleotidos molde estaban presentes en concentraciones sustancialmente equimolares, la mezcla se secuencio usando la plataforma de secuenciacion Illumina MiSeq™ de acuerdo con las recomendaciones del fabricante. Brevemente, para incorporar secuencias de oligonucleotidos espedficas de plataforma en los oligonucleotidos molde mezclados, se disenaron cebadores adaptados para reasociarse con los
5
10
15
20
25
30
35
40
45
50
55
sitios de cebado universales (U1, U2) y que teman colas de secuencia adaptadora Illumina como los extremos 5'. Despues, se llevo a cabo una reaccion de PCR de 7 ciclos para reasociar los adaptadores de Illumina con los oligonucleotidos molde. Despues, la mezcla de productos de reaccion de la PCR se purifico usando perlas Agencourt® AMPure® XP (Beckman Coulter, Inc., Fullerton, CA) en las condiciones recomendadas por el fabricante. Los primeros 29 pb de los productos de reaccion de la PCR se secuenciaron usando un secuenciador Illumina MiSEQ™ (Illumina, Inc., San Diego, CA) y se analizaron evaluando la frecuencia de cada marcador codigo de barras de 16 pb (B1).
Se calculo que una preparacion sustancialmente equimolar para el conjunto de 230 oligonucleotidos molde distintos contema aproximadamente 0,4% de cada miembro del conjunto, y se deseaba una tolerancia umbral de mas o menos diez veces la frecuencia (4,0% - 0,04%) para todas las especies. La secuenciacion cuantitativa puso de manifiesto que las 230 especies de los oligonucleotidos molde modificados por el adaptador dentro de la mezcla inicial estaban representados equitativamente.
Ejemplo 7: Ensayos combinados. Ensayo combinado de DJ de IgH y VJ de IgH
En algunas realizaciones, se desea la coamplificacion y secuencia de cadenas de CDR3 de VDJ de IgH reordenadas y cadenas de DJ de IgH reordenadas. Se genero una mezcla de moldes para probar un ensayo combinado de DJ de IgH y VJ de IgH usando los moldes de DJ de IgH y VJ de IgH. Cuando se mezclaron, la mezcla final inclrna 1116 moldes de VJ y 243 moldes de DJ, dando un total de 1359 moldes individuales. La composicion de moldes de VJ de IgH que comprende 1116 oligonucleotidos molde distintos se describe en la lista de secuencias en las SEQ ID NO: 4085-5200. Las secuencias de los oligonucleotidos molde de DJ de IgH se presentaba en las SEQ ID NO: 5579-5821.
Para verificar que los 1359 oligonucleotidos moldes estaban presentes en concentraciones sustancialmente equimolares, la mezcla se secuencio usando la plataforma de secuenciacion Illumina MiSeq™ de acuerdo con las recomendaciones del fabricante. Para incorporar secuencias de oligonucleotidos espedficas de plataforma en los oligonucleotidos molde mezclados, se disenaron cebadores adaptados para reasociarse con los sitios de cebado universales (U1, U2) y que teman colas de secuencia adaptadora Illumina como los extremos 5'. Despues, se llevo a cabo una reaccion de PCR de 7 ciclos para reasociar los adaptadores de Illumina con los oligonucleotidos molde. Despues, la mezcla de productos de reaccion de la PCR se purifico usando perlas Agencourt® AMPure® XP (Beckman Coulter, Inc., Fullerton, CA) en las condiciones recomendadas por el fabricante. Los primeros 29 pb de los productos de reaccion de la PCR se secuenciaron usando un secuenciador Illumina MiSEQ™ (Illumina, Inc., San Diego, CA) y se analizaron evaluando la frecuencia de cada marcador codigo de barras de 16 pb (B1).
Se calculo que una preparacion sustancialmente equimolar para el conjunto de 1359 oligonucleotidos molde distintos contema aproximadamente 0,073% de cada miembro del conjunto, y se deseaba una tolerancia umbral de mas o menos diez veces la frecuencia (0,73% - 0,0073%) para todas las especies. La secuenciacion cuantitativa puso de manifiesto que las 1359 especies de los oligonucleotidos molde modificados por el adaptador dentro de la mezcla inicial estaban representados equitativamente.
Ensayo combinado de IgL e IgK
En otras realizaciones, se desea la coamplificacion y secuencia de cadenas de CDR3 reordenadas de IgL e IgK reordenadas. Se genero una mezcla de moldes para probar un ensayo combinado de IgL e IgK (se combinaron los moldes de IgL e IgK). Cuando se mezclaron, la mezcla final inclrna 216 moldes de IgL y 230 moldes de IgK, para un total de 446 moldes individuales. Los oligonucleotidos molde de IgL se presentan como SEQ ID NO: 5822-6066.
Para verificar que los 446 oligonucleotidos moldes estaban presentes en concentraciones sustancialmente equimolares, la mezcla se secuencio usando la plataforma de secuenciacion Illumina MiSeq™ de acuerdo con las recomendaciones del fabricante. Brevemente, para incorporar secuencias de oligonucleotidos espedficas de plataforma en los oligonucleotidos molde mezclados, se disenaron cebadores adaptados para reasociarse con los sitios de cebado universales (U1, U2) y que teman colas de secuencia adaptadora Illumina como los extremos 5'. Despues, se llevo a cabo una reaccion de PCR de 7 ciclos para reasociar los adaptadores de Illumina con los oligonucleotidos molde. Despues, la mezcla de productos de reaccion de la PCR se purifico usando perlas Agencourt® AMPure® XP (Beckman Coulter, Inc., Fullerton, CA) en las condiciones recomendadas por el fabricante. Los primeros 29 pb de los productos de reaccion de la PCR se secuenciaron usando un secuenciador Illumina MiSEQ™ (Illumina, Inc., San Diego, CA) y se analizaron evaluando la frecuencia de cada marcador codigo de barras de 16 pb (B1).
Se calculo que una preparacion sustancialmente equimolar para el conjunto de 446 oligonucleotidos molde distintos contema aproximadamente 0,22% de cada miembro del conjunto, y se deseaba una tolerancia umbral de mas o menos diez veces la frecuencia (2,2% - 0,022%) para todas las especies. La secuenciacion cuantitativa puso de manifiesto que las 446 especies de los oligonucleotidos molde modificados por el adaptador dentro de la mezcla inicial estaban representados equitativamente.
Ejemplo 8: Correccion de la potencial amplificacion no uniforme (sesgo de la PCR) en conjuntos de cebadores oligonucleotidos que amplifican IgH
5
10
15
20
25
30
35
40
45
50
55
60
Se disenaron diversos cebadores de amplificacion de IgH para amplificar todas las posibles combinaciones de segmentos genicos V y J de IgH reordenados en una muestra biologica que contiene ADN de celulas linfoides de un sujeto. Se uso una preparacion que contiene concentraciones equimolares de los diversos cebadores de amplificacion en la pCr multiplexada para amplificar una composicion de diversos moldes que comprenden concentraciones equimolares de oligonucleotidos molde espedficos de IgH de acuerdo con la formula (I) con al menos un molde que representa todas las posibles combinaciones de V-J para el locus de IgH. Los productos de amplificacion se secuenciaron cuantitativamente y se obtuvo la frecuencia de aparicion de cada secuencia de producto V-J unica a partir de la frecuencia de aparicion de cada secuencia de codigo de barras molecular de 16 pb (B en la formula (I)) que identificaba de forma unica cada combinacion V-J.
La reaccion de PCR multiplexada se diseno para amplificar todas las posibles reordenaciones de genes V y J del locus IgH, indicado por IMGT collaboration. Vease, Yousfi Monod M, Giudicelli V, Chaume D, Lefranc. Pf. IMGT/JunctionAnalysis: the first tool for the analysis of the immunoglobulin and T cell receptor complex V-J and V-D- J JUNCTIONs. Bioinformatics. 2004;20(suppl 1):i379-i385. El locus inclma 126 genes V unicos; 52 genes funcionales, 6 marcos de lectura abiertos putativos que caredan de aminoacidos cnticos y 69 pseudogenes; y 9 genes J, 6 funcionales y 3 pseudogenes. La secuencia diana para la reasociacion de cebadores era identica para algunos segmentos V, permitiendo la amplificacion de los 126 segmentos V con 86 cebadores directos unicos. Igualmente, 7 cebadores inversos unicos se reasociaban con los 9 genes J. Como un valor inicial para la evaluacion del sesgo, la mezcla de 1116 moldes se amplifico usando una mezcla equimolar de los 86 cebadores directos de V (VF; espedficos para los genes V) y una mezcla equimolar de los 7 cebadores inversos J (JR; espedficos para los genes J).
Las reacciones en cadena de la polimerasa (PCR) (25 pl cada una) se establecieron con mezcla de VF 2,0 pM, JR 2,0 pM (Integrated DNA Technologies), QIAGEN Multiplex Plus PCR master mix 1 pM (QIAGEN, Valencia, CA), solucion Q al 10% (QIAGEN), y 200.000 moleculas diana de la mezcla de repertorio de IgH sintetica de los autores de la invencion. Se usaron las siguientes condiciones de ciclos termicos en un ciclador termico C100 (Bio-Rad Laboratories, Hercules, CA): un ciclo a 95°C durante 6 minutos, 31 ciclos a 95°C durante 30 segundos, 64°C durante 120 segundos y 72° durante 90 segundos, seguido de un ciclo a 72°C durante 3 minutos. Para todos los experimentos, se repitio 3 veces cada una de las condiciones de la PCR.
Despues de la evaluacion del sesgo inicial, se llevaron a cabo experimentos para definir todas las caractensticas de amplificacion de cebadores individuales. Para determinar la especificidad de los cebadores de VF y JR, se prepararon 86 mezclas que conteman un solo cebador de VF con todos los cebadores de JR, y 7 mezclas que conteman un solo cebador de JR con todos los cebadores de VP. Estos conjuntos de cebadores se usaron para amplificar el molde sintetico y secuenciar las bibliotecas resultantes para medir la especificidad de cada cebador para los segmentos genicos V o J diana, y para identificar casos de cebado fuera de la diana. Se llevaron a cabo experimentos de valoracion usando mezclas de concentraciones de 2 veces y 4 veces de cada VF y JF individual dentro del contexto de todos los demas cebadores equimolares (p. ej. 2x-veces IgHV1-01+ todos los demas cebadores de VF y JR equimolares) para calcular factores de aumento de escala que relacionaban la concentracion de cebador con la frecuencia de los moldes observada.
Optimizacion de mezcla de cebadores
Usando los factores de aumento de escala obtenidos por la valoracion de cebadores uno a uno, se desarrollaron mezclas de cebadores alternativas en las que los cebadores se combinaron en concentraciones desiguales para minimizar el sesgo de la amplificacion. Las mezclas de cebadores revisadas despues se usaron para amplificar la mezcla de moldes y medir el sesgo de la amplificacion residual. Este proceso se repitio, reduciendo o aumentando cada concentracion de cebador adecuadamente basandose en si los moldes amplificados por ese cebador estaban representados por encima o por debajo de la ronda previa de resultados. En cada etapa de este proceso iterativo, el grado total de sesgo de la amplificacion se determino calculando las medidas para el intervalo dinamico (sesgo maximo/sesgo mmimo) y la suma de los cuadrados (SS, calculado como valores log(sesgo)), y repitiendo el proceso para ajustar las concentraciones de cebador hasta que habfa una mejora minima entre las iteraciones. Para evaluar la solidez de la mezcla de cebadores optimizada final y los factores de aumento de escala respecto de las desviaciones de la entrada de moldes equimolares, los autores de la invencion usaron una mezcla muy desigual de los moldes de referencia de IgH para determinar el efecto en la salida de la secuenciacion. La mezcla final era sustancialmente mejor que una mezcla equimolar.
Ejemplo 9: Correccion de la potencial amplificacion no uniforme (sesgo de la PCR) en conjuntos de cebadores oligonucleotidos que amplifican TCRB
Se disenaron diversos cebadores de amplificacion de TCRB para amplificar todas las posibles combinaciones de segmentos genicos V y J de TCRB reordenados en una muestra biologica que contiene ADN de celulas linfoides de un sujeto. Se uso una preparacion que contiene concentraciones equimolares de los diversos cebadores de amplificacion en la PCR multiplexada para amplificar una composicion de diversos moldes que comprenden concentraciones equimolares de oligonucleotidos molde espedficos de TCRB de acuerdo con la formula (I) con al menos un molde que representa todas las posibles combinaciones de V-J para el locus de TCRB. Los productos de amplificacion se secuenciaron cuantitativamente y se obtuvo la frecuencia de aparicion de cada secuencia de
5
10
15
20
25
30
35
40
45
50
55
60
producto V-J unica a partir de la frecuencia de aparicion de cada secuencia de codigo de barras molecular de 16 pb (B en la formula (I)) que identifica de forma unica cada combinacion V-J.
La reaccion de PCR multiplexada se diseno para amplificar todas las posibles reordenaciones de genes V y J del locus TCRB, comentado por la colaboracion de IMGT. Vease, Yousfi Monod M, Giudicelli V, Chaume D, Lefranc. Pf. IMGT/JunctionAnalysis: the first tool for the analysis of the immunoglobulin and T cell receptor complex V-J and V-D- J JUNCTIONs. Bioinformatics. 2004;20(suppl 1):i379-i385. El locus incluye 67 genes V unicos; La secuencia diana para la reasociacion de cebadores era identica para algunos segmentos V, permitiendo amplificar los 67 segmentos V con 60 cebadores directos unicos. Para el locus de J, 13 cebadores inversos unicos se reasociaban con 13 genes J. Como un valor inicial para la evaluacion del sesgo, la mezcla de 868 moldes se amplifico usando una mezcla equimolar de los 60 cebadores directos de V (VF; espedficos para los genes V) y una mezcla equimolar de los 13 cebadores inversos de J (JR; espedficos para los genes J). Las reacciones en cadena de la polimerasa (PCR) (25 pl cada una) se prepararon con mezcla de VF 3,0 pM, JR 3,0 pM (Integrated DNA Technologies), QIAGEN Multiplex Plus PCR master mix 1 pM (QIAGEN, Valencia, Ca), solucion Q al 10% (QIAGEN), y 200.000 moleculas diana de la mezcla de repertorio de TCRB sintetico de los autores de la invencion. Se usaron las siguientes condiciones de ciclos termicos en un ciclador termico C100 (Bio-Rad Laboratories, Hercules, CA): un ciclo a 95°C durante 5 minutos, 31 ciclos a 95°C durante 30 segundos, 62°C durante 90 segundos y 72° durante 90 segundos, seguido de un ciclo a 72°C durante 3 minutos. Para todos los experimentos, se repitio 3 veces cada una de las condiciones de la PCR.
Despues de la evaluacion del sesgo inicial, se llevaron a cabo experimentos para definir todas las caractensticas de amplificacion de cebadores individuales. Para determinar la especificidad de los cebadores de VF y JR de los autores de la invencion, se prepararon 60 mezclas que conteman un solo cebador de VF con todos los cebadores de JR, y 13 mezclas que conteman un solo cebador de JR con todos los cebadores de VF. Estos conjuntos de cebadores se usaron para amplificar el molde sintetico y secuenciar las bibliotecas resultantes para medir la especificidad de cada cebador para los segmentos genicos V o J diana, y para identificar casos de cebado fuera de la diana. Se llevaron a cabo experimentos de valoracion usando mezclas de concentraciones de 2 veces y 4 veces de cada VF y JF individual dentro del contexto de todos los demas cebadores equimolares (p. ej. 2x-veces TCRBV07-6+ todos los demas cebadores de VF y JR equimolares) para permitir calcular factores de aumento de escala que relacionaban la concentracion de cebador con la frecuencia de los moldes observada.
Optimizacion de mezcla de cebadores
Usando los factores de aumento de escala obtenidos por la valoracion de cebadores uno a uno, se desarrollaron mezclas de cebadores alternativas en las que los cebadores se combinaron en concentraciones desiguales para minimizar el sesgo de la amplificacion. Las mezclas de cebadores revisadas despues se usaron para amplificar la mezcla de moldes y medir el sesgo de la amplificacion residual. Este proceso se repitio, reduciendo o aumentando cada concentracion de cebador adecuadamente basandose en si los moldes amplificados por ese cebador estaban representados por encima o por debajo en la ronda previa de resultados. En cada etapa de este proceso iterativo, el grado total de sesgo de la amplificacion se determino calculando las medidas para el intervalo dinamico (sesgo maximo/sesgo mmimo) y la suma de los cuadrados (SS, calculado como valores log(sesgo)), y repitiendo el proceso para ajustar las concentraciones de cebador hasta que habfa una mejora minima entre las iteraciones. La mezcla final era sustancialmente mejor que una mezcla equimolar de cebadores.
La Fig. 11 muestra las iteraciones de TCRB-cebador para los moldes de VJ de TCRB sinteticos frente al sesgo de amplificacion relativo. El sesgo de amplificacion relativo se determino para 858 moldes de VJ de TCRB sinteticos antes de la correccion de control del sesgo qmmico (cebadores equimolares (negro)), correccion post-qmmica (cebadores optimizados (gris oscuro)), y correccion post-qmmica y computacional (despues de ajuste computacional (gris claro)). Los cebadores equimolares teman un intervalo dinamico de 264, un recorrido intercuartflico de 0,841, y una suma de cuadrados (log sesgo) de 132. Los cebadores optimizados teman un intervalo dinamico de 147, un recorrido intercuartflico de 0,581, y una suma de cuadrados (log sesgo) de 50,7. Los cebadores corregidos (despues de ajuste computacional) teman un intervalo dinamico de 90,8, un recorrido intercuartflico de 0,248, y una suma de cuadrados (log sesgo) de 12,8.
Ejemplo 10: Correccion del potencial de amplificacion no uniforme (sesgo de PCR) en un conjunto de cebadores oligonucleotidos que amplifican VJ y DJ de IgH combinados
Se disenaron diversos cebadores de amplificacion de IgH para amplificar todas las posibles combinaciones de segmentos genicos V y J de IgH reordenados y segmentos genicos D y J de IgH en una muestra biologica que contema ADN de celulas linfoides de un sujeto. Se uso una preparacion que contema concentraciones equimolares de diversos cebadores de amplificacion en PCR multiplexada para amplificar una composicion de moldes diversos que comprende concentraciones equimolares de oligonucleotidos molde espedficos de IgH de acuerdo con la formula (I) con al menos un molde que representa todas las posibles combinaciones de V-J para el locus de IgH y todas las posibles combinaciones de D-J para el locus de IgH. Los productos de amplificacion se secuenciaron cuantitativamente y se obtuvo la frecuencia de aparicion de cada secuencia de producto V-J y D-J unica a partir de la frecuencia de aparicion de cada secuencia de codigo de barras molecular de 16 pb (B en la formula (I)) que identifica de forma unica cada combinacion V-J y D-J.
5
10
15
20
25
30
35
40
45
50
55
60
La reaccion de PCR multiplexada se diseno para amplificar todas las posibles reordenaciones de genes V y J y reordenaciones de genes D y J del locus de IgH, como ha senalado la IMGT collaboration. El locus inclma 126 genes V unicos; 52 genes funcionales, 6 marcos de lectura abiertos putativos que caredan de aminoacidos cnticos y 69 pseudogenes; y 9 genes J, 6 funcionales y 3 pseudogenes. El locus tambien inclma 27 genes D unicos. La secuencia diana para la reasociacion de cebadores era identica para algunos segmentos V, permitiendo la amplificacion de los 126 segmentos V con 86 cebadores directos unicos. Igualmente, 7 cebadores inversos unicos se reasociaban con los 9 genes J. Para el ensayo de D-J, se disenaron cebadores para reasociarse con las estirpes de -DJ reordenadas. Durante el desarrollo de linfocitos B, ambos alelos sufren reordenacion entre los segmentos genicos D y J, dando dos estirpes de -DJ. Una estirpe de -DJ incluye un gen J, una region N y un gen D. Despues de las reordenaciones DJ, uno de los dos alelos del gen V se reordena con la estirpe -DJ para codificar la region del gen de CDR3 (VnDnJ). Para amplificar la estirpe -DJ, se disenaron 27 cebadores unicos para reasociarse con cada gen D espedfico en una region intronica en la direccion 5' del exon del gen D. Estos segmentos, aunque estan presentes en las estirpes -DJ, son escindidos despues de la recombinacion de V con -DJ. Sin embargo, no se redisenaron cebadores de J; El ensayo de DJ usaba los mismos cebadores de J que el ensayo de VJ.
Como un valor inicial para la evaluacion del sesgo, se amplifico una mezcla de 1359 moldes usando una meezcla (mix 2-1) optimizada de 86 cebadores directos de V (VF; espedficos para genes V), 27 cebadores inversos de D (DF; espedficos para los genes D) y una mezcla equimolar de los 7 cebadores inversos J (JR; espedficos para los genes J). Las reacciones en cadena de la polimerasa (PCR) (25 jl cada una) se prepararon con mezcla de VF 1,0 |jM, DF 1,0 jM y JR 2,0 jM (Integrated DNA Technologies), 1 X QiAGEN Multiplex Plus PCR master mix (QIAGEN, Valencia, cA), solucion Q al 10% (QIAGEN), y 200.000 moleculas diana de la mezcla de repertorio de vJ y DJ de IgH sintetica de los autores de la invencion. Se usaron las siguientes condiciones de ciclos termicos en un ciclador termico C100 (Bio-Rad Laboratories, Hercules, CA): un ciclo a 95°C durante 6 minutos, 31 ciclos a 95°C durante 30 segundos, 64°C durante 120 segundos y 72° durante 90 segundos, seguido de un ciclo a 72°C durante 3 minutos. Para todos los experimentos, se repitio 3 veces cada una de las condiciones de la PCR.
Despues de la evaluacion del sesgo inicial, se llevaron a cabo experimentos para definir todas las caractensticas de amplificacion de cebadores individuales. Para determinar la especificidad de los cebadores de DF y JR de los autores de la invencion, se prepararon 27 mezclas que conteman un solo cebador de DF con todos los cebadores de JR y la mezcla de VF previamente identificada optimizada, y 7 mezclas que conteman un solo cebador de JR con todos los cebadores de VF y DF. Estos conjuntos de cebadores se usaron para amplificar el molde sintetico y secuenciar las bibliotecas resultantes para medir la especificidad de cada cebador para los segmentos genicos V, D o J diana, y para identificar casos de cebado fuera de la diana.
Se llevaron a cabo experimentos de valoracion usando mezclas de concentraciones de 2 veces y 4 veces de cada DF o JF individual, dentro del contexto de todos los demas cebadores, incluyendo la mezcla optimizada de cebadores de VF (p. ej. 2x-veces IgHD2-08 + todos los demas cebadores de DF, mezcla optima de VF y JR equimolares) para permitir calcular los factores de aumento de escala que relacionan la concentracion de cebador con la frecuencia del molde observada.
Optimizacion de mezcla de cebadores
Usando el ensayo de amplificacion cruzada, se identificaron cebadores de DF como amplificados cruzados. Se eliminaron 12 de los cebadores de DF, dando una mezcla final de 15 cebadores de DF. Usando los factores de aumento de escala obtenidos por la valoracion de cebadores uno a uno, se desarrollaron mezclas de cebadores alternativas en las que los cebadores se combinaron en concentraciones desiguales para minimizar el sesgo de la amplificacion. Las mezclas de cebadores revisadas despues se usaron para amplificar la mezcla de moldes y medir el sesgo de la amplificacion residual. Este proceso se repitio, reduciendo o aumentando cada concentracion de cebador adecuadamente basandose en si los moldes amplificados por ese cebador estaban representados por encima o por debajo en la ronda previa de resultados. En cada etapa de este proceso iterativo, el grado total de sesgo de la amplificacion se determino calculando las medidas para el intervalo dinamico (sesgo maximo/sesgo mmimo) y la suma de los cuadrados (SS, calculado como valores log(sesgo)), y repitiendo el proceso para ajustar las concentraciones de cebador hasta que habfa una mejora minima entre las iteraciones. La mezcla de cebadores final tiene sustancialmente menos sesgo de cebadores que una mezcla de cebadores equimolar.
La Fig. 12 muestra las iteraciones de cebador de IGH para los moldes de VJ de IGH sinteticos frente al sesgo de amplificacion relativo. El sesgo de amplificacion relativo se determino para 1116 moldes de VJ de IgH sinteticos respecto al sesgo de amplificacion antes de la correccion de control del sesgo qmmico (cebadores equimolares (negro)), correccion post-qmmica (cebadores optimizados (gris oscuro)), y correccion post-qmmica y computacional (despues de ajuste computacional (gris claro)). Los cebadores equimolares teman un intervalo dinamico de 1130, un recorrido intercuartflico de 0,991, y una suma de cuadrados (log sesgo) de 233. Los cebadores optimizados teman un intervalo dinamico de 129, un recorrido intercuartflico de 0,732, y una suma de cuadrados (log sesgo) de 88,2. Los cebadores despues de ajuste computacional teman un intervalo dinamico de 76,9, un recorrido intercuartflico de 0,545, y una suma de cuadrados (log sesgo) de 37,9.
La Fig. 13 muestra el sesgo de amplificacion relativo para 27 moldes sinteticos de DJ de IGH del gen de V. El sesgo de amplificacion relativo del segmento genico V se muestra en tres iteraciones de cebador: 1) antes de la correccion
5
10
15
20
25
30
35
40
45
50
de control de sesgo qmmica (negro), 2) una primera iteracion de correccion qmmica (blanco), y 3) una segunda iteracion de correccion qmmica posterior (gris claro).
EJEMPLO 11: Iteraciones de cebadores de VJ de TCRG
En otras realizaciones, se ensayo el sesgo de amplificacion relativo de los cebadores de VJ de TCRG en multiples iteraciones. Las Figs. 14a-d muestran las iteraciones TCRG-cebador para 55 moldes sinteticos de VJ de TCRG. El sesgo de amplificacion relativo se determino para los cebadores de VJ de TCRG antes de la correccion de control del sesgo qmmico (Fig. 14a), una primera iteracion de la correccion qmmica (Fig. 14b), una segunda iteracion de la correccion qmmica (Fig. 14c), e iteracion final de correccion qmmica (Fig. 14d).
EJEMPLO 12: Control de sesgo alternativo y metodo de enriquecimiento
En otras realizaciones, se pueden usar metodos alternativos para determinacion el sesgo de la amplificacion. Dos principales objetivos del metodo son como sigue: (1) eliminar el sesgo de la amplificacion en una amplificacion por PCR multiplexada de genes de TCR o BCR y (2) calcular la fraccion de linfocitos B o T en el molde inicial.
El metodo incluye empezar con un conjunto de celulas que comprenden ADN o ADNc (ARNm) extrafdas de una muestra que incluye linfocitos B y/o T. En una muestra que comprende celulas, se extrae el ADN usando metodos convencionales en la tecnica.
El ADN extrafdo se divide en multiples partes y se pone en diferentes pocillos de PCR. En algunas realizaciones, se usa un pocillo a plena capacidad o se pueden usar miles de pocillos. En una realizacion se usan 188 pocillos para la PCR (2 placas de 96 pocillos). El numero de moldes de TCR o BCR por pocillo debe ser escaso, de modo que sea raro tener multiples moleculas del mismo clonotipo en el mismo pocillo.
Despues el metodo incluye amplificar el ADN por separado en cada pocillo usando el mismo conjunto de cebadores multiplexados. Se pueden usar los conjuntos de cebadores descritos en la presente memoria. Como se ha descrito antes, se aplica el metodo del codigo de barras para amplificar moleculas en cada pocillo con la misma secuencia de codigo de barras. Por ejemplo, cada pocillo consigue su propio codigo de barras.
Despues las moleculas se secuencian en una maquina secuenciadora de alta capacidad con una cantidad suficiente de secuencias de BCR o TCR amplificadas para identificar por secuencia la cadena V y la J usada, asf como la secuencia de codigo de barras.
Cada pocillo tiene un recuento de copias medio. Puesto que cada clonotipo aparece una vez en un pocillo, la cantidad de ese molde con respecto a la media es el sesgo para esa combinacion V-J. Puesto que el sesgo de V y J son independientes, no son necesarias todas las combinaciones V-J para determinar el sesgo. Estos sesgos relativos despues se usan para redisenar los cebadores que amplifican en mucha menor o mayor cantidad, o para valorar la concentracion de cebador para aumentar o disminuir la amplificacion. Se repite el procedimiento entero con un nuevo lote de cebador y se repite para continuar disminuyendo el sesgo.
Despues de cualquier ciclo de las iteraciones, se puede aplicar un conjunto de factores computacionales (los factores de amplificacion relativos) para eliminar el sesgo. El sesgo se puede reducir tanto por (o por cualquiera de) cambios de cebadores como por correccion computacional.
El metodo incluye calcular una fraccion de celulas nucleadas de un ensayo similar. Para cada pocillo, se identifica cada clonotipo, y se determina el numero de lecturas de secuenciacion para cada clon. En algunas realizaciones, no es necesario que el numero de moldes sea escaso. Los recuentos de lecturas para cada clon se corrigen con los factores de control de sesgo como se ha descrito antes.
Se crea un histograma de los recuentos de lecturas corregidos, y la grafica tiene un modo principal (el factor de amplificacion). Este modo se identifica por inspeccion (basandose en la identificacion del primer pico grande), o por transformada de Fourier, u otros metodos conocidos.
El numero total de lecturas corregidas en cada pocillo se divide entre el factor de amplificacion para ese pocillo. Este el el numero calculado de moldes de genoma de TCR o BCR que estaban en el pocillo. El numero total de BCR o TCR de la muestra es la suma del numero de todos los pocillos. El numero total de genomas en cada pocillo se mide antes de la PCR. Esto se puede hacer por metodos de nanogotas u otros metodos conocidos usados para cuantificar ADN. El peso medido del ADN se divide entre el peso de un genoma bicatenario (por ejemplo, en seres humanos ~6,2 picogramos).
La fraccion de linfocitos B o linfocitos T en la muestra es el numero total de BCR o TCR en las muestras divididas entre el numero total de moleculas de ADN bicatenarias anadidas a la reaccion. El resultado necesita una correccion menor ya que una fraccion pequena de linfocitos T tiene ambos alelos reordenados. Este factor de correccion es aproximadamente 15% para linfocitos T alfa beta, 10% para linfocitos B. Para linfocitos T gamma delta, casi todas las celulas tienen ambos alelos reordenados, de modo que la correccion es un factor de dos.

Claims (17)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    1. Una composicion para la normalization de la eficacia de la amplification de un conjunto de cebadores oligonucleotidos para amplificar secuencias de acidos nucleicos reordenadas que codifican uno o mas receptores del sistema inmunitario adaptativo en una muestra biologica obtenida de celulas linfoides de un sujeto mamlfero, comprendiendo cada receptor del sistema inmunitario adaptativo una region variable y una region de union, comprendiendo la composicion:
    una pluralidad de oligonucleotidos molde sinteticos, teniendo cada oligonucleotido molde sintetico una concentration conocida antes de la amplificacion y una secuencia de oligonucleotido de una formula general:
    5'-U1 -B1-V-B2-R-B3-J-B4-U2-3' (I)
    en donde:
    (a) V es una secuencia de oligonucleotido que comprende al menos 20 y como maximo 1000 nucleotidos contiguos de una region variable (V) de receptor del sistema inmunitario adaptativo, o su complementario, y comprendiendo cada V una secuencia de oligonucleotido de region V unica;
    (b) J es una secuencia de oligonucleotido que comprende al menos 15 y como maximo 600 nucleotidos contiguos de una region de union (J) de receptor del sistema inmunitario adaptativo, o su complementario, y comprendiendo cada J una secuencia de oligonucleotido de region J unica;
    (c) U1 es nada o comprende una secuencia de oligonucleotido que se selecciona de (i) una primera secuencia de oligonucleotido adaptador universal, y (ii) una primera secuencia de oligonucleotido especlfico de plataforma de secuenciacion, que esta unida a y situada 5' respecto a una primera secuencia de oligonucleotido adaptador universal;
    (d) U2 es nada o comprende una secuencia de oligonucleotido que se selecciona de (i) una segunda secuencia de oligonucleotido adaptador universal, y (ii) una segunda secuencia de oligonucleotido especlfico de plataforma de secuenciacion, que esta unida a y situada 5' respecto a una segunda secuencia de oligonucleotido adaptador universal;
    (e) esta presente al menos uno de B1, B2, B3 y B4 y cada uno de B1, B2, B3 y B4 comprende un oligonucleotido que comprende una secuencia de codigo de barras de 3-25 nucleotidos contiguos que identifica de forma unica, como una combination emparejada, (i) la secuencia de oligonucleotido de la region V unica de (a), y (ii) la secuencia de oligonucleotido de la region J unica de (b);
    (f) R es nada o comprende un sitio de reconocimiento de enzima de restriction que comprende una secuencia de oligonucleotido que esta ausente de (a)-(e),
    y en donde:
    (g) la pluralidad de oligonucleotidos molde sinteticos comprende una serie de al menos a o al menos b secuencias de oligonucleotidos unicas, la que sea mayor, en donde a es el numero de segmentos genicos que codifican la region V de receptor del sistema inmunitario adaptativo unica en el sujeto y b es el numero de segmentos genicos que codifican la region J de receptor del sistema inmunitario adaptativo unica en el sujeto.
    y la composicion comprende al menos un oligonucleotido molde sintetico para la secuencia de oligonucleotido de region V unica y al menos un oligonucleotido molde sintetico para cada secuencia de oligonucleotido de region J unica.
  2. 2. La composicion de la reivindicacion 1, en donde:
    (a) a esta en el intervalo de 1 a un numero maximo de segmentos genicos V en el genoma de mamlfero del sujeto;
    (b) b esta en el intervalo de 1 a un numero maximo de segmentos genicos J en el genoma de mamlfero del sujeto; y/o
    (c) a es 1 o b es 1.
  3. 3. La composicion de la reivindicacion 1, en donde la pluralidad de oligonucleotidos molde comprende al menos (a x b) secuencias de oligonucleotidos unicas, donde a es el numero de segmentos genicos que codifican la region V de receptor del sistema inmunitario adaptativo unica en el sujeto mamlfero, y b es el numero de segmentos genicos unicos que codifican la region J de receptor del sistema inmunitario adaptativo unica en el sujeto mamlfero, y la composicion comprende al menos un oligonucleotido molde para cada posible combinacion de un segmento genico que codifica la region V y un segmento genico que codifica la region J.
  4. 4. La composicion segun una cualquiera de las reivindicaciones 1-3, en donde:
    5
    10
    15
    20
    25
    30
    35
    40
    45
    (a) J comprende una secuencia de oligonucleotido que comprende una region constante de la secuencia genica que codifica la region J de receptor del sistema inmunitario adaptativo;
    (b) el receptor del sistema inmunitario adaptativo se selecciona del grupo que consiste en TCRB, TCRG, TCRA, TCRD, IGH, IGK y IGL;
    (c) la secuencia del oligonucleotido V de (a) codifica un polipeptido de la region V del receptor TCRB, TCRG, TCRA, TCRD, IGH, IGK o IGL;
    (d) la secuencia del oligonucleotido J de (b) codifica un polipeptido de la region J del receptor TCRB, TCRG, TCRA, TCRD, IGH, IGK o IGL;
    (e) la composicion comprende ademas una secuencia de codon de parada entre V y B2;
    (f) cada oligonucleotido molde sintetico en la pluralidad de oligonucleotidos molde sinteticos esta presente en una cantidad equimolar;
    (g) la pluralidad de oligonucleotidos molde sinteticos tiene una pluralidad de secuencias de formula general (I) que se selecciona de:
    (1) la pluralidad de secuencias de oligonucleotido de formula general (I) en las que las secuencias de
    oligonucleotidos V y J tienen las secuencias V y J de TCRB expuestas en al menos un conjunto de 68 SEQ ID NO de V y J de TCRB en las figuras 5a-5l como conjunto 1 de V/J de TCRB, conjunto 2 de V/J de TCRB, conjunto 3 de V/J de TCRB, conjunto 4 de V/J de TCRB, conjunto 5 de V/J de TCRB, conjunto 6 de V/J de TCRB, conjunto 7 de V/J de TCRB, conjunto 8 de V/J de TCRB, conjunto 9 de V/J de TCRB, conjunto 10 de V/J de TCRB, conjunto 11 de
    V/J de TCRB, conjunto 12 de V/J de TCRB y conjunto 13 de V/J de TCRB;
    (2) la pluralidad de secuencias de oligonucleotidos de formula general (I) en las que las secuencias de oligonucleotidos V y J tienen las secuencias de V y J de TCRG expuestas en al menos un conjunto de 14 SEQ ID NO de V y J de TCRG en las figuras 6a y 6b como conjunto 1 de V/J de TCRG, conjunto 2 de V/J de TCRG, conjunto 3 de V/J de TCRG, conjunto 4 de V/J de TCRG y conjunto 5 de V/J de TCRG;
    (3) la pluralidad de secuencias de oligonucleotidos de formula general (I) en las que las secuencias de
    oligonucleotidos V y J tienen las secuencias de V y J de IGH expuestas en al menos un conjunto de 127 SEQ ID NO de V y J de IGH en las figuras 7a-7m como conjunto 1 de V/J de IGH, conjunto 2 de V/J de IGH, conjunto 3 de V/J
    de IGH, conjunto 4 de V/J de IGH, conjunto 5 de V/J de IGH, conjunto 6 de V/J de IGH, conjunto 7 de V/J de IGH,
    conjunto 8 de V/J de IGH y conjunto 9 de V/J de IGH;
    (4) la pluralidad de secuencias de oligonucleotidos de formula general (I) como se exponen en las SEQ ID NO: 31574014;
    (5) la pluralidad de secuencias de oligonucleotidos de formula general (I) como se exponen en las SEQ ID NO: 40154084;
    (6) pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 4085-5200;
    (7) la pluralidad de secuencias de oligonucleotidos de formula general (I) como se exponen en las SEQ ID NO: 55795821;
    (8) pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 5822-6066; y
    (9) pluralidad de secuencias de oligonucleotidos de formula general (I) expuestas en las SEQ ID NO: 6067-6191;
    (h) V es una secuencia de oligonucleotido que comprende al menos 30, 60, 90, 120, 150, 180 o 210 nucleotidos contiguos de la secuencia genica que codifica la region V de receptor del sistema inmunitario adaptativo, o su complementario;
    (i) V es una secuencia de oligonucleotido que comprende como maximo 900, 800, 700, 600 o 500 nucleotidos contiguos de una secuencia genica que codifica la region V de receptor del sistema inmunitario adaptativo, o su complementario.
    (j) J es una secuencia de oligonucleotido que comprende al menos 16-30, 31-60, 61-90, 91-120 o 120-150 nucleotidos contiguos de una secuencia genica que codifica la region J de receptor del sistema inmunitario adaptativo, o su complementario.
    (k) J es una secuencia de oligonucleotido que comprende como maximo 500, 400, 300 o 200 nucleotidos contiguos de una secuencia genica que codifica la region J de receptor del sistema inmunitario adaptativo, o su complementario. y/o
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    (i) cada oligonucleotido molde sintetico es menor que 1000, 900, 800, 700, 600, 500, 400, 300 o 200 nucleotidos de longitud.
  5. 5. La composicion segun una cualquiera de las reivindicaciones 1-4, en donde una secuencia de polinucleotido aleatoria de al menos 2 nucleotidos contiguos esta situada de la direccion 5' y/o la direccion 3' de una secuencia de codigo de barras.
  6. 6. La composicion segun una cualquiera de las reivindicaciones 1-5, que ademas comprende: un conjunto de cebadores oligonucleotidos que es capaz de amplificar moleculas de acido nucleico reordenadas que codifican uno o mas receptores del sistema inmunitario adaptativo, que comprende una pluralidad a' de cebadores oligonucleotidos de segmento V unico y una pluralidad b’ de cebadores oligonucleotidos de segmento J unico, opcionalmente en donde a' esta en el intervalo de 1 a un numero de segmentos genicos V maximo en el genoma del mairnfero, y b’ esta en el intervalo de 1 a una serie de numero maximo de segmentos genicos J en el genoma de marnffero, preferiblemente en donde a’ es a o b’ es b.
  7. 7. La composicion segun la reivindicacion 6, en donde:
    (a) cada cebador oligonucleotido de segmento V y cada cebador oligonucleotido de segmento J en el conjunto de cebadores oligonucleotidos, es capaz de hibridar espedficamente con al menos un oligonucleotido molde en una pluralidad de oligonucleotidos molde;
    (b) cada cebador oligonucleotido de segmento V comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region V de receptor del sistema inmunitario adaptativo;
    (c) cada cebador oligonucleotido de segmento J comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region J de receptor del sistema inmunitario adaptativo; y/o
    (d) la composicion comprende al menos un oligonucleotido molde sintetico que tiene una secuencia de oligonucleotido de formula general (I) con la que puede hibridar espedficamente cada cebador oligonucleotido de segmento V, y al menos un oligonucleotido molde que tiene una secuencia de oligonucleotido de formula general (I) con la que puede hibridar espedficamente cada cebador oligonucleotido de segmento J.
  8. 8. Un metodo para determinar el potencial de amplificacion de acido nucleico no uniforme entre miembros de un conjunto de cebadores oligonucleotidos, que es capaz de amplificar moleculas de acido nucleico reordenadas que codifican uno o mas receptores del sistema inmunitario adaptativo en una muestra biologica que comprende moleculas de acido nucleico reordenadas obtenidas de celulas linfoides de un sujeto marnffero, comprendiendo el metodo:
    (a) amplificar la composicion que comprende dicha pluralidad de oligonucleotidos molde sinteticos y dicho conjunto de cebadores oligonucleotidos segun la reivindicacion 6 o 7, en una reaccion de PCR multiplexada, para obtener una pluralidad de oligonucleotidos molde sinteticos amplificados;
    (b) secuenciar dicha pluralidad de oligonucleotidos molde sinteticos amplificados para determinar, para cada oligonucleotido molde sintetico unico que comprende dicha pluralidad, (i) una secuencia de oligonucleotido molde sintetico y (ii) una frecuencia de aparicion de dicha secuencia de oligonucleotido molde sintetica; y
    (c) comparar una frecuencia de aparicion de cada una de dichas secuencias de oligonucleotido molde sinteticas con una distribucion esperada, en donde dicha distribucion esperada se basa en relaciones molares predeterminadas de dicha pluralidad de oligonucleotidos molde sinteticos que comprende dicha composicion, y en donde una desviacion entre dicha frecuencia de aparicion de dichas secuencias de oligonucleotidos molde sinteticas y dicha distribucion esperada indica una potencial de amplificacion de acidos nucleicos no uniforme entre miembros del conjunto de cebadores oligonucleotidos de amplificacion.
  9. 9. El metodo de la reivindicacion 8, en donde:
    (a) dichas relaciones molares predeterminadas son equimolares, opcionalmente en donde dicha distribucion esperada comprende un nivel de amplificacion uniforme para dicho conjunto de oligonucleotidos molde amplificados por dicho conjunto de cebadores oligonucleotidos; o
    (b) cada molecula de acido nucleico molde sintetica amplificada tiene menos de 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 90, 80 o 70 nucleotidos de longitud.
  10. 10. El metodo segun la reivindicacion 8 o 9, en donde:
    (a) el metodo comprende ademas: para cada miembro del conjunto de cebadores oligonucleotidos que presentan potencial amplificacion no uniforme con respecto a la distribucion esperada, ajustar la representacion relativa del
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    miembro cebador oligonucleotido en el conjunto de cebadores oligonucleotidos de amplificacion, opcionalmente en donde el ajuste comprende
    (i) aumentar la representacion relativa del miembro en el conjunto de cebadores oligonucleotidos, corrigiendo asf la potencial amplificacion de acido nucleico no uniforme entre miembros del conjunto de cebadores oligonucleotidos, o
    (ii) disminuir la representacion relativa del miembro en el conjunto de cebadores oligonucleotidos, corrigiendo asf la potencial amplificacion de acido nucleico no uniforme entre miembros del conjunto de cebadores oligonucleotidos;
    (b) dicho conjunto de cebadores oligonucleotidos no incluye cebadores oligonucleotidos que hibridan espedficamente con un pseudogen u orfon de la region V, o con un pseudogen u orfon de la region J; y/o
    (c) el metodo comprende ademas: para cada miembro del conjunto de los cebadores oligonucleotidos de amplificacion que presenta potencial amplificacion no uniforme con respecto a la distribucion esperada, calcular una frecuencia proporcionalmente mayor o menor de aparicion de las moleculas de acido nucleico molde amplificadas, cuya amplificacion es promovida por dicho miembro, corrigiendo asf la potencial amplificacion de acido nucleico no uniforme entre miembros del conjunto de cebadores oligonucleotidos.
  11. 11. Un metodo para cuantificar una pluralidad de moleculas de acido nucleico reordenadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo en una muestra biologica, que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto mairnfero, comprendiendo cada receptor del sistema inmunitario adaptativo una region variable (V) y una region de union (J), comprendiendo el metodo:
    (A) amplificar moleculas de acido nucleico reordenadas en una sola reaccion en cadena de la polimerasa (PCR) multiplexada, que comprende:
    (1) moleculas de acido nucleico reordenadas obtenidas de la muestra biologica que comprende celulas linfoides del sujeto mamffero,
    (2) la composicion que comprende dicha pluralidad de oligonucleotidos molde sinteticos y dicho conjunto de cebadores oligonucleotidos segun la reivindicacion 6 o 7, en donde esta presente un numero conocido de cada uno de la pluralidad de oligonucleotidos molde que tienen una secuencia de oligonucleotidos unica,
    (3) un conjunto de cebadores oligonucleotidos de amplificacion que es capaz de amplificar moleculas de acido nucleico reordenadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo de la muestra biologica, comprendiendo el conjunto de cebadores:
    (a) en cantidades sustancialmente equimolares, una pluralidad de cebadores oligonucleotidos de segmento V que son capaces, cada uno independientemente, de hibridar espedficamente con al menos un polinucleotido que codifica un polipeptido de la region V del receptor del sistema inmunitario adaptativo o con su complementario, en donde cada cebador del segmento V comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region V del receptor del sistema inmunitario adaptativo funcional, y en donde la pluralidad de cebadores del segmento V hibrida espedficamente sustancialmente con todos los segmentos genicos que codifican la region V del receptor del sistema inmunitario adaptativo que estan presentes en la composicion, y
    (b) en cantidades sustancialmente equimolares, una pluralidad de cebadores oligonucleotidos de segmento J que son capaces, cada uno independientemente, de hibridar espedficamente con al menos un polinucleotido que codifica un polipeptido de la region J de receptor del sistema inmunitario adaptativo o con su complementario, en donde cada cebador del segmento J comprende una secuencia de nucleotidos de al menos 15 nucleotidos contiguos que es complementaria de al menos un segmento genico que codifica la region J de receptor del sistema inmunitario adaptativo funcional, y en donde la pluralidad de cebadores del segmento J hibrida espedficamente sustancialmente con todos los segmentos genicos que codifican la region J de receptor del sistema inmunitario adaptativo que estan presentes en la composicion,
    en donde los cebadores oligonucleotidos del segmento V y el segmento J son capaces de amplificar en dicha una reaccion en cadena de la polimerasa (PCR) multiplexada de (i) sustancialmente todos los oligonucleotidos molde sinteticos en la composicion para producir una multiplicidad de oligonucleotidos molde sinteticos amplificados, siendo suficiente dicha multiplicidad de moleculas de acido nucleico molde sinteticas amplificadas para cuantificar la diversidad de los oligonucleotidos molde sinteticos en la composicion, y (ii) sustancialmente todas las moleculas de acido nucleico reordenadas que codifican receptores del sistema inmunitario adaptativo en la muestra biologica, para producir una multiplicidad de moleculas de ADN reordenadas amplificadas, siendo suficiente dicha multiplicidad de moleculas de acido nucleico reordenadas amplificadas para cuantificar la diversidad de moleculas de acido nucleico reordenadas en el ADN de la muestra biologica,
    y en donde, cada molecula de acido nucleico amplificada en la pluralidad de oligonucleotidos molde sinteticos amplificados y en la pluralidad de moleculas de acido nucleico reordenadas amplificadas es de menos de 1000 nucleotidos de longitud;
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    (B) secuenciar cuantitativamente dichos oligonucleotidos molde sinteticos y dichas moleculas de acido nucleico reordenadas amplificadas para cuantificar (i) un numero de productos molde de oligonucleotidos molde sinteticos amplificados que contienen al menos una secuencia de oligonucleotido de codigo de barras, y (ii) un numero de productos reordenados de moleculas de acido nucleico reordenadas amplificadas que carecen de una secuencia de oligonucleotido de codigo de barras;
    (C) calcular un factor de amplificacion dividiendo el numero de productos molde de (B)(i) entre el numero conocido de cada uno de la pluralidad de oligonucleotidos molde sinteticos que tienen una secuencia de oligonucleotido unica de (A)(2); y
    (D) dividir el numero de productos reordenados de (B)(ii) entre el factor de amplificacion calculado en (C) para cuantificar el numero de moleculas de acido nucleico reordenadas que codifican receptores del sistema inmunitario adaptativo unicas en la muestra.
  12. 12. El metodo de la reivindicacion 11, en donde dicho numero cuantificado de moleculas de acido nucleico reordenadas unicas que codifican receptores del sistema inmunitario adaptativo en la muestra, es el numero de moldes de genoma de linfocitos B unicos o linfocitos T unicos en la muestra.
  13. 13. Un metodo para calcular un factor de amplificacion medio en un ensayo de PCR multiplexado, que comprende:
    obtener una muestra que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto marnffero;
    poner en contacto dicha muestra con dicha composicion que comprende dicha pluralidad de oligonucleotidos molde sinteticos y dicho conjunto de cebadores oligonucleotidos segun las reivindicaciones 6 o 7;
    amplificar la pluralidad de oligonucleotidos molde sinteticos y las moleculas de acido nucleico reordenadas usando dicha pluralidad de cebadores oligonucleotidos de segmento V y dicha pluralidad de cebadores oligonucleotidos de segmento J en una sola reaccion de PCR multiplexada para obtener una pluralidad de oligonucleotidos molde sinteticos amplificados y una pluralidad de moleculas de acido nucleico reordenadas amplificadas;
    secuenciar dicha pluralidad de oligonucleotidos molde sinteticos amplificados para determinar, para cada oligonucleotido molde sintetico unico que comprende dicha pluralidad, (i) una secuencia de oligonucleotido molde sintetico y (ii) una frecuencia de aparicion de dicha secuencia de oligonucleotido molde sintetica; y
    determinar dicho factor de amplificacion medio para dicha una sola reaccion de PCR multiplexada basada en el numero medio de copias de cada uno de dicha pluralidad de oligonucleotidos molde sinteticos amplificados y dicha cantidad conocida de dichos oligonucleotidos molde sinteticos.
  14. 14. El metodo de la reivindicacion 13, en donde:
    (a) el metodo comprende ademas:
    secuenciar dicha pluralidad de moleculas de acido nucleico reordenadas amplificadas para determinar para cada molecula de acido nucleico reordenada unica que comprende dicha pluralidad, i) una secuencia de la molecula de acido nucleico reordenada, y (ii) una serie de apariciones de dicha secuencia de molecula de acido nucleico reordenada; y
    determinar el numero de celulas linfoides en dicha muestra, basado en el factor de amplificacion medio para dicha una sola reaccion de PCR multiplexada y dicho numero de apariciones de dichas moleculas de acido nucleico reordenadas, opcionalmente en donde determinar el numero de celulas linfoides en dicha muestra comprende generar una suma del numero de apariciones de cada una de dichas secuencias de acido nucleico reordenadas amplificadas y dividir dicha suma entre dicho factor de amplificacion medio; o
    (b) dicha cantidad conocida es una copia de cada uno de los oligonucleotidos molde, opcionalmente 100 < a < 500 o 100 < b < 500.
  15. 15. Un metodo para corregir el sesgo de amplificacion en una sola reaccion de amplificacion por PCR multiplexada para cuantificar moleculas de acido nucleico reordenadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo en una muestra biologica que comprende moleculas de acido nucleico reordenadas, obtenidas de celulas linfoides de un sujeto mamffero, que comprende:
    (a) poner en contacto dicha muestra con una composicion que comprende dicha pluralidad de oligonucleotidos molde sinteticos y dicho conjunto de cebadores oligonucleotidos de la reivindicacion 6 o 7, para generar una muestra enriquecida en moldes, en donde dicha pluralidad de oligonucleotidos molde sinteticos y dichas moleculas de acido nucleico reordenadas comprenden las secuencias de region V y J correspondientes;
    (b) amplificar dicha muestra enriquecida en moldes en dicha una sola reaccion de PCR multiplexada usando dicho conjunto de cebadores oligonucleotidos que comprende dichos cebadores oligonucleotidos de segmento V y
    5
    10
    15
    20
    25
    30
    35
    40
    segmento J, para obtener una pluralidad de oligonucleotidos molde sinteticos amplificados y una pluralidad de moleculas de acido nucleico reordenadas amplificadas que codifican una pluralidad de receptores del sistema inmunitario adaptativo;
    (c) secuenciar dicha pluralidad de oligonucleotidos molde sinteticos amplificados para determinar, para cada oligonucleotido molde unico que comprende dicha pluralidad, (i) una secuencia de oligonucleotido molde sintetico y (ii) una frecuencia de aparicion de dicha secuencia de oligonucleotido molde sintetica;
    (d) secuenciar dicha pluralidad de moleculas de acido nucleico reordenadas amplificadas que codifican uno o una pluralidad de receptores del sistema inmunitario adaptativo, para cada una de las moleculas de acido nucleico reordenadas unicas que codifican dicha pluralidad de receptores del sistema inmunitario adaptativo que comprenden dicha pluralidad, (i) una secuencia de molecula de acido nucleico reordenada y (ii) una frecuencia de aparicion de dicha secuencia de molecula de acido nucleico reordenada;
    (e) comparar dicha frecuencia de aparicion de dichas secuencias de oligonucleotidos molde sinteticas con una distribucion esperada, en donde dicha distribucion esperada se basa en relaciones molares predeterminadas de dicha pluralidad de oligonucleotidos molde sinteticos que comprende dicha composicion, y en donde una desviacion entre dicha frecuencia de aparicion de dichas secuencias de oligonucleotidos molde sinteticas y dicha distribucion esperada indica una potencial amplificacion de acidos nucleicos no uniforme entre miembros del conjunto de cebadores oligonucleotidos;
    (f) generar un conjunto de valores de correccion para un conjunto de secuencias de oligonucleotidos molde sinteticas y secuencias de moleculas de acido nucleico reordenadas amplificadas por dichos miembros del conjunto de cebadores oligonucleotidos que tienen dicho potencial de amplificacion de acidos nucleicos no uniforme indicado, en donde dicho conjunto de valores de correccion corrige el sesgo de la amplificacion en dicha reaccion de PCR multiplexada; y
    (g) opcionalmente aplicar dicho conjunto de valores de correccion a dicha frecuencia de aparicion de dichas secuencias de moleculas de acido nucleico reordenadas para corregir el sesgo de la amplificacion en dicha reaccion de PCR multiplexada.
  16. 16. Un kit, que comprende:
    reactivos que comprenden: una composicion que comprende dicha pluralidad de oligonucleotidos molde sinteticos y dicho conjunto de cebadores oligonucleotidos segun la reivindicacion 6 o 7;
    instrucciones para determinar un potencial de amplificacion de acidos nucleicos no uniforme entre miembros del conjunto de cebadores oligonucleotidos que son capaces de amplificar moleculas de acido nucleico reordenadas que codifican uno o mas receptores del sistema inmunitario adaptativo en una muestra biologica que comprende moleculas de acido nucleico reordenadas de celulas linfoides de un sujeto mairnfero, opcionalmente en donde el kit comprende ademas instrucciones para la correccion de uno o mas miembros del conjunto de cebadores oligonucleotidos que tienen una potencial amplificacion de acido nucleico no uniforme, o instrucciones para cuantificar el numero de moleculas de acido nucleico reordenadas que codifican el receptor del sistema inmunitario adaptativo en la muestra.
  17. 17. Un kit, que comprende:
    reactivos que comprenden una composicion que comprende dicha pluralidad de oligonucleotidos molde sinteticos segun la reivindicacion 6 o 7, y un conjunto de cebadores oligonucleotidos proporcionados en cantidades que se han corregido para la potencial amplificacion de acido nucleico no uniforme; e
    instrucciones para usar dicha pluralidad de oligonucleotidos molde sinteticos y conjunto de cebadores oligonucleotidos para amplificar una pluralidad de moldes biologicos reordenados.
ES13722968.8T 2012-05-08 2013-05-08 Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas Active ES2582554T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261644294P 2012-05-08 2012-05-08
US201261644294P 2012-05-08
US201261726489P 2012-11-14 2012-11-14
US201261726489P 2012-11-14
PCT/US2013/040221 WO2013169957A1 (en) 2012-05-08 2013-05-08 Compositions and method for measuring and calibrating amplification bias in multiplexed pcr reactions

Publications (1)

Publication Number Publication Date
ES2582554T3 true ES2582554T3 (es) 2016-09-13

Family

ID=48444646

Family Applications (2)

Application Number Title Priority Date Filing Date
ES13722968.8T Active ES2582554T3 (es) 2012-05-08 2013-05-08 Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas
ES16165939T Active ES2711156T3 (es) 2012-05-08 2013-05-08 Método para medir y calibrar el sesgo de amplificación en reacciones de PCR multiplexadas

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES16165939T Active ES2711156T3 (es) 2012-05-08 2013-05-08 Método para medir y calibrar el sesgo de amplificación en reacciones de PCR multiplexadas

Country Status (21)

Country Link
US (4) US9150905B2 (es)
EP (2) EP2831276B1 (es)
JP (2) JP5756247B1 (es)
KR (1) KR101621643B1 (es)
CN (2) CN104520440B (es)
AU (2) AU2013259544B9 (es)
BR (1) BR112014027309A2 (es)
CA (1) CA2872468C (es)
CY (1) CY1117899T1 (es)
DK (1) DK2831276T3 (es)
ES (2) ES2582554T3 (es)
HK (1) HK1206789A1 (es)
HU (1) HUE029357T2 (es)
IL (1) IL235417A0 (es)
MX (1) MX354329B (es)
PL (1) PL2831276T3 (es)
PT (1) PT2831276T (es)
RU (1) RU2631797C2 (es)
SG (2) SG11201407107VA (es)
UA (1) UA115783C2 (es)
WO (1) WO2013169957A1 (es)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
CA2742380C (en) 2008-11-07 2018-05-29 Sequenta, Inc. Methods of monitoring conditions by sequence analysis
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US8685898B2 (en) 2009-01-15 2014-04-01 Imdaptive, Inc. Adaptive immunity profiling and methods for generation of monoclonal antibodies
RU2014144463A (ru) 2009-06-25 2015-06-20 Фред Хатчинсон Кансэр Рисёч Сентер Способ измерения адаптивного иммунитета
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
EP2768982A4 (en) 2011-10-21 2015-06-03 Adaptive Biotechnologies Corp QUANTIFICATION OF ADAPTIVE IMMUNOCELL GENOMES IN A COMPLEX MIX OF CELLS
CA2858070C (en) 2011-12-09 2018-07-10 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
GB2513024B (en) 2012-02-27 2016-08-31 Cellular Res Inc A clonal amplification method
US10077478B2 (en) 2012-03-05 2018-09-18 Adaptive Biotechnologies Corp. Determining paired immune receptor chains from frequency matched subunits
JP5756247B1 (ja) * 2012-05-08 2015-07-29 アダプティブ バイオテクノロジーズ コーポレイション マルチプレックスpcr反応における増幅バイアスを測定し校正する組成物及び方法
AU2013327423B2 (en) 2012-10-01 2017-06-22 Adaptive Biotechnologies Corporation Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
ES2857908T3 (es) 2013-08-28 2021-09-29 Becton Dickinson Co Análisis masivamente paralelo de células individuales
CN106103711A (zh) 2013-11-21 2016-11-09 组库创世纪株式会社 T细胞受体和b细胞受体库分析系统及其在治疗和诊断中的应用
US20170292149A1 (en) 2014-03-05 2017-10-12 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
MX2016011817A (es) * 2014-03-14 2017-05-12 Immunocore Ltd Bibliotecas de tcr.
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
ES2777529T3 (es) 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
CN105331680B (zh) * 2014-08-15 2018-09-14 深圳华大基因科技有限公司 确定可变区扩增引物是否存在偏向性的方法和装置及其应用
EP3715455A1 (en) 2014-10-29 2020-09-30 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
EP3498866A1 (en) 2014-11-25 2019-06-19 Adaptive Biotechnologies Corp. Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
US11047008B2 (en) 2015-02-24 2021-06-29 Adaptive Biotechnologies Corporation Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
CN107208158B (zh) 2015-02-27 2022-01-28 贝克顿迪金森公司 空间上可寻址的分子条形编码
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
EP3277294A4 (en) 2015-04-01 2018-11-14 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target
CN107580632B (zh) 2015-04-23 2021-12-28 贝克顿迪金森公司 用于全转录组扩增的方法和组合物
WO2016196229A1 (en) 2015-06-01 2016-12-08 Cellular Research, Inc. Methods for rna quantification
CN108026524A (zh) 2015-09-11 2018-05-11 赛卢拉研究公司 用于核酸文库标准化的方法和组合物
GB201516277D0 (en) 2015-09-15 2015-10-28 Adaptimmune Ltd And Immunocore Ltd TCR libraries
GB201516272D0 (en) 2015-09-15 2015-10-28 Adaptimmune Ltd And Immunocore Ltd TCR Libraries
ES2956757T3 (es) * 2016-05-02 2023-12-27 Becton Dickinson Co Codificación con códigos de barras moleculares precisa
CA3023248A1 (en) 2016-05-06 2017-11-09 Regents Of The University Of Minnesota Analytical standards and methods of using same
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
CN106047857B (zh) * 2016-06-01 2020-04-03 苏州金唯智生物科技有限公司 一种发掘特异性功能抗体的方法
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
EP3516400B1 (en) 2016-09-26 2023-08-16 Becton, Dickinson and Company Measurement of protein expression using reagents with barcoded oligonucleotide sequences
CN107955831A (zh) * 2016-10-13 2018-04-24 深圳华大基因研究院 用于淋巴细胞定量检测的标记物和淋巴细胞定量检测方法
IL266197B2 (en) 2016-10-24 2024-03-01 Geneinfosec Inc Hiding information contained within nucleic acids
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
CN109136346A (zh) * 2017-06-16 2019-01-04 深圳华大基因股份有限公司 一种提高免疫组库多重pcr建库质量的方法及其应用
CN107312863A (zh) * 2017-08-08 2017-11-03 深圳华大基因研究院 利用数字PCR鉴定B淋巴细胞的Ig基因分布的方法
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
WO2019126209A1 (en) 2017-12-19 2019-06-27 Cellular Research, Inc. Particles associated with oligonucleotides
WO2019161031A1 (en) * 2018-02-15 2019-08-22 Papgene, Inc. Barcoded molecular standards
EP3788170A1 (en) 2018-05-03 2021-03-10 Becton, Dickinson and Company Molecular barcoding on opposite transcript ends
US11773441B2 (en) 2018-05-03 2023-10-03 Becton, Dickinson And Company High throughput multiomics sample analysis
WO2020072380A1 (en) 2018-10-01 2020-04-09 Cellular Research, Inc. Determining 5' transcript sequences
JP2022506546A (ja) 2018-11-08 2022-01-17 ベクトン・ディキンソン・アンド・カンパニー ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
WO2020150356A1 (en) 2019-01-16 2020-07-23 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
ES2945227T3 (es) 2019-01-23 2023-06-29 Becton Dickinson Co Oligonucleótidos asociados con anticuerpos
WO2021016239A1 (en) 2019-07-22 2021-01-28 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
CN111139286B (zh) * 2019-11-07 2023-11-21 南方医科大学南方医院 一种bcr高通量测序文库的构建方法
JP2023500679A (ja) 2019-11-08 2023-01-10 ベクトン・ディキンソン・アンド・カンパニー 免疫レパートリーシーケンシングのための完全長v(d)j情報を得るためのランダムプライミングの使用
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
US11365411B2 (en) * 2020-01-21 2022-06-21 Microsoft Technology Licensing, Llc Efficient random access to DNA-encoded data
EP4150118A1 (en) 2020-05-14 2023-03-22 Becton Dickinson and Company Primers for immune repertoire profiling
CN111850016B (zh) * 2020-07-06 2022-04-26 深圳泛因医学有限公司 免疫组库标准物质序列及其设计方法和应用
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
CN112322716B (zh) * 2020-11-25 2021-07-30 深圳泛因医学有限公司 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置
WO2023245165A1 (en) * 2022-06-17 2023-12-21 Insitro, Inc. In situ sequencing of rna transcripts with non-uniform 5' ends
WO2024064736A1 (en) * 2022-09-20 2024-03-28 New England Biolabs, Inc. Methods for characterizing an immune response repertoire
CN115976221B (zh) * 2023-03-21 2023-05-23 迈杰转化医学研究(苏州)有限公司 一种用于bcr或tcr重排定量检测的内掺参考物及其制备方法和应用

Family Cites Families (381)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3270960A (en) 1964-09-11 1966-09-06 Sperry Rand Corp Fluid sensor
US3773919A (en) 1969-10-23 1973-11-20 Du Pont Polylactide-drug mixtures
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
DE3211263A1 (de) 1981-03-31 1983-01-27 Otsuka Pharmaceutical Co. Ltd., Tokyo Human-interferon verwandte peptide, antigene und antikoerper, sowie verfahren zu deren herstellung
DE3238353A1 (de) 1982-10-15 1984-04-19 Max Planck Gesellschaft zur Förderung der Wissenschaften e.V., 3400 Göttingen Verfahren zur simultanen quantitativen bestimmung der blutzellen und reagenz hierfuer
US5189147A (en) 1984-06-13 1993-02-23 Massachusetts Institute Of Technology Meterodimeric T lymphocyte receptor antibody
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
DE3541033A1 (de) 1985-11-19 1987-05-21 Boehringer Mannheim Gmbh Verfahren zur quantifizierung von zellpopulationen bzw. subpopulationen sowie hierfuer geeignetes reagenz
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5149625A (en) 1987-08-11 1992-09-22 President And Fellows Of Harvard College Multiplex analysis of DNA
US4942124A (en) 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
US5667967A (en) 1990-05-01 1997-09-16 The Board Of Trustees Of The Leland Stanford Junior University T-cell receptor varible transcripts as disease related markers
US6031091A (en) 1987-09-21 2000-02-29 Gen-Probe Incorporated Non-nucleotide linking reagents for nucleotide probes
US5506126A (en) 1988-02-25 1996-04-09 The General Hospital Corporation Rapid immunoselection cloning method
US5168038A (en) 1988-06-17 1992-12-01 The Board Of Trustees Of The Leland Stanford Junior University In situ transcription in cells and tissues
JP2781438B2 (ja) 1988-10-20 1998-07-30 モーリィ,アリグザンダー,アラン 白血病及びリンパ腫におけるモノクローナリテイーの診断法
US5075217A (en) 1989-04-21 1991-12-24 Marshfield Clinic Length polymorphisms in (dC-dA)n ·(dG-dT)n sequences
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5231012A (en) 1989-06-28 1993-07-27 Schering Corporation Nucleic acids encoding cytokine synthesis inhibitory factor (interleukin-10)
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5298396A (en) 1989-11-15 1994-03-29 National Jewish Center For Immunology And Respiratory Medicine Method for identifying T cells disease involved in autoimmune disease
US5336598A (en) 1989-11-15 1994-08-09 National Jewish Center For Immunology And Respiratory Medicine Method for diagnosing a superantigen caused pathologial condition via assay of T-cells
US6054034A (en) 1990-02-28 2000-04-25 Aclara Biosciences, Inc. Acrylic microchannels and their use in electrophoretic applications
US5126022A (en) 1990-02-28 1992-06-30 Soane Tecnologies, Inc. Method and device for moving molecules by the application of a plurality of electrical fields
US6916605B1 (en) 1990-07-10 2005-07-12 Medical Research Council Methods for producing members of specific binding pairs
GB9015198D0 (en) 1990-07-10 1990-08-29 Brien Caroline J O Binding substance
CA2090126C (en) 1990-08-02 2002-10-22 John W. Schrader Methods for the production of proteins with a desired function
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
IE76732B1 (en) 1990-08-07 1997-11-05 Becton Dickinson Co One step test for absolute counts
US5699798A (en) 1990-08-10 1997-12-23 University Of Washington Method for optically imaging solid tumor tissue
US5635354A (en) 1991-01-09 1997-06-03 Institut National De La Sante Et De La Recherche Medicale (Inserm) Method for describing the repertoires of antibodies (Ab) and of T-cell receptors (TcR) of an individual's immune system
US5364759B2 (en) 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
IE920447A1 (en) 1991-02-12 1992-08-12 Roussel Uclaf NUCLEOTIDE SEQUENCES CODING FOR ß-CHAIN VARIABLE REGIONS OF¹HUMAN T-LYMPHOCYTE RECEPTORS, CORRESPONDING PEPTIDE SEGMENTS¹AND DIAGNOSTIC AND THERAPEUTIC APPLICATIONS
JP3080178B2 (ja) 1991-02-18 2000-08-21 東洋紡績株式会社 核酸配列の増幅方法およびそのための試薬キット
US6091000A (en) 1991-03-15 2000-07-18 Duke University SCID mouse engrafted with human synovium tissue
JP3266311B2 (ja) 1991-05-02 2002-03-18 生化学工業株式会社 新規ポリペプチドおよびこれを用いる抗hiv剤
US20040018489A1 (en) 1991-09-09 2004-01-29 Ma Wupo Detection of RNA
US5674679A (en) 1991-09-27 1997-10-07 Amersham Life Science, Inc. DNA cycle sequencing
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5213960A (en) 1992-03-09 1993-05-25 Tanox Biosystems, Inc. Methods for selecting low frequency antigen-specific single B lymphocytes
US5256542A (en) 1992-03-09 1993-10-26 Tanox Biosystems, Inc. Selecting low frequency antigen-specific single B lymphocytes with correction for background noise
US5837447A (en) 1992-04-15 1998-11-17 Blood Center Research Foundation, Inc., The Monitoring an immune response by analysis of amplified immunoglobulin or T-cell-receptor nucleic acid
US5498392A (en) 1992-05-01 1996-03-12 Trustees Of The University Of Pennsylvania Mesoscale polynucleotide amplification device and method
US5587128A (en) 1992-05-01 1996-12-24 The Trustees Of The University Of Pennsylvania Mesoscale polynucleotide amplification devices
WO1993022461A1 (en) 1992-05-06 1993-11-11 Gen-Probe Incorporated Nucleic acid sequence amplification method, composition and kit
US5981176A (en) 1992-06-17 1999-11-09 City Of Hope Method of detecting and discriminating between nucleic acid sequences
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
CA2177988A1 (en) 1993-12-03 1995-06-08 Kazuo Higuchi Expression vector for preparing an anti-body-variable-region library
WO1995028481A1 (en) 1994-04-18 1995-10-26 New York Society For The Ruptured And Crippled Maintaining The Hospital For Special Surgery Conserved t-cell receptor sequences
US6001229A (en) 1994-08-01 1999-12-14 Lockheed Martin Energy Systems, Inc. Apparatus and method for performing microfluidic manipulations for chemical analysis
US6090592A (en) 1994-08-03 2000-07-18 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid on supports
FR2724182B1 (fr) 1994-09-02 1996-12-13 Pasteur Institut Obtention d'un anticorps monoclonal recombinant a partir d'un anticorps monoclonal humain anti-rhesus d, sa production en cellules d'insecte, et ses utilisations
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5776737A (en) 1994-12-22 1998-07-07 Visible Genetics Inc. Method and composition for internal identification of samples
US6919434B1 (en) 1995-02-20 2005-07-19 Sankyo Co., Ltd. Monoclonal antibodies that bind OCIF
US5698396A (en) 1995-06-07 1997-12-16 Ludwig Institute For Cancer Research Method for identifying auto-immunoreactive substances from a subject
WO1997013868A1 (en) 1995-10-11 1997-04-17 Leonard Adleman Large scale dna sequencing by position sensitive hybridization
WO1997013877A1 (en) 1995-10-12 1997-04-17 Lynx Therapeutics, Inc. Measurement of gene expression profiles in toxicity determination
US5742598A (en) 1995-10-19 1998-04-21 International Business Machines Corp. Network for efficiently locating resources and routing service requests received from individual node connections
US6087096A (en) 1995-11-13 2000-07-11 Dau; Peter C. Method of intrafamily fragment analysis of the T cell receptor α and β chain CDR3 regions
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US20020076725A1 (en) 1996-03-13 2002-06-20 Tomoko Toyosaki-Maeda Human t cell clone specific for rheumatoid arthritis
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
US6300065B1 (en) 1996-05-31 2001-10-09 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
US6699658B1 (en) 1996-05-31 2004-03-02 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
EP0910668A4 (en) 1996-06-03 2003-02-19 Univ Alberta METHOD FOR DETECTING REASSEMBLED DNA
ES2243393T3 (es) 1996-06-04 2005-12-01 University Of Utah Research Foundation Monitorizacion de la hibridacion durante la pcr.
AU3878697A (en) 1996-06-20 1998-02-02 Cornell Research Foundation Inc. Identification of abnormalities in the expression of t and cell antigen receptors as indicators of disease diagnosis, prognosis and therapeutic predictors
US6074827A (en) 1996-07-30 2000-06-13 Aclara Biosciences, Inc. Microfluidic method for nucleic acid purification and processing
DK0937251T3 (da) 1996-09-06 2007-02-19 Ortho Mcneil Pharm Inc Oprensning af antigenspecifikke T-celler
US6255071B1 (en) 1996-09-20 2001-07-03 Cold Spring Harbor Laboratory Mammalian viral vectors and their uses
WO1998015644A2 (en) 1996-09-27 1998-04-16 The Chinese University Of Hong Kong Parallel polynucleotide sequencing method
US6207371B1 (en) 1996-10-04 2001-03-27 Lexicon Genetics Incorporated Indexed library of cells containing genomic modifications and methods of making and utilizing the same
US6136566A (en) 1996-10-04 2000-10-24 Lexicon Graphics Incorporated Indexed library of cells containing genomic modifications and methods of making and utilizing the same
US6228589B1 (en) 1996-10-11 2001-05-08 Lynx Therapeutics, Inc. Measurement of gene expression profiles in toxicity determination
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
ATE545710T1 (de) 1997-04-01 2012-03-15 Illumina Cambridge Ltd Verfahren zur vervielfältigung von nukleinsäuren
US6143496A (en) 1997-04-17 2000-11-07 Cytonix Corporation Method of sampling, amplifying and quantifying segment of nucleic acid, polymerase chain reaction assembly having nanoliter-sized sample chambers, and method of filling assembly
GB2342094B (en) 1997-07-07 2002-10-23 Medical Res Council In vitro sorting method
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
US7572582B2 (en) 1997-09-12 2009-08-11 Exiqon A/S Oligonucleotide analogues
JP2001520377A (ja) 1997-10-15 2001-10-30 アクレイラ バイオサイエンシズ,インコーポレイティド 積層状マイクロ構造式装置および積層状マイクロ構造式装置製造方法
AU753732B2 (en) 1997-10-23 2002-10-24 Genzyme Corporation Methods for detecting contamination in molecular diagnostics using PCR
US7351578B2 (en) 1999-12-10 2008-04-01 Invitrogen Corp. Use of multiple recombination sites with unique specificity in recombinational cloning
US6210910B1 (en) 1998-03-02 2001-04-03 Trustees Of Tufts College Optical fiber biosensor array comprising cell populations confined to microcavities
JP4262799B2 (ja) 1998-04-16 2009-05-13 平田機工株式会社 生タイヤ供給方法
DE19833738A1 (de) 1998-07-27 2000-02-03 Michael Giesing Verfahren zur Isolierung von Krebszellen aus zellhaltigen Körperflüssigkeiten sowie Sets zur Durchführung dieses Verfahrens
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
DE19844931C1 (de) 1998-09-30 2000-06-15 Stefan Seeger Verfahren zur DNS- oder RNS-Sequenzierung
US6541608B1 (en) 1999-02-23 2003-04-01 Baylor College Of Medicine T cell receptor Vβ-Dβ-Jβ sequence and methods for its detection
US6307024B1 (en) 1999-03-09 2001-10-23 Zymogenetics, Inc. Cytokine zalpha11 Ligand
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
KR20020047132A (ko) 1999-08-24 2002-06-21 메다렉스, 인코포레이티드 인간 씨티엘에이-4 항체 및 그의 용도
US20040209314A1 (en) 1999-09-06 2004-10-21 Institut National De La Sante Et De La Recherche Medicale France Means for detection and purification of CD8+ T lymphocyte populations specific to peptides presented in the context of HLA
US6235483B1 (en) 2000-01-31 2001-05-22 Agilent Technologies, Inc. Methods and kits for indirect labeling of nucleic acids
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US20040121364A1 (en) 2000-02-07 2004-06-24 Mark Chee Multiplex nucleic acid reactions
CA2404568A1 (en) 2000-03-31 2001-10-11 University Of Southern California Epigenetic sequences for esophageal adenocarcinoma
AUPQ687600A0 (en) 2000-04-13 2000-05-11 Flinders Technologies Pty Ltd A method of detection
US20030207300A1 (en) 2000-04-28 2003-11-06 Matray Tracy J. Multiplex analytical platform using molecular tags
US6596492B2 (en) 2000-07-11 2003-07-22 Colorado State University Research Foundation PCR materials and methods useful to detect canine and feline lymphoid malignancies
US7567870B1 (en) 2000-07-31 2009-07-28 Institute For Systems Biology Multiparameter analysis for predictive medicine
CN1468250A (zh) * 2000-08-03 2004-01-14 ��ķһ����˹��̹ 在转基因动物中产生人源化抗体
US6939451B2 (en) 2000-09-19 2005-09-06 Aclara Biosciences, Inc. Microfluidic chip having integrated electrodes
CA2426824A1 (en) 2000-10-24 2002-07-25 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic dna
US6778724B2 (en) 2000-11-28 2004-08-17 The Regents Of The University Of California Optical switching and sorting of biological samples and microparticles transported in a micro-fluidic device, including integrated bio-chip devices
US6947748B2 (en) 2000-12-15 2005-09-20 Adaptix, Inc. OFDMA with adaptive subcarrier-cluster configuration and selective loading
EP1362093B1 (en) 2001-02-20 2010-11-17 University Of Georgia Research Foundation, Inc. Rapid production of monoclonal antibodies
US6969597B2 (en) 2001-02-21 2005-11-29 Clontech Laboratories, Inc. Nucleic acids encoding non aggregating fluorescent proteins and methods for using the same
US7265208B2 (en) 2001-05-01 2007-09-04 The Regents Of The University Of California Fusion molecules and treatment of IgE-mediated allergic diseases
WO2002094009A2 (en) 2001-05-24 2002-11-28 Guard Inc. Methods for selecting and producing animals having a predicted level of immune response
US20050260570A1 (en) 2001-05-29 2005-11-24 Mao Jen-I Sequencing by proxy
US7026121B1 (en) 2001-06-08 2006-04-11 Expression Diagnostics, Inc. Methods and compositions for diagnosing and monitoring transplant rejection
US6720144B1 (en) 2001-06-21 2004-04-13 Quest Diagnostics Detection of clonal T-cell receptor-γ gene rearrangement by PCR/temporal temperature gradient gel electrophoresis (TTGE)
AU2002313683A1 (en) 2001-07-15 2003-03-03 Keck Graduate Institute Nucleic acid amplification using nicking agents
US20030096277A1 (en) 2001-08-30 2003-05-22 Xiangning Chen Allele specific PCR for genotyping
PT1421115E (pt) 2001-08-31 2005-07-29 Avidex Ltd Receptor de celulas t soluvel
US7432084B2 (en) 2001-08-31 2008-10-07 Rosetta Inpharmatics Llc Methods for preparing nucleic acid samples
DK1436404T3 (da) 2001-09-19 2010-03-08 Alexion Pharma Inc Manipulerede templates og deres anvendelse i single-primer amplifikation
US6964850B2 (en) 2001-11-09 2005-11-15 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
GB2382137A (en) 2001-11-20 2003-05-21 Mats Gullberg Nucleic acid enrichment
GB0128153D0 (en) 2001-11-23 2002-01-16 Bayer Ag Profiling of the immune gene repertoire
WO2003052101A1 (en) 2001-12-14 2003-06-26 Rosetta Inpharmatics, Inc. Sample tracking using molecular barcodes
GB0130267D0 (en) 2001-12-19 2002-02-06 Neutec Pharma Plc Focussed antibody technology
AU2003207528A1 (en) 2002-01-09 2003-07-30 Maxx Genetech Co. Ltd Method of detecting t-cell proliferation for diagnosis of diseases by gene array
AUPS028002A0 (en) 2002-02-01 2002-02-28 Ausman Engineering And Associates Pty Ltd A bearing assembly
US7323306B2 (en) 2002-04-01 2008-01-29 Brookhaven Science Associates, Llc Genome signature tags
US7157274B2 (en) 2002-06-24 2007-01-02 Cytonome, Inc. Method and apparatus for sorting particles
US20030228617A1 (en) 2002-05-16 2003-12-11 Vanderbilt University Method for predicting autoimmune diseases
AU2003247129A1 (en) 2002-07-01 2004-01-19 Centre National De La Recherche Scientifique (Cnrs) System, method, device, and computer program product for extraction, gathering, manipulation, and analysis of peak data from an automated sequencer
AU2003281336A1 (en) 2002-07-03 2004-01-23 Institute For Scientific Research, Inc. Compositions and methods for the detection of human t cell receptor variable family gene expression
CA2800113C (en) 2002-07-12 2015-02-03 The Johns Hopkins University Reagents and methods for engaging unique clonotypic lymphocyte receptors
US7476519B2 (en) 2002-07-19 2009-01-13 Joseph Monforte Strategies for gene expression analysis
US7157228B2 (en) 2002-09-09 2007-01-02 Bioarray Solutions Ltd. Genetic analysis and authentication
US7459273B2 (en) 2002-10-04 2008-12-02 Affymetrix, Inc. Methods for genotyping selected polymorphism
ES2438782T3 (es) 2002-10-11 2014-01-20 Erasmus Universiteit Rotterdam Cebadores de amplificación de ácidos nucleicos para estudios de clonalidad basados en PCR del gen TCR-beta
CA2501873A1 (en) 2002-10-11 2004-04-22 The Regents Of The University Of California A method for diagnosis and prognosis of multiple sclerosis
US20060147925A1 (en) 2002-11-13 2006-07-06 Morley Alexander A Method of detection
EP1566635B1 (en) 2002-11-14 2011-12-07 Vivalis Microwell array chip for detecting antigen-specific lymphocyte, method of detecting antigen-specific lymphocyte and method of cloning antigen-specific lymphocyte antigen receptor gene
JP2006512927A (ja) 2002-12-11 2006-04-20 コーリー ファーマシューティカル グループ,インコーポレイテッド 5’cpg核酸およびその使用方法
WO2004063706A2 (en) 2003-01-08 2004-07-29 Maxx Genetech Co., Ltd. Method of detecting over-expression of t-cell receptor genes by real-time pcr
DE602004024034D1 (de) 2003-01-29 2009-12-24 454 Corp Nukleinsäureamplifikation auf basis von kügelchenemulsion
GB0304068D0 (en) 2003-02-22 2003-03-26 Avidex Ltd Substances
US20070042349A1 (en) 2003-04-24 2007-02-22 Ogle Brenda M Methods for assessing biologic diversity
AU2003902299A0 (en) 2003-05-13 2003-05-29 Flinders Medical Centre A method of analysing a marker nucleic acid molecule
WO2005020784A2 (en) 2003-05-23 2005-03-10 Mount Sinai School Of Medicine Of New York University Surrogate cell gene expression signatures for evaluating the physical state of a subject
US20050010030A1 (en) 2003-07-02 2005-01-13 Zang Jingwu Z. T cell receptor CDR3 sequence and methods for detecting and treating rheumatoid arthritis
EP2918595B1 (en) 2003-07-05 2019-12-11 The Johns-Hopkins University Method and compositions for detection and enumeration of genetic variations
TW200510723A (en) 2003-07-15 2005-03-16 Bioarray Solutions Ltd Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis
US20060228350A1 (en) 2003-08-18 2006-10-12 Medimmune, Inc. Framework-shuffling of antibodies
US20050048498A1 (en) 2003-08-29 2005-03-03 Applera Corporation Compositions, methods, and kits for assembling probes
WO2005026686A2 (en) 2003-09-09 2005-03-24 Compass Genetics, Llc Multiplexed analytical platform
TWI333977B (en) 2003-09-18 2010-12-01 Symphogen As Method for linking sequences of interest
FR2863274B1 (fr) 2003-12-05 2012-11-16 Commissariat Energie Atomique Procede d'evaluation quantitative d'un rearrangement ou d'une recombinaison genetique ciblee d'un individu et ses applications.
WO2005053603A2 (en) 2003-12-08 2005-06-16 Yeda Research And Development Co. Ltd. Antigen receptor variable region typing
WO2005059176A1 (en) 2003-12-15 2005-06-30 Institut Pasteur Repertoire determination of a lymphocyte b population
ATE421998T1 (de) 2003-12-15 2009-02-15 Pasteur Institut Ermittlung des repertoires von b-lymphozyten populationen
US20080166718A1 (en) 2003-12-15 2008-07-10 Institut Pasteur Repertoire determination of a lymphocyte B population
EP1721014B1 (en) 2004-02-18 2013-07-17 Trustees Of Boston University Method for detecting and quantifying rare mutations/polymorphisms
US20060046258A1 (en) 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
US20070161001A1 (en) 2004-03-04 2007-07-12 Dena Leshkowitz Quantifying and profiling antibody and t cell receptor gene expression
JP4480423B2 (ja) 2004-03-08 2010-06-16 独立行政法人科学技術振興機構 免疫細胞クローンの拡大の有無の判定方法
DE102004016437A1 (de) 2004-04-04 2005-10-20 Oligene Gmbh Verfahren zur Erkennung von Signaturen in komplexen Genexpressionsprofilen
WO2005111242A2 (en) 2004-05-10 2005-11-24 Parallele Bioscience, Inc. Digital profiling of polynucleotide populations
WO2006076025A2 (en) 2004-05-14 2006-07-20 Amaox, Inc. Immune cell biosensors and methods of using same
EP1598429A1 (en) 2004-05-19 2005-11-23 Amplion Ltd. Detection of amplicon contamination during PCR exhibiting two different annealing temperatures
GB0412973D0 (en) 2004-06-10 2004-07-14 Celltech R&D Ltd Identification of antibody producing cells
US20060020397A1 (en) 2004-07-21 2006-01-26 Kermani Bahram G Methods for nucleic acid and polypeptide similarity search employing content addressable memories
CN101087890A (zh) 2004-07-26 2007-12-12 帕拉列勒生物科学公司 多个基因组的同时分析
US7820382B2 (en) 2004-08-03 2010-10-26 Bauer A Robert Method for the early detection of breast cancer, lung cancer, pancreatic cancer and colon polyps, growths and cancers as well as other gastrointestinal disease conditions and the preoperative and postoperative monitoring of transplanted organs from the donor and in the recipient and their associated conditions related and unrelated to the organ transplantation
US20060094018A1 (en) 2004-08-03 2006-05-04 Bauer A R Jr Discovery and a method for the early detection of pancreatic cancer and other disease conditions
ES2344793T3 (es) 2004-08-05 2010-09-07 Genentech, Inc. Antagonistas anti-cmet humanizados.
WO2006031221A1 (en) 2004-09-13 2006-03-23 Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Compositions comprising t cell receptors and methods of use thereof
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
AU2005302425A1 (en) 2004-10-29 2006-05-11 Benaroya Research Institute At Virginia Mason Methods of generating antigen-specific CD4+CD25+ regulatory T cells, compositions and methods of use
US7966988B2 (en) 2005-01-11 2011-06-28 Exxonmobil Research And Engineering Company Method for controlling soot induced lubricant viscosity increase
US8029783B2 (en) 2005-02-02 2011-10-04 Genentech, Inc. DR5 antibodies and articles of manufacture containing same
FR2881436B1 (fr) 2005-02-03 2007-04-27 Commissariat Energie Atomique Procede de determination de la diversite des lymphocytes t dans un echantillon biologique
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
MX2007009911A (es) 2005-02-16 2008-02-20 Wyeth Corp Metodos y sistemas para el diagnostico, pronostico y seleccion del tratamiento de la leucemia.
US7537894B2 (en) 2005-03-02 2009-05-26 The University Of Chicago Methods and kits for monitoring Barrett's metaplasia
WO2006099164A2 (en) 2005-03-10 2006-09-21 Applera Corporation Methods for multiplex amplification
EP1856293A2 (en) 2005-03-16 2007-11-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
CA2604095A1 (en) 2005-04-12 2006-10-19 454 Life Sciences Corporation Methods for determining sequence variants using ultra-deep sequencing
WO2006116155A2 (en) 2005-04-21 2006-11-02 The Regents Of The University Of California A method for diagnosis and prognosis of multiple sclerosis subtypes
US20060263789A1 (en) 2005-05-19 2006-11-23 Robert Kincaid Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using
US7208795B2 (en) 2005-05-24 2007-04-24 Atmel Corporation Low-cost, low-voltage single-layer polycrystalline EEPROM memory cell integration into BiCMOS technology
US8426146B2 (en) 2005-06-03 2013-04-23 University of Pittsburgh—of the Commonwealth System of Higher Education Multiparameteric method for assessing immune system status
AU2006259565B2 (en) 2005-06-15 2011-01-06 Complete Genomics, Inc. Single molecule arrays for genetic and chemical analysis
US20070020670A1 (en) 2005-07-07 2007-01-25 Hematologics, Inc. Methods for detecting and confirming minimal disease
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
US20070042388A1 (en) * 2005-08-12 2007-02-22 Wong Christopher W Method of probe design and/or of nucleic acids detection
GB0521521D0 (en) 2005-10-21 2005-11-30 Medical Res Council Diagnostic methods and kits
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20070105165A1 (en) 2005-11-04 2007-05-10 Charles Goolsby Composite profiles of cell antigens and target signal transduction proteins for analysis and clinical management of hematologic cancers
US7375211B2 (en) 2005-11-18 2008-05-20 Kou Zhong C Method for detection and quantification of T-cell receptor Vβ repertoire
US8137936B2 (en) 2005-11-29 2012-03-20 Macevicz Stephen C Selected amplification of polynucleotides
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
US7544473B2 (en) 2006-01-23 2009-06-09 Population Genetics Technologies Ltd. Nucleic acid analysis using sequence tokens
SG10201405158QA (en) 2006-02-24 2014-10-30 Callida Genomics Inc High throughput genome sequencing on dna arrays
KR20080113223A (ko) 2006-03-06 2008-12-29 심포젠 에이/에스 호흡기세포 융합 바이러스 감염 치료용 재조합 폴리클로날 항체
ES2546848T3 (es) 2006-03-10 2015-09-29 Epigenomics Ag Un método para identificar una muestra biológica para el análisis de la metilación
EP2002017B1 (en) 2006-04-04 2015-06-10 Keygene N.V. High throughput detection of molecular markers based on restriction fragments
EP2021460A4 (en) 2006-05-11 2010-11-17 Univ Maryland Biotech Inst GENERAL PROCEDURE FOR GENERATING HUMAN ANTIBODY REACTIONS IN VITRO
WO2007136518A2 (en) 2006-05-17 2007-11-29 Torrey Pines Institute For Molecular Studies Treatment of autoimmune disorders
JP5409354B2 (ja) 2006-05-25 2014-02-05 インスティチュート フォー アドバンスド スタディ 配列モチーフを同定するための方法、およびその応用
US7833716B2 (en) 2006-06-06 2010-11-16 Gen-Probe Incorporated Tagged oligonucleotides and their use in nucleic acid amplification methods
CN101915957B (zh) 2006-06-12 2012-12-12 加利福尼亚太平洋生物科学公司 实施分析反应的基材
US8372584B2 (en) 2006-06-14 2013-02-12 The General Hospital Corporation Rare cell analysis using sample splitting and DNA tags
US20100027896A1 (en) 2006-06-28 2010-02-04 Amir Geva Automated application interaction using a virtual operator
AU2007269408A1 (en) 2006-06-30 2008-01-10 Applied Biosystems, Llc. Reversible terminator nucleotides and methods of use
WO2008108803A2 (en) 2006-07-13 2008-09-12 Amaox, Ltd. Immune cell biosensors and methods of using same
US8394590B2 (en) 2006-08-02 2013-03-12 California Institute Of Technology Capture agents and related methods and systems for detecting and/or sorting targets
US20080274904A1 (en) 2006-08-10 2008-11-06 Niall Anthony Gormley Method of target enrichment
WO2008026927A2 (en) 2006-08-30 2008-03-06 Academisch Medisch Centrum Process for displaying t- and b-cell receptor repertoires
WO2008039694A2 (en) 2006-09-26 2008-04-03 St. Jude Children's Research Hospital Methods and compositions for monitoring t cell receptor diversity
US8088379B2 (en) 2006-09-26 2012-01-03 The United States Of America As Represented By The Department Of Health And Human Services Modified T cell receptors and related materials and methods
JP5026047B2 (ja) 2006-10-18 2012-09-12 株式会社膠原病研究所 自己免疫疾患の発症に関わる自己応答性t細胞またはt細胞受容体の同定方法、およびその利用
EP2102367A2 (en) 2006-11-09 2009-09-23 XDX, Inc. Methods for diagnosing and monitoring the status of systemic lupus erythematosus
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US7862999B2 (en) 2007-01-17 2011-01-04 Affymetrix, Inc. Multiplex targeted amplification using flap nuclease
EP2121983A2 (en) 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
PT2121920E (pt) 2007-03-01 2011-10-03 Symphogen As Método de clonagem de anticorpos cognatos
WO2008147879A1 (en) 2007-05-22 2008-12-04 Ryan Golhar Automated method and device for dna isolation, sequence determination, and identification
US20090105959A1 (en) 2007-06-01 2009-04-23 Braverman Michael S System and method for identification of individual samples from a multiplex mixture
WO2009015296A1 (en) 2007-07-24 2009-01-29 The Regents Of The University Of California Microfabricated dropley generator
AU2008282862B2 (en) 2007-07-26 2014-07-31 Pacific Biosciences Of California, Inc. Molecular redundant sequencing
ITRM20070429A1 (it) 2007-08-06 2009-02-07 Uni Cattolica Del Sacro Cuor E Mezzi per la diagnosi la prevenzione e la cura dell'artrite reumatoide.
CN101842159B (zh) 2007-08-09 2014-09-24 赛路拉公司 关联的多参数单细胞测定及残余生物材料回收的方法和装置
US8268564B2 (en) 2007-09-26 2012-09-18 President And Fellows Of Harvard College Methods and applications for stitched DNA barcodes
US7960116B2 (en) 2007-09-28 2011-06-14 Pacific Biosciences Of California, Inc. Nucleic acid sequencing methods and systems
US20100285984A1 (en) 2007-09-28 2010-11-11 Wettstein Peter J Assessing t cell repertoires
KR101620642B1 (ko) 2007-11-07 2016-05-12 제넨테크, 인크. 항-cd40 항체를 사용한 치료에 대한 b-세포 림프종의 반응성 평가를 위한 방법 및 조성물
EP2060637A1 (en) 2007-11-14 2009-05-20 Koninklijke Philips Electronics N.V. Means and methods for detection of nucleic acids
WO2009070767A2 (en) 2007-11-28 2009-06-04 Whitehead Institute For Biomedical Research Systemic instigation systems to study tumor growth or metastasis
EP2062982A1 (fr) 2007-11-26 2009-05-27 ImmunID Procédé d'étude de la diversité combinatoire V(D)J
CN101225441B (zh) 2007-12-05 2010-12-01 浙江大学 一种检测克隆特异性t淋巴细胞tcr bv cdr3基因组成的方法
US20100021894A1 (en) 2007-12-20 2010-01-28 Northwestern University Nanoparticle-Based Colorimetric Detection Of Cysteine
US8621502B2 (en) 2007-12-21 2013-12-31 Microsoft Corporation Obtaining user reactions to video
US7767400B2 (en) 2008-02-03 2010-08-03 Helicos Biosciences Corporation Paired-end reads in sequencing by synthesis
EP2489744B1 (en) 2008-02-04 2014-09-03 Life Technologies Corporation Composition and method for sequencing nucleic acid
EP2088432A1 (en) 2008-02-11 2009-08-12 MorphoSys AG Methods for identification of an antibody or a target
EP2088205A1 (en) 2008-02-11 2009-08-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) PSMB10: A diagnosis marker and therapeutic target of chronic rejection.
CN102007408A (zh) 2008-02-28 2011-04-06 俄亥俄州立大学研究基金会 与急性髓性白血病(aml)中的细胞遗传学和预后相关的微rna特征及其用途
WO2009108860A2 (en) 2008-02-28 2009-09-03 The Ohio University Rasearch Foundation Microrna-based methods and compositions for the diagnosis, pronosis and treatment of prostate related disorders
US20090226975A1 (en) 2008-03-10 2009-09-10 Illumina, Inc. Constant cluster seeding
TW200938840A (en) 2008-03-12 2009-09-16 Emo Biomedicine Corp A method for in vitro study of immune modulation using pig blood cell
EP2100970B1 (en) 2008-03-13 2017-05-10 National Institute of Immunology Ig genes specific oligonucleotides and uses thereof
US8153375B2 (en) 2008-03-28 2012-04-10 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
EP2107040B1 (en) 2008-03-31 2011-10-26 Sony Deutschland Gmbh A method of fabricating a membrane having a tapered pore
US9012148B2 (en) 2008-04-16 2015-04-21 Jian Han Method for evaluating and comparing immunorepertoires
US8911948B2 (en) 2008-04-30 2014-12-16 Integrated Dna Technologies, Inc. RNase H-based assays utilizing modified RNA monomers
WO2009137832A2 (en) 2008-05-09 2009-11-12 Duke University Autoantibodies in the detection and treatment of cancer
US9068181B2 (en) 2008-05-23 2015-06-30 The General Hospital Corporation Microfluidic droplet encapsulation
DE102008025656B4 (de) 2008-05-28 2016-07-28 Genxpro Gmbh Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
JP5718221B2 (ja) 2008-05-30 2015-05-13 マサチューセッツ インスティテュート オブ テクノロジー 細胞の空間的分離およびスクリーニングのための組成物および方法
WO2009151628A2 (en) 2008-06-12 2009-12-17 Gov't Of The Usa, As Represented By The Secretary, Department Of Health Human Services Monitoring tcr-b to determine hiv therapy and disease progression
SG182951A1 (en) 2008-06-25 2012-08-30 Baylor Res Inst Blood transcriptional signature of mycobacterium tuberculosis infection
CA2769002C (en) 2008-07-24 2018-05-08 The Board Of Regents Of The University Of Texas System Vh4 codon signature for multiple sclerosis
CN102177438A (zh) 2008-07-25 2011-09-07 理查德·W·瓦格纳 蛋白筛选方法
US8586310B2 (en) 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
US9156010B2 (en) 2008-09-23 2015-10-13 Bio-Rad Laboratories, Inc. Droplet-based assay system
GB2502409B8 (en) 2008-09-23 2014-10-15 Bio Rad Laboratories Droplet-based assay system
US8699361B2 (en) 2008-09-30 2014-04-15 Qualcomm Incorporated Out-of-synchronization handling method and apparatus
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20140234835A1 (en) 2008-11-07 2014-08-21 Sequenta, Inc. Rare clonotypes and uses thereof
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9394567B2 (en) 2008-11-07 2016-07-19 Adaptive Biotechnologies Corporation Detection and quantification of sample contamination in immune repertoire analysis
CA2742380C (en) 2008-11-07 2018-05-29 Sequenta, Inc. Methods of monitoring conditions by sequence analysis
US8691510B2 (en) 2008-11-07 2014-04-08 Sequenta, Inc. Sequence analysis of complex amplicons
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US20110105343A1 (en) 2008-11-21 2011-05-05 Emory University Systems Biology Approach Predicts Immunogenicity of Vaccines
US8367330B2 (en) 2008-12-22 2013-02-05 Quest Diagnostics Investments Incorporated Methods for detecting TCR-gamma gene rearrangement
AU2009333489A1 (en) 2008-12-30 2010-07-08 Centocor Ortho Biotech Inc. Serum markers predicting clinical response to anti-TNF antibodies in patients with ankylosing spondylitis
US8685898B2 (en) 2009-01-15 2014-04-01 Imdaptive, Inc. Adaptive immunity profiling and methods for generation of monoclonal antibodies
US9329170B2 (en) 2009-01-20 2016-05-03 The Board Of Trustees Of The Leland Stanford Junior University Single cell gene expression for diagnosis, prognosis and identification of drug targets
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
RU2014144463A (ru) 2009-06-25 2015-06-20 Фред Хатчинсон Кансэр Рисёч Сентер Способ измерения адаптивного иммунитета
US8497071B2 (en) 2009-06-29 2013-07-30 California Institute Of Technology Isolation of unknown rearranged T-cell receptors from single cells
CA2768478A1 (en) 2009-07-17 2011-01-20 Brown University Detection of short rna sequences
US8586359B2 (en) 2009-07-28 2013-11-19 Promising Furture, LLC Compositions and methods of preparing alloreactive cytotoxic T cells
EP2480683B1 (en) 2009-09-22 2017-11-29 Roche Diagnostics GmbH Determination of kir haplotypes by amplification of exons
GB0917094D0 (en) 2009-09-29 2009-11-11 Ucl Biomedica Plc T-cell receptor
US9043160B1 (en) 2009-11-09 2015-05-26 Sequenta, Inc. Method of determining clonotypes and clonotype profiles
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US8545248B2 (en) 2010-01-07 2013-10-01 Life Technologies Corporation System to control fluid flow based on a leak detected by a sensor
KR101323827B1 (ko) 2010-01-08 2013-10-31 키스트 유럽 에프게엠베하 강직성척추염 진단용 프라이머 및 이를 이용한 강직성 척추염 진단 방법
GB201000375D0 (en) 2010-01-09 2010-02-24 Univ Cardiff T Cell clonotypes
WO2011106738A2 (en) 2010-02-25 2011-09-01 Fred Hutchinson Cancer Research Center Use of tcr clonotypes as biomarkers for disease
EP2367000A1 (en) 2010-03-04 2011-09-21 Charité Universitätsmedizin Berlin High throughput analysis of T-cell receptor repertoires
SG185128A1 (en) 2010-05-06 2012-12-28 Sequenta Inc Monitoring health and disease status using clonotype profiles
EP2566984B1 (en) 2010-05-07 2019-04-03 The Board of Trustees of the Leland Stanford Junior University Measurement and comparison of immune diversity by high-throughput sequencing
US20130123120A1 (en) 2010-05-18 2013-05-16 Natera, Inc. Highly Multiplex PCR Methods and Compositions
US20120035062A1 (en) 2010-06-11 2012-02-09 Life Technologies Corporation Alternative nucleotide flows in sequencing-by-synthesis methods
CN103069006A (zh) 2010-07-23 2013-04-24 艾索特里克斯遗传实验室有限责任公司 区别表达的胚胎或母源基因组区的鉴定及其用途
JP6192537B2 (ja) 2010-08-06 2017-09-06 ルードヴィヒ−マクシミリアン−ウニヴェルズィテート ミュンヘン T細胞の標的抗原の同定
WO2012027503A2 (en) 2010-08-24 2012-03-01 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity
ME02810B (me) 2010-09-20 2018-01-20 Biontech Cell & Gene Therapies Gmbh Antigen-specifični t ćelijski receptori i t ćelijski epitopi
CN103154273A (zh) 2010-09-21 2013-06-12 群体遗传学科技有限公司 通过分子计数提高等位基因调用的置信度
WO2012045012A2 (en) 2010-09-30 2012-04-05 Raindance Technologies, Inc. Sandwich assays in droplets
DK2625320T3 (da) 2010-10-08 2019-07-01 Harvard College High-throughput enkeltcellestregkodning
ES2730951T3 (es) 2010-10-08 2019-11-13 Harvard College Secuenciación inmune de alto rendimiento
EP2633069B1 (en) 2010-10-26 2015-07-01 Illumina, Inc. Sequencing methods
AU2011323107B2 (en) 2010-11-05 2015-09-10 Illumina, Inc. Linking sequence reads using paired code tags
US9193997B2 (en) 2010-12-15 2015-11-24 The Board Of Trustees Of The Leland Stanford Junior University Measuring and monitoring of cell clonality
US20140057799A1 (en) 2010-12-16 2014-02-27 Gigagen System and Methods for Massively Parallel Analysis of Nucleic Acids in Single Cells
EP2659408B1 (en) 2010-12-29 2019-03-27 Life Technologies Corporation Time-warped background signal for sequencing-by-synthesis operations
US10146906B2 (en) 2010-12-30 2018-12-04 Life Technologies Corporation Models for analyzing data from sequencing-by-synthesis operations
EP3736281A1 (en) 2011-02-18 2020-11-11 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
CN103842379A (zh) 2011-03-09 2014-06-04 细胞信号科技公司 用于生成单克隆抗体的方法和试剂
US8759036B2 (en) 2011-03-21 2014-06-24 Affymetrix, Inc. Methods for synthesizing pools of probes
CN103748236B (zh) 2011-04-15 2018-12-25 约翰·霍普金斯大学 安全测序系统
KR102112205B1 (ko) 2011-04-28 2020-06-12 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 샘플과 연관된 폴리뉴클레오티드의 식별
WO2012159754A2 (en) 2011-05-24 2012-11-29 Biontech Ag Individualized vaccines for cancer
WO2013033721A1 (en) 2011-09-02 2013-03-07 Atreca, Inc. Dna barcodes for multiplexed sequencing
WO2013036459A2 (en) 2011-09-09 2013-03-14 Sequenta, Inc. Sequence-based measures of immune response
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
US20140256592A1 (en) 2011-10-11 2014-09-11 Sequenta, Inc. Determining responsiveness of autoimmune patients to dmard treatment
EP2768982A4 (en) 2011-10-21 2015-06-03 Adaptive Biotechnologies Corp QUANTIFICATION OF ADAPTIVE IMMUNOCELL GENOMES IN A COMPLEX MIX OF CELLS
US20130137108A1 (en) 2011-10-25 2013-05-30 Anubhav Tripathi Magnetic bead separation apparatus and method
ES2619713T3 (es) 2011-11-04 2017-06-26 Adaptive Biotechnologies Corporation Clonotipos de receptores de células T compartidos entre pacientes con espondilitis anquilosante
US20140336059A1 (en) 2011-12-05 2014-11-13 Sequenta, Inc. Clonotypes as biometric specimen tags
CA2858070C (en) 2011-12-09 2018-07-10 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
JP2015501644A (ja) 2011-12-09 2015-01-19 シーケンタ インコーポレイテッド 免疫活性化を測定する方法
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
US20150031553A1 (en) 2011-12-13 2015-01-29 Sequenta, Inc. Method of measuring immune activation
US20140349883A1 (en) 2011-12-20 2014-11-27 Sequenta, Inc. Monitoring transformation of follicular lymphoma to diffuse large b-cell lymphoma by immune repertoire analysis
US20150031555A1 (en) 2012-01-24 2015-01-29 Gigagen, Inc. Method for correction of bias in multiplexed amplification
EP2812700B1 (en) 2012-02-09 2018-04-18 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
ES2665071T3 (es) 2012-02-17 2018-04-24 Fred Hutchinson Cancer Research Center Composiciones y métodos para identificar mutaciones de manera precisa
US11177020B2 (en) 2012-02-27 2021-11-16 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags
WO2013131074A1 (en) 2012-03-02 2013-09-06 Diogenix, Inc. Methods and reagents for evaluating autoimmune disease and determining antibody repertoire
WO2013134302A1 (en) 2012-03-05 2013-09-12 Sequenta, Inc. Monitoring immune responsiveness to cancer vaccination
US20150038346A1 (en) 2012-03-05 2015-02-05 Sequenta, Inc. Monitoring immune responsiveness to cancer vaccination
US10077478B2 (en) 2012-03-05 2018-09-18 Adaptive Biotechnologies Corp. Determining paired immune receptor chains from frequency matched subunits
EP2825675B1 (en) 2012-03-13 2017-12-27 Patel, Abhijit Ajit Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
AU2013246050B2 (en) 2012-04-13 2017-03-16 Adaptive Biotechnologies Corp. Detection and quantitation of sample contamination in immune repertoire analysis
WO2013158936A1 (en) 2012-04-20 2013-10-24 Sequenta, Inc Monitoring immunoglobulin heavy chain evolution in b-cell acute lymphoblastic leukemia
CA2871505C (en) 2012-04-24 2021-10-12 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
JP5756247B1 (ja) 2012-05-08 2015-07-29 アダプティブ バイオテクノロジーズ コーポレイション マルチプレックスpcr反応における増幅バイアスを測定し校正する組成物及び方法
US20150247201A1 (en) 2012-05-31 2015-09-03 Malek Faham Predicting relapse of chronic lymphocytic leukemia patients treated by allogeneic stem cell transplantation
US20130324422A1 (en) 2012-06-04 2013-12-05 Sequenta, Inc. Detecting disease-correlated clonotypes from fixed samples
CN104520443A (zh) 2012-06-11 2015-04-15 赛昆塔公司 使用序列标签的序列确定方法
JP2015519909A (ja) 2012-06-15 2015-07-16 アダプティブ バイオテクノロジーズ コーポレイション 複合遺伝子セットにおける固有にタグ付加された再構成適応性免疫受容体遺伝子
US20150154352A1 (en) 2012-06-21 2015-06-04 Gigagen, Inc. System and Methods for Genetic Analysis of Mixed Cell Populations
WO2014018460A1 (en) 2012-07-24 2014-01-30 Sequenta, Inc. Single cell analysis using sequence tags
JP2015524282A (ja) 2012-08-10 2015-08-24 シーケンタ インコーポレイテッド 配列タグを用いた高感度突然変異検出
US20140065629A1 (en) 2012-08-29 2014-03-06 Israel Barken Methods of treating diseases
CN114085896A (zh) 2012-09-24 2022-02-25 Cb生物技术公司 使用非干扰性噪音消除性多核苷酸鉴定标签的多重焦磷酸测序
US20150275308A1 (en) 2012-10-19 2015-10-01 Sequenta, Inc. Monitoring diffuse large b-cell lymphoma from peripheral blood samples
AU2013331212A1 (en) 2012-10-19 2015-05-07 Adaptive Biotechnologies Corp. Monitoring clonotypes of plasma cell proliferative disorders in peripheral blood
JP2015532123A (ja) 2012-10-22 2015-11-09 シーケンタ・インコーポレイテッド 免疫移植後の末梢血におけるマントル細胞リンパ腫のクローン型のモニタリング
WO2014130685A1 (en) 2013-02-22 2014-08-28 Sequenta, Inc. Rare clonotypes and uses thereof
US20140255944A1 (en) 2013-03-08 2014-09-11 Sequenta, Inc. Monitoring treatment-resistant clones in lymphoid and myeloid neoplasms by relative levels of evolved clonotypes
US20140255929A1 (en) 2013-03-11 2014-09-11 Sequenta, Inc. Mosaic tags for labeling templates in large-scale amplifications
CA2906218A1 (en) 2013-03-15 2014-09-18 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
WO2015013461A2 (en) 2013-07-26 2015-01-29 Sequenta, Inc. Cancer vaccination with antigen evolution
AU2014337063A1 (en) 2013-10-18 2016-05-19 Adaptive Biotechnologies Corp. Predicting patient responsiveness to immune checkpoint inhibitors
AU2015204569A1 (en) 2014-01-10 2016-07-21 Adaptive Biotechnologies Corp. Methods for defining and predicting immune response to allograft
US20150218656A1 (en) 2014-02-03 2015-08-06 Adaptive Biotechnologies Corp. Methods for detection and diagnosis of a lymphoid malignancy using high throughput sequencing
US20170292149A1 (en) 2014-03-05 2017-10-12 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
ES2777529T3 (es) 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
EP3715455A1 (en) 2014-10-29 2020-09-30 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
US11047008B2 (en) 2015-02-24 2021-06-29 Adaptive Biotechnologies Corporation Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
EP3277294A4 (en) 2015-04-01 2018-11-14 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target

Also Published As

Publication number Publication date
CN107586832B (zh) 2021-03-30
US20150017652A1 (en) 2015-01-15
CN104520440A (zh) 2015-04-15
EP3091089A1 (en) 2016-11-09
BR112014027309A2 (pt) 2017-07-11
SG11201407107VA (en) 2014-11-27
EP2831276A1 (en) 2015-02-04
UA115783C2 (uk) 2017-12-26
SG10201507700VA (en) 2015-10-29
US10894977B2 (en) 2021-01-19
EP3091089B1 (en) 2019-01-23
US9150905B2 (en) 2015-10-06
IL235417A0 (en) 2014-12-31
US10214770B2 (en) 2019-02-26
CA2872468A1 (en) 2013-11-14
AU2013259544B9 (en) 2017-09-28
HK1206789A1 (zh) 2016-01-15
JP2015171372A (ja) 2015-10-01
KR101621643B1 (ko) 2016-05-16
AU2013259544B2 (en) 2017-09-14
HUE029357T2 (en) 2017-02-28
AU2013259544A1 (en) 2014-11-20
MX2014013443A (es) 2015-05-11
CN107586832A (zh) 2018-01-16
EP2831276B1 (en) 2016-04-20
WO2013169957A8 (en) 2014-04-03
PT2831276T (pt) 2016-07-26
US20150203897A1 (en) 2015-07-23
JP5756247B1 (ja) 2015-07-29
JP2015523057A (ja) 2015-08-13
CA2872468C (en) 2020-10-27
US9371558B2 (en) 2016-06-21
RU2014143942A (ru) 2016-05-27
AU2017272256B1 (en) 2018-01-04
MX354329B (es) 2018-02-27
ES2711156T3 (es) 2019-04-30
RU2631797C2 (ru) 2017-09-26
US20160319340A1 (en) 2016-11-03
PL2831276T3 (pl) 2016-10-31
WO2013169957A1 (en) 2013-11-14
KR20140139620A (ko) 2014-12-05
JP6385889B2 (ja) 2018-09-05
CY1117899T1 (el) 2017-05-17
CN104520440B (zh) 2017-10-03
US20190203281A1 (en) 2019-07-04
DK2831276T3 (da) 2016-08-01

Similar Documents

Publication Publication Date Title
ES2582554T3 (es) Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas
US20170335386A1 (en) Method of measuring adaptive immunity
ES2867924T3 (es) Diagnóstico de tumores malignos linfoides y detección de enfermedad residual mínima
US9809813B2 (en) Method of measuring adaptive immunity
EP3132059B1 (en) Quantification of adaptive immune cell genomes in a complex mixture of cells
CN111363783B (zh) 一种基于特有识别序列的t细胞受体库高通量测序文库构建及测序数据分析方法
ES2641690B1 (es) Método de identificación de mutaciones
CN108588064B (zh) 构建目的序列dna文库的试剂盒及目的序列dna文库的构建方法
Miranda de Sousa Dias Novel Approaches for Molecular Diagnosis of Genetic Diseases by Next Generation Sequencing: Application to Breast Cancer and Retinitis Pigmentosa in the Clinical Practice