ES2615733T3 - Métodos para el análisis masivo paralelo de ácidos nucleicos en células individuales - Google Patents

Métodos para el análisis masivo paralelo de ácidos nucleicos en células individuales Download PDF

Info

Publication number
ES2615733T3
ES2615733T3 ES11848932.7T ES11848932T ES2615733T3 ES 2615733 T3 ES2615733 T3 ES 2615733T3 ES 11848932 T ES11848932 T ES 11848932T ES 2615733 T3 ES2615733 T3 ES 2615733T3
Authority
ES
Spain
Prior art keywords
sequence
nucleic acid
target nucleic
cells
probe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11848932.7T
Other languages
English (en)
Inventor
David Scott Johnson
Everett Hurteau Meyer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gigagen Inc
Original Assignee
Gigagen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gigagen Inc filed Critical Gigagen Inc
Application granted granted Critical
Publication of ES2615733T3 publication Critical patent/ES2615733T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1075Isolating an individual clone by screening libraries by coupling phenotype to genotype, not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6846Common amplification features
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Abstract

Un método para analizar al menos dos secuencias de ácido nucleico en una célula individual contenida dentro de una población de al menos 10.000 células, en el que la célula individual se aísla en una microgotita de emulsión, comprendiendo dicho método: proporcionar un primer conjunto de sondas de ácido nucleico, comprendiendo el primer conjunto una primera sonda que comprende una secuencia que es complementaria a una primera sub-secuencia de ácido nucleico diana, comprendiendo una segunda sonda una secuencia que es complementaria a una segunda sub-secuencia del primer ácido nucleico diana y una segunda secuencia que es complementaria a una secuencia exógena, comprendiendo una tercera sonda la secuencia exógena y una secuencia que es complementaria a una primera sub-secuencia de un segundo ácido nucleico diana, y una cuarta sonda que comprende una secuencia que es complementaria a una segunda sub-secuencia de la segunda secuencia de ácido nucleico diana, en donde el primer ácido nucleico diana o el segundo ácido nucleico diana comprende una secuencia de receptor de células T o una secuencia de inmunoglobulina; aislar las células individuales con al menos un conjunto de sondas de ácido nucleico; amplificar la primera y segunda secuencias de ácido nucleico diana de manera independiente, en donde la primera secuencia de ácido nucleico diana se amplifica utilizando la primera sonda y la segunda sonda, y en donde la segunda secuencia de ácido nucleico diana se amplifica utilizando la tercera sonda y la cuarta sonda; hibridar la secuencia exógena a su complemento; amplificar la primera secuencia de ácido nucleico diana, la segunda secuencia de ácido nucleico diana y la secuencia exógena, utilizando las primera y cuarta sondas, generando con ello un complejo fusionado; y realizar una reacción de secuenciación a granel para generar información de la secuencia para al menos 100.000 complejos fusionados a partir de al menos 10.000 células dentro de la población de células, en donde la información de la secuencia es suficiente para co-localizar la primera secuencia de ácido nucleico diana y la segunda secuencia de ácido nucleico diana en una célula individual de la población de al menos 10.000 células.

Description

5
10
15
20
25
30
35
40
45
50
DESCRIPCION
Metodos para el analisis masivo paralelo de acidos nucleicos en celulas individuales ANTECEDENTES DE LA INVENClON Campo de la invencion
La invencion se refiere a los campos de la biolog^a molecular y de diagnostico molecular, y mas espedficamente a metodos para el analisis genetico masivo paralelo de acidos nucleicos en celulas individuales.
Descripcion de la Tecnica Relacionada
Determinados analisis geneticos cuantitativos de tejidos biologicos y organismos se realizan mejor a nivel de celulas individuales. Sin embargo, las celulas individuales solo contienen picogramos de material genetico. Metodos convencionales tales como la reaccion en cadena de la polimerasa (PCR), la secuenciacion de ARN (Mortazavi et al., 2008 Nature Methods. 5:621-8), la secuenciacion por inmunoprecipitacion de cromatina (Johnson et al., 2007 Science 316:1497-502) o la secuenciacion del genoma completo (Lander et al., 2001 Nature 409:860-921), requieren mas material genetico que se encuentra en una celula individual y se realiza generalmente con miles de millones de celulas. Estas tecnicas proporcionan informacion genetica util al nivel de la poblacion de celulas, pero tienen serias limitaciones para la comprension de la biologfa a nivel de celulas individuales. Herramientas biologicas actuales tambien carecen de la capacidad para analizar las mediciones geneticas en muchas celulas individuales en paralelo.
Las tecnicas de celulas individuales convencionales son lentas, tediosas y estan limitadas a la cantidad de celulas que se pueden analizar a la vez. Por ejemplo, en el diagnostico genetico pre-implantacion (PGD), una celula individual se retira de un embrion humano en estadio de division para el analisis de todo el genoma de enfermedades geneticas (Johnson et al., 2010 Human Reproduction. 25:1066-75). Aplicaciones tales como el PGD requieren una tecnologfa de la biopsia guiada manualmente, que consume tiempo, y los estudios mas amplios incluyen cientos de celulas individuales. En otro ejemplo, la recombinacion genetica entre loci de interes se puede medir en celulas de esperma individuales (Jiang et al., 2005 Nucleic Acids Research 33: e91), pero un analisis manual de miles de espermatozoides individuales consumina tiempo y sena poco practico.
Un metodo establecido para el analisis de celulas individuales es la clasificacion de celulas activadas por fluorescencia (FACS). Celulas individuales se diluyen en pocillos de reaccion, y en los pocillos pueden llevarse a cabo diversas tecnicas geneticas y de biologfa molecular, desde la amplificacion de todo el genoma a ensayos por PCR de locus individuales. Sin embargo, debido a los lfmites ffsicos de paralelizacion utilizando pocillos de reaccion, la FACS solo es util para el analisis de cientos de celulas individuales, en lugar de cientos de miles de celulas individuales.
Las celulas individuales tambien se pueden utilizar como compartimientos de reaccion para llevar a cabo diversos analisis geneticos (Embleton et al., 1992 Nucleic Acids Research 20:3831-37; Hviid, 2002 Clinical Chemistry 48:2115-2123; Patente de EE.UU. 5.830.663). Las celulas individuales pueden ser ordenadas en emulsiones acuosas en aceite de microgotitas, y los analisis moleculares se pueden realizar en las microgotitas (Johnston et al., 1996 Science 271: 624-626; Brouzes et al., 2009 PNAS 106: 14195-200; Kliss et al., 2008 Anal Chem 80:8975-81; Zeng et al., 2010 Anal Chem 82: 3183-90). Estos ensayos de celulas individuales se limitan a la PCR de celulas individuales en emulsiones, o a la PCR in situ en celulas individuales fijadas y permeabilizadas. Ademas de ello, cuando se analizan grandes poblaciones de celulas, es diffcil rastrear cada uno de los productos genicos a una celula individual o sub-poblaciones de celulas.
Por lo tanto, existe la necesidad de metodos para la caracterizacion genetica de alto rendimiento, masivamente paralela, de celulas individuales y metodos para identificar la celula o sub-poblacion de celulas que origino el material genetico.
SUMARIO DE LA INVENClON
Se describe en esta memoria un metodo para analizar al menos dos secuencias de acido nucleico en una celula individual contenida en una poblacion de al menos 10.000 celulas. El metodo incluye proporcionar un primer conjunto de sondas de acido nucleico, comprendiendo el primer conjunto una primera sonda que comprende una secuencia que es complementaria a una primera sub-secuencia de acido nucleico diana, una segunda sonda que comprende una secuencia que es complementaria a una segunda sub-secuencia del primer acido nucleico diana y una segunda secuencia que es complementaria a una secuencia exogena, comprendiendo una tercera sonda la secuencia exogena y una secuencia que es complementaria a una primera sub-secuencia de un segundo acido nucleico diana, y comprendiendo una cuarta sonda una secuencia que es complementaria a una segunda sub- secuencia de la segunda secuencia de acido nucleico diana.
5
10
15
20
25
30
35
40
45
50
55
60
El metodo incluye aislar las celulas individuales con al menos un conjunto de sondas de acido nucleico; amplificar las primera y segunda secuencias de acido nucleico diana de forma independiente, en el que la primera secuencia de acido nucleico diana se amplifica utilizando la primera sonda y la segunda sonda, y en el que la segunda secuencia de acido nucleico diana se amplifica utilizando la tercera sonda y la cuarta sonda; hibridar la secuencia exogena a su complemento; y amplificar la primera secuencia de acido nucleico diana, la segunda secuencia de acido nucleico diana y la secuencia exogena utilizando la primera y cuarta sondas, generando de este modo un complejo fusionado.
El metodo tambien proporciona realizar una reaccion de secuenciacion a granel para generar informacion de la secuencia de al menos 100.000 complejos fusionados de al menos 10.000 celulas dentro de la poblacion de celulas, en el que la informacion de la secuencia es suficiente para co-localizar la primera secuencia de acido nucleico diana y la segunda secuencia de acido nucleico diana de una celula individual de la poblacion de al menos 10.000 celulas.
En un aspecto, la celula individual es aislada en una microgotita de la emulsion. En otro aspecto, la celula individual es aislada en un recipiente de reaccion.
En una realizacion, la etapa de amplificacion incluye realizar una reaccion en cadena de la polimerasa, en el que la etapa de amplificacion comprende realizar una reaccion en cadena de la polimerasa, y en el que la primera y tercera sondas son cebadores directos y la segunda y cuarta sondas son cebadores inversos para la reaccion en cadena de la polimerasa. En otra realizacion, la etapa de amplificacion incluye realizar una reaccion en cadena de la polimerasa, en el que el primer y tercer cebadores de amplificacion son cebadores directos y el segundo y cuarto cebadores de amplificacion son cebadores inversos para la reaccion en cadena de la polimerasa. En algunas realizaciones, la etapa de amplificacion comprende realizar una reaccion en cadena de la ligasa. La etapa de amplificacion puede incluir realizar una reaccion en cadena de la polimerasa, una reaccion en cadena de la polimerasa con transcriptasa inversa, una reaccion en cadena de la ligasa o una reaccion en cadena de la ligasa seguida de una reaccion en cadena de la polimerasa.
En otra realizacion, el complejo fusionado es circular. En algunas realizaciones, la primera o segunda secuencia de acido nucleico diana es una secuencia de ARN. La primera o segunda secuencia de acido nucleico diana tambien puede ser una secuencia de ADN. En una realizacion, la primera o segunda secuencia de acido nucleico diana comprende una secuencia de receptor de celulas T. En otra realizacion, la primera secuencia de acido nucleico diana, la segunda secuencia de acido nucleico diana o ambas secuencias de acido nucleico diana comprende una secuencia de inmunoglobulina. En otras realizaciones, el primer acido nucleico diana comprende una secuencia de receptor de celulas T, y la segunda secuencia de acido nucleico diana comprende una segunda molecula que se asocia con la funcion celular inmune. En otra realizacion, la primera secuencia de acido nucleico diana comprende una secuencia de inmunoglobulina, y la segunda secuencia comprende una segunda molecula asociada con la funcion celular inmune. En una realizacion, la segunda molecula asociada con la funcion celular inmune se selecciona del grupo que consiste en: interleucina-2 (IL-2), interleucina-4 (IL-4), interferon gamma (IFNy), interleucina-10 (IL-10), interleucina-1 (IL-1), la interleucina-13 (IL-13), interleucina-17 (IL-17), interleucina-18 (IL-18), factor de necrosis tumoral alfa (TNFa), factor de necrosis tumoral beta (TNFI3), factor de transcripcion 21 de la caja T (TBX21), caja forkhead P3 (FOXP3), cumulo de diferenciacion 4 (CD4), cumulo de diferenciacion 8 (CD8), cumulo de diferenciacion 1d (CD1d), cumulo de diferenciacion 161 (CD161), cumulo de diferenciacion 3 (CD3), complejo principal de histocompatibilidad (MHC), cumulo de diferenciacion 19 (CD19), receptor de interleucina 7 (receptor de IL-17), cumulo de diferenciacion 10 (CD10), cumulo de diferenciacion 20 (CD20), cumulo de diferenciacion 22 (CD22), cumulo de diferenciacion 34 (CD34), cumulo de diferenciacion 27 (CD27), cumulo de diferenciacion 5 (CD5) y cumulo de diferenciacion 45 (CD45), cumulo de diferenciacion 38 (CD38), cumulo de diferenciacion 78 (CD78), receptor de interleucina-6, factor regulador de interferon 4 (IRF4), cumulo de diferenciacion 138 (CD138).
En una realizacion, el primer o segundo acido nucleico diana incluye una secuencia de genes raros. En algunas realizaciones, la secuencia del gen raro esta presente en menos de 5% de las celulas, menos de 1% de las celulas o menos de 0,1% de las celulas. En una realizacion, la secuencia del gen raro resulta de una mutacion genetica. En otra realizacion, la mutacion genetica es una mutacion somatica. En una realizacion, la mutacion genetica es una mutacion en un gen seleccionado del grupo que consiste en el receptor del factor de crecimiento epidermal (EGFR), homologo de fosfatasa y tensina (PTEN), protema de tumor 53 (p53), MutS homologo 2 (MSH2), neoplasia endocrina multiple 1 (MEN1), poliposis adenomatosa coli (APC), receptor Fas (FASR), protema retinoblastoma (Rb1), Janus quinasa 2 (JAK2), factor de transcripcion 1 similar a (ETS) (ELK1), virus de la eritroblastosis aviar v-ets E26 homologo de oncogen 1 (ETS1), cancer de mama 1 (BRCA1), cancer de mama 2 (BRCA2), receptor del factor de crecimiento de hepatocitos (MET), proto-oncogen ret (RET), leucemia eritroblastica viral V-erb-b2 homologo de oncogen 2 (HER2), sarcoma de rata viral V-Ki-ras2 Kirsten homologo de oncogen (KRAS), linfoma de celulas B 2 (BCL2), mielocitomatosis viral V-myc homologo de oncogen (MYC), gen de neurofibromatosis de tipo 2 (NF2), mieloblastosis viral v-myb homologo de oncogen (MYB) y homologo mutS 6 (E. coli) (MSH6). En otras realizaciones, la mutacion se asocia con una enfermedad, y en una realizacion, la enfermedad es cancer. En algunas realizaciones, el cancer es un cancer seleccionado del grupo que consiste en carcinoma de pulmon, cancer de pulmon de celulas no pequenas, cancer de pulmon de celulas pequenas, cancer de utero, cancer de tiroides, carcinoma de mama, carcinoma de prostata, carcinoma de pancreas, carcinoma de colon, linfoma, linfoma de
5
10
15
20
25
30
35
40
45
50
55
Burkitt, linfoma de Hodgkin, leucemia mieloide, leucemia, sarcoma, blastema, melanoma, seminoma, cancer de cerebro, glioma, glioblastoma, astrocitoma cerebeloso, linfoma de celulas T cutaneo, cancer gastrico, cancer de tegado, ependimoma, cancer de laringe, cancer de cuello, cancer de estomago, cancer de rinon, cancer de pancreas, cancer de vejiga, cancer de esofago, cancer testicular, meduloblastoma, cancer vaginal, cancer de ovario, cancer cervical, carcinoma de celulas basales, adenoma de la pituitaria, rabdomiosarcoma o sarcoma de Kaposi.
Ademas, el metodo puede incluir, en determinadas realizaciones, fijar y permeabilizar las celulas antes de realizar la etapa de amplificacion. El metodo tambien puede incluir lisar las celulas antes de realizar la etapa de amplificacion y cuantificar la informacion de la secuencia generada a partir de la reaccion de secuenciacion a granel.
En algunas realizaciones, el metodo para analizar la celula individual incluye una celula individual contenida dentro de una poblacion de al menos 25.000 celulas, al menos 50.000 celulas, al menos 75.000 celulas o al menos 100.000 celulas. En algunas realizaciones, la celula individual es una celula unica con respecto a las celulas que quedan en la poblacion. En otras realizaciones, la celula individual es un representante de una sub-poblacion de celulas dentro de la poblacion. La poblacion puede ser considerada en algunas realizaciones como el numero total de celulas analizadas en un metodo de la invencion.
En una realizacion, la realizacion de la reaccion de secuenciacion a granel para generar informacion de la secuencia se lleva a cabo para al menos 1.000.000 de complejos fusionados de al menos 10.000 celulas dentro de la poblacion de celulas.
El metodo incluye proporcionar un segundo conjunto de sondas de acido nucleico, comprendiendo el segundo conjunto una quinta sonda que comprende una secuencia que es complementaria a una tercera sub-secuencia de acido nucleico diana, una sexta sonda que comprende una secuencia que es complementaria a una segunda sub- secuencia de la tercera secuencia de acido nucleico diana y una segunda secuencia que es complementaria a una segunda secuencia exogena, una septima sonda que comprende la secuencia exogena y una secuencia que es complementaria a una primera sub-secuencia de una cuarta secuencia de acido nucleico diana, y una octava sonda que comprende una secuencia que es complementaria a una segunda sub-secuencia de la cuarta secuencia de acido nucleico diana.
El metodo tambien proporciona aislar las celulas individuales con el primer y segundo conjunto de sondas de acido nucleico; amplificar las tercera y cuarta secuencias de acidos nucleicos diana de forma independiente, en el que la tercera secuencia de acido nucleico diana se amplifica utilizando la quinta sonda y la sexta sonda, y en el que la cuarta secuencia de acido nucleico diana se amplifica utilizando la septima sonda y la octava sonda; hibridar la secuencia exogena a su complemento; amplificar la tercera secuencia de acido nucleico diana, la cuarta secuencia de acido nucleico diana y la secuencia exogena utilizando las quinta y octava sondas, generando de este modo un complejo fusionado; y realizando una reaccion de secuenciacion a granel para generar informacion de la secuencia para al menos 100.000 complejos fusionados de al menos 10.000 celulas dentro de la poblacion de celulas, en el que la informacion de la secuencia es suficiente para co-localizar la primera secuencia de acido nucleico diana, la segunda secuencia de acido nucleico diana, la tercera secuencia de acido nucleico diana y la cuarta secuencia de acido nucleico diana de una celula individual de la poblacion de al menos 10.000 celulas.
En algunos aspectos, la primera secuencia de acido nucleico diana y la tercera secuencia de acido nucleico diana son las mismas. En otros aspectos, la primera secuencia de acido nucleico diana y la tercera secuencia de acido nucleico diana son diferentes.
En otras realizaciones, el metodo incluye proporcionar N conjuntos de sondas de acido nucleico, en el que cada uno de los N conjuntos comprende una sonda I1 que comprende una secuencia que es complementaria a una primera sub-secuencia de acido nucleico diana Ia, comprendiendo una sonda I2 una secuencia que es complementaria a una segunda sub-secuencia de acido nucleico diana Ia, y una segunda secuencia que es complementaria a una secuencia exogena I, comprendiendo un sonda I3 la secuencia exogena I y una secuencia que es complementaria a una primera sub-secuencia de acido nucleico diana Ib, y una sonda I4 que comprende una secuencia que es complementaria a una segunda sub-secuencia de acido nucleico diana Ib, en donde I oscila entre 1 y N.
El metodo tambien incluye aislar las celulas individuales con los N conjuntos de sondas de acido nucleico; amplificar para todos los valores de I, las secuencias de acido nucleico diana Ia e Ib de forma independiente, en el que la secuencia de acido nucleico diana Ia se amplifica utilizando la sonda I1 y la sonda I2 y la secuencia de acido nucleico diana Ib se amplifica utilizando la sonda I3 y la sonda I4; hibridar la secuencia exogena I a su complemento; amplificar para cada una de las I la secuencia diana Ia, la secuencia diana Ib y la secuencia exogena I utilizando las sondas I1 e I4, generando con ello N complejos fusionados; y realizar una reaccion de secuenciacion a granel para generar informacion de la secuencia de al menos 100.000 complejos fusionados de al menos 10.000 celulas dentro de la poblacion de celulas, en el que la informacion de la secuencia es suficiente para co-localizar la N secuencia de acido nucleico diana Ia y la secuencia de acido nucleico diana Ib a una celula individual de la poblacion de al menos 10.000 celulas.
5
10
15
20
25
30
35
40
45
50
55
En otras realizaciones, N es menor que o igual a 10, menor que o igual a 100, menor que o igual a 1000, menor que o igual a 10.000, menor que o igual a 100.000, o N representa todos los transcritos poliadenilados en una celula.
En algunas realizaciones, el metodo incluye introducir una secuencia de codigo de barras unica que comprende al menos seis nucleotidos en cada una de la pluralidad de celulas individuales, en el que cada una de las secuencias de codigo de barras se selecciona de una agrupacion de secuencias de codigo de barras con una diversidad mayor que 1000 veces en las secuencias. Para cada una de la pluralidad de celulas individuales, el metodo incluye proporcionar al menos un conjunto de sondas de acido nucleico. El metodo incluye las etapas de analizar al menos dos secuencias de acido nucleico en una celula individual contenida dentro de una poblacion de al menos 10.000 celulas, que comprende aislar cada una de una pluralidad de celulas individuales de una poblacion de al menos 10.000 celulas en una microgotita de la emulsion o un recipiente de reaccion. El metodo incluye introducir una secuencia de codigo de barras unica que comprende al menos seis nucleotidos en cada una de la pluralidad de celulas individuales, en el que cada una de las secuencias de codigo de barras se selecciona de una agrupacion de secuencias de codigo de barras con una diversidad de mas de 1000 veces en la secuencia.
Para cada una de la pluralidad de celulas individuales, el metodo proporciona al menos un conjunto de sondas de acido nucleico, comprendiendo el conjunto una primera sonda que comprende una secuencia que es complementaria a una secuencia de acido nucleico que esta localizada en el extremo 5' de la secuencia de codigo de barras, una segunda sonda que comprende una secuencia que es complementaria a una secuencia de acido nucleico que esta localizada en el extremo 3' de la secuencia de codigo de barras y una segunda region de la secuencia que es complementaria a una secuencia exogena, no humana, comprendiendo una tercera sonda una secuencia que comprende la secuencia exogena, no humana, y una secuencia que es complementaria a una primera sub-secuencia de una segunda secuencia de acido nucleico diana, y una cuarta sonda que comprende una secuencia que es complementaria a una segunda sub-secuencia de la segunda secuencia de acido nucleico diana.
El metodo continua amplificando la primera y segunda secuencias de acido nucleico de forma independiente, en el que la primera secuencia de acido nucleico diana se amplifica utilizando la primera sonda y la segunda sonda, y en el que la segunda secuencia de acido nucleico diana se amplifica utilizando la tercera sonda y la cuarta sonda; hibridando la secuencia exogena a su complemento; amplificando la primera secuencia de acido nucleico diana, la segunda secuencia de acido nucleico diana y la secuencia exogena utilizando la primera y cuarta sondas; realizando la secuenciacion a granel de los complejos fusionados; e identificando una celula individual para cada uno de los complejos fusionados en base a la secuencia de codigo de barras.
En algunas realizaciones, la secuencia de codigo de barras se fija a una perla o a una superficie solida. La perla o la superficie solida se pueden aislar en la microgotita de la emulsion o el recipiente de reaccion.
En otras realizaciones, el metodo incluye introducir una secuencia de codigo de barras unica que comprende condensar la microgotita de la emulsion o un recipiente de reaccion que comprende la celula individual con la microgotita de la emulsion o un recipiente de reaccion que comprende la secuencia de codigo de barras fijada a la perla o a la superficie solida. La segunda secuencia de acido nucleico diana puede ser complementaria a una secuencia de ARN. La segunda secuencia de acido nucleico diana puede ser complementaria a una secuencia de ADN.
En determinadas realizaciones, la amplificacion comprende realizar una reaccion en cadena de la polimerasa, realizar una reaccion en cadena de la ligasa o realizar una reaccion en cadena de la ligasa seguida de una reaccion en cadena de la polimerasa.
En una realizacion, la celula individual esta contenida dentro de una poblacion de al menos 25.000 celulas. En otras realizaciones, la celula individual esta contenida dentro de una poblacion de al menos 50.000 celulas. La celula individual puede estar contenida dentro de una poblacion de al menos 75.000 celulas o dentro de una poblacion de al menos 100.000 celulas.
En determinadas realizaciones, el metodo incluye tambien cuantificar los complejos fusionados. En otras realizaciones, los complejos fusionados son circulares.
En un aspecto, el metodo incluye proporcionar N conjuntos de sondas de acido nucleico, en el que cada uno de los N conjuntos comprende una sonda I1 que comprende una secuencia que es complementaria a una primera sub- secuencia de una secuencia de codigo de barras, comprendiendo una sonda I2 una secuencia que es complementaria a una segunda sub-secuencia de la secuencia de codigo de barras, y una segunda secuencia que es complementaria a una secuencia exogena I, comprendiendo una sonda I3 la secuencia exogena I y una secuencia que es complementaria a una primera sub-secuencia de acido nucleico diana Ib, y una sonda I4 que comprende una secuencia que es complementaria a una segunda sub-secuencia de acido nucleico diana Ib, en donde I oscila entre 1 y N.
El metodo tambien proporciona aislar las celulas individuales con los N conjuntos de sondas de acido nucleico; amplificar para todos los valores de I, la secuencia de codigo de barras y las secuencias de acidos nucleicos diana Ib
5
10
15
20
25
30
35
40
45
50
55
de forma independiente, en el que la secuencia de codigo de barras se amplifica utilizando la sonda I1 y la sonda I2 y la secuencia de acido nucleico diana Ib se amplifica utilizando la sonda I3 y la sonda I4; hibridar la secuencia exogena I a su complemento; amplificar para cada uno de los I la secuencia de codigo de barras, la secuencia diana Ib y la secuencia exogena I utilizando las sondas I1 e I4, generando con ello N complejos fusionados; y realizando una reaccion de secuenciacion a granel para generar informacion de la secuencia para al menos 100.000 complejos fusionados de al menos 10.000 celulas dentro de la poblacion de celulas, en el que la informacion de la secuencia es suficiente para co-localizar la secuencia de codigo de barras y la secuencia de acido nucleico diana Ib a una celula individual de la poblacion de al menos 10.000 celulas.
En otros aspectos, N es menor que o igual a 10, menor que o igual a 100, menor que o igual a 1000, menor que o igual a 100.000, o N representa a todos los transcritos poliadenilados en una celula. En algunas realizaciones, la secuencia de codigo de barras es la misma secuencia para todos los N.
En otras realizaciones, la invencion tambien proporciona un metodo para introducir dichas secuencias de codigo de barras en recipientes de reaccion o microgotitas de la emulsion. El metodo incluye proporcionar una agrupacion de secuencias de codigo de barras unicas, en el que cada una de las secuencias de codigo de barras esta enlazada a un gen de resistencia a la seleccion. El metodo tambien incluye proporcionar una poblacion de celulas individuales, transfectar la poblacion de celulas individuales con la agrupacion de secuencias de codigo de barras unicas, seleccionar celulas que contienen una secuencia de codigo de barras unica y el gen de resistencia a la seleccion, y aislar cada una de las celulas seleccionadas en recipientes de reaccion o microgotitas de la emulsion. El gen de resistencia a la seleccion puede codificar resistencia a gentamicina, neomicina, higromicina o puromicina, por ejemplo.
BREVE DESCRIPCION DE LAS DIVERSAS VISTAS DE LOS DIBUJOS
Estas y otras caractensticas, aspectos y ventajas de la presente invencion se entenderan mejor con respecto a la siguiente descripcion y dibujos que se acompanan, en que:
La Figura (FIG.) 1A muestra un ejemplo de enlace de secuencia en una celula individual por circularizacion multi- sonda intracelular de un complejo molecular, de acuerdo con una realizacion de la invencion. Cada una de las sondas tiene una region de complementariedad con cada uno de los loci diana. El complejo incluye dos sondas de acido nucleico (ay b) y dos acidos nucleicos diana (c y d). La celula individual (e) puede estar contenida en un recipiente de reaccion o una gotita de emulsion (j).
La FIG. 1B ilustra un ejemplo de enlace de secuencia en una celula individual (tambien en un recipiente de reaccion o gotita de emulsion (j)) por circularizacion multi-sonda intracelular de un complejo, de acuerdo con una realizacion de la invencion. Las dos sondas de acidos nucleicos (a y b) se hibridan a las regiones complementarias de los dos acidos nucleicos diana (c y d).
La FIG. 1C ilustra un ejemplo de la circularizacion de un complejo de enlace sonda-diana que se produce por amplificacion, de acuerdo con una realizacion de la invencion.
La FIG. 2 es un ejemplo de la amplificacion de un complejo de enlace sonda-diana circularizado (a) utilizando una polimerasa (b), de acuerdo con una realizacion de la invencion. En algunas realizaciones, una 9-29 polimerasa se utiliza en una amplificacion mediada por cfrculo rodante, y se generan copias (b y c) del complejo sonda-diana circularizado.
La FIG. 3 ilustra un ejemplo de la amplificacion de un complejo de enlace sonda-diana circularizado (a) utilizando una polimerasa (b) y cebadores (c y d), de acuerdo con una realizacion de la invencion. Los cebadores (c y d) se utilizan para amplificar la region del complejo sonda-diana circularizado que es complementario al acido nucleico diana. Se generan multiples copias (e) de un amplicon lineal de acido polinucleico de doble cadena y se secuencian a granel.
La FIG. 4 ilustra un ejemplo de la amplificacion de un complejo de enlace sonda-diana circularizado (a) en una celula individual (b), de acuerdo con una realizacion de la invencion. La amplificacion se produce por transformacion en bacterias y posterior seleccion con antibioticos. El amplicon (a) contiene un gen resistente a antibioticos, y celulas (c) que se transforman con el amplicon se seleccionan en presencia de antibioticos. No se seleccionan las celulas sin el complejo sonda-diana circularizado (d).
La FIG. 5A muestra un ejemplo de un enlace de secuencia de celulas individuales por reaccion en cadena de la polimerasa de extension por solapamiento intracelular, de acuerdo con una realizacion de la invencion. Un cebador directo (a) fija como objetivo un locus de un primer acido nucleico diana (g). Un cebador inverso (b) fija como objetivo otro locus del primer acido nucleico diana (g) y tiene una region de complementariedad (c) con una region (d) del cebador directo (e). El cebador directo (e) tiene una region de complementariedad con el segundo acido nucleico diana (h) y el cebador inverso (f) fija como objetivo otra region del segundo acido nucleico diana (h). Las etapas de la FIG. 5 se pueden realizar en un recipiente de reaccion o una gotita de la emulsion.
5
10
15
20
25
30
35
40
45
50
La FIG. 5B ilustra un ejemplo de la hibridacion de las sondas (a, b, e y f) a acidos nucleicos diana respectivos (g y h) de acuerdo con una realizacion de la invencion.
La FIG. 6A ilustra un ejemplo de las regiones complementarias (c) y (d) entre los amplicones (g) y (h), de acuerdo con una realizacion de la invencion. La FIG. 6B muestra la amplificacion de enlace de los amplicones (g) y (h) utilizando la polimerasa (e) para crear un amplicon principal enlazado (i). El producto final es un banco de "amplicones principales" que incluye los amplicones enlazados (g) y (h), que pueden ser secuenciados a granel. Las etapas de la FIG. 6 se pueden realizar en un recipiente de reaccion o una gotita de emulsion.
Las FIGs. 7A y 7B ilustran un ejemplo de enlace de secuencia de celula individual por reaccion en cadena de la ligasa intracelular combinada con reaccion en cadena de la polimerasa de extension por solapamiento, de acuerdo con una realizacion de la invencion.
La FIG. 8A muestra un ejemplo de las regiones complementarias entre amplicones (a) y (d), de acuerdo con una realizacion de la invencion. La FIG. 8B muestra la amplificacion del enlace de los amplicones utilizando la polimerasa (e) para crear un amplicon principal enlazado. Las etapas de las FIGs. 7 y 8 se pueden realizar en un recipiente de reaccion o una gotita de emulsion.
La FIG. 9A muestra un ejemplo de un amplicon enlazado (f), de acuerdo con una realizacion de la invencion. La FIG. 9B muestra el amplicon resultante producido a partir de las etapas mostradas en las FIGs. 8A y 8B. El producto final puede ser un banco de "amplicones principales” y se pueden secuenciar a granel.
La FIG. 10 ilustra un ejemplo de los componentes requeridos para un enlace de la secuencia de celulas individuales por sondas-candado en combinacion con la reaccion en cadena de la polimerasa de extension por solapamiento, de acuerdo con una realizacion de la invencion.
La FIG. 11 muestra las regiones complementarias entre una primera sonda-candado (a) y el primer acido nucleico diana (c) y entre una segunda sonda-candado (b) y un segundo acido nucleico diana (d) en una celula individual, de acuerdo con una realizacion de la invencion.
La FIG. 12 ilustra los amplicones circularizados (g) y (h) resultantes y los cebadores que se utilizan para amplificar los amplicones circularizados, de acuerdo con una realizacion de la invencion.
La FIG. 13 muestra un ejemplo de los amplicones resultantes de la amplificacion de las sondas circulares (g) y (h), de acuerdo con una realizacion de la invencion.
La FIG. 14 muestra un ejemplo de amplificacion por PCR de extension por solapamiento de los amplicones utilizando una polimerasa (e), de acuerdo con una realizacion de la invencion.
La FIG. 15 ilustra un ejemplo de desconvolucion del banco de plasmidos por reaccion en cadena de la polimerasa de extremo de cola con codigo de barras (con codigo de barras en el extremo 5'), que es seguida por secuenciacion a granel y la informatica, de acuerdo con una realizacion de la invencion. La secuencia de codigo de barras se puede rastrear a una posicion de pocillo y placa, la secuencia de codigo de barras se puede rastrear luego a una secuencia de acido nucleico y la secuencia de acido nucleico se rastrea a un pocillo. Cada uno de los cebadores en (a) y (b) tiene una etiqueta con codigo de barras en el extremo 5'. Los acidos nucleicos diana en (c) y (d) se amplifican utilizando los cebadores en (a) y (b). Las etapas se pueden realizar en recipientes cerrados o gotitas de emulsion tal como se muestra en (c) y (d).
La FIG. 16 muestra un ejemplo de amplificacion (e, f) de dos acidos nucleicos diana (A y B), utilizando cebadores que incluyen secuencias de codigos de barras, de acuerdo con una realizacion de la invencion. Los amplicones resultantes que incluyen las secuencias de codigos de barras se muestran en (g) y (h).
La FIG. 17 muestra un ejemplo simplificado de rastreo de una secuencia de codigo de barras en un amplicon a una diana celular (A o B), y el rastreo de nuevo de la diana celular a un lugar ffsico (c, d) (p. ej., un pocillo), de acuerdo con una realizacion de la invencion.
La FIG. 18 ilustra el enlace molecular entre dos transcripciones (g y h) y una secuencia de codigo de barras molecular (k), de acuerdo con una realizacion de la invencion.
La FIG. 19 muestra un ejemplo de la amplificacion de los acidos nucleicos diana (g y h) utilizando los cebadores tal como se muestra, de acuerdo con una realizacion de la invencion.
La FIG. 20 muestra un ejemplo de los amplicones que resultan despues de la amplificacion de dos acidos nucleicos diana y una secuencia de codigo de barras (k), de acuerdo con una realizacion de la invencion.
La FIG. 21 ilustra un amplicon fusionado que incluye secuencias de dos acidos nucleicos diana (g y h) y una secuencia de codigo de barras (k) dentro de una gotita de emulsion o recipiente de reaccion (j), de acuerdo con una
5
10
15
20
25
30
35
40
45
50
realizacion de la invencion. El amplicon ("principal") fusionado puede ser aislado por emulsion inversa y secuenciado a granel.
La FIG. 22 es un ejemplo de enlace molecular entre dos transcripciones (g y h) y una secuencia de codigo de barras molecular (k) unidas a una perla (m), de acuerdo con una realizacion de la invencion.
La FIG. 23 ilustra los cebadores directo e inverso que se utilizan en un enlace molecular entre dos transcripciones (g y h) y una secuencia de codigo de barras molecular (k) unida a una perla (m), de acuerdo con una realizacion de la invencion.
La FIG. 24 muestra un ejemplo de los amplicones que resultan despues de la amplificacion de dos acidos nucleicos diana y una secuencia de codigo de barras (k) unida a una perla (m), de acuerdo con una realizacion de la invencion.
La FIG. 25 ilustra un amplicon fusionado que incluye secuencias de dos acidos nucleicos diana (g y h) y una secuencia de codigo de barras (k), dentro de una gotita de emulsion o recipiente de reaccion (j), de acuerdo con una realizacion de la invencion. El amplicon ("principal") fusionado puede ser aislado por emulsion inversa y secuenciado a granel.
La FIG. 26 es un ejemplo de un enlace de la secuencia de celulas individuales por reaccion en cadena de la ligasa en combinacion con la reaccion en cadena de la polimerasa de extension por solapamiento, tal como se aplica a un metodo para el diagnostico prenatal no invasivo, de acuerdo con una realizacion de la invencion.
La FIG. 27 muestra un ejemplo de hibridacion de cebadores y acidos nucleicos diana en un enlace de la secuencia de celulas individuales por reaccion en cadena de la ligasa en combinacion con la reaccion en cadena de la polimerasa de extension por solapamiento, tal como se aplica a un metodo para el diagnostico prenatal no invasivo, de acuerdo con una realizacion de la invencion. El proceso se lleva a cabo en una gotita de emulsion o recipiente de reaccion (k).
La FIG. 28 muestra un ejemplo de amplicones resultantes producidos en un enlace de la secuencia de celulas individuales por reaccion en cadena de la ligasa en combinacion con la reaccion en cadena de la polimerasa de extension por solapamiento, tal como se aplica a un metodo para el diagnostico prenatal no invasivo, de acuerdo con una realizacion de la invencion.
La FIG. 29 muestra la hibridacion de regiones complementarias solapantes de los amplicones resultantes y la reaccion en cadena de la polimerasa de extension por solapamiento, tal como se aplica a un metodo para el diagnostico prenatal no invasivo, de acuerdo con una realizacion de la invencion.
La FIG. 30 muestra los amplicones que resultan de la reaccion en cadena de la polimerasa de extension por solapamiento, tal como se aplica a un metodo para el diagnostico prenatal no invasivo, de acuerdo con una realizacion de la invencion. El producto final es un banco de "amplicones principales", o loci enlazados, que luego pueden ser secuenciados a granel.
La FIG. 31 muestra un flujo de trabajo simplificado para la generacion de alto rendimiento de bancos de repertorio TCRp, de acuerdo con una realizacion de la invencion.
DESCRIPCION DETALLADA DE LA INVENCION
En smtesis, y como se describe con mayor detalle mas adelante, se describen en esta memoria metodos y sistemas para el analisis genetico paralelo masivo de celulas individuales en gotitas de emulsion o recipientes de reaccion. Loci geneticos de interes son fijados como objetivo en una celula individual utilizando sondas disenadas especialmente y un complejo de fusion esta formado por tecnicas de enlace molecular y amplificacion. Multiples loci geneticos pueden ser fijados como objetivo, y muchos conjuntos de sondas se pueden multiplexar por PCR en un solo analisis, de manera que se analizan varios loci o incluso todo el transcriptoma o genoma.
La invencion es util para analizar la informacion genetica en celulas individuales en un alto rendimiento, de forma paralela para una gran cantidad de celulas (104o mas celulas). La invencion tambien es util para el rastreo de la informacion genetica de una celula o poblacion de celulas utilizando secuencias de codigo de barras unicas.
Definiciones
Los terminos y expresiones utilizados en las reivindicaciones y la memoria descriptiva se definen como se indica a continuacion, a menos que se especifique lo contrario.
El termino "celula" se refiere a una unidad basica funcional de los organismos vivos. Una celula incluye cualquier tipo de celula (procariota o eucariota) de un organismo vivo. Ejemplos incluyen, pero no se limitan a celulas de sangre mononucleares de mairnfero, celulas de levadura o celulas bacterianas.
5
10
15
20
25
30
35
40
45
50
55
60
La expresion "reaccion en cadena de la polimerasa" o PCR se refiere a una tecnica de biolog^a molecular para la amplificacion de una secuencia de ADN de una sola copia a varios ordenes de magnitud (de miles a millones de copias). La PCR se basa en la ciclacion termica, lo que requiere ciclos de calentamiento y enfriamiento repetidos de la reaccion para la fusion del ADN y la replicacion enzimatica del ADN. Los cebadores (fragmentos cortos de ADN) que contienen secuencias complementarias a la region diana de la secuencia de ADN y una ADN polimerasa son componentes clave para permitir una amplificacion selectiva y repetida. A medida que progresa la PCR, el ADN generado es en sf utilizado como un molde para la replicacion, poniendo en marcha una reaccion en cadena en la que el molde de ADN se amplifica de manera exponencial. Se utiliza una ADN polimerasa termoestable, tal como Taq polimerasa. Las etapas de ciclacion termica son necesarias primero para separar ffsicamente las dos cadenas en una doble helice de ADN a una alta temperatura en un proceso denominado fusion del ADN. A una temperatura inferior, cada una de las cadenas se utiliza entonces como molde en la smtesis de ADN por la ADN polimerasa para amplificar selectivamente el ADN diana. La selectividad de la PCR resulta del uso de cebadores que son complementarios a la region de ADN fijada como objetivo para la amplificacion bajo condiciones espedficas de ciclacion termica.
La expresion "reaccion en cadena de la polimerasa con transcriptasa inversa" o RT-PCR se refiere a un tipo de reaccion PCR utilizada para generar multiples copias de una secuencia de ADN. En la RT-PCR, una cadena de ARN se transcribe primero inversamente en su complemento de ADN (ADN complementario o ADNc) utilizando la enzima transcriptasa inversa, y el ADNc resultante se amplifica utilizando tecnicas tradicionales de PCR.
La expresion "reaccion en cadena de la ligasa" o LCR se refiere a un tipo de amplificacion de ADN en el que dos sondas de ADN son ligadas por una ADN ligasa, y se utiliza una ADN polimerasa para amplificar el producto de ligamiento resultante. Se utilizan metodos de PCR tradicionales para amplificar la secuencia de ADN ligada. La LCR proporciona una mayor especificidad en comparacion con la PCR.
La expresion "gotita de emulsion" o "microgotita de emulsion" se refiere a una gotita que se forma cuando se combinan dos fluidos inmiscibles. Por ejemplo, una gotita acuosa se puede formar cuando un fluido acuoso se mezcla con un fluido no acuoso. En otro ejemplo, un fluido no acuoso puede ser anadido a un lfquido acuoso para formar una gotita. Las gotitas se pueden formar por diversos metodos, incluyendo metodos realizados por dispositivos de microfluidos u otros metodos, tales como inyectando un fluido a otro fluido, empujando o extrayendo lfquidos a traves de un orificio o abertura, formando gotitas por la fuerza de cizallamiento, etc. Las gotitas de una emulsion pueden tener cualquier distribucion uniforme o no uniforme. Cualquiera de las emulsiones descritas en esta memoria puede ser monodispersa (compuesta de gotitas de tamano al menos generalmente uniforme), o puede ser polidispersa (compuesta de gotitas de diversos tamanos). Si es monodispersa, las gotitas de la emulsion pueden variar en volumen por una desviacion estandar que es menor que aproximadamente mas o menos 100%, 50%, 20%, 10%, 5%, 2% o 1% del volumen medio de las gotitas. Las gotitas generadas a partir de un orificio pueden ser monodispersas o polidispersas. Una emulsion puede tener cualquier composicion adecuada. La emulsion se puede caracterizar por el compuesto lfquido predominante o el tipo de compuesto lfquido que se utiliza. Los compuestos lfquidos predominantes en la emulsion pueden ser agua y aceite. “Aceite” es cualquier compuesto lfquido o mezcla de compuestos lfquidos que es inmiscible con el agua y que tiene un alto contenido en carbono. En algunos ejemplos, el aceite tambien puede tener un alto contenido de hidrogeno, fluor, silicio, oxfgeno, o cualquier combinacion de los mismos, entre otros. Por ejemplo, cualquiera de las emulsiones descritas en esta memoria puede ser una emulsion de agua en aceite (W/O) (es dear, gotitas acuosas en una fase continua de aceite). El aceite puede ser o incluir al menos un aceite de silicona, aceite mineral, aceite fluorocarbonado, aceite vegetal, o una combinacion de los mismos, entre otros. Cualesquiera otros componentes adecuados pueden estar presentes en cualquiera de las fases de la emulsion tal como al menos un tensioactivo, reactivo, muestra (es decir, particiones de la misma), tampon, sal, elemento ionico, otros aditivos, etiqueta, partfculas, o cualquier combinacion de los mismos.
"Gotita" se refiere a un pequeno volumen de lfquido, tfpicamente con una forma esferica o como un disco que llena el diametro de un microcanal, encapsulado por un fluido inmiscible. El volumen de una gotita y/o el volumen medio de gotitas en una emulsion puede ser menos de aproximadamente un microlitro (es decir, una "microgotita") (o entre aproximadamente un microlitro y uno nanolitro o entre aproximadamente un microlitro y un picolitro), menos de aproximadamente un nanolitro (o entre aproximadamente un nanolitro y un picolitro), o menos de aproximadamente un picolitro (o entre aproximadamente un picolitro y un femtolitro), entre otros. Una gotita puede tener un diametro (o un diametro medio) de menos de aproximadamente 1000, 100 o 10 micras, o de aproximadamente 1000 a 10 micrometros, entre otros. Una gotita puede ser esferica o no esferica. En algunas realizaciones, la gotita tiene un volumen y un diametro que es lo suficientemente grande para encapsular una celula.
La expresion "codigo de barras" se refiere a una secuencia de acido nucleico que se utiliza para identificar una celula individual o una sub-poblacion de celulas. En algunas realizaciones, una secuencia de codigo de barras se utiliza para identificar un organismo o una especie particular. Tal como se describe a continuacion, las secuencias de codigo de barras se pueden introducir en una celula, enlazar por diversos metodos de amplificacion a un acido nucleico diana de interes y utilizar para rastrear el amplicon a la celula. Secuencias de codigo de barras pueden estar flanqueadas por secuencias universales que pueden ser utilizadas para amplificar bancos de codigos de barras
5
10
15
20
25
30
35
40
45
50
utilizando pares de cebadores universales. Las secuencias de codigos de barras pueden estar contenidas dentro de una molecula de doble cadena circular o lineal, o en una molecula lineal de cadena sencilla.
La expresion "secuenciacion a granel" o "secuenciacion de proxima generacion" o "secuenciacion masiva en paralelo" se refiere a cualquier tecnologfa de secuenciacion de alto rendimiento que paraleliza el proceso de secuenciacion de ADN. Por ejemplo, metodos de secuenciacion a granel son tfpicamente capaces de producir mas de un millon de amplicones de acido polinucleico en un unico ensayo. Las expresiones "secuenciacion a granel", "secuenciacion masiva en paralelo" y "secuenciacion de proxima generacion" se refieren solo a metodos generales, no necesariamente a la adquisicion de mas de 1 millon de etiquetas de secuencias en una sola pasada. Cualquier metodo de secuenciacion a granel se puede implementar en la invencion tal como la qrnmica de terminador reversible (p. ej., Illumina), pirosecuenciacion utilizando gotitas de emulsion polony (p. ej., Roche), la secuenciacion semiconductora de iones (Ion Torrent), la secuenciacion de una sola molecula (p. ej., Pacific Biosciences), secuenciacion masiva en paralelo de la firma, etc.
El termino "in situ" se refiere al examen de un fenomeno biologico en el entorno en el que se produce, p. ej., la practica de la hibridacion in situ se refiere a la hibridacion de una sonda a una diana de acido nucleico con la celula aun intacta.
El termino "in vivo" se refiere a los procesos que se producen en un organismo vivo.
El termino "mairnfero", tal como se utiliza en esta memoria, incluye tanto seres humanos como no humanos e incluye, pero no se limita a, seres humanos, primates no humanos, caninos, felinos, murinos, bovinos, equinos y porcinos.
La expresion "celulas T" se refiere a un tipo de celula que juega un papel central en la respuesta inmune mediada por celulas. Celulas T pertenecen a un grupo de globulos blancos conocidos como linfocitos y se pueden distinguir de otros linfocitos, tales como celulas B y celulas asesinas naturales T (NKT) por la presencia de un receptor de celulas T (TCR) en la superficie de la celula. Las respuestas de celulas T son espedficas para el antfgeno y son activadas por antfgenos extranos. Las celulas T son activadas para proliferar y diferenciarse en celulas efectoras cuando el antfgeno extrano se expone en la superficie de las celulas presentadoras de antfgeno en organos linfoides perifericos. Las celulas T reconocen fragmentos de antfgenos de protemas que han sido degradados en parte dentro de la celula presentadora de antfgeno. Existen dos clases principales de celulas T - celulas T citotoxicas y celulas T colaboradoras. Las celulas T efectoras citotoxicas matan directamente a las celulas que estan infectadas con un virus o algun otro patogeno intracelular. Las celulas T efectoras colaboradoras ayudan a estimular las respuestas de otras celulas, principalmente macrofagos, celulas B y celulas T citotoxicas.
La expresion "celula B" se refiere a un tipo de linfocito que juega un papel importante en la respuesta inmune humoral (en oposicion a la respuesta inmune mediada por celulas, que se rige por las celulas T). Las principales funciones de las celulas B son producir anticuerpos contra los antfgenos, realizar el papel de las celulas presentadoras de antfgeno (APCs) y, finalmente, convertirse en celulas B de memoria despues de la activacion por la interaccion del antfgeno. Las celulas B son un componente esencial del sistema inmune adaptativo.
Hay que senalar que, tal como se utiliza en la memoria descriptiva y las reivindicaciones adjuntas, las formas en singular "un", "una" y "el", “la” incluyen referentes en plural, a menos que el contexto indique claramente lo contrario.
Metodos de la invencion
I. Metodos de Analisis Molecular de Celulas Individuales Masivo Paralelo
A. Metodos de Microfluidos para Generar Gotitas de Emulsion de Celulas Individuales
En algunas realizaciones, se utiliza un dispositivo de microfluidos para generar gotitas de emulsion de celulas individuales. El dispositivo de microfluidos expulsa celulas individuales en tampon de reaccion acuoso en una mezcla de aceite hidrofobica. El dispositivo puede crear miles de microgotitas de emulsion por minuto. Despues de crear las microgotitas de emulsion, el dispositivo expulsa la mezcla de emulsion en una artesa. La mezcla puede ser pipeteada o recogida en un tubo de reaccion estandar para la termociclacion.
Dispositivos de microfluidos habituales para el analisis de celulas individuales se fabrican de forma rutinaria en los laboratorios academicos y comerciales (Kintses et al., 2010 Current Opinion in Chemical Biology 14:548-555). Por ejemplo, pueden fabricarse chips de polidimetilsiloxano (PDMS), de plastico, vidrio o cuarzo. En algunas realizaciones, el fluido se mueve a traves de los chips a traves de la accion de una bomba de presion o jeringa. Las celulas individuales pueden incluso ser manipuladas en los chips de microfluidos programables utilizando un dispositivo de dielectroforesis habitual (Hunt et al., 2008 Lab Chip 8:81-87). En una realizacion, se utiliza un chip de PDMS basado en presion que comprende una geometna de enfoque de flujo fabricada con tecnologfa litografica suave (Dolomite Microfluidics (Royston, Reino Unido)) (Anna et al., 2003 Applied Physics Letters 82:364-366). El diseno stock normalmente puede generar 10.000 microgotitas acuosas en aceite por segundo a intervalos de
5
10
15
20
25
30
35
40
45
50
tamano de 10-150 ^m de diametro. En algunas realizaciones, la fase hidrofobica consistira en aceite fluorado que contiene una sal de amonio de carboxi-perfluoropolieter, que garantiza condiciones optimas para la biologia molecular y disminuye la probabilidad de coalescencia de las gotitas (Johnston et al., 1996 Science 271:624-626). Para medir la periodicidad de la celula y el flujo de gotitas, las imagenes se registran a 50.000 fotogramas por segundo utilizando tecnicas estandares tales como una camara Phantom V7 o Fastec InLine (Abate et al., 2009 Lab Chip 9:2628-31).
El sistema de microfluidos puede optimizar el tamano de las microgotitas, la densidad de celulas de entrada, el diseno de los chips y los parametros de carga de celulas de modo que mas del 98% de las gotitas contiene una sola celula. Existen tres metodos comunes para la consecution de tales estadisticas: (i) la dilution extrema de la disolucion de celulas; (ii) la selection fluorescente de gotitas que contienen celulas individuales; y (iii) la optimization de la periodicidad de la entrada de celulas. Para cada uno de los metodos, las metricas para el exito incluyen: (i) la tasa de encapsulation (es decir, el numero de gotitas que contienen exactamente una celula); (ii) el rendimiento (es decir, la fraction de la poblacion original celular que termina en una gotita que contiene exactamente una celula); (iii) la tasa de multi-hit (es decir, la fraccion de gotas que contienen mas de una celula); (iv) la tasa negativa (es decir, la fraccion de gotitas que no contienen celulas); y (v) la tasa de encapsulacion por segundo (es decir, el numero de gotitas que contienen celulas individuales formadas por segundo).
En algunas realizaciones, las emulsiones de celulas individuales se generan por dilucion de celulas extremas. En condiciones desordenadas, la probabilidad de que una microgotita contenga k celulas viene dada por la distribution de Poisson:
/(M)
imagen1
en que e es el logaritmo natural y el numero esperado de ocurrencias en el intervalo es A. Asi, para P (k = 1) = 0,98, la disolucion de celulas debe ser extremadamente diluida, de tal manera que A = 0,04 y solo 3,84% de todas las gotitas contiene una celula individual.
En algunas realizaciones, se utiliza un simple chip de microfluidos con una union formadora de gotitas, de manera que una corriente acuosa fluye a traves de una boquilla cuadrada de 10 ^m y dispensa las mezclas acuosas en aceite de la emulsion en un deposito. La mezcla de emulsion puede ser pipeteada desde el deposito y termociclada en tubos de reaction estandares. Este metodo producira previsiblemente altas tasas de encapsulacion y bajas tasas multi-hit, pero una tasa de encapsulacion baja por segundo. Un diseno que puede alcanzar el rendimiento de gotita llena de 1000 Hz es capaz de clasificar hasta 106 celulas en menos de 17 minutos.
Tambien se pueden utilizar tecnicas de fluorescencia para clasificar microgotitas con caracteristicas de emision particulares (Baroud et al., 2007 Lab Chip 7:1029-1033; Kintses et al., 2010 Current Opinion in Chemical Biology 14:548-555). En estos estudios, los metodos qmmicos se utilizan para tenir las celulas. En algunas realizaciones, la autofluorescencia se utiliza para seleccionar microemulsiones que contienen celulas. Un detector fluorescente reduce la tasa negativa que resulta de la dilucion de celulas extrema. Un dispositivo microflmdico tambien puede estar equipado con un laser dirigido a una union de clasificacion "Y" aguas abajo de la union de encapsulacion de celulas. La union Y tiene un canal de "mantenimiento" y un canal de "residuos". Se utiliza un tubo fotomultiplicador para recoger la fluorescencia de cada una de las gotitas a medida que pasan por el laser. La diferencia de tension se calibra entre gotitas vacias y gotitas con al menos una celula. A continuation, cuando el dispositivo detecta una gotita que contiene al menos una celula, y los electrodos en la union de clasificacion Y crean un gradiente de campo por dielectroforesis (Hunt et al., 2008 Lab on a Chip 8:81-87) y empujan gotitas que contienen celulas en el canal de mantenimiento. El dispositivo de microfluidos utiliza dilucion celular extrema para controlar la tasa multi-hit y de clasificacion de celulas fluorescentes para reducir la tasa negativa.
En algunas realizaciones, el flujo de celulas de entrada esta alineado con la periodicidad de la formacion de gotitas, de manera que mas de un 98% de las gotitas contiene una sola celula (Edd et al., 2008 Lab Chip 8:1262-1264; Abate et al., 2009 Lab Chip 9:2628-31). En estos dispositivos de microfluidos, una suspension de alta densidad de las celulas es forzada a pasar a traves de un canal de alto aspecto-relacion, de manera que el diametro de la celula es una fraccion grande de la anchura del canal. El chip esta disenado con un microcanal rectangular de 27^m x 52 ^m que hace fluir celulas en microgotitas a > 10 ^L/min (Edd et al., 2008 Lab Chip 8:1262-1264). Se testa un cierto numero de anchuras de canal de entrada y caudales para llegar a una solution optima.
En algunas realizaciones, las celulas con diferente morfologia pueden comportarse de forma diferente en la corriente de microcanales del dispositivo de microfluidos, confundiendo la optimizacion de la tecnica cuando se aplica a muestras biologicas clinicas. Para abordar esta cuestion, se induce un gradiente de campo perpendicular al microcanal por dielectroforesis. La dielectroforesis tira de las celulas a un lado del microcanal, creando una ordenacion en los canales que es independiente de la morfologia de las celulas. Este metodo requiere la
5
10
15
20
25
30
35
40
45
50
55
optimizacion sustancial de la carga y el caudal y un chip y un dispositivo de diseno mas complicado, por lo que este metodo puede ser necesario si las metodologfas existentes fracasan en el funcionamiento para ciertos tipos de celulas.
Las mezclas de microgotitas de emulsion se pipetean desde la artesa en el dispositivo de microfluidos a un tubo de reaccion para la termociclacion. Despues de termociclar las emulsiones, un cierto numero de metodos podna conseguir la inversion de la emulsion para recuperar la fase acuosa de la reaccion. Dos procesos de reversion directos que han sido utilizados por investigadores anteriores son la congelacion instantanea en nitrogeno lfquido durante 10 segundos (Kliss et al., 2008 Analytical Chem. 80:8975-8981) y el paso a traves de un filtro de malla de 15 pm (Zeng et al., 2010 Analytical Chem 82:3183-90). La inversion de la emulsion tambien se puede lograr utilizando reactivos comercialmente disponibles disenados para este proposito (Brouzes et al., 2009 PNAS 106:14195-200). El exito de la inversion de la emulsion se evaluo mediante visualizacion de las fases acuosa e hidrofobicas bajo un microscopio.
En algunas realizaciones, los metodos de la invencion utilizan celulas individuales en recipientes de reaccion, en lugar de gotitas de la emulsion. Ejemplos de recipientes de reaccion de este tipo incluyen placas de 96 pocillos, tubos de 0,2 mL, tubos de 0,5 mL, tubos de 1,5 mL, placas de 384 pocillos, placas de 1536 pocillos, etc.
B. Metodos para el Enlace Molecular en Emulsiones de Celulas Individuales y Secuenciacion Masiva en Paralelo
1) Enlace Molecular utilizando la Reaccion en Cadena de la Polimerasa (PCR)
La PCR se utiliza para amplificar muchos tipos de secuencias, incluyendo pero no limitadas a SNPs, repeticiones cortas en tandem (STR), dominios variables de protemas, regiones metiladas y regiones intergenicas. Los metodos para la PCR de extension por solapamiento se utilizan para crear productos de amplicon de fusion de varios loci genomicos independientes en un solo tubo de reaccion (Johnson et al., 2005 Genome Research 15:1315-24; Patente de EE.UU. 7.749.697).
En algunas realizaciones, al menos dos secuencias diana de acido nucleico (p. ej., primera y segunda secuencias de acido nucleico diana, o primer y segundo loci) se eligen en la celula y se designan como loci diana. Se disenan cebadores directos e inversos para cada una de las dos secuencias de acido nucleico diana, y los cebadores se utilizan para amplificar las secuencias diana. Se generan amplicones "menores" mediante la amplificacion de las dos secuencias de acido nucleico diana por separado, y luego se fusionan mediante amplificacion para crear un amplicon de fusion, tambien conocido como un amplicon “principal”. En una realizacion, un amplicon "menor" es una secuencia de acido nucleico amplificada a partir de loci genomicos diana, y un amplicon “principal” es un complejo de fusion generado a partir de secuencias amplificadas entre loci genomicos multiples. Cebadores a modo de ejemplo que se pueden utilizar para generar amplicones menores y principales se enumeran en la Tabla 2. Estos cebadores se utilizan para la amplificacion multiplexada de TCRp de una celula individual y despues enlace del TCRp a las dianas efectoras inmunes IL-2, IL-4, iNfG, TBX21, FOXP3 o TNFA. En una realizacion, SEQ ID NOs: 157 se agrupan junto con los cebadores para una unica diana efectora inmune, p. ej., SEQ ID NOs: 68 y 69.
El metodo utiliza cebadores "internos" (es decir, el cebador inverso para el primer locus y el cebador directo para el segundo locus) que comprenden un dominio que se hibrida con un amplicon menor y un segundo dominio que se hibrida con un segundo amplicon menor. Cebadores "internos" son un reactivo limitante, de manera que durante la fase exponencial de la PCR, los cebadores internos se han agotado, conduciendo a que dominios solapantes en los amplicones menores se reasocien y creen amplicones principales.
Los cebadores de la PCR se disenan contra dianas de interes utilizando parametros estandares, es decir, la temperatura de fusion (Tm) de aproximadamente 55-65°C, y con una longitud de 20-50 nucleotidos. Los cebadores se utilizan con condiciones estandares de la PCR, por ejemplo, Tris-HCl 1 mM pH 8,3, cloruro de potasio 5 mM, cloruro de magnesio 0,15 mM, cebadores 0.2-2 pM, dNTPs 200 pM y una ADN polimerasa termoestable. Estan disponibles muchos kits comerciales para realizar la PCR tales como Platinum Taq (Life Technologies), Amplitaq Gold (Life Technologies), Titanium Taq (Clontech), Phusion polymerase (Finnzymes), HotStartTaq Plus (Qiagen). Cualquier ADN polimerasa termoestable estandar se puede utilizar para esta etapa, tal como Taq polimerasa o el fragmento Stoffel.
En una realizacion, se utiliza un conjunto de sondas (o cebadores) de acidos nucleicos para amplificar una primera secuencia de acido nucleico diana y una segunda secuencia de acido nucleico diana para formar un complejo de fusion. La primera sonda incluye una secuencia que es complementaria a una primera secuencia de acido nucleico diana (p. ej., el extremo 5' de la primera secuencia de acido nucleico diana). La segunda sonda incluye una secuencia que es complementaria a la primera secuencia de acido nucleico diana (p. ej., el extremo 3' de la primera secuencia de acido nucleico diana) y una segunda secuencia que es complementaria a una secuencia exogena. En algunas realizaciones, la secuencia exogena es una secuencia de acido nucleico no humana y no es
5
10
15
20
25
30
35
40
45
50
55
complementaria a cualquiera de las secuencias de acidos nucleicos diana. La primera y segunda sondas son el cebador directo y el cebador inverso para la primera secuencia de acido nucleico diana.
La tercera sonda incluye una secuencia que es complementaria a la porcion de la segunda sonda que es complementaria a la secuencia exogena y una secuencia que es complementaria a la segunda secuencia de acido nucleico diana (p. ej., el extremo 5' de la segunda secuencia de acido nucleico diana). La cuarta sonda incluye una secuencia que es complementaria a la segunda secuencia de acido nucleico diana (p. ej., el extremo 3' de la segunda secuencia de acido nucleico diana). La tercera sonda y la cuarta sonda son los cebadores directo e inverso para la segunda secuencia de acido nucleico diana.
La segunda y tercera sonda tambien se denominan los cebadores "internos" de la reaccion (es decir, el cebador inverso para el primer locus y el cebador directo para el segundo locus) y son limitantes de la concentracion (p. ej., 0.01 |jM para los cebadores internos y 0.1 jM para todos los otros cebadores). Esto impulsara la amplificacion del amplicon principal preferentemente sobre los amplicones menores. La primera y cuarta sondas se denominan los cebadores "externos".
La primera y segunda secuencias de acido nucleico se amplifican de forma independiente, de manera que la primera secuencia de acido nucleico se amplifica utilizando la primera sonda y la segunda sonda, y la segunda secuencia de acido nucleico se amplifica utilizando la tercera sonda y la cuarta sonda. A continuacion, se genera un complejo de fusion mediante la hibridacion de las regiones de secuencias complementarias de las primera y segunda secuencias de acido nucleico amplificadas y amplificando las secuencias hibridadas utilizando la primera y cuarta sondas. Esto se denomina la amplificacion de PCR de extension por solapamiento.
Durante la amplificacion de PCR de extension por solapamiento, las regiones de secuencias complementarias de las secuencias de acidos nucleicos primera y segunda amplificadas actuan como cebadores para la extension en ambas cadenas y en cada direccion por moleculas de ADN polimerasa. En ciclos de PCR posteriores, los cebadores externos ceban la secuencia condensada completa, de modo que el complejo fusionado se duplica por la ADN polimerasa. Este metodo produce una pluralidad de complejos de fusion.
Las FIGs. 5-6 muestran un ejemplo del enlace de la secuencia de celulas individuales por reaccion en cadena de la polimerasa de extension por solapamiento intracelular, de acuerdo con una realizacion de la invencion. En la FIG. 5A, un cebador directo (a) fija como objetivo un locus de un primer acido nucleico diana (g). Un cebador inverso (b) fija como objetivo otro locus del primer acido nucleico diana (g) y tiene una region de complementariedad (c) a una region (d) del cebador directo (e). El cebador directo (e) tiene una region de complementariedad con el segundo acido nucleico diana (h) y el cebador inverso (f) fija como objetivo otra region del segundo acido nucleico diana (h). La FIG. 5B ilustra un ejemplo de la hibridacion de las sondas (a, b, e y f) a acidos nucleicos diana respectivos (g y h), de acuerdo con una realizacion de la invencion. La FIG. 6A ilustra un ejemplo de las regiones complementarias (c) y (d) entre los amplicones (g) y (h), de acuerdo con una realizacion de la invencion. La FIG. 6B muestra la amplificacion de enlace de los amplicones (g) y (h) utilizando la polimerasa (e) para crear un amplicon principal enlazado (i). El producto final es un banco de "amplicones principales" que incluyen los amplicones enlazados (g) y (h), que pueden ser secuenciados a granel. Las etapas de las FIGs. 5-6 se pueden realizar en un recipiente de reaccion o una gotita de emulsion.
En algunas realizaciones, multiples loci son fijados como objetivo en una celula individual, y muchos conjuntos de sondas se pueden multiplexar en un solo analisis, de tal manera que se analizan varios loci o incluso todo el transcriptoma o genoma. La PCR multiplex es una modificacion de la PCR que utiliza multiples conjuntos de cebadores dentro de una unica mezcla de PCR para producir amplicones de diferentes tamanos que son espedficos para diferentes secuencias de ADN. Al fijar como objetivo multiples genes a la vez, se puede conseguir informacion adicional a partir de una unica prueba que de otro modo requerina varias veces los reactivos y mas tiempo para llevarse a cabo. En una realizacion, 10-20 transcripciones diferentes estan fijadas como objetivo en una sola celula y estan enlazadas a un segundo acido nucleico diana (p. ej., enlazadas a una region variable tal como una secuencia mutada del gen, un codigo de barras o una region variable inmune).
En una realizacion, las celulas individuales se encapsulan en microgotas de picolitros acuosas-en-aceite. Las gotitas permiten la compartimentacion de las reacciones de tal manera que la biologfa molecular se puede realizar en millones de celulas individuales en paralelo. Microgotas acuosas-en-aceite monodispersas se pueden generar en dispositivos de microfluidos en intervalos de tamano de 10-150 pm de diametro. Alternativamente, las gotitas pueden ser generadas mediante vortice o por un TissueLyser (Qiagen). Dos realizaciones de disoluciones de aceite y acuosas para la creacion de microgotitas de PCR son: (i) tampon de PCR que contiene 0,5 pg/pL de albumina de suero bovino (New England Biolabs) en combinacion con una mezcla de aceite fluorocarbonado (3M), tensioactivo Krytox 157FSH (Dupont) y PicoSurf (Sphere Microfluidics); y (ii) tampon PCR con Tween 20 al 0,1% (Sigma) combinado con una mezcla de aceite mineral ligero (Sigma), EM90 (Evonik), y Triton X-100 (Sigma). Varios ensayos replicados que cuantifican 1 millon de los amplicones mediante secuenciacion de la siguiente generacion han demostrado que ambas qmmicas forman microgotitas monodispersas que son > 99,98% estables despues de 40 ciclos de PCR. La PCR puede producirse en un tubo estandar de termociclacion, una placa de 96 pocillos o una
5
10
15
20
25
30
35
40
45
50
55
placa de 384 pocillos, utilizando un termociclador estandar (Life Technologies). La PCR tambien puede producirse en chips de microfluidos calentados, o cualquier otro tipo de recipiente que pueda mantener la emulsion y la transferencia de calor.
Despues de la termociclacion y la PCR, el material amplificado debe ser recuperado de la emulsion. En una realizacion, el eter se utiliza para romper la emulsion, y luego se evapora el eter de la capa acuosa/eter para recuperar el ADN amplificado en disolucion. Otros metodos incluyen la adicion de un tensioactivo a la emulsion, congelacion instantanea con nitrogeno Uquido y centrifugacion.
Una vez que los productos enlazados y amplificados se recuperan de la emulsion, existe un cierto numero de metodos para preparar el producto para la secuenciacion a granel. En una realizacion, el amplicon principal se afsla de los amplicones menores utilizando electroforesis en gel. Si el rendimiento no es suficiente, el amplicon principal se amplifica de nuevo utilizando la PCR y los dos cebadores externos. Este material entonces se puede secuenciar directamente mediante secuenciacion a granel. En algunas realizaciones, los cebadores externos se utilizan para producir moleculas que pueden ser secuenciadas directamente. En otras realizaciones, se deben agregar adaptadores al amplicon principal antes de la secuenciacion a granel. Una vez que se sintetiza el banco de secuenciacion, se puede realizar la secuenciacion a granel utilizando metodos estandares y sin modificacion significativa.
2) Enlace Molecular Utilizando la Reaccion en Cadena de la Polimerasa con Transcriptasa Inversa (RT-PCR)
El metodo de la PCR de extension por solapamiento se adapta a la RT-PCR de extension por solapamiento individual en tubo, que amplifica el ADN a partir de las transcripciones de ARN. El metodo RT-PCR combina la smtesis de ADNc y PCR en tubos cerrados sin intercambio de tampon o adicion de reactivos entre las etapas moleculares. Se utilizan enzimas termoestables de la transcriptasa inversa (RT) que soportan temperaturas superiores a 95°C, aunque la RT termoestable no es necesaria si la smtesis de ADNc de la primera cadena se produce antes de la amplificacion por PCR. Por ejemplo, tanto ThermoScript RT (Lucigen) como GeneAmp Thermoestable rTth (Life Technologies) estan disenados y se utilizan en la PCR con transcriptasa inversa en un solo tubo. En una realizacion, se utiliza un conjunto de sondas (o cebadores) de acidos nucleicos para amplificar una primera secuencia de acido nucleico diana y una segunda secuencia de acido nucleico diana para formar un complejo de fusion. La primera secuencia de acido nucleico diana o la segunda secuencia de acido nucleico diana es ARN.
La primera sonda incluye una secuencia que es complementaria a una primera secuencia de acido nucleico diana (p. ej., el extremo 5' de la primera secuencia de acido nucleico diana). La segunda sonda incluye una secuencia que es complementaria a la primera secuencia de acido nucleico diana (p. ej., el extremo 3' de la primera secuencia de acido nucleico diana) y una segunda secuencia que es complementaria a una secuencia exogena. En algunas realizaciones, la secuencia exogena es una secuencia de acido nucleico no humana y no es complementaria a cualquiera de las secuencias de acidos nucleicos diana. La primera y segunda sondas son el cebador directo y el cebador inverso para la primera secuencia de acido nucleico diana.
La tercera sonda incluye una secuencia que es complementaria a la porcion de la segunda sonda que es complementaria a la secuencia exogena y una secuencia que es complementaria a la segunda secuencia de acido nucleico diana (p. ej., el extremo 5' de la segunda secuencia de acido nucleico diana). La cuarta sonda incluye una secuencia que es complementaria a la segunda secuencia de acido nucleico diana (p. ej., el extremo 3' de la segunda secuencia de acido nucleico diana). La tercera sonda y la cuarta sonda son los cebadores directo e inverso para la segunda secuencia de acido nucleico diana.
Las segunda y tercera sondas tambien se denominan los cebadores "internos" de la reaccion (es decir, el cebador inverso para el primer locus y el cebador directo para el segundo locus) y son limitantes en la concentracion (p. ej., 0.01|jM para los cebadores internos y 0.1 jM para todos los otros cebadores). Esto impulsara la amplificacion del amplicon principal preferentemente frente a los amplicones menores. La primera y cuarta sondas se denominan los cebadores "externos".
El metodo incluye amplificar mediante RT-PCR la primera y segunda secuencias de acido nucleico de forma independiente, de manera que la primera secuencia de acido nucleico se amplifica utilizando la primera sonda y la segunda sonda, y la segunda secuencia de acido nucleico se amplifica utilizando la tercera sonda y la cuarta sonda. Utilizando la amplificacion por PCR de extension por solapamiento, se genera un complejo de fusion mediante la hibridacion de las regiones de secuencias complementarias de las secuencias primera y segunda de acido nucleico amplificadas y la amplificacion de las secuencias hibridadas utilizando la primera y cuarta sondas. (Veanse las FIGs. 5-6).
3) Enlace Molecular Utilizando la Reaccion en Cadena de la Ligasa
La reaccion en cadena de la ligasa (LCR) se utiliza para fijar como objetivo y amplificar loci geneticos de interes (Landegren et al., 1988 Science 241:1077-1080. Benjamin et al, 2003 Methods in Molecular Biology 226:135-149;
5
10
15
20
25
30
35
40
45
50
55
Patente de EE.UU. 6.235.472). En la reaccion en cadena de la ligasa, dos sondas de acido polinucleico fijan como objetivo un locus de acido polinucleico de interes. Tras la hibridacion, las dos sondas se ligan mediante una enzima ligasa. En contraposicion con la PCR, la LCR amplifica tanto ARN como ADN, facilitando muchos tipos diferentes de analisis multiplexado. Otra ventaja notable de la reaccion en cadena de la ligasa es la capacidad para la amplificacion espedfica para alelos. Mientras que la PCR amplifica ambos alelos para una variante particular, el proceso de ligamiento de la LCR es alelo-espedfico.
En algunas realizaciones, sondas de LCR se utilizan como un "interruptor" molecular. Por ejemplo, si millones de celulas individuales son rastreados para detectar una variante particular, solo las celulas que incluyen esa variante produciran amplicones principales. La LCR se utiliza para realizar analisis geneticos solo en celulas que contienen una secuencia particular de interes. Celulas que carecen de la secuencia de interes no se amplifican sustancialmente y, por lo tanto, son silenciosas en la reaccion. La LCR tambien se puede multiplexar de forma mas eficiente que la pCr, utilizando cientos de sondas que fijan como objetivo cientos de loci geneticos en una microgotita de una celula individual o reaccion intracelular.
En una realizacion, se formula una unica mezcla de reaccion por LCR/PCR de extension por solapamiento de tampon de un solo tubo utilizando ADN y/o ARN, sondas de LCR, los cebadores de PCR Ampligase (Epicentre), una ADN polimerasa tal como el fragmento Stoffel (Life Technologies) y tampon de reaccion (Tris-HCl 20 mM, KCl 25 mM, MgCl2 10 mM, NAD 0,5 mM, Triton X-100 al 0,01%). El metodo combina la LCR con la PCR de extension por solapamiento para aprovechar los beneficios tanto de la LCR como de la PCR (FIGs. 7-9). Las sondas "internas" se anaden en 1/10 de la concentracion de los otros oligonucleotidos en la reaccion de tal manera que se convierten en un reactivo limitante en ciclos posteriores. Para la reasociacion inicial y el ligamiento, las mezclas se pueden incubar durante 4 minutos a 20°C, durante 5 minutos a 95°C y durante 15 minutos a 60°C. Condiciones estandares de termociclacion de PCR se utilizan para amplificar los amplicones menores y principales (95°C, 5 minutos; [95°C, 30 segundos; 60°C, 30 segundos; 72°C, 30 segundos] x 30 ciclos). El amplicon principal se amplifica adicionalmente mediante seleccion por tamano de gel y otra ronda de amplificacion utilizando solo los cebadores externos. Las FIGs. 7A y 7B ilustran un ejemplo de enlace de secuencia celula individual por reaccion en cadena de la ligasa intracelular combinada con reaccion en cadena de la polimerasa de extension por solapamiento, de acuerdo con una realizacion de la invencion. Un cebador de LCR directo (a) fija como objetivo un locus de un primer acido nucleico diana (g). Un cebador de LCR inverso (b) fija como objetivo otro locus del primer acido nucleico diana (g) y tiene una region de complementariedad (c) a una region (d) del cebador directo (e). El cebador de LCR directo (e) tiene una region de complementariedad con el segundo acido nucleico diana (h) y el cebador de LCR inverso (f) fija como objetivo otra region del segundo acido nucleico diana (h).
La FIG. 8A muestra otro ejemplo de las regiones complementarias entre amplicones (a) y (d), de acuerdo con una realizacion de la invencion. La FIG. 8B muestra la amplificacion del enlace de los amplicones utilizando la polimerasa (e) para crear un amplicon principal enlazado. Las etapas de las FIGs. 7 y 8 se pueden realizar en un recipiente de reaccion o una gotita de emulsion.
La FIG. 9A muestra un ejemplo de un amplicon enlazado (f) de acuerdo con una realizacion de la invencion. La FIG. 9B muestra el amplicon resultante, producido a partir de las etapas mostradas en las FIGs. 8A y 8B. El producto final puede ser un banco de "amplicones principales” y se secuencian a granel.
En otra realizacion, el enlace de la secuencia de celulas individuales por reaccion en cadena de la ligasa intracelular combinada con la reaccion en cadena de la polimerasa de extension por solapamiento se lleva a cabo con el siguiente conjunto de sondas: una primera sonda de LCR que comprende una secuencia que es complementaria a una primera sub-secuencia de acido nucleico diana, una segunda sonda que comprende una secuencia que es complementaria a una segunda sub-secuencia del primer acido nucleico diana y una segunda secuencia que es complementaria a una secuencia exogena, una tercera sonda que comprende la secuencia exogena y una secuencia que es complementaria a una primera sub-secuencia de un segundo acido nucleico diana, y una cuarta sonda que comprende una secuencia que es complementaria a una segunda sub-secuencia de la segunda secuencia de acido nucleico diana. El metodo incluye aislar las celulas individuales con al menos un conjunto de sondas de acido nucleico. La primera y segunda sondas se hibridan al primer acido nucleico y se ligan mediante una enzima ligasa. De manera similar, la tercera y cuarta sondas se hibridan al segundo acido nucleico diana y se ligan mediante una enzima ligasa. A continuacion, las sondas ligadas para los primer y segundo acidos nucleicos diana se hibridan a traves de la region complementaria que comprende la secuencia exogena y la PCR de extension por solapamiento se utiliza para generar un complejo fusionado. Los complejos fusionados pueden ser secuenciados a granel.
4) Enlace Molecular Utilizando Sondas-Candado
Una sonda-candado es una molecula de ADN o de ARN de cadena sencilla, circularizada, con complementariedad con una secuencia diana de interes (Hardenbol et al., 2003 Nature Biotechnology 21: 673-678; Patente de EE.UU. 6.858.412). Despues de la hibridacion a las moleculas diana, una polimerasa llena el hueco entre los dos extremos de la sonda, y una ligasa completa la cadena de polinucleotidos para formar una molecula de polinucleotido
5
10
15
20
25
30
35
40
45
50
55
circularizada. La molecula circularizada se puede amplificar, a continuacion, con la amplificacion por desplazamiento multiple (MDA). La MDA es un metodo de amplificacion isotermico que funciona mediante reasociacion de polinucleotidos de cadena sencilla al molde, seguido de la smtesis de ADN por una enzima de alta fidelidad tal como una 9-29 polimerasa. La PCR inversa tambien se puede utilizar para amplificar solo las moleculas circularizadas, porque cebadores de PCR que amplifican las moleculas circularizadas no amplificaran las sondas de cadena sencilla (Patente de EE.UU. N° 6.858.412).
Una ventaja notable de las sondas-candado frente a la PCR es la capacidad para la amplificacion espedfica para los alelos. Mientras que la PCR amplifica ambos alelos para una variante particular, el proceso de ligamiento de sondas- candado es alelo-espedfico. Al igual que con la LCR, las sondas-candado se utilizan como un "interruptor" molecular. Si millones de celulas individuales son examinadas para rastrear una variante particular, solo las celulas que incluyan dicha variante produciran amplicones principales. Por lo tanto, las sondas-candado se utilizan para realizar el analisis genetico solo en celulas que contienen una secuencia particular de interes. Ademas, en determinadas realizaciones, las sondas-candado estan altamente multiplexadas, fijando decenas de miles de tipos de sonda como objetivo decenas de miles de loci geneticos en una microgotita de celula individual o reaccion intracelular (Vease la Patente de EE.UU. N° 6.858.412).
Sondas-candado se hibridan tfpicamente a las dianas mediante ciclacion durante al menos 20 veces entre 95°C durante 5 min y 55°C durante 20 min (Baner et al., 2003 Nucleic Acids Research 31:e103). Los huecos de nucleotidos individuales se rellenan con Stoffel polimerasa y ligasa tal como Tth ligasa o Ampligase (Epicentre). Las sondas circularizadas son entonces amplificadas utilizando PCR con cebadores universales. Cuando se multiplexan para la PCR de extension por solapamiento, se utilizan dos conjuntos de cebadores universales, uno para cada tipo de sonda-candado. Los cebadores universales contienen regiones de secuencias de solapamiento, lo que permite una PCR de extension por solapamiento estandar despues de la captura de la secuencia inicial por las sondas- candado. (Veanse las FIGs. 10-14). Las sondas tambien pueden ser disenadas para que contengan las secuencias de cebadores adecuadas para la secuenciacion a granel, de modo que el banco se secuencia directamente despues de la amplificacion por PCR.
La FIG. 10 ilustra un ejemplo de los componentes requeridos para un enlace de la secuencia de celulas individuales mediante sondas-candado en combinacion con la reaccion en cadena de la polimerasa de extension por solapamiento, de acuerdo con una realizacion de la invencion. La FIG. 11 muestra las regiones de complementariedad entre una primera sonda-candado (a) y el primer acido nucleico diana (c) y entre una segunda sonda-candado (b) y un segundo acido nucleico diana (d) en una celula individual, de acuerdo con una realizacion de la invencion. Los componentes de la reaccion pueden estar contenidos en un recipiente de reaccion ffsica o en una gotita de emulsion (k). La primera sonda-candado (a) incluye dos regiones separadas que son complementarias al primer acido nucleico diana (c). La segunda sonda-candado (b) incluye dos regiones separadas que son complementarias a un segundo acido nucleico diana (d). Se utilizan una polimerasa y una ligasa (m) para amplificar y ligar el hueco entre regiones complementarias de las sondas-candado (a) y (b).
La FIG. 12 ilustra los amplicones circularizados (g) y (h) resultantes y los cebadores que se utilizan para amplificar los amplicones circularizados, de acuerdo con una realizacion de la invencion. Se utilizan un cebador directo (a) y un cebador inverso (i) para amplificar el amplicon circular (g). Los cebadores directo e inverso (j) y (f) se utilizan para amplificar el amplicon circular (h). El cebador (i) tiene una region (b) que es complementaria a una region del amplicon (g) y una region (c) que es complementaria a la region (d) del cebador (j). El cebador (j) tiene una region (e) que es complementaria al amplicon (h) y una region (d) que es complementaria a la region (c) del cebador (i).
La FIG. 13 es un ejemplo de los amplicones resultantes de la amplificacion de las sondas circulares (g) y (h) de acuerdo con una realizacion de la invencion. En esta figura, la region (a) es complementaria al amplicon (g) y la region (b) es complementaria a la region (c). La region (d) es complementaria al amplicon (h) y la region (c) es complementaria a la region (b).
La FIG. 14 es un ejemplo de amplificacion por PCR de extension por solapamiento de los amplicones utilizando una polimerasa (e), de acuerdo con una realizacion de la invencion. El amplicon (f) resultante incluye secuencias (a), (d) y las secuencias solapantes (b) y (c). El amplicon (f) resultante se puede utilizar para la secuenciacion a granel. Las etapas se pueden realizar en un recipiente de reaccion o una gotita de emulsion (g).
5) Enlace Molecular Utilizando la Circularizacion de Multisondas
En algunas realizaciones, se puede utilizar la circularizacion de multisondas. En la circularizacion de multisondas, dos sondas-candado fijan como objetivo dos loci geneticos. Despues de la hibridacion a las moleculas diana, una polimerasa llena el hueco entre los extremos de las dos sondas, y una ligasa completa las cadenas de polinucleotidos para formar una molecula de polinucleotidos circularizada. (Veanse las FIGs. 1A-1C). La molecula circularizada se puede amplificar a continuacion con la amplificacion de desplazamiento multiple (MDA). La PCR inversa tambien se puede utilizar para amplificar solo las moleculas circularizados, porque cebadores de PCR que amplifican las moleculas circularizadas no amplificaran las sondas de cadena sencilla (Veanse las FIGs. 2-3).
5
10
15
20
25
30
35
40
45
50
55
60
En una realizacion, las sondas se hibridan a dianas ciclando al menos 20 veces entre 95°C durante 5 min y 55°C durante 20 min (Baner et al., 2003 Nucleic Acids Research 31: e103). Los huecos de nucleotidos individuales se rellenan con una polimerasa y ligasa Stoffel. Las sondas circularizadas se amplifican mediante PCR con cebadores universales. Cuando se multiplexan para la PCR de extension por solapamiento, se utilizan los dos conjuntos de cebadores universales, uno para cada tipo de sonda-candado. Los cebadores universales contienen regiones de secuencias de solapamiento, lo que permite la PCR de extension por solapamiento estandar despues de la captura de la secuencia inicial de las sondas-candado (FIGs. 2-3). Las sondas tambien pueden ser disenadas para que contengan las secuencias de cebadores apropiadas para la secuenciacion a granel, por lo que el banco se secuencia directamente despues de la amplificacion por PCR.
La FIG. 1 muestra un ejemplo de enlace de secuencia en una celula individual por circularizacion intra-celular de multisondas de un complejo molecular, de acuerdo con una realizacion de la invencion. Cada una de las sondas tiene una region de complementariedad con cada uno de los loci diana. El complejo incluye dos sondas de acido nucleico (ay b) y dos acidos nucleicos diana (c y d). La celula individual (e) puede estar contenida en un recipiente de reaccion o una gotita de emulsion (j). La FlG. 1A ilustra que la sonda de acido nucleico (a) tiene una primera region (f) que es complementaria a una region en el acido nucleico diana (c), y una segunda region (g) que es complementaria a una region en el acido nucleico diana (d). La sonda de acido nucleico (b) tiene una primera region (h) que es complementaria a una region en el acido nucleico diana (c) y una segunda region (i) que es complementaria a una region en el acido nucleico diana (d). La FIG. 1B ilustra un ejemplo de enlace de secuencia en una celula individual (tambien en un recipiente de reaccion o gotita de emulsion (j)) por circularizacion intra-celular de multisondas de un complejo, de acuerdo con una realizacion de la invencion. Las dos sondas de acidos nucleicos (a y b) se hibridan a las regiones complementarias de los dos acidos nucleicos diana (c y d). La FIG. 1C ilustra un ejemplo de la circularizacion de un complejo de enlace sonda-diana que se produce por amplificacion, de acuerdo con una realizacion de la invencion. En un ejemplo, se utiliza una amplificacion mediada por drculo rodante por 9-29 polimerasa para circularizar las regiones extremas (f) de las dos sondas de acido nucleico (a) y (b).
La FIG. 2 muestra un ejemplo de amplificacion de un complejo de enlace circularizado sonda-diana (a) utilizando una polimerasa (b), de acuerdo con una realizacion de la invencion. En algunas realizaciones, una 9 -29 polimerasa se utiliza en una amplificacion mediada por drculo rodante, y se generan copias (b y c) del complejo sonda-diana circularizado. Ademas, la FIG. 3 ilustra un ejemplo de la amplificacion de un complejo de enlace sonda-diana (a) circularizado utilizando una polimerasa (b) y cebadores (c y d), de acuerdo con una realizacion de la invencion. Los cebadores (c y d) se utilizan para amplificar la region del complejo sonda-diana circularizado que es complementaria al acido nucleico diana. Se generan multiples copias (e) de un amplicon lineal de acido polinucleico de doble cadena y se secuencian a granel.
6) Metodos que Utilizan Acidos Nucleicos de codigo de barras
La secuenciacion a granel requiere la destruccion de celulas o microgotitas de emulsion, de manera que todos los analitos de acido polinucleico se agrupan en una sola mezcla de reaccion. Tfpicamente, no es posible un rastreo de una diana particular de la secuencia a partir de los datos de secuenciacion a granel para una celula en particular. Sin embargo, muchas aplicaciones requeriran el rastreo posterior de las secuencias de sus celulas individuales originales. Por ejemplo, un investigador puede desear analizar una poblacion de celulas para los patrones de expresion de celulas individuales para dos transcripciones de ARN. La amplificacion por PCR con transcriptasa inversa de extension por solapamiento de dos dianas de transcripcion de ARN, seguida de secuenciacion a granel no es adecuada para este tipo de analisis debido a que todas las transcripciones se mezclan juntas, y las transcripciones de celulas de alta expresion son indistinguibles de las transcripciones de las celulas de baja expresion. Para abordar este problema, se utilizan codigos de barras de acido polinucleico. Cada una de las microgotitas de emulsion de una celula individual o un recipiente de reaccion ffsico contiene un solo codigo de barras acido polinucleico clonal unico. Este codigo de barras se enlaza entonces a los acidos polinucleicos diana (es decir, transcripciones de ARN), y se utiliza para rastrear los amplicones principales a una celula individual (Veanse las FIGs. 18-25). Con un seguimiento posterior de cada una de las secuencias a un celula individual original es posible tabular los datos geneticos para cada una de las celulas individuales, que entonces permite la cuantificacion de celulas individuales (es decir, los niveles de expresion genica de celulas individuales).
En una realizacion, el oligonucleotido enlazador de codigo de barras esta muy diluido, de manera que menos de 1% de las microgotitas de emulsion en picolitros porta mas de un codigo de barras enlazador. Esto permite el enlace de una celula individual a un solo codigo de barras. El oligonucleotido enlazador de codigo de barras se amplifica por PCR utilizando universalmente cebadores dentro de cada una de las gotitas, de manera que cada una de las gotitas contendra millones de copias de solo una secuencia de codigo de barras enlazador, y que el codigo de barras sera unico para esa gotita (FIGs. 18-21). La dilucion sigue la estadfstica de Poisson, de modo que para P (k = 1) “ 0,99, los codigos de barras de enlazador necesitan ser diluidos a 0,01. El codigo de barras esta entonces ffsicamente enlazado a la molecula diana por PCR de extension por solapamiento. Los codigos de barras pueden ser producidos por un cierto numero de metodos. En una realizacion, un banco de decameros aleatorios se subclona en un vector plasmfdico (p. ej., Life Technologies). Esto produce un banco de plasmidos mixtos con > 1 millon de codigos de barras de decamero unicos. A continuacion, los plasmidos se transforman en bacterias y se recogen 3.840 clones.
5
10
15
20
25
30
35
40
45
50
55
60
Los clones son secuenciados por secuenciacion capilar (Sequetech) y se archivan en materiales de glicerol en placas de 384 pocillos. Seguidamente, los clones se digieren en sitios de restriccion en cualquier lado de las inserciones de decamero aleatorias para producir un fragmento de ~100 pb. Estos fragmentos son entonces biotinilados utilizando el fragmento de Klenow con procedimientos estandares. Un lavado entre las etapas moleculares se lleva a cabo con ayuda de tecnologfa de perlas Ampure (PerkinElmer). Los fragmentos biotinilados se fijan entonces a perlas de estreptavidina de 17 pm de diametro (Life Technologies) en cada uno de los pocillos, produciendo 3.840 poblaciones clonales de perlas de codigo de barras. La Amplificacion de acidos nucleicos utilizando emulsiones de perlas se describe en la Patente de EE.UU. N° 7.842.457.
En una realizacion, el metodo proporciona perlas de codigo de barras fijadas a secuencias de acidos nucleicos. Un banco de 15-meros al azar se subclona en un vector de plasmido (Life Technologies). Esto produce un banco de plasmidos mezclados con > 1 billon de codigos de barras de 15-meros unicos. Los fragmentos biotinilados se fijan a continuacion a perlas de estreptavidina de 17 pm de diametro (Life Technologies). La mezcla plasmidos-codigos de barras se diluye en una mezcla de PCR de manera que el 99% de las gotitas que contienen un plasmido contendran solo un unico plasmido clonal. La mezcla de PCR contiene nucleotidos biotinilados, de manera que los codigos de barras amplificados se biotinilan. Entonces, perlas de estreptavidina se hacen fluir en esta mezcla de PCR para encapsular las perlas individuales en microgotitas. Tfpicamente, se encapsulan al menos 10 millones de perlas, y luego las mezclas de perlas/plasmido se termociclan para amplificar y biotinilar los codigos de barras. Las perlas de codigo de barras se recuperan entonces y se pueden utilizar en el metodo de codigo de barras de gotitas.
En otra realizacion, un dispositivo de microfluidos inyecta perlas recubiertas con oligonucleotidos de codigo de barras de enlazador clonales en las microgotitas de la emulsion de celulas individuales. Un dispositivo de este tipo permite la visualizacion de perlas individuales y celulas individuales en cada una de las gotas, eliminando el requisito de oligonucleotidos de codigos de barras de enlazador altamente diluidos. En esta realizacion, tambien se utiliza la PCR para amplificar el oligonucleotido de codigo de barras de enlazador, de forma que cada una de las gotitas contiene millones de copias de la misma secuencia de codigo de barras, pero cada uno de los codigos de barras sena unico para una microgotita individual. El codigo de barras es entonces enlazado a la secuencia de acido nucleico diana utilizando la PCR de extension por solapamiento. Durante la amplificacion por PCR de extension por solapamiento, las regiones de secuencias complementarias de las primera y segunda secuencias de acidos nucleicos amplificados actuan como cebadores para la extension en ambas cadenas en cada direccion mediante moleculas de ADN polimerasa. En posteriores ciclos de la PCR, los cebadores externos ceban la secuencia condensada completa de tal modo que se duplica por la ADN polimerasa. Este metodo produce una pluralidad de complejos de fusion.
En otra realizacion, el metodo incluye las etapas de proporcionar una agrupacion de secuencias de codigo de barras unica, en donde cada una de las secuencias de codigo de barras esta enlazada a un gen de resistencia a la seleccion, proporcionando una poblacion de celulas individuales, transfectando la poblacion de celulas individuales con la agrupacion de secuencias de codigo de barras unica, seleccionando celulas que comprenden una secuencia de codigo de barras unica y el gen de resistencia a la seleccion, y aislando cada una de las celulas seleccionadas en recipientes de reaccion o microgotitas de la emulsion. En algunas realizaciones, el gen de resistencia a la seleccion codifica la resistencia a gentamicina, neomicina, higromicina o puromicina. El gen de resistencia a la seleccion permite seleccionar celulas que han incorporado la secuencia de codigo de barras en la celula. Las celulas que carecen de plasmido tambien carecen del gen de resistencia a la seleccion y, por lo tanto, se exterminan en presencia de una sustancia qrnmica de seleccion de mairnferos tales como gentamicina, neomicina, higromicina o puromicina.
La FIG. 15 ilustra un ejemplo de desconvolucion de un banco de plasmidos mediante reaccion en cadena de la polimerasa con cola con codigo de barras (codigo de barras en el extremo 5'), que es seguido por secuenciacion a granel e informatica, de acuerdo con una realizacion de la invencion. La secuencia de codigo de barras se puede rastrear de nuevo a una posicion de pocillo y placa, la secuencia de codigo de barras se puede rastrear, a continuacion, a una secuencia de acido nucleico y la secuencia de acido nucleico se rastrea de nuevo a un pocillo. Cada uno de los cebadores en (a) y (b) tiene una etiqueta con codigo de barras en el extremo 5'. Los acidos nucleicos diana en (c) y (d) se amplifican utilizando los cebadores en (a) y (b). Las etapas se pueden realizar en recipientes cerrados o en gotitas de emulsion tal como se muestra en (c) y (d). La FlG. 16 tambien muestra un ejemplo de la amplificacion (e, f) de dos acidos nucleicos diana (A y B), utilizando cebadores que incluyen secuencias de codigos de barras, de acuerdo con una realizacion de la invencion. Los amplicones resultantes que incluyen las secuencias de codigos de barras se muestran en (g) y (h). Ademas, la FlG. 17 ilustra un ejemplo simplificado de rastreo renovado de una secuencia de codigo de barras en un amplicon a una diana celular (A o B), y el rastreo renovado de la diana celular a un lugar ffsico (c, d) (p. ej., un pocillo), de acuerdo con una realizacion de la invencion.
Ademas, la FIG. 18 ilustra los componentes para el enlace molecular entre dos transcripciones (g y h) y una secuencia de codigo de barras molecular (k), de acuerdo con una realizacion de la invencion. Las dianas (g y h) pueden ser transcripciones de ARN, y la secuencia de codigo de barras molecular (k) esta flanqueada por sitios de cebado universales. Solo una copia del oligonucleotido de codigo de barras molecular esta contenida en la gotita de
5
10
15
20
25
30
35
40
45
50
55
emulsion o recipiente de reaccion (j), y cebadores de PCR universales amplifican el oligonucleotido para producir una pluralidad de acidos polinucleicos de codigo de barras clonales. Un cebador directo (a) y cebador inverso (m) se utilizan para amplificar el acido nucleico diana (g). Un cebador directo (n) y cebador inverso (f) se utilizan para amplificar el acido nucleico diana (h). El cebador inverso (m) incluye una region (b) que es complementaria al acido nucleico diana (g) y una region (c) que es complementaria a la region (d) en el cebador (n). El cebador (n) incluye una region (e) de complementariedad al acido nucleico diana (h) y una region (d) de complementariedad a la region (c) del cebador (m). En algunas realizaciones, se pueden enlazar mas de dos dianas, y las dianas tambien pueden ser ADN.
Ademas, la FIG. 19 muestra un ejemplo de la amplificacion de los acidos nucleicos diana (g y h) usando cebadores tal como se muestra, de acuerdo con una realizacion de la invencion. El cebador directo (a) es complementario al acido nucleico diana (g), y el cebador inverso (b) para el acido nucleico diana (g) incluye una region (c) que es complementaria a la secuencia de codigo de barras (k). El cebador directo (e) y el cebador inverso (f) se utilizan para amplificar el acido nucleico diana (h). El cebador directo (e) incluye una region (d) que es complementaria a la secuencia de codigo de barras (k).
En la FIG. 20 se muestran amplicones que resultan despues de la amplificacion de dos acidos nucleicos diana y una secuencia de codigo de barras (k), de acuerdo con una realizacion de la invencion. La FIG. 21 ilustra un amplicon fusionado que incluye secuencias de dos acidos nucleicos diana (g y h) y una secuencia de codigo de barras (k) dentro de una gotita de emulsion o recipiente de reaccion (j), de acuerdo con una realizacion de la invencion. El amplicon (“principal”) fusionado puede ser aislado por emulsion inversa y ser secuenciado a granel. En la FIG. 22, las dianas (g y h) pueden ser transcripciones de ARN, y la secuencia de codigo de barras molecular (k) esta flanqueada por sitios de cebado universales. Solo una copia de la secuencia de codigo de barras molecular (k) esta contenida en la gotita de emulsion de una celula individual o recipiente de reaccion (j), y cebadores de PCR universales amplifican el oligonucleotido para producir una pluralidad de acidos polinucleicos de codigo de barras clonales. El cebador directo (a) y el cebador inverso (b) se utilizan para amplificar el acido nucleico diana (g). El cebador directo (n) y el cebador inverso (f) se utilizan para amplificar el acido nucleico diana (h). El cebador inverso (m) incluye una region (b) que es complementaria al acido nucleico diana (g) y una region (c) que es complementaria a la region (d) en el cebador (n). El cebador (n) incluye una region (e) de complementariedad al acido nucleico diana (h) y una region (d) de complementariedad a la region (c) de cebador (m). En algunas realizaciones, se pueden enlazar mas de dos dianas, y las dianas tambien pueden ser ADN.
La FIG. 23 ilustra los cebadores directo e inverso que se utilizan en un enlace molecular entre dos transcripciones (g y h) y una secuencia de codigo de barras molecular (k) unidas a una perla (m), de acuerdo con una realizacion de la invencion. El cebador directo (a) y el cebador inverso (b) se utilizan para amplificar el acido nucleico diana (g). El cebador directo (n) y el cebador inverso (f) se utilizan para amplificar el acido nucleico diana (h). El cebador inverso (m) incluye una region (b) que es complementaria al acido nucleico diana (g) y una region (c) que es complementaria a la region (d) en el cebador (n). El cebador (n) incluye una region (e) de complementariedad al acido nucleico diana (h) y una region (d) de la complementariedad a la region (c) del cebador (m). Los dos acidos nucleicos diana son complementarios a una secuencia de ADN (1). La FIG. 24 es un ejemplo de amplicones que resultan despues de la amplificacion de dos acidos nucleicos diana y una secuencia de codigo de barras (k) unida a una perla (m), de acuerdo con una realizacion de la invencion. La FIG. 25 ilustra un amplicon fusionado que incluye secuencias de dos acidos nucleicos diana (g y h) y una secuencia de codigo de barras (k), dentro de una gotita de emulsion o recipiente de reaccion (j), de acuerdo con una realizacion de la invencion. El amplicon (“principal”) fusionado puede ser aislado por emulsion inversa y secuenciado a granel. Las FIGs. 24-25 ilustran un ejemplo de amplicones que resultan despues de la amplificacion de dos acidos nucleicos diana y una secuencia de codigo de barras (k) unida a una perla (m), de acuerdo con una realizacion de la invencion.
7) Metodos que Utilizan la Amplificacion de Combinacion
La fijacion como objetivo y la amplificacion de loci geneticos en celulas se puede realizar utilizando PCR, LCR, sondas-candado, rT-PCR o circularizacion multi-sonda. Se puede utilizar cualquier combinacion de estos metodos para fijar como objetivo y amplificar diferentes loci. Por ejemplo, un enfoque de amplificacion de la combinacion se utiliza para amplificar un locus de ADN genomico y una transcripcion de ARN. En una realizacion, una enzima transcriptasa inversa termoestable, tal como ThermoScript RT (Lucigen) o GeneAmp Thermostable rTth (Life Technologies) se combina con una ADN polimerasa termoestable tal como el fragmento Stoffel o ADN Taq polimerasa. La termociclacion puede inducir la smtesis de la primera cadena de ADNc de la diana de transcripcion de ARN. Una vez que se ha sintetizado el ADNc a partir de la transcripcion de ARN, se realiza una PCR de extension por solapamiento utilizando el ADNc y las secuencias diana de ADN genomico.
8) Metodo de secuenciacion a Granel
Existe un cierto numero de nuevas metodologfas comerciales para la secuenciacion de acido polinucleico. A estas tecnologfas se las alude a menudo como "la secuenciacion de generacion siguiente", "secuenciacion masiva en paralelo" o "secuenciacion a granel”. Estos terminos se utilizan indistintamente para describir cualquier metodo de
5
10
15
20
25
30
35
40
45
50
55
secuenciacion que es capaz de adquirir mas de un millon de etiquetas de secuencias de acido polinucleico en una sola operacion. ^picamente, estos metodos funcionan al hacer mediciones altamente paralelizadas, es decir, el rastreo paralelizado de millones de clones de ADN sobre portaobjetos de vidrio. Los metodos para enlazar multiples dianas de acido polinucleico en celulas individuales se podnan utilizar en combinacion con cualquier metodo de secuenciacion a granel comercializado. Estos metodos incluyen la qmmica de terminacion reversible (Illumina), la pirosecuenciacion utilizando gotitas de emulsion polony (Roche), la secuenciacion de una sola molecula (Pacific Biosciences) y otros (lonTorrent, Halcyon, etc.).
Despues del enlace molecular se llevan a cabo protocolos, y antes de la secuenciacion a granel, es util amplificar espedficamente y purificar amplicones principales para reducir la secuenciacion total requerida para obtener datos utiles. De lo contrario, muchos amplicones menores y otros tipos de secuencias de fondo no deseadas se secuenciaran de forma innecesaria. Esto se logra mediante la PCR utilizando solamente los cebadores externos y el analito de acido nucleico obtenido a partir de las celulas lisadas, seguido de seleccion por tamanos utilizando un metodo tal como electroforesis en gel de agarosa. Otros metodos, tales como las columnas de exclusion por tamanos, electroforesis de microfluidos o filtros de microporos, se podnan utilizar para seleccionar las moleculas de tamano adecuado.
En una realizacion, el metodo proporciona la etapa de realizar una reaccion de secuenciacion a granel para generar informacion de la secuencia de al menos 100.000 complejos fusionados de al menos 10.000 celulas dentro de una poblacion de celulas. En otra realizacion, la reaccion de secuenciacion a granel genera informacion de la secuencia para al menos 75.000, 50.000 o 25.000, o 10.000 complejos fusionados de al menos 10.000 celulas dentro de una poblacion de celulas.
Los complejos fusionados se pueden utilizar entonces para cuantificar el fenomeno biologico o clmico particular de interes. En el caso del analisis de celulas T o B funcionales, clonotipos particulares que expresan moleculas funcionales pueden analizarse determinando primero la secuencia de peptidos CDR3 del complejo fusionado, y luego tabulando los casos de ese peptido CDR3 enlazado a una molecula efectora particular. De esta manera la secuenciacion a granel cuantifica la expansion clonal y la funcion biologica de cada uno de los clonotipos individuales. Cuando los cebadores fijan como objetivo multiples moleculas efectoras y todas las posibles regiones variables se multiplexan en un unico ensayo, se pueden separar clonotipos en compartimientos funcionales. En el caso de enlace entre codigos de barras y dianas de transcripcion, se puede estratificar los datos de secuenciacion a granel mediante codigo de barras y luego tabular los casos de un codigo de barras particular enlazado a una diana de transcripcion. Cuando cebadores que fijan como objetivo multiples transcripciones se multiplexan en un unico ensayo, se pueden utilizar los codigos de barras para inferir patrones de expresion multigenicos para celulas individuales rastreadas de nuevo en cuanto a gotitas individuales. En el caso del enlace entre una secuencia mutante o variable y otras secuencias mutantes o variables, se pueden analizar los datos de secuenciacion a granel para determinar la secuencia en cada uno de los locus en cada una de las moleculas en el banco de secuenciacion a granel, y luego tabular los casos de cada tipo de secuencia. Por ejemplo, si se requiere una mutacion en cada una de las dos dianas enlazadas para producir un fenotipo de la enfermedad, se puede utilizar la cuantificacion del numero de dianas enlazadas con dos mutaciones para detectar la enfermedad en un individuo.
C. Enlace Intracelular en Celulas Fijadas Seguido de Secuenciacion Masiva Paralela
Los metodos moleculares descritos en la seccion B anterior se pueden realizar de forma intracelular en miles de millones de celulas fijas individuales (Embleton et al., 1992, Nucleic Acids Research 20:3831-37; Hviid, 2002 Clinical Chemistry 48: 2115-2123; Patente de EE.UU N° 5.830.663). Las membranas celulares de las celulas sirven como compartimientos de reaccion, permitiendo el enlace entre dos o mas loci geneticos en miles a millones de celulas fijadas individuales analizadas en paralelo. El uso de celulas fijadas como compartimientos de reaccion es mas rentable que un chip microflmdico para hacer microgotitas de emulsion. Ademas, la heterogeneidad en el tamano celular o la morfologfa en una poblacion particular de celulas, es menos probable que interrumpa el metodo de celulas fijadas que el metodo de microgotitas de emulsion. Sin embargo, en algunos casos, la fuga de acidos nucleicos a partir de las celulas puede provocar un ruido de fondo en el analisis genetico molecular, por lo que se debe tener cuidado de lavar las celulas entre etapas moleculares y llevar a cabo un analisis riguroso de la calidad de los analitos. Por lo tanto, en una realizacion, celulas fijadas y permeabilizadas se encapsulan en microgotitas, y la amplificacion se produce utilizando celulas fijadas y permeabilizadas en microgotitas en lugar de celulas lisadas en el interior de microgotitas.
1) Enlace Molecular en Metodos de Celulas Fijadas
El trabajo de los autores de la invencion utilizando la amplificacion del genoma entero (WGA) de celulas individuales y la PCR a partir de celulas individuales fijas ha demostrado que la fijacion de celulas en glutaraldetudo inhibe WGA, pero no la PCR. En cualquier realizacion de protocolos de enlace intracelulares, se debe tener cuidado de asegurar que la fijacion y/o permeabilizacion no inhibe la amplificacion molecular.
5
10
15
20
25
30
35
40
45
50
55
Para la fijacion, se pueden utilizar reactivos tales como glutaraldehudo, paraformaldehudo, IntraStain (Dako), o reactivos similares. Para la permeabilizacion, se pueden utilizar reactivos tales como Triton X-100, Tween-20, IntraStain (Dako), o reactivos similares (Lippincott-Schwartz 2003 Short Protocols in Cell Biology; Celis 2005 Cell Biology: A Laboratory Hadbook). Despues de la fijacion y/o permeabilizacion, las celulas se lavan multiples veces en un tampon tal como solucion salina tamponada con fosfato (PBS). Una vez que las celulas se fijan y/o se permeabilizan, tampones de reaccion que contienen los cebadores/las sondas y enzimas se suministran al compartimiento intracelular sin maquinaria o metodos especiales.
Por ejemplo, cuando se utiliza la RT-PCR para amplificar los loci objetivos en celulas individuales, las celulas fijadas y permeabilizadas se sumergen en tampon de reaccion y la primera cadena de ADNc se sintetiza intracelularmente a 55-70°C durante cuatro horas. Sin el lavado o intercambio de tampon, se podnan entonces utilizar las condiciones de termociclacion de PCR de extension por solapamiento estandar para amplificar y enlazar las dianas. Despues de este procedimiento de amplificacion, la mezcla se lava varias veces con pBs, y el sobrenadante se retiene para el analisis de control de calidad. Las membranas de las celulas resuspendidas son entonces interrumpidas utilizando tampon de lisis alcalina o disoluciones de proteinasa K (Johnson et al., 2010 Human Reproduction 25:1066-75).
Despues de la lisis de las celulas y antes de la secuenciacion a granel, es util amplificar espedficamente los complejos enlazados para reducir la secuenciacion global requerida para obtener datos utiles. Esto se logra mediante PCR utilizando solamente los cebadores externos y el analito de acido nucleico obtenido a partir de las celulas lisadas, seguido de seleccion portamanos utilizando un metodo tal como electroforesis en gel de agarosa.
II. Metodos de Desconvolucion del Banco de Clones Agrupado
Bancos altamente multiplexados de acidos nucleicos se producen a menudo utilizando metodos paralelizados que no logran producir moleculas individuales a una molaridad optimizada para las aplicaciones de interes. El metodo en esta memoria proporciona la smtesis de paralelizado, la desconvolucion y la re-multiplexacion de bancos de acidos polinucleicos. El metodo conserva las ventajas tanto de la smtesis paralelizada como de la optimizacion del clon individual. Estos bancos de acidos polinucleicos se utilizan para una diversidad de aplicaciones, incluyendo pero no limitadas a, amplificacion multiplexada de secuencias de acidos nucleicos diana para la secuenciacion y el analisis (FIGs. 15-17).
A. Metodo de Smtesis de Sonda-Candado
1) Metodo de Desconvolucion de Agrupaciones de Pre-sonda
En una realizacion, se genera una agrupacion de miles de sondas-candado que fijan como objetivo polimorfismos de nucleotidos individuales, o SNP. Precursores de sondas de oligonucleotidos de ADN se sintetizan en agrupaciones (Atactic o NimbleGen). Cebadores universales se utilizan entonces para amplificar por PCR de ADN de doble cadena de la agrupacion de oligonucleotidos (Porreca et al., 2007 Nature Methods 4:931-36). A continuacion, los extremos del banco de amplificacion de doble cadena de PCR se digieren utilizando una enzima de restriccion. Por ejemplo, se utiliza EcoP15I, que escinde 25 pares de bases del sitio de reconocimiento y separa los sitios de union de PCR universales. EcoP15I es un ejemplo de una enzima que es adecuada para la subclonacion, y productos no escindidos no afectan a etapas moleculares aguas abajo. El banco digerido se subclona en vectores de plasmidos de diseno personalizado que confieren resistencia a la ampicilina. Los plasmidos se transforman entonces en cultivos bacterianos bajo seleccion con un antibiotico.
La FIG. 4 ilustra un ejemplo de amplificacion de un complejo de enlace circularizado sonda-diana (a) en una celula individual (b), de acuerdo con una realizacion de la invencion. La amplificacion se produce por transformacion en bacterias y posterior seleccion con antibioticos. El amplicon (a) contiene un gen resistente a antibioticos y celulas (c) que se transforman con el amplicon se seleccionan en presencia de antibioticos. No se seleccionan las celulas sin el complejo sonda-diana (d) circularizado.
2) Sintesis de sondas de cadena sencilla en masa
En algunas realizaciones, un material bacteriano que contiene un banco mixto de miles de clones, fijando cada uno como objetivo un SNP particular, se utiliza para la smtesis de sondas de cadena sencilla en masa. Por ejemplo, los cultivos bacterianos se extienden sobre placas de agar LB bajo seleccion con ampicilina, y luego se recogen colonias individuales. A continuacion, la PCR con cebadores con codigo de barras se utiliza para amplificar la secuencia de la sonda y regiones de cebado flanqueantes universales. El resultado es un amplicon que contiene tanto la secuencia de la sonda como un codigo de barras que se puede rastrear de nuevo a un solo pocillo. En una realizacion, un codigo de barras molecular unico indicara una posicion particular del pocillo en una placa de 384 pocillos particular. Por ejemplo, el sistema podna tener 3.840 codigos de barras unicos que indican las posiciones de los pocillos y el numero de placas para 3.840 PCRs en una de las diez placas de 384 pocillos. Para desconvular un banco de 10.000 complejos de clones, se realizan cuatro rondas de desconvolucion utilizando el conjunto de 3.840 PCRs con codigo de barras, y sobremuestreando y detectando un total de 15.360 clones. Para cada una de las
5
10
15
20
25
30
35
40
45
50
55
rondas de desconvolucion, los productos de PCR pueden entonces agruparse y secuenciarse utilizando cualquier metodo de secuenciacion principal.
Con las secuencias de la sonda adaptadas a un codigo de barras, se puede entonces utilizar un algoritmo de desconvolucion para desconvular el banco. Debido a que el codigo de barras se corresponde con la secuencia de insercion, se crea una tabla que coincide con la secuencia de codigo de barras para el pocillo y la placa originales y, en consecuencia, esto coincide con la secuencia de insercion para un pocillo. Los clones bacterianos pueden ser entonces almacenados como materiales de glicerol, y las secuencias de estos materiales pueden ser catalogadas en una base de datos y almacenadas a -80°C.
Para sintetizar sondas-candado de cadena sencilla de los materiales de glicerol de molde, se utiliza una derivacion de la tecnica de SMART (Krishnakumar et al., 2008 PNAS 105:9296-9301). En una concentracion alta, este metodo implica la digestion (i) de un ADN de doble cadena con una endonucleasa de restriccion; (ii) la desfosforilacion del "extremo pegajoso"; (iii) la digestion del segundo extremo del ADN de doble cadena con una segunda endonucleasa de restriccion; y (iv) la digestion de la cadena desfosforilada de ADN utilizando una exonucleasa A. En primer lugar, los clones deseados se recogen, y despues se cultivan en placas de 384 pocillos. Despues de la incubacion durante la noche, se evalua la densidad optica de cada uno de los cultivos, y luego se igualan los materiales. Se agrupan 5 |jL de los cultivos bacterianos normalizados, y la agrupacion de plasmido se purifica utilizando metodos estandares (Qiagen). A continuacion, se utiliza un conjunto de cebadores de PCR universales para generar una agrupacion de amplicones de PCR de doble cadena. La mezcla de la PCR resultante se somete entonces a digestion con una enzima de restriccion, tal como Haelll (NEB), seguido de desfosforilacion con fosfatasa alcalina de camaron (SAP). Despues de la desfosforilacion, el analito se digiere con una enzima de restriccion tal como BstUI (NEB). Este producto puede entonces ser digerido con exonucleasa A (NEB), produciendo moleculas de ADN de cadena sencilla. Finalmente, el ADN de cadena sencilla (ADNss) se purifica a partir de cualquier ADN de doble cadena no digerido utilizando un kit comercial (Zymo Research). De este modo, se sintetizan en paralelo cientos de miles de sondas.
B. Desconvolucion del Clon Celular
Los metodos en la Seccion II. A. tambien se pueden utilizar para desconvular bancos mixtos de celulas u organismos con diferentes caractensticas geneticas subyacentes. El objetivo es separar el banco mixto de clones en compartimientos de reaccion, realizar PCR con codigo de barras, seguido por secuenciacion principal en los clones, y a continuacion mapeando los datos de secuencia de nuevo a los clones en los compartimientos de reaccion. En un ejemplo, una poblacion de celulas de mairnfero se somete a mutagenesis y luego poblaciones clonales de celulas mutagenizadas se afslan de la poblacion mixta. En esta realizacion, las celulas mutagenizadas individuales estan ordenadas en compartimientos de reaccion, y despues se realiza una PCR con codigo de barras fijada como objetivo o sondas-candado en loci geneticos de interes. Los datos de secuenciacion a granel se utilizan para rastrear de nuevo los clones originales, y luego los materiales de clones ffsicos se utilizan para una investigacion o uso adicional.
EJEMPLOS
A continuacion se presentan ejemplos de realizaciones espedficas para llevar a cabo la presente invencion. Los ejemplos se ofrecen para fines ilustrativos solamente, y no pretenden limitar el alcance de la presente invencion de modo alguno. Se han hecho esfuerzos para asegurar la precision con respecto a los numeros utilizados (p. ej., cantidades, temperaturas, etc.), pero, por supuesto, se debenan permitir algunos errores y desviaciones experimentales.
La practica de la presente invencion empleara, a menos que se indique lo contrario, metodos convencionales de la qmmica de protemas, bioqmmica, tecnicas de ADN recombinante y farmacologfa, dentro de la experiencia de la tecnica. Tales tecnicas se explican completamente en la bibliografia. Vease, p. ej., T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., edicion actual); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2a edicion, 1989); Methods in Enzymology (S. Colowick y N. Kaplan eds., Academic Press, Inc.); Remington’s Pharmaceutical Sciences, 18a Edicion (Easton, Pensilvania: Mack Publishing Company, 1990); Carey y Sundberg, Advanced Organic Chemistry 3a Ed. (Plenum Press) Vols. A y B (1992).
Ejemplo 1: Metodos de Analisis de celulas T
El sistema inmune responde a la enfermedad mediante la induccion de respuestas celulares. Casi toda la inmunologfa esta involucrada en la deteccion de la expansion o contraccion del clonotipo en respuesta a un antfgeno y/o el analisis funcional de los clonotipos expandidos o contrafdos. Descritos en este ejemplo son metodos que aprovechan la informacion contenida en la respuesta inmune para diagnosticar y tratar la enfermedad. Celulas activas y/o de la memoria son particularmente informativas, ya que estas celulas indican una respuesta inmune funcional a una enfermedad y, por lo tanto, tienen un alto contenido de informacion. Regiones de ADN variables y las transcripciones de ARN se analizaron en celulas individuales a partir de poblaciones de celulas inmunes y/o de la
5
10
15
20
25
30
35
40
45
50
55
memoria activadas, y luego se correlacionaron con la enfermedad. Estos perfiles se utilizaron para desarrollar diagnosticos no invasivos, diagnosticos de alto valor que informan de los reg^enes de tratamiento y los nuevos agentes terapeuticos.
Celulas T incluyen receptores de celulas T (TCR) que reconocen antigenos y controlan la respuesta inmune. El receptor de celulas T se compone de dos subunidades: ay p o y y 6. Los metodos actuales para examinar las celulas T por sus receptores de celulas T en su inmensa mayona de secuencias de subunidades del receptor de celulas T a partir de poblaciones a granel que van desde unas pocas a millones de celulas. Esto resulta en un catalogo de secuencias de la subunidad (a o 6) que son disociadas de la otra secuencia de la subunidad correspondiente que se encuentra en las celulas individuales (p o y). Esto da una informacion del nivel de la poblacion sobre la diversidad de receptores de celulas T, pero no da una descripcion de los receptores de celulas T individuales en celulas individuales por las dos subunidades (ay p o yy 6). Mediante el enlace de las secuencias en una celula individual utilizando los metodos en las Secciones I. A-C, los TCRs de celulas individuales en poblaciones mixtas se analizan con una resolucion mas fina, y esto permite un mapeado sin precedentes de la diversidad de celulas T humanas.
Las secuencias de subunidades TCR y moleculas de funcionalidad inmunes fueron enlazadas utilizando los metodos descritos en las secciones I. A-C. Este enfoque, denominado "secuenciacion de celulas T funcional", se centro espedficamente en las celulas T que puedan tener una funcion clinica o biologicamente relevante. Por ejemplo, la funcion inmune de una celula T se indica por la expresion de TCR clonales y moleculas de senalizacion tales como la interleucina-4 (IL-4). Celulas T naifs expresan TCR clonales, pero no expresan las moleculas de senalizacion tales como IL-4, y tienen diferentes funciones inmunes. El TCR se enlazo a la molecula de senalizacion que, a su vez, se enlazo al TCR de la funcion clinica. Los cebadores que amplifican el repertorio completo de TCRp estaban enlazados a una unica molecula de efector inmune tal como IL-4. Los cebadores que amplifican el repertorio completo de TCRp estaban enlazados a docenas de moleculas de efector inmune, resultando en un fenotipo completo de celulas T para cada uno de los clonotipos de celulas T en el ensayo.
Ejemplos de moleculas que estan asociadas con la funcion inmunologica y que estan enlazadas a una secuencia de TCR incluyen, pero no se limitan a: interleucina-2 (IL-2), interleucina-4 (IL-4), interferon gamma (IFNy), interleucina- 10 (IL-10), interleucina-1 (IL-1), interleucina-13 (IL-13), interleucina-17 (iL-17), interleucina-18 (IL-18), factor de necrosis tumoral alfa (TNFa), factor de necrosis tumoral beta (TNFI3), factor de transcripcion de la caja T 21 (TBX21), caja forkhead P3 (FOXP3), cumulo de diferenciacion 4 (CD4), cumulo de diferenciacion 8 (CD8), cumulo de diferenciacion 1d (CD1d), cumulo de diferenciacion 161 (CD161), cumulo de diferenciacion 3 (CD3) y factor de transcripcion de la caja T TBX21 (T-BET).
La cadena p de TCR fue ligada a una molecula asociada con la funcion inmune. En otro metodo a modo de ejemplo, los TCR ay p, o los TCR y y 6, o cualquiera de las subunidades individuales, estaban enlazadas a las moleculas de funcionalidad inmunes. Se utilizaron cebadores optimizados publicados para la amplificacion de TCR genomico recombinado (Robins et al., 2009 Blood 114:4099-107). Gran parte de la variabilidad peptfdica del TCR estaba codificada en CDR3p, que se formo por recombinacion entre los segmentos variables (V), de diversidad (D) y de union (J) no contiguos en los loci de la cadena b (Wang et al., 2010 PNAS 107:1518-1523). Tambien se pueden utilizar cebadores de PCR que fijan como objetivo el locus CDR3p, previamente publicados (Robins et al., 2009 Blood. 114:4099-107; Robins et al., 2010 Science Translational Med 2:47ra64). Este conjunto de cuarenta y cinco cebadores directos y trece cebadores inversos amplifican la region CDR3p genomica recombinada de ~ 200 pares de bases para la amplificacion multiplex del complemento completo de CDR3p de una muestra de celulas mononucleares de sangre periferica humana. La region CDR3p comienza con la segunda cistema conservada en la region 3' del segmento Vp y termina con la fenilalanina conservada codificada por la region 5' del segmento Jp (Monod et al., 2004 Bioinformatics 20:i379-i385). Por lo tanto, las secuencias amplificadas se tradujeron informaticamente para localizar la cistema conservada, obtener la secuencia de peptidos intermedia y tabular los recuentos de cada uno de los clones unico en la muestra.
Ejemplos de cebadores que pueden ser utilizados para la amplificacion multiplex de secuencias de TCR y el enlace a diversas moleculas de efector inmunes se muestran en la Tabla 2. Estos cebadores se han utilizado, por ejemplo, con los metodos de la Seccion I. A-C, para amplificar y enlazar secuencias TCR a diversas moleculas de efector inmunes.
Ejemplo 2: Protocolo de Alto Rendimiento para la Construccion del Banco de Repertorio de TCRB
En una realizacion, se implemento un protocolo de alto rendimiento para la construccion de bancos de repertorio de TCRp humano o de raton. Los bancos fueron secuenciados directamente en la plataforma de secuenciacion de generacion siguiente GAIIx (Illumina). Para las muestras humanas, se realizo una PCR multiplex utilizando un conjunto de 20 cebadores para amplificar los 50 segmentos V y 10 cebadores para amplificar los 13 segmentos J. Los bancos de cebadores generaron bancos que eran el complemento inverso de la secuencia de TCRp nativa. Esto permitio la secuenciacion desde el lado J de las construcciones sin manipulacion adicional. Los cebadores tambien teman colas con la misma secuencia que una parte del adaptador de banco TruSeq de Illumina. Los 30 cebadores
5
10
15
20
25
30
35
40
45
50
se agruparon en una sola PCR de 400 pl, que contema el ADN genomico de al menos 5x105 celulas. Las reacciones fueron luego termocicladas durante no mas de 25 ciclos, dependiendo del numero de celulas de entrada. Despues de la termociclacion se utilizo una columna de PCR (Qiagen) para retirar los cebadores. A continuacion, se realizo una segunda ronda de PCR, utilizando una parte alfcuota del analito purificado de la primera ronda y un conjunto de cebadores universales. Los cebadores universales para la segunda ronda de PCR se reasociaron a las colas de los primeros cebadores, proporcionando productos finales de PCR que teman la secuencia de adaptador de la secuenciacion completa Illumina condensada a un banco de secuencias de TCRp. Los cebadores universales tambien teman etiquetas de codigo de barras, lo que permitio la multiplexacion de docenas de muestras en una sola pista de secuenciacion de siguiente generacion. Finalmente, los bancos fueron purificados con gel de seleccion por tamanos y fueron cuantificados con un kit de PCR cuantitativa (Kapa Biosystems) antes de la secuenciacion. Utilizando este protocolo se construyeron y secuenciaron mas de 300 bancos de TCRp.
La FIG. 31 muestra un flujo de trabajo simplificado para la generacion de alto rendimiento de bancos de repertorio de TCRp. La primera ronda utilizo un conjunto de 30 cebadores para amplificar el repertorio completo de TCRp y fija regiones de cebado universales. La segunda ronda amplifico el repertorio con cebadores universales y anadio secuencias para la secuenciacion de siguiente generacion.
Ejemplo 3: Optimizacion del Protocolo Utilizando una Agrupacion de 48 complejos de Clones del plasmido TCRB
El verdadero contenido de cualquier repertorio de TCRp particular no se conoce, por lo que un repertorio de TCRp endogeno no puede servir como un patron de oro para la optimizacion del protocolo. Una agrupacion de 48 complejos de clones plasmfdicos TCRp de raton fue disenada para actuar como molde para la optimizacion del protocolo. En primer lugar, se realizo la amplificacion multiplexada del repertorio de TCRp de raton tal como se describe en el Ejemplo 2. Los productos de PCR se subclonaron utilizando el vector TOPO-TA (Life Technologies), se transformaron post-ligamiento en celulas competentes TOP10 (Life Technologies) y se escogieron 48 colonias transformadas. A continuacion, los clones se secuenciaron por secuenciacion de Sanger para identificar las secuencias de clonotipo TCRp. Todos los clones eran unicos, y representaban una amplia gama de posibles combinaciones V-Jp. Los plasmidos se mezclaron luego en un solo tubo, a traves de tres ordenes de magnitud y con seis replicas a cada una de las concentraciones.
La mezcla de 48 complejos se utilizo para optimizar el protocolo de amplificacion de TCRp. Se optimizaron la metodologfa de purificacion despues de la primera y segunda etapas de PCR, el numero de ciclos en la primera PCR y la temperatura de reasociacion en la primera PCR. Se utilizo la columna WA PCR o la escision del gel para la tecnologfa de purificacion. Debido al cebado falso erroneo, la primera ronda de PCR produjo multiples bandas, ademas de una banda principal en el intervalo de tamanos diana de 150-200 pb. La escision del gel separo el material no deseado, pero el proceso fue tedioso y resulto en una perdida de hasta el 75% del material deseado. Protocolos con un menor numero de primeros ciclos de amplificacion por PCR producen tfpicamente una desviacion de la amplificacion menos grave, mientras que la desviacion de la amplificacion es tfpicamente distorsionada en los protocolos con > 30 ciclos. La temperatura de reasociacion controla el rigor de los eventos de cebado, produciendo a temperaturas mas bajas rendimientos mas altos, pero menos especificidad.
68 bancos de Illumina se construyeron utilizando la mezcla de 48 plasmidos y variando los parametros del protocolo tal como se describe anteriormente. Los bancos fueron secuenciados en una maquina de secuenciacion de siguiente generacion (Illumina) para obtener > 500k de etiquetas de 80 pb de extremos pareados para cada uno de los bancos. Para analizar los datos de secuenciacion, cada una de las etiquetas de secuencia 2x80 pares de bases se alineo con las secuencias de los 48 clonotipos conocidos para obtener el mejor emparejamiento. Se conto el numero de etiquetas alineadas a cada uno de los plasmidos para cada uno de los bancos y, a continuacion, estos resultados se correlacionaron con las relaciones esperadas de los clones de plasmido de entrada. Se realizo un analisis de rearesion lineal para adaptarse a cada uno de los conjuntos de datos (vease la Tabla 1: correlacion del rendimiento, Rrde 1, y una pendiente de 1. El protocolo utilizo 15 ciclos de amplificacion para la primera PCR, una temperatura de reasociacion de 61°C, una purificacion en columna por PCR despues de la primera PCR, y purificacion en gel despues de la segunda PCR.
Tabla 1. Analisis de experimentos de optimizacion de protocolo piloto seleccionados. R2y la pendiente se calcularon a partir de un analisis de regresion entre el recuento observado de las secuencias en cada uno de los bancos frente al recuento de entrada conocido. Las condiciones en la fila 3 (negrita) son un ejemplo de un protocolo optimizado.
Ciclos de 1a PCR
Ta de 1a PCR Barrido en 1a PCR Barrido en 2a PCR R2 Pendiente
15
57 columna gel 0,56 0,54
15
59 columna gel 0,7 0,68
15
61 columna gel 0,72 0,71
15
63 columna gel 0,69 0,7
25
57 columna gel 0,47 0,43
25
59 Columna gel 0,44 0,4
5
10
15
20
25
30
35
40
45
50
25
61 Columna gel 0,45 0,45
25
63 Columna gel 0,41 0,39
35
57 Columna gel 0,47 0,41
35
59 Columna gel 0,43 0,37
35
61 Columna gel 0,42 0,4
35
63 Columna gel 0,41 0,4
Ejemplo 4: Analisis de datos del Repertorio de TCRB
Debido a que el repertorio de TCRp contiene tantos como 5x106 clonotipos, y las regiones CDR3 a menudo difieren en solo unos pocos nucleotidos, una plataforma de analisis de encargo sofisticada era necesaria solo para identificar los clones en el banco. Los metodos de tiempo de respuesta de alineacion rapida, tales como BLAST (Altschul et al., 1990), BLAT (Kent, 2002) y SOAP (Li et al., 2008) eran inadecuados para la tarea en cuestion, ya que ocasionaban muchos emparejamientos falsos. Ademas de ello, los metodos de tiempo de respuesta de alta precision tales como Smith-Waterman (Smith y Waterman, 1981) eran incomodamente lentos para este tipo de analisis. Por ultimo, todos estos metodos requerinan un enorme banco de referencia (1015 diversidad) de todas las posibles secuencias de CDR3 de nucleotidos, lo cual es una carga computacional.
Para hacer frente a estos problemas, se construyo un algoritmo que es mas rapido que cualquier metodo actual en casi un orden de magnitud, y que tiene la misma precision que los metodos de alineacion estandares. Se genera una tabla de "palabras" de 4-8 nucleotidos que identifican de forma unica los segmentos V y J de raton o ser humano dentro de la region amplificada. La validez de cada emparejamiento se testa mediante la identificacion de la distancia a y la secuencia de la segunda cistema conservada. El emparejamiento fue aceptado como correcto solo si tanto la distancia como la secuencia confirman el emparejamiento. Utilizando datos de los experimentos de secuenciacion del repertorio de TCRp de los autores de la invencion, estos identificaron tipicamente ~ 99.98% de combinaciones V-Jp sin ambiguedades. Las lecturas restantes fueron descartadas.
Tambien emplearon otras dos etapas de control de calidad: (i) la region de CDR3 no debe contener ninguna secuencia de errores en forma de bases no exigidas; y (ii) la region de CDR3 esta en el marco definido por la segunda cistema conservada. Si se pasan todas las pruebas de calidad, el metodo identifico la secuencia codificadora de la protema de la region de CDR3 dentro del marco de lectura conocido para ese gen particular. Este algoritmo aseguro velocidad, precision y bajos indices de error. Se puede adaptar facilmente para uso con otras familias de genes variables tales como TCRa o IgH.
Los autores de la invencion realizaron un cierto numero de experimentos para demostrar la utilidad de sus protocolos para la secuenciacion de TCRp profundo. Realizaron trasplantes de medula osea de ratones en contextos geneticos coincidentes y no coincidentes. Para determinar el impacto sistemico de estos eventos de trasplante en los ratones, se examinaron los repertorios de celulas T del colon. Los clonotipos de TCRp mas comunes en colones de trasplantes de medula osea replicados no coincidentes estaban mas estrechamente relacionados que los clonotipos mas comunes de TCR en un colon de trasplante singenico, especialmente en la parte superior del 1% de los clones. Los perfiles de los colones de control fueron casi identicos en el 1% de los clonotipos. Estos datos indican que los protocolos descritos en esta memoria producen datos de calidad, cuantitativos de utilidad a los clientes de investigacion.
Ejemplo 5: Construccion de un Banco de Controles de Clones de TCRB y Qptimizacion de las Condiciones de PCR Utilizando el Banco de Controles
Se llevan a cabo experimentos adicionales para construir un banco de 960 clones de TCRp que contiene al menos un representante de cada uno de las 650 posibles combinaciones de V-Jp humanas. Este conjunto de clones se utiliza para optimizaciones moleculares y estadfsticas. Un banco de plasmidos de TCRp humano se genera tal como se describe arriba en el Ejemplo 4. Se recogen aproximadamente 3.000 colonias transformantes y los clones se secuencian utilizando la secuenciacion capilar estandar (p. ej., Sequetech). El emparejamiento de V-Jp correspondiente a cada uno de los clones secuenciados se identifica tal como se describe arriba en el Ejemplo 4. El objetivo es obtener al menos un clon representativo para cada par de V-Jp. Si la secuenciacion encuentra que faltan algunos pares de V-Jp, esos pares son rescatados mediante la creacion de bancos de TCRp utilizando solo los cebadores de los pares de V-Jp que faltan, se subclonan y secuencian. Despues de varias rondas, los clones se identifican para cada posible par de V-Jp. Estos plasmidos se mezclan en una sola mezcla de moldes, con 96 clones a cada concentracion y 10 concentraciones diferentes a traves de tres ordenes de magnitud.
Ejemplo 6: Qptimizacion de las Condiciones de la PCR Utilizando el Banco de Controles:
Experimentos previos han demostrado que la primera amplificacion por PCR provoca la mayor desviacion de la amplificacion. Se realizan experimentos adicionales utilizando la agrupacion de 960 clones y secuenciacion de siguiente generacion para optimizar adicionalmente el numero de ciclos de la primera PCR. Se generan
5
10
15
20
25
30
35
40
45
50
55
aproximadamente 60 bancos de TCRp a partir de la mezcla de plasmidos, con cuatro replicas para cada uno de los 15 ciclos de numeros entre 10 y 25. Las mezclas de los bancos se cuantifican y de cada uno de los bancos se obtienen ~ 4 millones de secuencias mediante un secuenciador GAIIx de siguiente generacion (Illumina). El emparejamiento de V-Jp correspondiente a cada uno de los clones secuenciados tal como se describe anteriormente en el Ejemplo 4, y los recuentos de etiquetas de las secuencias se cuentan para cada uno de los clones en cada conjunto de datos.
Trabajo previo ha demostrado que el contenido de GC puede afectar a la eficiencia de la amplificacion (Markoulatos et al., 2002). La inmensa diversidad de combinaciones de V(D)Jp da como resultado un surtido de contenidos y longitudes de GC. La desviacion de la amplificacion se testa despues de la adicion de diversos reactivos tales como betama o cloruro de magnesio. Se generan aproximadamente 60 bancos de TCRp a partir de la mezcla de plasmidos, con cuatro replicas para cada uno de los 15 tampones diferentes. Las mezclas de los bancos se cuantifican y se obtienen ~ 4 millones de secuencias de cada uno de los bancos utilizando un secuenciador GAIIx de siguiente generacion (Illumina). Se identifica el emparejamiento V-Jp correspondiente a cada uno de los clones secuenciados tal como se describe arriba en el Ejemplo 4, y los recuentos de las etiquetas de secuencias se tabulan para cada uno de los clones en cada uno de los conjuntos de datos.
Ejemplo 7: Analisis de Celulas T y Seguimiento del Trasplante
Los metodos de la invencion se aplican al seguimiento inmune post-trasplante. Despues de un trasplante alogenico (es decir, del rinon o del Idgado), una respuesta de las celulas T de un huesped a los trasplantes se evalua para controlar la salud del huesped y el injerto. El seguimiento molecular de la sangre o la orina es util para detectar un rechazo agudo o cronico antes de que tfpicamente estuviera indicada una biopsia. Por ejemplo, la deteccion de alo- anticuerpos contra el antfgeno leucocitario humano (HLA) se ha asociado con el rechazo cronico de aloinjerto (Terasaki y Ozawa, 2004 American Journal of Transplantation 4:438-43). Otros marcadores moleculares incluyen microglobulina b2, neopterina y citocinas proinflamatorias en la orina y en la sangre (Sabek et al., 2002 Transplantation 74:701-7; Tatapudi et al., 2004 Kidney International 65: 2390; Matz et al., 2006 Kidney International 69: 1683; Bestard et al., 2010 Current Opinion in Organ Trasplantation 15: 467-473). Sin embargo, ninguno de estos metodos ha sido ampliamente adoptado en la practica clmica, tal vez debido a su baja especificidad y sensibilidad. El trabajo previo ha demostrado que las celulas T reguladoras (Treg) inducen la tolerancia del injerto al sub-regular celulas T colaboradoras (Th) (Graca et al., 2002 Journal of Experimental Medicine 195:1641). Adicionalmente, el trasplante de celulas madre hematopoyeticas de donantes de emparejamiento erroneo de HLA en el receptor ha dado como resultado la tolerancia del trasplante renal no-inmunosupresivo hasta 5 anos despues del trasplante (Kawai et al., 2008 NEJM 358:353-61).
Se disenan cebadores que fijan como objetivo transcripciones de varios genes de funcionalidad inmune (descritos anteriormente), que producen construcciones de fusion de extension por solapamiento con amplicones CDR3p. En una realizacion, estos cebadores se disenan para amplificar espedficamente ADNc que abarca uniones de corte y empalme de ARN y se hibrida a ADNc a partir de ARN mensajero procesado. Ejemplos de moleculas que estan asociadas con la funcion inmunologica incluyen, pero no se limitan a, T-BET e IFN-g, que indican celulas T colaboradoras 1 (Th1); GATA3 e IL-4, que indican celulas T colaboradoras 2 (Th2); IL-17 que indica celulas T colaboradoras 17 (Th17); y FoxP3 e IL-10, que indican celulas T reguladoras (Treg). Tales moleculas de senalizacion son miembros de grandes familias de protemas con una fuerte homologfa entre paralogos, lo cual puede dar lugar a la amplificacion de fondo durante la PCR. Por consiguiente, se generan alineaciones de nucleotidos de todos los paralogos en cada una de las familias (es decir, todos los genes de interleucina) y se disenan cebadores de la PCR de forma que abarquen exones y tengan la homologfa de secuencia mas baja posible con otros genes en la familia.
El seguimiento de celulas T funcionales implica las siguientes etapas: (i) aislamiento de celulas mononucleares de la sangre periferica individuales en los reactores de microgotitas de emulsion; (ii) amplificacion de extension por solapamiento de complejos entre TCRp y moleculas de funcionalidad inmunes en reactores de microgotitas; y (iii) la reversion de la emulsion, seguida de secuenciacion a granel. El TCRp y conjuntos de cebadores de funcionalidad inmunes se combinaran para producir construcciones de fusion de amplicon principal a partir de los amplicones menores. Los cebadores de extension por solapamiento son una combinacion de los cebadores de TCRp inversos con aproximadamente la mitad de cada uno de los cebadores directos con moleculas de funcionalidad inmune, lo que resulta en un total de 91 cebadores de TCRp de fusion inversa. Los cebadores de fusion entre el cebador directo para cada uno de los amplicones menores de funcionalidad inmune contienen aproximadamente la mitad de cada uno de los 13 cebadores de TCRp inversa, para un total de 91 cebadores de TCRp de funcionalidad inmune de fusion inversa. El resultado final es que el solapamiento entre cualquier par de TCRp y amplicones menores de funcionalidad inmune tiene una temperatura de fusion de aproximadamente 55-65°C, de tal manera que cada uno de los amplicones menores actua como un cebador para el amplicon emparejado. En las mezclas de reaccion finales, los cebadores externos se diluyen a una concentracion final de 0,1 |jM, y los cebadores internos se diluyen a 0,01 |jM, de manera que los cebadores internos son reactivos limitantes.
5
10
15
20
25
30
35
40
45
50
55
La tuberculosis latente (TB) es una epidemia mundial principal, que afecta a tanto como 2 billones de personas en todo el mundo. Actualmente no existe un test fiable para el diagnostico clmico de la TB latente. Esta brecha tecnologica tiene consecuencias clmicas graves, ya que la TB reactivada es el unico sello fiable de TB latente. Ademas de ello, los ensayos clmicos para vacunas y terapias carecen de biomarcadores para la TB latente y, por lo tanto, deben seguir las cohortes durante muchos anos para demostrar la eficacia.
La principal vacuna actual contra la tuberculosis, el bacilo de Calmette-Guerin (BCG), es un profilactico poco fiable. En un meta-analisis de docenas de estudios epidemiologicos, el efecto global del BCG fue del 50% contra las infecciones de TB, del 78% contra la TB pulmonar, del 64% contra la meningitis TB y del 71% contra la muerte debida a la infeccion de TB (Colditz et al., 1994 JAMA 271:698-702). Adicionalmente, el rapido aumento de la TB resistente a multiples farmacos ha aumentado la necesidad de nuevos enfoques de vacunas e inmunoterapias. Hasta el 90% de los individuos infectados, inmunocompetentes no progresan nunca a la enfermedad, lo que resulta en la enorme reserva mundial de TB latente (Kaufmann, 2005 Trends in Immunology 26:660-67).
Dado que la tuberculosis es un patogeno intracelular facultativo, la inmunidad esta mediada casi en su totalidad a traves de las celulas T. Celulas T colaboradoras 1 (Th1) que expresan el interferon-g suscitan la respuesta primaria de la TB, con una cierta intervencion de celulas T colaboradoras 2 (Th2). Despues de la respuesta primaria, las bacterias se vuelven latentes, controladas por celulas T reguladoras (Treg) y celulas T de la memoria (Tmem). Recientemente, once nuevos candidatos vacunales han iniciado ensayos clmicos (Kaufmann, 2005 Trends in Immunology 26:660-67). Estas vacunas son todas vacunas "post-exposicion", es decir, fijan como objetivo las respuestas de celulas T a la TB latente y estan destinadas a evitar la reactivacion de la enfermedad. Debido al fracaso parcial de BCG para inducir una inmunidad total, el diseno racional y la validacion de futuras vacunas de TB deben incluir un analisis sistematico de la respuesta inmune espedfica tanto para la TB como para las nuevas vacunas.
Durante decadas, el patron de cuidado para el diagnostico de la tuberculosis latente ha sido la prueba de la tuberculina en la piel (TST) (Pai et al., 2004 Lancet Infectious Disease 4:761-76). Mas recientemente, se han desarrollado dos ensayos comerciales in vitro de interferon-g: el ensayo QuantiFERON-TB y el ensayo T SPOT-TB. Estos ensayos miden la inmunidad mediada por celulas mediante la cuantificacion de interferon-g liberado de las celulas T cuando se enfrentan a un coctel de antfgenos de la tuberculosis. Lamentablemente, ni el TST ni los ensayos mas recientes de interferon-g son eficaces para distinguir TB latente de clara (Diel et al., 2007 American Journal of Respir Crit Care Med 177:1164-70). Este es un problema importante, ya que los pacientes sin evidencia clmica de TB latente (es decir, visualizacion de granulomas) pero con TST positiva o prueba de interferon-g reciben tfpicamente terapia con isoniazida durante 6-9 meses, a pesar de que esta intervencion emprnca es innecesaria en los pacientes que han eliminado la infeccion primaria y puede causar complicaciones graves tal como insuficiencia hepatica.
El trabajo previo ha demostrado que las respuestas de celulas T se utilizan para distinguir la TB latente de la activa (Schuck et al., 2009 PLoS One 4: e5590). La premisa de este trabajo previo es que las celulas inmunes dirigidas contra antfgenos de la TB aumentaran en la poblacion de celulas T de memoria si la TB es latente, pero aumentaran en una fraccion de celulas T colaboradoras si la TB es activa. La secuenciacion de celulas T funcionales se utiliza para distinguir la TB latente de TB clara. El protocolo implica: (i) la captura de celulas T individuales en microgotitas de emulsion; (ii) la transcripcion inversa y la amplificacion de microgotitas en loci diana; (iii) la smtesis de microgotitas de complejos de fusion entre dos o mas loci diana; y (iv) invertir emulsiones y secuenciar amplicones principales con la secuenciacion a granel. La PCR espedfica para la secuencia se utiliza despues de la RT-PCR de extension por solapamiento para detectar la presencia de un biomarcador particular para la TB latente.
Ejemplo 9: Analisis de Celulas T y Diagnostico o Seguimiento de la Enfermedad
De manera similar, el seguimiento de celulas T funcionales se utiliza para el diagnostico y el seguimiento de casi cualquier enfermedad humana. Estas enfermedades incluyen, pero no se limitan a lupus eritematoso sistemico (SLE), alergia, enfermedades autoinmunes, trasplantes de corazon, trasplantes de fngado, trasplantes de medula osea, trasplantes de pulmon, tumores solidos, tumores lfquidos, smdrome mielodisplasico (MDS), infeccion cronica, infeccion aguda, hepatitis, virus del papiloma humano (HPV), virus herpes simplex, citomegalovirus (CMV) y virus de la inmunodeficiencia humana (VIH). Dicho seguimiento incluye el diagnostico y seguimiento individuales o el seguimiento de la poblacion para los estudios epidemiologicos.
El seguimiento de celulas T se utiliza para fines de investigacion utilizando cualquier sistema de modelo no humano, tales como el pez cebra, raton, rata o conejo. El seguimiento de celulas T tambien se utiliza para fines de investigacion utilizando cualquier sistema de modelo humano tal como lmeas de celulas T primarias o lmeas de celulas T inmortales.
5
10
15
20
25
30
35
40
45
50
55
60
Los anticuerpos son producidos por secuencias recombinadas de inmunoglobulina genomica (Ig) en celulas de linaje B. Cadenas ligeras de inmunoglobulina se derivan de genes k o A. Los genes A se componen de cuatro genes de region constante (C) y aproximadamente treinta genes de region variable (V). Por el contrario, los genes k se componen de un gen de la region C y 250 genes de la region V. La familia de genes de la cadena pesada esta compuesta de varios cientos de segmentos de genes V, quince segmentos de genes D y cuatro segmentos de genes de union (J). La recombinacion somatica durante la diferenciacion de celulas B elige al azar una combinacion V-D-J de la cadena pesada y una combinacion V-J en la cadena ligera k o A. Debido a que hay tantos segmentos de genes, son posibles millones de combinaciones unicas. Las regiones V tambien se someten a una hipermutacion somatica despues de la recombinacion, generando una diversidad adicional. A pesar de esta complejidad subyacente, es posible utilizar docenas de cebadores que fijan como objetivo secuencias conservadas para secuenciar el complemento completo de la cadena pesada y ligera en varias reacciones multiplexadas (van Dongen et al., 2003 Leukemia 17:2257-2317).
Cualquiera de las subunidades de inmunoglobulina individuales esta enlazada a las moleculas de funcionalidad inmune que indican la actividad o sub-poblaciones de celulas B. Una primera secuencia de acido nucleico diana, una segunda secuencia de acido nucleico diana o ambas secuencias de acidos nucleicos diana pueden comprender una secuencia de inmunoglobulina. Alternativamente, la primera secuencia de acido nucleico diana puede comprender una secuencia de inmunoglobulina, y la segunda secuencia puede comprender una segunda molecula asociada con la funcion celular inmune. Ejemplos de moleculas de marcador de celulas B funcionales incluyen, pero no se limitan a complejo principal de histocompatibilidad (MHC), cumulo de diferenciacion 19 (CD 19), receptor de interleucina 7 (receptor de IL-17), cumulo de diferenciacion 10 (CD10), cumulo de diferenciacion 20 (CD20), cumulo de diferenciacion 22 (CD22), cumulo de diferenciacion 34 (CD34), cumulo de diferenciacion 27 (CD27), cumulo de diferenciacion 5 (CD5) y cumulo de diferenciacion 45 (CD45), cumulo de diferenciacion 38 (CD38), cumulo de diferenciacion 78 (CD78), receptor de interleucina-6, factor regulador de interferon 4 (IRF4) y cumulo de diferenciacion 138 (CD138). Una agrupacion de cebadores que amplifica el complemento IgH completo de celulas B se combina con un solo par de cebadores marcadores de celulas B. Esto ensaya todos los clonotipos de celulas B en un grupo funcional particular tal como Bmem. Alternativamente, una agrupacion de cebadores que amplifica el complemento completo de IgH de celulas B se combina con docenas de pares de cebadores de marcadores de celulas B. Este ensayo proporciona el fenotipo completo de cada uno de los clonotipos en la mezcla de celulas.
Se proporciona un metodo para enlazar IgH e IgK. IgH e IgA estan enlazados en celulas individuales a moleculas de funcionalidad inmune que indican la actividad o sub-poblaciones de celulas B. La gran mayona de la diversidad en el repertorio de celulas B esta compuesta por las regiones V-D-J de regiones IgH y V-J de IgK (Sandberg et al., 2005 Journal of Molecular Diagnostics. 7:495-503; Boyd et al., 2009 Science Translational Med 1:12ra23). Agrupaciones de cebadores previamente resenadas (van Dongen et al., 2003 Leukemia 17:2257-2317) se utilizan para amplificar estas regiones de IgH e IgK. Cinco agrupaciones de cebadores en reacciones separadas se utilizan para amplificar el complemento de IgH e IgK de un ser humano sano. El material amplificado se secuencio con la secuenciacion a granel. Para analizar los resultados de la secuenciacion a granel, se utiliza el algoritmo IgBLAST y la base de datos para determinar las uniones V-D y D-J de IgH y alinear las secuencias de IgH e IgK a segmentos de genes de la imea germinal. En general, este metodo esta mas paralelizado que los metodos previamente resenados para el analisis de Ig de celulas individuales (Patente de EE.Uu. 7.749.697).
Ejemplo 11: Analisis de celulas B y Descubrimiento de Farmacos
Los productos terapeuticos de anticuerpos se utilizan cada vez mas por las compares farmaceuticas para el tratamiento de enfermedades incurables tales como el cancer (Carter 2006 Nature Reviews Immunology 6:343-357). Sin embargo, el proceso de descubrimiento de farmacos de anticuerpos es caro y tedioso, requiriendo la identificacion de un antfgeno, y a continuacion, el aislamiento y la produccion de anticuerpos monoclonales con actividad contra el antfgeno. Los individuos que han estado expuestos a una enfermedad producen anticuerpos contra antfgenos asociados con esa enfermedad, por lo que es posible explotar los repertorios inmunologicos de los pacientes para anticuerpos que podnan utilizarse para el desarrollo de productos farmaceuticos. Sin embargo, un anticuerpo monoclonal funcional requiere tanto de inmunoglobulinas de cadena pesada como ligera. La PCR de extension de solapamiento y/o la rT-PCR de extension por solapamiento en microgotitas de emulsion de celulas individuales se utiliza para capturar secuencias de anticuerpos funcionales a partir de repertorios de celulas B del paciente. En smtesis, el metodo implica las siguientes etapas: (i) aislamiento de celulas B individuales en microrreactores acuosos-en-aceite utilizando un dispositivo de microfluidos; (ii) el enlace molecular entre amplicones de inmunoglobulina de cadena pesada y ligera (IgH e IgK) dentro de los microrreactores de celulas individuales; y (iii) la inversion de las emulsiones, seguido por secuenciacion a granel de las secuencias de acido polinucleico enlazadas. Esto produce emparejamientos de cadena pesada y ligera de millones de celulas B individuales analizadas en paralelo, que se explotan como agentes terapeuticos potenciales.
Las secuencias de los cebadores de fusion para la PCR de extension por solapamiento y la RT-PCR de extension por solapamiento son identicas a los cebadores IgH e IgK independientes, excepto que determinados cebadores contienen secuencias adicionales de polinucleotidos para la extension por solapamiento: (i) el cebador directo del locus IgH tiene una secuencia de 10-20 nt al azar sin complementariedad con cualquiera de las dianas; (ii) el
5
10
15
20
25
30
35
40
45
50
55
cebador inverso de los loci IgH tiene una secuencia de 10-20 nt con complementariedad con el cebador directo de IgK, y (iii) el cebador directo de IgK tiene complementariedad con los cebadores inversos para el locus IgH. En las mezclas de reaccion finales, los cebadores externos se diluyen a una concentracion final de 0,1 jM, y los cebadores internos se diluyen a 0,01 jM, de tal manera que los cebadores internos seran un reactivo limitante. Esto impulsa la formacion del amplicon principal.
Ejemplo 12: Analisis de Celulas B y Seguimiento de la Inmunidad
Celulas B de memoria humorales (Bmem) ayudan a los sistemas inmunes de mairnferos a conservar determinados tipos de inmunidad. Despues de la exposicion a un antigeno y de la expansion de celulas productoras de anticuerpos, las celulas Bmem sobreviven durante muchos anos y contribuyen a la respuesta inmune secundaria tras la re-introduccion de un antfgeno. Esta inmunidad se mide tfpicamente en un ensayo in vitro celular o basado en anticuerpos. En algunos casos, es beneficioso detectar la inmunidad mediante la amplificacion, el enlace y la deteccion de las regiones variables de IgH y de inmunoglobulina de cadena ligera en celulas B individuales. Un metodo de este tipo es mas espedfico y sensible que los metodos actuales. La secuenciacion del repertorio de celulas B masiva en paralelo se utiliza tal como se describe en el Ejemplo 13 para el rastreo de celulas Bmem que contienen un determinado emparejamiento de cadena pesada y ligera que es indicativo de la inmunidad. En otro metodo a modo de ejemplo, se combina un emparejamiento de cadena pesada y ligera de celulas individuales con la secuenciacion de celulas B funcional, es decir, desarrollando cebadores de RT-PCR de extension por solapamiento que fijan como objetivo transcripciones de ARN que estan sobre-representadas en celulas Bmem (es decir, CD27). Mediante la combinacion de la amplificacion de inmunoglobulina ligera y pesada con la expresion genica de transcripciones de la funcion inmune de celulas Bmem o plasmaticas, se evitan la clasificacion de celulas por FACS u otros metodos tediosos.
Ejemplo 13: Analisis de Celulas B y Diagnostico y Seguimiento de Enfermedades
El seguimiento de celulas B se utiliza para el diagnostico y el seguimiento de casi cualquier enfermedad humana. Estas enfermedades incluyen, pero no se limitan a lupus eritematoso sistemico (SLE), alergia, enfermedades autoinmunes, trasplantes de corazon, trasplantes de Idgado, trasplantes de medula osea, trasplantes de pulmon, tumores solidos, tumores lfquidos, smdrome mielodisplasico (MDS), infeccion cronica, infeccion aguda, hepatitis, virus del papiloma humano (VPH), virus herpes simplex (HSV), citomegalovirus (CMV) y virus de la inmunodeficiencia humana (VIH). Dicho seguimiento podna incluir el diagnostico y seguimiento individuales o el seguimiento de la poblacion para los estudios epidemiologicos.
El seguimiento de celulas B tambien se utiliza para fines de investigacion utilizando cualquier sistema de modelo no humano tal como el pez cebra, raton, rata o conejo. El seguimiento de celulas B se utiliza con fines de investigacion utilizando cualquier sistema modelo humano, tal como lmeas de celulas B primarias o lmeas de celulas B inmortales.
Ejemplo 14: Metodos para el Diagnostico Prenatal No Invasivo
En ausencia de un diagnostico prenatal, aproximadamente el 2% de los bebes tienen discapacidades ffsicas o mentales graves, aproximadamente el 3,3% de los bebes tienen algun tipo de malformacion congenita y aproximadamente el 0,5% tiene una anomalfa cromosomica fenotfpicamente significativa. Metodos clmicos actuales para el diagnostico prenatal son invasivos y presentan riesgos significativos para el feto, limitando su uso a pacientes de edad materna avanzada. Se necesitan tecnologfas no invasivas y precisas para el diagnostico genetico prenatal en el primer trimestre. La mayona de los actuales metodos preclmicos para el diagnostico prenatal no invasivo capturan y diagnostican celulas fetales circulantes. Estos metodos se basan en protemas de la superficie celular y/o en la morfologfa celular para enriquecer poblaciones particulares de celulas fetales. Tales enfoques defectuosos no han logrado llegar a la clinica a pesar de decadas de intensa investigacion y desarrollo.
El aislamiento de globulos rojos fetales nucleados en circulacion (FNRBCs) de la sangre materna es un enfoque para el diagnostico prenatal no invasivo. Globulos rojos nucleados son uno de los primeros tipos de celulas hematopoyeticas producidas durante el desarrollo fetal. Estas celulas atraviesan la placenta y son detectables a bajas concentraciones en la sangre materna durante el primer trimestre (Ganshirt et al., 1994 Lancet 343:.1038-9). Otra caractenstica atractiva de los FNRBCs es su corta vida en comparacion con otros tipos de celulas fetales circulantes (Pearson, 1967, Journal of Pediatrics 70:166-71), haciendo poco probable que persistan en la sangre materna de embarazos anteriores.
La escasez de celulas fetales circulantes, estimada en una celula fetal por cada 105-109 celulas maternas (Price et al., 1991 Am J Obstet Gynecol 165:1731-7; Ganshirt-Ahlert et al., 1994 Clin Genet 38:38-43), hace necesario el uso de metodos de enriquecimiento de celulas fetales sensibles y espedficos antes del diagnostico. Metodos de enriquecimiento ampliamente adoptados incluyen combinaciones de centrifugacion en gradiente de densidad (Samura et al., 2000 Prenat Diagn 20:281-6), la clasificacion de celulas activadas por fluorescencia (FACS) y la clasificacion celular magnetica (MACS) (Busch et al., 1994 Ann NY Acad Sci 731:144-6). A pesar del desarrollo de estos metodos, ninguno ha sido comercializado.
5
10
15
20
25
30
35
40
45
50
55
i. Metodos para el Diagnostico Prenatal No Invasivo de Trastornos de Genes Individuales
La LCR o sondas-candado se utilizan para capturar y amplificar alelos espedficos paternos de una manera espedfica para el alelo y para llevar a cabo la PCR de extension por solapamiento para detectar alelos de la enfermedad (FIGs. 26-30). El metodo implica las siguientes etapas: (i) genotipado parental para encontrar polimorfismos espedficos paternales; (ii) aislamiento de celulas mononucleares individuales de la sangre materna en microgotitas de emulsion; (iii) amplificacion de la enfermedad y loci de "enlazador" espedficos paternales mediante un protocolo de LCR/PCR modificado en reactores de microgotitas de emulsion; (iv) la amplificacion de extension por solapamiento de complejos entre la enfermedad y loci de enlazador en reactores de microgotitas; (v) recuperacion de los complejos enlazados por inversion de la emulsion; y (vi) secuenciacion masiva en paralelo. Los datos de secuenciacion masiva en paralelo se analizan para cuantificar los casos de genotipos enlazados. Solamente los reactores de microgotitas que contienen celulas fetales individuales proporcionan complejos enlazados entre el locus de la enfermedad y el alelo espedfico paternal. Ambos alelos se amplifican a partir de la celula fetal, proporcionando al medico el estado como un vetnculo, homocigoto normal u homocigoto afectado.
Se disenan sondas de LCR para fijar como objetivo un locus asociado con una enfermedad y un locus de SNP enlazador. Las sondas de LCR son de 20-30 nucleotidos de largo y tienen temperaturas de fusion (Tm) de aproximadamente 55-65°C. Los nucleotidos 5' se fosforilan y las sondas se disenan para minimizar la auto- complementariedad de la sonda, asf como la complementariedad entre sondas. Ademas de las regiones de complementariedad a loci diana, tres de las sondas incluyen secuencias de polinucleotidos que permiten la amplificacion despues de ligamiento: (i) la sonda 5' para el locus de la enfermedad tiene una secuencia al azar de 10-20 nt sin complementariedad con cualquiera de los locus diana; (ii) la sonda 3' para el locus de la enfermedad tiene una secuencia de 10-20 nucleotidos con complementariedad al extremo 5' del locus SNP de enlazador; y (iii) la sonda 5' para el locus SNP de enlazador tiene complementariedad con el extremo 3' del locus de la enfermedad (FIGs. 26-30).
Para cada par de locus de la enfermedad y del enlazador, se formula una mezcla de reaccion utilizando ADN genomico de lmeas celulares, las sondas de LCR, los cebadores de la PCR, Ampligase (Epicentre), fragmento de ADN polimerasa Stoffel (Life Technologies) y tampon de reaccion (segun Hardenbol et al., 2005; Tris-HCl 20 mM, KCl 25 mM, MgCh 10 mM, NAD 0,5 mM, Triton X-100 al 0,01%). Las sondas "interiores" se anaden a 1/10 de la concentracion de los otros oligonucleotidos en la reaccion. Para la reasociacion inicial y el ligamiento, las mezclas se incuban durante 4 minutos a 20°C, durante 5 minutos a 95°C y durante 15 minutos a 60°C. Despues, las condiciones de termociclacion por PCR se utilizan para amplificar los amplicones menores y principales (p. ej., 95°C, 5 minutos; [95°C, 30 segundos; 60°C, 30 segundos; 72°C, 30 segundos] x 30 ciclos).
Despues de la secuenciacion a granel de los amplicones principales, la enfermedad y los alelos no afectados se analizan para diagnosticar el feto como homocigoto normal, heterocigoto portador u homocigoto afectado. En los heterocigotos portadores, los amplicones principales enlazados al alelo espedfico paternal comprende aproximadamente 50% de alelos de la enfermedad y 50% de alelos normales. De manera similar, en los homocigotos portadores, los amplicones principales enlazados a los alelos espedficos paternales comprenden casi el 100% de los alelos de la enfermedad. Este metodo se puede extender mas alla de mutaciones de un solo nucleotido para encontrar patrones de expresion genica espedficos para alelos paternales y/o analisis multiplexado de muchas mutaciones de la lmea germinal en las celulas fetales circulantes.
Ejemplos de genes que a menudo estan mutados y son de interes en el diagnostico prenatal incluyen, pero no se limitan a receptor transmembrana de la fibrosis qmstica (CFTR), aspartoacilasa (ASPA), anemia de Fanconi, grupo de complementacion C (FANCC), glucosa-6-fosfatasa (G6CP), glucocerebrosidasa (GBA), hexosaminidasa A (HEXA), hemoglobina beta (HBB), frataxina (FXN), receptor de lipoprotemas de baja densidad (LDLR) y protema de union 2 a metil CpG (MECP2).
Por ejemplo, en la FIG. 26 se ilustra el enlace de la secuencia de celulas individuales mediante reaccion en cadena de la ligasa en combinacion con la reaccion en cadena de la polimerasa de extension por solapamiento tal como se aplica a un metodo para el diagnostico prenatal no invasivo. El acido nucleico diana (g) es un alelo espedfico paternal, el acido nucleico diana (h) es un primer alelo de la enfermedad y el acido nucleico diana (i) es un segundo alelo de la enfermedad. En particular, los dos alelos (h) e (i) se amplifican en cualquier celula (j) que contiene la variante espedfica paternal y no se producen amplicones principales en celulas que carecen de la variante de nucleotidos espedfica paternal. El cebador (a) es una sonda de LCR directa y el cebador (b) es una sonda de LCR inversa para la amplificacion de acido nucleico diana (g). El cebador (e) es un cebador de PCR directo y el cebador (f) es un cebador de PCR inverso para los dos alelos de la enfermedad (h) e (i). El cebador directo que fija como objetivo el locus de la enfermedad tiene una region de complementariedad con la sonda inversa que fija como objetivo la variante de nucleotidos espedfica paternal. El proceso puede llevarse a cabo en una gotita de emulsion o contenedor de reaccion (k). La FIG. 27 tambien muestra un ejemplo de hibridacion de los cebadores y los acidos nucleicos diana en un enlace de secuencia de celula individual mediante reaccion en cadena de la ligasa en combinacion con la reaccion en cadena de la polimerasa de extension por solapamiento, tal como se aplica a un
5
10
15
20
25
30
35
40
45
50
55
metodo para el diagnostico prenatal no invasivo, de acuerdo con una realizacion de la invencion. El proceso se lleva a cabo en una gotita de emulsion o recipiente de reaccion (k).
Ademas, la FIG. 28 muestra un ejemplo de amplicones resultantes producidos en un enlace de secuencia de celula individual mediante reaccion en cadena de la ligasa en combinacion con la reaccion en cadena de la polimerasa de extension por solapamiento tal como se aplica a un metodo para el diagnostico prenatal no invasivo, de acuerdo con una realizacion de la invencion. La FlG. 29 muestra la hibridacion de la superposicion de las regiones complementarias de los amplicones resultantes y la reaccion en cadena de la polimerasa de extension por solapamiento tal como se aplica a un metodo para el diagnostico prenatal no invasivo, de acuerdo con una realizacion de la invencion. La FIG. 30 ilustra los amplicones resultantes que se producen a partir de la reaccion en cadena de la polimerasa de extension por solapamiento tal como se aplica a un metodo para el diagnostico prenatal no invasivo. El producto final es un banco de "amplicones principales", o loci enlazados, que luego pueden ser secuenciados a granel.
ii. Metodos para el Cariotipado Molecular Prenatal No Invasivo
Metodos para la deteccion de enfermedades geneticas estan adaptados para el cariotipado molecular prenatal no invasivo. Un metodo de este tipo implica las siguientes etapas: (i) genotipado parental para encontrar polimorfismos espedficos paternales; (ii) aislamiento de celulas mononucleares individuales de la sangre materna de microgotas de emulsion; (iii) amplificacion de la enfermedad y loci de "enlazador" espedficos paternales mediante un protocolo LCR/PCR modificado en reactores de microgotitas de emulsion; (iv) amplificacion de extension por solapamiento de complejos entre decenas de miles a cientos de miles de sondas cromosomicas y loci de enlazador en reactores de microgotitas; (v) recuperacion de los complejos enlazados por inversion de emulsion; y (vi) secuenciacion masiva en paralelo. Los datos de secuenciacion masiva en paralelo se analizan para cuantificar los casos de genotipos enlazados. Solamente los reactores de microgotitas que contienen celulas fetales individuales proporcionan complejos enlazados entre las sondas cromosomicas y el alelo espedfico paterno. Las sondas cromosomicas se utilizan para cuantificar el numero de cromosomas o segmentos de cromosomas presentes en las celulas fetales y, por asociacion, en el feto. El numero de copias de cromosomas se cuantifica mediante la comparacion de los recuentos de secuencia de un cromosoma desconocido a recuentos de la secuencia de un cromosoma de referencia conocido dentro de un unico experimento, o mediante la busqueda de desequilibrio alelico (Johnson et al., 2010 Human Reproduction 25:1066-1075). Este metodo tambien se utiliza para detectar una diversidad de trastornos cromosomicos, incluyendo aneuploidfa, trastornos cromosomicos estructurales desequilibrados, microdeleciones, microinserciones y otros tipos de trastornos congenitos. Ejemplos de trastornos de interes incluyen trisoirna 13, trisoirna 18 y trisoirna 21.
Ejemplo 15: Metodos de Diagnostico No Invasivo del Cancer
La comunidad medica ha buscado durante mucho tiempo el diagnostico y seguimiento no invasivo de pacientes con cancer, y ya existe un metodo aprobado por la FDA (CellSearch, Veridex) para la cuantificacion de celulas tumorales circulantes para pacientes con cancer de prostata y de mama. Metodos no invasivos para el diagnostico pueden permitir la estadificacion molecular de tumores antes de la biopsia, la cual puede reducir el costo y conducir a mejores resultados clmicos. Despues del tratamiento, se utilizan metodos no invasivos para evaluar el exito del regimen de tratamiento sin la necesidad de una re-biopsia invasiva y cara. Existe un consenso general entre los medicos de que los metodos no invasivos para la caracterizacion de los tumores beneficianan en gran medida a los pacientes y aumentanan la probabilidad de resultados favorables.
La PCR de extension por solapamiento de celulas individuales, la LCR, sondas-candado y/o RT-PCR se utilizan para analizar espedficamente solo a las celulas tumorales en poblaciones de celulas heterogeneas tales como lfquido cefalorraqmdeo (CSF) o la sangre (FIGs. 18-25). A diferencia de los metodos actuales, este enfoque evita por completo las complejidades provocadas por las diferencias en marcadores de la superficie celular y la morfologfa. Tales metodos son particularmente utiles en los canceres en los que una biopsia es invasiva y costosa, y las decisiones de tratamiento tales como las decisiones de terapia farmacologica, se beneficianan de analisis molecular del tumor. La tecnologfa se utiliza para cualquier tipo de tumor o cualquier tipo de problema genetico o combinacion de problemas geneticos en los tumores.
Los metodos descritos anteriormente en las Secciones I y II tambien se utilizan para detectar un gen o SNP asociado con el cancer. La PCR de extension por solapamiento de celulas individuales, la LCR, sondas-candado y/o la RT-PCR se utilizaron para amplificar un primer acido nucleico o un segundo acido nucleico que esta asociado con el cancer. El primer acido nucleico diana incluye una mutacion somatica rara y la segunda diana es una transcripcion de genes asociada con el cancer. Alternativamente, una secuencia es un codigo de barras molecular y la segunda secuencia es una secuencia de mutacion rara o una transcripcion de genes asociada con el cancer. En cualquiera de las alternativas, niveles mas altos de multiplexacion producen patrones de expresion de celulas individuales de 10, 100, 1000, 10.000 transcripciones o incluso todas las transcripciones en la celula. Niveles mas altos de multiplexacion tambien pueden producir perfiles de mutacion de genes enteros, o muchos genes enteros, o incluso todo el genoma. La secuencia del gen rara esta presente en menos de 5% de las celulas, menos de 1% de las
5
10
15
20
25
30
35
40
45
50
55
celulas o menos de 0,1% de las celulas. La secuencia del gen rara resulta de una mutacion genetica. La mutacion genetica puede ser una mutacion somatica. La mutacion genetica puede ser una mutacion en un gen seleccionado del grupo que consiste en: receptor del factor de crecimiento epidermal (EGFR), homologo de fosfatasa y tensina (PTEN), protema de tumor 53 (p53), MutS homologo 2 (MSH2), neoplasia endocrina multiple 1 (MEN1), poliposis adenomatosa coli (APC), receptor Fas (FASR), protema retinoblastoma (Rb1), Janus quinasa 2 (JAK2), factor de transcripcion 1 similar a (ETS) (ELK1), virus de la eritroblastosis aviar v-ets E26 homologo de oncogen 1 (ETS1), cancer de mama 1 (BRCA1), cancer de mama 2 (BRCA2), receptor del factor de crecimiento de hepatocitos (MET), protoco-oncogen ret (RET), leucemia eritroblastica viral V-erb-b2 homologo de oncogen 2 (HER2), sarcoma de rata viral V-Ki-ras2 Kirsten homologo de oncogen (KRAS), linfoma de celulas B 2 (BCL2), mielocitomatosis viral V-myc homologo de oncogen (MYC), gen de neurofibromatosis de tipo 2 (NF2), mieloblastosis viral v-myb homologo de oncogen (MYB) y homologo mutS 6 (E. coli) (MSH6). La transcripcion asociada al cancer es un gen seleccionado del grupo que consiste en molecula de adhesion celular epidermal (EpCAM), leucemia eritroblastica viral V-erb-b2 homologo de oncogen 2 (HER2), receptor de estrogeno (Er), transductor de senales y activador de la transcripcion 3 (STAT3), protemas de union al potenciador CCAAT (C/EBP), antfgeno prostatico espedfico (PSA), receptor de androgenos (AR), receptor de progesterona (PR), Jun B (JUNB), protema Rab-31 relacionada con Ras (RAB31), protema de respuesta de crecimiento temprano 1 (EGR1), linfoma de celulas B 2 (BCL2), protema C-ets-1 (ETS1), osteosarcoma murino viral FBJ homologo de oncogen (c-Fos) y factor de crecimiento 1 similar a la insulina (IGF-1). Transductor de senal y activador de la transcripcion 2 (STAT2) (irgon et al., 2010 BMC Cancer 10:319).
Las transcripciones asociadas al cancer pueden multiplexarse para producir una senal de 10, 100, 1000, 10.000 transcripciones, o la totalidad de las transcripciones en la celula, que es analizada por secuenciacion de siguiente generacion para identificar una mutacion. La mutacion se asocia con el cancer. El cancer se selecciona del grupo que consiste en carcinoma de pulmon, cancer de pulmon de celulas no pequenas, cancer de pulmon de celulas pequenas, cancer de utero, cancer de tiroides, carcinoma de mama, carcinoma de prostata, carcinoma de pancreas, carcinoma de colon, linfoma, linfoma de Burkitt, linfoma de Hodgkin, leucemia mieloide, leucemia, sarcoma, blastoma, melanoma, seminoma, cancer de cerebro, glioma, glioblastoma, astrocitoma cerebeloso, linfoma de celulas T cutaneo, cancer gastrico, cancer de Idgado, ependimoma, cancer de laringe, cancer de cuello, cancer de estomago, cancer de rinon, cancer de pancreas, cancer de vejiga, cancer de esofago, cancer testicular, meduloblastoma, cancer vaginal, cancer de ovario, cancer cervical, carcinoma de celulas basales, adenoma de la pituitaria, rabdomiosarcoma y sarcoma de Kaposi.
Los metodos en este Ejemplo se pueden aplicar en un ensayo que utiliza mezclas de celulas de marnffero intactas para detectar celulas cancerosas. Las celulas de carcinoma de pulmon de celulas no pequenas CRL-5908 (ATCC) se utilizan como un modelo de cancer y las celulas de Jurkat se utilizan como un sustituto de linfocitos primarios. CRL-5908 tiene una mutacion puntual EGFR en L858R, y expresa EpCAM. Jurkat no expresa EpCAM (Landolin et al., 2010). Se crean mezclas de celulas en seis relaciones CRL-5908:Jurkat de 0% y 1%. Las celulas se encapsulan a partir de las mezclas con perlas en una mezcla de lisis y despues se fusionan con una corriente que contiene una mezcla de RT-PCR utilizando los metodos descritos anteriormente. Las celulas se diluyen de manera que la distribucion de celulas sigue la estadfstica de Poisson con A = 1,5, y ~44% de las gotitas con celulas que tienen multiples celulas. Utilizando este metodo, se genera > 1 millon de gotitas en cada uno de seis experimentos de replica para cada una de las mezclas de celulas. Una camara de alta velocidad se utiliza para obtener tasas de encapsulacion de perlas y celulas. Los amplicones principales se purifican por electroforesis en gel y se secuencian por secuenciacion de siguiente generacion para obtener al menos 10 millones de etiquetas de secuencia para cada uno de los bancos.
La deteccion de celulas cancerosas en estas mezclas de celulas requiere un marco analttico especial. La secuenciacion genera recuentos de EGFR mutado y EpCAM enlazados a cada uno de los codigos de barras y los codigos de barras se rastrean de nuevo a las celulas. Si cada una de las gotitas contiene solo una celula individual, a continuacion, estos recuentos se utilizan para cuantificar directamente el porcentaje de CRL-5908 en la mezcla de celulas. Sin embargo, puede existir un cierto numero arbitrario de celulas encapsuladas en gotitas de acuerdo con una distribucion de Poisson, dando como resultado muchas gotitas con multiples celulas.
Por lo tanto, para este tipo de analisis se utiliza un algoritmo que calcula el numero de celulas cancerosas en una muestra dando recuentos de marcadores de cancer, tales como EGFR mutado o EpCAM y estadfsticas para la encapsulacion de celulas Poisson A. Para testar la validez de este algoritmo y para estimar los lfmites de deteccion que impone la encapsulacion de multiples celulas por gotita, se simula el proceso de encapsulacion, y se determina la relacion de la expresion de marcadores de cancer en las celulas cancerosas con las celulas normales. Se supone una distribucion de Poisson para la tasa de encapsulacion de celulas, los niveles de expresion se distribuyen de forma normal logantmica a lo largo de un fondo fijo, y la relacion senal-ruido (SNR) se define como la relacion entre el nivel de expresion medio al fondo medio. Esta simulacion indica una tasa de error de < 1% en un escenario en donde ~44% de gotitas que contienen celulas tendra multiples celulas (A = 1,5) y SNR = 10.
5
10
15
20
25
30
35
40
45
50
55
Determinados genes se co-expresan espedficamente solo en celulas tumorales circulantes, por lo que el enlace de dos transcripciones espedficas de tumor en la misma celula es un metodo potencialmente poderoso para la deteccion de celulas tumorales circulantes en la sangre periferica o CSF. El metodo permite la estadificacion molecular no invasiva de glioblastoma multiforme (GBM). GBM es el tipo mas comun de tumor cerebral maligno primario, con una incidencia de 16.000 nuevos casos por ano en los Estados Unidos. Despues de la caracterizacion por resonancia magnetica (MRI) y el tratamiento clinico, la caracterizacion molecular de las biopsias se realiza a menudo para guiar a los regfmenes de tratamiento. Existe un creciente consenso de que categonas moleculares distintas de tumores deben ser sometidas a distintos regfmenes de tratamiento espedficos (Mischel et al., 2003 Cancer Biol Ther 2:242-247). La investigacion anterior del GBM ha indicado que un mal pronostico es indicado mediante la co-expresion de los genes C/EBPp y STAT3 (Carro et al., 2010 Nature 463:318-26). Estas transcripciones no se co-expresan en los tejidos normales. Sin embargo, las biopsias de GBM son altamente invasivas y costosas, por lo que existe una demanda clinica de los metodos mmimamente invasivos para la estadificacion molecular.
El metodo implica las siguientes etapas: (i) aislamiento de celulas mononucleares a partir de CSF (Spriggs 1954; Journal of Clinical Pathology 7:122) con la tecnologfa de microgotitas de emulsion; (ii) reaccion en cadena de la polimerasa con transcriptasa inversa que fija como objetivo C/EBPp, STAT3 y una secuencia de codigo de barras de enlazador unico para cada una de las microgotitas; (iii) la amplificacion de extension por solapamiento de complejos entre C/EBPp, STAT3 y la secuencia de enlazador; (iv) la recuperacion de complejos enlazados por inversion de la emulsion; y (v) la cuantificacion digital de los complejos de fusion utilizando secuenciacion de siguiente generacion. Solo reactores de microgotitas que contienen celulas tumorales que co-expresan C/EBPp y STAT3 producen grandes numeros de complejos enlazados completos. Aunque la secuenciacion de siguiente generacion agrupa todos los analitos de todas las celulas, las secuencias de codigos de barras de enlazador permiten el rastreo de la expresion genica de celulas individuales. El resultado final es la cuantificacion digital de multiples transcripciones enlazadas que se remontan a millones de celulas individuales analizadas en paralelo.
El metodo tambien proporciona la smtesis de ADNc y PCR en microgotitas de emulsion sin intercambio de tampon ni adicion de reactivos entre las etapas moleculares. Se utilizan enzimas termoestables de la transcriptasa inversa (RT) que soportan temperaturas > 95°C, tales como ThermoScript RT (Lucigen) y GeneAmp Thermostable rTth (Life Technologies). Ademas de las regiones de cebador que fijan como objetivo C/EBPp y STAT3 (FIGs. 18-25), tres de los cebadores en el conjunto incluyen secuencias de polinucleotidos que permiten la amplificacion de un complejo de fusion: (i) el cebador 5' del locus C/EBPp tiene una secuencia al azar de 10-20 nt sin complementariedad con cualquiera de los locus diana; (ii) el cebador 3' del locus C/EBPp tiene una secuencia de 10-20 nt con complementariedad con el extremo 5' del oligonucleotido de codigo de barras de enlazador; (iii) la sonda 5' del locus STAT3 tiene complementariedad con el extremo 3' del enlazador. Otros dos oligonucleotidos actuan como cebadores directo e inverso de la PCR para amplificar espedficamente el oligonucleotido de codigo de barras de enlazador. Los cebadores "internos" de los loci STAT3 y C/EBPp (es decir, el cebador inverso para C/EBPp y el cebador directo para STAT3) estan a una concentracion lfmite, es decir, 0,01 |jM para los cebadores internos y 0,1 |jM para todos los otros cebadores. Esto impulsa la amplificacion del amplicon principal preferentemente frente a los amplicones menores.
Despues de la inversion de la emulsion, los amplicones principales se someten a secuenciacion a granel. El codigo de barras esta enlazado a las secuencias de C/EBPp y STAT3, y se utilizan para rastrear los amplicones principales a una celula individual (FIGs. 18-25). Con el rastreo de cada una de las secuencias a una celula individual original, es posible tabular datos geneticos para cada una de las celulas individuales, que permite entonces una cuantificacion de la transcripcion de celulas individuales, es decir, niveles de expresion de genes de celulas individuales que se traducen a un diagnostico clmicamente procesable.
Ejemplo 17: Cariotipado Molecular
A menudo, los cambios cromosomicos estructurales tales como la perdida de heterocigosidad (LOH) o la ganancia de cromosomas completos o segmentos de los mismos, conducira a la progresion de un tumor (Parsons et al., 2008 Science 321:1807-1812). Los medicos a menudo examinan el cariotipo de un tumor para formular un regimen de pronostico y tratamiento. Los metodos arriba esbozados estan adaptados para analizar tanto la expresion del gen como para detectar anomalfas cromosomicas para cualquier tipo de tumor en una unica reaccion multiplexada.
Una secuencia de cancer mutante esta enlazada a sondas para determinar el numero de copias de cromosomas o aberraciones cromosomicas estructurales. Un metodo de este tipo implica las siguientes etapas: (i) el aislamiento de celulas mononucleares individuales de sangre en microgotitas de emulsion; (ii) la amplificacion de sondas cromosomicas y loci de "enlazador" de mutaciones del cancer por un protocolo de LCR/PCR modificado en reactores de microgotitas de emulsion; (iii) la amplificacion de extension por solapamiento de complejos entre sondas cromosomicas y loci de enlazador mutantes en reactores de microgotitas; (iv) la recuperacion de los complejos enlazados por inversion de la emulsion; y (v) la secuenciacion masiva en paralelo.
5
10
15
20
25
30
35
40
45
50
55
Los datos de secuenciacion masiva en paralelo se analizan para cuantificar los casos de genotipos enlazados. Solamente los reactores de microgotitas que contienen celulas con mutaciones del cancer proporcionan complejos enlazados entre las sondas cromosomicas y la secuencia espedfica del cancer. Las sondas cromosomicas se utilizan para cuantificar el numero de cromosomas o segmentos de cromosomas presentes en las celulas cancerosas circulantes y, por asociacion, el tumor. El numero de copias de cromosomas se cuantifica mediante la comparacion de recuentos de secuencias de un cromosoma desconocido con los recuentos de secuencias de un cromosoma de referencia conocida dentro de un unico experimento, o mediante la busqueda de un desequilibrio alelico (Johnson et al,, 2010 Human Reproduction 25:1066-75). Este metodo tambien se utiliza para detectar una diversidad de trastornos cromosomicos, incluyendo la aneuploidfa, trastornos cromosomicos estructurales desequilibrados, microdeleciones, microinserciones y otros tipos de trastornos congenitos. Las sondas cromosomicas estan ligadas a una secuencia de codigo de barras en lugar de una mutacion del cancer, de manera que la secuenciacion cromosomicas masiva en paralelo mide los trastornos cromosomicos en todas las celulas en el ensayo en lugar de solo las celulas que albergan una mutacion particular.
Ejemplo 18: Mutaciones de Celulas Somaticas
A menudo, las mutaciones de celulas somaticas, es decir, en los genes promotores de tumores tales como p53, p16 y/o EGFR, contribuyen a la progresion del cancer (Parsons et al., 2008 Science 321:1807-1812). Los medicos a menudo analizan los tumores en cuanto a mutaciones de celulas somaticas conocidas para formular un regimen de pronostico y tratamiento. En particular, las mutaciones de celulas somaticas son a menudo indicativas de la progresion a etapas mas agresivas de un tumor. Los metodos descritos anteriormente estan adaptados para analizar la expresion de genes, las mutaciones de celulas somaticas y/o cambios cromosomicos para cualquier tipo de tumor en las reacciones de microgotitas de emulsion multiplexadas en millones de celulas individuales en paralelo. Si se conocen las mutaciones de celulas somaticas, no es necesario un codigo de barras molecular, porque la LCR espedfica para el alelo o sondas-candado se utilizan para amplificar espedficamente los amplicones principales solo en las celulas que albergan la mutacion de celulas somaticas.
Cualquier combinacion de expresion genica, cariotipado molecular y analisis de la mutacion de celulas somaticas se lleva a cabo en las celulas tumorales individuales en poblaciones de celulas heterogeneas. Por ejemplo, la LCR o sondas-candado se utilizan para afectar a la captura del locus espedfica para el alelo y la amplificacion del amplicon principal solo en celulas con una mutacion de celulas somaticas particular. Este metodo es una alternativa al metodo de codigo de barras molecular descrito anteriormente, al menos en la seccion B.6), consiguiendo un analisis genetico espedfico para las celulas tumorales en un fondo mixto altamente heterogeneo de celulas. La amplificacion de mutacion de celulas somaticas espedfica para el alelo esta ligada a las transcripciones de ARN asociadas a los resultados de la enfermedad y/o sondas para la cuantificacion de la perdida de heterocigosidad (LOH) o duplicaciones regionales en el cromosoma. El metodo se utiliza para analizar la co-expresion de dos o mas
secuencias de microARN en las celulas individuales, o la co-expresion de un microARN con otra transcripcion, una
secuencia de ADN metilado o la mutacion de celulas somaticas.
Ejemplo 19: Metodos de Analisis de Poblaciones de Celulas Quimericas
Determinadas aplicaciones requieren un analisis multiplexado de poblaciones de celulas que son quimeras entre dos organismos. Por ejemplo, despues de un trasplante de celulas madre hematopoyeticas (HSC), las celulas T y B del huesped son quimericas entre el huesped y el injerto. La amplificacion por PCR en una poblacion de celulas quimericas de un locus genetico variable combinada con algun tipo de locus genetico funcional, tal como una transcripcion de ARN, permite el analisis del locus genetico funcional de una manera espedfica para el individuo.
Los metodos descritos en esta memoria se aplican al trasplante de celulas madre hematopoyeticas no
mieloablativas. Los medicos carecen de herramientas poderosas para el seguimiento de los pacientes despues de
los trasplantes alogenicos no mieloablativos de celulas madre hematopoyeticas (HSC) (Pollack et al., 2009 American Journal of Clinical Oncology. 32:618-28). Despues del trasplante no mieloablativo, el sistema inmune del huesped es una quimera entre el huesped y las celulas T del injerto. La quimera es un tejido mal caracterizado, y la inestabilidad quimerica se asocia con un pronostico deficiente. El equilibrio donante-receptor de reconstitucion inmune parece influir en un cierto numero de resultados inmunologicos de trasplante, incluido el efecto de injerto frente a tumor (GVT), la enfermedad de injerto frente a huesped (GVHD) y la susceptibilidad a la infeccion. Las celulas T parecen jugar un papel importante en la mediacion de cada uno de estos procesos a traves de la inmunidad adaptativa y reconocimiento de antfgeno del receptor de celulas T (TCR). Actualmente, los medicos carecen de herramientas para el seguimiento de la identidad de las celulas T del huesped y el injerto despues de trasplante de HSC. Tales metodos se utilizan para supervisar directamente GVT, GVHD y la respuesta a las infecciones (Kristt et al., 2007 Bone Marrow Transplantation 39: 255-68).
Un metodo se utiliza para el seguimiento de las poblaciones de celulas T quimericas. Para el analisis de quimerismo de celulas T, TCRp y polimorfismos de un solo nucleotido espedficos para huesped e injerto (SNPs) estan enlazados por PCR de extension por solapamiento o RT-PCR de extension por solapamiento en microgotitas de celulas individuales. Este metodo implica las siguientes etapas: (i) determinacion del genotipo para encontrar SNPs
5
10
15
20
25
30
35
40
45
50
55
espedficos para el injerto y el huesped; (ii) el aislamiento post-trasplante de celulas individuals a partir de sangre del huesped en microgotitas de emulsion; (iii) la PCR de extension por solapamiento de complejos de fusion entre SNPs y TCRp en reactores de microgotitas; y (iv) la recuperacion y secuenciacion de los complejos de enlace SNP- TCRp por la inversion de la emulsion. El resultado es un banco de secuencias de TCRp con enlace al huesped o injerto. Las secuencias de TCRp se correlacionan con los resultados clmicos a lo largo del tiempo.
Tipos similares de analisis se llevan a cabo utilizando LCR, circularizacion multi-sonda o sondas-candado, o cualquier combinacion de los mismos. Tambien, otros tipos de secuencias variantes tales como los STRs, tambien son utiles para indicar la fuente de celulas en una poblacion quimerica de las celulas. El analisis de quimerismo de celulas T es adaptable a aplicaciones tales como el analisis de celulas B o cualquier otra sub-poblacion de celulas mononucleares en sangre. Adicionalmente, el metodo se puede combinar con la secuenciacion de celulas T funcionales para indicar la actividad inmune de clones particulares de celulas T.
Existen muchas aplicaciones para el analisis de la poblacion de celulas quimericas fuera del campo de la medicina. Por ejemplo, un investigador puede crear organismos quimericos tales como moscas de la fruta, ratones o ratas, que son quimeras entre multiples individuos con diferentes antecedentes geneticos, o incluso entre multiples especies. Poblaciones de celulas quimericas para las transcripciones de ARN, metilacion de ADN, mutaciones de celulas somaticas, presencia de un gen recombinante o una region de ADN variable tambien son susceptibles de analisis con este metodo. Por lo tanto, metodos para el analisis de poblaciones de celulas T y B quimericas estan adaptados a otros organismos y otros tipos de poblaciones de celulas. Adicionalmente, estos metodos se utilizan para la terapia celular alogenica o autologa. Actualmente los medicos carecen de herramientas poderosas para el seguimiento de los pacientes despues de haber introducido las celulas inmunes ya sea de un donante o como se han recogido previamente del paciente. Celulas T, celulas B o celulas NK son monitoreadas para establecer las caractensticas y la eficacia de la terapia.
Ejemplo 20: Metodos para el Analisis de la Secuencia Reguladora de Genes
Variantes de ADN regulador tienen un impacto en los niveles de expresion de las transcripciones de ARN (Brown et al., 2007 Science 317:1557-60). Rastreos funcionales de variantes de regulacion requieren mucho tiempo y son costosas. En un metodo a modo de ejemplo, el metodo incluye mutagenizar celulas, capturar celulas individuales en microgotitas acuosas-en-aceite y luego fusionar un locus regulador supuesto amplificado con transcripciones de ARN del gen cercano. De esta manera, las mutaciones en las secuencias reguladoras podnan enlazarse con los niveles de expresion genica.
A menudo, un investigador desea entender como las secuencias de acido nucleico genomico afectan a la expresion de las transcripciones. Debido a que muchos nucleotidos afectan a la expresion del gen, estos experimentos son tediosos. Idealmente, un investigador quiere analizar la expresion genica cuantitativa al nivel de celulas individuales en funcion de las secuencias reguladoras mutagenizadas. Las secuencias reguladoras sospechosas se mutagenizan para crear un banco de secuencias reguladoras variables. Entonces, se utiliza una combinacion de PCR de extension por solapamiento y de RT-PCR de extension por solapamiento en microgotitas de emulsion de celulas individuales para enlazar la secuencia de ADN reguladora a niveles de transcripcion de ARN. De esta manera, el efecto de la mutagenesis de la secuencia reguladora en los niveles de transcripcion de ARN se mide en celulas individuales.
Ejemplo 21: Metodos para el Haplotipado Molecular
Muchos tipos de analisis geneticos tales como PGD o estudios de asociacion de genoma completo se benefician del enlace del haplotipo de varios loci geneticos en el ADN derivado de una celula de esperma individual. En un metodo a modo de ejemplo, celulas del esperma individuales son capturadas en microgotitas acuosas-en-aceite, y luego varios loci geneticos variables se fusionan en las celulas, tales como SNPs o STRs. Esto permite un ajuste de fase molecular masivamente paralelo.
Se proporciona un metodo para el ajuste de fase de dos loci. Millones de haplotipos de esperma individual se analizan en paralelo. El metodo implica las siguientes etapas: (i) el aislamiento de las celulas de esperma individuales que utilizan la tecnologfa de microgotitas de emulsion; (ii) amplificacion de dos variantes geneticas por PCR en reactores de microgotitas; (iii) la amplificacion por PCR de extension por solapamiento de complejos de fusion entre las variantes en los reactores de microgotitas; y (iv) la recuperacion de complejos enlazados por inversion de la emulsion. El resultado es un banco de haplotipos ajustados en fase, que luego se secuencian utilizando la secuenciacion de siguiente generacion.
Un metodo alternativo para el ajuste de fase alterno de multiples loci se proporciona en este parrafo. En algunos casos, el ajuste de fases de solo dos loci no es adecuado para la mejora de los estudios de asociacion de todo el genoma u otros tipos de analisis. En tales situaciones, se utilizan metodos moleculares como la LCR o sondas- candado, que permiten una multiplexacion mayor de la sonda, como una alternativa. Adicionalmente, una diversidad
5
10
15
20
25
30
35
40
45
50
de pares de cebadores de PCR se fijan a las perlas, de manera que miles de pares de cebadores de la PCR se distribuyen a microgotitas de emulsion que contienen una unica perla y una celula de esperma individual.
Ejemplo 22: Metodos de Deteccion de la Evolucion Molecular Dirigida
Algunos tipos de aplicaciones industriales requieren enzimas y/o cepas biologicas para optimizar biosistemas modificados por ingeniena. Por ejemplo, las enzimas que degradan un tipo particular de residuos industriales no se pueden encontrar en la naturaleza, pero la evolucion in vitro de enzimas existentes podna resultar en una enzima optimizada. Muchos de tales procesos se benefician de analisis genetico molecular de multiples loci en millones de celulas individuales analizadas en paralelo.
Evolucion de Levaduras
La evolucion industrial in vitro a menudo implica la mutagenesis de celulas seguida por el crecimiento en medios selectivos. En un metodo a modo de ejemplo, celulas de levadura se someten a mutagenesis y se cultivan en medios especiales que contienen xilosa como fuente de alimentacion primaria. Las celulas de levadura individuales son capturadas en microgotitas acuosas-en-aceite, y luego se secuencian varios genes de la ruta metabolica. Al menos una comparua (Microbiogen, Sydney, AUS) esta desarrollando cepas de levadura para el crecimiento en xilosa, pero esta utilizando metodos de rastreo lentos y tradicionales.
Otras aplicaciones
Muchos grupos estan investigando actualmente metodos para mejorar las cepas naturales de algas y bacterias con el fin de la produccion de biocombustibles. Los metodos para la determinacion del genotipo enlazado y/o el analisis de la expresion genica de celulas individuales se utilizan para activar la evolucion in vitro de estos organismos con el fin de la produccion de biocombustibles u otros tipos de energfa.
Ejemplo 23: Otras Aplicaciones y Metodos Derivados
Agricultura
Todos los metodos clmicos descritos anteriormente (p. ej., secuenciacion de celulas T y secuenciacion de celulas B) son aplicables a los animales. Estos animales incluyen, pero no se limitan a vacas, cerdos, pollos o salmon, etc. En particular, el ganado y otros animales agncolas padecen enfermedades infecciosas que resultan en considerables dificultades economicas. Los metodos descritos en esta memoria son adaptables para mejorar el seguimiento y la deteccion de enfermedades infecciosas en un entorno agncola.
Metagenomica
La metagenomica es un metodo de estudio de la diversidad genetica en los ecosistemas en los que muestras ambientales se secuencian directamente. En un metodo a modo de ejemplo, celulas tales como algas en muestras del medio ambiente tales como el agua de mar se separan en microgotitas de emulsion de celulas individuales, y despues se analizan para al menos dos loci geneticos. Por ejemplo, un investigador puede estar interesado en encontrar una especie particular de alga que expresa una forma particular de clorofila y pertenece a una especie de alga particular. El genotipado por LCR se utiliza para amplificar amplicones principales solo de celulas de algas de una especie particular que alberga esa forma particular de clorofila. Un experto en la tecnica tambien puede apreciar que un metodo de este tipo tambien es util para probar la diversidad de clorofila en una clase, especie o genero particular de algas mediante el enlace de LCR espedfica de la especie o sondas-candado con la amplificacion por PCR de exones de clorofila. Las algas y la clorofila son solo un ejemplo espedfico; las celulas son de cualquier especie, y hay muchos tipos de loci geneticos diana, incluidas las transcripciones de ARN, variantes genomicas y aDn mitocondrial.
Deteccion de la metilacion del ADN
La metilacion del ADN es un tipo de modificador epigenetico que ayuda a las celulas a controlar la transcripcion de ARN y otros procesos celulares (Brunner et al., 2009 Genome Research 19: 1044-56). Por ejemplo, los linfocitos de la sangre pueden sufrir metilacion del ADN aberrante, conduciendo a tumores lfquidos. Los metodos descritos anteriormente son utiles para analizar la metilacion del ADN en celulas individuales (p. ej., loci de metilacion del ADN multiple en celulas individuales, o al menos un locus de metilacion del ADN con una diana de transcripcion de ARN o diana de la secuencia de ADN). La metilacion del ADN se analiza mediante enzimas de restriccion espedficas para la metilacion, la conversion de bisulfito o precipitacion con anti-metilcitosina. La mayor parte de estos analisis requerinan multiples entradas de tampones de reaccion si se utiliza un chip de microfluidos para crear microgotitas de emulsion. Por ejemplo, la realizacion de la conversion de bisulfito requiere un tampon que no es apropiado para la PCR, LCR, RT-PCR o sondas-candado. En un metodo a modo de ejemplo, las celulas individuales se encapsulan en microgotitas de emulsion utilizando un tampon de conversion de bisulfito estandar. Luego, despues de la conversion de bisulfito, las microgotitas se fusionan con un segundo tampon acuoso. Este segundo tampon diluye el
tampon de conversion de bisulfito, permitiendo PCR, LCR, RT-PCR o metodos de sonda-candado. Enfoques similares son utiles para anti-metilcitosina o digestion de restriccion sensible a la metilacion.
Inmunoprecipitacion de la cromatina
La inmunoprecipitacion de la cromatina es un metodo en el que el ADN se reticula a las protemas en los nucleos 5 celulares (Johnson et al., 2007 Science 316:1497-502). Un anticuerpo dirigido contra una protema de union de ADN de interes se utiliza entonces para precipitar espedficamente los complejos de ADN-protema, y luego el ADN se secuencia o analiza con un chip de ADN. Los metodos de enlace molecular descritos anteriormente se utilizan para analizar multiples loci de union a ADN-protema en celulas individuales, o al menos un locus de union ADN-protema con una diana de transcripcion de ARN o diana de secuencia de ADN. La mayor parte de estos analisis requieren 10 multiples entradas de tampones de reaccion si se utiliza un chip de microfluidos para crear microgotitas de emulsion. Por ejemplo, la realizacion de inmunoprecipitacion de la cromatina requiere un tampon que no es apropiado para la PCR, LCR, RT-PCR o sondas-candado. En un metodo a modo de ejemplo, las celulas individuales se encapsulan en microgotitas de emulsion utilizando un tampon de inmunoprecipitacion estandar. Luego, despues de la precipitacion, las microgotitas se fusionan con un segundo tampon acuoso. Este segundo tampon diluye el tampon de 15 precipitacion, permitiendo PCR, LCR, RT-PCR, o metodos de sonda-candado.
TABLA 2: LISTADO INFORMAL DE SECUENCIAS
SEQ ID N°
NOMBRE REGION DE FIJACION COMO OBJETICiVO SECUENCIA DE DESCRIPCION
DEL GENOMA SOLAPAMIENTO
SEQ ID NO: 1
TRBV2.F TCAAATTTCACTCTGAAGATCCGGTCCACAA directo externo
SEQ ID NO: 2
TRBV3-1.F GCTCACTTAAATCTTCACATCAATTCCCTGG directo externo
SEQ ID NO: 3
TRBV4-1.F CTTAAACCTTCACCTACACGCCCTGC directo externo
SEQ ID NO: 4
TRBV4-2 4- 3.F CTTATTCCTTCACCTACACACCCTGC directo externo
SEQ ID NO: 5
TRBV5-1.F GCTCTGAGATGAATGTGAGCACCTTG directo externo
SEQ ID NO: 6
TRBV5-3.F GCTCTGAGATGAATGTGAGTGCCTTG directo externo
SEQ ID NO: 7
TRBV 5-4 55 5-6 5-7 5- 8.F GCTCTGAGCTGAATGTGAACGCCTTG directo externo
SEQ ID NO: 8
TRBV6-1.F TCGCTCAGGCTGGAGTCGGCTG directo externo
SEQ ID NO: 9
TRBV6-2 6- 3.F GCTGGGGTTGGAGTCGGCTG directo externo
SEQ ID NO: 10
TRBV6-4.F CCCTCACGTTGGCGTCTGCTG directo externo
SEQ ID NO: 11
TRBV6-5.F GCTCAGGCTGCTGTCGGCTG directo externo
SEQ ID NO: 12
TRBV6-6.F CGCTCAGGCTGGAGTTGGCTG directo externo
SEQ ID NO: 13
TRBV6-7.F CCCCTCAAGCTGGAGTCAGCTG directo externo
SEQ ID NO: 14
TRBV6-8.F CACTCAGGCTGGTGTCGGCTG directo externo
SEQ ID NO: 15
TRBV6-9.F CGCTCAGGCTGGAGTCAGCTG directo externo
SEQ ID NO: 16
TRBV7-1.F CCACTCTGAAGTTCCAGCGCACAC directo externo
SEQ ID NO: 17
TRBV7-2.F CACTCTGACGATCCAGCGCACAC directo externo
SEQ ID NO: 18
TRBV7-3.F CTCTACTCTGAAGATCCAGCGCACAG directo externo
SEQ ID NO: 19
TRBV7-4.F CCACTCTGAAGATCCAGCGCACAG directo externo
SEQ ID NO: 20
TRBV7-6.F CACTCTGACGATCCAGCGCACAG directo externo
SEQ ID NO: 21
TRBV7-7.F CCACTCTGACGATTCAGCGCACAG directo externo
SEQ ID NO: 22
TRBV7-8.F CCACTCTGAAGATCCAGCGCACAC directo externo
SEQ ID NO: 23
TRBV7-9.F CACCTTGGAGATCCAGCGCACAG directo externo
se
ouj0;uj osj0AUj
OOOIOIVOIOO WOOOOOOOOOOIOOOOOOVOV y>-zrayi ON dl 03S
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO VWOOOOOIOOOIOOOOOOVOIOIOV ye-zrayi ON dl es 03S
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO V WOOIOHOOOVOVIOOOVOIOOOVIOVOO yz-zrayi ON dl ZQ 03S
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO WOOOOOOIOOOIOIOOOOVOIOOO yi-zrayi ON dl I.S 03S
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO V WOOOHOOOOIOOIOOOVOIOVOVOIOIO y'9-i.rayi ON dl OS 03S
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO V WOOOIOVOOHOOOIOOVOVOVOVOWOO y>-i.rayi ON dl 6V 03S
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO w VOOIOIOOOHOWOOOVOIOVOWOVIOOV ye-i-rayi ON dl 8V 03S
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO wo OOWOOOOOIOOIOOWHOOOWOVIOOV y'2-i.rayi ON dl LV 03S
ouj0}U! osj0AUj
1001011W1V OOOIOIVOIOO vwo OIOIIOOOIOOIOIOVOIOIOWOVIOOVH yi.-i.rayi ON dl 9V 03S
oiU0)X0 o;o0jjp
OOWOWIOIIOVOIOOIVOUOVOOOO yoeAayi ON dl 9V 03S
oiU0)X0 o;o0jjp
VOWOOVOIOIOVOIOIOWOIOUVOWIO di-62Aayi ON dl VV 03S
oiU0)X0 o;o0jjp
V0000010V001011V0100010 yszAayi ON dl £V 03S
oiU0)X0 o;o0jjp
VOOOOOIOVOOIOOIVOIOOO dzzAayi ON dl ZV 03S
oiU0)X0 o;o0jjp
VOOOIOIOVOOIOOOVOIOOO di-szAayi ON dl IV 03S
oiU0)X0 o;o0jjp
IVOOOIOIOVOVIOOOIOIOOOIO di-^Aayi ON dl OV 03S
oiU0)X0 o;o0jjp
OVOIOOIOIOOIWOOOIOOOVO di-ezAayi ON dl 68 03S
oiU0)X0 o;o0jjp
OIOVOOVOIOVOVOIOIOVOOIOHO di-ozAayi ON dl 88 03S
oiU0)X0 o;o0jjp
OOOOOOIVOVOIOIOVOIOIOO d'6i.Aayi ON dl ze 03S
ouj0;x0 o;o0jjp
OVIOOVOOVOOIVOOVOIOOIVOO d suAayi ON dl 98 03S
oiU0)X0 o;o0jjp
OOOOIVOOIVOWOIOOOVOOHO d'zi-Aayi ON dl se 03S
oiU0)X0 o;o0jjp
VOOVIOOOVOOIVOVOUOOOVIOIO d'9i.Aayi ON dl V£ 03S
oiU0)X0 o;o0jjp
VOWOOOOOVOOVOOIWOOHOWIVO d'si-Aayi ON dl ee D3S
oiU0)X0 o;o0jjp
OVOOIOOOVOOIOOWOIOIOVIO dHAayi ON dl W CD M m O
oiU0)X0 o;o0jjp
OOIIOOIOOVOIVOWOIOWOIOUVO d'ei-Aayi ON dl 1.8 03S
oiU0)X0 o;o0jjp
OVOIOOOOVOOIVOWOIOIOVOO dS -zi v-zi e -2i.Aayi ON dl oe 03S
oiU0)X0 o;o0jjp
WOOIOOOVOOIVOWOIOIOVOOIO d'2-u.Aayi ON dl 6Z 03S
oiU0)X0 o;o0jjp
OVOOIOOOVOOIVOWOIOIOVOO de-u i -n.Aay± ON dl 8Z 03S
oiU0)X0 o;o0jjp
VIOOOOIOVOOIOIOVOIOOIOO d'e-oi-Aayi ON dl LZ 03S
oiU0)X0 o;o0jjp
VIOOVOIOVOOIOIOVOIOOOOO d'2-oi.Aayi ON dl 9Z 03S
oiU0)X0 o;o0jjp
OIOOIOIOVOOIOIOVOIOOOO yi.-oi.Aayi ON dl 8Z 03S
oiU0)X0 o;o0jjp
OIOIOIOOVOIOOVWIOWOIOIOVOO d'6Aay± ON dl VZ 03S
OUJ0JX0 OSJ0AU!
OOOVOVOOVllOOVlVllllWOlVO UZ1\ ON ai ez CGS
ouj0;uj o;o0jjp
OOVOIVOVOOO 1V11WOVOOV OIOOVUVOIOVIVVOOOVIWOOIO d'31l ON ai ZL CGS
OUJ0p<0 OSJ0AUj
OOOWOVOOOIOOOVWOVOVO d'l-zxai ON ai IL CGS
ouj0;uj o;o0jjp
OOVOIVOVOOO 1V11WOVOOV OOIOOOOOVOIOVOIOOV di2xai ON ai oz CGS
OUJ0JX0 OSJ0AUj
OIOVOOOVOOIVUOVIOOIOO yi.2xai ON ai 69 CGS
ouj0;uj o;o0jjp
OOVOIVOVOOO 1V11WOVOOV IVOVOOOVOIOIWOVVOOIO d'l-zxai ON ai 89 CGS
OUJ0p<0 OSJ0AUj
loiiooiooooioiovonvo yedxod ON ai 19 CGS
ouj0;uj o;o0jjp
OOVOIVOVOOO 1V11WOVOOV lOOllOVOVOOOUVOVOOVOW d'eaxod ON ai 99 CGS
OUJ0JX0 OSJ0AUj
looooivowovioomooo avdNi ON ai S9 CGS
ouj0;uj o;o0jjp
OOVOIVOVOOO 1V11WOVOOV OIVOIVOVOIOVOOOVOOOO dVdNl ON ai V9 CGS
OUJ0p<0 OSJ0AUj
WOIOIVOVIOOOOIVIIVOOHO aodNi ON ai 89 CGS
ouj0;uj o;o0jjp
OOVOIVOVOOO 1V11WOVOOV OOllllOOlVOOlOlOOVOl dOdNI ON ai Z9 CGS
OUJ0p<0 OSJ0AUj
lOllOOlllOOWOVOOlOOO a >11 ON ai 1-9 CGS
ouj0}U! o;o0jjp
OOVOIVOVOOO 1V11WOVOOV VIVOOOIOWOVOVOOOVOO d>ll ON ai 09 CGS
OUJ0p<0 OSJ0AUj
VOlOVOVOVlOllOllOllOVOlllOOVO d sni ON ai 6S 03S
ouj0;uj o;o0jjp
OOVOIVOVOOO 1V11WOVOOV lOWlllVOVOlOOlVOOVOOVOl d sni ON ai 8S 03S
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO WOOOOOOOOOOIOOIOOOVOIO yz-zraai ON ai ZS CGS
ouj0;uj osj0AUj
1001011W1V OOOIOIVOIOO WOOOOOOOOOOIOOIOOOVOIO a'9-zraai ON ai 9S 03S
ouj0}U! osj0AUj
1001011W1V OOOIOIVOIOO WOOOOOOIOOOIOOOOOOVOO as-zraai ON ai SS 03S
1001011W1V V9

Claims (22)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    REIVINDICACIONES
    1. Un metodo para analizar al menos dos secuencias de acido nucleico en una celula individual contenida dentro de una poblacion de al menos 10.000 celulas, en el que la celula individual se afsla en una microgotita de emulsion, comprendiendo dicho metodo:
    proporcionar un primer conjunto de sondas de acido nucleico, comprendiendo el primer conjunto una primera sonda que comprende una secuencia que es complementaria a una primera sub-secuencia de acido nucleico diana, comprendiendo una segunda sonda una secuencia que es complementaria a una segunda sub-secuencia del primer acido nucleico diana y una segunda secuencia que es complementaria a una secuencia exogena, comprendiendo una tercera sonda la secuencia exogena y una secuencia que es complementaria a una primera sub-secuencia de un segundo acido nucleico diana, y una cuarta sonda que comprende una secuencia que es complementaria a una segunda sub-secuencia de la segunda secuencia de acido nucleico diana, en donde el primer acido nucleico diana o el segundo acido nucleico diana comprende una secuencia de receptor de celulas T o una secuencia de inmunoglobulina;
    aislar las celulas individuales con al menos un conjunto de sondas de acido nucleico;
    amplificar la primera y segunda secuencias de acido nucleico diana de manera independiente, en donde la primera secuencia de acido nucleico diana se amplifica utilizando la primera sonda y la segunda sonda, y en donde la segunda secuencia de acido nucleico diana se amplifica utilizando la tercera sonda y la cuarta sonda;
    hibridar la secuencia exogena a su complemento;
    amplificar la primera secuencia de acido nucleico diana, la segunda secuencia de acido nucleico diana y la secuencia exogena, utilizando las primera y cuarta sondas, generando con ello un complejo fusionado; y
    realizar una reaccion de secuenciacion a granel para generar informacion de la secuencia para al menos 100.000 complejos fusionados a partir de al menos 10.000 celulas dentro de la poblacion de celulas, en donde la informacion de la secuencia es suficiente para co-localizar la primera secuencia de acido nucleico diana y la segunda secuencia de acido nucleico diana en una celula individual de la poblacion de al menos 10.000 celulas.
  2. 2. El metodo de la reivindicacion 1, en el que la etapa de amplificacion comprende llevar a cabo
    (a) una reaccion en cadena de la polimerasa y en donde la primera y tercera sondas son cebadores directos y la segunda y cuarta sondas son cebadores inversos para la reaccion en cadena de la polimerasa;
    (b) una reaccion en cadena de la ligasa; o
    (c) una reaccion en cadena de la polimerasa, una reaccion en cadena de la polimerasa con transcriptasa inversa o una reaccion en cadena de la ligasa, seguida de una reaccion en cadena de la polimerasa.
  3. 3. El metodo de la reivindicacion 1 o 2, en el que el complejo fusionado es circular.
  4. 4. El metodo segun una de las reivindicaciones 1-3, en el que la primera o la segunda secuencia de acido nucleico diana es una secuencia de ARN o una secuencia de ADN.
  5. 5. El metodo segun una de las reivindicaciones 1-4, en el que
    (a) la primera o segunda secuencia de acido nucleico diana comprende una secuencia del receptor de celulas T, en donde preferiblemente la primera secuencia de acido nucleico diana, la segunda secuencia de acido nucleico diana o las dos secuencias de acido nucleico diana comprenden una secuencia de inmunoglobulina;
    (b) el primer acido nucleico diana comprende una secuencia del receptor de celulas T y la segunda secuencia de acido nucleico diana comprende una segunda molecula que esta asociada con la funcion de celulas inmunes;
    (c) la primera secuencia de acido nucleico diana comprende una secuencia de inmunoglobulina, y la segunda secuencia comprende una segunda molecula asociada con la funcion de celulas inmunes; o
    (d) el primero o segundo acido nucleico diana comprende una secuencia de genes rara.
  6. 6. El metodo de la reivindicacion 5(b) en el que la segunda molecula se selecciona del grupo que consiste en: interleucina-2 (IL-2), interleucina-4 (lL-4), interferon gamma (IFNy), interleucina-10 (IL-10), interleucina-1 (IL-1), interleucina-13 (IL-13), interleucina-17 (IL-17), interleucina-18 (IL-18), factor de necrosis tumoral alfa (TNFa), factor de necrosis tumoral beta (TNFp), factor de transcripcion 21 de la caja T (TBX21), caja forkhead P3 (FOXP3), cumulo
    10
    15
    20
    25
    30
    35
    40
    45
    de diferenciacion 4 (CD4), cumulo de diferenciacion 8 (CD8), cumulo de diferenciacion 1d (CD1d), cumulo de diferenciacion 161 (CD161), cumulo de diferenciacion 3 (CD3), complejo principal de histocompatibilidad (MHC), cumulo de diferenciacion 19 (CD19), receptor de interleucina 7 (receptor de IL-7), cumulo de diferenciacion 10 (CD10), cumulo de diferenciacion 20 (CD20), cumulo de diferenciacion 22 (CD22), cumulo de diferenciacion 34
    (CD34), cumulo de diferenciacion 27 (CD27), cumulo de diferenciacion 5 (CD5) y cumulo de diferenciacion 45
    (CD45), cumulo de diferenciacion 38 (CD38), cumulo de diferenciacion 78 (CD78), receptor de interleucina-6, factor regulador de interferon 4 (IRF4) y cumulo de diferenciacion 138 (CD138).
  7. 7. El metodo de la reivindicacion 5(c), en el que la segunda molecula se selecciona del grupo que consiste en:
    interleucina-2 (IL-2), interleucina-4 (IL-4), interferon gamma (IFNy), interleucina-10 (IL-10), interleucina-1 (IL-1), interleucina-13 (IL-13), interleucina-17 (IL-17), interleucina-18 (IL-18), factor de necrosis tumoral alfa (TNFa), factor de necrosis tumoral beta (TNFp), factor de transcripcion 21 de la caja T (TBX21), caja forkhead P3 (FOXP3), cumulo de diferenciacion 4 (CD4), cumulo de diferenciacion 8 (CD8), cumulo de diferenciacion 1d (CD1d), cumulo de diferenciacion 161 (CD161), cumulo de diferenciacion 3 (CD3), complejo principal de histocompatibilidad (MHC), cumulo de diferenciacion 19 (CD19), receptor de interleucina 7 (receptor de lL-7), cumulo de diferenciacion 10 (CD10), cumulo de diferenciacion 20 (CD20), cumulo de diferenciacion 22 (CD22), cumulo de diferenciacion 34
    (CD34), cumulo de diferenciacion 27 (CD27), cumulo de diferenciacion 5 (CD5) y cumulo de diferenciacion 45
    (CD45), cumulo de diferenciacion 38 (CD38), cumulo de diferenciacion 78 (CD78), receptor de interleucina-6, factor regulador de interferon 4 (IRF4) y cumulo de diferenciacion 138 (CD138).
  8. 8. El metodo de la reivindicacion 5(d), en el que
    (a) la secuencia de genes rara esta presente en menos de 5% de las celulas, preferiblemente en menos de 1% de las celulas, y mas preferiblemente en menos de 0,1% de las celulas; o
    (b) la secuencia de genes rara resulta de una mutacion genetica, en donde preferiblemente la mutacion es una mutacion somatica; la mutacion esta asociada con una enfermedad; o
    la mutacion genetica es una mutacion en un gen seleccionado del grupo que consiste en el receptor del factor de crecimiento epidermal (EGFR), homologo de fosfatasa y tensina (PTEN), protema de tumor 53 (p53), MutS homologo 2 (MSH2), neoplasia endocrina multiple 1 (MEN1), poliposis adenomatosa coli (APC), receptor Fas (FASR), protema retinoblastoma (Rb1), Janus quinasa 2 (JAK2), factor de transcripcion 1 similar a (ETS) (ELK1), virus de la eritroblastosis aviar v-ets E26 homologo de oncogen 1 (ETS1), cancer de mama 1 (BRCA1), cancer de mama 2 (BRCA2), receptor del factor de crecimiento de hepatocitos (MET), proto-oncogen ret (RET), leucemia eritroblastica viral V-erb-b2 homologo de oncogen 2 (HER2), sarcoma de rata viral V-Ki- ras2 Kirsten homologo de oncogen (KRAS), linfoma de celulas B 2 (BCL2), mielocitomatosis viral V-myc homologo de oncogen (MYC), gen de neurofibromatosis de tipo 2 (NF2), mieloblastosis viral v-myb homologo de oncogen (MYB) y homologo mutS 6 (E. coli) (MSH6);
    siendo la enfermedad preferiblemente cancer, seleccionandose dicho cancer preferiblemente del grupo que consiste en carcinoma de pulmon, cancer de pulmon de celulas no pequenas, cancer de pulmon de celulas pequenas, cancer de utero, cancer de tiroides, carcinoma de mama, carcinoma de prostata, carcinoma de pancreas, carcinoma de colon, linfoma, linfoma de Burkitt, linfoma de Hodgkin, leucemia mieloide, leucemia, sarcoma, blastoma, melanoma, seminoma, cancer de cerebro, glioma, glioblastoma, astrocitoma cerebeloso, linfoma de celulas T cutaneo, cancer gastrico, cancer de fugado, ependimoma, cancer de laringe, cancer de cuello, cancer de estomago, cancer de rinon, cancer de pancreas, cancer de vejiga, cancer de esofago, cancer testicular, meduloblastoma, cancer vaginal, cancer de ovario, cancer de cuello de utero, carcinoma de celulas basales, adenoma de la pituitaria,
    rabdomiosarcoma o sarcoma de Kaposi.
  9. 9. El metodo segun una de las reivindicaciones 1-8, que comprende, ademas, fijar y permeabilizar las celulas antes de realizar la etapa de amplificacion.
  10. 10. El metodo segun una de las reivindicaciones 1-9, que comprende, ademas, lisar las celulas antes de realizar la etapa de amplificacion.
  11. 11. El metodo segun una de las reivindicaciones 1-10, que comprende, ademas, cuantificar la informacion de la secuencia generada a partir de la reaccion de secuenciacion a granel.
  12. 12. El metodo segun una de las reivindicaciones 1-11, en el que la realizacion de la reaccion de secuenciacion a granel para generar informacion de la secuencia se lleva a cabo para al menos 1.000.000 de complejos fusionados de al menos 10.000 celulas dentro de la poblacion de celulas.
    (ba)
    (bb)
    (bc)
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
  13. 13. El metodo de la reivindicacion 1, que comprende, ademas:
    (A) proporcionar un segundo conjunto de sondas de acido nucleico, comprendiendo el segundo conjunto una quinta sonda que comprende una secuencia que es complementaria a una tercera sub-secuencia de acido nucleico diana, comprendiendo una sexta sonda una secuencia que es complementaria a una segunda sub-secuencia de la tercera secuencia de acido nucleico diana y una segunda secuencia que es complementaria a una segunda secuencia exogena, comprendiendo una septima sonda la segunda secuencia exogena y una secuencia que es complementaria a una primera sub-secuencia de una cuarta secuencia de acido nucleico diana, y comprendiendo una octava sonda una secuencia que es complementaria a una segunda sub- secuencia de la cuarta secuencia de acido nucleico diana;
    aislar las celulas individuales con los primer y segundo conjuntos de sondas de acido nucleico;
    amplificar la tercera y cuarta secuencias de acido nucleico diana de manera independiente, en el que la tercera secuencia de acido nucleico diana se amplifica utilizando la quinta sonda y la sexta sonda, y en el que la cuarta secuencia de acido nucleico diana se amplifica utilizando la septima sonda y la octava sonda;
    hibridar la segunda secuencia exogena a su complemento;
    amplificar la tercera secuencia de acido nucleico diana, la cuarta secuencia de acido nucleico diana y la segunda secuencia exogena, utilizando las quinta y octava sondas, generando con ello un complejo fusionado; y
    realizar una reaccion de secuenciacion a granel para generar informacion de la secuencia para al menos 100.000 complejos fusionados a partir de al menos 10.000 celulas dentro de la poblacion de celulas, en donde la informacion de la secuencia es suficiente para co-localizar la primera secuencia de acido nucleico diana, la segunda secuencia de acido nucleico diana, la tercera secuencia de acido nucleico diana y la cuarta secuencia de acido nucleico diana en una celula individual de la poblacion de al menos 10.000 celulas; o
    (B) proporcionar N conjuntos de sondas de acido nucleico, en donde cada uno de los N conjuntos comprende una sonda I1 que comprende una secuencia que es complementaria a una primera sub-secuencia de acido nucleico diana Ia, comprendiendo una sonda I2 una secuencia que es complementaria a una segunda sub-secuencia de acido nucleico diana Ia y una segunda secuencia que es complementaria a una secuencia exogena I, comprendiendo una sonda I3 la secuencia exogena I y una secuencia que es complementaria a una primera sub-secuencia de acido nucleico diana Ib y comprendiendo una sonda I4 una secuencia que es complementaria a una segunda sub- secuencia de acido nucleico diana Ib, en donde I oscila entre 1 y N;
    aislar las celulas individuales con los N conjuntos de sondas de acido nucleico;
    amplificar para todos los valores de I las secuencias de acido nucleico diana Ia e Ib, independientemente, en donde la secuencia de acido nucleico diana Ia se amplifica utilizando la sonda I1 y la sonda I2 y la secuencia de acido nucleico diana Ib se amplifica utilizando la sonda I3 y la sonda I4;
    hibridar la secuencia exogena I a su complemento;
    amplificar para cada una de las I, la secuencia diana Ia, la secuencia diana Ib y la secuencia exogena I utilizando las sondas I1 e I4, generando con ello N complejos fusionados; y
    realizar una reaccion de secuenciacion a granel para generar informacion de la secuencia para al menos 100.000 complejos fusionados a partir de al menos 10.000 celulas dentro de la poblacion de celulas, en donde la informacion de la secuencia es suficiente para co-localizar las N secuencias de acido nucleico diana Ia y las secuencias de acido nucleico diana Ib en una celula individual de la poblacion de al menos 10.000 celulas.
  14. 14. Un metodo para analizar al menos dos secuencias de acido nucleico en una celula individual contenida dentro de una poblacion de al menos 10.000 celulas, que comprende:
    aislar cada una de una pluralidad de celulas individuales de una poblacion de al menos 10.000 celulas en una microgotita de emulsion,
    5
    10
    15
    20
    25
    30
    35
    40
    45
    introducir una secuencia de codigo de barras exogena, unica, que comprende al menos seis nucleotidos en cada una de las microgotitas de emulsion, en donde cada una de las secuencias de codigo de barras se selecciona de una agrupacion de secuencias de codigo de barras con una diversidad de la secuencia mayor que 1000 veces, en donde cada una de dichas secuencias de codigo de barras exogenas, unicas, coincide con una celula individual de dicha pluralidad de celulas individuales;
    para cada una de la pluralidad de celulas individuales,
    proporcionar al menos un conjunto de sondas de acido nucleico, comprendiendo el conjunto una primera sonda que comprende una secuencia que es complementaria a una secuencia de acido nucleico que esta localizada en el extremo 5' de la secuencia de codigo de barras exogena, unica, comprendiendo una segunda sonda una secuencia que es complementaria a una secuencia de acido nucleico que esta localizada en el extremo 3' de la secuencia de codigo de barras exogena, unica, y una segunda region de secuencia que es complementaria a una secuencia exogena, no humana, comprendiendo una tercera sonda una secuencia que comprende la secuencia exogena, no humana, y una secuencia que es complementaria a una primera sub-secuencia de una segunda secuencia de acido nucleico diana, y comprendiendo una cuarta sonda una secuencia que es complementaria a una segunda sub- secuencia de la segunda secuencia de acido nucleico diana, y en el que la segunda secuencia de acido nucleico diana comprende una secuencia del receptor de celulas T o una secuencia de inmunoglobulina;
    amplificar la primera y segunda secuencias de acido nucleico independientemente, en donde la secuencia de codigo de barras exogena se amplifica utilizando la primera sonda y la segunda sondas, y en donde la segunda secuencia de acido nucleico diana se amplifica utilizando la tercera sonda y la cuarta sonda;
    hibridar la secuencia exogena, no humana, a su complemento;
    amplificar la secuencia de codigo de barras, la segunda secuencia de acido nucleico diana y la secuencia exogena, no humana, utilizando las primera y cuarta sondas;
    realizar la secuenciacion a granel de los complejos fusionados; e
    identificar una celula individual para cada uno de los complejos fusionados basado en la secuencia del codigo de barras.
  15. 15. El metodo de la reivindicacion 14, en el que la secuencia de codigo de barras se fija a una perla o a una
    superficie solida, en donde preferiblemente la perla o la superficie solida esta aislada en la microgotita de emulsion o el recipiente de reaccion, en el que preferiblemente introducir una secuencia de codigo de barras unica comprende condensar la microgotita de emulsion o un recipiente de reaccion que comprende la celula individual con la
    microgotita de emulsion o un recipiente de reaccion que comprende la secuencia de codigo de barras fijada a la
    perla o a la superficie solida.
  16. 16. El metodo de la reivindicacion 14 o 15, en el que la segunda secuencia de acido nucleico diana es complementaria a una secuencia de ARN o es complementaria a una secuencia de ADN.
  17. 17. El metodo segun una de las reivindicaciones 14-16, en el que la amplificacion comprende
    (a) realizar una reaccion en cadena de la polimerasa;
    (b) realizar una reaccion en cadena de la ligasa; o
    (c) realizar una reaccion en cadena de la ligasa seguida de una reaccion en cadena de la polimerasa.
  18. 18. El metodo de la reivindicacion 1 o 14, en el que la celula individual esta contenida dentro una poblacion de al menos 25.000 celulas, al menos 50.000 celulas, al menos 75.000 celulas o al menos 100.000 celulas.
  19. 19. El metodo de la reivindicacion 14, que comprende, ademas, cuantificar los complejos fusionados.
  20. 20. El metodo segun una de las reivindicaciones 14-19, en el que los complejos fusionados son circulares.
  21. 21. El metodo de la reivindicacion 14, que comprende, ademas:
    proporcionar N conjuntos de sondas de acido nucleico, en donde cada uno de los N conjuntos comprende una sonda I1 que comprende una secuencia que es complementaria a una primera sub-secuencia de una secuencia de codigo de barras, comprendiendo una sonda I2 una secuencia que es complementaria a una segunda sub-secuencia de la secuencia de codigo de barras y una segunda secuencia que es complementaria a una secuencia exogena I, comprendiendo una sonda I3 la secuencia exogena I y una secuencia que es complementaria a una primera sub- secuencia de acido nucleico diana Ib y comprendiendo una sonda I4 una secuencia que es complementaria a una segunda sub-secuencia de acido nucleico diana Ib, en donde I oscila entre 1 y N;
    aislar las celulas individuals con los N conjuntos de sondas de acido nucleico;
    amplificar para todos los valores de I la secuencia de codigo de barras y las secuencias de acido nucleico diana Ib independientemente, en donde la secuencia de codigo de barras se amplifica utilizando la sonda I1 y la sonda I2 y la secuencia de acido nucleico diana Ib se amplifica utilizando la sonda I3 y la sonda I4;
    5 hibridar la secuencia exogena I a su complemento;
    amplificar para cada uno de las I, la secuencia de codigo de barras, la secuencia diana Ib y la secuencia exogena I utilizando las sondas I1 e I4, generando con ello N complejos fusionados; y
    realizar una reaccion de secuenciacion a granel para generar informacion de la secuencia para al menos 100.000 complejos fusionados a partir de al menos 10.000 celulas dentro de la poblacion de celulas, en donde la informacion 10 de la secuencia es suficiente para co-localizar la secuencia de codigo de barras y la secuencia de acido nucleico diana Ib en una celula individual de la poblacion de al menos 10.000 celulas.
  22. 22. El metodo de la reivindicacion 13(B) o 21, en el que N es menor que o igual a 10, menor que o igual a 100, menor que o igual a 1000, menor que o igual a 10.000, menor que o igual a 100.000 o N representa la totalidad de las transcripciones poliadeniladas en una celula.
    15 23. El metodo de la reivindicacion 21 o 22, en el que la secuencia del codigo de barras es la misma secuencia para
    todos los N.
ES11848932.7T 2010-12-16 2011-12-16 Métodos para el análisis masivo paralelo de ácidos nucleicos en células individuales Active ES2615733T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US45960010P 2010-12-16 2010-12-16
US459600P 2010-12-16
PCT/US2011/065600 WO2012083225A2 (en) 2010-12-16 2011-12-16 System and methods for massively parallel analysis of nycleic acids in single cells

Publications (1)

Publication Number Publication Date
ES2615733T3 true ES2615733T3 (es) 2017-06-08

Family

ID=46245400

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11848932.7T Active ES2615733T3 (es) 2010-12-16 2011-12-16 Métodos para el análisis masivo paralelo de ácidos nucleicos en células individuales

Country Status (5)

Country Link
US (11) US20140057799A1 (es)
EP (1) EP2652155B1 (es)
DK (1) DK2652155T3 (es)
ES (1) ES2615733T3 (es)
WO (1) WO2012083225A2 (es)

Families Citing this family (220)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7968287B2 (en) 2004-10-08 2011-06-28 Medical Research Council Harvard University In vitro evolution in microfluidic systems
US20080003142A1 (en) 2006-05-11 2008-01-03 Link Darren R Microfluidic devices
WO2008097559A2 (en) 2007-02-06 2008-08-14 Brandeis University Manipulation of fluids and reactions in microfluidic systems
US8592221B2 (en) 2007-04-19 2013-11-26 Brandeis University Manipulation of fluids, fluid components and reactions in microfluidic systems
WO2010009365A1 (en) 2008-07-18 2010-01-21 Raindance Technologies, Inc. Droplet libraries
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US9394567B2 (en) 2008-11-07 2016-07-19 Adaptive Biotechnologies Corporation Detection and quantification of sample contamination in immune repertoire analysis
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
JP5798926B2 (ja) 2008-11-07 2015-10-21 シーケンタ インコーポレイテッド 配列解析によって病態をモニターする方法
EP2387627B1 (en) 2009-01-15 2016-03-30 Adaptive Biotechnologies Corporation Adaptive immunity profiling and methods for generation of monoclonal antibodies
EP3415235A1 (en) 2009-03-23 2018-12-19 Raindance Technologies Inc. Manipulation of microfluidic droplets
CA2765949C (en) 2009-06-25 2016-03-29 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
WO2011100604A2 (en) 2010-02-12 2011-08-18 Raindance Technologies, Inc. Digital analyte analysis
US9399797B2 (en) 2010-02-12 2016-07-26 Raindance Technologies, Inc. Digital analyte analysis
US10351905B2 (en) * 2010-02-12 2019-07-16 Bio-Rad Laboratories, Inc. Digital analyte analysis
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
EP3447155A1 (en) 2010-09-30 2019-02-27 Raindance Technologies, Inc. Sandwich assays in droplets
EP2652155B1 (en) * 2010-12-16 2016-11-16 Gigagen, Inc. Methods for massively parallel analysis of nucleic acids in single cells
JP6069224B2 (ja) 2011-01-31 2017-02-01 アプライズ バイオ, インコーポレイテッド 細胞において複数のエピトープを同定する方法
US9364803B2 (en) 2011-02-11 2016-06-14 Raindance Technologies, Inc. Methods for forming mixed droplets
US9150852B2 (en) 2011-02-18 2015-10-06 Raindance Technologies, Inc. Compositions and methods for molecular labeling
US9260753B2 (en) 2011-03-24 2016-02-16 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
WO2012167142A2 (en) 2011-06-02 2012-12-06 Raindance Technolgies, Inc. Enzyme quantification
US8658430B2 (en) 2011-07-20 2014-02-25 Raindance Technologies, Inc. Manipulating droplet size
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
CA2853088C (en) 2011-10-21 2018-03-13 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
EP3904536A1 (en) 2011-12-09 2021-11-03 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
EP2817418B1 (en) * 2012-02-24 2017-10-11 Raindance Technologies, Inc. Labeling and sample preparation for sequencing
CA2865575C (en) 2012-02-27 2024-01-16 Cellular Research, Inc. Compositions and kits for molecular counting
US11177020B2 (en) 2012-02-27 2021-11-16 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags
EP3372694A1 (en) 2012-03-05 2018-09-12 Adaptive Biotechnologies Corporation Determining paired immune receptor chains from frequency matched subunits
LT3305918T (lt) 2012-03-05 2020-09-25 President And Fellows Of Harvard College Būdai, skirti epigenetinių sekų sudarymui
ES2828661T3 (es) 2012-03-20 2021-05-27 Univ Washington Through Its Center For Commercialization Métodos para reducir la tasa de error de la secuenciación de ADN masiva en paralelo mediante el uso de la secuenciación de secuencia consenso bicatenaria
AU2013246050B2 (en) * 2012-04-13 2017-03-16 Adaptive Biotechnologies Corp. Detection and quantitation of sample contamination in immune repertoire analysis
CN107586832B (zh) 2012-05-08 2021-03-30 适应生物技术公司 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法
JP2015519909A (ja) 2012-06-15 2015-07-16 アダプティブ バイオテクノロジーズ コーポレイション 複合遺伝子セットにおける固有にタグ付加された再構成適応性免疫受容体遺伝子
JP6558830B2 (ja) 2012-06-15 2019-08-14 ボード・オブ・リージエンツ,ザ・ユニバーシテイ・オブ・テキサス・システム 複数転写産物のハイスループットシークエンシング
JP6525872B2 (ja) * 2012-08-08 2019-06-05 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 細胞中の複数のエピトープを同定するためのダイナミックレンジを高めること
US10161007B2 (en) 2012-08-13 2018-12-25 The Regents Of The University Of California Methods and systems for detecting biological components
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
AU2013302756C1 (en) 2012-08-14 2018-05-17 10X Genomics, Inc. Microcapsule compositions and methods
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2014047561A1 (en) * 2012-09-21 2014-03-27 The Broad Institute Inc. Compositions and methods for labeling of agents
ES2660027T3 (es) 2012-10-01 2018-03-20 Adaptive Biotechnologies Corporation Evaluación de la inmunocompetencia por la diversidad de los receptores de inmunidad adaptativa y caracterización de la clonalidad
EP3567116A1 (en) 2012-12-14 2019-11-13 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2014116729A2 (en) * 2013-01-22 2014-07-31 The Board Of Trustees Of The Leland Stanford Junior University Haplotying of hla loci with ultra-deep shotgun sequencing
KR102190198B1 (ko) 2013-02-08 2020-12-14 10엑스 제노믹스, 인크. 폴리뉴클레오티드 바코드 생성
CN113151436A (zh) * 2013-03-14 2021-07-23 奎斯特诊断投资股份有限公司 用于检测囊性纤维化病的方法
US10119134B2 (en) 2013-03-15 2018-11-06 Abvitro Llc Single cell bar-coding for antibody discovery
CN105452483B (zh) 2013-03-15 2019-01-11 适应生物技术公司 复杂基因集合中的独特标记的重排适应性免疫受体基因
WO2014210225A1 (en) 2013-06-25 2014-12-31 Prognosys Biosciences, Inc. Methods and systems for determining spatial patterns of biological targets in a sample
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
AU2014312208B2 (en) 2013-08-28 2019-07-25 Becton, Dickinson And Company Massively parallel single cell analysis
US10395758B2 (en) 2013-08-30 2019-08-27 10X Genomics, Inc. Sequencing methods
US11901041B2 (en) 2013-10-04 2024-02-13 Bio-Rad Laboratories, Inc. Digital analysis of nucleic acid modification
WO2015054292A1 (en) 2013-10-07 2015-04-16 Cellular Research, Inc. Methods and systems for digitally counting features on arrays
EP3058091B1 (en) * 2013-10-18 2020-03-25 The Broad Institute, Inc. Spatial and cellular mapping of biomolecules in situ by high-throughput sequencing
US9944977B2 (en) 2013-12-12 2018-04-17 Raindance Technologies, Inc. Distinguishing rare variations in a nucleic acid sequence from a sample
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
CA2935122C (en) 2013-12-30 2023-09-19 Atreca, Inc. Analysis of nucleic acids associated with single cells using nucleic acid barcodes
WO2015103225A1 (en) * 2013-12-31 2015-07-09 Illumina, Inc. Addressable flow cell using patterned electrodes
US20170292149A1 (en) 2014-03-05 2017-10-12 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
DE202015009494U1 (de) 2014-04-10 2018-02-08 10X Genomics, Inc. Fluidische Vorrichtungen und Systeme zur Einkapselung und Partitionierung von Reagenzien, und deren Anwendungen
ES2777529T3 (es) 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
DK3299469T3 (da) * 2014-04-21 2020-03-30 Harvard College Systemer og fremgangsmåder til at stregkodemarkere nukleinsyre
US20150298091A1 (en) 2014-04-21 2015-10-22 President And Fellows Of Harvard College Systems and methods for barcoding nucleic acids
US10202640B2 (en) 2014-05-07 2019-02-12 The Board Of Trustees Of The Leland Stanford Junior University Single cell analysis of T cells using high-throughput multiplex amplification and deep sequencing
MX2016016902A (es) 2014-06-26 2017-03-27 10X Genomics Inc Metodos para analizar acidos nucleicos de celulas individuales o poblaciones de celulas.
KR20170023979A (ko) 2014-06-26 2017-03-06 10엑스 제노믹스, 인크. 핵산 서열 조립을 위한 프로세스 및 시스템
EP3160654A4 (en) 2014-06-27 2017-11-15 The Regents of The University of California Pcr-activated sorting (pas)
CA2956925C (en) * 2014-08-01 2024-02-13 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
ES2727656T3 (es) * 2014-09-15 2019-10-17 Abvitro Llc Secuenciación de alto rendimiento de banco de nucleótidos
EP3209419A4 (en) 2014-10-22 2018-10-03 The Regents of The University of California High definition microdroplet printer
EP3212790B1 (en) 2014-10-29 2020-03-25 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
CN107002128A (zh) 2014-10-29 2017-08-01 10X 基因组学有限公司 用于靶核酸测序的方法和组合物
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
WO2016077750A1 (en) 2014-11-14 2016-05-19 Athena Diagnostics, Inc. Methods to detect a silent carrier genotype
US11066705B2 (en) 2014-11-25 2021-07-20 Adaptive Biotechnologies Corporation Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
CN112782140A (zh) 2014-12-03 2021-05-11 伊索普莱西斯公司 细胞分泌特征的分析和筛选
SG11201705615UA (en) 2015-01-12 2017-08-30 10X Genomics Inc Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
SG11201705425SA (en) 2015-01-13 2017-08-30 10X Genomics Inc Systems and methods for visualizing structural variation and phasing information
CN104531713A (zh) * 2015-01-20 2015-04-22 中国人民解放军第三军医大学 基于高通量测序构建人tcbr文库的多重pcr引物和方法
CA2974306A1 (en) 2015-02-04 2016-08-11 The Regents Of The University Of California Sequencing of nucleic acids via barcoding in discrete entities
MX2017010142A (es) 2015-02-09 2017-12-11 10X Genomics Inc Sistemas y metodos para determinar variacion estructural y ajuste de fases con datos de recuperacion de variantes.
US10697010B2 (en) 2015-02-19 2020-06-30 Becton, Dickinson And Company High-throughput single-cell analysis combining proteomic and genomic information
EP3262407B1 (en) 2015-02-24 2023-08-30 10X Genomics, Inc. Partition processing methods and systems
AU2016222788B2 (en) 2015-02-24 2022-03-31 Adaptive Biotechnologies Corp. Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
AU2016222719B2 (en) 2015-02-24 2022-03-31 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
CN107208158B (zh) 2015-02-27 2022-01-28 贝克顿迪金森公司 空间上可寻址的分子条形编码
US10513733B2 (en) 2015-03-23 2019-12-24 Board Of Regents, The University Of Texas System High throughout sequencing of paired VH and VL transcripts from B cells secreting antigen-specific antibodies
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
EP3835431B1 (en) 2015-03-30 2022-11-02 Becton, Dickinson and Company Methods for combinatorial barcoding
EP3277294A4 (en) 2015-04-01 2018-11-14 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target
EP3530752B1 (en) 2015-04-10 2021-03-24 Spatial Transcriptomics AB Spatially distinguished, multiplex nucleic acid analysis of biological specimens
US11746367B2 (en) 2015-04-17 2023-09-05 President And Fellows Of Harvard College Barcoding systems and methods for gene sequencing and other applications
EP3286326A1 (en) 2015-04-23 2018-02-28 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US11124823B2 (en) 2015-06-01 2021-09-21 Becton, Dickinson And Company Methods for RNA quantification
US9422547B1 (en) 2015-06-09 2016-08-23 Gigagen, Inc. Recombinant fusion proteins and libraries from immune cell repertoires
CA2988914A1 (en) 2015-06-09 2016-12-15 Gigagen, Inc. Recombinant fusion proteins and libraries from immune cell repertoires
JP6940484B2 (ja) 2015-09-11 2021-09-29 セルラー リサーチ, インコーポレイテッド ライブラリー正規化のための方法および組成物
JP7064439B2 (ja) * 2015-11-04 2022-05-10 アトレカ インコーポレイテッド 単一細胞に関連する核酸の解析のための、核酸バーコードの組み合わせセット
US11371094B2 (en) 2015-11-19 2022-06-28 10X Genomics, Inc. Systems and methods for nucleic acid processing using degenerate nucleotides
DK3882357T3 (da) 2015-12-04 2022-08-29 10X Genomics Inc Fremgangsmåder og sammensætninger til analyse af nukleinsyrer
EP3263715B1 (en) * 2016-06-28 2020-01-08 Hifibio Method for transcriptome analysis of single cells
PL3387152T3 (pl) 2015-12-08 2022-05-09 Twinstrand Biosciences, Inc. Ulepszone adaptory, sposoby i kompozycje do sekwencjonowania dupleksowego
JP6735348B2 (ja) 2016-02-11 2020-08-05 10エックス ジェノミクス, インコーポレイテッド 全ゲノム配列データのデノボアセンブリのためのシステム、方法及び媒体
KR20180116377A (ko) 2016-02-23 2018-10-24 더브테일 제노믹스 엘엘씨 게놈 어셈블리를 위한 페이징된 판독 세트의 생성 및 반수체형 페이징
AU2017261189B2 (en) 2016-05-02 2023-02-09 Becton, Dickinson And Company Accurate molecular barcoding
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
EP3954771A1 (en) 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
WO2017205691A1 (en) 2016-05-26 2017-11-30 Cellular Research, Inc. Molecular label counting adjustment methods
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10465242B2 (en) 2016-07-14 2019-11-05 University Of Utah Research Foundation Multi-sequence capture system
WO2018031691A1 (en) 2016-08-10 2018-02-15 The Regents Of The University Of California Combined multiple-displacement amplification and pcr in an emulsion microdroplet
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
CN109791157B (zh) 2016-09-26 2022-06-07 贝克顿迪金森公司 使用具有条形码化的寡核苷酸序列的试剂测量蛋白质表达
ES2870639T3 (es) 2016-10-24 2021-10-27 Geneinfosec Inc Ocultación de información presente en los ácidos nucleicos
CN109952612B (zh) 2016-11-08 2023-12-01 贝克顿迪金森公司 用于表达谱分类的方法
JP7228510B2 (ja) 2016-11-08 2023-02-24 ベクトン・ディキンソン・アンド・カンパニー 細胞標識分類の方法
EP3559231B1 (en) * 2016-11-11 2022-08-17 Bio-Rad Laboratories, Inc. Methods for processing nucleic acid samples
DK3538891T3 (da) * 2016-11-11 2022-03-28 Isoplexis Corp Sammensætninger og fremgangsmåder til samtidig genomisk, transkriptomisk og proteomisk analyse af enkeltceller
CN110226084A (zh) 2016-11-22 2019-09-10 伊索普莱克西斯公司 用于细胞捕获的系统、装置和方法,以及其制造方法
WO2018119301A1 (en) 2016-12-21 2018-06-28 The Regents Of The University Of California Single cell genomic sequencing using hydrogel based droplets
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) * 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
CN110366557B (zh) 2016-12-23 2024-04-09 威特拉公司 结合多肽及其制备方法
JP6234542B1 (ja) 2016-12-27 2017-11-22 株式会社 TL Genomics 胎児細胞由来染色体dnaの取得方法
EP3568234B1 (en) 2017-01-13 2023-09-06 Cellular Research, Inc. Hydrophilic coating of fluidic channels
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
EP3577232A1 (en) 2017-02-01 2019-12-11 Cellular Research, Inc. Selective amplification using blocking oligonucleotides
US10995333B2 (en) 2017-02-06 2021-05-04 10X Genomics, Inc. Systems and methods for nucleic acid preparation
WO2018170013A1 (en) * 2017-03-13 2018-09-20 Gigagen, Inc. Systems and methods for massively parallel combinatorial analysis of single cells
CN110870018A (zh) 2017-05-19 2020-03-06 10X基因组学有限公司 用于分析数据集的系统和方法
CN109526228B (zh) 2017-05-26 2022-11-25 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
US10844372B2 (en) 2017-05-26 2020-11-24 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
US10837047B2 (en) 2017-10-04 2020-11-17 10X Genomics, Inc. Compositions, methods, and systems for bead formation using improved polymers
US10501739B2 (en) 2017-10-18 2019-12-10 Mission Bio, Inc. Method, systems and apparatus for single cell analysis
WO2019084043A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS
US11866785B2 (en) 2017-10-27 2024-01-09 Board Of Regents, The University Of Texas System Tumor specific antibodies and T-cell receptors and methods of identifying the same
EP3700672B1 (en) 2017-10-27 2022-12-28 10X Genomics, Inc. Methods for sample preparation and analysis
US11739367B2 (en) 2017-11-08 2023-08-29 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
EP3625361A1 (en) 2017-11-15 2020-03-25 10X Genomics, Inc. Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
WO2019108851A1 (en) 2017-11-30 2019-06-06 10X Genomics, Inc. Systems and methods for nucleic acid preparation and analysis
EP3728636A1 (en) 2017-12-19 2020-10-28 Becton, Dickinson and Company Particles associated with oligonucleotides
WO2019157529A1 (en) 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
EP3775271A1 (en) 2018-04-06 2021-02-17 10X Genomics, Inc. Systems and methods for quality control in single cell processing
EP3788171B1 (en) 2018-05-03 2023-04-05 Becton, Dickinson and Company High throughput multiomics sample analysis
EP3788170A1 (en) 2018-05-03 2021-03-10 Becton, Dickinson and Company Molecular barcoding on opposite transcript ends
US11649482B2 (en) * 2018-05-08 2023-05-16 President And Fellows Of Harvard College Droplet-based single cell genomic DNA sequencing
EP3794118A4 (en) * 2018-05-14 2022-03-23 The Broad Institute, Inc. IN SITU CELLULAR SCREENING METHODS AND SYSTEMS
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
US11703427B2 (en) 2018-06-25 2023-07-18 10X Genomics, Inc. Methods and systems for cell and bead processing
EP3821004A4 (en) 2018-07-12 2022-04-20 Twinstrand Biosciences, Inc. METHODS AND REAGENTS FOR CHARACTERIZING GENOMIC EDITING AND CLONAL EXPANSION, AND RELATED APPLICATIONS
US20200032335A1 (en) 2018-07-27 2020-01-30 10X Genomics, Inc. Systems and methods for metabolome analysis
EP3861134A1 (en) 2018-10-01 2021-08-11 Becton, Dickinson and Company Determining 5' transcript sequences
US20210358574A1 (en) * 2018-10-16 2021-11-18 The Broad Institute, Inc. Methods of scaling computational genomics with specialized architectures for highly parallelized computations and uses thereof
US11466310B2 (en) * 2018-10-19 2022-10-11 Akoya Biosciences, Inc. Detection of co-occurring receptor-coding nucleic acid segments
JP2022506546A (ja) 2018-11-08 2022-01-17 ベクトン・ディキンソン・アンド・カンパニー ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析
US11459607B1 (en) 2018-12-10 2022-10-04 10X Genomics, Inc. Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
WO2020150356A1 (en) 2019-01-16 2020-07-23 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
ES2945227T3 (es) 2019-01-23 2023-06-29 Becton Dickinson Co Oligonucleótidos asociados con anticuerpos
WO2020168013A1 (en) 2019-02-12 2020-08-20 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11851683B1 (en) 2019-02-12 2023-12-26 10X Genomics, Inc. Methods and systems for selective analysis of cellular samples
US11655499B1 (en) 2019-02-25 2023-05-23 10X Genomics, Inc. Detection of sequence elements in nucleic acid molecules
US11920183B2 (en) 2019-03-11 2024-03-05 10X Genomics, Inc. Systems and methods for processing optically tagged beads
EP3941491A4 (en) 2019-03-21 2023-03-29 Gigamune, Inc. ENGINEERED CELLS EXPRESSING ANTIVIRAL T-CELL RECEPTORS AND METHODS OF USE
WO2020214642A1 (en) 2019-04-19 2020-10-22 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
CA3138806A1 (en) 2019-05-22 2020-11-26 Dalia Dhingra Method and apparatus for simultaneous targeted sequencing of dna, rna and protein
WO2021003255A1 (en) 2019-07-01 2021-01-07 Mission Bio Method and apparatus to normalize quantitative readouts in single-cell experiments
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
AU2020357191A1 (en) * 2019-10-05 2022-06-02 Mission Bio, Inc. Methods, systems and apparatus for copy number variations and single nucleotide variations simultaneously detected in single-cells
US11773436B2 (en) 2019-11-08 2023-10-03 Becton, Dickinson And Company Using random priming to obtain full-length V(D)J information for immune repertoire sequencing
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
CN115698282A (zh) 2020-01-13 2023-02-03 福路伦特生物科学公司 单细胞测序
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11835462B2 (en) 2020-02-11 2023-12-05 10X Genomics, Inc. Methods and compositions for partitioning a biological sample
WO2021173640A1 (en) * 2020-02-25 2021-09-02 The Regents Of The University Of California Methods of detecting somatic mutations
US11926863B1 (en) 2020-02-27 2024-03-12 10X Genomics, Inc. Solid state single cell method for analyzing fixed biological cells
US11866782B2 (en) 2020-03-16 2024-01-09 Fluent Biosciences Inc. Multi-omic analysis in monodisperse droplets
US11851700B1 (en) 2020-05-13 2023-12-26 10X Genomics, Inc. Methods, kits, and compositions for processing extracellular molecules
WO2021231779A1 (en) 2020-05-14 2021-11-18 Becton, Dickinson And Company Primers for immune repertoire profiling
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
CN115867676A (zh) 2020-05-29 2023-03-28 国立研究开发法人理化学研究所 细胞群的处理方法和细胞群中所含的基因的分析方法
AU2021283174A1 (en) 2020-06-02 2023-01-05 10X Genomics, Inc. Nucleic acid library methods
WO2021247568A1 (en) * 2020-06-02 2021-12-09 10X Genomics, Inc. Spatial trancriptomics for antigen-receptors
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022032194A1 (en) 2020-08-06 2022-02-10 Singular Genomics Systems, Inc. Methods for in situ transcriptomics and proteomics
EP4247967A1 (en) 2020-11-20 2023-09-27 Becton, Dickinson and Company Profiling of highly expressed and lowly expressed proteins
WO2022182682A1 (en) 2021-02-23 2022-09-01 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
EP4298236A1 (en) * 2021-02-23 2024-01-03 The Broad Institute, Inc. High-throughput assessment of exogenous polynucleotide- or polypeptide-mediated transcriptome perturbations
WO2023287980A1 (en) * 2021-07-15 2023-01-19 Fluent Biosciences Inc. Decentralized workflows for single cell analysis
WO2023114203A1 (en) * 2021-12-13 2023-06-22 Cornell University Genotyping of targeted loci with single-cell chromatin accessibility

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06509473A (ja) 1991-08-10 1994-10-27 メディカル・リサーチ・カウンシル 細胞個体群の処理
US6013445A (en) * 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
ATE380883T1 (de) 2000-10-24 2007-12-15 Univ Leland Stanford Junior Direkte multiplex charakterisierung von genomischer dna
GB0128153D0 (en) 2001-11-23 2002-01-16 Bayer Ag Profiling of the immune gene repertoire
TWI333977B (en) * 2003-09-18 2010-12-01 Symphogen As Method for linking sequences of interest
US20050221357A1 (en) 2003-09-19 2005-10-06 Mark Shannon Normalization of gene expression data
AU2005325801A1 (en) 2005-01-31 2006-08-03 Ablynx N.V. Method for generating variable domain sequences of heavy chain antibodies
US20060178835A1 (en) 2005-02-10 2006-08-10 Applera Corporation Normalization methods for genotyping analysis
US7497588B2 (en) * 2005-07-14 2009-03-03 International Development Corporation Store display for solar lamp
US8268564B2 (en) * 2007-09-26 2012-09-18 President And Fellows Of Harvard College Methods and applications for stitched DNA barcodes
CN102124125A (zh) * 2007-10-16 2011-07-13 霍夫曼-拉罗奇有限公司 通过克隆性测序的高分辨率、高通量hla基因分型
JP5798926B2 (ja) 2008-11-07 2015-10-21 シーケンタ インコーポレイテッド 配列解析によって病態をモニターする方法
AU2010242073C1 (en) 2009-04-30 2015-12-24 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
CA2798431C (en) * 2010-05-06 2018-10-23 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
AU2011256290B2 (en) 2010-05-17 2014-06-12 The Board Of Regents Of The University Of Texas System Rapid isolation of monoclonal antibodies from animals
US10392726B2 (en) 2010-10-08 2019-08-27 President And Fellows Of Harvard College High-throughput immune sequencing
WO2012048341A1 (en) * 2010-10-08 2012-04-12 President And Fellows Of Harvard College High-throughput single cell barcoding
EP2652155B1 (en) * 2010-12-16 2016-11-16 Gigagen, Inc. Methods for massively parallel analysis of nucleic acids in single cells
US20130316358A1 (en) * 2011-01-31 2013-11-28 Yeda Research And Development Co. Ltd. Methods of diagnosing disease using overlap extension pcr
WO2013109935A1 (en) 2012-01-20 2013-07-25 Gigagen, Inc. Method for analysis of immune variable sequences
US20150031555A1 (en) 2012-01-24 2015-01-29 Gigagen, Inc. Method for correction of bias in multiplexed amplification
WO2014004124A2 (en) 2012-06-14 2014-01-03 Gigagen, Inc. Method for amplification gene fusion complexes
WO2013188772A1 (en) 2012-06-14 2013-12-19 Gigagen, Inc. Methods for antibody and cell therapeutic discovery
JP6558830B2 (ja) 2012-06-15 2019-08-14 ボード・オブ・リージエンツ,ザ・ユニバーシテイ・オブ・テキサス・システム 複数転写産物のハイスループットシークエンシング
KR102190198B1 (ko) 2013-02-08 2020-12-14 10엑스 제노믹스, 인크. 폴리뉴클레오티드 바코드 생성

Also Published As

Publication number Publication date
US20210292835A1 (en) 2021-09-23
US20230313291A1 (en) 2023-10-05
US11591652B2 (en) 2023-02-28
US20220056522A1 (en) 2022-02-24
US20170166889A1 (en) 2017-06-15
US20190002974A1 (en) 2019-01-03
US20140057799A1 (en) 2014-02-27
US20200140947A1 (en) 2020-05-07
WO2012083225A2 (en) 2012-06-21
EP2652155A2 (en) 2013-10-23
US9695474B2 (en) 2017-07-04
WO2012083225A3 (en) 2012-08-16
US20170204460A1 (en) 2017-07-20
US20150344871A1 (en) 2015-12-03
US11053543B2 (en) 2021-07-06
US20160326583A1 (en) 2016-11-10
EP2652155A4 (en) 2014-05-14
US10787706B2 (en) 2020-09-29
US10465243B2 (en) 2019-11-05
EP2652155B1 (en) 2016-11-16
US10106789B2 (en) 2018-10-23
WO2012083225A4 (en) 2012-09-13
US20200291474A1 (en) 2020-09-17
DK2652155T3 (en) 2017-02-13

Similar Documents

Publication Publication Date Title
ES2615733T3 (es) Métodos para el análisis masivo paralelo de ácidos nucleicos en células individuales
US11098358B2 (en) High-throughput single-cell analysis combining proteomic and genomic information
US20150154352A1 (en) System and Methods for Genetic Analysis of Mixed Cell Populations
EP3262189B1 (en) Methods for barcoding nucleic acids for sequencing
EP3212790B1 (en) Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
KR102433825B1 (ko) 핵산 바코드를 이용하는 단일 세포와 관련된 핵산의 분석
ES2740802T3 (es) Monitorización del estadio de neoplasia linfoide usando perfiles de clonotipo
KR20200035942A (ko) 감소된 증폭 편향을 갖는 고속대량 단일 세포 서열분석
JP2015519909A (ja) 複合遺伝子セットにおける固有にタグ付加された再構成適応性免疫受容体遺伝子
JP2017508457A (ja) T細胞バランス遺伝子発現、組成物およびその使用方法
WO2019010486A1 (en) ULTRA-ACCURATE AND HIGH COVERAGE OF IMMUNE REPERTOIRE USING MOLECULAR IDENTIFIERS