ES2893000T3 - Materiales de referencia celulares multiplex - Google Patents

Materiales de referencia celulares multiplex Download PDF

Info

Publication number
ES2893000T3
ES2893000T3 ES16871194T ES16871194T ES2893000T3 ES 2893000 T3 ES2893000 T3 ES 2893000T3 ES 16871194 T ES16871194 T ES 16871194T ES 16871194 T ES16871194 T ES 16871194T ES 2893000 T3 ES2893000 T3 ES 2893000T3
Authority
ES
Spain
Prior art keywords
exon
kmt2a
nucleic acid
subsequence
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16871194T
Other languages
English (en)
Inventor
Catherine Huang
Bharathi Anekella
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seracare Life Sciences Inc
Original Assignee
Seracare Life Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seracare Life Sciences Inc filed Critical Seracare Life Sciences Inc
Application granted granted Critical
Publication of ES2893000T3 publication Critical patent/ES2893000T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0635B lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0652Cells of skeletal and connective tissues; Mesenchyme
    • C12N5/0656Adult fibroblasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/36Embedding or analogous mounting of samples
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • G01N2001/305Fixative compositions

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Hematology (AREA)
  • Rheumatology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Rod-Shaped Construction Members (AREA)
  • Road Signs Or Road Markings (AREA)

Abstract

Un ácido nucleico, que comprende una pluralidad de secuencias de nucleótidos, en donde: cada secuencia de nucleótidos de la pluralidad comprende una primera subsecuencia y una segunda subsecuencia; la primera subsecuencia comprende una secuencia 3' de un primer exón; la segunda subsecuencia comprende una secuencia 5' de un segundo exón; la primera subsecuencia y la segunda subsecuencia son secuencias adyacentes en el ácido nucleico; la primera subsecuencia y la segunda subsecuencia tienen cada una al menos 20 nucleótidos de longitud; la primera subsecuencia está en 5' con respecto a la segunda subsecuencia en el ácido nucleico; el primer exón es un exón de un primer gen; el segundo exón es un exón de un segundo gen; el primer gen y el segundo gen son genes diferentes; y cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos comprende una secuencia 3' de un primer exón que es diferente de cada otro primer exón de las secuencias de nucleótidos de la pluralidad o una secuencia 5' de un segundo exón que es diferente de cada otro segundo exón de las secuencias de nucleótidos de la pluralidad.

Description

DESCRIPCIÓN
Materiales de referencia celulares multiplex
SOLICITUDES RELACIONADAS
La presente solicitud reivindica el beneficio de prioridad para la Solicitud de Patente Provisional de Estados Unidos N.° 62/261.514, presentada el 1 de diciembre de 2015, y la Solicitud de Patente Provisional de Estados Unidos N.° 62/323.659, presentada el 16 de abril de 2016.
LISTADO DE SECUENCIAS
La presente solicitud contiene un listado de secuencias que se ha enviado electrónicamente en formato ASCII. Dicha copia ASCII, creada el 8 de agosto de 2016, se denomina SCX-007_26_SL.txt y tiene un tamaño de 40.863 bytes.
ANTECEDENTES
Los materiales de referencia basados en células son útiles como controles de proceso para analizar muestras o validar métodos. Sin embargo, los materiales de referencia son limitados en el sentido de que puede ser necesaria una colección de controles para analizar una muestra con características desconocidas. Por ejemplo, ciertos ensayos de cáncer criban una serie de biomarcadores diferentes, y cada biomarcador puede requerir un material de referencia diferente, lo que complica el análisis. Por lo tanto, son deseables enfoques simplificados para analizar muestras con características desconocidas.
Waibhav et al., 2014, BMC Genomics 15 (1): 824 desvela datos de secuencia de ARNm de adición sintética de acceso abierto para fusiones génicas de cáncer.
El documento de patente CN 103468813 B desvela un kit de ensayo de PCR (reacción en cadena de la polimerasa) cuantitativa fluorescente del gen de fusión EML4-ALK (proteína similar a 4 asociada a microtúbulos de equinodermoquinasa de linfoma anaplásico).
El documento de patente WO 2015/073080 A1 desvela una pluralidad de secuencias de ácidos nucleicos que comprenden múltiples variantes de una secuencia de referencia; y plásmidos, células, métodos y kits que comprenden los mismos.
SUMARIO
Los aspectos de la invención se refieren a ácidos nucleicos que comprenden una pluralidad de secuencias de nucleótidos, donde cada secuencia de nucleótidos corresponde a un genotipo. Las realizaciones de la invención se presentan en las reivindicaciones. Los ácidos nucleicos son útiles para desarrollar materiales de referencia biológicos que comprenden una serie de genotipos diferentes. Estos materiales de referencia tienen muchas ventajas. Por ejemplo, cada genotipo de un ácido nucleico aparecerá en un material de referencia con la misma frecuencia, lo que simplifica la preparación del material de referencia. Además, se pueden combinar diferentes ácidos nucleicos para permitir combinaciones mayores de diferentes genotipos con respecto al de las colecciones de ácidos nucleicos que comprenden cada una un solo genotipo.
BREVE DESCRIPCIÓN DE LAS FIGURAS
La Figura 1 muestra dos realizaciones de la invención, etiquetadas como "Constructo de ARN N.° 1" y "Constructo de ARN N.° 2." Cada constructo comprende una protección 5' [m7G(5')ppp(5')G], etiquetada como "protección 5'", y una cola de poli-A. Cada constructo comprende seis secuencias de nucleótidos que consisten en dos subsecuencias cada una, en donde cada secuencia de nucleótidos está asociada a cáncer. Por ejemplo, la primera secuencia de nucleótidos del Constructo de ARN N.° 1 consiste en una subsecuencia del exón 13 de e ML4 y una subsecuencia del exón 20 de ALK, para servir como control para una fusión exón 13 de EML4-exón 20 de ALK, que está asociada a cáncer de pulmón no microcítico. Los constructos son ejemplos de materiales de referencia de oncología multiplex. La Figura 1 también muestra un diagrama de flujo para construir materiales de referencia a partir de los constructos o a partir de otros ácidos nucleicos multiplexados. La Figura 1 también desvela dos casos de SEQ ID NO: 13.
La Figura 2 muestra resultados de secuenciación de nueva generación para una colección de ARN preparada a partir de ácidos nucleicos extraídos de células fijadas con formalina que comprenden el Constructo N.° 1 diluido con células no transfectadas. Los resultados de la secuenciación identificaron correctamente cada fusión génica en el constructo.
Figure 3 muestra resultados de secuenciación de nueva generación para una colección de ARN preparada a partir de ácidos nucleicos extraídos de células fijadas con formalina que comprenden el Constructo N.° 2 diluido con células no transfectadas. Los resultados de la secuenciación identificaron correctamente cada fusión génica en el constructo.
La Figura 4 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica del Constructo N.° 1, que se transfectó en células humanas que se fijaron con formalina y se diluyó con células no transfectadas.
La Figura 5 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica del Constructo N.° 2, que se transfectó en células humanas que se fijaron con formalina y se diluyó con células no transfectadas.
La Figura 6 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica del Constructo N.° 1, que se transfectó en células humanas que se fijaron con formalina y se diluyó con células no transfectadas.
La Figura 7 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica del Constructo N.° 2, que se transfectó en células humanas que se fijaron con formalina y se diluyó con células no transfectadas.
La Figura 8 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica de (1) una muestra embebida en parafina y fijada con formalina diluida a una proporción de constructo de fusión con respecto a célula de 1:1.000 que se describe en el Ejemplo 4 ("FFPE Medio") y (2) una muestra preparada de forma similar con aproximadamente cinco veces más de células que se describe en el Ejemplo 5 ("102380").
La Figura 9 es un gráfico que muestra la distribución de tamaño de ARN extraído del material de referencia 102380, que se describe en los Ejemplos 5 y 6.
DESCRIPCIÓN DETALLADA
Los aspectos de la invención se refieren a ácidos nucleicos que comprenden una serie de genotipos diferentes para uso en la producción de materiales de referencia biológicos. Un material de referencia biológico puede comprender, por ejemplo, una célula que comprende tal ácido nucleico. Un ácido nucleico que comprenda varios genotipos diferentes de interés se puede usar para transfectar un grupo de células para generar un material de referencia que comprenda cada genotipo del ácido nucleico. El formato de ácido nucleico único es deseable por muchas razones. Por ejemplo, tener una serie de genotipos en un solo ácido nucleico simplifica la cuantificación del ácido nucleico porque es necesario cuantificar con precisión un ácido nucleico solo una vez. Este formato también permite "mega" mezclas (mezclas de múltiples ácidos nucleicos, cada uno portando múltiples genotipos diferentes) lo que permite incorporar cientos de genotipos en el mismo control, por ejemplo, permitiendo de ese modo un control biosintético que imita múltiples variantes heterocigóticas. Además, los ácidos nucleicos que comprenden una serie de genotipos diferentes permiten transfectar cuantitativamente cada genotipo en una célula a la misma concentración. Algunas ventajas para los usuarios finales incluyen la confirmación de que los genotipos se evaluaron en un ensayo de secuenciación del exoma completo (ensayo de WES) y la confirmación de que se detectaron genotipos difíciles de secuenciar en una serie de secuenciación usando el material de referencia como control positivo. Por último, los controles multiplexados son más baratos que las colecciones de numerosos controles de un solo mutante.
I. ÁCIDOS NUCLEICOS
En algunos aspectos, la invención se refiere a un ácido nucleico, que comprende una pluralidad de secuencias de nucleótidos, en donde cada secuencia de nucleótidos de la pluralidad está asociada a una enfermedad o afección. El ácido nucleico puede ser ADN o ARN. Cuando el término se refiere a ARN, cada timina T de una secuencia de nucleótidos se puede sustituir con uracilo U. Un ácido nucleico como se describe en el presente documento se puede denominar "ácido nucleico de longitud completa" con fines de claridad, por ejemplo, para diferenciar un ácido nucleico y fragmento del mismo.
Cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos puede comprender una primera subsecuencia y una segunda subsecuencia, en donde la primera subsecuencia comprende una secuencia 3' de un primer exón, la segunda subsecuencia comprende una secuencia 5' de un segundo exón, y la primera subsecuencia y la segunda subsecuencia son secuencias adyacentes en el ácido nucleico (y en la secuencia de nucleótidos). La primera subsecuencia puede estar en 5' con respecto a la segunda subsecuencia, es decir, la primera subsecuencia puede aparecer primero en la secuencia de nucleótidos y seguida inmediatamente por la segunda subsecuencia. El primer exón puede ser de un primer gen, y el segundo exón puede ser de un segundo gen, por ejemplo, en donde el primer gen y el segundo gen son genes diferentes. Por lo tanto, cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos puede replicar una fusión génica, por ejemplo, de un ARNm procesado incorrectamente, en donde el ARNm procesado incorrectamente contiene exones de dos genes diferentes. Cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos puede comprender una secuencia 3' de un primer exón diferente y/o una secuencia 5' de un segundo exón diferente.
El ARNm que comprende una fusión génica se produce a menudo en células enfermas, incluyendo células cancerosas, y una secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos puede, por lo tanto, ser una secuencia de nucleótidos de origen natural. Sin embargo, no se conocer si en la naturaleza se produce la combinación de múltiples fusiones génicas en un solo ácido nucleico de acuerdo con diversas realizaciones de la invención. La primera subsecuencia y la segunda subsecuencia pueden estar adyacentes "en marco" de modo que la traducción de la secuencia de nucleótidos que comprende la primera subsecuencia y la segunda subsecuencia podría dar como resultado un polipéptido.
Una secuencia de nucleótidos puede estar asociada a una enfermedad o afección si un sujeto que tiene la secuencia presenta mayor riesgo de desarrollar la enfermedad o afección. Una secuencia de nucleótidos puede estar asociada a una enfermedad o afección si su presencia o ausencia se correlaciona con la progresión o gravedad de una enfermedad o afección. Por ejemplo, ciertas secuencias de nucleótidos están correlacionadas con la agresividad de diversas neoplasias tales como adenocarcinomas, carcinomas de células transicionales, neuroblastomas, AML, CML, CMML, JMML, ALL, linfoma de Burkitt, linfoma de Hodgkin, mieloma de células plasmáticas, carcinoma hepatocelular, carcinoma de pulmón macrocítico, carcinoma de pulmón no microcítico, carcinoma de células escamosas, neoplasia pulmonar, adenocarcinomas ductales, tumores endocrinos, carcinoma de células basales, melanomas malignos, angiosarcoma, leiomiosarcoma, liposarcoma, rabdomiosarcoma, mixoma, histiocitoma fibroso maligno-sarcoma pleomórfico, germinoma, seminoma, carcinoma anaplásico, carcinoma folicular, carcinoma papilar, y carcinoma de células de Hurthle. Por ejemplo, se sabe que en diversos cánceres se producen fusiones génicas, que incluyen cáncer de pulmón, cáncer de pulmón no microcítico, cáncer de tejido blando, cáncer linfoide, leucemia linfoide aguda, leucemia mieloide aguda, leucemia mielógena crónica, linfoma no Hodgkin, linfoma de Burkitt, melanoma, melanoma intraocular, cáncer del sistema nervioso central, neuroblastoma, cáncer de tiroides, cáncer de paratiroides, cáncer hepatocelular, cáncer de estómago, cáncer de intestino grueso, cáncer de colon, cáncer del tracto urinario, cáncer de vejiga, cáncer de riñón, cáncer de próstata, cáncer de cuello uterino, cáncer de ovario, o cáncer de mama.
Una pluralidad de secuencias de nucleótidos puede comprender al menos 2 secuencias de nucleótidos, por ejemplo, al menos 2 secuencias de nucleótidos que no superponen sobre el ácido nucleico. Una pluralidad de secuencias de nucleótidos puede comprender al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, o al menos 10 secuencias de nucleótidos. Una pluralidad de secuencias de nucleótidos puede comprender de 2 a 1.000 secuencias de nucleótidos (por ejemplo, de 2 a 1.000 secuencias de nucleótidos que no se superponen). Una pluralidad de secuencias de nucleótidos puede comprender de 2 a 100 secuencias de nucleótidos, tal como de 2 a 50, de 2 a 20, de 2 a 12, de 3 a 1.000, de 3 a 100, de 3 a 50, de 3 a 20, de 3 a 12, de 4 a 1.000, de 4 a 100, de 4 a 50, de 4 a 20, de 4 a 12, de 5 a 1.000, de 5 a 100, de 5 a 50, de 5 a 20, de 5 a 12, de 6 a 1.000, de 6 a 100, de 6 a 50, de 6 a 20, de 6 a 12, de 7 a 1.000, de 7 a 100, de 7 a 50, de 7 a 20, de 7 a 12, de 8 a 1.000, de 8 a 100, de 8 a 50, de 8 a 20, de 8 a 12, de 9 a 1.000, de 9 a 100, de 9 a 50, de 9 a 20, de 9 a 12, de 10 a 1.000, de 10 a 100, de 10 a 50, de 10 a 20, de 10 a 16, o de 10 a 12 secuencias de nucleótidos. Una pluralidad de secuencias de nucleótidos puede consistir en 2, 3, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, o 200 secuencias de nucleótidos diferentes.
En ciertas realizaciones, cada secuencia de nucleótidos de una pluralidad es la secuencia de nucleótidos de un gen o ARNm de origen natural (por ejemplo, un gen o ARNm que está asociado a una enfermedad o a una afección de interés) o una subsecuencia de los mismos. Un gen o ARNm de origen natural incluye genotipos sanos y genotipos que están asociados a una enfermedad o afección. El término "genotipo" se refiere a un rasgo genético, tal como una variante de corte y empalme o fusión génica. Por ejemplo, una secuencia de nucleótidos puede comprender una subsecuencia de una fusión génica, y en tales realizaciones, la subsecuencia puede comprender una parte de cada gen de la fusión génica. En ciertas realizaciones, cada secuencia de nucleótidos de una pluralidad comprende un genotipo, por ejemplo, una unión de una fusión génica. Una secuencia de nucleótidos de una pluralidad puede comprender un genotipo sano en una secuencia de nucleótidos en donde se sabe que se producen variantes de corte y empalme o fusiones génicas perjudiciales. Una secuencia de nucleótidos de una pluralidad puede comprender un exón de un gen o una subsecuencia de un exón. Una secuencia de nucleótidos puede consistir en un exón de un primer gen, o una subsecuencia del mismo, y un exón de un segundo gen, o una subsecuencia del mismo.
Una secuencia de nucleótidos puede comprender más de un exón de un primer gen (por ejemplo, cualquiera de dos exones consecutivos, completos o un exón completo y una subsecuencia de un segundo exón, consecutivo), y un exón de un segundo gen, o una subsecuencia del mismo. Una secuencia de nucleótidos puede comprender un exón de un primer gen o una subsecuencia del mismo, y más de un exón de un segundo gen (por ejemplo, cualquiera de dos exones consecutivos, completos o un exón completo y una subsecuencia de un segundo exón, consecutivo). Una secuencia de nucleótidos puede comprender más de un exón del mismo gen, por ejemplo, cuando un solo exón no es lo suficientemente largo para su identificación de manera fiable mediante secuenciación de nueva generación.
En ciertas realizaciones, cada secuencia de nucleótidos de una pluralidad es lo suficientemente larga para su identificación mediante secuenciación de ácidos nucleicos, por ejemplo, secuenciación de nueva generación (NGS). En ciertas realizaciones, una secuencia de nucleótidos de una pluralidad comprende un genotipo de interés en una posición que pueda ser identificada mediante secuenciación de ácidos nucleicos, por ejemplo, el genotipo de interés, tal como una fusión génica (por ejemplo, punto de ruptura de fusión génica), puede estar ubicado en o cerca de la mitad de la secuencia de nucleótidos.
Un ácido nucleico puede tener de 1.000 nucleótidos a aproximadamente 100.000 nucleótidos de longitud, tal como de aproximadamente 3.000 a aproximadamente 60.000 nucleótidos de longitud, de aproximadamente 5.000 a aproximadamente 50.000 nucleótidos de longitud, o de aproximadamente 8.000 a aproximadamente 20.000 nucleótidos de longitud.
Una secuencia de nucleótidos de una pluralidad puede tener al menos 20 nucleótidos (o pares de bases) de longitud, tal como al menos 20, 30, 40, 50, 60, 70, 80, 90, 100, 120, 150, 200, o al menos 250 nucleótidos (o pares de bases) de longitud. Una secuencia de nucleótidos de una pluralidad puede ten .000 nucleótidos (o pares de bases) de longitud, tal como de 20 a 5.000, de 20 a 2.000, de 20 a 1.00 de 30 a 5.000, de
30 a 2.000, de 30 a 1.000, de 30 a 500, de 40 a 5.000, 2.000, de 40 a 1.000, de 4 50 a 2.000, de 50 a 1.000, de
Figure imgf000005_0001
500,
Figure imgf000005_0002
60 a 5.000, 2.000, de 60 a 1.000, de 6 70 a 2.000, de 70 a 1.000, de 70 a 500, de 80 a 5.000, 2.000, de 80 a 1.000, de 8 90 a 2.000, de 90 a 1.000, de 90 a 500, de 100 a 5.000, de 100 a 2.000, de 1.000, de 100 a 500, de 120 5.000, de 120 a 2.000, de 120 a 1.000, de 120 a 500, de 150 a 5.000, de 150 a 2.0
Figure imgf000005_0003
000, de 150 a 500, de 200 a 5.000, de 200 a 2.000, de 200 a 1.000, o de 200 a 500 nucleótidos (o pares de bases) de longitud.
Una subsecuencia de una secuencia de nucleótidos (por ejemplo, primera subsecuencia o segunda subsecuencia) puede tener al menos 20 nucleótidos (o pares de bases) de longitud, tal como al menos 25, 30, 40, 50, 60, 70, 80,
90, 100, 120, 150, 200, o al menos 250 nucleótidos (o pares de bases) de longitud. Una subsecuencia de una secuencia de nucleótidos (por ejemplo, primera subsecuencia o segunda subsecuencia) puede tener de 20 a 10.000 nucleótidos (o pares de bases) de longitud, tal como de 20 a 5.000, de 20 a 2.000, de 20 a 1.000, de 20 a 500, de 25 a 5.000, de 25 a 2.000, de 25 a 1.000, de 25 a 500, de 25 a 250, de 30 a 5.000, de 30 a 2.000, de 30 a 1.000, de 30 a 500, de 30 a 250, de 30 a 5.000, de 40 a 2.000, de 40 a 1.000, de 40 a 500, de 40 a 250, de 50 a 5.000, 2.000, de 50 a 1.000, de 50 a 500, de 50 a 250, de 60 a 5.000, de 60 a 2.000, de 60 a 1.000, de 60 a 500, de 60 a 250, de 70 a 5.000, de 70 a 2.000, de 70 a 1.000, de 70 a 500, de 70 a 250, de 80 a 5.000, de 80 a 2.000, de 80 a
1.000, de 80 a 500, de 80 a 250, de 90 a 5.000, de 90 a 2.000, de 90 a 1.000, de 90 a 500, de 90 a 250, de 100 a 5.000, de 100 a 2.000, de 100 a 1.000, de 100 a 500, de 100 a 250, de 120 a 5.000, de 120 a 2.000, de 120 a 1.000, de 120 a 500, de 120 a 250, de 150 a 5.000, de 150 a 2.000, de 150 a 1.000, de 150 a 500, de 150 a 250, de 200 a
5.000, de 200 a 2.000, de 200 a 1.000, de 200 a 500, o de 200 a 250 nucleótidos (o pares de bases) de longitud.
Una secuencia de nucleótidos de una pluralidad puede comprender un genotipo de interés (por ejemplo, punto de ruptura de fusión génica) en una posición que tiene al menos 20 nucleótidos (o pares de bases) desde el extremo 5' y/o el extremo 3' de la secuencia de nucleótidos, tal como al menos 25, 30, 40, 50, 60, 70, 80, 90, 100, 120, 150,
200, o 250 nucleótidos (o pares de bases) desde el extremo 5' y/o el extremo 3' de la secuencia de nucleótidos. Una secuencia de nucleótidos de una pluralidad puede comprender un genotipo de interés (por ejemplo, punto de ruptura
de fusión génica) en una posición que tiene 20 a 5.000 nucleótidos (o pares de bases) desde el extremo 5' y/o el extremo 3' de la secuencia de nucleótidos, tal como 25 a 5.000, de 30 a 5.000, de 40 a 5.000, de 50 a 5.000, de 60 a
5.000, de 70 a 5.000, de 80 a 5.000, de 90 a 5.000, de 100 a 5.000, de 120 a 5.000, de 150 a 5.000, de 200 a 5.000, de 250 a 5.000, de 25 a 2.000, de 30 a 2.000, de 40 a 2.000, de 50 a 2.000, de 60 a 2.000, de 70 a 2.000, de 80 a
2.000, de 90 a 2.000, de 100 a 2.000, de 120 a 2.000, de 150 a 2.000, de 200 a 2.000, de 250 a 2.000, de 25 a
1.000, de 30 a 1.000, de 40 a 1.000, de 50 a 1.000, de 60 a 1.000, de 70 a 1.000, de 80 a 1.000, de 90 a 1.000, de
100 a 1.000, de 120 a 1.000, de 150 a 1.000, de 200 a 1.000, de 250 a 1.000, de 25 a 750, de 30 a 750, de 40 a
750, de 50 a 750, de 60 a 750, de 70 a 750, de 80 a 750, de 90 a 750, de 100 a 750, de 120 a 750, de 150 a 750, de
200 a 750, de 250 a 750, de 25 a 500, de 30 a 500, de 40 a 500, de 50 a 500, de 60 a 500, de 70 a 500, de 80 a
500, de 90 a 500, de 100 a 500, de 120 a 500, de 150 a 500, de 200 a 500, o de 250 a 500 nucleótidos (o pares de bases) desde el extremo 5' y/o el extremo 3' de la secuencia de nucleótidos.
En algunas realizaciones, una secuencia de nucleótidos de una pluralidad comprende una fusión génica. Por ejemplo, una secuencia de nucleótidos de una pluralidad puede comprender una primera subsecuencia y una segunda subsecuencia, en donde la primera subsecuencia comprende una secuencia 3' de un primer exón y la segunda subsecuencia comprende la secuencia 5' de un segundo exón. La primera subsecuencia y la segunda subsecuencia pueden ser secuencias adyacentes en la secuencia de nucleótidos, y la primera subsecuencia puede estar en 5' con respecto a la segunda subsecuencia. Por lo tanto, el extremo 3' de la primera subsecuencia, que consiste en el extremo 3' del primer exón, puede estar unido al extremo 5' de la segunda subsecuencia, que consiste
en el extremo 5' del segundo exón, replicando de ese modo la unión de una fusión génica. En algunas realizaciones, cada secuencia de nucleótidos de una pluralidad comprende una fusión génica. Por ejemplo, cada secuencia de nucleótidos de la pluralidad puede comprender una primera subsecuencia de un primer exón y una segunda subsecuencia de un segundo exón. En ciertas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una secuencia 3' de un primer exón diferente o una secuencia 5' de un segundo exón diferente.
Una secuencia de nucleótidos puede comprender un exón hacia arriba (5') del primer exón, en donde el exón hacia arriba y el primer exón son exones consecutivos en el mismo gen y el exón hacia arriba y el primer exón están
unidos como en un ARNm maduro, de origen natural del gen. Una secuencia de nucleótidos puede comprender un exón hacia abajo (3') del segundo exón, en donde el exón hacia abajo y el segundo exón son exones consecutivos en el mismo gen y el exón hacia abajo y el segundo exón están unidos como en un ARNm maduro, de origen natural del gen. Un exón hacia arriba o un exón hacia abajo puede ser útil, por ejemplo, cuando el primer exón o el segundo exón, respectivamente, es más corto que 200 nucleótidos de longitud (tal como más corto que 180, 160, 150, 140, 130, 120, 120, o 100 nucleótidos de longitud) porque puede ser más difícil identificar los exones cortos en ausencia de secuencia adicional del gen a partir del que se originó el exón. Por ejemplo, una primera subsecuencia puede comprender dos o más exones, en donde el primer exón de la primera subsecuencia tiene menos de 250 nucleótidos de longitud (tal como menos de 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, o 50 nucleótidos de longitud), por ejemplo, y la suma de las longitudes de los dos o más exones es al menos 50 nucleótidos de longitud (tal como al menos 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, o 250 nucleótidos de longitud). Del mismo modo, una segunda subsecuencia puede comprender dos o más exones, en donde el segundo exón de la segunda subsecuencia tiene menos de 250 nucleótidos de longitud (tal como menos de 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, o 50 nucleótidos de longitud), por ejemplo, y la suma de las longitudes de los dos o más exones es al menos 50 nucleótidos de longitud (tal como al menos 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, o 250 nucleótidos de longitud).
En algunas realizaciones, una secuencia de nucleótidos de una pluralidad comprende una fusión génica, unión compleja, corte y empalme ilegítimo, omisión de exón o unión génica compleja. Una secuencia de nucleótidos de una pluralidad puede comprender una primera subsecuencia y una segunda subsecuencia, en donde la primera subsecuencia comprende una secuencia 3' de un primer gen y la segunda subsecuencia comprende la secuencia 5' de un segundo gen. La primera subsecuencia y la segunda subsecuencia pueden ser secuencias adyacentes en la secuencia de nucleótidos, y la primera subsecuencia puede estar en 5' con respecto a la segunda subsecuencia. Por lo tanto, el extremo 3' de la primera subsecuencia, que consiste en el extremo 3' del primer gen, puede estar unido al extremo 5' de la segunda subsecuencia, que consiste en el extremo 5' del segundo gen, por ejemplo, replicando de ese modo la unión de una fusión génica. El primer gen y el segundo gen pueden ser el mismo gen o un gen diferente. En realizaciones de la invención en donde el primer gen y el segundo gen son el mismo gen, la primera subsecuencia puede aparecer hacia arriba (5') o hacia abajo (3') de la segunda subsecuencia en un genoma. La primera subsecuencia y/o segunda subsecuencia puede ser una subsecuencia de un intrón y/o exón.
Un ácido nucleico puede comprender una secuencia de nucleótidos que comprende un intrón, por ejemplo, en donde la secuencia de nucleótidos está diseñada para replicar una fusión génica o corte y empalme ilegítimo. Una secuencia de nucleótidos que comprende un intrón puede ser parte de la pluralidad de secuencias de nucleótidos o puede existir independientemente de la pluralidad de secuencias de nucleótidos. Una secuencia de nucleótidos que comprende un intrón puede comprender una primera subsecuencia y una segunda subsecuencia, en donde la primera subsecuencia comprende una secuencia 3' de un primer intrón o exón, la segunda subsecuencia comprende una secuencia 5' de un segundo intrón o exón, y la primera subsecuencia se une a la segunda subsecuencia en el ácido nucleico y en la secuencia de nucleótidos. Cualquiera de la primera subsecuencia, la segunda subsecuencia, o tanto la primera subsecuencia como la segunda subsecuencia pueden comprender un intrón. Cualquiera de la primera subsecuencia, la segunda subsecuencia, o tanto la primera subsecuencia como la segunda subsecuencia pueden comprender un exón. La primera subsecuencia puede aparecer hacia arriba (5') con respecto a la segunda subsecuencia en la secuencia de nucleótidos y ácido nucleico. Dado que la secuencia de nucleótidos comprende un intrón, puede que la secuencia de nucleótidos completa no sea capaz de traducirse en un polipéptido, por ejemplo, porque el intrón puede comprender codones de parada o codones de baja eficacia en marco con los exones de la secuencia de nucleótidos. El primer gen y el segundo gen pueden ser el mismo gen o diferentes genes.
En algunas realizaciones, un ácido nucleico puede comprender poliadenosina, por ejemplo, una cola de poliadenosina en 3' (cola de poli-A). Cualquiera de ADN o ARN puede comprender poliadenosina. Si el ADN comprende poliadenosina, el ADN puede ser bicatenario, de modo que una secuencia de poli-timidina complementaria se transcribe en ARNm que comprende una cola de poliadenosina.
Un ácido nucleico puede estar metilado o básicamente exento de nucleósidos metilados. En ciertas realizaciones, un ácido nucleico es ARN, y el ácido nucleico comprende una protección en 5'. Por ejemplo, un ARN puede comprender 7-metil guanosina, por ejemplo, en una protección de 5' [m7G(5')ppp(5')G].
En algunas realizaciones, el ácido nucleico comprende un promotor, por ejemplo, cuando el ácido nucleico es ADN. Un promotor se une a una ARN polimerasa, tal como ARN polimerasa SP6. Un promotor puede ser un promotor SP6. La secuencia de nucleótidos de un promotor puede ser de una especie diferente (por ejemplo, virus, bacteria, levadura) a una secuencia de nucleótidos de una pluralidad, por ejemplo, para transcripción in vitro de la pluralidad de secuencias de nucleótidos, que pueden ser secuencias de nucleótidos humanos). La secuencia de nucleótidos de un promotor puede ser de una especie diferente (por ejemplo, virus, bacteria, levadura) a cada secuencia de nucleótidos de una pluralidad.
En algunas realizaciones, el ácido nucleico es un plásmido, tal como un plásmido superenrollado, plásmido circular relajado, o plásmido lineal. En algunas realizaciones, el ácido nucleico comprende un origen de replicación. El origen de la replicación puede permitir la clonación y/o la producción por lotes del ácido nucleico. El origen de replicación puede ser un origen de replicación de levadura (por ejemplo, Saccharomyces cerevisiae) o bacteria (por ejemplo, Escherichia coli), por ejemplo, de modo que el ácido nucleico se pueda clonar y/o producir en levadura (por ejemplo, Saccharomyces cerevisiae) o bacteria (por ejemplo, Escherichia coli).
En el presente documento se desvela una pluralidad de fragmentos de ácido nucleico, en donde cada ácido nucleico de la pluralidad de fragmentos de ácido nucleico es un fragmento de un ácido nucleico de longitud completa como se ha descrito en el presente documento, anteriormente, y cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos del ácido nucleico de longitud completa está codificada por al menos un fragmento de ácido nucleico de la pluralidad de fragmentos de ácido nucleico. Se puede obtener una pluralidad de fragmentos de ácido nucleico, por ejemplo, mediante procesamiento de múltiples copias de un el ácido nucleico de ARN de longitud completa, único que comprende una pluralidad de secuencias de nucleótidos, por ejemplo, mediante la transfección de células con el ácido nucleico de a Rn de longitud completa, único (por ejemplo, mediante electroporación), fijando las células (por ejemplo, con formalina), embebiendo las células (por ejemplo, en parafina), y/o extrayendo ácidos nucleicos (por ejemplo, ARN) de las células. El procesamiento de múltiples copias de un ácido nucleico de ARN de longitud completa, único que corresponde a uno de los ácidos nucleicos que se han descrito en el presente documento, mencionado anteriormente puede degradar el ácido nucleico de ARN de longitud completa, único en fragmentos de ARN más pequeños, por ejemplo, una pluralidad de fragmentos de ácido nucleico. Esta pluralidad de fragmentos de ácido nucleico puede comprender la misma pluralidad de secuencias de nucleótidos que el ácido nucleico de ARN único, pero cualquier secuencia de nucleótidos dada de la pluralidad de secuencias de nucleótidos puede aparecen en diferentes fragmentos de ácido nucleico de la pluralidad de fragmentos de ácido nucleico en lugar de en el mismo fragmento de ácido nucleico. La secuenciación de nueva generación se puede usar para identificar secuencias de nucleótidos que se producen en dos o más fragmentos de ácido nucleico de una pluralidad de fragmentos de ácido nucleico. Por lo tanto, la secuenciación de una pluralidad de fragmentos de ácido nucleico debería identificar la misma pluralidad de secuencias de nucleótidos que la secuenciación del ácido nucleico de ARN de longitud completa, único a partir del que se originó la pluralidad de fragmentos de ácido nucleico. Una pluralidad de fragmentos de ácido nucleico se pueden mezclar con ácidos nucleicos celulares (por ejemplo, ARN y/o ADN) a partir de células transfectadas con el ácido nucleico de ARN de longitud completa, único y/o células no transfectadas (por ejemplo, células no transfectadas añadidas a un material de referencia, véase a continuación). Por lo tanto, una pluralidad de fragmentos de ácido nucleico se pueden mezclar una pluralidad de fragmentos de ácido nucleico con ARN celular, tal como un transcriptoma y/o ARN ribosómico.
En algunos aspectos, la invención se refiere a un método para preparar un ácido nucleico como se describe en el presente documento. El método puede comprender incubar una mezcla de reacción que comprende un molde de ADN, ARN polimerasa, y ribonucleótido trifosfatos (por ejemplo, a una temperatura a la que la ARN polimerasa muestra actividad de polimerasa), produciendo de ese modo un ácido nucleico de ARN. El molde de ADN también puede ser un ácido nucleico como se describe en el presente documento. La ARN polimerasa puede ser de una especie diferente a las secuencias de nucleótidos de la pluralidad de secuencias de nucleótidos. Por ejemplo, la a Rn polimerasa puede ser de un virus (por ejemplo, ARN polimerasa T7; ARN polimerasa SP6), bacteria, o levadura y las secuencias de nucleótidos de la pluralidad de secuencias de nucleótidos pueden ser humanas. La ARN polimerasa puede ser ARN polimerasa II.
En el presente documento se desvela una mezcla de reacción que comprende un ácido nucleico como se describe en el presente documento, una polimerasa, y cualquiera de ribonucleótido trifosfatos o desoxirribonucleótido trifosfatos. La polimerasa puede ser una ADN polimerasa (por ejemplo, para uso con desoxirribonucleótidos trifosfatos) o una ARN polimerasa (por ejemplo, para uso con ribonucleótidos trifosfatos). La polimerasa puede ser de una especie diferente a una secuencia de nucleótidos de una pluralidad. La mezcla de reacción puede comprender un inhibidor de ARNasa, por ejemplo, de una especie diferente a una secuencia de nucleótidos de una pluralidad.
Un ácido nucleico puede comprender secuencias de nucleótidos de cualquier origen, tal como de origen viral, bacterial, protista, fúngico, vegetal o animal. En ciertas realizaciones, las secuencias de nucleótidos de una pluralidad son secuencias de nucleótidos humanos.
En algunos casos, la divulgación se refiere a una composición que comprende un ácido nucleico como se describe en el presente documento y ADN genómico. En ciertos casos, la proporción de (a) el número de copias de una secuencia de nucleótidos que corresponde a un gen en el ácido nucleico con respecto a (b) el número de copias del gen en el ADN genómico es de aproximadamente 1:15.000 a aproximadamente 500:1 en la composición, tal como de aproximadamente 1:10.000 a aproximadamente 1:500, de aproximadamente 1:5.000 a aproximadamente 500:1, de aproximadamente 1:2.000 a aproximadamente 500:1, de aproximadamente 1:1.000 a aproximadamente 500:1, de aproximadamente 1:500 a aproximadamente 500:1, de 1:5.000 a aproximadamente 100:1, de aproximadamente 1:2.000 a aproximadamente 100:1, de aproximadamente 1:1.000 a aproximadamente 100:1, de aproximadamente 1:500 a aproximadamente 100:1, de aproximadamente 1:250 a aproximadamente 100:1, de aproximadamente 1:200 a aproximadamente 100:1, de aproximadamente 1:100 a aproximadamente 100:1, de aproximadamente 1:50 a aproximadamente 50:1, de aproximadamente 1:25 a aproximadamente 25:1, de aproximadamente 1:20 a aproximadamente 20:1, o de aproximadamente 1:10 a aproximadamente 10:1 en la composición. En ciertos casos, la proporción de (a) el número de copias de una secuencia de nucleótidos que corresponde a un gen en el ácido nucleico con respecto a (b) el número de copias del gen en el ADN genómico es aproximadamente 6:1, 4:1, aproximadamente 3:1, aproximadamente 2:1, aproximadamente 1:1, aproximadamente 1:2, aproximadamente 1:3, aproximadamente 1:4, o aproximadamente 1:6 en la composición; en ciertas realizaciones la proporción es aproximadamente 1:1.
Una composición puede comprender al menos dos ácidos nucleicos como se describe en el presente documento, por ejemplo, en donde al menos dos de los ácidos nucleicos comprenden diferentes pluralidades de secuencias de nucleótidos. Por ejemplo, una composición puede comprender una pluralidad de ácidos nucleicos como se describe en el presente documento, en donde de 2 a 50, de 2 a 40, de 2 a 30, de 2 a 20, de 2 a 10, de 2 a 9, de 2 a 8, de 2 a 7, de 2 a 6, de 2 a 5, o de 2 a 4 ácidos nucleicos de la pluralidad cada uno comprende diferentes pluralidades de secuencias de nucleótidos.
Un ácido nucleico puede comprender secuencias de nucleótidos de genes que se producen en diferentes cromosomas. Una pluralidad de secuencias de nucleótidos pueden comprender secuencias de nucleótidos de genes que se producen en 2, 3, 4, 5, 6, 7, 8, 9, o 10 diferentes cromosomas humanos.
Un ácido nucleico puede comprender la secuencia de nucleótidos que se presenta en SEQ ID NO: 11 o en SEQ ID NO: 12. Un ácido nucleico puede comprender una secuencia de nucleótidos que tiene al menos aproximadamente un 80 %, aproximadamente un 85 %, aproximadamente un 90 %, aproximadamente un 95 %, aproximadamente un 96 %, aproximadamente un 97 %, aproximadamente un 98 %, o un 99 % de identidad de secuencia con la secuencia que se presenta en SEQ ID NO: 11 o en SEQ ID NO: 12.
II. FUSIONES GÉNICAS PARA MATERIALES DE REFERENCIA DE ONCOLOGÍA
La enfermedad o afección puede ser, por ejemplo, una neoplasia, tal como cáncer. Algunas neoplasias incluyen cáncer de pulmón, cáncer linfoide, leucemia linfoide aguda, leucemia mieloide aguda, leucemia mielógena crónica, linfoma de Burkitt, linfoma de Hodgkin, mieloma de células plasmáticas, cáncer del tracto biliar, cáncer de vejiga, cáncer de hígado, cáncer pancreático, cáncer de próstata, cáncer de piel, cáncer de tiroides, cáncer de estómago, cáncer de intestino grueso, cáncer de colon, cáncer del tracto urinario, cáncer del sistema nervioso central, neuroblastoma, cáncer de riñón, cáncer de mama, cáncer de cuello uterino, cáncer testicular, y cáncer de tejido blando. La enfermedad o afección puede ser adenocarcinoma, carcinoma de células transicionales, carcinoma de mama, adenocarcinoma de cuello uterino, adenocarcinoma de colon, adenoma de colon, neuroblastoma, AML, CML, CMML, JMML, ALL, linfoma de Burkitt, linfoma de Hodgkin, mieloma de células plasmáticas, carcinoma hepatocelular, carcinoma de pulmón macrocítico, carcinoma de pulmón no microcítico, carcinoma de pulmón de células escamosas, neoplasia pulmonar, adenocarcinoma ductal, tumor endocrino, adenocarcinoma de próstata, carcinoma de piel de células basales, carcinoma de piel de células escamosas, melanoma, melanoma maligno, angiosarcoma, leiomiosarcoma, liposarcoma, rabdomiosarcoma, mixoma, histiocitoma fibroso maligno-sarcoma pleomórfico, adenocarcinoma de estómago, germinoma, seminoma, carcinoma anaplásico, carcinoma folicular, carcinoma papilar, o carcinoma de células de Hurthle. Una secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos puede estar asociada a un tumor sólido. Cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos puede estar asociada a un tumor sólido.
En algunas realizaciones, una secuencia de nucleótidos de una pluralidad comprende una subsecuencia de un gen seleccionado entre el grupo que consiste en tirosina quinasa receptora de linfoma anaplásico (ALK), proteína 1 similar a proteína 2 asociada al inhibidor 1 de la angiogénesis específico del cerebro (BAIAP2L1), CD74, proteína similar a 4 asociada a microtúbulos de equinodermo (EML4), variante 6 de ETS (ETV6), receptor 3 del factor de crecimiento de fibroblastos (FGFR3), cadena pesada de kinesina 1 (KIF5B), coactivador 4 de receptor nuclear (NCOA4), nucleofosmina (NPM1), receptor neurotrófico de tirosina quinasa 1 (NTRK1), receptor neurotrófico de tirosina quinasa 3 (NTRK3), gen de caja emparejada 8 (Pax8), receptor gamma activado por proliferador de peroxisomas (PPARG), protooncogén r Et (RET), protooncogén 1 de ROS (ROS1), proteína de transporte de fosfato dependiente de sodio SLC34A, proteína 3 que contiene superenrollamiento ácida transformante (TACC3), gen fusionado con TRK (TFG), y tropomiosina 3 (TPM3). En ciertas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos genes seleccionados entre el grupo que consiste en un ALK, BAIAP2L1, CD74, EML4, ETV6, FGFR3, KIF5B, NCOA4, NPM1, NTRK1, NTRK3, Pax8, PPARG, RET, ROS1, SLC34A, TACC3, TFG, y TPM3. Por ejemplo, una secuencia de nucleótidos de la pluralidad puede consistir en una subsecuencia de EML4 y una subsecuencia de ALK. Cada subsecuencia puede consistir en una subsecuencia de un único exón de uno cualquiera de los genes mencionados anteriormente. Por ejemplo, cada secuencia de nucleótidos de la pluralidad puede consistir en una subsecuencia de un exón de EML4 (por ejemplo, una subsecuencia 3') y una subsecuencia de un exón de ALK (por ejemplo, una subsecuencia 5').
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un gen seleccionado entre el grupo que consiste en ALK, BAIAP2L1, CD74, EML4, eTv6, FGFR3, KIF5B, NCOA4, NPM1, NTRK1, NTRK3, Pax8, PPARG, RET, ROS1, SLC34A, TACC3, TFG, y TPM3. En ciertas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos genes seleccionados entre el grupo que consiste en un ALK, BAIAP2L1, CD74, EML4, ETV6, FGFR3, KIF5B, NCOA4, NPM1, NTRK1, NTRK3, Pax8, PPARG, RET, ROS1, SLC34A, TACC3, TFG, y TPM3.
En algunas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un exón seleccionado entre el grupo que consiste en exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón NTRK1, exón 13 de NTRK3, exón 8 de Pax8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3. En ciertas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos exones seleccionados entre el grupo que consiste en un exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón 10 de NTRK1, exón 13 de NTRK3, exón 8 de Pax8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3. Por ejemplo, una secuencia de nucleótidos de la pluralidad puede consistir en una subsecuencia de exón 13 de EML4 y una subsecuencia de exón 20 de ALK.
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un exón seleccionado entre el grupo que consiste en exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón NTRK1, exón 13 de NTRK3, exón 8 de Pax8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3. En ciertas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos exones seleccionados entre el grupo que consiste en un exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón 10 de NTRK1, exón 13 de NTRK3, exón 8 de Pax8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3.
En algunas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos exones (por ejemplo, una subsecuencia de un primer exón y una subsecuencia de un segundo exón), en donde el primer exón y el segundo exón, respectivamente, se seleccionan entre el grupo que consiste en exón 13 de EML4 y exón 20 de AlK; exón 5 de NPM1 y exón 20 de ALK; exón 24 de KIF5B y exón 11 de RET; exón 8 de NCOA4 y exón 12 de RET; exón 6 de CD74 y exón 34 de ROS1; exón 4 de SLC34A y exón 34 de ROS1; exón 8 de TPM3 y exón 10 de NTRK1; exón 5 de TfG y exón 10 de NTRK1; exón 18 de FGFR3 y exón 2 de BAIAP2L1; exón 18 de FGFR3 y exón 11 de TACC3; exón 8 de PAX8 y exón 1 de PPARG; y exón 5 de ETV6 y exón 13 de NTRK3. En ciertas realizaciones, una subsecuencia incluye el extremo 3' del primer exón. En ciertas realizaciones, una subsecuencia incluye el extremo 5' del segundo exón.
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos exones (por ejemplo, una subsecuencia de un primer exón y una subsecuencia de un segundo exón), en donde el primer exón y el segundo exón, respectivamente, se seleccionan entre el grupo que consiste en exón 13 de EML4 y exón 20 de ALK; exón 5 de NPM1 y exón 20 de ALK; exón 24 de KIF5B y exón 11 de Ret; exón 8 de NCOA4 y exón
12 de RET; exón 6 de CD74 y exón 34 de Ros 1; exón 4 de SLC34A y exón 34 de Ros 1; exón 8 de TPM3 y exón 10 de NTRK1; exón 5 de TFG y exón 10 de NTRK1; exón 18 de FGFr3 y exón 2 de BAIAP2L1; exón 18 de FGFR3 y exón 11 de TACC3; exón 8 de Pax8 y exón 1 de PPARG; y exón 5 de ETV6 y exón 13 de NTRK3. En ciertas realizaciones, una subsecuencia incluye el extremo 3' del primer exón. En ciertas realizaciones, una subsecuencia incluye el extremo 5' del segundo exón.
En algunas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de extensión de una secuencia de nucleótidos seleccionada entre el grupo que consiste en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID
NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, and SEQ ID
NO: 10; en donde la subsecuencia de extensión comprende una primera subsecuencia (por ejemplo, de un primer exón) y una segunda subsecuencia (por ejemplo, de un segundo exón) como se describe en el presente documento.
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de extensión de una secuencia de nucleótidos seleccionada entre el grupo que consiste en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID
NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, Y SEQ ID
NO: 10; en donde la subsecuencia de extensión comprende una primera subsecuencia (por ejemplo, de un primer exón) y una segunda subsecuencia (por ejemplo, de un segundo exón) como se describe en el presente documento.
Una secuencia de nucleótidos de la pluralidad puede comprender la secuencia de nucleótidos que se presenta en
SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID
NO: 8, SEQ ID NO: 9, o SEQ ID NO: 10. Cada secuencia de nucleótidos de la pluralidad puede comprender una secuencia de nucleótidos que se presenta en una de SEQ ID NO: 1, SEQ ID NO: 2, SEQ iD NO: 3, SEQ ID NO: 4,
SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, y SEQ ID NO: 10. Una secuencia de nucleótidos de la pluralidad puede comprender una secuencia de nucleótidos con al menos aproximadamente un
80 %, aproximadamente un 85 %, aproximadamente un 90 %, aproximadamente un 95 %, aproximadamente un
96 %, aproximadamente un 97 %, aproximadamente un 98 %, o un 99 % de identidad de secuencia con la secuencia que se presenta en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ
ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, o SEQ ID NO: 10. Cada secuencia de nucleótidos de la pluralidad puede comprender una secuencia de nucleótidos con al menos aproximadamente un 80 %, aproximadamente un 85 %, aproximadamente un 90 %, aproximadamente un 95 %, aproximadamente un 96 %, aproximadamente un 97 %, aproximadamente un 98 %, o un 99 % de identidad de secuencia con una secuencia que se presenta en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, o SEQ ID NO: 10.
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un primer exón and un segundo exón, en donde el primer exón y el segundo exón, respectivamente, se seleccionan entre el grupo que consiste en un exón de ACBD6 y RRP15; ACSL3 y ETV1; ACTB y GLI1; AGPAT5 y MCPH1; AGTRAP y BRAF; AKAP9 y BRAF; ARFIP1 y FHDC1; ARID1A y MAST2; ASPSCR1 y TFE3; ATG4C y FBXO38; ATIC y ALK; BBS9 y PKD1L1; BCR y ABL1; BCR y JAK2; BRD3 y NUTM1; BRD4 y NUTM1; C2orf44 y ALK; CANT1 y ETV4; CARS y ALK; CCDC6 y RET; CD74 y NRG1; CD74 y ROS1; CDH11 y USP6; CDKN2D y WDFY2; CEP89 y BRAF; CHCHD7 y PLAG1; CIC y DUX4L1; CIC y FOXO4; CLCN6 y BRAF; CLIP1 y ROS1; CLTC y ALK; CLTC y TFE3; CNBP y USP6; COL1A1 y PDGFB; COL1A1 y USP6; COL1A2 y PLAG1; CRTC1 y MAML2; CRTC3 y MAML2; CTAGE5 y SIP1; CTNNB1 y PLAG1; DCTN1 y ALK; DDX5 y ETV4; DNAJB1 y PRKACA; EIF3E y RSPO2; EIF3K y CYP39A1; EML4 y ALK; EPC1 y PHF1; ERC1 y RET; ERC1 y ROS1; ERO1L y FERMT2; ESRP1 y RAF1; ETV6 e ITPR2; ETV6 y JAK2; ETV6 y NTRK3; EWSR1 y ATF1; EWSR1 y CREB1; EWSR1 y DDIT3; EWSR1 y ERG; EWSR1 y ETV1; EWSR1 y ETV4; EWSR1 y FEV; EWSR1 y FLI1; EWSR1 y NFATC1; EWSR1 y NFATC2; EWSR1 y NR4A3; EWSR1 y PATZ1; EWSR1 y PBX1; EWSR1 y POU5F1; EWSR1 y SMARCA5; EWSR1 y SP3; EWSR1 y WT1; EWSR1 y YY1; EWSR1 y ZNF384; EWSR1 y ZNF444; EZR y ROS1; FAM131B y BRAF; FBXL18 y RNF216; FCHSD1 y BRAF; FGFR1 y ZNF703; FGFR1 y PLAG1; FGFR1 y TACC1; FGFR3 y BAIAP2L1; FGFR3 y TACC3; FN1 y ALK; FUS y ATF1; FUS y CREB3L1; FUS y CREB3L2; FUS y DDIT3; FUS y ERG; FUS y FEV; GATM y BRAF; GMDS y PDE8B; GNAI1 y BRAF; GOLGA5 y RET; GOPC y ROS1; GPBP1L1 y MAST2; HACL1 y RAF1; HAS2 y PLAG1; HERPUD1 y BRAF; HEY1 y NCOA2; HIP1 y ALK; HLA-A y ROS1; HMGA2 y ALDH2; HMGA2 y CCNB1IP1; HMGA2 y COX6C; HMGA2 y EBF1; HMGA2 y FHIT; HMGA2 y LHFP; HMGA2 y LPP; HMGA2 y NFIB; HMGA2 y RAD51B; HMGA2 y WIF1; HN1 y USH1G; HNRNPA2B1 y ETV1; HOOK3 y RET; IL6R y ATP8B2; INTS4 y GAB2; IRF2BP2 y CDX1; JAZF1 y PHF1; JAZF1 y SUZ12; KIAA1549 y BRAF; KIAA1598 y ROS1; KIF5B y ALK; KIF5B y RET; KLC1 y ALK; KLK2 y ETV1; KLK2 y ETV4; KMT2A y ABI1; KMT2A y ABI2; KMT2A y ACTN4; KMT2A y AFF1; KMT2A y AFF3; KMT2A y AFF4; KMT2A y ARHGAP26; KMT2A y ARHGEF12; KMT2A y BTBD18; KMT2A y CASC5; KMT2A y CASP8AP2; KMT2A y CBL; KMT2A y CREBBP; KMT2A y CT45A2; KMT2A y DAB2IP; KMT2A y EEFSEC; KMT2A y ELL; KMT2A y EP300; KMT2A y EPS15; KMT2A y FOXO3; KMT2A y FOXO4; KMT2A y FRYL; KMT2A y GAS7; KMT2A y GMPS; KMT2A y GPHN; KMT2A y KIAA0284; KMT2A y KIAA1524; KMT2A y LASP1; KMT2A y LPP; KMT2A y MAPRE1; KMT2A y MLLT1; KMT2A y MLLT10; KMT2A y MLLT11; KMT2A y MLLT3; KMT2A y MLLT4; KMT2A y MLLT6; KMT2A y MYO1F; KMT2A y NCKIPSD; KMT2A y NRIP3; KMT2A y PDS5A; KMT2A y PICALM; KMT2A y PRRC1; KMT2A y SARNP; KMT2A y SEPT2; KMT2A y SEPT5; KMT2A y SEPT6; KMT2A y SEPT9; KMT2A y SH3GL1; KMT2A y SORBS2; KMT2A y TET1; KMT2A y TOP3A; KMT2A y ZFYVE19; KTN1 y RET; LIFR y PLAG1; LMNA y NTRK1; LRIG3 y ROS1; LSM14A y BRAF; MARK4 y ERCC2; MBOAT2 y PRKCE; MBTD1 y CXorf67; MEAF6 y PHF1; MKRN1 y BRAF; MSN y ALK; MYB y NFIB; MYO5A y ROS1; NAB2 y STAT6; NACC2 y NTRK2; NCOA4 y RET; NDRG1 y ERG; NF1 y ACCN1; NFIA y EHF; NFIX y MAST1; NONO y TFE3; NOTCH1 y GABBR2; NPM1 y ALK; NTN1 y ACLY; NUP107 y LGR5; OMD y USP6; PAX3 y FOXO1; PAX3 y NCOA1; PAX3 y NCOA2; PAX5 y JAK2; PAX7 y FOXO1; PAX8 y PPARG; PCM1 y JAK2; PCM1 y RET; PLA2R1 y RBMS1; PLXND1 y TMCC1; PPFIBP1 y ALK; PPFIBP1 y ROS1; PRCC y TFE3; PRKAR1A y RET; PTPRK y RSPO3; PWWP2A y ROS1; QKI y NTRK2; RAF1 y DAZL; RANBP2 y ALK; RBM14 y PACS1; RGS22 y SYCP1; RNF130 y BRAF; SDC4 y ROS1; SEC16A_NM_014866.1 y NOTCH1; SEC31A y ALK; SEC31A y JAK2; SEPT8 y AFF4; SFPQ y TFE3; SLC22A1 y CUTA; SLC26A6 y PRKAR2A; SLC34A2 y ROS1; SLC45A3 y BRAF; SLC45A3 y ELK4; SLC45A3 y ERG; SLC45A3 y ETV1; SLC45A3 y ETV5; SND1 y BRAF; SQSTM1 y ALK; SRGAP3 y RAF1; SS18 y SSX1; SS18 y SSX2; SS18 y SSX4; SS18L1 y SSX1; SSBP2 y JAK2; SSH2 y SUZ12; STIL y TALI; STRN y ALK; SUSD1 y ROD1; TADA2A y MAST1; TAF15 y NR4A3; TCEA1 y PLAG1; TCF12 y NR4A3; TCF3 y PBX1; TECTA y TBCEL; TFG y ALK; TFG y NR4A3; TFG y NTRK1; THRAP3 y USP6; TMPRSS2 y ERG; TMPRSS2 y ETV1; TMPRSS2 y ETV4; TMPRSS2 y ETV5; TP53 y NTRK1; TPM3 y ALK; TPM3 y NTRK1; TPM3 y ROS1; TPM3 y ROS1; TPM4 y ALK; TRIM24 y RET; TRIM27 y RET; TRIM33 y RET; UBE2L3 y KRAS; VCL y ALK; VTI1A y TCF7L2; YWHAE y FAM22A; YWHAE y NUTM2B; ZC3H7B y BCOR; ZCCHC8 y ROS1; ZNF700 y MAST1; y ZSCAN30 y BRAF. Algunas fusiones génicas de los pares de genes mencionados anteriormente que se correlacionan con el cáncer se pueden identificar, por ejemplo, en la base de datos del Catálogo de Mutaciones Somáticas en el Cáncer (COSMIC) (http://cancer.sanger.ac.uk/cosmic/fusion). Cada uno de los pares de genes descritos en este párrafo corresponde a una fusión génica enumerada en la base de datos COSMIC, que se ha identificado como asociada al cáncer. La base de datos COSMIC se puede usar para identificar sinónimos para los nombres de los genes, así como para las secuencias de nucleótidos de los genes y fusiones génicas. Existen otras bases de datos que recogen fusiones génicas asociadas al cáncer, por ejemplo, FusionCancer (http://donglab.ecnu.edu.cn/databases/FusionCancer/index.html) y las bases de datos en las que se basa ArcherDx (http://archerdx.com/software/quiver), y las secuencias de nucleótidos de una pluralidad se pueden seleccionar entre cualquiera de las fusiones génicas enumeradas en estas bases de datos.
III. COMPOSICIONES QUE COMPRENDEN UNA PLURALIDAD DE FRAGMENTOS DE ÁCIDO NUCLEICO
Un solo ácido nucleico multiplexado, sin embargo, se puede fragmentar y/o degradar durante su preparación, almacenamiento y/o procesamiento. Un ácido nucleico multiplexado que comprende múltiples secuencias de nucleótidos diferentes presenta muchas ventajas para la preparación de materiales de referencia. Sin embargo, la fragmentación y/o la degradación no influyen necesariamente en el rendimiento de un material de referencia, porque las estrategias de secuenciación de nueva generación ensamblan secuencias de nucleótidos relativamente largas a partir de ácidos nucleicos relativamente cortos. Además, la fragmentación y/o la degradación de un único ácido nucleico multiplexado puede ser deseable, por ejemplo, porque los ácidos nucleicos más cortos replican más estrechamente los ARNm de un transcriptoma después de se haya extraído de una célula.
En algunos casos, la divulgación se refiere a una composición que comprende una pluralidad de fragmentos de ácido nucleico. El ensamblaje de secuencias de las secuencias de nucleótidos de la pluralidad de fragmentos de ácido nucleico puede dar como resultado la secuencia de nucleótidos completa de un ácido nucleico de longitud completa tal como se ha descrito en las secciones I y II, mencionadas anteriormente. La expresión "ensamblaje de secuencias" se refiere al alineamiento y fusión de las secuencias de nucleótidos de una pluralidad de fragmentos de ácido nucleico en secuencias de nucleótidos las largas para reconstruir la secuencia de nucleótidos original (véase, por ejemplo, El-Metwally, S. et al., PLoS Computational Biology 9(12): e1003345 (2013); Nagarajan, N. y M. Pop, Nature Reviews Genetics 14(3): 157 (2013); Paszkiewicz, K. y D.J. Studholme, Briefings Bioinformatics 11(5):457 (2010)). El ensamblaje de secuencias de las secuencias de nucleótidos de una pluralidad de fragmentos de ácido nucleico puede dar como resultado menos que la secuencia de nucleótidos completa de un ácido nucleico de longitud completa siempre y cuando cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos del ácido nucleico de longitud completa (por ejemplo, tal como se ha descrito en las secciones I y II) esté codificada por al menos un fragmento de ácido nucleico de la pluralidad de ácidos nucleicos. Por ejemplo, el ensamblaje de secuencias de las secuencias de nucleótidos de los fragmentos de ácido nucleico de la pluralidad puede dar como resultado secuencias ensambladas que están alineadas con al menos un 50 %, un 60 %, un 70 %, un 80 %, un 90 %, un 95 %, un 96 %, un 97 %, un 98 %, o un 99 % de la secuencia de nucleótidos del ácido nucleico de longitud completa. Las secuencias de nucleótidos omitidas pueden incluir, por ejemplo, secuencias de nucleótidos inestables y/o secuencias de nucleótidos específicas que están agotadas de manera intencionada o seleccionadas de otro modo contra (por ejemplo, durante una etapa de hibridación o de amplificación).
Una pluralidad de fragmentos de ácido nucleico se puede producir a partir de un ácido nucleico de longitud completa tal como se ha descrito en las secciones I y II, mencionadas anteriormente (por ejemplo, la pluralidad de fragmentos de ácido nucleico se puede producir a partir de un número de copias del mismo ácido nucleico de longitud completa). La pluralidad de fragmentos de ácido nucleico puede consistir en fragmentos o productos de degradación de un ácido nucleico de longitud completa tal como se ha descrito en las secciones I y II, mencionadas anteriormente (por ejemplo, la pluralidad de fragmentos de ácido nucleico puede consistir en fragmentos o productos de degradación de un número de copias del mismo ácido nucleico de longitud completa).
Cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos de un ácido nucleico de longitud completa tal como se ha descrito en las secciones I y II, mencionadas anteriormente, puede estar codificada por al menos un fragmento de ácido nucleico de una pluralidad de fragmentos de ácido nucleico.
Diferentes copias del mismo ácido nucleico se pueden fragmentar/degradar de muchas formas diferentes y, por lo tanto, una pluralidad de fragmentos de ácido nucleico puede o no comprender fragmentos de ácido nucleico idénticos. Además, se pueden perder partes de ácidos nucleicos individuales, por ejemplo, durante una etapa de purificación, o se pueden degradar hasta una longitud que carece de contenido secuenciable. Sin embargo, la secuenciación de nueva generación puede reensamblar la secuencia de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar, de la pluralidad de fragmentos de ácido nucleico siempre y cuando la pluralidad de fragmentos de ácido nucleico contenga suficiente redundancia. Por ejemplo, la pluralidad de fragmentos de ácido nucleico puede comprender de aproximadamente 2x a aproximadamente 1.000.000x de cobertura de la secuencia de nucleótidos de un ácido nucleico de longitud completa original, sin fragmentar, tal como 10x a aproximadamente 100.000x, de aproximadamente 20x a aproximadamente 50.000x, de aproximadamente 100x a aproximadamente 10.000x, o de aproximadamente 100x a aproximadamente 1.000x de cobertura. Por lo tanto, la secuencia de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar, se puede identificar por secuenciación de la pluralidad de fragmentos de ácido nucleico mediante secuenciación de nueva generación.
La pluralidad de fragmentos de ácido nucleico puede comprender de aproximadamente 2x a aproximadamente 1.000.000x de cobertura de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos de un ácido nucleico de longitud completa original, sin fragmentar, tal como de aproximadamente 10x a aproximadamente 100.000x, de aproximadamente 20x a aproximadamente 50.000x, de aproximadamente 100x a aproximadamente 10.000x, o de aproximadamente 100x a aproximadamente 1.000x de cobertura. Por lo tanto, cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar, se puede identificar por secuenciación de la pluralidad de fragmentos de ácido nucleico mediante secuenciación de nueva generación.
Una composición que comprende una pluralidad de fragmentos de ácido nucleico puede comprender además básicamente todo el transcriptoma de una célula. La proporción de la secuencia de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar (por ejemplo, el ácido nucleico a partir del que se originó la pluralidad de fragmentos de ácido nucleico) con respecto a una sola copia del transcriptoma de la célula puede ser de aproximadamente 1:10 a aproximadamente 1.000:1, tal como de aproximadamente 1:5 a aproximadamente 500:1, de aproximadamente 1:3 a aproximadamente 300:1, de aproximadamente 1:2 a aproximadamente 200:1, o de aproximadamente 1:1 a aproximadamente 100:1 en la composición. La proporción de cada copia de una secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar (por ejemplo, el ácido nucleico a partir del que se originó la pluralidad de fragmentos de ácido nucleico) con respecto a una sola copia del transcriptoma de la célula puede ser de aproximadamente 1:10 a aproximadamente 1.000:1, tal como de aproximadamente 1:5 a aproximadamente 500:1, de aproximadamente 1:3 a aproximadamente 300:1, de aproximadamente 1:2 a aproximadamente 200:1, o de aproximadamente 1:1 a aproximadamente 100:1 en la composición. "Una sola copia de un transcriptoma de una célula" se refiere a todo el ARNm de una sola célula, que puede contener múltiples copias del mismo ARNm.
Una composición que comprende una pluralidad de fragmentos de ácido nucleico puede comprender además una célula. La célula puede ser la célula del transcriptoma, mencionado anteriormente, es decir, la composición puede comprender básicamente todo el transcriptoma de una célula porque la composición comprende una célula. La célula puede ser una célula humana. La célula puede ser un fibroblasto o un linfocito, tal como un linfocito B inmortalizado. La célula puede ser GM24385. La célula puede ser cualquiera de las células que se describen en el presente documento, a continuación.
En algunas realizaciones, la composición puede comprender una pluralidad de células. La pluralidad de células puede comprender la célula, mencionado anteriormente, por ejemplo, en donde el transcriptoma de la composición es el transcriptoma de la célula. Cada célula de una pluralidad de células puede comprender básicamente el mismo genoma. "Básicamente el mismo genoma" se refiere a genomas del mismo individuo (por ejemplo, persona), de la misma célula precursora o de la misma línea celular, que pueden contener ligeras diferencias, tal como pequeñas diferencias epigenéticas, mutaciones espontáneas y mutaciones que surgen del procesamiento, tal como transfección y fijación celular (por ejemplo, que puede influir en la integridad del ADN celular).
La pluralidad de fragmentos de ácido nucleico de una composición puede ser fragmentos de ácido nucleico intracelulares, por ejemplo, la pluralidad de fragmentos de ácido nucleico puede existir intracelularmente, por ejemplo, en el citoplasma y/o el núcleo de una célula. La pluralidad de células puede comprender la pluralidad de fragmentos de ácido nucleico de la composición. La pluralidad de fragmentos de ácido nucleico puede haberse introducido en células de la composición (por ejemplo, una pluralidad de células) mediante transfección. "Transfección" se refiere a la introducción de material exógeno en una célula, y el término incluye la introducción de ácidos nucleicos exógenos mediante transformación, transfección, infección (por ejemplo, con un virus recombinante) y electroporación, así como otros métodos conocidos. Un ácido nucleico de longitud completa, tal como se ha descrito en las secciones I y II, mencionadas anteriormente, se puede introducir en las células de la composición mediante transfección, y el ácido nucleico de longitud completa se puede fragmentar y/o degradar en la pluralidad de fragmentos de ácido nucleico durante la transfección o después de la transfección, generando de ese modo la pluralidad de fragmentos de ácido nucleico.
En algunas realizaciones, cada célula de la pluralidad de células está fijada. Los métodos para fijar células se describen en el presente documento, a continuación, e incluyen fijación con formalina. En algunas realizaciones, las células de la composición están embebidas en parafina.
En algunas realizaciones, la composición no comprende células. Por ejemplo, la composición puede comprender simplemente una pluralidad de fragmentos de ácido nucleico generados a partir de un ácido nucleico de longitud completa descrito en las secciones I y II, mencionadas anteriormente. La composición puede comprender ácidos nucleicos extraídos de las células que se han descrito en los párrafos precedentes, por ejemplo, la pluralidad de fragmentos de ácido nucleico se puede extraer de una pluralidad de células como se ha descrito en los párrafos precedentes, por ejemplo, junto con el transcriptoma y/o genomas de la pluralidad de células. Por lo tanto, la pluralidad de fragmentos de ácido nucleico se puede haber extraído de una célula o de una pluralidad de células. La composición puede comprender además urea (por ejemplo, de 100 mM a 8 M de urea), guanidina (por ejemplo, 100 mM a 6 M de guanidina), un inhibidor de RNAsa, un quelante de metales (por ejemplo, etilendiaminotetraacetato), una proteasa (por ejemplo, proteinasa K), una DNAsa (por ejemplo, DNAsa I), etanol (por ejemplo, etanol al 10-99 %), isopropanol (por ejemplo, isopropanol al 10-99 %), y/o una transcriptasa inversa. Se conocen bien algunos métodos para extraer y purificar ARN de las células usando los reactivos mencionados anteriormente. La pluralidad de fragmentos de ácido nucleico puede estar asociada a un soporte sólido, tal como perlas (por ejemplo, perlas magnéticas), para ayudar en la purificación.
IV. CÉLULAS
En algunos aspectos, la invención se refiere a una célula que comprende un ácido nucleico como se describe en el presente documento. En algunas realizaciones, la invención se refiere a una pluralidad de células que comprenden un ácido nucleico como se describe en el presente documento. Un ácido nucleico de la invención puede estar integrado en el genoma de una célula, o puede estar presente en un plásmido o como un ácido nucleico lineal, tal como ARNm o un plásmido lineal. Por ejemplo, una célula puede comprender un ácido nucleico como se describe en el presente documento, mencionado anteriormente, en donde el ácido nucleico es un ARN monocatenario.
Una célula puede comprender al menos dos ácidos nucleicos como se describe en el presente documento, por ejemplo, en donde al menos dos de los ácidos nucleicos comprenden diferentes pluralidades de secuencias de nucleótidos. Por ejemplo, una célula puede comprender una pluralidad de fragmentos de ácido nucleico como se describe en el presente documento, en donde de 2 a 50, de 2 a 40, de 2 a 30, de 2 a 20, de 2 a 10, de 2 a 9, de 2 a 8, de 2 a 7, de 2 a 6, de 2 a 5, o de 2 a 4 fragmentos de ácido nucleico de la pluralidad cada uno comprende diferentes pluralidades de secuencias de nucleótidos.
Una célula puede comprender más de una copia del mismo ácido nucleico. Por ejemplo, una célula puede comprender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 150, o 200 copias del mismo ácido nucleico. Una célula puede comprender al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 150, o 200 copias del mismo ácido nucleico. Una célula puede comprender de 1 a 1.000, de 2 a 1.000, de 5 a 1.000, de 10 a 1.000, de 20 a 1.000, de 50 a 1.000, de 100 a 1.000, de 150 a 1.000, de 200 a 1.000, de 250 a 1.000, de 1 a 500, de 2 a 500, de 5 a 500, de 10 a 500, de 20 a 1.000, de 50 a 500, de 100 a 500, de 150 a 500, o de 200 a 500, de 250 a 500, de 1 a 400, de 2 a 400, de 5 a 400, de 10 a 400, de 20 a 400, de 50 a 400, de 100 a 400, de 150 a 400, de 200 a 400, o de 250 a 400 copias del mismo ácido nucleico.
Un ácido nucleico se puede llegar a fragmentar o de otro modo degradar antes, durante, o después de la transfección del ácido nucleico en una célula. Por lo tanto, en algunas realizaciones, una célula puede comprender una pluralidad de fragmentos de ácido nucleico (por ejemplo, que son fragmentos de un único ácido nucleico de longitud completa como se describe en el presente documento, mencionado anteriormente, o fragmentos de múltiples copias de un único ácido nucleico de longitud completa como se describe en el presente documento, mencionado anteriormente). La pluralidad de fragmentos de ácido nucleico se puede mezclar con los ácidos nucleicos de la célula, por ejemplo, ácidos nucleicos citosólicos y/o nucleares. La célula puede comprender múltiples copias de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos, tal como de 1 a 1.000, de 2 a 1.000, de 5 a 1.000, de 10 a 1.000, de 20 a 1.000, de 50 a 1.000, de 100 a 1.000, de 150 a 1.000, de 200 a 1.000, de 250 a 1.000, de 1 a 500, de 2 a 500, de 5 a 500, de 10 a 500, de 20 a 1.000, de 50 a 500, de 100 a 500, de 150 a 500, o de 200 a 500, de 250 a 500, de 1 a 400, de 2 a 400, de 5 a 400, de 10 a 400, de 20 a 400, de 50 a 400, de 100 a 400, de 150 a 400, de 200 a 400, o de 250 a 400 copias de cada secuencia de nucleótidos. Una célula puede comprender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 150, o 200 copias de cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos como se describe en el presente documento, mencionado anteriormente. Una célula puede comprender al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 150, o 200 copias de cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos como se describe en el presente documento, mencionado anteriormente. Cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos que se origina a partir del mismo ácido nucleico de longitud completa puede estar presente en una pluralidad de fragmentos de ácido nucleico con aproximadamente el mismo número de copias. Algunas secuencias de nucleótidos son más o menos estables que otras secuencias de nucleótidos, sin embargo, y por lo tanto, una célula puede contener secuencias de nucleótidos diferentes de una pluralidad de secuencias de nucleótidos con diferentes números de copias. Una copia de una secuencia de nucleótidos se puede producir, por ejemplo, en un único fragmento de ácido nucleico de la pluralidad de fragmentos de ácido nucleico.
Una célula puede ser una célula humana. Una célula puede ser un fibroblasto o linfocito. Una célula puede ser la célula de una línea celular. Una célula puede ser una célula adherente o una célula en suspensión.
Una célula se puede seleccionar entre el grupo que consiste en 721, 293T, 721, A172, A253, A2780, A2780ADR, A2780cis, A431, A-549, células BCP-1, BEAS-2B, BR 293, BxPC3, Cal-27, CML T1, COR-L23, COR-L23/5010, COR-L23/CPR, COR-L23/R23, COV-434, DU145, DuCaP, EM2, EM3, FM3, H1299, H69, HCA2, HEK-293, HeLa, HL-60, HMEpC, HT-29, HUVEC, Jurkat, células JY, células K562, células KBM-7, KCL22, KG1, Ku812, KYO1, LNCap, Ma-Mel, MCF-10A, MCF-7, MDA-MB-157, MDA-MB-231, MDA-MB-361, MG63, MONO-MAC 6, MOR/0.2R, MRC5, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, Peer, Raji, células Saos-2, SiHa, SKBR3, SKOV-3, T2, T-47D, T84, U373, U87, U937, VCaP, WM39, WT-49, y células YAR.
Una célula puede ser cualquier célula disponible en la ATCC (por ejemplo, http://www.atcc.org). En ciertas realizaciones, la célula es una célula de mamífero, tal como una célula humana. La célula puede ser una célula de cualquiera de las líneas celulares del repositorio de células genéticas humanas del National Institute of General Medical Sciences (NIGMS) disponibles en el Coriell Institute for Medical Research (https://catalog.coriell.org/1/NIGMS), tal como una línea celular de la colección "aparentemente sana". La célula puede ser un fibroblasto, linfoblasto, o linfocito. La célula se puede transformar, por ejemplo, con el virus Epstein-Barr. La célula puede ser una célula inmortalizada. Por ejemplo, la célula puede ser un linfocito inmortalizado, tal como un linfocito B inmortalizado. La célula puede ser un linfocito transformado con el virus Epstein-Barr, tal como un linfocito B transformado con el virus Epstein-Barr. La célula puede ser GM12878 (véase Zook, J.M. et al., Nature Biotechnology 32: 246 (2014)). La célula puede ser GM12878, GM24149, GM24143, GM24385, GM24631, GM24694, o GM24695 (véase Zook, J.M. et al., Scientific Data 3: 160025 (2016)). En ciertas realizaciones, la célula es GM24385.
Una célula puede ser una célula de bacteria, de levadura, de insecto, de ratón, de rata, de hámster, de perro, o de mono, por ejemplo, para clonación o validación de un constructo. Por ejemplo, la célula puede ser E. coli o Saccharomyces cerevisiae, por ejemplo, para la clonación de un ácido nucleico de la invención.
En algunos aspectos, la invención se refiere una composición que comprende una primera pluralidad de células y una segunda pluralidad de células (denominada "composición que comprende células"). La primera pluralidad de células puede comprender un ácido nucleico de longitud completa como se describe en el presente documento, mencionado anteriormente, o una pluralidad de fragmentos de ácido nucleico, por ejemplo, en donde el ensamblaje de secuencias de las secuencias de nucleótidos de la pluralidad de fragmentos de ácido nucleico da como resultado una secuencia o secuencias de nucleótidos tomadas en conjunto comprenden una pluralidad de secuencias de nucleótidos como se describe en el presente documento, mencionado anteriormente. La segunda pluralidad de células puede consistir en células que no comprenden un ácido nucleico de longitud completa o pluralidad de fragmentos de ácido nucleico como se describe en el presente documento. La primera pluralidad de células y la segunda pluralidad de células pueden ser el mismo tipo de células, por ejemplo, las células de la primera y de la segunda pluralidades pueden ser células humanas, tal como linfocitos inmortalizados, tal como células GM24385. Las células de la primera pluralidad y de la segunda pluralidad se pueden mezclar en la composición. La proporción del número de células de la primera pluralidad con respecto al número de células de la segunda pluralidad puede ser de aproximadamente 1:1 a aproximadamente 1:10.000, tal como de aproximadamente 1:2 a aproximadamente 1:2.000, o de aproximadamente 1:10 a aproximadamente 1:1.000 en la composición. La proporción puede depender en parte del número de copias promedio del ácido nucleico en la primera pluralidad de células o del número de copias promedio de las secuencias de nucleótidos de la pluralidad de secuencias de nucleótidos en la primera pluralidad de células. La proporción del número de células de la primera pluralidad de células con respecto al número de células de la segunda pluralidad de células se puede ajustar, por ejemplo, de modo que la composición comprenda de aproximadamente 0,01 copias del ácido nucleico (o aproximadamente 0,01 copias de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos) a aproximadamente 100 copias del ácido nucleico (o aproximadamente 100 copias de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos) por célula de la composición. La proporción se puede ajustar de modo que la composición comprenda de aproximadamente 0,1 a aproximadamente 50 copias, de aproximadamente 0,5 a aproximadamente 20 copias, o de aproximadamente 1 a aproximadamente 10 copias del ácido nucleico por célula de la composición (o de aproximadamente 0,1 a aproximadamente 50 copias, de aproximadamente 0,5 a aproximadamente 20 copias, o de aproximadamente 1 a aproximadamente 10 copias de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos por célula de la composición).
Una célula, pluralidad de células, o composición que comprende células pueden estar fijadas. En ciertas realizaciones, una célula, pluralidad de células, o composición que comprende células está fijada con formalina. Una célula, pluralidad de células, o composición que comprende células pueden estar fijadas con glutaraldehído, etanol, metanol, acetona, benzoato de metilo, xileno, ácido acético, picrato, fijador HOPE, tetraóxido de osmio, y/o acetato de uranilo.
Una célula, pluralidad de células, o composición que comprende células se puede deshidratar, por ejemplo, usando etanol o un disolvente orgánico.
Una célula, pluralidad de células, o composición que comprende células se puede embeber en parafina. Por ejemplo, una célula, pluralidad de células, o composición que comprende células se puede fijar en formalina y se puede embeber en parafina. Una célula, pluralidad de células, o composición que comprende células se puede montar en un portaobjetos.
En algunos aspectos, la invención se refiere a una sección de parafina que comprende una pluralidad de células o composición que comprende células. La sección de parafina puede comprender de 1 a aproximadamente 1.000.000 células, tal como de aproximadamente 10 a aproximadamente 100.000 células, de aproximadamente 50 a aproximadamente 50.000 células, de aproximadamente 100 a aproximadamente 10.000 células, de aproximadamente 500 a aproximadamente 5.000 células, de aproximadamente 200 a aproximadamente 2.000 células, de aproximadamente 100 a aproximadamente 1.000 células, o de aproximadamente 50 a aproximadamente 1.000 células. La sección de parafina puede ser de aproximadamente 1 pm a aproximadamente 50 pm de grosor, tal como de aproximadamente 2 pm a aproximadamente 25 pm de grosor, o de aproximadamente 5 pm a aproximadamente 20 pm de grosor. La sección de parafina puede tener de aproximadamente 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, o 20 pm de grosor. La sección de parafina puede tener de aproximadamente 1 mm a aproximadamente 100 mm de longitud, ancho, o diámetro, tal como de aproximadamente 5 mm a aproximadamente 50 mm, o de aproximadamente 10 mm a aproximadamente 40 mm. Por ejemplo, una sección de parafina puede tener de aproximadamente 5 mm a aproximadamente 50 mm de longitud, de aproximadamente 5 mm a aproximadamente 50 mm de ancho, y de aproximadamente 5 pm a aproximadamente 20 pm de grosor. Una sección de parafina puede tener de aproximadamente 5 mm a aproximadamente 50 mm de diámetro y de aproximadamente 5 pm a aproximadamente 20 pm de grosor.
Una célula, pluralidad de células, o composición que comprende células puede estar presentes estar presente en un sedimento celular. Una célula, pluralidad de células, o composición que comprende células puede estar suspendida en plasma sanguíneo, tal como un plasma sanguíneo de mamífero. En ciertos casos, una célula, pluralidad de células, o composición que comprende células puede estar suspendida en plasma sanguíneo humano o una solución diseñada para replicar el plasma sanguíneo humano.
En algunos aspectos, la invención se refiere a un método para preparar un material de referencia biológico, que comprende transfectar una pluralidad de células con un ácido nucleico descrito en el presente documento, una pluralidad de las mismas, o una pluralidad de fragmentos de ácido nucleico como se describe en el presente documento.
Un método puede comprender fijar una pluralidad de células o composición que comprende células. Por ejemplo, el método puede comprender fijar una pluralidad de células o composición que comprende células con formalina. Un método puede comprender fijar una pluralidad de células o composición que comprende células con glutaraldehído, etanol, metanol, acetona, benzoato de metilo, xileno, ácido acético, picrato, fijador HOPE, tetraóxido de osmio, y/o acetato de uranilo.
Un método puede comprender embeber una pluralidad de células o composición que comprende células en parafina. Un método puede comprender seccionar células embebidas en parafina. Un método puede comprender montar una pluralidad de células en un portaobjetos, por ejemplo, células embebidas en parafina o células que no están embebidas en parafina.
Un método puede comprender montar una pluralidad de células o composición que comprende células en un portaobjetos.
En algunos aspectos, la invención se refiere a un material de referencia biológico que comprende una célula, pluralidad de células, o composición que comprende células como se describe en el presente documento.
Un material de referencia biológico puede comprender parafina, por ejemplo, en donde la célula, pluralidad de células, o composición que comprende células están fijadas, y la célula, pluralidad de células, o composición que comprende células están embebidas en la parafina.
Un material de referencia biológico puede comprender además células no transfectadas, por ejemplo, en donde las células no transfectadas no comprenden el ácido nucleico. En ciertas realizaciones, las células no transfectadas son la misma especie que las células de la pluralidad, por ejemplo, las células no transfectadas pueden ser de la misma fuente (por ejemplo, línea celular) que las células de la pluralidad. La proporción de células de la pluralidad de células con respecto a células no transfectadas puede ser de aproximadamente 4:1 a aproximadamente 1:10.000, tal como de aproximadamente 1:1 a aproximadamente 1:5.000, de aproximadamente 1:1 a aproximadamente 1:1.000, de aproximadamente 1:10 a aproximadamente 1:1.000, o de aproximadamente 1:50 a aproximadamente 1:500. La proporción de células de la pluralidad de células con respecto a células no transfectadas puede ser aproximadamente 45:55, aproximadamente 50:50, aproximadamente 55:45, aproximadamente 1:1, aproximadamente 1:2, aproximadamente 1:3, aproximadamente 1:4, aproximadamente 1:5, aproximadamente 1:6, aproximadamente 1:7, aproximadamente 1:8, aproximadamente 1:9, aproximadamente 1:10, aproximadamente 1:20, aproximadamente 1:25, aproximadamente 1:50, aproximadamente 1:100, aproximadamente 1:200, aproximadamente 1:250, aproximadamente 1:500, o aproximadamente 1:1.000.
En algunas realizaciones, la proporción de el número de copias del ácido nucleico con respecto al número de copias de genomas celulares en el material de referencia biológico es de aproximadamente 10:1 a aproximadamente 1:10.000, tal como de aproximadamente 5:1 a aproximadamente 1:1.000, de aproximadamente 2:1 a aproximadamente 1:100, de aproximadamente 1:1 a aproximadamente 1:50, o de aproximadamente 1:2 a aproximadamente 1:20. En general, cada genoma contiene dos copias de un gen (por ejemplo, para genes que se producen en cromosomas diploides, tal como autosomas). El número de copias de un ácido nucleico con respecto al número de copias de un gen en el genoma celular en el material de referencia biológico puede ser de aproximadamente 10:1 a aproximadamente 1:10.000, tal como de aproximadamente 5:1 a aproximadamente 1:1.000, de aproximadamente 1:1 a aproximadamente 1:100, de aproximadamente 1:2 a aproximadamente 1:50, o de aproximadamente 1:4 a aproximadamente 1:40. Por lo tanto, la proporción de un genotipo de un ácido nucleico con respecto al número de copias de un gen en el genoma celular que está asociado al genotipo (por ejemplo, el alelo de tipo natural) en el material de referencia biológico puede ser de aproximadamente 10:1 a aproximadamente 1:10.000, tal como de aproximadamente 5:1 a aproximadamente 1:1.000, de aproximadamente 1:1 a aproximadamente 1:100, de aproximadamente 1:2 a aproximadamente 1:50, o de aproximadamente 1:4 a aproximadamente 1:40.
Un material de referencia biológico puede comprender además un líquido, tal como solución salina, solución salina tamponada con fosfato, o plasma sanguíneo, tal como un plasma sanguíneo de mamífero. Una célula, pluralidad de células, o composición que comprende células de un material de referencia biológico puede estar suspendida en plasma, tal como plasma humano sanguíneo o una solución diseñada para replicar el plasma humano sanguíneo.
Un material de referencia biológico puede ser un sedimento celular, por ejemplo, preparado mediante centrifugación de una pluralidad de células o composición que comprende células como se describe en el presente documento. En algunos aspectos, la invención se refiere a una composición que comprende un ácido nucleico purificado, en donde el ácido nucleico purificado se aísla de un material de referencia biológico como se describe en el presente documento. La composición puede comprender un tampón, tal como tampón tris (es decir, tris(hidroximetil)aminometano o una sal del mismo). La composición puede comprender un agente quelante, tal como ácido etilendiaminotetraacético, o una sal del mismo. La composición puede comprender cantidades traza de formaldehído y/o parafina, aunque la composición puede estar exenta del formaldehído y parafina.
Ejemplos
Ejemplo 1. Diseño de ácido nucleico para dianas de oncología
Se desarrolló un listado de dianas de fusión génica que representan fusiones clínicamente relevantes para las que actualmente se encuentran disponibles ensayos de diagnóstico usando tecnología de secuenciación de nueva generación (NGS) (Tabla 1). Las dianas se seleccionaron basándose en la disponibilidad de ensayos para detectar las fusiones, así como en una revisión de la bibliografía que indica relevancia clínica. El listado favoreció mutaciones en cánceres de pulmón y de tiroides. Los detalles con respecto a las secuencias exactas incluidas se proporcionan en la Tabla 2.
T l 1. Di n f i n ni n l í r m ri l r f r n i
Figure imgf000016_0001
Tabla 2. Secuencias de GenBank usadas para diseñar los constructos de fusión múltiples
Figure imgf000016_0002
Figure imgf000017_0001
Se diseñaron dos constructos de ADN plasmídico diferentes de modo que cada plásmido contuviera 6 de las 12 dianas de fusión. Todas las líneas con números pares de la Tabla 1 se incorporaron en el constructo n.° 1 (SEQ ID NO: 11) y todas las líneas con números impares de la Tabla 1 se incorporaron en el constructo n.° 2 (SEQ ID NO: 12).
La Tabla 1 incluye dos fusiones para ALK, dos fusiones para RET, dos fusiones para ROS1, dos fusiones para NTRK1 y dos fusiones para FGFR3. Las dos fusiones para cada gen se separaron en diferentes plásmidos en parte para evitar que los plásmidos contuvieran tramos significativos de secuencia idéntica, que podrían ser inestables y se podrían someter a recombinación.
Cada fusión en el constructo se diseñó para que incluyera 250 nucleótidos hacia arriba y hacia abajo del punto de ruptura que conecta dos genes diferentes en un par de fusión. Por ejemplo, la fusión EML4-ALK contiene aproximadamente 250 nucleótidos de EML4 unidos a aproximadamente 250 nucleótidos de ALK.
Se colocó un promotor SP6 antes de las dianas de fusión para que el ARN se pudiera transcribir a partir del plásmido.
Una secuencia corta de aproximadamente 125 pares de bases se añadió hacia abajo de las dianas de fusión. Esta secuencia se usó para la validación del constructo mediante un ensayo de PCR en tiempo real basada en TaqMan, que se dirige a la secuencia. La secuencia permitió la cuantificación del ARN transcrito, para aumentar la precisión y la exactitud de las mediciones de ARN para las etapas de transfección posteriores.
Se añadió una cola de poli-A hacia abajo tanto de las dianas de fusión como de la secuencia usada para cuantificación para aumentar la estabilidad del ARN en células transfectadas.
Ejemplo 2. Transfección de células con ARN
El ARN se transcribió usando el kit de transcripción mMessage mMachine SP6 de Thermo Fisher Ambion ahora. Este kit se usó porque incorpora un análogo de protección [m7G(5')ppp(5')G], que se incorpora solo como la primera o G 5' terminal del transcrito, porque su estructura impide su incorporación en cualquier otra posición en la molécula de ARN. Los ARN que carecen de una estructura de protección en 5' se pueden dirigir a rutas de degradación intracelular y, por lo tanto, el kit de transcripción protegido se usó para aumentar la estabilidad del ARN dentro de una célula.
Los ARN se sometieron a electroporación en la línea celular humana GM24385. Esta línea celular es un genoma de referencia de genoma en una botella (Genome in a Bottle) del National Institutes of Standards, que ha sido bien caracterizado por NGS y que se puede usar en productos comerciales.
El ARN se introdujo en las células mediante electroporación. Se usaron 10 pg de ARN para transfectar 40 millones de células. Las condiciones de electroporación fueron las siguientes: 300 Voltios/500 pF/1 pulso/cubeta de 4 mm. Después de la electroporación, se permitió que las células se recuperaran durante 6 horas. A las 6 horas después de la electroporación, las células sedimentaron, el sobrenadante se retiró y se añadió medio nuevo. La retirada de los medios de transfección ayuda a retirar el ARN no incorporado de la muestra.
A las 24 horas después de la electroporación, las células sedimentaron suavemente, y se lavaron usando solución salina tamponada con fosfato. Las células se volvieron a suspender en solución salina tamponada con fosfato a aproximadamente 4,4E+06 células/ml. Se transfirieron 2 ml de las células lavadas a fijador y se fijaron durante 20 minutos en formalina para destruir las células y preservar la estructura celular. A continuación, las células se deshidrataron mediante una serie de lavados en etanol y se almacenaron a la misma concentración (~4,4E+06 células/ml) a -20 °C en etanol al 70 %.
Una alícuota de las células se congeló instantáneamente en lugar de fijarse para verificar que el ARN biosintético se incorporaba de hecho a las células (mediante PCR en tiempo real basada en TaqMan).
Los ácidos nucleicos se extrajeron de las células fijadas usando un Agencourt FormaPure - Extracción de ácido nucleico del Kit tisular FFPE. En los ácidos nucleicos extraídos se realizó PCR en tiempo real TaqMan. Se recuperó ARN de las células fijadas aproximadamente al mismo nivel que de las células no fijadas. Se calculó que el número de copias del ARN multiplex era superior a 250 copias por célula.
Tabla 3. Cuantificación de ARN biosintético dentro de células transfectadas
Figure imgf000018_0001
Dado que parecía haber cientos de copias del ARN biosintético por célula, las células transfectadas se diluyeron con células no transfectadas para reducir la cantidad de ARN de fusión a niveles fisiológicos. Las células transfectadas se diluyeron en las células no transfectadas en diluciones en serie de 10 veces para hacer una dilución 1:10, 1:100 y 1:1.000 de cada constructo.
En experimentos en paralelo, se extrajo ácido nucleico de células transfectadas y de células no transfectadas. El ácido nucleico se normalizó a la misma concentración y a continuación el ácido nucleico de las células transfectadas se diluyó en serie en el ácido nucleico de las células no transfectadas para lograr diluciones 1:10, 1:100 y 1:1.000.
El ácido nucleico total de las células se extrajo usando un kit de extracción FormaPure de acuerdo con las modificaciones al protocolo de extracción FormaPure recomendado por ArcherDx. El ácido nucleico total se usó para la preparación de la colección usando el Kit v2 de reactivo de ARN universal Archer™ para Illumina y el Panel de pulmón y tiroides FusionPlex™ Archer™. La preparación de la colección siguió las instrucciones de ArcherDx y la colección se analizó usando un instrumento MiSeq de Illumina. El software identificó de forma apropiada las fusiones génicas de oncología esperadas (Figuras 2 y 3).
°
Figure imgf000018_0002
T l . N m r l r r v l ni n f i n ni r l n r ^ N.° 2
Figure imgf000018_0003
El número de lecturas a través de cada unión de fusión se representó en gráfico para las diluciones 1:10, 1:100 y 1:1.000 tanto del constructo n.° 1 como del constructo n.° 2 (Figuras 4 y 5). Cuando se representa el nivel de dilución frente al número de lecturas, existe una relación lineal (Figuras 6 y 7). Esto demuestra que un material de referencia se puede ajustar para lograr el número de lecturas deseado simplemente diluyendo las células transfectadas antes de las etapas de procesamiento posteriores. Dado que existe una respuesta lineal, la cantidad de dilución se puede calcular fácilmente.
Las mezclas celulares (diluciones 1:10, 1:100 y 1:1.000) se extrajeron de nuevo usando el kit de extracción Agencourt FormaPure, siguiendo un protocolo para producir ARN puro (es decir, con una etapa de tratamiento con DNasa). El producto de ARN se analizó usando un panel de investigación de cáncer de pulmón de fusión de ARN de Ion AmpliSeq™. Este panel se limita solo a las fusiones de ALK, RET, ROS1 y NTRK1, y se centra solo en las fusiones que se encuentran en el cáncer de pulmón. Por lo tanto, no todas las fusiones contenidas en el material multiplex se analizaron en el panel. Sin embargo, cada una de las fusiones sometidas a ensayo se detectó en los tres niveles de dilución. Las lecturas totales se muestran en las Tablas 6 y 7.
T l . Nmr l r In Amli r v l nin f i n r l n r N.° 1
Figure imgf000019_0001
T l 7. Nmr l r In Amli rv l nin f i n r l n r N.° 2
Figure imgf000019_0002
Ejemplo 3. Construcciones combinadas
Las células transfectadas fijadas que portan el constructo n.° 1 y las células transfectadas fijadas que portan el constructo n.° 2 se mezclaron y se diluyeron en células no transfectadas a un nivel de dilución de 1:1.000. Los ácidos nucleicos totales se extrajeron usando el kit de extracción FormaPure. El número de lote 102342 se asignó al ácido nucleico total.
La secuenciación de nueva generación se realizó de acuerdo con las instrucciones del panel de pulmón y tiroides Archer Dx FusionPlex. Se detectaron las 12 fusiones y cada fusión pasó todos los filtros de evidencia fuerte. Curiosamente, aunque se identificó la fusión KIF5B-RET, el software Archer no indicó que se conociera la fusión. Por lo tanto, la muestra identificó una discrepancia en el software Archer. El PAX8-PPARG se identificó de manera similar, pero el software Archer no indicó que se conociera la fusión, lo cual se esperaba porque esta fusión no está anotada en el software Archer. Todas las demás fusiones génicas se marcaron como conocidas.
T l . Nmr l r Arh rDx r v l nin f i n r l l 1242
Figure imgf000019_0003
Figure imgf000020_0003
Ejemplo 4. Células embebidas
Las células transfectadas y fijadas que portan el constructo n.° 1 y las células transfectadas fijadas que portan el constructo n.° 2 se mezclaron y se diluyeron en células no transfectadas a niveles de diluciones 1:10, 1:100 y 1:1.000 (muestras de números de copias denominadas "altos", "medios" y "bajos"). Se sedimentó 1 ml de cada mezcla celular y se volvió a suspender en HistoGel. La mezcla de HistoGel/células se transfirió al cilindro de una jeringa de 3 ml y se dejó solidificar. Después de la solidificación, cada uno de los tres "núcleos" (alto, medio y bajo) se recortó y se cortó en dos piezas. Los núcleos se colocaron en formalina al 10 % a 2-8 °C durante 18-24 horas. Después de la fijación durante la noche, los núcleos se deshidrataron mediante incubación con concentraciones crecientes de etanol (50 %, 70 %, 80 %, y 100 %). Después de la deshidratación en etanol, los núcleos se incubaron en nafta (un sustituto del xileno) durante la noche. Al tercer día, la nafta se intercambió varias veces y los núcleos se embebieron en parafina.
Los bloques de parafina se seccionaron en secciones de 10 pm. Basándose en el número de células embebidas, una sección de 10 micrómetros debería contener el equivalente de ADN/ARN de aproximadamente 10.000 células. Cada sección de 10 pm contendría aproximadamente 1.400 células transfectadas en el bloque "Alto", 140 células transfectadas en el bloque "Medio" y 14 células transfectadas en el bloque "Bajo".
Se extrajeron cinco secciones de cada bloque usando el protocolo de extracción de Agencourt FormaPure para obtener el ácido nucleico total (Tabla 9).
Figure imgf000020_0001
Se usaron aproximadamente 125 ng de ácido nucleico total para la preparación de la colección usando el Kit v2 de reactivo de ARNm universal Archer™ para Illumina y el panel de pulmón y tiroides Archer™ FusionPlex™. La preparación de la colección siguió las instrucciones de ArcherDx y cada muestra se analizó con un instrumento Illumina MiSeq. Los resultados de la muestra "Alto" mostraron fusiones fuera de la diana y la muestra "Bajo" no pudo detectar la mayoría de las fusiones esperadas. Sin embargo, la muestra "Medio" detectó 11 de las 12 fusiones esperadas, tal como se muestra en la Tabla 10 que sigue a continuación. Hubo más variabilidad entre el número de lecturas de extensión para las diferentes dianas de fusión cuando se extrajo el ácido nucleico total de FFPE con respecto a las células ligeramente fijadas de los Ejemplos 2 y 3 (Tabla 11).
CD74-ROS1 no se detectó en la muestra "FFPE medio"; sin embargo, se detectó en la muestra de "FFPE alto", lo que indica que constructo se diseñó de manera apropiada. Se desconoce el motivo de las lecturas bajas para CD74-ROS1 y SLC34A2-ROS1; sin embargo, el ARN de ROS1 puede ser susceptible de daño durante la etapa de electroporación o durante la fijación con formalina, de modo que, en esta región del constructo de ARN, se podrían amplificar menos moléculas durante la preparación de la colección.
Tabla 10
Figure imgf000020_0002
Figure imgf000021_0003
Tabla 11. Comparación de lecturas a través de la unión de cada fusión para las muestras del Ejemplo 2 (Serie N.° 1 E m l ri N.° 2 E m l 4 FFPE
Figure imgf000021_0001
El ácido nucleico extraído de las secciones "FFPE medio" se sometió a ensayo en un laboratorio comercial, que usa el Panel de Investigación del Cáncer OncoMine®. Los resultados se muestran en la Tabla 12. No se detectaron NPM1-ALK, ETV6-NTRK3 ni TFG-NTRK1, pero las nueve fusiones restantes en el material de referencia se detectaron de forma positiva. El examen de evidencia de OncoMine sugiere que el ensayo no somete a ensayo NPM1-ALK o TFG-NTRK1, por lo que no se esperaban resultados positivos para estas fusiones. Sin embargo, se esperaba que OncoMine analizara ETV6-NTRK3 y se desconoce la razón exacta por la que no se detectó esta fusión.
Tabla 12
Figure imgf000021_0002
Figure imgf000022_0001
La muestra de FFPE se envió a un segundo laboratorio comercial para su análisis (los datos no se muestran).
A primera vista, parecía haber múltiples discrepancias entre los resultados del análisis de ArcherDx y los otros dos laboratorios. Una inspección más detallada muestra que, en general, no hubo desacuerdo sobre las fusiones de ARN presentes, sino sobre los puntos de ruptura exactos y los exones que se unieron. Por ejemplo, ambas fusiones de fGfR3 se denominaron FGFR3(18)-BAIAP2L1(2) y fGfR3(18)-TACC3(11) en el ensayo Archer, y se diseñaron para que el exón 18 de FGFR3 se fusionara con el otro gen (Tabla 1). Sin embargo, el exón 17 y el exón 18 tienen ambos menos de 200 pb, por lo que ambas secuencias de exón estaban presentes en el constructo. Para un ensayo que depende de la producción de un producto de PCR, tiene sentido que se detecte una fusión con el exón 17. Parece que la fusión NCOA4-RET se puede haber evaluado de forma similar. Este ARN de fusión se diseñó y se detectó en el ensayo Archer como fusión del exón 8 de NCOA4 con el exón 12 de RET, pero en OncoMine, se denomina fusión del exón 7 de NCOA4 con el exón 12 de RET. de nuevo, el exón 7 y el exón 8 de NCOA4 son ambos muy pequeños, por lo que ambos están presentes en el constructo. Es poco probable que la diferencia en el punto de corte exacto influya en la toma de decisiones clínicas. Siempre y cuando los dominios funcionales estén unidos en la proteína de fusión, los efectos hacia abajo serán los mismos.
Ejemplo 5. Materiales de referencia FFPE con mayor concentración celular
Aunque los resultados del bloque "FFPE medio" del Ejemplo 4 fueron generalmente buenos, la retroalimentación de ArcherDx y otros sugirió que la cantidad de ARN extraíble era baja y podría no cumplir con las expectativas del cliente en cuanto a rendimiento de ácido nucleico. Por lo tanto, se preparó un nuevo bloque FFPE usando las mismas células transfectadas fijadas y la misma proporción de mezcla 1:100 que en el bloque "FFPE medio". Para esta nueva preparación, se embebieron ~50 millones de células para dar lugar a un núcleo de ~10 mm de altura (de concentración 5x mayor que anteriormente), que se podría usar para preparar secciones de ~800 x 10 pm en 2 bloques FFPE idénticos.
Los resultados se muestran en la Tabla 13. Mientras que el bloque "FFPE medio" solo produjo aproximadamente 218 ng de ácido nucleico total a partir de cinco secciones de 10 pm, el nuevo bloque (número de lote 102380) produjo aproximadamente esta misma cantidad de una sola sección, lo que indica que el rendimiento fue aproximadamente cinco veces mayor.
El lote 102380 se sometió a ensayo usando el panel de pulmón y tiroides ArcherDx FusionPlex como en los ejemplos anteriores, excepto porque se usaron aproximadamente 250 ng de ácido nucleico de entrada para la preparación de la colección. Es importante destacar que ArcherDx introdujo una actualización importante en su software de análisis Archer, desde la versión 3.3 a la versión 4.0. La principal diferencia entre estas versiones es que 3.3 alineó cada lectura con una secuencia de referencia humana. Las lecturas asignadas a dos ubicaciones distintas admitían las llamadas de fusión. Sin embargo, en la versión 4.0, las lecturas se usan para el ensamblaje de novo. Básicamente, el software puede usar las lecturas para ensamblar a través del constructo de fusión multiplex de SeraCare. Por lo tanto, se observaron fusiones de tres o cuatro genes. Además, la nueva versión del software también enumeró las fusiones por separado, incluso si tenían el mismo punto de ruptura, lo que dio como resultado un informe con llamadas duplicadas (por ejemplo, NCOA4-RET y FGFR3-TACC3 se llamaron dos veces, ambas con el símbolo de la diana, indicando que se conocía el punto de ruptura exacto). Estos problemas son inherentes al software y no específicos del diseño del material de referencia. A pesar de las llamadas adicionales confusas, las 12 fusiones esperadas se detectaron como fusiones de evidencia fuerte, y el número de lecturas de extensión, aunque mayor en esta serie, fue coherente con las del Ejemplo 4 (Figura 8).
Tabla 13
Figure imgf000022_0002

Claims (15)

REIVINDICACIONES
1. Un ácido nucleico, que comprende una pluralidad de secuencias de nucleótidos, en donde:
cada secuencia de nucleótidos de la pluralidad comprende una primera subsecuencia y una segunda subsecuencia;
la primera subsecuencia comprende una secuencia 3' de un primer exón;
la segunda subsecuencia comprende una secuencia 5' de un segundo exón;
la primera subsecuencia y la segunda subsecuencia son secuencias adyacentes en el ácido nucleico;
la primera subsecuencia y la segunda subsecuencia tienen cada una al menos 20 nucleótidos de longitud; la primera subsecuencia está en 5' con respecto a la segunda subsecuencia en el ácido nucleico;
el primer exón es un exón de un primer gen;
el segundo exón es un exón de un segundo gen;
el primer gen y el segundo gen son genes diferentes; y
cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos comprende una secuencia 3' de un primer exón que es diferente de cada otro primer exón de las secuencias de nucleótidos de la pluralidad o una secuencia 5' de un segundo exón que es diferente de cada otro segundo exón de las secuencias de nucleótidos de la pluralidad.
2. El ácido nucleico de la reivindicación 1, en donde:
(a) el ácido nucleico es ADN o ARN; y/o
(b) cada secuencia de nucleótidos de la pluralidad está asociada a una neoplasia, opcionalmente en donde la neoplasia es un cáncer de pulmón, cáncer de pulmón no microcítico, cáncer de tejido blando, cáncer linfoide, leucemia linfoide aguda, leucemia mieloide aguda, leucemia mielógena crónica, linfoma no Hodgkin, linfoma de Burkitt, melanoma, melanoma intraocular, cáncer del sistema nervioso central, neuroblastoma, cáncer de tiroides, cáncer de paratiroides, cáncer hepatocelular, cáncer de estómago, cáncer de intestino grueso, cáncer de colon, cáncer del tracto urinario, cáncer de vejiga, cáncer de riñón, cáncer de próstata, cáncer de cuello uterino, cáncer de ovario, o cáncer de mama.
3. El ácido nucleico de las reivindicaciones 1 o 2, en donde:
(a) cada primer gen y cada segundo gen se seleccionan entre el grupo que consiste en tirosina quinasa receptora de linfoma anaplásico (ALK), proteína 1 similar a proteína 2 asociada al inhibidor 1 de la angiogénesis específico del cerebro (BAIAP2L1), CD74, proteína similar a 4 asociada a microtúbulos de equinodermo (EML4), variante 6 de ETS (ETV6), receptor 3 del factor de crecimiento de fibroblastos (FGFR3), cadena pesada de kinesina 1 (KIF5B), coactivador 4 de receptor nuclear (NCOA4), nucleofosmina (NPM1), receptor neurotrófico de tirosina quinasa 1 (NTRK1), receptor neurotrófico de tirosina quinasa 3 (NTRK3), gen de caja emparejada 8 (Pax8), receptor gamma activado por proliferador de peroxisomas (PPARG), protooncogén RET (RET), protooncogén 1 de ROS (ROS1), proteína de transporte de fosfato dependiente de sodio SLC34A, proteína 3 que contiene superenrollamiento ácida transformante (TACC3), gen fusionado con TRK (TFG), y tropomiosina 3 (TPM3);
opcionalmente en donde cada primer exón y cada segundo exón se seleccionan entre el grupo que consiste en exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón 10 de NTRK1, exón 13 de NTRK3, exón 8 de PAX8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3;
opcionalmente en donde el primer exón y el segundo exón de cada secuencia de nucleótidos se seleccionan entre el grupo que consiste en exón 13 de EML4 y exón 20 de ALK; exón 5 de NPM1 y exón 20 de ALK; exón 24 de KIF5B y exón 11 de Ret; exón 8 de NCOA4 y exón 12 de RET; exón 6 de CD74 y exón 34 de ROS1; exón 4 de SLC34A y exón 34 de ROS1; exón 8 de TPM3 y exón 10 de NTRK1; exón 5 de TFG y exón 10 de NTRK1; exón 18 de Fg FR3 y exón 2 de BAIAP2L1; exón 18 de FGFR3 y exón 11 de TACC3; exón 8 de PAX8 y exón 1 de PPARG; y exón 5 de ETV6 y exón 13 de NTRK3, respectivamente; o
(b) cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un gen seleccionado entre el grupo que consiste en tirosina quinasa receptora de linfoma anaplásico (ALK), proteína 1 similar a proteína 2 asociada al inhibidor 1 de la angiogénesis específico del cerebro (BAIAP2L1), CD74, proteína similar a 4 asociada a microtúbulos de equinodermo (EML4), variante 6 de ETS (ETV6), receptor 3 del factor de crecimiento de fibroblastos (FGFR3), cadena pesada de kinesina 1 (KIF5B), coactivador 4 de receptor nuclear (NCOA4), nucleofosmina (NPM1), receptor neurotrófico de tirosina quinasa 1 (NTRK1), receptor neurotrófico de tirosina quinasa 3 (NTRK3), gen de caja emparejada 8 (Pax8), receptor gamma activado por proliferador de peroxisomas (PPARG), protooncogén RET (RET), protooncogén 1 de ROS (ROS1), proteína de transporte de fosfato dependiente de sodio SLC34A, proteína 3 que contiene superenrollamiento ácida transformante (TACC3), gen fusionado con TRK (TFG), y tropomiosina 3 (TPM3);
opcionalmente en donde cada subsecuencia de un gen es una subsecuencia de un exón único del gen;
opcionalmente en donde cada exón único se selecciona entre el grupo que consiste en exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón 10 de NTRK1, exón 13 de NTRK3, exón 8 de PAX8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3;
opcionalmente en donde el primer exón y el segundo exón de cada secuencia de nucleótidos se seleccionan entre el grupo que consiste en exón 13 de EML4 y exón 20 de ALK; exón 5 de NPM1 y exón 20 de ALK; exón 24 de KIF5B y exón 11 de Ret; exón 8 de NCOA4 y exón 12 de RET; exón 6 de Cd74 y exón 34 de ROS1; exón 4 de SLC34A y exón 34 de ROS1; exón 8 de TpM3 y exón 10 de NTRK1; exón 5 de TFG y exón 10 de NTRK1; exón 18 de FGFR3 y exón 2 de BAIAP2L1; exón 18 de FGFR3 y exón 11 de TACC3; exón 8 de PAX8 y exón 1 de PPARG; y exón 5 de ETV6 y exón 13 de NTRK3, respectivamente; o
(c) cada primer gen y cada segundo gen, respectivamente, se seleccionan entre el grupo que consiste en ACBD6 y RRP15; ACSL3 y ETV1; ACTB y GLI1; AGPAT5 y MCPH1; AGTRAP y BRAF; AKAP9 y BRAF; ARFIP1 y FHDC1; ARID1A y MAST2; ASPSCR1 y TFE3; ATG4C y FBXO38; ATIC y ALK; BBS9 y PKD1L1; BCR y ABL1; BCR y JAK2; BRD3 y NUTM1; BRD4 y NUTM1; C2orf44 y ALK; CANT1 y ETV4; CARS y ALK; CCDC6 y RET; CD74 y NRG1; CD74 y ROS1; CDH11 y USP6; CDKN2D y WDFY2; CEP89 y BRAF; CHCHD7 y PLAG1; CIC y DUX4L1; CIC y FOXO4; CLCN6 y BRAF; CLIP1 y ROS1; CLTC y ALK; CLTC y TFE3; CNBP y USP6; COL1A1 y PDGFB; COL1A1 y USP6; COL1A2 y PLAG1; CRTC1 y MAML2; CRTC3 y MAML2; CTAGE5 y SIP1; CTNNB1 y PLAG1; DCTN1 y ALK; DDX5 y ETV4; DNAJB1 y PRKACA; EIF3E y RSPO2; EIF3K y CYP39A1; EML4 y ALK; EPC1 y PHF1; ERC1 y RET; ERC1 y ROS1; ERO1L y FERMT2; ESRP1 y RAF1; ETV6 e ITPR2; ETV6 y JAK2; ETV6 y NTRK3; EWSR1 y ATF1; EWSR1 y CREB1; EWSR1 y DDIT3; EWSR1 y ERG; EWSR1 y ETV1; EWSR1 y ETV4; EWSR1 y FEV; EWSR1 y FLI1; EWSR1 y NFATC1; EWSR1 y NFATC2; EWSR1 y NR4A3; EWSR1 y PATZ1; EWSR1 y PBX1; EWSR1 y POU5F1; EWSR1 y SMARCA5; EWSR1 y SP3; EWSR1 y WT1; EWSR1 y YY1; EWSR1 y ZNF384; EWSR1 y ZNF444; EZR y ROS1; FAM131B y BRAF; FBXL18 y RNF216; FCHSD1 y BRAF; FGFR1 y ZNF703; FGFR1 y PLAG1; FGFR1 y TACC1; FGFR3 y BAIAP2L1; FGFR3 y TACC3; FN1 y ALK; FUS y ATF1; FUS y CREB3L1; FUS y CREB3L2; FUS y DDIT3; FUS y ERG; FUS y FEV; GATM y BRAF; GMDS y PDE8B; GNAI1 y BRAF; GOLGA5 y RET; GOPC y ROS1; GPBP1L1 y MAST2; HACL1 y RAF1; HAS2 y PLAG1; HERPUD1 y BRAF; HEY1 y NCOA2; HIP1 y ALK; HLA-A y ROS1; HMGA2 y ALDH2; HMGA2 y CCNB1IP1; HMGA2 y COX6C; HMGA2 y EBF1; HMGA2 y FHIT; HMGA2 y LHFP; HMGA2 y LPP; HMGA2 y NFIB; HMGA2 y RAD51B; HMGA2 y WIF1; HN1 y USH1G; HNRNPA2B1 y ETV1; HOOK3 y RET; IL6R y ATP8B2; INTS4 y GAB2; IRF2BP2 y CDX1; JAZF1 y PHF1; JAZF1 y SUZ12; KIAA1549 y BRAF; KIAA1598 y ROS1; KIF5B y ALK; KIF5B y RET; KLC1 y ALK; KLK2 y ETV1; KLK2 y ETV4; KMT2A y ABI1; KMT2A y ABI2; KMT2A y ACTN4; KMT2A y AFF1; KMT2A y AFF3; KMT2A y AFF4; KMT2A y ARHGAP26; KMT2A y ARHGEF12; KMT2A y BTBD18; KMT2A y CASC5; KMT2A y CASP8AP2; KMT2A y CBL; KMT2A y CREBBP; KMT2A y CT45A2; KMT2A y DAB2IP; KMT2A y EEFSEC; KMT2A y ELL; KMT2A y EP300; KMT2A y EPS15; KMT2A y FOXO3; KMT2A y FOXO4; KMT2A y FRYL; KMT2A y GAS7; KMT2A y GMPS; KMT2A y GPHN; KMT2A y KIAA0284; KMT2A y KIAA1524; KMT2A y LASP1; KMT2A y LPP; KMT2A y MAPRE1; KMT2A y MLLT1; KMT2A y MLLT10; KMT2A y MLLT11; KMT2A y MLLT3; KMT2A y MLLT4; KMT2A y MLLT6; KMT2A y MYOIF; KMT2A y NCKIPSD; KMT2A y NRIP3; KMT2A y PDS5A; KMT2A y PICALM; KMT2A y PRRC1; KMT2A y SARNP; KMT2A y SEPT2; KMT2A y SEPT5; KMT2A y SEPT6; KMT2A y SEPT9; KMT2A y SH3GL1; KMT2A y SORBS2; KMT2A y TET1; KMT2A y TOP3A; KMT2A y ZFYVE19; KTN1 y RET; LIFR y PLAG1; LMNA y NTRK1; LRIG3 y ROS1; LSM14A y BRAF; MARK4 y ERCC2; MBOAT2 y PRKCE; MBTD1 y CXorf67; MEAF6 y PHF1; MKRN1 y BRAF; MSN y ALK; MYB y NFIB; MYO5A y ROS1; NAB2 y STAT6; NACC2 y NTRK2; NCOA4 y RET; NDRG1 y ERG; NF1 y ACCN1; NFIA y EHF; NFIX y MAST1; NONO y TFE3; NOTCH1 y GABBR2; NPM1 y ALK; NTN1 y ACLY; NUP107 y LGR5; OMD y USP6; PAX3 y FOXO1; PAX3 y NCOA1; PAX3 y NCOA2; PAX5 y JAK2; PAX7 y FOXO1; PAX8 y PPARG; PCM1 y JAK2; PCM1 y RET; PLA2R1 y RBMS1; PLXND1 y TMCC1; PPFIBP1 y ALK; PPFIBP1 y ROS1; PRCC y TFE3; PRKAR1A y RET; PTPRK y RSPO3; PWWP2A y ROS1; QKI y NTRK2; RAF1 y DAZL; RANBP2 y ALK; RBM14 y PACS1; RGS22 y SYCP1; RNF130 y BRAF; SDC4 y ROS1; SEC16A_NM_014866.1 y NOTCH1; SEC31A y ALK; SEC31A y JAK2; SEPT8 y AFF4; SFPQ y TFE3; SLC22A1 y CUTA; SLC26A6 y PRKAR2A; SLC34A2 y ROS1; SLC45A3 y BRAF; SLC45A3 y ELK4; SLC45A3 y ERG; SLC45A3 y ETV1; SLC45A3 y ETV5; SND1 y BRAF; SQSTM1 y ALK; SRGAP3 y RAF1; SS18 y SSX1; SS18 y SSX2; SS18 y SSX4; SS18L1 y SSX1; SSBP2 y JAK2; SSH2 y SUZ12; STIL y TALI; STRN y ALK; SUSD1 y ROD1; TADA2A y MAST1; TAF15 y NR4A3; TCEA1 y PLAG1; TCF12 y NR4A3; TCF3 y PBX1; TECTA y TBCEL; TFG y ALK; TFG y NR4A3; TFG y NTRK1; THRAP3 y USP6; TMPRSS2 y ERG; TMPRSS2 y ETV1; TMPRSS2 y ETV4; TMPRSS2 y ETV5; TP53 y NTRK1; TPM3 y ALK; TPM3 y NTRK1; TPM3 y ROS1; TPM3 y ROS1; TPM4 y ALK; TRIM24 y RET; TRIM27 y RET; TRIM33 y RET; UBE2L3 y KRAS; VCL y ALK; VTI1A y TCF7L2; YWHAE y FAM22A; YWHAE y NUTM2B; ZC3H7B y BCOR; ZCCHC8 y ROS1; ZNF700 y MAST1; y ZSCAN30 y BRAF.
4. El ácido nucleico de una cualquiera de las reivindicaciones 1, 2 o 3 partes (a) y (b), en donde:
cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de extensión de una secuencia de nucleótidos seleccionada entre el grupo que consiste en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, y SEQ ID NO: 10; y la subsecuencia de extensión comprende la primera subsecuencia y la segunda subsecuencia.
5. El ácido nucleico de una cualquiera de las reivindicaciones 1-4, en donde:
(a) la pluralidad de secuencias de nucleótidos consiste en 2, 3, 2, 3, 4, 5, 6, 7, 8, 9, 10,
18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 0, 41, 42, 43, 48, 49, 50, 51, 52, 53, 54, 55, 56,
Figure imgf000047_0001
57, 58, 59, 60, 61, 62, 63, 64, 65, 0, 71, 72, 73, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 00, 101, 102, 1 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122,
128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144,
150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166,
172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188,
Figure imgf000047_0002
194, 195, 196, 197, 198, 199, o 200 secuencias de nucleótidos diferentes; y/o
(b) la pluralidad de secuencias de nucleótidos consiste en 2 a 12 secuencias de nucleótidos; y/o
(c) la pluralidad de secuencias de nucleótidos consiste en 6 secuencias de nucleótidos; y/o
(d) cada primera subsecuencia y cada segunda subsecuencia tienen al menos de 120 a 500 nucleótidos de longitud.
6. El ácido nucleico de una cualquiera de las reivindicaciones 1-5, en donde:
(a) una primera subsecuencia o una segunda subsecuencia de una secuencia de nucleótidos de la pluralidad comprende dos o más exones;
cada exón de los dos o más exones es un exón del mismo gen; y
los exones de los dos o más exones están ordenados en el ácido nucleico de acuerdo con el orden de los exones en un ARNm de origen natural,
opcionalmente
en donde:
una primera subsecuencia comprende dos o más exones, y el primer exón de la primera subsecuencia tiene menos de 200 nucleótidos de longitud; o
una segunda subsecuencia comprende dos o más exones, y el segundo exón de la segunda subsecuencia tiene menos de 200 nucleótidos de longitud; y/o
(b) el ácido nucleico es como se presenta en la parte (a) y la suma de las longitudes de los dos o más exones es de al menos 50 nucleótidos de longitud o de 120 a 500 nucleótidos de longitud; y/o
(c) el ácido nucleico comprende además una secuencia de nucleótidos que comprende un intrón, en donde:
la secuencia de nucleótidos que comprende un intrón comprende una primera subsecuencia y una segunda subsecuencia;
la primera subsecuencia comprende una subsecuencia 3' de un intrón o exón de un primer gen;
la segunda subsecuencia comprende una subsecuencia 5' de un intrón o exón de un segundo gen;
la primera subsecuencia y la segunda subsecuencia son secuencias adyacentes en el ácido nucleico;
la primera subsecuencia está en 5' con respecto a la segunda subsecuencia; y
el primer gen y el segundo gen son el mismo gen o genes diferentes;
opcionalmente en donde:
la primera subsecuencia comprende una subsecuencia 3' de un intrón de un primer gen; o
la segunda subsecuencia comprende una subsecuencia 5' de un intrón de un segundo gen; y/o
(d) el ácido nucleico es como se presenta en la parte (c) y el primer gen y el segundo gen de la secuencia de nucleótidos que comprende un intrón son genes diferentes o son el mismo gen; y/o
(e) el ácido nucleico comprende además una cola de poli-A.
7. El ácido nucleico de la reivindicación 6, en donde el ácido nucleico comprende además al menos un nucleósido metilado, opcionalmente en donde el al menos un nucleósido metilado comprende 7-metil guanosina, opcionalmente en donde el ácido nucleico comprende una protección 5' [m7G(5')ppp(5')G].
8. El ácido nucleico de la reivindicación 6, en donde:
(a) el ácido nucleico comprende además un promotor, opcionalmente en donde el promotor es un promotor SP6;
y/o
(b) el ácido nucleico comprende además un promotor en donde el promotor es de una especie diferente a las secuencias de nucleótidos de la pluralidad, opcionalmente en donde el promotor es un promotor SP6; y/o
(c) el ácido nucleico es un plásmido.
9. Un método para preparar el ácido nucleico de una cualquiera de las reivindicaciones 1-7, que comprende incubar una mezcla de reacción que comprende un molde de ADN, ARN polimerasa, y ribonucleótido trifosfatos a una temperatura a la que la ARN polimerasa muestra actividad de polimerasa, formando de ese modo el ácido nucleico.
10. Una célula que comprende el ácido nucleico de una cualquiera de las reivindicaciones 1-8.
11. La célula de la reivindicación 10, en donde:
(a) la célula es una célula humana; y/o
(b) la célula es un fibroblasto o un linfocito, opcionalmente un linfocito B inmortalizado; y/o
(c) la célula es GM12878, GM24149, GM24143, GM24385, GM24631, GM24694, o GM24695, opcionalmente GM24385; y/o
(d) la célula comprende de 1 a 1.000 copias o de 5 a 500 copias del ácido nucleico; o
(e) la célula es E. coli.
12. Una composición, que comprende una primera pluralidad de células y una segunda pluralidad de células, en donde:
la primera pluralidad de células consiste en células de acuerdo con la reivindicación 11 parte (d), células que comprenden de 5 a 500 copias del ácido nucleico;
la segunda pluralidad de células consiste en células que no comprenden el ácido nucleico;
la primera pluralidad de células y la segunda pluralidad de células son células humanas;
la primera pluralidad de células y la segunda pluralidad de células están mezcladas en la composición; y la proporción del número de células de la primera pluralidad con respecto al número de células de la segunda pluralidad es de aproximadamente 1:1 a aproximadamente 1:10.000 en la composición.
13. Un método para preparar un material de referencia biológico, que comprende transfectar una pluralidad de células con el ácido nucleico de una cualquiera de las reivindicaciones 1-8,
que comprende además opcionalmente:
(a) fijar las células de la pluralidad, opcionalmente en donde fijar las células comprende fijar las células con formalina; y/o
(b) embeber las células en parafina; y/o
(c) diluir la pluralidad de células con células no transfectadas, opcionalmente en donde diluir la pluralidad de células con células no transfectadas comprende diluir a una proporción de células transfectadas con respecto a células no transfectadas de aproximadamente 1:1 a aproximadamente 1:10.000.
14. Un material de referencia biológico, que comprende:
(a) una pluralidad de células de una cualquiera de las reivindicaciones 10 u 11 partes (a)-(d) y parafina, en donde la pluralidad de células están fijadas y embebidas en la parafina, que comprende además opcionalmente células no transfectadas en donde las células no transfectadas no comprenden el ácido nucleico o la pluralidad de fragmentos de ácido nucleico, opcionalmente en donde la proporción de células que comprenden el ácido nucleico o la pluralidad de fragmentos de ácido nucleico con respecto a células no transfectadas es de aproximadamente 1:1 a aproximadamente 1:10.000, de aproximadamente 1:5 a aproximadamente 1:5.000 o de aproximadamente 1:10 a aproximadamente 1:1.000; o
(b) una pluralidad de células de una cualquiera de las reivindicaciones 10 u 11 partes (a)-(d); y un líquido, opcionalmente en donde el líquido es plasma sanguíneo.
15. Una composición que comprende el ácido nucleico de una cualquiera de las reivindicaciones 1-8, y un tampón acuoso, opcionalmente en donde el tampón comprende tris(hidroximetil)aminometano y ácido etilendiaminotetraacético, o una sal de uno cualquiera de los mencionados anteriormente.
ES16871194T 2015-12-01 2016-08-25 Materiales de referencia celulares multiplex Active ES2893000T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562261514P 2015-12-01 2015-12-01
US201662323659P 2016-04-16 2016-04-16
PCT/US2016/048661 WO2017095486A1 (en) 2015-12-01 2016-08-25 Multiplex cellular reference materials

Publications (1)

Publication Number Publication Date
ES2893000T3 true ES2893000T3 (es) 2022-02-07

Family

ID=58797728

Family Applications (2)

Application Number Title Priority Date Filing Date
ES16871194T Active ES2893000T3 (es) 2015-12-01 2016-08-25 Materiales de referencia celulares multiplex
ES16871195T Active ES2972471T3 (es) 2015-12-01 2016-08-25 Materiales de referencia celulares multiplex

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES16871195T Active ES2972471T3 (es) 2015-12-01 2016-08-25 Materiales de referencia celulares multiplex

Country Status (9)

Country Link
US (2) US20190352720A1 (es)
EP (3) EP3384054B1 (es)
AU (2) AU2016362875B2 (es)
CA (2) CA3006464A1 (es)
DK (2) DK3384054T5 (es)
ES (2) ES2893000T3 (es)
FI (1) FI3384054T3 (es)
IL (2) IL259448B2 (es)
WO (2) WO2017095486A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY201941A (en) * 2017-08-21 2024-03-25 Taiho Pharmaceutical Co Ltd Fusion protein of dctn1 protein with ret protein
AU2019374898A1 (en) * 2018-11-08 2021-06-24 University Of Miami Method of determining responsiveness to cell therapy in dilated cardiomyopathy
TW202122590A (zh) * 2019-08-28 2021-06-16 行動基因生技股份有限公司 檢測ntrk基因融合的套組及方法
IL293051A (en) 2019-11-18 2022-07-01 Janssen Biotech Inc calr and jak2 mutant-based vaccines and their uses
CN112080566B (zh) * 2020-08-25 2021-08-17 上海交通大学医学院附属瑞金医院 基于高通量测序法的甲状腺癌检测产品及用途
CN115141886B (zh) * 2022-06-28 2023-06-06 厦门艾德生物医药科技股份有限公司 一种基于高通量测序的髓系白血病基因突变检测的探针引物组及其应用

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2408980B (en) * 2003-12-09 2006-06-07 Nat Biolog Standards Board Genetic reference materials
WO2007056825A1 (en) * 2005-11-21 2007-05-24 Simons Haplomics Limited Method and probes for identifying a nucleotide sequence
US20100286143A1 (en) * 2009-04-24 2010-11-11 Dora Dias-Santagata Methods and materials for genetic analysis of tumors
EP2633311A4 (en) * 2010-10-26 2014-05-07 Univ Stanford NON-INVASIVE F TAL GENE SCREENING BY SEQUENCING ANALYSIS
CA2890346A1 (en) * 2012-11-05 2014-05-08 Foundation Medicine, Inc. Novel fusion molecules and uses thereof
EP3421613B1 (en) * 2013-03-15 2020-08-19 The Board of Trustees of the Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
CN103468813B (zh) 2013-09-17 2015-06-03 广州达健生物科技有限公司 Eml4-alk融合基因荧光定量pcr检测试剂盒
EP3066194B1 (en) * 2013-11-05 2019-08-07 Life Technologies Corporation Method for preparing ffpe quality control material with bulking agent
WO2015073080A1 (en) * 2013-11-12 2015-05-21 Life Technologies Corporation Reagents and methods for sequencing
EP4219744A3 (en) * 2014-01-27 2023-08-30 The General Hospital Corporation Methods of preparing nucleic acids for sequencing
GB201402249D0 (en) * 2014-02-10 2014-03-26 Vela Operations Pte Ltd NGS systems control and methods involving the same

Also Published As

Publication number Publication date
FI3384054T3 (fi) 2024-02-19
WO2017095487A1 (en) 2017-06-08
CA3006464A1 (en) 2017-06-08
DK3929305T3 (en) 2024-01-02
EP3384054A4 (en) 2019-07-24
DK3384054T3 (en) 2024-01-08
DK3929305T5 (en) 2024-08-05
IL259449B (en) 2021-12-01
EP3929305B1 (en) 2023-11-08
AU2016362875A1 (en) 2018-06-21
AU2016362875B2 (en) 2022-12-08
US20190352720A1 (en) 2019-11-21
EP3384054B1 (en) 2023-11-29
DK3384054T5 (en) 2024-08-05
IL259448B1 (en) 2023-10-01
EP3929305A1 (en) 2021-12-29
IL259448A (en) 2018-07-31
IL259448B2 (en) 2024-02-01
EP3384053A1 (en) 2018-10-10
EP3384053A4 (en) 2019-07-24
IL259449A (en) 2018-07-31
EP3384054A1 (en) 2018-10-10
US20190177794A1 (en) 2019-06-13
AU2016362876B2 (en) 2023-02-09
WO2017095486A1 (en) 2017-06-08
EP3384053B1 (en) 2021-08-11
ES2972471T3 (es) 2024-06-12
AU2016362876A1 (en) 2018-06-28
CA3007056A1 (en) 2017-06-08

Similar Documents

Publication Publication Date Title
ES2893000T3 (es) Materiales de referencia celulares multiplex
Jiang et al. TEFM regulates both transcription elongation and RNA processing in mitochondria
US20240140978A1 (en) Therapeutic oligonucleotides
RU2662932C2 (ru) Композиции и способы с участием нуклеиновых кислот, нацеленных на нуклеиновые кислоты
CA3025486A1 (en) Oligonucleotide probes and uses thereof
Zhang et al. Translation repression via modulation of the cytoplasmic poly (A)-binding protein in the inflammatory response
AU2018244320A1 (en) Oligonucleotide probes and uses thereof
Liu et al. circFL-seq reveals full-length circular RNAs with rolling circular reverse transcription and nanopore sequencing
Malone et al. Selective modulation of a pan-essential protein as a therapeutic strategy in cancer
Sammons et al. ZNF9 activation of IRES-mediated translation of the human ODC mRNA is decreased in myotonic dystrophy type 2
US20150045237A1 (en) Method for identification of the sequence of poly(a)+rna that physically interacts with protein
Rao et al. KMT 1 family methyltransferases regulate heterochromatin–nuclear periphery tethering via histone and non‐histone protein methylation
Ueberschär et al. BEN-solo factors partition active chromatin to ensure proper gene activation in Drosophila
Falk et al. The EIF4E1-4EIP cap-binding complex of Trypanosoma brucei interacts with the terminal uridylyl transferase TUT3
ES2971123T3 (es) Cribado de alta productividad basado en células para aptámeros
US20230277618A1 (en) Therapeutic targeting of phosphate dysregulation in cancer via the xpr1:kidins220 protein complex
Baticados Functional consequences of transmembrane protein 30A (TMEM30A) inactivating mutations in diffuse large B-cell lymphoma
Marr Probing Genome-Wide Native Chromatin Structure via Histone Surface Accessibilities
Yuan G-quadruplexes in Gene Regulation and Telomere Maintenance
Duggimpudi Elucidating the physiological function of the RNA binding protein EWS and its role in post-transcriptional gene regulation
WO2023173012A2 (en) Compositions for activating and silencing gene expression
WO2021194531A1 (en) Dna repair site detection for personal genomics, epigenomics, and gene therapy
Class et al. Patent application title: METHOD FOR IDENTIFICATION OF THE SEQUENCE OF POLY (A)+ RNA THAT PHYSICALLY INTERACTS WITH PROTEIN Inventors: Markus Landthaler (Berlin, DE) Mathias Munschauer (Berlin, DE) Alexander Baltz (Berlin, DE)
Gao et al. C-BERST: Defining subnuclear proteomic landscapes at genomic elements with dCas9-APEX2 [preprint]
Gupta The human CCHC-type Zinc Finger Nucleic Acid Binding Protein (CNBP) binds to the G-rich elements in target mRNA coding sequences and promotes translation