ES3045482T3 - Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis - Google Patents

Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis

Info

Publication number
ES3045482T3
ES3045482T3 ES21867505T ES21867505T ES3045482T3 ES 3045482 T3 ES3045482 T3 ES 3045482T3 ES 21867505 T ES21867505 T ES 21867505T ES 21867505 T ES21867505 T ES 21867505T ES 3045482 T3 ES3045482 T3 ES 3045482T3
Authority
ES
Spain
Prior art keywords
dna
adapter
multifunctional
region
approximately
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES21867505T
Other languages
English (en)
Inventor
Jiannan Guo
Jennifer Hernandez
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Resolution Bioscience Inc
Original Assignee
Resolution Bioscience Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Resolution Bioscience Inc filed Critical Resolution Bioscience Inc
Application granted granted Critical
Publication of ES3045482T3 publication Critical patent/ES3045482T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La presente divulgación proporciona composiciones y métodos para la detección y el análisis multiplexados de ácidos nucleicos celulares. En algunas realizaciones, la presente divulgación proporciona adaptadores multifuncionales para su uso en los métodos de la presente divulgación. En algunas realizaciones, las composiciones y los métodos de la presente divulgación son automatizables. (Traducción automática con Google Translate, sin valor legal)

Description

[0001] DESCRIPCIÓN
[0003] Adaptadores y métodos para la construcción de bibliotecas genéticas y análisis genéticos de alta eficiencia
[0004] Campo de la descripción
[0006] La presente descripción se refiere a composiciones y métodos para la construcción de bibliotecas genéticas de alta eficiencia y a métodos de uso de las mismas. Las bibliotecas genéticas producidas utilizando las composiciones y métodos descritos en la presente memoria pueden utilizarse para realizar análisis genéticos.
[0008] Listado de secuencias
[0010] La presente solicitud contiene un Listado de Secuencias que se ha enviado electrónicamente en formato ASCII. Dicha copia ASCII, creada el 7 de septiembre de 2021, se denomina CLFK_006_01WO_SeqList_ST25 y tiene un tamaño de aproximadamente 20 KB.
[0012] Antecedentes
[0014] La secuenciación de nueva generación (NGS,Next Generation Sequencing)puede utilizarse en una variedad de entornos clínicos para identificar cambios genéticos. La NGS se divide aproximadamente en los elementos del proceso de preprocesamiento de muestras, preparación de bibliotecas, secuenciación y bioinformática. En la actualidad, el preprocesamiento de muestras y la preparación de bibliotecas son procesos muy laboriosos que, en su mayor parte, se realizan sin automatización. Los protocolos de preparación de bibliotecas suelen consistir en un proceso multietapa y requieren reactivos costosos y una dedicación práctica sustancial. Para abordar este cuello de botella en la NGS, es muy deseable contar con un método de NGS automatizado que permita la multiplexación de muestras, un alto rendimiento y una mayor sensibilidad.
[0016] En los documentos WO 2020/132316, WO 2019/140201 y WO 2018/140695 se describen métodos para amplificar y secuenciar secuencias específicas en una muestra de bajo volumen de entrada.
[0018] En el documento WO 2018/050722 se describen métodos para etiquetar moléculas de ácido nucleico individuales presentes en una muestra, que implican adaptadores diseñados para permitir la incorporación de un código de barras (etiqueta) por extensión.
[0020] Breve resumen
[0022] La invención se define en las reivindicaciones adjuntas.
[0024] La presente descripción proporciona un adaptador multifuncional que comprende a) un oligonucleótido de cadena de ligamiento y b) un oligonucleótido de cadena sin ligamiento que es capaz de hibridarse con una región en el extremo 3' del oligonucleótido de cadena de ligamiento y formar un dúplex con la misma; en donde el oligonucleótido de cadena de ligamiento, al entrar en contacto con un fragmento de ADN bicatenario (ADNbc) de una muestra, se liga al extremo 5' de cada cadena del fragmento 1 de ADNbc; en donde el oligonucleótido de cadena de ligamiento comprende (i) un saliente 3' terminal; (ii) una región de amplificación que comprende una secuencia de polinucleótidos capaz de servir como sitio de reconocimiento de cebadores; (iii) una región de ID multifuncional única; (iv) un multiplicador de identificador único de molécula (UMI, por las siglas del inglés,unique molecule identifier);y (v) una región de anclaje que comprende una secuencia de polinucleótidos que es al menos parcialmente complementaria al oligonucleótido cadena sin ligamiento; en donde el fragmento de ADNbc comprende un grupo fosfato en el extremo 5' de cada cadena y un saliente en el extremo 3' de cada cadena; en donde cada fragmento de ADNbc puede identificarse mediante la combinación de la región de ID multifuncional y el multiplicador de UMI; y en donde la muestra puede identificarse mediante la región de ID multifuncional.
[0026] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el oligonucleótido de la cadena de ligamiento comprende un saliente de dT en el extremo 3' y el fragmento de ADNbc comprende un saliente de dA en el extremo 3' de cada cadena.
[0028] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el oligonucleótido de la cadena de ligamiento comprende un saliente de dA en el extremo 3' y el fragmento de ADNbc comprende un saliente de dT en el extremo 3' de cada cadena.
[0030] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el oligonucleótido de la cadena de ligamiento comprende un saliente de dC en el extremo 3' y el fragmento de ADNbc comprende un saliente de dG en el extremo 3' de cada cadena.
[0032] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el oligonucleótido de la cadena de ligamiento comprende un saliente de dG en el extremo 3' y el fragmento de ADNbc comprende un saliente de dC en el extremo 3' de cada cadena.
[0033] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la región de amplificación en el oligonucleótido de cadena de ligamiento comprende una secuencia de polinucleótidos capaz de servir como sitio de reconocimiento de cebadores para la PCR, LAMP, NASBA, SDA, Rc A o LCR.
[0035] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el oligonucleótido de cadena sin ligamiento comprende una modificación en su extremo 3' que impide el ligamiento al extremo 5' del fragmento de ADNbc y/o la formación del dímero adaptador.
[0037] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la muestra se aísla o se obtiene de un mamífero. En algunas realizaciones, el mamífero es un modelo animal para una enfermedad humana. En algunas realizaciones, el mamífero es un ratón, una rata, una cobaya, un conejo, un cerdo, un gato, un perro, una oveja o un caballo. En algunas realizaciones, el mamífero es un primate no humano (PNH). En algunas realizaciones, el mamífero es un ser humano.
[0039] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la muestra se aísla o se obtiene de uno o más tipos de células. En algunas realizaciones, la muestra se aísla o se obtiene de uno o más tipos de tejido. En algunas realizaciones, la muestra se aísla o se obtiene de una o más fuentes. En algunas realizaciones, la una o más fuentes comprende(n) un donante. En algunas realizaciones, el donante es un ser humano. En algunas realizaciones, el donante es un donante sano o de control. En algunas realizaciones, una o más fuentes comprende(n) un paciente o sujeto (p. ej., de un ensayo clínico). En algunas realizaciones, el paciente o el sujeto es un ser humano. En algunas realizaciones, el paciente o el sujeto es un paciente o sujeto sano o de control. En algunas realizaciones, el paciente o el sujeto es un paciente o sujeto de prueba. En algunas realizaciones, el paciente o el sujeto presenta(n) un signo o síntoma de una enfermedad o trastorno. En algunas realizaciones, la paciente o sujeto está embarazada. En algunas realizaciones, el paciente o el sujeto presentan antecedentes familiares o un marcador genético de una enfermedad o trastorno.
[0041] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la muestra es una biopsia de tejido. En algunas realizaciones, la biopsia de tejido se toma de un tumor o de un tejido que se sospecha que es un tumor.
[0043] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el fragmento de ADNbc es A d N libre de células (ADNlc), ADN genómico (ADNg), ADN complementario (ADNc), ADN mitocondrial, ADN metilado o ADN desmetilado. En algunas realizaciones, el fragmento de ADNbc comprende uno o más de un ADN libre de células (ADNlc), un ADN genómico (ADNg), un ADN complementario (ADNc), un ADN mitocondrial, un ADN metilado y un ADN desmetilado. En algunas realizaciones, la muestra de ADNbc comprende ADN libre de células (ADNlc). En algunas realizaciones, el fragmento de ADNbc comprende un ADN genómico (ADNg). En algunas realizaciones, el fragmento de ADNbc comprende un ADN complementario (ADNc). En algunas realizaciones, el fragmento de ADNbc comprende un ADN mitocondrial. En algunas realizaciones, el fragmento de ADNbc comprende un ADN metilado. En algunas realizaciones, el fragmento de ADNbc comprende un ADN desmetilado.
[0045] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el ADNbc se aísla o se obtiene de una muestra o una muestra de ensayo. En algunas realizaciones, la muestra o la muestra de ensayo comprende una muestra biológica. En algunas realizaciones, la muestra biológica comprende un líquido biológico seleccionado del grupo que consiste en: líquido amniótico, sangre, plasma, suero, semen, líquido linfático, líquido cefalorraquídeo, líquido ocular, orina, saliva, heces, mucosa, y sudor. En algunas realizaciones, la muestra biológica o el líquido biológico comprende líquido amniótico. En algunas realizaciones, la muestra biológica o el líquido biológico comprende uno o más de sangre entera, plasma, capa leucoplaquetaria y suero. En algunas realizaciones, la muestra biológica o el líquido biológico comprenden líquido linfático. En algunas realizaciones, la muestra biológica o el líquido biológico comprende líquido cefalorraquídeo. En algunas realizaciones, la muestra biológica o el líquido biológico comprende orina. En algunas realizaciones, la muestra biológica o el líquido biológico comprende uno o más de saliva, heces, moco, lágrimas y sudor.
[0047] En algunas realizaciones de los adaptadores multifuncionales de la descripción, los fragmentos de ADNbc se obtienen mediante un método que comprende fragmentar el ADN genómico para producir al menos un fragmento de ADN. En algunas realizaciones, el método comprende, además, antes de la etapa de fragmentación, aislar el ADN genómico de una muestra que comprende al menos una célula. En algunas realizaciones, la fragmentación comprende poner en contacto el ADN genómico con al menos una enzima, en donde la enzima digiere el ADN genómico para producir al menos un fragmento de ADN. En algunas realizaciones, la fragmentación comprende aplicar tensión mecánica al ADN genómico para producir al menos un fragmento de ADN. En algunas realizaciones, la fragmentación comprende poner en contacto el ADN genómico con uno o más compuestos para romper químicamente uno o más enlaces del ADN genómico. En algunas realizaciones la tensión mecánica comprende someter a ultrasonido el ADN genómico para producir al menos un fragmento de ADN. En algunas realizaciones, después de la etapa de fragmentación, el método comprende, además, poner en contacto al menos un fragmento de ADN y una enzima, en donde la enzima digiere uno o ambos extremos del fragmento de ADN para producir un fragmento de ADN que comprende uno o más extremos romos. En algunas realizaciones, después de la etapa de fragmentación, el método comprende, además, unir una cola de adenina de ácido desoxirribonucleico (dA) a uno o ambos extremos romos del al menos un fragmento de ADN. En algunas realizaciones, después de la etapa de fragmentación, el método comprende, además, fosforilar uno o ambos extremos del al menos un fragmento de ADN.
[0048] En algunas realizaciones, después de la etapa de fragmentación, el método comprende, además, las etapas de unión de la cola y de fosforilación de forma simultánea o secuencial. En algunas realizaciones, después de la etapa de fragmentación, el método comprende, además, las etapas de unión de la cola y de fosforilación de forma secuencial. En algunas realizaciones, la etapa de unión de la cola sigue a la etapa de fosforilación. En algunas realizaciones, la etapa de fosforilación sigue a la etapa de unión de la cola.
[0050] En algunas realizaciones de los adaptadores multifuncionales de la descripción, los fragmentos de ADNbc se obtienen mediante las etapas que comprenden: (a) aislar el ADN genómico de la muestra de ensayo; y (b) fragmentar el ADN genómico para obtener el fragmento de ADN genómico. En algunas realizaciones, la etapa (b) se realiza poniendo en contacto el ADN genómico con al menos una enzima de digestión. En algunas realizaciones, la etapa (b) se realiza aplicando tensión mecánica al ADN genómico. En algunas realizaciones, la tensión mecánica se aplica sometiendo a ultrasonido el ADN genómico.
[0052] En algunas realizaciones de los adaptadores multifuncionales de la descripción, los fragmentos de ADNbc se obtienen mediante las etapas que comprenden: (a) aislar el ADN celular de la muestra de ensayo; y (b) fragmentar el ADN celular para obtener el fragmento de<a>D<n>genómico. En algunas realizaciones, la etapa (b) se realiza poniendo en contacto el ADN celular con al menos una enzima de digestión. En algunas realizaciones, la etapa (b) se realiza aplicando tensión mecánica al ADN celular. En algunas realizaciones, la tensión mecánica se aplica sometiendo a ultrasonido el ADN celular.
[0054] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la región de amplificación tiene una longitud de entre 10 y 50 nucleótidos. En algunas realizaciones, la región de amplificación tiene una longitud de entre 20 y 30 nucleótidos. En algunas realizaciones, la región de amplificación tiene una longitud de 25 nucleótidos.
[0056] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la región de ID multifuncional tiene una longitud de entre 3 y 50 nucleótidos. En algunas realizaciones, la región de ID multifuncional tiene una longitud de entre 3 y 15 nucleótidos. En algunas realizaciones, la región de ID multifuncional tiene una longitud de 8 nucleótidos.
[0058] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el multiplicador de UMI es adyacente a o está contenido en la región de ID multifuncional. En algunas realizaciones, el multiplicador de UMI tiene una longitud de entre 1 y 5 nucleótidos. En algunas realizaciones, el multiplicador de UMI tiene una longitud de 3 nucleótidos y comprende una de las 64 posibles secuencias de nucleótidos.
[0060] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la región de anclaje tiene una longitud de entre 1 y 50 nucleótidos. En algunas realizaciones, la región de anclaje tiene una longitud de entre 5 y 25 nucleótidos. En algunas realizaciones, la región de anclaje tiene una longitud de 10 nucleótidos.
[0062] En algunas realizaciones de los adaptadores multifuncionales de la descripción, una pluralidad de adaptadores multifuncionales se liga a una pluralidad de fragmentos de ADNbc.
[0064] En algunas realizaciones, los fragmentos de ADNbc se reparan en los extremos antes de ligarlos con una pluralidad de adaptadores multifuncionales.
[0066] En algunas realizaciones de los adaptadores multifuncionales de la descripción, las regiones de amplificación de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprenden una secuencia de nucleótidos idéntica. En algunas realizaciones, la secuencia de nucleótidos idéntica es un sitio de unión al cebador de la PCR.
[0068] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la región de ID multifuncional de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de entre 2 y 10.000 secuencias de nucleótidos únicas. En algunas realizaciones, la región de ID multifuncional de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de entre 50 y 500 secuencias de nucleótidos únicas. En algunas realizaciones, la región de ID multifuncional de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de entre 100 y 400 secuencias de nucleótidos únicas. En algunas realizaciones, la región de ID multifuncional de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de las 60 secuencias de nucleótidos únicas.
[0070] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la región de ID multifuncional de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales tiene una longitud de 8 nucleótidos.
[0072] En algunas realizaciones de los adaptadores multifuncionales de la descripción, cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de entre 64 y 2.560.000 secuencias de nucleótidos únicas.
[0074] En algunas realizaciones de los adaptadores multifuncionales de la descripción, cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de las 3840 secuencias de nucleótidos únicas, y cada secuencia de nucleótidos está separada de cualquier otra secuencia de las 3840 secuencias de nucleótidos únicas por una distancia de Hamming de al menos dos.
[0075] En algunas realizaciones de los adaptadores multifuncionales de la descripción, cada uno de la pluralidad de adaptadores multifuncionales comprende un multiplicador de UMI que es adyacente a o está contenido en la región de ID multifuncional.
[0077] En algunas realizaciones de los adaptadores multifuncionales de la descripción, el multiplicador de UMI de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales tiene una longitud de entre 1 y 5 nucleótidos. En algunas realizaciones, el multiplicador de UMI de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales tiene una longitud de 3 nucleótidos.
[0079] En algunas realizaciones de los adaptadores multifuncionales de la descripción, la región de anclaje de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de las cuatro secuencias de nucleótidos, y cada región de ID multifuncional de una secuencia dada puede emparejarse con cada una de las cuatro regiones de anclaje.
[0081] En algunas realizaciones de los adaptadores multifuncionales de la descripción, las regiones de amplificación de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprenden una secuencia de nucleótidos idéntica; en donde la región de ID multifuncional de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales tiene una longitud de 8 nucleótidos; en donde la secuencia de nucleótidos de cada región de ID multifuncional está separada de la secuencia de nucleótidos de cualquier otra región de ID multifuncional de la pluralidad de adaptadores multifuncionales por una distancia de Hamming de al menos dos; en donde cada uno de la pluralidad de adaptadores multifuncionales comprende un multiplicador de UMI que es adyacente a o está contenido en la región de ID multifuncional, en donde el multiplicador de UMI de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales tiene una longitud de tres nucleótidos, y en donde el multiplicador de UMI de cada una de las posibles secuencias de nucleótidos está emparejado con cada región de ID multifuncional de la pluralidad de adaptadores multifuncionales, en donde la región de anclaje de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de las cuatro secuencias de nucleótidos, y en donde cada región de ID multifuncional de una secuencia dada puede emparejarse con cada una de las cuatro regiones de anclaje.
[0083] La descripción proporciona un complejo que comprende un adaptador multifuncional y un fragmento de ADNbc, en donde el adaptador multifuncional se selecciona de uno cualquiera de los adaptadores multifuncionales descritos.
[0085] La descripción proporciona una pluralidad de adaptadores multifuncionales de la descripción. En algunas realizaciones, la pluralidad también puede denominarse grupo. En algunas realizaciones, la pluralidad de adaptadores multifuncionales comprende un conjunto de adaptadores aplicados a una muestra. En algunas realizaciones, dentro del conjunto de adaptadores aplicados a una muestra, cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales contiene una región de ID única o un UMI único. En algunas realizaciones, el número de adaptadores multifuncionales de la pluralidad de adaptadores multifuncionales puede aumentarse o disminuirse para adaptarse a la muestra o a la diana de ADN celular de la muestra. En algunas realizaciones, el número de adaptadores multifuncionales de la pluralidad de adaptadores multifuncionales puede aumentarse o disminuirse para corresponder al nivel de multiplexación requerido para detectar y o analizar una diana de ADN celular de la muestra. En algunas realizaciones, el número de adaptadores multifuncionales de la pluralidad de adaptadores multifuncionales puede aumentarse o disminuirse aumentando o disminuyendo el número de regiones de ID únicas o UMI únicos dentro de la pluralidad de adaptadores multifuncionales aplicados a una muestra. En algunas realizaciones, el número de adaptadores multifuncionales de la pluralidad de adaptadores multifuncionales puede aumentarse o disminuirse aumentando o disminuyendo el número de nucleótidos de la región de ID o de la región de anclaje.
[0087] La descripción proporciona un método para crear una biblioteca de ADN etiquetado con adaptador que comprende: (a) ligar una pluralidad de adaptadores multifuncionales con una pluralidad de fragmentos de ADNbc para generar una pluralidad de complejos de adaptador multifuncional/fragmento de ADNbc, en donde el adaptador multifuncional se selecciona de uno cualquiera de los adaptadores multifuncionales descritos; y (b) poner en contacto los complejos de adaptador multifuncional/fragmento de ADNbc de la etapa (a) con una o más enzimas para formar una biblioteca de ADN marcada con adaptador que comprende una pluralidad de fragmentos de ADNbc marcados con adaptador contiguos. En algunas realizaciones, cada complejo de adaptador multifuncional/fragmento de ADNbc de la pluralidad de complejos comprende un adaptador multifuncional ligado a cada extremo del fragmento de ADNbc.
[0089] En algunas realizaciones de los métodos de la descripción, el fragmento de ADNbc es ADN libre de células (ADNlc), ADN genómico (ADNg), ADN complementario (A<d>N<c>), ADN mitocondrial o ADN metilado o ADN desmetilado. En algunas realizaciones, el fragmento de ADNbc comprende uno o más de un ADN libre de células (ADNlc), un ADN genómico (ADNg), un ADN complementario (ADNc), un ADN mitocondrial, un ADN metilado y un ADN desmetilado. En algunas realizaciones, la muestra de ADNbc comprende ADN libre de células (ADNlc). En algunas realizaciones, el fragmento de ADNbc comprende un ADN genómico (ADNg). En algunas realizaciones, el fragmento de ADNbc comprende un ADN complementario (ADNc). En algunas realizaciones, el fragmento de ADNbc comprende un ADN mitocondrial. En algunas realizaciones, el fragmento de ADNbc comprende un ADN metilado. En algunas realizaciones, el fragmento de ADNbc comprende un ADN desmetilado.
[0090] En algunas realizaciones de los métodos de la descripción, la pluralidad de fragmentos de ADNbc se repara en sus extremos antes de ligarlos con una pluralidad de adaptadores multifuncionales.
[0092] En algunas realizaciones de los métodos de la descripción, la pluralidad de fragmentos de ADNbc se obtiene de una biblioteca seleccionada de la lista que consiste en una biblioteca de genoma completo con bajo número de pases, una biblioteca de amplicones, una biblioteca de exorna completo, una biblioteca de ADNc o una biblioteca de ADN metilado.
[0094] En algunas realizaciones de los métodos de la descripción, el oligonucleótido de la cadena sin ligamiento se desplaza del complejo adaptador multifuncional/fragmento de ADNbc.
[0096] En algunas realizaciones de los métodos de la descripción, la una o más enzimas comprenden una ligasa de ADN o una ligasa de ARN. En algunas realizaciones, la ligasa de ADN comprende una ligasa de ADN de T4 o una ligasa de ADN de Taq.
[0098] La descripción proporciona un método para crear una biblioteca de ADN etiquetado con adaptador que comprende: (a) ligar una pluralidad de adaptadores multifuncionales con una pluralidad de fragmentos de ADNbc para generar una pluralidad de complejos de adaptador multifuncional/fragmento de ADNbc, en donde el adaptador multifuncional se selecciona de uno cualquiera de los adaptadores multifuncionales descritos; y (b) poner en contacto los complejos de adaptador multifuncional/fragmento de ADNbc de la etapa (a) con una o más enzimas, para formar fragmentos de ADNbc contiguos etiquetados con adaptador; y amplificar los fragmentos de ADNbc contiguos etiquetados con adaptador para generar una biblioteca de ADN etiquetado con adaptador que comprende una pluralidad de fragmentos de ADNbc contiguos etiquetados con adaptador.
[0100] En algunas realizaciones de los métodos de la descripción, se utilizan uno o más cebadores para la amplificación. En algunas realizaciones, el uno o más cebadores comprenden una secuencia de unión al cebador universal que se hibrida con la región de unión al cebador del adaptador.
[0102] La descripción proporciona una biblioteca de ADN etiquetado con adaptador producida según uno cualquiera de los métodos descritos.
[0104] La descripción proporciona un método para crear una biblioteca de moléculas híbridas que comprende: (a) crear una biblioteca etiquetada con adaptador según uno cualquiera de los métodos descritos anteriormente; (b) hibridar la biblioteca de ADN etiquetado con adaptador con una o más sondas de captura multifuncionales para formar uno o más complejos de ADN etiquetado con sonda de captura/adaptador, en donde cada sonda de captura multifuncional comprende (i) una primera región capaz de hibridarse con un oligonucleótido compañero, en donde, opcionalmente, la primera región comprende una secuencia de cola que comprende un sitio de unión al cebador de la PCR; y (ii) una segunda región capaz de hibridarse con una región diana específica en la biblioteca de ADN genético etiquetada; (c) aislar el uno o más complejos de ADN etiquetado con sonda de captura/adaptador de la etapa (b), en donde cada complejo de ADN etiquetado con sonda de captura/adaptador aislado, comprende una sonda de captura y un fragmento de ADN marcado con adaptador; y (d) procesar enzimáticamente el uno o más complejos de sonda de captura/ADN etiquetado con adaptador aislados de la etapa (c) para generar una o más moléculas de ácido nucleico híbridas etiquetadas con adaptador (moléculas híbridas), en donde cada molécula híbrida comprende la sonda de captura y un complemento del fragmento de ADN etiquetado con adaptador que está en posición 3' desde donde la sonda de captura se hibridó con la secuencia genética diana. En algunas realizaciones, el método comprende, además, (e) realizar una PCR en las moléculas híbridas de la etapa (d) para generar una biblioteca genética dirigida que comprende moléculas híbridas amplificadas. En algunas realizaciones, el procesamiento enzimático de la etapa (d) comprende realizar una extensión de la sonda de captura en dirección 5'-3' con ADN polimerasa utilizando, como molde, el fragmento de ADN etiquetado con adaptador en el complejo.
[0106] En algunas realizaciones de uno cualquiera de los métodos descritos, al menos una sonda de captura se hibrida en dirección 3' de la secuencia genética diana y al menos una sonda de captura se hibrida en dirección 5' de la secuencia genética diana.
[0108] En algunas realizaciones de uno cualquiera de los métodos descritos, la sonda de captura comprende una secuencia de reconocimiento del cebador de secuenciación.
[0110] En algunas realizaciones, la descripción proporciona un complejo de ADN etiquetado con sonda de captura/adaptador producido según uno cualquiera de los métodos descritos.
[0112] En algunas realizaciones, la descripción proporciona una biblioteca de moléculas híbridas producida según uno cualquiera de los métodos descritos.
[0114] En algunas realizaciones, la descripción proporciona una biblioteca genética dirigida producida según uno cualquiera de los métodos descritos.
[0115] Algunas realizaciones de la descripción se refieren a un método que comprende realizar un análisis genético específico en una biblioteca de moléculas híbridas producida según uno cualquiera de los métodos descritos. En algunas realizaciones, el análisis genético específico es un análisis de secuencia. En algunas realizaciones, el análisis genético específico es un análisis del número de copias.
[0117] Algunas realizaciones de la descripción se refieren a un método que comprende realizar un análisis genético específico en una biblioteca genética diana producida según uno cualquiera de los métodos descritos. En algunas realizaciones, el análisis genético específico es un análisis de secuencia. En algunas realizaciones, el análisis genético específico es un análisis del número de copias.
[0119] En algunas realizaciones de uno cualquiera de los métodos descritos, se secuencia la región de la sonda de captura en la molécula híbrida. En algunas realizaciones de uno cualquiera de los métodos descritos, se secuencia toda la región de la sonda de captura en la molécula híbrida. En algunas realizaciones de uno cualquiera de los métodos descritos, se secuencia una parte de la región de la sonda de captura en la molécula híbrida.
[0121] Estos y otros aspectos se abordan con más detalle en la descripción detallada que se expone a continuación.
[0122] Breve descripción de los dibujos
[0124] La figura 1 es un diagrama esquemático que representa un adaptador multifuncional ilustrativo de la descripción. El adaptador multifuncional ilustrativo comprende, de 5' a 3', una región de amplificación de 25 nucleótidos, una región de ID de 8 nucleótidos, una región de multiplicador de UMI de 3 nucleótidos y una región de anclaje de 10 nucleótidos. El adaptador multifuncional también comprende un saliente de dT en el extremo 3'. La longitud de cada región del adaptador multifuncional puede modificarse como se describe a continuación.
[0126] La figura 2 es un diagrama esquemático que representa una realización del flujo de trabajo general de los métodos de la descripción. Las etapas de este flujo de trabajo se describirán con más detalle a continuación.
[0128] La figura 3 es un diagrama esquemático que representa un proceso ilustrativo para generar una biblioteca de ADN etiquetado con adaptador según algunas realizaciones de los métodos de la descripción. En la primer etapa, los extremos del ADNlc se reparan utilizando el módulo NEB Next Ultra II End Repair®/adición de cola de dA. Después, se añade una base al extremo 3' y los extremos 5' se fosforilan (etapa 2). La etapa 2 puede realizarse utilizando un termociclador. En la etapa 3, los adaptadores multifuncionales que tienen un saliente terminal dT en 3' se acoplan a cada uno de los extremos 5' y 3'. En una etapa opcional 4 (no mostrada), pueden utilizarse perlas de afinidad para separar los fragmentos y adaptadores no ligados de las cadenas de ADN ligadas al adaptador. En algunas realizaciones, el método pasa directamente de la etapa 3 a la etapa 5 de amplificación. En esta etapa, la enzima Ultra II Q5® extiende los salientes de los fragmentos para crear una biblioteca bicatenaria y amplifica los fragmentos utilizando un ciclo de amplificación estándar. Opcionalmente, se puede realizar una etapa de extensión adicional de 3 minutos al principio para permitir el llenado de los salientes en los extremos 5' y 3' de los fragmentos.
[0130] Las figuras 4A-4C proporcionan una serie de diagramas esquemáticos y una tabla que compara un proceso comparador (no diseñado para ser automatizable) de generación de una biblioteca de ADN etiquetado con adaptador con un proceso automatizable de generación de una biblioteca de ADN etiquetado con adaptador según los métodos de la descripción. La figura 4A representa las etapas realizadas en el proceso comparador, así como los reactivos utilizados y los programas del termociclador. La figura 4B representa las etapas realizadas en el proceso automatizable, así como los reactivos utilizados y los programas de termociclador. La figura 4C proporciona datos de profundidad de una muestra ilustrativa de ADNlc de tipo natural(wildtype),así como de dos muestras de control, procesadas utilizando cada uno de los procesos, el comparador y el automatizable. También se muestra en aumento porcentual de profundidad cuando se utiliza el proceso automatizable.
[0132] La figura 5 es un diagrama esquemático que representa un método ilustrativo para la preparación y amplificación de bibliotecas de ADN etiquetado con adaptador según algunas realizaciones de los métodos de la descripción.
[0134] La figura 6 es un diagrama esquemático que representa la hibridación y extensión de la sonda de captura según algunas realizaciones de los métodos de la descripción.
[0136] La figura 7 es un diagrama esquemático que representa la amplificación de bibliotecas diana (capturadas) según algunas realizaciones de los métodos de la descripción.
[0138] La figura 8 es un diagrama esquemático que compara la molécula adaptadora, la “ molécula híbrida” y el amplicón de secuenciación (para la NGS). La molécula adaptadora comprende, de 5' a 3', una región de amplificación de 25 nucleótidos, una región de ID de 8 nucleótidos, una región de multiplicador de UMI de 3 nucleótidos, una región de anclaje de 10 nucleótidos y un saliente de dT en el extremo 3'. La molécula híbrida comprende, de 5' a 3', un cebador directo (FP,forwardprimer),una región adaptadora (que comprende una región de amplificación, una región de ID, una región de multiplicador de UMI y una región de anclaje), un fragmento de biblioteca, una sonda de captura multifuncional (MCP,multifunctional capture probe)y un cebador inverso (RP,reverse primer).El FP y el RP se utilizan para la amplificación de la molécula híbrida. Como se muestra en la figura, para la lectura 1 de secuenciación, la secuenciación se inicia al comienzo de la región de amplificación y avanza en sentido 5' a 3' a lo largo del amplicón de secuenciación. Para la lectura 2, la secuenciación se inicia al final de la sonda de captura multifuncional y avanza en sentido 3' a 5' a lo largo del amplicón de secuenciación.
[0140] La figura 9 es un gráfico que representa la distribución de anclajes y adaptadores de los procesos comparador y automatizable.
[0142] Las figuras 10A-10B proporcionan un par de gráficos que representan la unión de alta eficiencia de los adaptadores a los fragmentos de<a>D<n>en un proceso ilustrativo de construcción de bibliotecas de ADNlc. La figura 10A proporciona datos de perfiles gráficos(traces)del instrumento Bioanalyzer del ADNfc de entrada; la figura 10B proporciona datos de perfiles gráficos del instrumento Bioanalyzer de ADNlc después de la construcción de la biblioteca, que indican que la mayor parte (> 50 %) del ADNlc comprende 2 códigos de barras (adaptadores).
[0144] Descripción detallada
[0146] Las composiciones y métodos de la presente descripción resuelven una necesidad previamente sentida desde hace tiempo, pero insatisfecha de detección y secuenciación multiplexada de ácidos nucleicos, así como un proceso automatizable para aumentar la eficiencia del proceso en su conjunto, lo que permite análisis de alto rendimiento. Las composiciones y métodos de la descripción pueden utilizarse con varios procesos de secuenciación de nueva generación (NGS).
[0148] La velocidad y precisión de los procesos automatizables de preparación y secuenciación de bibliotecas de ADN son particularmente importantes para la detección y el diagnóstico rápidos de enfermedades en estadio avanzado, incluido el cáncer, y para la detección temprana de enfermedades sumamente infecciosas antes de su transmisión. Una enfermedad genética puede tratarse, o incluso prevenirse, desde su inicio, si se detecta de forma rápida y precisa. Además, la monitorización de la eficacia del tratamiento a menudo requiere resultados rápidos y precisos para rastrear biomarcadores del avance de la enfermedad o la remisión de la misma.
[0150] La descripción proporciona adaptadores y métodos para la construcción de alta eficiencia de bibliotecas genéticas y análisis genéticos que permiten la automatización. Además de los análisis con fines de diagnóstico, los métodos y composiciones de la descripción pueden utilizarse en el análisis de cualquier muestra de ácido nucleico. Como ejemplo, los métodos y composiciones de la descripción pueden utilizarse en la secuenciación a escala poblacional de una o más especies para identificar la variación genética a nivel de población, por ejemplo, para abordar cuestiones en los campos de la investigación evolutiva, agrícola y biológica.
[0152] Particularmente en aquellas circunstancias en las que las reacciones altamente multiplexadas en un gran número de muestras se realizarían de manera óptima en paralelo, las composiciones y los métodos de la descripción proporcionan la eficiencia para realizar análisis en una gran población de muestras, por ejemplo, para rastrear los orígenes de una enfermedad o infección.
[0154] Las composiciones y métodos de la descripción están diseñados para minimizar las etapas requeridas para detectar y analizar fragmentos de ácido nucleico. Asimismo, las composiciones y métodos de la descripción están diseñados para simplificar la manipulación de las muestras de una etapa a otra, permitiendo en algunas circunstancias que se produzcan múltiples etapas de forma secuencial en el mismo recipiente de reacción. Además, las composiciones y métodos de la descripción pueden utilizarse en volúmenes de reacción más pequeños en comparación con otros procesos comerciales, reduciendo así la dilución del material genético. Esto es particularmente importante cuando el material genético de partida es escaso o limitado, por ejemplo, cuando se utiliza ADN libre de células (ADNlc) (también denominado ADN extracelular [o libre] circulante) o<a>D<n>antiguo.
[0156] En algunas realizaciones, la descripción proporciona diseños de adaptadores y métodos de uso de los mismos que permiten la detección de múltiples tipos de cambios en el ADN, incluyendo (pero sin limitación) cambios en el número de copias, variantes de un solo nucleótido (SNV,single nucleotide variants),inserciones y deleciones(indels)cortas (inferiores a 40 pb) y reordenamientos genómicos, por ejemplo fusiones de genes tales como fusiones, inversiones y translocaciones de genes oncogénicos.
[0158] En algunas realizaciones, la descripción proporciona métodos para preparar bibliotecas de ADN etiquetado según un flujo de trabajo simplificado. Estos métodos son particularmente útiles para el procesamiento y la automatización de alto rendimiento, por ejemplo, utilizando robótica de manipulación de muestras para la preparación de bibliotecas de NGS, el enriquecimiento de los locus genéticos de interés mediante procesos de captura específicos, la secuenciación de los materiales genéticos y para los análisis genéticos.
[0160] El uso de las composiciones descritas en los métodos descritos es sorprendentemente eficaz para aumentar la eficiencia de la clonación, mejorar la distribución uniforme de los adaptadores y mejorar el rendimiento en términos de mayor profundidad/cobertura de las lecturas de secuencias, así como de los equivalentes genómicos.
[0161] Como resultado, los métodos proporcionados en la presente descripción tienen al menos las siguientes propiedades superiores, en comparación con los flujos de trabajo estándar (tales como los flujos de trabajo no automatizables): número reducido de etapas, menor tiempo de procesamiento, menor riesgo de error del operario, número reducido de reactivos, volúmenes de reacción más pequeños y menor coste, lo que hace factible la comercialización y automatización de dichos métodos y flujos de trabajo.
[0163] En algunas realizaciones de los métodos de esta descripción, los métodos se denominan procesos automatizables. Aunque las composiciones y los métodos de la descripción están diseñados para su uso en un dispositivo automatizado, no es necesario que las composiciones y los métodos de la descripción estén automatizados y, para mayor claridad, también podrían realizarse por medios no automatizados o en dispositivos no automatizados. Para proporcionar una base de comparación, la descripción proporciona un proceso “ comparador"’ — un proceso que no está diseñado específicamente para la automatización o para su uso con un dispositivo automatizado. Cuando se alinean, por ejemplo, con el proceso comparador de la descripción, los procesos “automatizables” de la descripción eliminan varias etapas al tiempo que conservan el resultado deseado de una detección y un análisis de ácidos nucleicos multiplexados.
[0165] En algunas realizaciones de las composiciones y métodos de la descripción, la reparación de extremos se realiza en una sola etapa; el ligamiento con adaptador se realiza en una sola etapa; y la extensión y amplificación de los fragmentos de ADN etiquetados con adaptador se realiza en una sola etapa. En algunas realizaciones, el proceso automatizable también reduce el tiempo de preparación de la biblioteca, reduce la cantidad de reactivos utilizados y reduce el volumen de las reacciones. En particular, la reducción del volumen de reacción facilita la automatización porque puede realizarse un volumen de reacción más pequeño en placas de microtitulación o en tiras de tubos que pueden manipular robots de muestreo. La figura 4A-4C proporciona diagramas esquemáticos que describen un proceso comparador ilustrativo para generar una biblioteca de ADN etiquetado con adaptador y un proceso automatizable de la descripción para generar una biblioteca de ADN etiquetado con adaptador de la descripción.
[0166] Definiciones
[0168] A menos que se defina lo contrario en la descripción, los términos científicos y técnicos utilizados en la presente solicitud tendrán los significados que entienden comúnmente los expertos en la técnica. Generalmente, las técnicas y nomenclatura utilizadas en relación con la química, biología molecular, biología celular y del cáncer, inmunología, microbiología, farmacología y química de proteínas y ácidos nucleicos descritas en la descripción, son las que se conocen bien y se utilizan comúnmente en la materia.
[0170] Como se utiliza en la descripción, los siguientes términos tienen los significados que se les asignan, salvo que se especifique lo contrario.
[0172] Los artículos “ un” , “ uno(a)” y “el/la” , se utilizan en la descripción para referirse a uno o a más de uno (es decir, al menos uno) del objeto gramatical del artículo. Como ejemplo, “ un elemento” significa un elemento o más de un elemento.
[0174] El uso de la alternativa (p. ej., “ o” ) debe entenderse que significa una, ambas o cualquier combinación de las alternativas.
[0176] El término “ y/o” debe entenderse que significa una o ambas de estas alternativas.
[0178] Como se utiliza en la descripción, el término “aproximadamente” o “ alrededor de” se refiere a una cantidad, nivel, valor, número, frecuencia, porcentaje, dimensión, tamaño, cantidad, peso o longitud que varía hasta en un 15 %, 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 % o 1 % con respecto a una cantidad, nivel, valor, número, frecuencia, porcentaje, dimensión, tamaño, cantidad, peso o longitud de referencia. En algunas realizaciones, el término “aproximadamente” o “alrededor de” se refiere a un intervalo de cantidad, nivel, valor, número, frecuencia, porcentaje, dimensión, tamaño, cantidad, peso o longitud ± 15 %, ± 10 %, ± 9 %, ± 8 %, ± 7 %, ± 6 %, ± 5 %, ± 4 %, ± 3 %, ± 2 % o ± 1 % sobre una cantidad, nivel, valor, número, frecuencia, porcentaje, dimensión, tamaño, cantidad, peso o longitud de referencia.
[0180] Como se utiliza en la descripción, el término “ aislado” significa material que está sustancial o esencialmente exento de los componentes que normalmente lo acompañan en su estado originario. En algunas realizaciones, el término “ obtenido” o “ derivado” se utiliza como sinónimo de aislado.
[0182] Un “ sujeto” , “ individuo” o “ paciente” , como se utiliza en la presente memoria, incluye cualquier animal que presente un síntoma de una afección que pueda detectarse o identificarse con las composiciones contempladas en la presente descripción. Los sujetos adecuados incluyen animales de laboratorio (como ratones, ratas, conejos, o conejillos de Indias), animales de granja (como caballos, vacas, ovejas, cerdos) y animales domésticos o mascotas (como un gato o un perro). En algunas realizaciones, el sujeto es un mamífero. En algunas realizaciones, el sujeto es un primate no humano y, en realizaciones preferidas, el sujeto es un ser humano.
[0184] Las frases transitorias tales como “ que comprende” , “ consiste esencialmente en” y “ que consiste en” , toman las definiciones habituales descritas en el Manual de procedimiento de examen de patentes de la Oficina de Patentes y Marcas de los Estados Unidos (véase MPEP 2111.03).
[0185] Diseño del adaptador
[0187] Para lograr capacidades de alto rendimiento susceptibles de automatización (por ejemplo, utilizando robótica de manipulación de muestras), los adaptadores y los métodos relacionados de la descripción incluyen, en algunas realizaciones, las siguientes características: (i) unión en una sola etapa; (ii) unión de alta eficiencia; (iii) distribución uniforme de los adaptadores; (iv) acomodación de la multiplexación e identificación de muestras; (v) elevado número de identificadores únicos de molécula (UMI). Por ejemplo, algunas realizaciones de los adaptadores y métodos de la descripción proporcionan lo siguiente:
[0189] Unión en una sola etapa: En algunas realizaciones, el adaptador multifuncional de longitud completa puede unirse al fragmento de ADN en una sola etapa. Un adaptador multifuncional de “ longitud completa” puede comprender al menos 4 regiones: una primera región de amplificación que comprende una secuencia de polinucleótidos capaz de servir como un sitio de reconocimiento de cebadores, una segunda región de ID multifuncional que comprende un identificador único de molécula (UMI), una tercera región que comprende un multiplicador de UMI y una cuarta región que comprende una región de anclaje. La unión de un adaptador multifuncional de longitud completa puede eliminar la necesidad del ligamiento del adaptador de forma escalonada, donde primero se une el anclaje y después se unen las otras regiones del adaptador (véase, por ejemplo, la forma escalonada de ligamiento del adaptador en el proceso comparador de la Figura 4A).
[0191] Unión de alta eficiencia: En algunas realizaciones, los adaptadores multifuncionales pueden unirse a los fragmentos de ADN con alta eficiencia. Para los fines de la presente descripción, la eficiencia de la unión del adaptador se refiere a la tasa de conversión de los fragmentos de ADN de entrada en moléculas de la biblioteca de ADN etiquetado con adaptador. Por ejemplo, un fragmento de ADN puede identificarse mediante la región de ID de un adaptador unido, y un fragmento de ADN no sería identificable utilizando la región de ID si no estuviera unido a un adaptador. En consecuencia, una mayor eficiencia de la unión del adaptador puede reducir el número de fragmentos de ADN de entrada perdidos en el proceso de conversión de la biblioteca. Esto es particularmente útil en situaciones en las que la cantidad de ADN disponible es limitada, por ejemplo, en muestras analizadas en relación con muchas aplicaciones oncológicas y otras enfermedades genéticas (p. ej., esclerosis múltiple, artritis reumatoide, enfermedad de Alzheimer). En dichas situaciones, la aparición de alteraciones del ADN (p. ej., variantes de un solo nucleótido (SNV), indeles, cambios en el número de copias, reordenamientos del ADN, opcionalmente relacionados con tumores/cánceres) es normalmente poco frecuente y, por lo tanto, pueden ser difíciles de detectar. La unión altamente eficiente de los adaptadores de la descripción a estos fragmentos de ADN puede facilitar la captura de tales variaciones poco frecuentes. En algunas realizaciones, al menos el 50 % de los fragmentos de ADN de entrada se convierten en moléculas de la biblioteca de ADN etiquetado con adaptador mediante la unión de adaptadores multifuncionales. La figura 10 proporciona datos de la unión de alta eficiencia de adaptadores a fragmentos de ADN en un proceso ilustrativo de construcción de bibliotecas de ADNlc.
[0193] Distribución uniforme del adaptador: El análisis bioinformático puede analizar el rendimiento de la sonda dentro de la muestra y el rendimiento de la sonda entre muestras. La fluctuación del rendimiento entre los grupos de adaptadores en las muestras puede afectar negativamente a la sensibilidad del análisis. Es deseable una distribución uniforme de los adaptadores en las bibliotecas de ADN etiquetado y en las bibliotecas de sondas de captura, medida mediante lecturas de secuencia. En algunas realizaciones, existe la posibilidad de un sesgo en la distribución de los adaptadores en la biblioteca de ADN etiquetado con adaptador, donde algunos adaptadores pueden ser menos eficientes a la hora de ligarse a los fragmentos de ADN o pueden amplificarse de manera menos eficiente en comparación con los otros del conjunto de adaptadores. Esto puede dar lugar a menos amplicones y a menos lecturas de esos adaptadores menos eficientes durante la secuenciación. Aunque dicha distribución sesgada puede tolerarse o compensarse aumentando la cantidad de adaptadores menos eficientes en el conjunto de adaptadores para proporcionar una representación más equilibrada de los adaptadores en la biblioteca de ADN etiquetado y las lecturas de secuenciación, las composiciones y los métodos de la descripción proporcionan la opción de eliminar dicha compensación. Los adaptadores y métodos descritos en la presente memoria pueden proporcionar el beneficio inesperado de lograr una distribución uniforme de los adaptadores, en donde cada adaptador se representa aproximadamente en la misma proporción en los resultados de secuenciación. Esta distribución uniforme del adaptador proporciona una mayor sensibilidad.
[0195] En algunas realizaciones, la distribución uniforme de los adaptadores puede realizarse teniendo múltiples tipos de regiones de anclaje, todas ellas representadas en cada grupo de adaptadores.
[0197] En algunas realizaciones, la distribución uniforme de los adaptadores puede realizarse seleccionando aleatoriamente regiones de ID únicas (cada región de ID identifica tanto la muestra como el fragmento de ADN unido a la misma) en cada conjunto de adaptadores.
[0199] [0092] Acomodación de la multiplexación e identificación de muestras: Para lograr la multiplexación de muestras (es decir, la capacidad de procesar diferentes muestras simultáneamente), en algunas realizaciones, se construyen conjuntos de adaptadores únicos donde cada adaptador único dentro del mismo conjunto se une a la misma muestra. Desde la perspectiva del recuento de secuencias, es beneficioso que cada adaptador único del conjunto de adaptadores posea un comportamiento esencialmente idéntico al de todos los demás adaptadores del conjunto. Para lograr esto, en algunas realizaciones, cada región de ID tiene una distancia de Hamming de 2 entre la región de ID y cualquier otra región de ID, lo que reduce la posibilidad de que una lectura se asigne falsamente a la muestra incorrecta. En algunas realizaciones, cada conjunto de adaptadores se divide en conjuntos adicionales que se emparejan con regiones de anclaje específicas, lo que permite reducir aún más la posibilidad de un error en la desmultiplexación de las muestras. Por ejemplo, en una etiqueta de octomérica(8mer)con una distancia de Hamming de 2, el número total de secuencias posibles es de 16.384. El término “ emparejado” cuando se utiliza con respecto a dos secuencias de polinucleótidos diferentes o regiones de ADN que comprenden diferentes secuencias de polinucleótidos, significa que las dos secuencias de polinucleótidos diferentes o regiones de ADN que comprenden diferentes secuencias de polinucleótidos están presentes en el mismo polinucleótido. Por ejemplo, si se dice que una región de ID particular del ADN está emparejada con una región de amplificación particular del ADN, se entiende que la región de ID y la etiqueta de amplificación están presentes en la misma molécula de polinucleótido de ADN.
[0201] Gran cantidad de identificadores únicos de molécula (UMI): Aunque en general es beneficioso que los adaptadores sean funcionalmente equivalentes desde una perspectiva de biología molecular, también es deseable que los adaptadores posean un número muy grande de identificadores únicos de molécula (UMI) (> 10.000) que aumenten la identificación de fragmentos genómicos únicos. En este contexto, por “ aumentar” se entiende que se incrementa el poder de identificar un fragmento derivado de forma única. Cada fragmento de clon genómico tiene un par de sitios de fragmentación particulares que corresponden a la posición en la secuencia genómica en la que se escindió el ADN bicatenario. Este sitio de escisión puede utilizarse para diferenciar clones genómicos únicos, ya que es probable que cada clon posea un sitio de escisión diferente. Sin embargo, en bibliotecas que poseen miles de clones independientes, los fragmentos derivados de forma única a menudo pueden poseer exactamente los mismos sitios de escisión. Los clones genómicos (es decir, fragmentos) que comparten el mismo sitio de escisión pueden clasificarse como únicos o redundantes con respecto a otras secuencias de clones derivadas de la misma muestra. Al unir adaptadores que introducen una gran diversidad de etiquetas de secuencia, es más probable que diferentes clones genómicos que comparten el mismo sitio de escisión se identifiquen como únicos. En algunas realizaciones, el UMI se crea mediante una combinación de la región de ID multifuncional con el multiplicador de UMI. Es decir, cada fragmento de ADN único puede identificarse mediante la combinación de la región de ID multifuncional y el multiplicador de UMI (es decir, identificarse mediante el UMI). Además, la combinación del UMI y el sitio de escisión crea un elemento identificador molecular único (UMIE,unique molecular identifer element),que facilita la clasificación de las lecturas de secuencia como lecturas redundantes o lecturas únicas. Algunas realizaciones contemplan que el multiplicador de UMI pueda comprender secuencias más largas o más cortas para aumentar o reducir la complejidad global del UMI. En algunas realizaciones, cada fragmento de ADN único puede identificarse únicamente mediante la región de ID multifuncional.
[0203] Los términos “ adaptador” , “ adaptador multifuncional” y “ módulo adaptador” pueden utilizarse indistintamente y se refieren a un oligonucleótido corto monocatenario o bicatenario que se puede ligar a un extremo de una molécula de ADN o ARN. Normalmente, los adaptadores descritos en la presente memoria comprenden al menos cinco elementos: (i) un saliente 3' terminal; (ii) una región de amplificación que comprende una secuencia de polinucleótidos capaz de servir como sitio de reconocimiento de cebadores; (iii) una región de ID multifuncional única; (iv) un multiplicador de identificador único de molécula (UMI); y (v) una región de anclaje que comprende una secuencia de polinucleótidos que es al menos parcialmente complementaria al oligonucleótido de cadena sin ligamiento. La figura 1 proporciona una composición ilustrativa de un adaptador multifuncional según algunas realizaciones como se describe en la presente memoria (solo se muestra el oligonucleótido de la cadena de ligamiento).
[0205] En algunas realizaciones, el adaptador comprende una o más regiones de amplificación, una o más regiones de ID multifuncionales, uno o más multiplicadores de UMI y una o más regiones de anclaje. En algunas realizaciones, el adaptador comprende, en orden de 5' a 3', una región de amplificación, una región de ID multifuncional, un multiplicador de UMI, una región de anclaje y un saliente 3' terminal.
[0207] En algunas realizaciones, el multiplicador de UMI está contenido dentro de la región de ID multifuncional, y el adaptador comprende, en orden de 5' a 3', una región de amplificación, una región de ID/región de multiplicador de UMI multifuncional integrada, una región de anclaje y un saliente terminal 3'.
[0209] En algunas realizaciones, el adaptador multifuncional comprende una o más regiones de amplificación, una o más regiones de ID, uno o más multiplicadores de UMI, una o más regiones de anclaje y uno o más nucleótidos en el saliente 3' que son sustratos de ligamiento eficaces. En realizaciones adicionales, el módulo adaptador comprende además uno o más sitios de unión al cebador de secuenciación.
[0211] La estructura de los adaptadores ilustrativos que puede utilizarse en las composiciones y métodos de la descripción, se proporciona en las Tablas 2 y 3. Por ejemplo, en algunas realizaciones, la cadena de ligamiento de un adaptador puede comprender la siguiente estructura: Región de ID de AMP/Multiplicador de UMI-ACGTATGCCA (Id. de sec. n.°: 2)-3'dT. En algunas realizaciones, la cadena de ligamiento de un adaptador puede comprender la siguiente estructura: Región de ID de AMP/Multiplicador de UMI CTAGCGTTAC (Id. de sec. n.°: 3)-3'dT. En algunas realizaciones, la cadena de ligamiento de un adaptador puede comprender la siguiente estructura: Región de ID de AMP/Multiplicador de UMI-GATCGACATG (Id. de sec. n.°: 4)-3'dT. En algunas realizaciones, la cadena de ligamiento de un adaptador puede comprender la siguiente estructura: Región de ID de AMP/Multiplicador de UMI-TGCATCAGGT (Id. de sec. n.°: 5) - 3'dT. En algunas realizaciones, la región de anclaje de la cadena sin ligamiento de un adaptador puede comprender la secuencia TGGCATACGT (Id. de sec. n.°: 6). En algunas realizaciones, la región de anclaje de la cadena sin ligamiento de un adaptador puede comprender la secuencia GTAACGCTAG_(Id. de sec. n.°: 7). En algunas realizaciones, la región de anclaje de la cadena sin ligamiento de un adaptador puede comprender la secuencia CATGTCGATC (Id. de sec. n.°: 8). En algunas realizaciones, la región de anclaje de la cadena sin ligamiento de un adaptador puede comprender la secuencia ACCTGATGCA (Id. de sec. n.°: 9).
[0212] En algunas realizaciones, un adaptador puede comprender una cadena de ligamiento con un saliente de dT en 3'. En algunas realizaciones, la cadena de ligamiento con un saliente de dT en 3' puede comprender una cualquiera de las secuencias mostradas en la Tabla 3. Por ejemplo, la cadena de ligamiento con un saliente de dT en 3' puede comprender una secuencia de una cualquiera de las Id. de sec. n.°: 10 a 69. En estas secuencias de cadena de ligamiento, “ NNN” representa un multiplicador de UMI de 3 nucleótidos en donde cada N puede seleccionarse de uno cualquiera de A, G, C o T. En algunas realizaciones, la cadena de ligamiento con un saliente de dT en 3' puede comprender una secuencia de una cualquiera de las Id. de sec. n.°: 10 a 69 con 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más sustituciones de nucleótidos.
[0213] Oligonucleótido de cadena de ligamiento
[0214] Las expresiones “oligonucleótido de cadena de ligamiento” y “cadena de ligamiento” , se utilizan indistintamente.
[0215] La descripción proporciona, en algunas realizaciones, un oligonucleótido de cadena de ligamiento que comprende (i) un saliente 3' terminal; (ii) una región de amplificación que comprende una secuencia de polinucleótidos capaz de servir como sitio de reconocimiento de cebadores; (iii) una región de ID multifuncional única; (iv) un multiplicador de identificador único de molécula (UMI); y (v) una región de anclaje que comprende una secuencia de polinucleótidos que es al menos parcialmente complementaria al oligonucleótido de cadena sin ligamiento.
[0216] En algunas realizaciones, el oligonucleótido de cadena de ligamiento no está fosforilado en el extremo 5'.
[0217] En algunas realizaciones, el oligonucleótido de cadena de ligamiento tiene una longitud de entre aproximadamente 30 nucleótidos y aproximadamente 70 nucleótidos. En algunas realizaciones, el oligonucleótido de cadena de ligamiento tiene una longitud de entre aproximadamente 35 y aproximadamente 65 nucleótidos, entre aproximadamente 40 y aproximadamente 60 nucleótidos, o entre aproximadamente 40 y aproximadamente 50 nucleótidos. En algunas realizaciones, el oligonucleótido de cadena de ligamiento tiene una longitud de aproximadamente 47 nucleótidos.
[0218] En algunas realizaciones, el oligonucleótido de cadena de ligamiento tiene una longitud de entre 30 nucleótidos y 70 nucleótidos. En algunas realizaciones, el oligonucleótido de cadena de ligamiento tiene una longitud de entre 35 y 65 nucleótidos, entre 40 y 60 nucleótidos o entre 40 y 50 nucleótidos. En algunas realizaciones, el oligonucleótido de cadena de ligamiento tiene una longitud de 47 nucleótidos.
[0219] Cadena sin ligamiento
[0220] Las expresiones “oligonucleótido de cadena sin ligamiento” y “cadena sin ligamiento” , se utilizan indistintamente.
[0221] El oligonucleótido de cadena sin ligamiento es capaz de hibridarse con una región en el extremo 3' del oligonucleótido de cadena de ligamiento y formar un dúplex con la misma. La cadena sin ligamiento es complementaria a al menos una parte de la cadena de ligamiento para formar el dúplex. Esta estructura dúplex puede facilitar el ligamiento del extremo 5' del ADNbc con la cadena de ligamiento.
[0222] En algunas realizaciones, la cadena sin ligamiento no está fosforilada. La ausencia de fosforilación de la cadena no ligada puede impedir que la cadena no ligada se una al extremo 3' del fragmento de ADN y puede reducir la formación de dímeros adaptadores.
[0223] En algunas realizaciones, la cadena sin ligamiento puede comprender opcionalmente una modificación en su extremo 3' que impide el ligamiento con el extremo 5' del fragmento de ADNbc y/o la formación de dímeros adaptadores. En algunas realizaciones, la muestra es una modificación química.
[0224] Saliente 3' terminal
[0225] La expresión “ saliente 3' terminal” se refiere a uno o más salientes o colas de nucleótidos en el extremo 3' de un polinucleótido.
[0226] En algunas realizaciones, el oligonucleótido de cadena de ligamiento comprende un saliente de dT en el extremo 3'.
[0227] En algunas realizaciones, el saliente 3' terminal (p. ej., una cola de dT) ayuda al ligamiento de la cadena de ligamiento para ligarse con el extremo 5' del fragmento de ADN, con el fin de lograr un ligamiento eficiente del adaptador multifuncional con el fragmento de ADN que tiene un saliente complementario (p. ej., un saliente/cola de dA).
[0228] Región de amplificación
[0229] La expresión “ región de amplificación” se refiere a un elemento de la molécula adaptadora que comprende una secuencia de polinucleótidos capaz de servir como un sitio de reconocimiento de cebadores. El sitio de reconocimiento de cebadores puede ser para cualquier cebador que sea adecuado para cualquier amplificación conocida en la materia, tal como los métodos descritos en Fakruddin y col. “ Nucleic acid amplification: Alternative methods of polymerase chain reaction”JPharm BioalliedSci.octubre-diciembre de 2013; 5(4): 245-252. Por ejemplo, dichos métodos de amplificación pueden incluir PCR (reacción en cadena de la polimerasa), LAMP (amplificación isotérmica mediada por bucle), NASBA (amplificación basada en secuencias de ácidos nucleicos), SDA (amplificación por desplazamiento de cadena), RCA (amplificación por círculo rodante), LCR (reacción en cadena de la ligasa).
[0231] En algunas realizaciones, un adaptador comprende una región de amplificación que comprende una o más secuencias de reconocimiento de cebadores para la amplificación con un solo cebador de una biblioteca de ADN. En algunas realizaciones, la región de amplificación comprende una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez o más secuencias de reconocimiento de cebadores para la amplificación con un solo cebador de una biblioteca de ADN. En algunas realizaciones, la región de amplificación comprende un sitio de unión a un cebador de PCR para un cebador ACA2 (Id. de sec. n.°: 70).
[0233] En algunas realizaciones, la región de amplificación tiene una longitud de entre aproximadamente 5 y aproximadamente 50 nucleótidos, entre aproximadamente 10 y aproximadamente 45 nucleótidos, entre aproximadamente 15 y aproximadamente 40 nucleótidos, o entre aproximadamente 20 y aproximadamente 30 nucleótidos. En algunas realizaciones, la región de amplificación tiene una longitud de aproximadamente 10 nucleótidos, aproximadamente 11 nucleótidos, aproximadamente 12 nucleótidos, aproximadamente 13 nucleótidos, aproximadamente 14 nucleótidos, aproximadamente 15 nucleótidos, aproximadamente 16 nucleótidos, aproximadamente 17 nucleótidos, aproximadamente 18 nucleótidos, aproximadamente 19 nucleótidos, aproximadamente 20 nucleótidos, aproximadamente 21 nucleótidos, aproximadamente 22 nucleótidos, aproximadamente 23 nucleótidos, aproximadamente 24 nucleótidos, aproximadamente 25 nucleótidos, aproximadamente 26 nucleótidos, aproximadamente 27 nucleótidos, aproximadamente 28 nucleótidos, aproximadamente 29 nucleótidos, aproximadamente 30 nucleótidos, aproximadamente 31 nucleótidos, aproximadamente 32 nucleótidos, aproximadamente 33 nucleótidos, aproximadamente 34 nucleótidos, aproximadamente 35 nucleótidos, aproximadamente 36 nucleótidos, aproximadamente 37 nucleótidos, aproximadamente 38 nucleótidos, aproximadamente 39 nucleótidos o aproximadamente 40 nucleótidos o más. En algunas realizaciones, la región de amplificación tiene una longitud de aproximadamente 25 nucleótidos.
[0235] En algunas realizaciones, la región de amplificación tiene una longitud de entre 5 y 50 nucleótidos, entre 10 y 45 nucleótidos, entre 15 y 40 nucleótidos o entre 20 y 30 nucleótidos. En algunas realizaciones, la región de amplificación tiene una longitud de 10 nucleótidos, 11 nucleótidos, 12 nucleótidos, 13 nucleótidos, 14 nucleótidos, 15 nucleótidos, 16 nucleótidos, 17 nucleótidos, 18 nucleótidos, 19 nucleótidos, 20 nucleótidos, 21 nucleótidos, 22 nucleótidos, 23 nucleótidos, 24 nucleótidos, 25 nucleótidos, 26 nucleótidos, 27 nucleótidos, 28 nucleótidos, 29 nucleótidos, 30 nucleótidos, 31 nucleótidos 32 nucleótidos, 33 nucleótidos, 34 nucleótidos, 35 nucleótidos, 36 nucleótidos, 37 nucleótidos, 38 nucleótidos, 39 nucleótidos o 40 nucleótidos o más. En algunas realizaciones, la región de amplificación tiene una longitud de 25 nucleótidos.
[0237] Región de ID multifuncional
[0239] Las expresiones “ región de ID multifuncional” y “ región de ID” se utilizan indistintamente y se refieren a un elemento del adaptador que comprende una secuencia de polinucleótidos que identifica de forma única el fragmento de ADN particular, así como la muestra de la que deriva.
[0241] En algunas realizaciones, la región de ID multifuncional tiene una longitud de entre aproximadamente 3 y aproximadamente 50 nucleótidos, entre aproximadamente 3 y aproximadamente 25 nucleótidos, o entre aproximadamente 5 y aproximadamente 15 nucleótidos. En una realización, la región de ID multifuncional tiene una longitud de aproximadamente 3 nucleótidos, aproximadamente 4 nucleótidos, aproximadamente 5 nucleótidos, aproximadamente 6 nucleótidos, aproximadamente 7 nucleótidos, aproximadamente 8 nucleótidos, aproximadamente 9 nucleótidos, aproximadamente 10 nucleótidos, aproximadamente 11 nucleótidos, aproximadamente 12 nucleótidos, aproximadamente 13 nucleótidos, aproximadamente 14 nucleótidos, aproximadamente 15 nucleótidos, aproximadamente 16 nucleótidos, aproximadamente 17 nucleótidos, aproximadamente 18 nucleótidos, aproximadamente 19 nucleótidos o aproximadamente 20 nucleótidos. En algunas realizaciones, la región de ID multifuncional tiene una longitud de aproximadamente 8 nucleótidos.
[0243] En algunas realizaciones, la región de ID multifuncional tiene una longitud de entre 3 y 50 nucleótidos, entre 3 y 25 nucleótidos o entre 5 y 15 nucleótidos. En algunas realizaciones, la región de ID multifuncional tiene una longitud de 3 nucleótidos, 4 nucleótidos, 5 nucleótidos, 6 nucleótidos, 7 nucleótidos, 8 nucleótidos, 9 nucleótidos, 10 nucleótidos, 11 nucleótidos, 12 nucleótidos, 13 nucleótidos, 14 nucleótidos, 15 nucleótidos, 16 nucleótidos, 17 nucleótidos, 18 nucleótidos, 19 nucleótidos, 20 nucleótidos o más. En algunas realizaciones, la región de ID multifuncional tiene una longitud de 8 nucleótidos.
[0244] En algunas realizaciones, la región de ID multifuncional comprende una de entre aproximadamente 2 y aproximadamente 10.000 secuencias de nucleótidos únicas, entre aproximadamente 50 y aproximadamente 500 secuencias de nucleótidos únicas, o entre aproximadamente 100 y aproximadamente 400 secuencias de nucleótidos únicas. En algunas realizaciones, la región de ID multifuncional de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de aproximadamente 60 secuencias de nucleótidos únicas.
[0245] En algunas realizaciones, la región de ID multifuncional comprende una de entre 2 y 10.000 secuencias de nucleótidos únicas, entre 50 y 500 secuencias de nucleótidos únicas o entre 100 y 400 secuencias de nucleótidos únicas. En algunas realizaciones, la región de ID multifuncional de cada adaptador multifuncional de la pluralidad de adaptadores multifuncionales comprende una de las 60 secuencias de nucleótidos únicas.
[0246] En algunas realizaciones, el adaptador multifuncional comprende una de entre 64 y 2.560.000 secuencias de nucleótidos únicas.
[0247] En algunas realizaciones, se proporcionan conjuntos preespecificados (una pluralidad) de adaptadores. Dichos conjuntos preespecificados se utilizan para representar una sola muestra. Es decir, cada secuencia adaptadora en cada conjunto de oligonucleótidos adaptadores es distinta de cada secuencia adaptadora en cualquier otro conjunto utilizado para identificar otras muestras. Un experto en la técnica reconocerá que el número de oligonucleótidos distintos en conjuntos preespecificados que son posibles para los oligonucleótidos adaptadores dependerá de la longitud de la región de ID multifuncional y/o del multiplicador de UMI. “ Pluralidad” puede referirse a una pluralidad del mismo módulo adaptador o a un conjunto de diferentes módulos adaptadores.
[0248] En algunas realizaciones, la región de ID identifica la muestra individual, por ejemplo, la fuente de la biblioteca genómica. En algunas realizaciones, a cada muestra se le asigna una pluralidad (conjunto preespecificado) de entre aproximadamente 64 y aproximadamente 2,5 millones de adaptadores únicos. En algunas realizaciones, a cada muestra se le asigna una pluralidad (conjunto preespecificado) de entre 64 y 2,5 millones de adaptadores únicos. En algunas realizaciones, a cada muestra se le asigna una pluralidad (conjunto preespecificado) de aproximadamente 3.840 adaptadores únicos. En algunas realizaciones, a cada muestra se le asigna una pluralidad (conjunto preespecificado) de 3.840 adaptadores únicos. En algunas realizaciones, a cada muestra se le asigna una pluralidad (conjunto preespecificado) de entre aproximadamente 1 y aproximadamente 60 adaptadores únicos. En algunas realizaciones, a cada muestra se le asigna una pluralidad (conjunto preespecificado) de entre 1 y 60 adaptadores únicos. En algunas realizaciones, a cada muestra se le asigna una pluralidad (conjunto preespecificado) de 60 adaptadores únicos, en donde cada conjunto preespecificado de 60 adaptadores únicos se divide además en 4 conjuntos (comprendiendo cada conjunto 15 adaptadores únicos), en donde cada región de ID multifuncional de un conjunto se empareja con una de las 4 secuencias de anclaje. Por lo tanto, la muestra puede identificarse mediante la combinación de la región de ID multifuncional y la región de anclaje.
[0249] En algunas realizaciones, la secuencia de nucleótidos de cada región de ID multifuncional está separada de la secuencia de nucleótidos de cualquier otra región de ID multifuncional de la pluralidad de adaptadores multifuncionales a una distancia de Hamming de al menos dos (lo que significa que se requieren al menos dos cambios de bases para cambiar una región de ID por otra).
[0250] En algunas realizaciones, la región de ID identifica el fragmento de ADN individual al que está unido, por lo que las regiones de ID también sirven como etiquetas de fragmentos que pueden, en un ejemplo, enumerar la diversidad de clones para el análisis del número de copias.
[0251] En algunas realizaciones, la región de ID multifuncional tiene una longitud de 8 nucleótidos y comprende una de las 240 secuencias de nucleótidos únicas, y el multiplicador de UMI tiene una longitud de 3 secuencias de nucleótidos, por lo que el número total de secuencias adaptadoras únicas sería de 240 x 43= 3.840= 15.360. Por lo tanto, en algunas realizaciones, a cada muestra se le puede asignar un conjunto de adaptadores que varía de 1~ 15.360 adaptadores únicos para la identificación de fragmentos de ADN.
[0252] En algunas realizaciones, la región de ID multifuncional tiene una longitud de 8 nucleótidos y comprende una de las 60 secuencias de nucleótidos únicas, y el multiplicador de UMI tiene una longitud de 3 nucleótidos, y cada secuencia de nucleótidos está separada de cualquier otra secuencia de las 3840 secuencias de nucleótidos únicas a una distancia de Hamming de al menos dos.
[0253] Por lo tanto, la región de ID multifuncional contribuye a la identificación tanto de la muestra como del fragmento de ADN. Esto contrasta marcadamente con los sistemas actuales que se utilizan en la técnica, que utilizan una etiqueta generada al azar para identificar la secuencia y un código de barras o una indexación por secuenciador independiente para permitir la multiplexación de muestras.
[0254] Multiplicador de UMI
[0255] [0128] Para aumentar aún más la diversidad de posibles etiquetas de secuencia (UMI), se incluyen multiplicadores de UMI en los adaptadores. Un multiplicador de UMI es una secuencia corta de bases aleatorias (por ejemplo, NNN, en donde cada N puede seleccionarse de una cualquiera de A, C, G y T) que, cuando se combina con una UMI, aumenta la diversidad y el número total de secuencias adaptadoras en un conjunto de adaptadores. En algunas realizaciones, un adaptador comprende un multiplicador de UMI, en donde el multiplicador de UMI es adyacente a o está contenido en la región de ID. En algunas realizaciones, un adaptador comprende una región de ID que tiene una longitud de ocho nucleótidos y un multiplicador de UMI que tiene una longitud de tres nucleótidos. En algunas realizaciones, el multiplicador de UMI tiene una longitud de tres nucleótidos y comprende una de las 64 secuencias posibles. En algunas realizaciones, el multiplicador de UMI está ubicado adyacente o contenido dentro de la región de ID.
[0257] En algunas realizaciones, cada posición nucleotídica del multiplicador de UMI puede comprender una cualquiera de adenina, guanina, citosina o timina. Por lo tanto, en algunas realizaciones, un multiplicador de UMI que comprende un número n de nucleótidos, puede comprender cualquiera de las 4n secuencias de nucleótidos posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de un nucleótido y comprende una de las cuatro secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de dos nucleótidos y comprende una de las dieciséis secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de tres nucleótidos y comprende una de las 64 secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de cuatro nucleótidos y comprende una de las 256 secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de cinco nucleótidos y comprende una de las 1.024 secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de seis nucleótidos y comprende una de las 4.096 secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de siete nucleótidos y comprende una de las 16.384 secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de ocho nucleótidos y comprende una de las 65.536 secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de nueve nucleótidos y comprende una de las 262.144 secuencias posibles. En algunas realizaciones, el multiplicador de UMI tiene una longitud de diez o más nucleótidos y comprende una de las 1.048.576 o más secuencias posibles.
[0259] En algunas realizaciones, el multiplicador de UMI tiene una longitud de al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9 o al menos 10 nucleótidos. En algunas realizaciones, el multiplicador de UMI tiene una longitud de entre 1 y 5 nucleótidos.
[0261] Región de anclaje
[0263] Las expresiones “ región de anclaje” y “ secuencia de anclaje” se utilizan indistintamente y se refieren a una secuencia de polinucleótidos que es al menos parcialmente complementaria al oligonucleótido de cadena sin ligamiento. En algunas realizaciones, a la región de anclaje también se la denomina enlazador. La región de anclaje puede, en algunas realizaciones, comprender una o más de las siguientes propiedades: (1) cada secuencia de anclaje forma parte de un conjunto de dos o más tipos de anclaje únicos que representan en conjunto cada una de las cuatro posibles bases de ADN en cada sitio dentro de la extensión; esta característica, la representación de bases equilibrada, es útil para calibrar el llamado de bases adecuado en las lecturas de secuenciación en realizaciones particulares. El número total de tipos de secuencias de anclaje debe coincidir con el número total de modos de detección. Por ejemplo, en la secuenciación de Illumina® se detectan cuatro colores, por lo que pueden utilizarse cuatro tipos de secuencias de anclaje. Para lograr la máxima sensibilidad, puede utilizarse cada modo de detección. Las composiciones y métodos de la descripción pueden utilizarse en cualquier modo de detección conocido en la técnica, incluyendo, pero sin limitación, la detección basada en luz, la detección basada en enzimas y la detección magnética.
[0265] (2) Cada secuencia de anclaje puede estar compuesta por solo dos de las cuatro bases posibles, y estas se eligen específicamente para que sean un número igual de A C o un número igual de G T; una secuencia de anclaje formada a partir de solo dos bases reduce la posibilidad de que la secuencia de anclaje participe en la formación de una estructura secundaria que impediría la función adaptadora adecuada.
[0267] (3) Dado que cada secuencia de anclaje está compuesta por números iguales de A+C o G+T, cada secuencia de anclaje puede compartir aproximadamente la misma temperatura de fusión y estabilidad de dúplex que cualquier otra secuencia de anclaje del conjunto.
[0269] (4) Cada tipo de secuencia de anclaje (que termina en A/T/G/C) puede distribuirse aproximadamente por igual en las lecturas de secuenciación, por ejemplo, en cantidades aproximadamente equimolares (es decir, aproximadamente el 25 % del conjunto tiene secuencias adaptadoras que terminan en A, aproximadamente el 25 % que terminan en T, aproximadamente el 25 % que terminan en G y aproximadamente el 25 % que terminan en C).
[0271] En algunas realizaciones, los módulos adaptadores se mezclan con fragmentos de ADN en cantidades equimolares de adaptadores que contienen diferentes tipos de anclaje (por ejemplo, cantidades equimolares de anclaje 1, anclaje 2, anclaje 3, anclaje 4) para proporcionar una distribución de adaptadores más uniforme. Las secuencias de anclaje ilustrativas incluyen, aunque sin limitación: Anclaje 1 ACGTATGCCA (Id. de sec. n.°: 2); Anclaje 2 CTAGCGTTAC (Id. de sec. n.°: 3); Anclaje 3 G<a>T<c>GACATG (Id. de sec. n.°: 4); y Anclaje 4 T<g>CATCAGGT (Id. de sec. n.°: 5).
[0273] En algunas realizaciones, las secuencias adaptadoras terminan con un nucleótido T en el extremo 3' (saliente T en 3'). En algunas realizaciones, los adaptadores tienen TT como los 2 últimos nucleótidos del extremo 3'. En algunas realizaciones, los adaptadores tienen AT, CT o GT como los 2 últimos nucleótidos del extremo 3'.
[0274] En general, una distribución ideal de los tipos de anclaje daría como resultado que cada tipo de anclaje tuviera un mismo porcentaje de distribución (es decir, 100 % dividido entre el número de tipos de anclaje), lo que daría como resultado una distribución “ uniforme” de diferentes adaptadores que comprenden diferentes anclajes entre todos los fragmentos de ADN. Por ejemplo, una distribución ideal de cuatro tipos de anclaje daría como resultado una distribución de aproximadamente 25 % de cada tipo de anclaje. En algunas realizaciones, las secuencias de anclaje de un conjunto dado tienen un porcentaje de distribución de entre aproximadamente 5 % y aproximadamente 75 % (es decir, el % de distribución del tipo de anclaje menos frecuente es de aproximadamente 5 % y el % de distribución del tipo de anclaje más frecuente es de aproximadamente 75 %). En algunas realizaciones, cada secuencia de anclaje de un conjunto dado tiene un % de distribución de aproximadamente 50 %, aproximadamente 34 %, aproximadamente 28 %, aproximadamente 27 %, aproximadamente 23 %, aproximadamente 14 % o aproximadamente 9 %. En algunas realizaciones, el porcentaje de distribución de cada secuencia de anclaje de un proceso automatizable, como se describe en la presente memoria, es de al menos un 5 %, al menos un 10 %, al menos un 25 % o al menos un 20 % más cercano al porcentaje de distribución ideal correspondiente en comparación con un proceso de comparación (es decir, un proceso que no está diseñado para la automatización, véase la Tabla 4).
[0276] En algunas realizaciones, la pluralidad de adaptadores comprende un saliente de dT en 3' y puede incluir cantidades más altas de adaptadores que tienen anclajes con TT como los dos últimos 2 nucleótidos del extremo 3'. Dichos adaptadores pueden ser 1, 2, 4, 5, 6, 7, 8, 9 o más de 10 veces la cantidad de otros tipos de anclaje en el conjunto, lo que da como resultado una distribución más uniforme de los adaptadores en las lecturas de secuenciación.
[0278] En algunas realizaciones, la pluralidad de adaptadores puede comprender más de una secuencia de anclaje. Por ejemplo, una pluralidad de adaptadores puede contener 4 secuencias de anclaje diferentes que se utilizan simultáneamente. Estas secuencias de anclaje también pueden utilizarse durante la desmultiplexación de muestras para reducir errores. Además, la posición de las secuencias dentro de la lectura es fija y, por lo tanto, las regiones de ID y el anclaje deben tener una posición fija dentro de una lectura de secuenciación para pasar los filtros de inclusión para su consideración en dirección 3'.
[0280] En algunas realizaciones, la región de anclaje tiene una longitud de entre 1 y 50 nucleótidos. En algunas realizaciones, la región de anclaje tiene una longitud de entre 4 y 40 nucleótidos. En algunas realizaciones, la región de anclaje tiene una longitud de entre 5 y 25 nucleótidos. En algunas realizaciones, la región de anclaje tiene una longitud de al menos 4 nucleótidos, al menos seis nucleótidos, al menos 8 nucleótidos, al menos 10 nucleótidos, al menos 12 nucleótidos, al menos 14 nucleótidos o al menos 16 nucleótidos. En algunas realizaciones, la región de anclaje tiene una longitud de 10 nucleótidos.
[0282] Flujo de trabajo ilustrativo
[0284] A continuación, se proporciona un flujo de trabajo ilustrativo de los métodos de la descripción y se representa en la figura 2.
[0286] 1. Reparación de extremos
[0288] En algunas realizaciones, los fragmentos de ADN de entrada se convierten en “fragmentos de ADN reparados en los extremos” , de modo que los fragmentos de ADN reparados en los extremos poseen grupos fosfato en 5' y dA en 3' salientes de nucleótidos en una sola mezcla de reacción (una sola etapa). Puede utilizarse un kit disponible en el comercio (por ejemplo, el módulo NEB Ultra II End Repair®/adición de cola de dA, E7546L) para reparar los extremos de los fragmentos de ADN o pueden combinarse una o más de las enzimas y tampones individuales descritos para la preparación de fragmentos de ADN reparados en los extremos que poseen grupos fosfato en 5' y salientes de nucleótidos de dA en 3'.
[0290] En algunas realizaciones, el volumen de reacción para reparación de extremos es inferior a 50 pl.
[0292] 2. Ligamiento con adaptador
[0294] En algunas realizaciones, un conjunto de adaptadores multifuncionales se liga a fragmentos de ADNbc reparado en los extremos de una o más muestras (multiplexación), lo que da como resultado en la unión del adaptador al extremo 5' de los fragmentos de ADNbc.
[0296] En algunas realizaciones, el volumen de la reacción de ligamiento es inferior a 100 pl.
[0298] En algunas realizaciones, los fragmentos de ADN etiquetado con adaptador se aíslan y se lavan en volúmenes de reacción inferiores a 100 pl.
[0300] 3. Extensión
[0302] [0144] En algunas realizaciones, los fragmentos de ADN con cola de dA en 3' se extienden desde el extremo 3' del fragmento de ADN, desplazando la cadena sin ligamiento utilizando, como molde, la cadena de ligamiento que está unida al extremo 5' del fragmento de ADN para producir fragmentos de ADNbc etiquetados con adaptador contiguos que son adecuados para la amplificación. La colección de “ fragmentos de ADNbc contiguos marcados con adaptador” es la biblioteca de ADN etiquetado con adaptador no amplificada. La figura 3 proporciona un diagrama esquemático que representa un proceso de generación ilustrativo de la biblioteca de ADN etiquetado con adaptador según algunos métodos de la descripción.
[0304] En algunas realizaciones, el volumen de la reacción de extensión es inferior a 100 pl.
[0306] 4. Amplificación
[0308] En algunas realizaciones, la biblioteca de ADN etiquetado con adaptador no amplificada se amplifica por PCR con un cebador único que reconoce el sitio de unión del cebador de amplificación en la región de amplificación del adaptador, lo que da como resultado una biblioteca de ADN etiquetado con adaptador amplificada. En algunas realizaciones, el cebador único comprende la secuencia de la Id. de sec. n.°: 70. Para los fines de la presente descripción, las expresiones “ biblioteca de ADN etiquetado con adaptador amplificada” , “ biblioteca de ADN etiquetado amplificada” y “ biblioteca de productos amplificada (LPA,library product amplified)”se utilizan indistintamente. La figura 5 proporciona un diagrama esquemático que representa la preparación y amplificación de bibliotecas de ADN etiquetado con adaptador según los métodos de la descripción.
[0310] En algunas realizaciones, el volumen de reacción de amplificación es inferior a 100 pl.
[0312] En algunas realizaciones, la biblioteca de ADN etiquetado amplificada se aísla y se lava adicionalmente en volúmenes inferiores a 100 pl.
[0314] En algunas realizaciones, la amplificación se lleva a cabo según las condiciones proporcionadas en la Tabla 7. Por ejemplo, en algunas realizaciones, los métodos descritos en la presente memoria comprenden: 1) llevar a cabo la amplificación de una biblioteca que se había dividido en 2 tubos distintos a una temperatura de hibridación de 69 °C; 2) llevar a cabo la amplificación de una biblioteca que se había dividido en 2 tubos distintos a una temperatura de hibridación de 65 °C; o 3) llevar a cabo la amplificación sin dividir la biblioteca (en 1 tubo) a una temperatura de hibridación de 65 °C.
[0316] 5. Captura y aislamiento de uno o más locus genéticos
[0318] En algunas realizaciones, una sonda de captura multifuncional con su región de cola (primera región) que forma un dúplex al menos parcialmente con un oligonucleótido compañero biotinilado, se hibrida con la biblioteca de ADN etiquetado amplificada para formar uno o más complejos de a Dn etiquetado con sonda de captura/adaptador.
[0320] 6. Aislamiento de complejo de módulo de sonda de captura de moléculas de ADN etiquetado amplificadas
[0321] En algunas realizaciones, los complejos de ADN etiquetado con sonda de captura/adaptador (es decir, los fragmentos capturados) se separan de los fragmentos no hibridados (es decir, los fragmentos no capturados) utilizando perlas magnéticas de estreptavidina.
[0323] 7. Extensión de la sonda de captura
[0325] En algunas realizaciones, las sondas de captura soportadas en perlas del complejo se extienden desde el extremo 3' utilizando, como molde, los fragmentos de ADN etiquetado, creando moléculas de ácido nucleico híbridas etiquetadas con adaptador (moléculas híbridas), en donde cada molécula híbrida comprende la sonda de captura y un complemento del fragmento de ADN etiquetado con adaptador que está en 3' desde donde la sonda de captura se hibridó con la secuencia genética específica.
[0327] En algunas realizaciones, la desnaturalización libera la molécula híbrida de la perla magnética a la solución. La figura 6 proporciona un diagrama esquemático que representa la hibridación y extensión de la sonda de captura.
[0329] 8. Amplificación de moléculas híbridas
[0331] En algunas realizaciones, un cebador directo (FP) (Id. de sec. n.°: 71) se hibrida con el sitio de unión del cebador en la región de amplificación de la etiqueta adaptadora dentro de las moléculas híbridas y extiende en dirección 5' -> 3' la sonda de captura utilizando la molécula híbrida como molde para formar una molécula híbrida bicatenaria contigua.
[0333] En algunas realizaciones, la cadena extendida con FP en la molécula híbrida bicatenaria contigua se desnaturaliza y un cebador inverso (RP) (Id. de sec. n.°: 72) se hibrida con una molécula/cadena extendida con FP desnaturalizada en la región de cola del módulo de sonda de captura incorporado en la molécula híbrida.
[0335] [0156] En algunas realizaciones, el RP se extiende en dirección 5' -> 3' utilizando la molécula híbrida como molde para crear una molécula híbrida bicatenaria contigua que esté lista para la secuenciación de Illumina® o la secuenciación mediante cualquier otro método conocido en la materia. La figura 7 proporciona un diagrama esquemático que representa la amplificación de bibliotecas diana (capturadas).
[0336] En algunas realizaciones, los cebadores de secuenciación son diferentes entre sí. En algunas realizaciones, cada extremo de la molécula híbrida incluye preferiblemente un sitio de unión al cebador de secuenciación que es reconocido por un cebador de secuenciación, tal como los cebadores de secuenciación P5 y P7, u otros cebadores de secuenciación de Illumina®. La colección de moléculas híbridas amplificadas listas para la secuenciación se denomina “ biblioteca genética diana” , “ biblioteca diana” o “ biblioteca capturada por sonda (PCL,Probe Captured Librar/)” .
[0337] En algunas realizaciones, el volumen de reacción de amplificación es inferior a 100 pl.
[0338] En algunas realizaciones, las moléculas híbridas amplificadas se aíslan y se lavan.
[0339] 9. Secuenciación
[0340] En algunas realizaciones, la secuenciación de nueva generación (NGS) de las moléculas híbridas amplificadas se realiza utilizando el secuenciador Illumina® NextSeq® 550.
[0341] En algunas realizaciones, la NGS puede realizarse en la biblioteca de ADN etiquetado con adaptador no amplificada, la biblioteca de ADN etiquetado amplificada, la biblioteca de moléculas híbridas (biblioteca dirigida no amplificada) y/o la biblioteca dirigida amplificada.
[0342] En algunas realizaciones, se realiza una lectura 1 de secuenciación (151 nt de longitud) y una lectura 2 de secuenciación (17 nt de longitud) utilizando cebadores de secuenciación directa e inversa hechos a medida.
[0343] La secuenciación se realizó en el Illumina NextSeq550, siguiendo las instrucciones del fabricante, utilizando cebadores personalizados, Cebador de Sec. Directo y Cebador de Sec. Inverso 62. Cebador de Sec Directo:
[0344] CAAGCAGAAGACGGCATACGAGATGTGACTGGCACGGGACCAGAGAATTCGAATACA (Id. de sec. n.°: 73) Cebador de Sec Inverso 62:
[0345] GTGACTGGCACGGGACCAGAGAATTCGAATACA (Id. de sec. n.°: 74)
[0346] 10. Análisis genético
[0347] En algunas realizaciones, las moléculas híbridas, o cualquiera de las moléculas generadas según los métodos de la descripción, que pueden someterse a secuenciación (utilizando cebadores de amplificación o cebadores de secuenciación), se someten a análisis genético.
[0348] En algunas realizaciones, las lecturas 1 y 2 de secuencia se utilizan para el análisis genético.
[0349] En algunas realizaciones, el análisis bioinformático se realiza para identificar variantes genéticas, tales como números de copias, SNV, indeles, reordenamientos de genes y cromosomas.
[0350] Métodos detallados
[0351] 1. Preparación de bibliotecas de ADN etiquetado con adaptador
[0352] En algunas realizaciones, los métodos contemplados en la descripción comprenden generar una biblioteca de a Dn etiquetado con adaptador que comprende tratar los fragmentos de ADNbc con una o más enzimas reparadoras de extremos para generar ADN reparado en los extremos y unir uno o más adaptadores a cada extremo del ADN reparado en los extremos para generar la biblioteca de ADN etiquetado con adaptador.
[0353] Preparación de muestras de ADN
[0354] Como se utiliza en la descripción, el término “ADN” se refiere a ácido desoxirribonucleico. En algunas realizaciones, el término ADN se refiere a ADN genómico, ADN recombinante, ADN sintético o ADNc. En algunas realizaciones, ADN se refiere a ADN genómico o a ADNc. En algunas realizaciones, el DNA comprende una “ región diana” . Las bibliotecas de ADN contempladas en la presente memoria incluyen bibliotecas de ADN genómico y bibliotecas de ADNc construidas a partir de ARN, p. ej., una biblioteca de expresión de ARN. En algunas realizaciones, las bibliotecas de ADN comprenden una o más secuencias y/o etiquetas de ADN adicionales.
[0355] [0169] Como se utiliza en la descripción, con frecuencia, los términos “ADN circulante” , “ADN circulante libre de células” y “ADN libre de células” , se utilizan indistintamente y se refieren a ADN que es ADN extracelular, a ADN que se ha extrudido de las células o a ADN que se ha liberado de células necróticas o apoptóticas. Este término se utiliza a menudo en contraste con “ADN genómico celular” o “ADN celular” , que se utilizan indistintamente en la presente memoria y se refieren a ADN genómico que está contenido dentro de la célula (es decir, la nucleasa) y que solo es accesible mediante técnicas de biología molecular tales como las descritas en la presente memoria, mediante la lisis o la alteración de la integridad de la célula.
[0357] Las composiciones y métodos proporcionados en la descripción son particularmente adecuados para la preparación de valiosas muestras biológicas que normalmente se obtienen en pequeñas cantidades, tales como muestras de biopsia de tejido canceroso o muestras de “ biopsia de líquidos” que normalmente son fluidos (p. ej., orina, líquido LCR, sangre entera, plasma, saliva).
[0359] En algunas realizaciones, la cantidad de ADN utilizada para crear una biblioteca puede ser cualquier cantidad adecuada. En algunas realizaciones, la cantidad es de entre aproximadamente 1 pg y aproximadamente 500 ng, entre aproximadamente 1 ng y aproximadamente 400 ng, entre aproximadamente 5 ng y aproximadamente 300 ng, entre aproximadamente 10 ng y aproximadamente 250 ng o de entre aproximadamente 20 ng y aproximadamente 200 ng. En algunas realizaciones, la cantidad de ADN es de entre aproximadamente 5 ng y aproximadamente 50 ng.
[0361] En algunas realizaciones, la cantidad de ADN utilizada para crear una biblioteca puede ser cualquier cantidad adecuada. En algunas realizaciones, la cantidad es de entre 1 pg y 500 ng, entre 1 ng y 400 ng, entre 5 ng y 300 ng, entre 10 ng y 250 ng o de entre 20 ng y 200 ng. En algunas realizaciones, la cantidad de ADN es de entre 5 ng y 50 ng.
[0363] En algunas realizaciones, los métodos y composiciones contemplados en la descripción utilizan ADNbc que se selecciona de ADN libre de células (ADNlc), ADN genómico (ADNg), ADN complementario (ADNc), ADN mitocondrial, ADN metilado o ADN desmetilado.
[0365] En algunas realizaciones, los métodos de análisis genético contemplados en la presente memoria comprenden generar una biblioteca de ADNlc que comprende tratar ADNlc o ADN genómico celular fragmentado con una o más enzimas reparadoras de extremos para generar ADN reparado en los extremos y unir uno o más adaptadores a cada extremo del ADN reparado en los extremos para generar la biblioteca de ADN.
[0367] En algunas realizaciones, los métodos y composiciones contemplados en la presente memoria están diseñados para analizar, detectar, diagnosticar y/o monitorizar de manera eficiente en el número de copias utilizando, como analito, ADN genómico. En algunas realizaciones, el análisis del número de copias se realiza generando una biblioteca de ADN genómico a partir de ADN genómico obtenido de una muestra de ensayo, p. ej., una muestra biológica tal como una biopsia de tejido. En algunas realizaciones, el ADN genómico es ADN circulante o libre de células. En realizaciones preferidas, el ADN genómico es ADN genómico celular.
[0369] En algunas realizaciones, el ADN genómico se obtiene de una muestra de tejido o biopsia tomada de un tejido, incluyendo, aunque sin limitación, tejido de médula ósea, esófago, estómago, duodeno, recto, colon, íleon, páncreas, pulmón, hígado, próstata, cerebro, nervios, tejido meníngeo, renal, endometrial, cervicouterino, mamario, de ganglio linfático, músculo y piel. En algunas realizaciones, la muestra de tejido es una biopsia de un tumor o de una sospecha de tumor. En algunas realizaciones, el tumor es canceroso o se sospecha que es canceroso. En algunas realizaciones, la muestra de tejido comprende células cancerosas o células que se sospechosa que son cancerosas.
[0371] En la técnica se conocen bien métodos para purificar ADN genómico de células o de un tejido biológico compuesto por células y el experto en la técnica reconocerá cuáles son los procedimientos óptimos o los kits comerciales dependiendo del tejido y de las condiciones en las que se obtenga el tejido. Algunas realizaciones contemplan que la purificación de ADN celular de un tejido requerirá la alteración celular o la lisis celular para exponer el ADN celular que contiene, por ejemplo, mediante métodos químicos y físicos tales como mezclar, triturar o someter a ultrasonido la muestra de tejido; eliminar los lípidos de la membrana añadiendo un detergente o tensioactivos que también sirvan en la lisis celular, eliminando opcionalmente las proteínas, por ejemplo añadiendo una proteasa; eliminar el ARN, por ejemplo añadiendo una RNasa; y purificación de ADN, por ejemplo, a partir de detergentes, proteínas, sales y reactivos utilizados durante la etapa de lisis celular. La purificación de ADN puede realizarse mediante precipitación, por ejemplo, con etanol o isopropanol; mediante extracción con fenol y cloroformo.
[0373] En algunas realizaciones, el ADN celular obtenido de tejidos y/o células se fragmenta antes de, o durante, la obtención, generación, fabricación, formación y/o producción de una biblioteca de ADN genómico como se describe en la descripción. Un experto en la técnica entenderá que existen varias técnicas adecuadas para la fragmentación de ADN, y puede reconocer e identificar las técnicas adecuadas para fragmentar ADN celular con el fin de generar una biblioteca de ADN genómico para la secuenciación de ADN, incluyendo, aunque sin limitación, secuenciación de nueva generación. Algunas realizaciones contemplan que el ADN celular pueda fragmentarse en fragmentos de longitud apropiada y/o suficiente para generar una biblioteca mediante métodos que incluyen, pero sin limitación, fragmentación física, fragmentación enzimática y cizallamiento químico.
[0375] [0179] La fragmentación física puede incluir, pero sin limitación, cizallamiento acústico, ultrasonido y cizallamiento hidrodinámico. En algunas realizaciones, el a Dn celular se fragmenta mediante fragmentación física. En algunas realizaciones, el ADN celular se fragmenta mediante cizallamiento acústico o ultrasonido. Algunas realizaciones contemplan que el cizallamiento acústico y el ultrasonido son métodos físicos comunes utilizados para cortar ADN celular. El instrumento Covaris® (Woburn, MA) es un dispositivo acústico para romper el ADN en 100-5 kb de pb. Covaris® también fabrica tubos (gTubes) que procesarán muestras de 6 a 20 kb para las bibliotecas Mate-Pair. El Bioruptor® (Denville, Nueva Jersey) es un dispositivo de ultrasonido que se utiliza para cortar la cromatina, el ADN y alterar los tejidos. Se pueden cortar pequeños volúmenes de ADN hasta alcanzar una longitud de 150 kb. Hydroshear® de Digilab® (Marlborough, MA) utiliza fuerzas hidrodinámicas para cortar el ADN. También pueden utilizarse nebulizadores (Life Technologies®, Grand Island, NY) para atomizar líquidos utilizando aire comprimido, cortando el ADN en fragmentos de 100 a 3 kb en segundos. La nebulización tiene un coste bajo, pero el proceso puede causar una pérdida de aproximadamente un 30 % del ADN celular de la muestra original. En algunas realizaciones, el ADN celular se fragmenta mediante ultrasonido.
[0377] La fragmentación enzimática puede incluir, pero sin limitación, el tratamiento con una endonucleasa de restricción, p. ej., con ADNasa I, o el tratamiento con una nucleasa inespecífica. En algunas realizaciones, el ADN celular se fragmenta mediante fragmentación enzimática. En algunas realizaciones, el ADN celular se fragmenta mediante el tratamiento con una endonucleasa de restricción. En algunas realizaciones, el ADN celular se fragmenta mediante el tratamiento con una nucleasa inespecífica. En algunas realizaciones, el ADN celular se fragmenta mediante el tratamiento con una transposasa. Algunas realizaciones contemplan que los métodos enzimáticos para cortar el ADN celular en trozos pequeños incluyan ADNasa I, una combinación de proteína de unión a maltosa (MBP,maltose binding protein)-EndoI de T7 y una nucleasa inespecífica con nucleasa deVibrio vulnificus(Vvn), la tecnología de tagmentación Fragmentase® y Nextera™ de New England Biolabs® (Ipswich, MA) (Illumina®, San Diego, CA). La combinación de nucleasa inespecífica y Endo de T7 actúa sinérgicamente para producir mellas y contramellas inespecíficas, generando fragmentos que disocian 8 o menos nucleótidos del sitio de la mella. En la tagmentación se utiliza una transposasa para fragmentar e insertar adaptadores simultáneamente en el ADN bicatenario.
[0379] La fragmentación química puede incluir el tratamiento con calor y catión metálico divalente. En algunas realizaciones, el ADN genómico se fragmenta mediante fragmentación química. Algunas realizaciones contemplan que la cizalladura química se utiliza más comúnmente para la rotura de fragmentos largos de ARN en contraposición al ADN genómico. La fragmentación química se realiza normalmente mediante la digestión térmica del ADN con un catión metálico divalente (magnesio o zinc). La longitud de los fragmentos de ADN se puede ajustar aumentando o disminuyendo el tiempo de incubación.
[0381] En algunas realizaciones, el ADN genómico puede fragmentarse con ultrasonido, utilizando un homogeneizador ultrasónico (Covaris®) en un dispositivo adecuado para generar fragmentos de 200 pb.
[0383] En algunas realizaciones, los fragmentos generados pueden purificarse adicionalmente y seleccionarse por tamaño utilizando purificación con perlas de “ doble cara” con perlas AmPure XP® paramagnéticas (Beckman®).
[0385] En algunas realizaciones, las mezclas de ADN de líneas celulares cizalladas pueden estar en diversas proporciones según sean adecuadas para los fines de los estudios, y se pueden mezclar con ADNlc de TS de sujetos femeninos y/o masculinos (para tener en cuenta los genes de los cromosomas X y/o Y) para producir muestras generadas en laboratorio con variantes de un solo nucleótido (SNV) tales como polimorfismos de un solo gen (SNP), inserciones y/o deleciones (indeles), reordenamientos de genes, tales como translocaciones, fusiones, inversiones, duplicaciones (cambios en el número de copias) y otras variantes a frecuencias alélicas (FA) definidas.
[0387] En algunas realizaciones, los métodos y composiciones contemplados en la descripción utilizan ADNbc que se obtiene de una biblioteca de genoma completo con bajo número de pases, una biblioteca de amplicones, una biblioteca de exoma completo, una biblioteca de ADNc o una biblioteca de ADN metilado.
[0389] En algunas realizaciones, los métodos y composiciones de la descripción utilizan, como analito, cualquiera de las muestras de ADN descritas en la Tabla 1. Por ejemplo, en algunas realizaciones, los métodos y composiciones contemplados en la descripción utilizan ADN libre de células (ADNlc) como analito. En algunas realizaciones, la muestra de ADN que se va a utilizar como analito comprende ADN sintético, ADN genómico o una mezcla de los mismos. En algunas realizaciones, la muestra de ADN que se va a utilizar como analito comprende variantes de genes HRD(Homologous Repair Defcient,deficientes en reparación homóloga), tales como variantes en uno cualquiera de los siguientes genes: ATM, BRCA1, BRCA2, F ANC A, HDAC2, PALB2, ERBB2, TP53, EML4-ALK, EGFR. En algunas realizaciones, la muestra de ADN que se va a utilizar como analito comprende variantes de genes de cáncer de pulmón. En algunas realizaciones, la muestra de ADN que se va a utilizar como analito comprende ADN de una línea celular, tal como NA12878, PC-3 o H2228.
[0391] En algunas realizaciones, para los análisis, se utilizan de aproximadamente de 10 a aproximadamente 250 ng de muestra de ADN. Por ejemplo, en algunas realizaciones, se utilizan de aproximadamente 1 a aproximadamente 100 ng, de aproximadamente 1 a aproximadamente 50 o de aproximadamente 1 a aproximadamente 25 ng de ADN. En algunas realizaciones, se utilizan aproximadamente 20, aproximadamente 25 o aproximadamente 50 ng de ADN.
[0393] [0188] En algunas realizaciones, la distribución por tamaño del ADNlc que se va a utilizar como analito, varía entre aproximadamente 150 pb y aproximadamente 180 pb. En algunas realizaciones, la distribución por tamaño del ADNlc varía entre 150 pb y 180 pb. La fragmentación de ADNlc puede ser el resultado de la actividad endonucleolítica y/o exonucleolítica y presenta un desafío formidable para el análisis preciso, fiable y sólido del ADNIc. Otro desafío para analizar el ADNlc es su corta semivida en el torrente sanguíneo, del orden de aproximadamente 15 minutos. Sin pretender ceñirse a ninguna teoría en particular, la presente descripción contempla, en parte, que el análisis del ADNlc es como el de una “ biopsia líquida” y que es una instantánea en tiempo real de los procesos biológicos actuales.
[0395] Además, dado que el ADNlc no se encuentra en las células y puede obtenerse de diversas fuentes adecuadas, incluyendo, pero sin limitación, fluidos biológicos y muestras de heces, no está sujeto a las limitaciones existentes que afectan al análisis mediante secuenciación de nueva generación, tales como el acceso directo a los tejidos que se están analizando.
[0397] En algunas, realizaciones, los métodos de análisis genético contemplados en la presente memoria comprenden generar una biblioteca de ADNlc que comprende tratar ADNlc con una o más enzimas reparadoras de extremos para generar ADNlc reparado en los extremos y ligar uno o más adaptadores a cada extremo del ADNlc reparado en los extremos para generar la biblioteca de ADNlc.
[0399] Como ejemplos ilustrativos de líquidos biológicos que son fuentes adecuadas de las que se aíslan ADNlc en algunas realizaciones, se incluyen, pero sin limitación, líquido amniótico, sangre, plasma, suero, semen, líquido linfático, líquido cefalorraquídeo, líquido ocular, orina, saliva, mucosa y sudor.
[0401] En algunas realizaciones, el líquido fluido biológico es sangre o plasma sanguíneo.
[0403] En algunas realizaciones, pueden utilizarse kits disponibles en el comercio y otros métodos conocidos por el experto en la técnica para aislar ADNlc directamente de los líquidos biológicos de un paciente o de una muestra biológica previamente obtenida y opcionalmente estabilizada, p.ej., mediante la congelación y/o la adición de agentes quelantes enzimáticos que incluyen, pero sin limitación, EDTA, EGTA u otros agentes quelantes específicos para cationes divalentes.
[0405] En algunas realizaciones, para la construcción de bibliotecas de NGS, puede utilizarse ADN libre de células o ADN genómico (p. ej., ADNlc o ADNg) aislado de células inmortalizadas que llevan variantes genéticas (Instituto Coriell de Investigación Médica o SeraCare Life Sciences, Inc.).
[0407] En algunas realizaciones, el ADN libre de células puede extraerse de muestras de plasma utilizando un kit QiAmp DSP Circulating NA (Qiagen).
[0409] Reparación de extremos de ADN en una solo etapa
[0411] Aunque los fragmentos de ADN de la descripción pueden obtenerse en forma procesada, los métodos de la descripción permiten el procesamiento de muestras biológicas para obtener fragmentos de ADN que sean susceptibles de ligarse a los adaptadores de la descripción. Por ejemplo, una forma procesada de un fragmento de ADN de la descripción incluye, pero sin limitación, un fragmento de ADN que comprende uno o más de un extremo romo, un extremo 3' romo, un extremo 5' romo, una cola de adenina (dA) de ácido desoxirribonucleico, una cola de dA en un extremo 3', una cola de dA en un extremo 5', un ácido nucleico fosforilado, un ácido nucleico fosforilado en un extremo 3' y un ácido nucleico fosforilado en un extremo 5'.
[0413] En algunas realizaciones, la “ reparación de extremos” puede realizarse para generar fragmentos de ADN que estén desfosforilados, reparados con daños internos, extremos romos, fosforilados en 5' o para generar fragmentos de ADN con salientes en 3'.
[0415] En algunas realizaciones de los métodos de la descripción que incluyen el procesamiento de fragmentos de ADN, pueden realizarse, en una sola etapa, una o más de una reacción de reparación de ADN para realizar un corte romo en un extremo, una reacción de adición de cola A y una reacción de fosforilación.
[0417] En algunas realizaciones, la generación de una biblioteca de ADN genómico comprende la reparación de extremos de ADNlc o de ADN celular fragmentado aislado. El ADNlc o ADN celular fragmentado, se procesa con enzimas reparadoras de extremos para generar ADNlc reparado en los extremos con extremos romos, salientes en 5' o salientes en 3'. En algunas realizaciones, pueden producirse enzimas reparadoras de extremos, por ejemplo. En algunas realizaciones, el ADNlc o ADN celular reparado en los extremos, contiene extremos romos. En algunas realizaciones, el ADN celular o ADNlc reparado en los extremos, se procesa para que contenga extremos romos. En algunas realizaciones, los extremos romos del ADNlc o ADN celular reparado en los extremos, se modifican adicionalmente para que contengan un único par de bases saliente. En algunas realizaciones, el ADNlc o ADN celular reparado en los extremos que contiene extremos romos, puede procesarse adicionalmente para que contenga un saliente de adenina (A)/timina (T). En algunas realizaciones, el ADNlc o ADN celular reparado en los extremos que contiene extremos romos, puede procesarse adicionalmente para que contenga un saliente de adenina (A)/timina (T) como el único saliente de par de bases. En algunas realizaciones, el ADNlc o ADN celular reparado en los extremos, tiene salientes en 3' sin molde. En algunas realizaciones, el ADNlc o ADN celular reparado en los extremos, se procesa para que contenga salientes en 3'. En algunas realizaciones, el ADNlc o ADN celular reparado en los extremos, se procesa con una transferasa terminal (TdT) para que contenga salientes en 3'.
[0418] En algunas realizaciones, a través de una TdT puede añadirse una cola de G. En algunas realizaciones, el ADNIc o ADN celular reparado en los extremos, se procesa para que contenga extremos salientes utilizando digestión parcial con cualquier enzima de restricción conocida (p. ej., con la enzima Sau3A y similares).
[0420] En algunas realizaciones, la desfosforilación del fragmento de ADN puede realizarse mediante fosfatasas termolábiles tales como fosfatasas alcalinas. Como ejemplos comerciales se incluyen la fosfatasa alcalina termolábil APEx™, la fosfatasa termolábil NT phos™, la fosfatasa termolábil KT™ y la fosfatasa alcalina de camarón (SAP,shrimp alkaline phosphatase).
[0422] En algunas realizaciones, el daño interno del ADN puede repararse mediante una o más enzimas reparadoras que pueden reparar el daño interno en los fragmentos de ADN. Como ejemplos se incluyen ligasa de a Dn de Taq, endonucleasa IV, polimerasa de ADN de Bst, Fpg, uracil-ADN glicolasa (UDG), T4 PDG y endonucleasa VIII. En algunas realizaciones, pueden utilizarse todas las enzimas anteriores. Puede utilizarse un cóctel de las enzimas mencionadas anteriormente disponible en el comercio (p. ej., el kit de enzimas PreCR), o bien puede prepararse un cóctel mediante la adición de una o más de las enzimas individuales en cualquier combinación. En algunas realizaciones, la reparación del daño interno del ADN puede no realizarse.
[0424] En algunas realizaciones, la reparación interna de daños en el ADN, la reparación de extremos y la transferencia terminal (TdT) para la adición de colas de dA, pueden llevarse a cabo en una sola etapa y en una sola mezcla de reacción. En algunas realizaciones, para la reacción en una sola etapa puede utilizarse un kit disponible en el comercio, tal como el kit de enzimas PrECR o el kit Quick blunt de NEB.
[0426] En algunas realizaciones, la reparación de los extremos del ADN puede realizarse utilizando una o más enzimas reparadoras de extremos para crear fragmentos de ADN con extremos romos. Las enzimas pueden incluir la exonucleasa 3'-5', la ADN polimerasa 5'-3' (p. ej., el fragmento de Klenow) y la endonucleasa 5' FLAP.
[0428] En algunas realizaciones, la reparación de los extremos del ADN, la fosforilación en 5' y la transferasa terminal (TdT) para la adición de cola de dA, pueden realizarse en una sola etapa y en una sola mezcla de reacción para generar fragmentos de ADNbc que están fosforilados en 5' con extremos de saliente en 3', p. ej., fosforilados en 5' y con cola de dA en 3'. En algunas realizaciones, pueden utilizarse kits disponibles en el comercio, tal como el kit Next Ultra II de reparación de extremos/adición de cola de dA de NEB, para la reacción de una sola etapa.
[0430] En algunas realizaciones, la presente descripción contempla que las cantidades apropiadas de muestras de<a>D<n>fragmentado puedan “ repararse en los extremos en una sola etapa” , combinando en una sola mezcla enzimas y reactivos para cada una de las siguientes reacciones: desfosforilación, reparación del daño interno del ADN, creación de extremos romos, fosforilación en el extremo 5' y creación de salientes en 3'. Este proceso de reacción único de una sola etapa genera fragmentos de ADN bicatenario reparado en los extremos que tienen un extremo fosforilado en 5' y un saliente en 3'. En algunas realizaciones, el saliente en 3' comprende una cola de dA.
[0432] En algunas realizaciones, la cantidad de ADN que puede repararse en los extremos puede ser cualquier cantidad adecuada. En algunas realizaciones, la cantidad de ADN a reparar en los extremos es de entre 1 ng y 500 ng, entre 5 ng y 400 ng, entre 10 ng y 300 ng, entre 15 ng y 250 ng, o entre 20 ng y 200 ng. En algunas realizaciones, la cantidad de ADN a reparar en los extremos es de entre 20 ng y 50 ng.
[0434] Ligamiento con adaptador a ADN con extremos reparados
[0436] En algunas realizaciones, una etapa de ligamiento comprende ligar un módulo adaptador al ADNlc reparado en los extremos para generar una biblioteca de ADNlc“ etiquetado” . En algunas realizaciones, se emplea un único módulo adaptador. En algunas realizaciones, se emplean dos, tres, cuatro o cinco módulos adaptadores. En algunas realizaciones, se liga un módulo adaptador de la misma secuencia a cada extremo de ADN fragmentado con extremos reparados. En algunas realizaciones, se ligan módulos adaptadores de las mismas secuencias a los dos extremos de cada ADN fragmentado con extremos reparados.
[0438] El ligamiento de uno o más adaptadores contemplados en la presente memoria puede llevarse a cabo mediante métodos conocidos por los expertos en la técnica. En algunas realizaciones, se ligan uno o más adaptadores contemplados en la presente memoria a ADNlc reparado en los extremos que comprende extremos romos. En algunas realizaciones, se ligan uno o más adaptadores contemplados en la presente memoria a ADNlc reparado en los extremos que comprende extremos complementarios apropiados para el método de ligamiento empleado. En algunas realizaciones, se ligan uno o más adaptadores a ADNlc reparado en los extremos que comprende un saliente en 3'.
[0440] [0209] En algunas realizaciones, la unión de los fragmentos de ADN genómico a una pluralidad de adaptadores incluye las etapas de unir el ADNlc o los fragmentos de ADN celular reparados en los extremos a un oligonucleótido que contenga al menos una parte de una región de anclaje. En algunas realizaciones, el oligonucleótido contiene toda la región de anclaje. En algunas realizaciones, el oligonucleótido es un ADN dúplex que comprende una cadena de unión fosforilada en 5' formando un dúplex con una cadena compañera, en donde la unión de la cadena compañera se bloquea mediante modificación química en su extremo 3', y en donde la cadena de unión se une al fragmento de ADN genómico. En algunas realizaciones, los fragmentos de ADN unidos con al menos una parte de la región de anclaje se emparejan después con oligonucleótidos de ADN que codifican las secuencias adaptadoras de longitud completa. En algunas realizaciones, a los fragmentos de ADN genómico y a los oligonucleótidos de<a>D<n>que codifican la secuencia adaptadora de longitud completa, se añaden una o más polinucleótido cinasas, una o más ligasas de ADN y/o una o más polimerasas de ADN. En algunas realizaciones, la polinucleótido cinasa es la polinucleótido cinasa de T4. En algunas realizaciones, la ligasa de ADN es la ligasa de ADN de Taq.(Thermus aquaticus).En algunas realizaciones, la polimerasa de ADN es la polimerasa de Taq. En algunas realizaciones, la polimerasa de ADN es la polimerasa de Bst(Bacillus stearothermophilus)de longitud completa.
[0442] En algunas realizaciones, los adaptadores y fragmentos de ADN pueden mezclarse con un tampón de ligamiento, reactivos y enzimas de ligamiento, tales como ligasas de ADN (p. ej., ligasa de T4 o ligasa de Taq) y/o ligasas de ARN. Dichas ligasas pueden utilizarse para ligar la cadena de ligamiento monocatenaria con el saliente en 3', como se describió anteriormente, a un fragmento de ADN monocatenario.
[0444] En algunas realizaciones, la cadena de ligamiento del adaptador multifuncional se liga al extremo 5' del fragmento de ADNbc en una sola etapa mediante la complementación del saliente 3' terminal de la cadena de ligamiento y el saliente 3' del fragmento de ADN, mientras que la cadena sin ligamiento permanece sin unirse al extremo 3' del fragmento de ADN.
[0446] En algunas realizaciones, una etapa de ligamiento comprende ligar un adaptador multifuncional con un fragmento de ADNbc para generar un complejo de adaptador multifuncional/fragmento de ADNbc. En algunas realizaciones, se emplea un solo adaptador. En algunas realizaciones, se emplean dos, tres, cuatro o cinco adaptadores. En algunas realizaciones, se une un módulo adaptador de la misma secuencia a cada extremo de ADN fragmentado con extremos reparados.
[0448] En algunas realizaciones, el mismo adaptador se une a ambos extremos del fragmento de ADN. En algunas realizaciones, se unen diferentes adaptadores a diferentes extremos del fragmento de ADNbc.
[0450] En algunas realizaciones, una etapa de ligamiento comprende:
[0452] (a) ligar una pluralidad de adaptadores multifuncionales con una pluralidad de fragmentos de ADNbc para generar una pluralidad de complejos de adaptador multifuncional/fragmento de ADNbc, en donde el adaptador multifuncional es uno cualquiera de los adaptadores multifuncionales de la descripción;
[0454] (b) poner en contacto los complejos de adaptador/fragmento de ADN de la etapa (a) con una o más enzimas, para formar una biblioteca de ADN etiquetado con adaptador, que comprende una pluralidad de fragmentos de ADN bicatenario contiguos etiquetados con adaptador.
[0456] En algunas realizaciones, los complejos de adaptador/fragmento de ADN de la etapa (b) se realizan en fragmentos de ADN bicatenario contiguos etiquetados con adaptador mediante extensión con ADN polimerasa utilizando, como molde, la cadena de ligamiento.
[0458] En algunas realizaciones, la cadena sin ligamiento no unida es desplazada por la extensión de la polimerasa en dirección 5'-3' del fragmento de ADN utilizando, como molde, la cadena de ligamiento. En algunas realizaciones, la cadena sin ligamiento puede comprender opcionalmente una modificación en su extremo 3' que impide el ligamiento con el extremo 5' del fragmento de ADNbc y/o la formación de dímeros adaptadores.
[0460] En algunas realizaciones, la cadena sin ligamiento se liga al extremo 3' del fragmento de ADN mediante la reparación de muescas con la polimerasa de ADN (traducción de muescas), utilizando, como molde, la cadena de ligamiento.
[0462] En algunas realizaciones, el fragmento de ADNbc es ADN libre de células (ADNlc), ADN genómico (ADNg), ADN complementario (ADNc), ADN mitocondrial o ADN metilado o ADN desmetilado.
[0464] En algunas realizaciones, la pluralidad de fragmentos de ADNbc se repara en los extremos antes de ligarlos con una pluralidad de adaptadores multifuncionales.
[0466] En algunas realizaciones, la pluralidad de fragmentos de ADNbc se obtiene de una biblioteca de genoma completo con bajo número de pases, una biblioteca de amplicones, una biblioteca de exoma completo, una biblioteca de ADNc o una biblioteca de ADN metilado.
[0468] En algunas realizaciones, el período de ligamiento del adaptador puede ser cualquier período adecuado para el ligamiento. En algunas realizaciones, el periodo es de al menos aproximadamente 5 minutos. En algunas realizaciones, el período es de entre aproximadamente 5 minutos y aproximadamente 72 horas. En algunas realizaciones, el período es de entre aproximadamente 5 minutos y aproximadamente 2 horas. En algunas realizaciones, el período de ligamiento es inferior a aproximadamente 1 hora, inferior a aproximadamente 30 minutos, inferior a aproximadamente 15 minutos o inferior a aproximadamente 10 minutos.
[0469] En algunas realizaciones, el período de ligamiento del adaptador puede ser cualquier período adecuado para el ligamiento. En algunas realizaciones, el período es de al menos 5 minutos. En algunas realizaciones, el período es de entre 5 minutos y 72 horas. En algunas realizaciones, el período es de entre 5 minutos y 2 horas. En algunas realizaciones, el período de ligamiento es inferior a 1 hora, inferior a 30 minutos, inferior a 15 minutos o inferior a 10 minutos.
[0471] En algunas realizaciones, el volumen del ligamiento del adaptador es uno que es adecuado para la automatización y para los sistemas robóticos de manipulación de muestras. En algunas realizaciones, el volumen de reacción es de entre aproximadamente 1 pl y aproximadamente 1000 pl, entre aproximadamente 1 pl y aproximadamente 350 pl, entre aproximadamente 1 pl y aproximadamente 200 pl, entre aproximadamente 1 pl y aproximadamente 100 pl, entre aproximadamente 1 pl y aproximadamente 50 pl, entre aproximadamente 5 pl y aproximadamente 25 pl, entre aproximadamente 10 pl y aproximadamente 40 pl, entre aproximadamente 20 pl y aproximadamente 40 pl. En algunas realizaciones, el volumen de reacción es de aproximadamente 100 pl. En algunas realizaciones, el volumen es de aproximadamente 30 pl.
[0473] En algunas realizaciones, el volumen del ligamiento del adaptador es uno que es adecuado para la automatización y para los sistemas robóticos de manipulación de muestras. En algunas realizaciones, el volumen de reacción es de entre 1 pl y 1000 pl, entre 1 pl y 350 pl, entre 1 pl y 200 pl, entre 1 pl y 100 pl, entre 1 pl y 50 pl, entre 5 pl y 25 pl, entre 10 pl y 40 pl, entre 20 pl y 40 pl. En algunas realizaciones, el volumen de reacción es de 100 pl. En algunas realizaciones, el volumen es de 30 pl.
[0475] En algunas realizaciones, el ligamiento del adaptador puede realizarse en tiras de tubos o en pocillos de placas de microtitulación o en cualquier otro formato adecuado para permitir un procesamiento automatizado y/o de alto rendimiento.
[0477] En algunas realizaciones, la cantidad de adaptador puede ser cualquier concentración adecuada. En algunas realizaciones, la concentración de los adaptadores es de al menos 0,01 pM. En algunas realizaciones, la concentración de los adaptadores es de entre aproximadamente 0,01 pM y aproximadamente 200 pM, entre aproximadamente 0,01 pM y aproximadamente 50 pM, entre aproximadamente 0,1 pM y aproximadamente 50 pM, entre aproximadamente 0,2 pM y aproximadamente 20 pM, entre aproximadamente 0,2 pM y aproximadamente 10 pM, entre aproximadamente 1 pM y aproximadamente 10 pM, o entre aproximadamente 2 pM y aproximadamente 8 pM. En algunas realizaciones, la concentración del adaptador es de al menos aproximadamente 2 pM. En algunas realizaciones, la concentración del adaptador es de aproximadamente 5 pM.
[0479] En algunas realizaciones, la concentración de los adaptadores es de entre 0,01 pM y 200 pM, entre 0,01 pM y 50 pM, entre 0,1 pM y 50 pM, entre 0,2 pM y 20 pM, entre 0,2 pM y 10 pM, entre 1 pM y 10 pM o entre 2 pM y 8 pM. En algunas realizaciones, la concentración del adaptador es de al menos 2 pM. En algunas realizaciones, la concentración del adaptador es de 5 pM.
[0481] En algunas realizaciones, la mezcla de reacción de ligamiento puede incubarse a temperaturas entre aproximadamente 10 °C y aproximadamente 30 °C. En algunas realizaciones, la mezcla de reacción de ligamiento puede incubarse a aproximadamente 20 °C.
[0483] En algunas realizaciones, la mezcla de reacción de ligamiento puede incubarse a temperaturas entre 10 °C y 30 °C. En algunas realizaciones, la mezcla de reacción de ligamiento puede incubarse a 20 °C.
[0485] En algunas realizaciones, después del ligamiento, las moléculas de ADN etiquetado con adaptador pueden aislarse y lavarse. Esto puede realizarse utilizando perlas de purificación de ADN, tales como Ampure XP® (Beckman®) o Spectra Mix, de modo que las moléculas de ADN-adaptador permanezcan unidas a las perlas y los materiales contaminantes se eliminen por lavado. El sobrenadante clarificado eluido contiene una biblioteca aislada que comprende una pluralidad de fragmentos de ADN etiquetado con adaptador. Para la amplificación, el sobrenadante que contiene la biblioteca puede transferirse a un tubo de PCR o a un pocillo de placa de microtitulación nuevo.
[0487] Amplificación de bibliotecas de ADN
[0489] En algunas realizaciones, la extensión en 5'-3' de los fragmentos de ADNbc se realiza primero para generar fragmentos de ADNbc contiguos etiquetados con adaptador, y después, los fragmentos de ADNbc contiguos etiquetados con adaptador, se amplifican para generar una biblioteca de ADN etiquetado con adaptador que comprende una pluralidad de fragmentos de ADNbc contiguos etiquetados con adaptador.
[0491] En algunas realizaciones, la primera etapa de extensión en 5'-3' de los fragmentos de ADNbc que forman fragmentos de ADNbc contiguos etiquetados con adaptador y la segunda etapa de amplificación de los fragmentos de ADNbc contiguos etiquetados con adaptador, se combina para generar la biblioteca de ADN etiquetado con adaptador en una sola etapa. Los fragmentos de ADNbc etiquetados con adaptador en la biblioteca de ADN están flanqueados por adaptadores en ambos extremos que comprenden las mismas regiones de amplificación, en donde las secuencias de la región de amplificación pueden actuar como sitios de unión al cebador de amplificación reconocibles por un único cebador de amplificación, tal como un cebador de amplificación por PCR.
[0492] En algunas realizaciones, la cadena sin ligamiento no unida es desplazada por la extensión de la polimerasa en dirección 5'-3' del fragmento de ADN utilizando, como molde, la cadena de ligamiento. En algunas realizaciones, la cadena sin ligamiento puede comprender opcionalmente una modificación en su extremo 3' que impide el ligamiento con el extremo 5' del fragmento de ADNbc y/o la formación de dímeros adaptadores.
[0494] En algunas realizaciones, la cadena sin ligamiento se liga al extremo 3' del fragmento de ADN mediante la reparación de muescas con la polimerasa de ADN, utilizando, como molde, la cadena de ligamiento.
[0496] En algunas realizaciones, se utiliza una polimerasa de ADN. La polimerasa de ADN puede ser termófila para la PCR o la amplificación termostática/isotérmica. En algunas realizaciones, se combinan una mezcla maestra (MM) que contiene reactivos y las enzimas para la extensión 5'-3' y las enzimas para la amplificación posterior. Los kits de enzimas y reactivos disponibles en el comercio para dicha extensión y amplificación incluyen, por ejemplo, el kit NEB Ultra II 2x PCR Amplification® (New England Biolabs®), la enzima Hi-Fidelity Q5® de PCR (NEB), KAPA (Roche®), KAPA 2X (Roche®), TruSeq Nano® (Thermofisher®), AmpliTaq® (Thermofisher®).
[0498] En algunas realizaciones, una parte de la biblioteca de ADN etiquetado con adaptador se amplificará utilizando técnicas de PCR estándar con una secuencia cebadora única que active la amplificación. En algunas realizaciones, la secuencia cebadora única tiene aproximadamente 25 nucleótidos, opcionalmente con una Tm proyectada de > 55 °C en condiciones de fuerza iónica estándar. En algunas realizaciones, la secuencia cebadora única tiene 25 nucleótidos, opcionalmente con una Tm proyectada de > 55 °C en condiciones de fuerza iónica estándar. En algunas realizaciones, el cebador de amplificación único es complementario a una secuencia dentro de la región de amplificación del módulo adaptador. En algunas realizaciones, el cebador de amplificación único comprende una secuencia de TGCAGGACCAGAGAATTCGAATACA (Id. de sec. n.°: 70).
[0500] En algunas realizaciones, la amplificación puede realizarse mediante cualquier amplificación conocida en la técnica, tal como PCR (reacción en cadena de la polimerasa), LAMP (amplificación isotérmica mediada por bucle), NASBA (amplificación basada en secuencias de ácidos nucleicos), SDA (amplificación por desplazamiento de cadena), RCA (amplificación por círculo rodante), LCR (reacción en cadena de la ligasa).
[0502] En algunas realizaciones, durante la amplificación, algunos amplicones formarán estructuras de tallo y bucle debido a que los adaptadores se ligan a ambos extremos de los fragmentos. Esta estrategia es eficiente para impedir que se amplifiquen productos muy cortos (p. ej., dímeros de cebadores) y sesguen la biblioteca resultante.
[0504] En algunas realizaciones, se lleva a cabo un ciclo de incubación inicial de 3 minutos para formar una pluralidad de fragmentos de ADNbc contiguos etiquetados con adaptador mediante la extensión con molde de la cadena de ligamiento.
[0506] En algunas realizaciones, la amplificación por PCR se realiza en la pluralidad de fragmentos de ADNbc contiguos etiquetados con adaptador para formar una biblioteca de ADN Etiquetado amplificada.
[0508] En algunas realizaciones, los picogramos de la pluralidad de fragmentos de ADNbc contiguos etiquetados con adaptador se amplifican en microgramos de clones de ADN (biblioteca de ADN etiquetado con adaptador), lo que implica una amplificación de 10.000 veces. La cantidad de producto amplificado puede medirse utilizando métodos conocidos en la técnica, p. ej., la cuantificación en un instrumento Qubit 2.0 o Nanodrop.
[0510] En algunas realizaciones, la biblioteca de ADN etiquetado con adaptador amplificada puede aislarse mediante el uso de perlas de purificación de ADN y lavarse con tampones de lavado, p. ej., tampón Tris-EDTA (TEZ) pH 8,0. El sobrenadante clarificado puede transferirse a un tubo de PCR o a un pocillo de placa de microtitulación nuevo o cualquier otro formato adecuado para la automatización y/o alto rendimiento.
[0512] En general, es preferible utilizar tan pocos ciclos de PCR como sea posible para amplificar las bibliotecas. Además de reducir el tiempo de flujo de trabajo, esto también limita el riesgo de introducir sesgos durante la PCR. Una consecuencia del aumento de la eficiencia de la reparación de extremos, la adición de la cola dA y el ligamiento del adaptador en los métodos de la descripción, es que se requieren menos ciclos de PCR para alcanzar los rendimientos de la biblioteca necesarios para la secuenciación u otros flujos de trabajo intermedios en dirección 3'. La simplificación del flujo de trabajo y de los procesos descritos proporciona ventajas tales como: reducción del tiempo de respuesta, reducción del número de reactivos, menor cantidad de instrumentos/aparatos utilizados y reducción de gastos.
[0514] Estos procesos, adaptadores y bibliotecas de ADN etiquetado mencionados anteriormente, pueden utilizarse para crear bibliotecas de sondas de captura que estén enriquecidas en los locus genéticos de interés presentes en cualquier muestra de ensayo.
[0516] 2. Captura y aislamiento diana
[0518] [0245] En algunas realizaciones, un método para el análisis genético de ADN genómico, p. ej., ADN genómico celular o ADNlc, comprende el análisis genético cuantitativo de uno o más locus genéticos diana de los clones de la biblioteca de ADN. El análisis genético cuantitativo comprende una o más, o todas, de las siguientes etapas: capturar clones de ADN que comprendan un locus genético diana; amplificación del locus genético diana capturado; secuenciación del locus genético diana capturado amplificado; y análisis bioinformático de las lecturas de secuencia resultantes. Como se utiliza en la presente memoria, la expresión “clon de biblioteca de ADN” se refiere a un fragmento de biblioteca de ADN en donde la combinación del adaptador y el fragmento de ADN genómico da como resultado una secuencia de ADN única (p. ej., una secuencia de ADN que puede distinguirse de la de otro clon de biblioteca de ADN).
[0520] La presente descripción contempla, en parte, un módulo de sonda de captura diseñado para conservar la eficiencia y la fiabilidad de sondas más grandes, pero que minimiza la generación de secuencias no informativas en una biblioteca de ADN genómico que comprende fragmentos de ADN más pequeños, p. ej., una biblioteca de clones de ADNlc.
[0522] Las expresiones “ sonda de captura multifuncional” y “ módulo de sonda de captura” se utilizan indistintamente. En algunas realizaciones, el “ módulo de sonda de captura” o la “ sonda de captura multifuncional” comprenden una secuencia de sonda de captura y una secuencia de cola, en donde la secuencia de sonda de captura puede hibridarse con una región diana en la biblioteca de ADN genético etiquetado. En algunas realizaciones, una sonda de captura multifuncional comprende una primera región que puede hibridarse con un oligonucleótido compañero, en donde, opcionalmente, la primera región comprende una secuencia de cola que comprende un sitio de unión al cebador de la PCR; y una segunda región que puede hibridarse con una región diana específica en la biblioteca de ADN genético etiquetado. La primera región también puede denominarse región de cola, y la segunda región también puede denominarse sonda de captura o secuencia de sonda de captura.
[0524] En algunas realizaciones, un módulo de sonda de captura comprende una secuencia de cola. Como se utiliza en la presente memoria, la expresión “ secuencia de cola” se refiere a un polinucleótido en el extremo 5' del módulo de sonda de captura, que, en algunas realizaciones, puede servir como sitio de unión al cebador. En algunas realizaciones, la sonda de captura comprende un sitio de unión al cebador de secuenciación.
[0526] En algunas realizaciones, la secuencia de cola tiene de aproximadamente 5 a aproximadamente 100 nucleótidos, de aproximadamente 10 a aproximadamente 100 nucleótidos, de aproximadamente 5 a aproximadamente 75 nucleótidos, de aproximadamente 5 a aproximadamente 50 nucleótidos, de aproximadamente 5 a aproximadamente 25 nucleótidos o de aproximadamente 5 a aproximadamente 20 nucleótidos. En algunas realizaciones, la tercera región tiene de aproximadamente 10 a aproximadamente 50 nucleótidos, de aproximadamente 15 a aproximadamente 40 nucleótidos, de aproximadamente 20 a aproximadamente 30 nucleótidos o aproximadamente 20 nucleótidos, o cualquier número intermedio de nucleótidos.
[0528] En algunas realizaciones, la secuencia de cola tiene aproximadamente 30 nucleótidos, aproximadamente 31 nucleótidos, aproximadamente 32 nucleótidos, aproximadamente 33 nucleótidos, aproximadamente 34 nucleótidos, aproximadamente 35 nucleótidos, aproximadamente 36 nucleótidos, aproximadamente 37 nucleótidos, aproximadamente 38 nucleótidos, aproximadamente 39 nucleótidos o aproximadamente 40 nucleótidos.
[0530] En algunas realizaciones, la secuencia de cola tiene de 5 a 100 nucleótidos, de 10 a 100 nucleótidos, de 5 a 75 nucleótidos, de 5 a 50 nucleótidos, de 5 a 25 nucleótidos o de 5 a 20 nucleótidos. En algunas realizaciones, la tercera región tiene de 10 a 50 nucleótidos, de 15 a 40 nucleótidos, de 20 a 30 nucleótidos o 20 nucleótidos, o cualquier número intermedio de nucleótidos.
[0532] En algunas realizaciones, la secuencia de cola tiene 30 nucleótidos, 31 nucleótidos, 32 nucleótidos, 33 nucleótidos, 34 nucleótidos, 35 nucleótidos, 36 nucleótidos, 37 nucleótidos, 38 nucleótidos, 39 nucleótidos o 40 nucleótidos.
[0534] En algunas realizaciones, un oligonucleótido compañero ilustrativo puede ser: GTGAAAACCAGGATCAACTCCCGTGCCAGTCACATCTCAGATGAGCT (Id. de sec. n.°: 1) con una modificación de biotina-TEG en el extremo 3'.
[0536] Cada una de la biblioteca de fragmentos contiguos de ADN etiquetado con adaptador (no amplificada) y la de ADN etiquetado (amplificada) es útil una variedad de análisis genéticos basados en secuenciación, incluida la preparación de bibliotecas que contienen moléculas híbridas enriquecidas en uno o más locus genéticos de interés, y pueden constituir una biblioteca no amplificada o amplificada (una “ biblioteca diana” ).
[0538] Las bibliotecas de fragmentos de ADN etiquetado con adaptador no amplificadas y/o las de ADN etiquetado amplificadas, preparadas como se ha descrito anteriormente, pueden hibridarse con módulos de sondas de captura multifuncionales para generar bibliotecas dirigidas a locus genéticos diana, es decir, bibliotecas diana. Los fragmentos de ADN etiquetado con adaptador pueden hibridarse con una o más sondas de captura. Cada sonda de captura puede dirigirse a los mismos locus genéticos en los fragmentos de ADN etiquetados con adaptador o puede dirigirse a diferentes locus genéticos en los fragmentos de ADN etiquetado con adaptador. En algunas realizaciones, se dirige a una pluralidad de locus genéticos en los fragmentos de la biblioteca de ADN etiquetado amplificada.
[0540] [0256] En algunas realizaciones, las sondas de captura se utilizan con una biblioteca de ADN genómico construida a partir de ADN celular. En algunas realizaciones, las sondas de captura se utilizan con una biblioteca de ADN genómico construida a partir de ADNlc. Dado que el tamaño promedio del ADNlc es de aproximadamente 150 a aproximadamente 170 pb y que está muy fragmentado, las composiciones y métodos contemplados en la presente memoria comprenden el uso de sondas de captura de alta densidad y relativamente cortas para examinar las regiones diana de ADN de interés. En algunas realizaciones, las sondas de captura pueden hibridarse con regiones diana de ADN que se distribuyen en todos los segmentos cromosómicos a una densidad uniforme. Un conjunto de dichas sondas de captura se denomina en la presente memoria “sondas de estabilidad cromosómica” . Se utilizan sondas de estabilidad cromosómica para analizar las variaciones en el número de copias a escala genómica, con el fin de proporcionar una medición a nivel de todo el genoma del número de copias cromosómicas (p. ej., ploidía cromosómica).
[0542] Una preocupación particular acerca del uso de sondas de captura de alta densidad es que, generalmente, las sondas de captura se diseñan utilizando “ reglas de secuencia” específicas. Por ejemplo, las regiones de secuencia redundante o que muestran sesgos extremos en la composición de bases generalmente se excluyen al diseñar las sondas de captura. Sin embargo, se ha descubierto que la falta de flexibilidad en las reglas de diseño de sondas de captura no afecta de manera sustancial al rendimiento de las sondas. Por el contrario, las sondas de captura elegidas estrictamente por restricción posicional proporcionaron información sobre la secuencia diana; muestran muy poca captura de lectura fuera de la diana y no se pueden mapear; y producen lecturas uniformes, útiles y dentro de la diana, con solo unas pocas excepciones. Además, la alta redundancia con un espaciado estrecho entre las sondas compensa con creces las sondas de captura ocasionales de bajo rendimiento.
[0544] En algunas realizaciones, una región diana es reconocida por una pluralidad de sondas de captura, en donde una cualquiera de dos o más sondas de captura están diseñadas para unirse a la región diana a una distancia de entre 10 nucleótidos entre sí, 15 nucleótidos entre sí, 20 nucleótidos entre sí, 25 nucleótidos entre sí, 30 nucleótidos entre sí, 35 nucleótidos entre sí, 40 nucleótidos entre sí, 45 nucleótidos entre sí, o 50 nucleótidos o más entre sí, así como a todas las longitudes de nucleótidos intermedias.
[0546] En algunas realizaciones, la sonda de captura tiene aproximadamente 25 nucleótidos, aproximadamente 26 nucleótidos, aproximadamente 27 nucleótidos, aproximadamente 28 nucleótidos, aproximadamente 29 nucleótidos, aproximadamente 30 nucleótidos, aproximadamente 31 nucleótidos, aproximadamente 32 nucleótidos, aproximadamente 33 nucleótidos, aproximadamente 34 nucleótidos, aproximadamente 35 nucleótidos, aproximadamente 36 nucleótidos, aproximadamente 37 nucleótidos, aproximadamente 38 nucleótidos, aproximadamente 39 nucleótidos, aproximadamente 40 nucleótidos, aproximadamente 41 nucleótidos, aproximadamente 42 nucleótidos, aproximadamente 43 nucleótidos, aproximadamente 44 nucleótidos o aproximadamente 45 nucleótidos.
[0548] En una realización, la sonda de captura tiene 25 nucleótidos, 26 nucleótidos, 27 nucleótidos, 28 nucleótidos, 29 nucleótidos, 30 nucleótidos, 31 nucleótidos, 32 nucleótidos, 33 nucleótidos, 34 nucleótidos, 35 nucleótidos, 36 nucleótidos, 37 nucleótidos, 38 nucleótidos, 39 nucleótidos, 40 nucleótidos, 41 nucleótidos, 42 nucleótidos, 43 nucleótidos, 44 nucleótidos o 45 nucleótidos.
[0550] En algunas realizaciones, la sonda de captura tiene aproximadamente 100 nucleótidos, aproximadamente 200 nucleótidos, aproximadamente 300 nucleótidos, aproximadamente 400 nucleótidos o aproximadamente 100 nucleótidos. En otra realización, la sonda de captura tiene de aproximadamente 100 nucleótidos a aproximadamente 500 nucleótidos, de aproximadamente 200 nucleótidos a aproximadamente 500 nucleótidos, de aproximadamente 300 nucleótidos a aproximadamente 500 nucleótidos o de aproximadamente 400 nucleótidos a aproximadamente 500 nucleótidos, o cualquier intervalo intermedio de los mismos.
[0552] En algunas realizaciones, la sonda de captura tiene 100 nucleótidos, 200 nucleótidos, 300 nucleótidos, 400 nucleótidos o 100 nucleótidos. En otra realización, la sonda de captura tiene de 100 nucleótidos a 500 nucleótidos, de 200 nucleótidos a 500 nucleótidos, de 300 nucleótidos a 500 nucleótidos o de 400 nucleótidos a 500 nucleótidos, o cualquier intervalo intermedio de los mismos.
[0554] En una realización particular, la sonda de captura tiene 60 nucleótidos. En otra realización, la sonda de captura es sustancialmente más pequeña que 60 nucleótidos, pero se hibrida de manera comparable, tan bien, o mejor que una sonda de captura de 60 nucleótidos dirigida a la misma región diana de ADN. En algunas realizaciones, la sonda de captura tiene 40 nucleótidos.
[0556] En algunas realizaciones, el módulo de sonda de captura comprende un miembro específico de un par de unión para permitir el aislamiento y/o la purificación de uno o más fragmentos capturados de una biblioteca de ADN genómico etiquetado y/o amplificado (p. ej., una biblioteca de ADNlc o celular) que se hibrida con la sonda de captura. En algunas realizaciones, el módulo de sonda de captura se conjuga con biotina u otro hapteno adecuado, p. ej., dinitrofenol, digoxigenina.
[0558] En algunas realizaciones, el módulo de sonda de captura se hibrida con una bibliografía de ADN etiquetado y opcionalmente amplificada para formar un complejo. En algunas realizaciones, el módulo de sonda de captura multifuncional se hibrida sustancialmente con una región diana genómica específica en la biblioteca de ADN.
[0560] [0266] Las condiciones de hibridación o hibridación pueden incluir cualquier condición de reacción en la que dos secuencias de nucleótidos formen un complejo estable; por ejemplo, la biblioteca de ADN etiquetado y el módulo de sonda de captura forman un complejo estable de biblioteca de ADN etiquetado y módulo de sonda de captura. Dichas condiciones de reacción se conocen bien en la técnica y los expertos en la técnica apreciarán que dichas condiciones pueden modificarse según sea apropiado, p. ej., temperaturas de emparejamiento reducidas con sondas de captura de menor longitud. Puede producirse una hibridación sustancial cuando la segunda región del complejo de sondas de captura presenta una identidad de secuencia, homología o complementariedad del 100 %, 99 %, 98 %, 97 %, 96 %, 95 %, 94 %, 93 %, 92 %, 91 %, 90 %, 89 %, 88 %, 85 %, 80 %, 75 % o 70 % con una región de la biblioteca de ADN etiquetado.
[0562] En algunas realizaciones, la sonda de captura (es decir, la región que hibrida con la secuencia diana) tiene aproximadamente 40 nucleótidos y una temperatura de alineamiento óptima de aproximadamente 44 °C a aproximadamente 47 °C.
[0564] En algunas realizaciones, la sonda de captura (es decir, la región que se hibrida con la secuencia diana) tiene 40 nucleótidos y tiene una temperatura de hibridación óptima de 44 °C a 47 °C.
[0566] En algunas realizaciones, los métodos contemplados en la presente memoria comprenden aislar un complejo de módulo de sonda de captura con la biblioteca de ADNlc etiquetado. En algunas realizaciones, los expertos en la técnica conocen bien los métodos para aislar complejos de ADN(véase, p. ej.,Ausubel y col.,Current Protocols in Molecular Biology,2007-2012) y cualquier método que un experto en la técnica considere apropiado puede emplearse en relación con los métodos de la presente descripción. En algunas realizaciones, los complejos se aíslan utilizando técnicas de aislamiento con biotina y estreptavidina.
[0568] 3. Amplificación de bibliotecas diana
[0570] En algunas realizaciones, se contempla la eliminación de los extremos 3' monocatenarios de los complejos de ADN etiquetados con sonda de captura/adaptador aislados. En algunas realizaciones, los métodos comprenden el procesamiento enzimático de la exonucleasa en dirección 3'-5' del complejo de módulo de sonda de captura multifuncional y biblioteca de ADN etiquetado aislado para eliminar los extremos 3' monocatenarios.
[0572] En algunas otras realizaciones, los métodos comprenden realizar la extensión de la sonda de captura multifuncional con polimerasa de ADN en dirección 5'-3' utilizando, como molde, los fragmentos aislados de la biblioteca de ADN etiquetado. Las enzimas que son adecuadas para este proceso de extensión pueden ser cualquier polimerasa de ADN termoestable y termófila. Los ejemplos de polimerasas de ADN disponibles en el comercio incluyen la polimerasa de ADN Q5 de alta fidelidad (NEB®), NEBNext Ultra PCR®, NebNext Ultra II PCR® (NEB) y KAPA 2X® (Roche®).
[0574] En algunas otras realizaciones, los métodos comprenden la creación de una molécula diana de ADN etiquetado híbrida aislada por una sonda de captura, p. ej., una molécula diana de ADNlc etiquetado o una molécula de ADN celular etiquetado, mediante la acción conjunta de una endonucleasa FLAP 5', la polimerización del ADN y el cierre de muesca(nick)mediante una ligasa de ADN.
[0576] Se puede emplear una variedad de enzimas para el procesamiento enzimático exonucleasa 3'-5' del complejo aislado de biblioteca de ADN etiquetado con el módulo de sonda de captura multifuncional. Los ejemplos ilustrativos de enzimas adecuadas, que muestran actividad enzimática de exonucleasa 3'-5', que pueden emplearse en realizaciones particulares incluyen, pero no se limitan a: T4 o exonucleasas I, III, V (véase tambiénShevelevIV, Hübscher U., Nat Rev Mol Cell Biol.3(5):364-76 (2002)). En realizaciones particulares, la enzima que comprende actividad de exonucleasa 3'-5' es la polimerasa T4. En algunas realizaciones, puede emplearse una enzima que muestre actividad enzimática de exonucleasa 3'-5' y que sea capaz de extender el molde del cebador, incluyendo, por ejemplo, la T4 o las exonucleasas I, III, V.Id.
[0578] En algunas realizaciones, los métodos contemplados en la presente memoria comprenden realizar secuenciación y/o PCR sobre el complejo procesado enzimáticamente por la exonucleasa 3'-5' mencionado anteriormente y en otras secciones de la presente memoria. En algunas realizaciones, para generar una molécula de ácido nucleico híbrida se copia una parte de la cola de un módulo de sonda de captura. En algunas realizaciones, la molécula híbrida de ácido nucleico generada comprende la región diana que puede hibridar con el módulo de sonda de captura y el complemento de la secuencia de la cola del módulo de sonda de captura.
[0580] En algunas realizaciones, el análisis genético comprende a) hibridar uno o más módulos de sondas de captura con uno o más locus genéticos diana en una pluralidad de clones de bibliotecas de ADN para formar uno o más complejos de módulo de sonda de captura y clon de biblioteca de ADN; b) aislar el uno o más complejos de módulo de sonda de captura y clon de biblioteca de ADN de a); c) procesar enzimáticamente el uno o más complejos de módulo de sonda de captura y clon de biblioteca de ADN aislados de la etapa b); d) realizar una PCR en el complejo procesado enzimáticamente de c) en donde la parte de cola del módulo de sonda de captura se copia para generar moléculas de ácido nucleico híbridas amplificadas, en donde las moléculas de ácido nucleico híbridas amplificadas comprenden una secuencia diana en el locus genómico diana que puede hibridarse con la sonda de captura y el complemento de la secuencia de cola del módulo de la sonda de captura; y e) realizar un análisis genético cuantitativo en las moléculas de ácido nucleico híbridas amplificadas de d).
[0581] En algunas realizaciones, se contemplan métodos para determinar el número de copias de un locus genético diana específico que comprenden: a) hibridar uno o más módulos de sondas de captura con uno o más locus genéticos diana en una pluralidad de clones de la biblioteca de ADN para formar uno o más complejos de módulo de sonda de captura y clon de biblioteca de ADN; b) aislar el uno o más complejos de módulo de sonda de captura y clon de biblioteca de ADN de a); c) procesar enzimáticamente el uno o más complejos de módulo de sonda de captura y clon de biblioteca de ADN aislados de la etapa b); d) realizar una PCR en el complejo procesado enzimáticamente de c) en donde la parte de cola del módulo de sonda de captura se copia para generar moléculas de ácido nucleico híbridas amplificadas, en donde las moléculas de ácido nucleico híbridas amplificadas comprenden una secuencia diana en el locus genómico diana que puede hibridarse con la sonda de captura y el complemento de la secuencia de cola del módulo de la sonda de captura; e) realizar la amplificación por PCR de las moléculas de ácido nucleico híbridas amplificadas en d); y f) cuantificar la reacción de PCR en e), en donde la cuantificación permite determinar el número de copias de la región diana específica.
[0583] En algunas realizaciones, el procesamiento enzimático de la etapa c) comprende realizar el procesamiento enzimático de la exonucleasa 3'-5' en el uno o más complejos de módulo de sonda de captura y la biblioteca de ADN de b) utilizando una enzima con actividad de exonucleasa 3'-5' para eliminar los extremos 3' monocatenarios; crear una o más moléculas clonadas de librería de ADNlc con módulos de sondas de captura mediante la acción conjunta de una endonucleasa FLAP 5', la polimerización del ADN y el cierre de muesca mediante una ligasa de<a>DN; o realizar la extensión de la sonda de captura con polimerasa de ADN en dirección 5'-3' utilizando, como molde, el clon de ADN aislado en el complejo.
[0585] En algunas realizaciones, el procesamiento enzimático de la etapa c) comprende realizar la extensión de la sonda de captura con polimerasa de ADN en dirección 5'-3' utilizando, como molde, el clon de ADN aislado en el complejo.
[0587] En algunas realizaciones, la PCR puede realizarse utilizando cualquier condición de reacción de PCR estándar bien conocida por los expertos en la técnica. En algunas realizaciones, la reacción de PCR en e) emplea dos cebadores de PCR. En algunas realizaciones, la reacción de PCR en e) emplea un primer cebador de PCR que se hibrida con una repetición dentro del locus genético diana. En una realización particular, la reacción de PCR en e) emplea un segundo cebador de PCR que se hibrida con las moléculas de ácido nucleico híbridas en la unión entre el locus genético diana y la cola. En algunas realizaciones, la reacción de PCR en e) emplea un primer cebador de PCR que se hibrida con el locus genético diana y un segundo cebador de PCR se hibrida con las moléculas de ácido nucleico híbridas amplificadas en la unión entre el locus genético diana y la cola. En algunas realizaciones, el segundo cebador se hibrida con la unión entre el locus genético diana y la cola de modo que al menos uno o más nucleótidos del cebador se hibridan con el locus genético diana y al menos uno o más nucleótidos del cebador se hibridan con la secuencia de cola.
[0589] En algunas realizaciones, la amplificación puede ser isotérmica, tal como mediante amplificación isotérmica mediada por bucles (LAMP), amplificación del genoma completo (WGA), amplificación por desplazamiento de cadena (SDA), amplificación dependiente de helicasa (HDA), amplificación por recombinasa polimerasa (RPA), amplificación basada en secuenciación de ácidos nucleicos (NASBA), reacción de amplificación con enzimas de corte (NEAR) y reacción en cadena de ligasa (LCR).
[0591] En algunas realizaciones, las polimerasas de ADN para la amplificación isotérmica incluyen polimerasas de ADN tales como el fragmento de Klenow, el fragmento grande de Bsu y la phi29 para reacciones a temperatura moderada (25-40 °C) y el fragmento grande de la ADN polimerasa de Bst para reacciones a temperatura más alta (50-65 °C). Las enzimas adecuadas para la LCR incluyen una ligasa de Taq termoestable y una ADN polimerasa termoestable tal como la polimerasa de Taq.
[0593] En algunas realizaciones, las moléculas de ácido nucleico híbridas amplificadas obtenidas en la etapa e) se secuencian y las secuencias se alinean horizontalmente, es decir, se alinean entre sí, pero no se alinean con una secuencia de referencia. En algunas realizaciones, las etapas a) a e) se repiten una o más veces con uno o más módulos de sonda de captura. Los módulos de la sonda de captura pueden ser iguales o diferentes y estar diseñados para dirigirse a cualquier cadena de ADNlc de un locus genético diana. En algunas realizaciones, cuando las sondas de captura son diferentes, se hibridan en secuencias diana superpuestas o adyacentes dentro de un locus genético diana en la biblioteca de clones de ADNlc etiquetados. En algunas realizaciones, se utiliza una estrategia de sonda de captura de alta densidad en donde una pluralidad de sondas de captura se hibrida con un locus genético diana, y en donde cada una de la pluralidad de sondas de captura se hibrida con el locus genético diana dentro de aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 pb o más de cualquier otra sonda de captura que se hibride con el locus genético diana en una biblioteca de clones de ADN etiquetados, incluidas todas las distancias intermedias. En algunas realizaciones, se utiliza una estrategia de sonda de captura de alta densidad en donde una pluralidad de sondas de captura se hibrida con un locus genético diana, y en donde cada una de la pluralidad de sondas de captura se hibrida con el locus genético diana dentro de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 pb o más de cualquier otra sonda de captura que se hibride con el locus genético diana en una biblioteca de clones de ADN etiquetados, incluidas todas las distancias intermedias.
[0595] En algunas realizaciones, el método puede realizarse utilizando dos módulos de sonda de captura por locus genético diana, en donde uno se hibrida con la cadena de “Watson” (cadena no codificante o molde) en dirección 5' de la región diana y el otro se hibrida con la cadena de “Crick” (cadena codificante o no molde) en dirección 3' de la región diana.
[0596] En algunas realizaciones, los métodos contemplados en la presente memoria pueden realizarse además varias veces con cualquier número de módulos de sonda de captura, por ejemplo 2, 3, 4, 5, 6, 7, 8, 9, o 10 o más módulos de sonda de captura por locus genético diana, cuyo cualquier número se hibrida con la cadena de Watson o Crick en cualquier combinación. En algunas realizaciones, las secuencias obtenidas pueden alinearse entre sí para identificar cualquiera de una serie de diferencias.
[0598] En algunas realizaciones se examina una pluralidad de locus genéticos diana, p. ej., 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 10.000, 50.000, 100.000, 500.000 o más, en una sola reacción, utilizando uno o más módulos de sonda de captura.
[0600] En algunas realizaciones, la etapa de procesamiento enzimático (etapa c en la descripción anterior) no se lleva a cabo. En algunas realizaciones, los complejos de sonda de captura aislados/fragmentos de ADN etiquetados se amplifican directamente, en donde la ADN polimerasa realiza una extensión en dirección 5' -> 3' para formar una biblioteca de moléculas híbridas. En algunas realizaciones, la biblioteca que contiene las moléculas híbridas se amplifica además utilizando cebadores directos e inversos que contienen adaptadores de secuenciación (por ejemplo, los adaptadores se unen a los cebadores de secuenciación, como los cebadores de secuenciación P5 y P7 de la tecnología de NGS de Illumina® NextSeq) para generar la biblioteca diana de moléculas híbridas amplificadas listas para secuenciar.
[0602] Al eliminar la etapa de procesamiento enzimático, la biblioteca diana se genera así más rápido utilizando los métodos descritos. Dichos métodos más rápidos conducen a un rendimiento mejorado y más rápido del análisis genético de los locus genéticos de interés que están presentes en los fragmentos de ADN en las bibliotecas de ADN etiquetadas y en las bibliotecas diana. Un experto en la técnica reconocerá que los locus genéticos pueden analizarse para detectar alteraciones en el ADN, p. ej., SNV, indeles, reorganizaciones de genes y cambios en el número de copias.
[0604] 4. Determinación del número de equivalentes genómicos
[0606] En algunas realizaciones, un método de análisis genético de ADN comprende determinar el número de equivalentes genómicos en la biblioteca de clones de ADN. Como se utiliza en la presente memoria, la expresión “ equivalente genómico” se refiere al número de copias del genoma en cada biblioteca. Un desafío importante al que se enfrentan las composiciones y métodos contemplados en la presente memoria es lograr una sensibilidad de ensayo suficiente para detectar y analizar mutaciones genéticas raras o diferencias en la secuencia genética. Para determinar el valor de sensibilidad del ensayo sobre una base de muestra por muestra, se miden los números de secuencias diferentes y distintas presentes en cada muestra, midiendo el número de equivalentes genómicos presentes en una biblioteca de secuenciación. Para establecer la sensibilidad, debe medirse el número de equivalentes genómicos de cada biblioteca de muestras.
[0608] El número de equivalentes genómicos puede determinarse mediante un ensayo de qPCR (PCR cuantitativa) o utilizando recuento basado en bioinformática después de realizar la secuenciación. En el flujo del proceso de muestras clínicas, la medición por qPCR de equivalentes genómicos se utiliza como un etapa de CC (control de calidad) para las bibliotecas de ADN. Esto establece una expectativa de sensibilidad del ensayo antes del análisis de la secuencia y permite excluir una muestra del análisis si su biblioteca de clones de ADN correspondiente carece de la profundidad necesaria de equivalentes genómicos. En última instancia, el recuento de equivalentes genómicos basado en bioinformática también se utiliza para identificar los equivalentes genómicos - y por lo tanto calcular la sensibilidad del ensayo y los falsos negativos - de cada biblioteca de clones de ADN determinada.
[0610] El ensayo empírico de qPCR y los ensayos de recuento estadístico deben estar bien correlacionados. En los casos donde la secuenciación no revele la profundidad de la secuencia en una biblioteca de clones de ADN, puede ser necesario el reprocesamiento de la biblioteca de clones de ADN y/o una secuenciación adicional.
[0612] En algunas realizaciones, los equivalentes genómicos en una biblioteca de clones de ADNlc se determinan utilizando un ensayo de PCR cuantitativa (qPCR, por sus siglas en inglés). En algunas realizaciones, se utiliza una biblioteca estándar de concentraciones conocidas para construir una curva estándar y las mediciones del ensayo de qPCR se ajustan a la curva estándar resultante y, a partir del ajuste, se obtiene un valor de equivalentes genómicos. Los presentes inventores han descubierto que un ensayo de qPCR “ basado en repeticiones” , que comprende un cebador que se hibrida específicamente con una secuencia común del genoma, p. ej., una secuencia repetida, y otro cebador que se une al sitio de unión del cebador en el adaptador, mide un aumento de 8 veces en los equivalentes genómicos en comparación con los métodos que utilizan solo el cebador específico de adaptador (presente en ambos extremos del clon de ADN). El número de equivalentes genómicos medido mediante los ensayos basados en repeticiones, proporciona un rendimiento más consistente entre las bibliotecas y una mejor alineación entre las estimaciones de qPCR de los equivalentes genómicos y los equivalentes de etiquetas contados bioinformáticamente en los procesos de secuenciación.
[0614] Como ejemplos ilustrativos de repeticiones adecuadas para su uso en los ensayos de equivalentes genómicos basados en repeticiones contemplados en la presente memoria se incluyen, pero sin limitación: elementos nucleares intercalados cortos (SINE,short interspersed nuclear elements),p. ej., repeticiones Alu; elementos nucleares intercalados largos (LINE,long interspersed nuclear elements),p. ej., LINE1, LINE2, LINE3; elementos de repetición de microsatélites, p.
[0615] ej., repeticiones cortas en tándem (STR,short tándem repeats),repeticiones de secuencia simple (SSR,simple sequence repeats); y repeticiones intercaladas a lo largo del genoma de mamíferos (MIR,mammalian-wide interspersed repeats).
[0617] En algunas realizaciones, la repetición es una repetición Alu.
[0619] 5. Secuenciación
[0621] En algunas realizaciones, el análisis genético cuantitativo comprende secuenciar una pluralidad de moléculas de ácido nucleico híbridas, como se ha descrito anteriormente en otra parte de la presente memoria, para generar profundidades de secuenciación suficientes para obtener una pluralidad de lecturas de secuenciación únicas. Las expresiones “ lecturas únicas” o “ secuencias genómicas únicas” (UGS,unique genomic sequences)se utilizan indistintamente en la presente memoria y se identifican agrupando las lecturas redundantes individuales en una “ familia” . Las lecturas redundantes son lecturas de secuencias que comparten un mismo UMI(Unique Molecular Identifíer,Identificador Molecular Único) (p. ej., comparten el mismo código de lectura y la misma posición de inicio de la secuencia de ADN dentro de la secuencia genómica) y proceden de un solo acontecimiento de unión y, por lo tanto, son “ hermanas” entre sí obtenidas de la amplificación. Un solo consenso único de una familia de lecturas redundantes se traduce como una lectura única o UGS. Cada lectura única o UGS se considera que es un acontecimiento de unión único. La suma de las lecturas únicas correspondientes a una sonda de captura particular se denomina “ profundidad genómica en bruto” (RGD,raw genomic depth)para esa sonda de captura en particular. Cada sonda de captura produce un conjunto de lecturas únicas que se extraen computacionalmente del total de lecturas agrupándolas en familias. En algunas realizaciones, se secuencia toda la región de la sonda de captura en la molécula híbrida. En algunas realizaciones, se secuencia una parte de la región de la sonda de captura en la molécula híbrida.
[0623] Las lecturas únicas de una muestra determinada (p. ej., la profundidad genómica en bruto de una muestra) se calculan después como el promedio de todas las lecturas únicas observadas entre sondas. Las lecturas únicas son importantes porque cada lectura única debe derivar de un clon de ADN genómico único. Cada lectura única representa la entrada y el análisis de un equivalente haploide del ADN genómico. La suma de las lecturas únicas es la suma de los genomas haploides analizados. El número de genomas analizados, a su vez, define la sensibilidad del ensayo de secuenciación. A modo de ejemplo no limitativo, si el recuento promedio de lecturas únicas es de 100 equivalentes de genoma, entonces ese ensayo en particular tiene la sensibilidad de poder detectar una lectura mutante en 100, o el 1 %. Cualquier observación inferior a esta no es defendible.
[0625] Los casos en los que hay un cambio evidente en el número de copias (por ejemplo, casos de sondas ruidosas) se excluyen del conjunto de datos utilizado para calcular el promedio de la muestra. En la presente memoria, una “ sonda ruidosa” se refiere a una sonda que captura un número muy variable de lecturas únicas entre un conjunto grande de muestras idénticas (p. ej., un número muy variable de lecturas únicas entre 12 y 16 copias de la muestra). En algunas realizaciones, el número de lecturas únicas asociadas a una sonda ruidosa aumenta en comparación con el número promedio de lecturas únicas para la muestra en un 50 % o más. En algunas realizaciones, el número de lecturas únicas asociadas a una sonda ruidosa se reduce en comparación con el número promedio de lecturas únicas para la muestra en un 50 % o más. En algunas realizaciones, de aproximadamente el 2 % a aproximadamente el 4 % de las sondas utilizadas en un análisis particular se identifican como sondas ruidosas y se excluyen de los cálculos para determinar el número promedio de lecturas únicas para una muestra dada. En algunas realizaciones, del 2 % al 4 % de las sondas utilizadas en un análisis particular se identifican como sondas ruidosas y se excluyen de los cálculos para determinar el número promedio de lecturas únicas para una muestra determinada.
[0627] En algunas realizaciones, las lecturas de secuenciación se identifican como “ lecturas específicas” o “ lecturas inespecíficas” . Las lecturas específicas poseen una secuencia de ADN genómico que mapea las proximidades de una sonda de captura utilizada para crear la biblioteca genómica. En algunas realizaciones, cuando cada secuencia genómica está unida físicamente a una sonda de captura específica y cuando la secuencia del segmento genómico y la sonda de captura se determinan como una información unificada, una lectura específica se define como cualquier secuencia genómica cuyas coordenadas iniciales se mapean dentro de los 400 pb y, más generalmente, dentro de los 200 pb del extremo 3' de la sonda de captura correspondiente. Las lecturas inespecíficas se definen como aquellas que tienen una secuencia genómica que se alinea con el genoma de referencia en una ubicación > 500 pares de bases (y, más a menudo, se mapea en cromosomas completamente diferentes) en relación con la sonda de captura.
[0629] En algunas realizaciones, el análisis genético cuantitativo comprende la secuenciación múltiple de moléculas de ácido nucleico híbridas derivadas de una pluralidad de muestras.
[0631] [0299] En algunas realizaciones, el análisis genético cuantitativo comprende obtener uno o más o una pluralidad de clones de bibliotecas de ADN etiquetado, comprendiendo cada clon una primera secuencia de ADN y una segunda secuencia de ADN, en donde la primera secuencia de ADN comprende una secuencia en un locus genético diana y la segunda secuencia de ADN comprende una secuencia de sonda de captura; realizar una reacción de secuenciación de extremos emparejados en el uno o más clones y obtener una o más lecturas de secuenciación o realizar una reacción de secuenciación en uno o más clones en donde se obtiene una sola lectura de secuenciación larga de más de aproximadamente 100, aproximadamente 200,aproximadamente 300, aproximadamente 400, aproximadamente 500 o más nucleótidos, en donde la lectura es suficiente para identificar tanto la primera secuencia de ADN como la segunda secuencia de ADN; y ordenar o agrupar las lecturas de secuenciación del uno o más clones según las secuencias de sonda de las lecturas de secuenciación.
[0633] 6. Análisis bioinformático
[0635] En algunas realizaciones, el análisis genético cuantitativo comprende, además, el análisis bioinformático de las lecturas de secuenciación. El análisis bioinformático excluye cualquier análisis puramente mental realizado en ausencia de una composición o método de secuenciación. En algunas realizaciones, el análisis bioinformático incluye, pero no se limita a: alineamientos de secuencias; análisis de equivalentes genómicos; análisis de variantes de un solo nucleótido (SNV); análisis de la variación del número de copias de genes (CNV); medición del número de copias cromosómicas; y detección de lesiones genéticas. En algunas realizaciones, el análisis bioinformático es útil para cuantificar el número de equivalentes genómicos analizados en la biblioteca de clones de ADNlc; para detectar el estado genético de un locus genético diana; para detectar lesiones genéticas en un locus genético diana; y para medir las fluctuaciones del número de copias dentro de un locus genético diana.
[0637] Las alineaciones de secuencia pueden realizarse entre las lecturas de secuencia y una o más secuencias de ADN de referencia humanas. En algunas realizaciones, las alineaciones de secuenciación pueden utilizarse para detectar lesiones genéticas en un locus genético diana que incluyen, pero sin limitación, la detección de una transición o transversión de nucleótidos, una inserción o eliminación de nucleótidos, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes. La detección de lesiones genéticas que son indicadores causales o pronósticos puede ser útil en el diagnóstico, el pronóstico, el tratamiento y/o la monitorización de una afección o enfermedad genética en particular.
[0639] Las expresiones “ locus genético diana” y “ región diana de ADN” se utilizan indistintamente en la presente memoria y se refieren a una región de interés dentro de una secuencia de ADN. En algunas realizaciones, los análisis genéticos dirigidos se realizan en el locus genético diana. En algunas realizaciones, la región diana de ADN es una región de un gen que está asociada a un estado genético, una afección genética, enfermedades genéticas particulares; pruebas fetales; mosaicismo genético, pruebas de paternidad; predecir la respuesta al tratamiento farmacológico; diagnosticar o controlar una afección médica; elaboración de perfiles de microbiomas; detección de patógenos; o monitorización de trasplantes de órganos. En realizaciones adicionales, la región diana de ADN es una secuencia de ADN que está asociada a un cromosoma humano particular, tal como un cromosoma autosómico o ligado al cromosoma X particular, o una región del mismo (p. ej., una región cromosómica única).
[0641] En la presente memoria también se contemplan métodos para el análisis de alineación de secuencias, que pueden realizarse sin la necesidad de alinearse con una secuencia de referencia, denominados en la presente memoria análisis de secuencia horizontal. Tal análisis se puede realizar en cualquier secuencia generada por los métodos contemplados en la presente memoria o en cualquier otro método. En algunas realizaciones, el análisis de secuencia comprende realizar alineaciones de secuencia en las lecturas obtenidas mediante los métodos contemplados en la presente memoria.
[0643] En una realización, los equivalentes del genoma en una biblioteca de clon de ADNlc se determinan utilizando recuento basado en bioinformática después de realizar la secuenciación. Cada lectura de secuenciación está asociada a una sonda de captura particular, y la colección de lecturas asignadas a cada sonda de captura se analiza en grupos. Dentro de un grupo, los conjuntos de lecturas individuales comparten el mismo código de lectura y la misma posición de inicio de la secuencia de ADN dentro de la secuencia genómica. Estas lecturas individuales se agrupan en una “ familia” y un único consenso representativo de esta familia se traduce como una “ lectura única” . Todas las lecturas individuales que constituyen una familia proceden de un solo acontecimiento de unión y, por lo tanto, son “ hermanas” entre sí obtenidas de la amplificación. Cada lectura única se considera un evento de unión único y la suma de las lecturas únicas se considera equivalente al número de equivalentes del genoma analizados.
[0645] A medida que el número de clones únicos se acerca al número total de posibles combinaciones de secuencias, la probabilidad dicta que las mismas combinaciones de código y sitio de inicio se creen mediante eventos independientes y que estos eventos independientes se agrupen de manera inapropiada en familias individuales. El resultado neto será una subestimación de los equivalentes genómicos analizados, y las lecturas de mutantes raros pueden descartarse como errores de secuenciación porque se superponen con las lecturas naturales que contienen los mismos identificadores.
[0647] En algunas realizaciones, para proporcionar un análisis preciso de las bibliotecas de clones de ADNlc, el número de equivalentes genómicos analizados es de aproximadamente 1/10, de aproximadamente 1/12, de aproximadamente 1/14, de aproximadamente 1/16, de aproximadamente 1/18, de aproximadamente 1/20, de aproximadamente 1/25 o menor del número de posibles clones únicos. En algunas realizaciones, para proporcionar un análisis preciso de las bibliotecas de clones de ADNlc, el número de equivalentes genómicos analizados es de aproximadamente 1/10, 1/12, 1/14, 1/16, 1/18, 1/20, 1/25 o menor del número de posibles clones únicos. Debe entenderse que el procedimiento descrito anteriormente es meramente ilustrativo y no limitativo.
[0649] [0307] En algunas realizaciones, puede ser necesario aumentar el número de equivalentes genómicos que van a analizarse. Para ampliar la profundidad de los equivalentes del genoma, se contemplan al menos dos soluciones. La primera solución es utilizar más de un juego de adaptadores por muestra. Al combinar adaptadores, es posible ampliar multiplicativamente el número total de clones posibles y, por lo tanto, ampliar los cómodos límites de la entrada genómica. La segunda solución es expandir el código de lectura en 1,2, 3, 4 o 5 o más bases. El número de códigos de lectura posibles que difieren en al menos 2 bases de cualquier otro código de lectura se escala como 4(n-1), donde n es el número de bases dentro de un código de lectura. Por lo tanto, en un ejemplo no limitativo, si un código de lectura es de 5 nucleótidos y 4(5-1) = 256; por lo tanto, la inclusión de bases adicionales amplía el repertorio disponible en un factor de cuatro por cada base adicional.
[0651] En algunas realizaciones, el análisis genético cuantitativo comprende el análisis bioinformático de las lecturas de secuenciación para identificar variantes de un solo nucleótido (SNV) poco frecuentes.
[0653] La secuenciación de próxima generación tiene una tasa de error inherente de aproximadamente el 0,02 al 0,02 %, lo que significa que entre 1/200 y 1/500 llamadas base son incorrectas. Para detectar variantes y otras mutaciones que se producen a frecuencias inferiores a esta, por ejemplo, a frecuencias de 1 por 1000 secuencias, es necesario invocar estrategias de anotación molecular. Como ejemplo no limitativo, el análisis de 5000 moléculas únicas utilizando tecnología de captura de secuencias específicas generaría, a profundidades de secuenciación suficientes de >50.000 lecturas, una colección de 5000 lecturas únicas, perteneciendo cada lectura única a una “ familia” de lecturas, todas ellas con el mismo código de lectura. Una SNV que se presenta dentro de una familia es candidata a ser una variante poco frecuente. Cuando esta misma variante se observa en más de una familia, se convierte en una candidata muy fuerte por ser una variante poco frecuente que existe dentro de la muestra inicial. Por el contrario, es probable que las variantes que se producen esporádicamente dentro de las familias sean errores de secuenciación y las variantes que se producen dentro de una y solo una familia son poco frecuentes o son el resultado de una alteración de bases que se produjo exvivo(p. ej., oxidación de una base de ADN o errores introducidos por la PCR).
[0655] En algunas realizaciones, los métodos de detección de las SNV comprenden introducir 10 veces más información genómica (genomas o equivalentes del genoma) como la sensibilidad diana deseada del ensayo. En un ejemplo no limitativo, si la sensibilidad deseada es del 2 % (2 de cada 100), entonces la diana experimental es una entrada de 2000 genomas.
[0657] En algunas realizaciones, el análisis bioinformático de los datos de secuenciación se utiliza para detectar o identificar la SNV asociada a un estado, afección o enfermedad genética, al mosaicismo genético, a pruebas fetales, pruebas de paternidad, a predicción de la respuesta al tratamiento farmacológico, diagnóstico o monitorización de una afección médica, elaboración de perfiles del microbioma, la detección de patógenos, y la monitorización de trasplantes de órganos.
[0659] 7. Análisis del número de copias
[0661] En la presente memoria se proporcionan composiciones y métodos que son útiles para la detección de un cambio mutacional, SNP, translocación, inversión, deleción, cambio en el número de copias u otra variación genética dentro de una muestra de ADN genómico celular (p. ej., una muestra de biopsia de tejido) o ADNlc (p. ej., de una muestra de sangre). Las composiciones y métodos descritos en la presente memoria son particularmente útiles para detectar variaciones en el número de copias increíblemente difíciles de detectar en el ADNlc de una muestra biológica (p. ej., sangre) con una resolución exquisita. En particular, algunas realizaciones de la descripción se refieren a un método para detectar el número de copias de una región diana de ADN a partir de una muestra de ensayo generando una biblioteca de ADN genómico compuesta por fragmentos de ADN genómico unidos a un adaptador, capturando regiones diana de ADN con una pluralidad de sondas de captura, aislando los fragmentos de la biblioteca de ADN que comprenden la región diana de ADN y realizando un análisis genético cuantitativo de la región diana de ADN para determinar así el número de copias de la región diana de ADN. Los adaptadores descritos en la presente memoria permiten la identificación del fragmento de ADN individual que se está secuenciando, así como la identidad de la muestra o fuente del ADN genómico.
[0663] En algunas realizaciones, las composiciones y métodos para la detección de cambios en el número de copias específicos de la diana, descritos en la presente memoria son aplicables a varios tipos de muestras, incluyendo, pero sin limitación, biopsias directas de tejido y sangre periférica. En el contexto de la genómica del cáncer y, en particular, de los ensayos de ADN libre de células (ADNlc) para el análisis de tumores sólidos, la cantidad de ADN tumoral suele ser una fracción muy pequeña del ADN total. Además, la pérdida del número de copias es difícil de detectar en ensayos de ADN genómico, y en particular en ensayos de ADN genómico donde el cambio en el número de copias puede estar presente solo en una parte del ADN genómico total de una muestra, por ejemplo, en ensayos de ADNlc. Por ejemplo, la mayor parte del ADN libre de células extraído de un paciente con cáncer procederá de fuentes normales y tendrá un número de copias diploide (excepto para los genes ligados al cromosoma X en sujetos masculinos). En un paciente con cáncer, la fracción de ADN procedente de tumores a menudo tiene una baja frecuencia alélica minoritaria, tal como, por ejemplo, de un paciente en donde el 2 % del ADN circulante extraído del plasma procede del tumor. La pérdida de una copia de un gen supresor de tumor (por ejemplo, el BRCA1 en el cáncer de mama) significa que la frecuencia alélica minoritaria en ausencia de fragmentos genómicos detectables es del 1 %. En este escenario, un ensayo de pérdida del número de copias diseñado debería poder discriminar entre 100 copias (normal) y 99 copias (pérdida de genes heterocigotos). Por lo tanto, algunas realizaciones contemplan que los métodos y composiciones descritos en la presente memoria permiten la detección del cambio en el número de copias con una resolución suficiente para detectar cambios en el número de copias a frecuencias alélicas minoritarias incluso en el contexto de ADNlc.
[0664] En algunas realizaciones, se proporciona un método para el análisis del número de copias de un ADN de la región diana de ADN. En algunas realizaciones, el análisis del número de copias se realiza generando una biblioteca de ADN genómico de fragmentos de bibliotecas de ADN que contienen cada uno un fragmento de ADN genómico y un adaptador, aislando los fragmentos de la biblioteca de ADN que contienen las regiones diana de ADN y realizando un análisis genético cuantitativo de la región diana de ADN. Por “ análisis genético cuantitativo” se entiende un análisis realizado mediante cualquier técnica de biología molecular que pueda cuantificar los cambios en un ADN (p. ej., un gen, un locus genético, una región diana de interés, etc.) que incluye, entre otros, mutaciones del ADN, SNP, translocaciones, deleciones y variaciones en el número de copias (CNV). En algunas realizaciones, el análisis genético cuantitativo se realiza mediante secuenciación, por ejemplo, secuenciación de nueva generación.
[0666] En algunas realizaciones, se proporciona un método para el análisis de determinación del número de copias que comprende obtener uno o más o una pluralidad de clones, comprendiendo cada clon una primera secuencia de<a>D<n>y una segunda secuencia de ADN, en donde la primera secuencia de ADN comprende una secuencia en un locus genético diana y la segunda secuencia de a Dn comprende una secuencia de sonda de captura. En realizaciones relacionadas, se lleva a cabo una reacción de secuenciación de extremos pareados en el uno o más clones y se obtienen una o más lecturas de secuenciación. En otra realización, se lleva a cabo una reacción de secuenciación en el uno o más clones en donde se obtiene una única lectura de secuenciación larga de más de aproximadamente 100 nucleótidos, en donde la lectura es suficiente para identificar tanto la primera secuencia de ADN como la segunda secuencia de ADN. Las lecturas de secuenciación del uno o más clones pueden ordenarse o agruparse según la secuencia de sonda de las lecturas de secuenciación.
[0668] Los análisis del número de copias incluyen, pero sin limitación, análisis que examinan el número de copias de un gen o mutación en particular que se produce en una muestra de ADN genómico determinada y pueden incluir además la determinación cuantitativa del número de copias de un gen determinado o de las diferencias de secuencia en una muestra determinada. En realizaciones particulares, el análisis del número de copias se utiliza para detectar o identificar la amplificación génica asociada a estados, afecciones o enfermedades genéticas, pruebas fetales, mosaicismo genético, pruebas de paternidad, predicción de la respuesta al tratamiento farmacológico, diagnóstico o monitorización de una afección médica, elaboración de perfiles del microbioma, detección de patógenos y monitorización de trasplantes de órganos.
[0670] En algunas realizaciones, el análisis del número de copias se utiliza para medir la inestabilidad cromosómica. En dichas realizaciones, los conjuntos de sondas de captura que comprenden sondas de estabilidad cromosómica se utilizan para determinar las variaciones del número de copias a una densidad uniforme en todos los conjuntos de cromosomas. Se realizan análisis del número de copias para cada sonda de estabilidad cromosómica y, a continuación, las sondas de estabilidad cromosómica se ordenan según su diana cromosómica. Esto permite la visualización de las pérdidas o ganancias del número de copias en todo el genoma y puede servir como una medida de la estabilidad cromosómica.
[0672] En algunas realizaciones, el análisis bioinformático de los datos de secuenciación se utiliza para detectar o identificar una o más secuencias o lesiones genéticas en un locus diana que incluye, pero no se limita a, la detección de una transición o transversión de nucleótidos, una inserción o eliminación de nucleótidos, un reordenamiento genómico, un cambio en el número de copias o una fusión de genes. La detección de lesiones genéticas que son indicadores causales o pronósticos puede ser útil en el diagnóstico, el pronóstico, el tratamiento y/o la monitorización de una afección o enfermedad genética en particular. En algunas realizaciones, las lesiones genéticas están asociadas a estados, afecciones o enfermedades genéticas, pruebas fetales, mosaicismo genético, pruebas de paternidad, predicción de la respuesta al tratamiento farmacológico, e diagnóstico o monitorización de una afección médica, elaboración de perfiles del microbioma, detección de patógenos y monitorización de trasplantes de órganos.
[0674] En algunas realizaciones, el número de copias de la región diana de ADN presente en la muestra se determina mediante el análisis genético cuantitativo. En algunas realizaciones, el número de copias de la región diana de ADN se determina comparando la cantidad de copias de las regiones diana de ADN presentes en la muestra y comparándola con las cantidades de regiones diana de ADN presentes en una o más muestras con un número de copias conocido.
[0676] Algunas realizaciones contemplan que las composiciones y métodos descritos en la presente memoria son particularmente útiles para detectar cambios en el número de copias en una muestra de ADN genómico, donde solo una parte del ADN genómico total de la muestra tiene un cambio en el número de copias. Por ejemplo, en una muestra puede haber una mutación tumoral significativa, p. ej., una muestra de ADN libre de células, que esté presente en una frecuencia alélica minoritaria que sea significativamente inferior al 50 % (p. ej., en el intervalo del 0,1 % a > 20 %), a diferencia del genotipado de SNP convencional, donde las frecuencias alélicas son generalmente del -100 %, 50 % o 0 %. Un experto en la técnica reconocerá que las composiciones y métodos descritos en la presente memoria también son útiles para detectar otros tipos de mutaciones, incluidas variantes de un solo nucleótido (SNV), inserciones y deleciones (indeles) cortas (p. ej., de menos de 40 pares de bases (pb)) y reordenamientos genómicos, incluyendo fusiones de genes oncogénicos.
[0678] [0321] En algunas realizaciones, las composiciones y/o métodos descritos en la presente memoria son útiles, capaces, adecuados y/o capaces de detectar, identificar, observar y/o revelar un cambio en el número de copias de una o más regiones diana de ADN presentes en menos de aproximadamente el 20 %, menos de aproximadamente el 19 %, menos de aproximadamente el 18 %, menos de aproximadamente el 17 %, menos de aproximadamente el 16 %, menos de aproximadamente el 15 %, menos de aproximadamente el 14 %, menos de aproximadamente el 13 %, menos de aproximadamente el 12 %, menos de aproximadamente el 11 %, menos de aproximadamente el 10 %, menos de aproximadamente el 9 %, menos de aproximadamente el 8 %, menos de aproximadamente el 7 %, menos de aproximadamente el 6 %, menos de aproximadamente el 5 %, menos de aproximadamente el 4 %, menos de aproximadamente el 3 %, menos de aproximadamente el 2 %, menos de aproximadamente el 1 %, menos de aproximadamente el 0,5 %, menos de aproximadamente el 0,2 % o menos de aproximadamente el 0,1 % del ADN genómico total de la muestra. En algunas realizaciones, los métodos descritos en la presente memoria son útiles, capaces, adecuados y/o capaces de detectar, identificar, observar y/o revelar un cambio en el número de copias de una o más regiones diana de ADN presentes entre aproximadamente el 0,01 % y aproximadamente el 100 %, de aproximadamente el 0,01 % a aproximadamente el 50 % o de aproximadamente el 0,1 % a aproximadamente el 20 % del ADN genómico total de la muestra.
[0680] En algunas realizaciones, las composiciones y/o métodos descritos en la presente memoria son útiles, capaces, adecuados y/o capaces de detectar, identificar, observar y/o revelar un cambio en el número de copias de una o más regiones diana de ADN presentes en menos del 20 %, menos del 19 %, menos del 18 %, menos del 17 %, menos del 16 %, menos del 15 %, menos del 14 %, menos del 13 %, menos del 12 %, menos del 11 %, menos del 10 %, menos del 9 %, menos del 8 %, menos del 7 %, menos del 6 %, menos del 5 %, menos del 4 %, menos del 3 %, menos del 2 %, menos del 1 %, menos del 0,5 %, menos del 0,2 % o menos de 0,1 % del ADN genómico total de la muestra. En algunas realizaciones, los métodos descritos en la presente memoria son útiles, capaces, adecuados y/o capaces de detectar, identificar, observar y/o revelar un cambio en el número de copias de una o más regiones diana de ADN presentes entre el 0,01 % y el 100 %, entre el 0,01 % y el 50 % o entre el 0,1 % y el 20 % del ADN genómico total de la muestra.
[0682] En algunas realizaciones, un método de análisis genético de ADNlc comprende: generar y amplificar una biblioteca de ADNlc, determinando el número de equivalentes genómicos en la biblioteca de ADNlc; y realizar un análisis genético cuantitativo de uno o más locus diana genómicos.
[0684] Algunas realizaciones contemplan que cualquiera de los métodos y composiciones descritos en la presente memoria sea eficaz para su uso para analizar, detectar, diagnosticar y/o monitorizar de manera eficiente estados genéticos, afecciones genéticas, enfermedades genéticas, mosaicismo genético, diagnóstico fetal, pruebas de paternidad, elaboración de perfiles de microbiomas, detección de patógenos y monitorización de trasplantes de órganos utilizando ADN genómico, p. ej., ADN celular o ADNlc, donde toda o solo una parte del ADN genómico total de la muestra tiene una característica de interés, p. ej., una lesión genética, una mutación, una variante de un solo nucleótido (SNV). En algunas realizaciones, una característica de interés es una característica genética asociada a una enfermedad o afección. Por ejemplo, en una muestra puede haber una mutación tumoral significativa, p. ej., una muestra de ADNlc, que esté presente en una frecuencia alélica minoritaria que sea significativamente inferior al 50 % (p. ej., en el intervalo del 0,1 % a > 20%),a diferencia del genotipado de SNP convencional, donde las frecuencias alélicas son generalmente del -100 %, 50 % o 0 %.
[0686] 8. Aplicaciones clínicas
[0688] En algunas realizaciones, en la presente memoria se describe un método para detectar, identificar, predecir, diagnosticar o monitorizar una afección o enfermedad en un sujeto mediante la detección de un cambio mutacional, SNP, translocación, inversión, deleción, cambio en el número de copias u otra variación genética en una región de interés.
[0690] En algunas realizaciones, en la presente memoria se describe un método para detectar, identificar, predecir, diagnosticar o controlar una afección o enfermedad en un sujeto.
[0692] En algunas realizaciones, en la presente memoria se describe un método para detectar, identificar, predecir, diagnosticar o monitorizar un estado, afección o enfermedad genéticos en un sujeto, que comprende realizar un análisis genético cuantitativo de uno o más locus genéticos diana en una biblioteca de clones de ADN para detectar o identificar un cambio en la secuencia en uno o más locus genéticos diana. En algunas realizaciones, el cambio es un cambio en el número de copias.
[0694] En algunas realizaciones, en la presente memoria se describe un método para detectar, identificar, predecir, diagnosticar o monitorizar un estado, afección o enfermedad genéticos, que comprende aislar u obtener ADN celular o ADNlc de una muestra biológica de un sujeto; tratar el ADN celular o ADNlc con una o más enzimas reparadoras de extremos para generar ADN reparado en los extremos; unir uno o más adaptadores a cada extremo del ADN reparado en los extremos para generar una biblioteca de ADN genómico; amplificar la biblioteca de ADN para generar una biblioteca de clones de ADN; determinar el número de equivalentes genómicos en la biblioteca de clones de ADN; y realizar un análisis genético cuantitativo de uno o más locus genéticos diana en una biblioteca de clones de ADN para detectar o identificar un cambio en la secuencia, p. ej., una translocación, una inversión, una deleción, o un cambio en el número de copias en el uno o más locus genéticos diana.
[0696] [0329] En algunas realizaciones, en la presente memoria de describe un método para detectar, identificar, predecir, diagnosticar o controlar un estado genético o una afección o enfermedad genética seleccionada del grupo que consiste en: enfermedades genéticas; mosaicismo genético; pruebas fetales; pruebas de paternidad; pruebas de paternidad; predecir la respuesta al tratamiento farmacológico; diagnosticar o controlar una afección médica; elaboración de perfiles de microbiomas; detección de patógenos; y monitorización del trasplante de órganos que comprende aislar u obtener ADN genómico de una muestra biológica de un sujeto; tratar el ADN con una o más enzimas reparadoras de extremos para generar ADN reparado en los extremos; unir uno o más adaptadores a cada extremo del a Dn reparado en los extremos para generar una biblioteca de ADN genómico; amplificar la biblioteca de ADN genómico para generar una biblioteca de clones de ADN; determinar el número de equivalentes genómicos en la biblioteca de clones de ADN; y realizar un análisis genético cuantitativo de uno o más locus genéticos diana en una biblioteca de clones de ADN para detectar o identificar una transición o transversión de nucleótidos, una inserción o eliminación de nucleótidos, un reordenamiento genómico, un cambio en el número de copias o una fusión génica en la secuencia en uno o más locus genéticos diana.
[0698] Los ejemplos ilustrativos de enfermedades genéticas que pueden detectarse, identificarse, predecirse, diagnosticarse o monitorizarse con las composiciones y métodos contemplados en la presente memoria incluyen, sin limitación, cáncer, la enfermedad de Alzheimer (APOEI), la enfermedad de Charcot-Marie-Tooth, neuropatía óptica hereditaria de Leber (LHON), síndrome de Angelman (UBE3A, ubiquitina-proteína ligasa E3A), síndrome de Prader-Willi (región del cromosoma 15), p-Talasemia (HBB, p-globina), enfermedad de Gaucher (tipo I) (GBA, glucocerebrosidasa), fibrosis quística (canal de cloruro epitelial CFTR), anemia drepanocítica (HBB, p-globina), enfermedad de Tay-Sachs (HEXA, hexosaminidasa A), fenilcetonuria (PAH, fenilalanina hidroliasa), hipercolesterolemia familiar (LDLR, receptor de lipoproteínas de baja densidad), poliquistosis renal en adultos (PKD1, policistina), enfermedad de Huntington (HDD, huntingtina), neurofibromatosis tipo I (NF1, gen supresor de tumores NF1), distrofia miotónica (DM, miotonina), esclerosis tuberosa (TSC1, tuberina), acondroplasia (FGFR3, receptor del factor de crecimiento de fibroblastos), síndrome del cromosoma X frágil (FMRI, proteína de unión al ARN), distrofia muscular de Duchenne (DMD, distrofina), hemofilia A (F8C, factor VIII de la coagulación sanguínea), síndrome de Lesch-Nyhan (HPRT1, hipoxantina guanina ribosiltransferasa 1) y adrenoleucodistrofia (ABCD1).
[0700] Los ejemplos ilustrativos de cánceres que pueden detectarse, identificarse, predecirse, diagnosticarse o monitorizarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a: cáncer de células B, p. ej., mieloma múltiple, melanomas, cáncer de mama, cáncer de pulmón (tal como carcinoma pulmonar no microcítico o NSCLC), cáncer de bronquios, cáncer colorrectal, cáncer de próstata, cáncer de páncreas, cáncer de estómago, cáncer de ovario, cáncer de vejiga urinaria, cáncer del cerebro o del sistema nervioso central, cáncer del sistema nervioso periférico, cáncer de esófago, cáncercervicouterino, cáncer uterino o endometrial, cáncer de la cavidad oral o faringe, cáncer de hígado, cáncer de riñón, cáncer testicular, cáncer de vías biliares, cáncer de intestino delgado o apéndice, cáncer de glándulas salivales, cáncer de glándulas tiroideas, cáncer de glándulas suprarrenales, osteosarcoma, condrosarcoma, cáncer de tejidos hemáticos, adenocarcinomas, tumores miofibroblásticos inflamatorios, tumor del estroma gastrointestinal (GIST), cáncer de colon, mieloma múltiple (MM), síndrome mielodisplásico (SMD), trastorno mieloproliferativo (MPD), leucemia linfocítica aguda (ALL), leucemia mielocítica aguda (AML), leucemia mielocítica crónica (CML), leucemia linfocítica crónica (CLL), policitemia vera, linfoma hodgkiniano, linfoma no hodgkiniano (NHL), sarcoma de tejidos blandos, fibrosarcoma, mixosarcoma, liposarcoma, sarcoma osteogénico, cordoma, angiosarcoma, endoteliosarcoma, linfangiosarcoma, linfangioendoteliosarcoma, sinovioma, mesotelioma, tumor de Ewing, leiomiosarcoma, rabdomiosarcoma, carcinoma de células escamosas, carcinoma de células basales, adenocarcinoma, carcinoma de glándulas sudoríparas, carcinoma de glándulas sebáceas, carcinoma papilar, adenocarcinomas papilares, carcinoma medular, carcinoma broncogénico, carcinoma de células renales, hepatoma, carcinoma de vías biliares, coriocarcinoma, seminoma, carcinoma embrionario, tumor de Wilms, carcinoma de vejiga, carcinoma epitelial, glioma, astrocitoma, meduloblastoma, craneofaringioma, ependimoma, pinealoma, hemangioblastoma, neuroma acústico, oligodendroglioma, meningioma, neuroblastoma, retinoblastoma, linfoma folicular, linfoma difuso de células B grandes, linfoma de células del manto, carcinoma hepatocelular, cáncer de tiroides, cáncer gástrico, cáncer de cabeza y cuello, cánceres microcíticos, trombocitemia esencial, metaplasia mieloide agnogénica, síndrome hipereosinofílico, mastocitosis sistémica, hipereosinofilia familiar, leucemia eosinofílica crónica, cánceres neuroendocrinos, tumores carcinoides y similares.
[0702] En algunas realizaciones, la lesión genética es una lesión anotada en la base de datos Cosmic (las lesiones y los datos de secuencia están disponibles en línea y pueden descargarse de la sección del Cancer Gene Census del sitio web de Cosmic) o una lesión anotada en el Atlas del genoma del cáncer (las lesiones y los datos de secuencia están disponibles en línea y pueden descargarse del sitio web de The Cancer Genome Atlas).
[0704] [0333] Como ejemplos ilustrativos de genes que llevan una o más lesiones genéticas asociadas al cáncer que pueden detectarse, identificarse, predecirse, diagnosticarse o monitorizarse con las composiciones y métodos contemplados en la presente memoria se incluyen, pero sin limitación, ABCB1, ABCC2, ABCC4, ABCG2, ABL1, ABL2, AKT1, AKT2, AKT3, ALDH4A1, ALK, APC, AR, ARAF, ARFRP1, ARID1A, ATM, ATR, AURKA, AURKB, BCL2, BCL2A1, BCL2L1, BCL2L2, BCL6, BRAF, BRCA1, BRCA2, Clorfl44, CARD11, CBL, CCND1, CCND2, CCND3, CCNE1, CDH1, CDH2, CDH20, CDH5, CDK4, CDK6, CDK8, CDKN2A, CDKN2B, CDKN2C, CEBPA, CHEK1, CHEK2, CRKL, CRLF2, CTNNB1, CYP1B1, CYP2C19, CYP2C8, CYP2D6, CYP3A4, CYP3A5, DNMT3A, DOT1L, DPYD, EGFR, EPHA3, EPHA5, EPHA6, EPHA7, EPHB1, EPHB4, EPHB6, EPHX1, ERBB2, ERBB3, ERBB4, ERCC2, ERG, ESRI, ESR2, ETV1, ETV4, ETV5, ETV6, EWSR1, EZH2, F ANC A, FBXW7, FCGR3A, FGFR1, FGFR2, FGFR3, FGFR4, FLT1, FLT3, FLT4, FOXP4, GATAI, GNA11, GNAQ, GNAS, GPR124, GSTP1, GUCY1A2, HOXA3, HRAS, HSP90AA1, IDH1, IDH2, IGF1R, IGF2R, IKBKE, IKZF1, INHBA, IRS2, ITPA, JAKI, JAK2, JAK3, JUN, KDR, KIT, KRAS, LRP1B, LRP2, LTK, MAN1B1, MAP2K1, MAP2K2, MAP2K4, MCL1, MDM2, MDM4, MEN1, MET, MITF, MLH1, MLL, MPL, MRE11A, MSH2, MSH6, MTHFR, MTOR, MUTYH, MYC, MYCL1, MYCN, NF 1, NF2, NKX2-1, NOTCH1, NPM1, NQO1, NRAS, NRP2, NTRK1, NTRK3, PAK3, PAX5, PDGFRA, PDGFRB, PIK3CA, PIK3R1, PKHD1, PLCG1, PRKDC, PTCHI, PTEN, PTPN11, PTPRD, RAFI, RARA, RBI, RET, RICTOR, RPTOR, RUNX1, SLC19A1, SLC22A2, SLCO1B3, SMAD2, SMAD3, SMAD4, SMARCA4, SMARCB1, SMO, SOD2, SOX10, SOX2, SRC, STK11, SULT1A1, TBX22, TET2, TGFBR2, TMPRSS2, TNFRSF14, TOPI, TP53, TPMT, TSC1, TSC2, TYMS, UGT1A1, UMPS, USP9X, VHL y WT1.
[0706] En algunas realizaciones, la lesión genética comprende una transición o transversión de nucleótidos, una inserción o eliminación de nucleótidos, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes. En algunas realizaciones, la lesión genética comprende un desplazamiento (o desfase) del marco de lectura. En algunas realizaciones, la lesión genética comprende un cambio en el corte y empalme. En algunas realizaciones, la lesión genética comprende una variación de un solo nucleótido (SNV).
[0708] En algunas realizaciones, la lesión genética es una fusión génica que fusiona la región codificante 3' del gen ALK con otro gen.
[0710] En algunas realizaciones, la lesión genética es una fusión génica que fusiona la región codificante 3' del gen ALK con el gen EML4.
[0712] En algunas realizaciones, la lesión genética es una cualquiera de las lesiones que se muestran en la Tabla 5 o la Tabla 6. Por ejemplo, la lesión genética puede ser una mutación de TM, un desplazamiento del marco de lectura de BRCA1, un cambio de marco del BRCA2, una mutación G4 de BRCA2 (es decir, una mutación que provoca la formación de una estructura cuádruplex G), una mutación de empalme de FANCA, un desplazamiento del marco de lectura de HDAC2, una mutación Q479 de PALB2 o un desplazamiento del marco de lectura de ATM. En algunas realizaciones, la lesión genética puede ser una mutación ERBB2 1655V, una mutación TP53 Q331, un desplazamiento del marco de lectura de TP53, una fusión aEML4-Alk o una amplificación del EGFR.
[0714] Los ejemplos ilustrativos de afecciones adecuadas para las pruebas fetales que pueden detectarse, identificarse, predecirse, diagnosticarse o monitorizarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a: Síndrome de Down (trisomía 21), síndrome de Edwards (trisomía 18), síndrome de Patau (trisomía 13), síndrome de Klinefelter (XXY), síndrome de Triple X, síndrome XYY, trisomía 8, trisomía 16, síndrome de Turner (XO), translocación robertsoniana, síndrome de DiGeorge y síndrome de Wolf-Hirschhorn.
[0716] Los ejemplos ilustrativos de alelos adecuados para las pruebas de paternidad que pueden detectarse, identificarse, predecirse, diagnosticarse o monitorizarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a, 16 o más de: D20S1082, D6S474, D12ATA63, D22S1045, D10S1248, D1S1677, D11S4463, D4S2364, D9S1122, D2S1776, D10S1425, D3S3053, D5S2500, D1S1627, D3S4529, D2S441, D17S974, D6S1017, D4S2408, D9S2157, amelogenina, D17S1301, D1GATA113, D18S853, D20S482, y D14S1434.
[0718] Los ejemplos ilustrativos de genes adecuados para predecir la respuesta al tratamiento farmacológico que pueden detectarse, identificarse, predecirse, diagnosticarse o monitorizarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a, uno o más de los siguientes genes: ABCB1 (casete de unión a ATP, subfamilia B (MDR/TAP), miembro 1), ECA (enzima convertidora de angiotensina I), ADH1A (alcohol deshidrogenasa 1A (clase I), polipéptido alfa), ADH1B (alcohol deshidrogenasa IB (clase I), polipéptido beta), ADH1C (alcohol deshidrogenasa 1C (clase I), polipéptido gamma), ADRB1 (receptor adrenérgico beta-1), A<d>RB2 (receptor adrenérgico beta-2 de superficie), AHR (receptor hidrocarburos arílicos), ALDH1 (familia de la aldehído deshidrogenasa 1, miembro A1), ALOX5 (araquidonato 5-lipoxigenasa), BRCA1 (cáncer de mama 1, aparición temprana), COMT (catecol-O-metiltransferasa), CYP2A6 (citocromo P450, familia 2, subfamilia A, polipéptido 6), CYP2B6 (citocromo P450, familia 2, subfamilia B, polipéptido 6), CYP2C9 (citocromo P450, familia 2, subfamilia C, polipéptido 9), CYP2C19 (citocromo P450, familia 2, subfamilia C, polipéptido 19), CYP2D6 (citocromo P450, familia 2, subfamilia D, polipéptido 6), CYP2J2 (citocromo P450, familia 2, subfamilia J, polipéptido 2), CYP3 A4 (citocromo P450, familia 3, subfamilia A, polipéptido 4), CYP3A5 (citocromo P450, familia 3, subfamilia A, polipéptido 5), DPYD (dihidropirimidina deshidrogenasa), DRD2 (receptor dopaminérgico D2), F5 (factor de coagulación V), GSTP1 (glutatión S-transferasa pi), HMGCR (3-hidroxi-3-metilglutaril-Coenzima A reductasa), KCNH2 (canal de potasio activado por voltaje, subfamilia H (relacionada con eag), miembro 2), KCNJ11 (canal rectificador interno de potasio, subfamilia J, miembro 11), MTHFR (5,10-metilentetrahidrofolato reductasa (<n>A<d>PH)), NQO1 (NAD(P)H deshidrogenasa, quinona 1), P2RY1 (receptor purinérgico P2Y, acoplado a proteína G, 1), P2RY12 (receptor purinérgico P2Y, acoplado a proteína G, 12), PTGIS (prostaglandina 12 (prostaciclina) sintasa), SCN5A (canal de sodio, activado por voltaje, tipo V, alfa (síndrome de QT largo 3)), SLC19A1 (familia 19 de transportadores de solutos (transportador de folato), miembro 1), SLCO1B1 (familia de transportadores de aniones orgánicos, miembro 1B1), SULT1A1 (familia de sulfotransferasas, citosólica, 1A, con preferencia por fenol, miembro 1), TPMT (tiopurina S-metiltransferasa), TYMS (timidilato sintetasa), UGT1A1 (familia UDP glucuronosiltransferasa 1, polipéptido A1), VDR (receptor de vitamina D (1,25-dihidroxivitamina D3)), VKORC1 (complejo vitamina K epóxido reductasa, subunidad 1).
[0720] Los ejemplos ilustrativos de afecciones médicas que pueden detectarse, identificarse, predecirse, diagnosticarse o monitorizarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a: accidente cerebrovascular, ataque isquémico transitorio, lesión cerebral traumática, enfermedad cardíaca, ataque cardíaco, angina, aterosclerosis e hipertensión arterial.
[0721] Los ejemplos ilustrativos de patógenos que se pueden detectar con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a: bacterias, hongos y virus.
[0723] Los ejemplos ilustrativos de especies bacterianas que pueden seleccionarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a:Mycobacteriumspp.,Pneumococcusspp.,Escherichiaspp.,Campylobacterspp.,Corynebacteriumspp.,Clostridiumspp.,Streptococcusspp.,Staphylococcusspp.,Pseudomonasspp.,Shigellaspp.,Treponemaspp. oSalmonellaspp.
[0725] Los ejemplos ilustrativos de especies fúngicas que pueden seleccionarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a:Aspergillus spp., Blastomyces spp., Candida spp., Coccicioides spp., Cryptococcus spp,dermatofitos,Tinea spp., Trichophyton spp., Microsporum spp., Fusarium spp., Histoplasma spp, Mucoromycotina spp., Pneumocystis spp., Sporothrix spp., Exserophilum spp.oCladosporium spp.
[0727] Los ejemplos ilustrativos de virus que pueden detectarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a: Influenza A como el H1N1, H1N2, H3N2 y H5N1 (gripe aviar), influenza B, virus de la influenza C, virus de la hepatitis A, virus de la hepatitis B, virus de la hepatitis C, virus de la hepatitis D, virus de la hepatitis E, rotavirus, cualquier virus del grupo de los virus de Norwalk, adenovirus entéricos, parvovirus, virus del dengue, viruela del mono, mononegavirales, virus del lisavirus como virus de la rabia, virus de los murciélagos, virus de Mokola, virus de Duvenhage, virus de los murciélagos europeos 1 y 2 y virus de los murciélagos australianos, efemerovirus, vesiculovirus, virus de la estomatitis vesicular (VSV), herpesvirus como el virus del herpes simple de tipo 1 y 2, varicela zóster, citomegalovirus, virus de Epstein-Bar (EBV), herpesvirus humano (HHV), herpesvirus humano de tipo 6 y 8, virus de la leucemia murina de Moloney (m-MuLV), virus del sarcoma murino de Moloney (MoMSV), virus del sarcoma murino de Harvey (HaMuSV), virus del tumor mamario murino (MumTV), virus de la leucemia del simio gibón (GaLV), el virus de la leucemia felina (FLV), el virus del espumavirus, el virus de la leucemia murina Friend, el virus de las células madre murinas (MSCV) y el virus del sarcoma de Rous (RSV), el VIH (virus de la inmunodeficiencia humana); incluidos el HIV tipo 1 y el HIV tipo 2), el virus visna-maedi (VMV), el virus de la artritis-encefalitis caprina (CAEV), el virus de la anemia infecciosa equina (EIAV), el virus de la inmunodeficiencia felina (FIV), el virus de la inmunodeficiencia bovina (BIV) y el virus de la inmunodeficiencia de los simios (SIV), el virus del papiloma, el gammaherpesvirus murino y arenavirus tales como el virus de la fiebre hemorrágica argentina, el virus de la fiebre hemorrágica boliviana, el virus de la fiebre hemorrágica asociada a Sabia, el virus de la fiebre hemorrágica venezolana, el virus de la fiebre de Lassa, el virus de Machupo, el virus de la coriomeningitis linfocítica (LCMV), Bunyaviridiae como el virus de la fiebre hemorrágica de Crimea-Congo, el hantavirus, la fiebre hemorrágica con el virus que causa el síndrome renal, el virus de la fiebre del Valle del Rift, Filoviridae (filovirus), incluidos la fiebre hemorrágica del Ébola y la fiebre hemorrágica de Marburgo, Flaviviridae, incluidos el virus de la enfermedad de Kaysanur Forest, el virus de la fiebre hemorrágica de Omsk, el virus causante de la encefalitis transmitida por garrapatas, y Paramyxoviridae, como el virus Hendra y el virus Nipah, la viruela mayor y la viruela menor (viruela), alfavirus como el virus de la encefalomielitis equina venezolana, el virus de la encefalomielitis equina del este, el virus de la encefalomielitis equina del oeste, el coronavirus asociado al SARS (SARS-CoV), el virus del Nilo Occidental y cualquier virus causante de encefalitis.
[0729] Los ejemplos ilustrativos de genes adecuados para monitorizar un trasplante de órganos en un receptor de trasplante que pueden detectarse, identificarse, predecirse, diagnosticarse o monitorizarse con las composiciones y métodos contemplados en la presente memoria incluyen, pero no se limitan a, uno o más de los siguientes genes: HLA-A, HLA-B, HLA-C, HLA-DR, HLA-DP y HLA-DQ.
[0731] En algunas realizaciones, se utiliza un análisis bioinformático para cuantificar el número de equivalentes genómicos analizados en la biblioteca de clones de ADNlc; detectar variantes genéticas en un locus genético diana; detectar mutaciones dentro de un locus genético diana; detectar fusiones genéticas dentro de un locus genético diana; o medir las fluctuaciones del número de copias dentro de un locus genético diana.
[0733] En algunas realizaciones, se proporciona un diagnóstico complementario para una enfermedad genética, que comprende: aislar u obtener ADN genómico a partir de una muestra biológica de un sujeto; tratar el ADN con una o más enzimas reparadoras de extremos para generar ADN reparado en los extremos; unir uno o más adaptadores a cada extremo del ADN reparado en los extremos para generar una biblioteca de ADN; amplificar la biblioteca de ADN para generar una biblioteca de clones de ADN; determinar el número de equivalentes genómicos en la biblioteca de clones de ADN; y realizar un análisis genético cuantitativo de uno o más biomarcadores asociados a la enfermedad genética en la biblioteca de clones de ADN, en donde la detección, o la ausencia de detección, de al menos uno del uno o más biomarcadores indica si el sujeto debe ser tratado por la enfermedad genética. En algunas realizaciones, el ADN es ADNlc. En algunas realizaciones, el ADN es ADN celular.
[0735] Como se utiliza la presente descripción, la expresión “diagnóstico complementario” se refiere a una prueba de diagnóstico que está relacionada con una terapia contra el cáncer particular. En una realización particular, los métodos de diagnóstico comprenden la detección de una lesión genética en un biomarcador asociado a una muestra biológica, lo que permite la identificación rápida de los pacientes que deben o no ser tratados con la terapia contra el cáncer.
[0737] La terapia contra el cáncer incluye, pero no se limita a, cirugía, radiación, productos quimioterapéuticos, fármacos contra el cáncer e inmunomoduladores.
[0738] Los ejemplos ilustrativos de fármacos contra el cáncer incluyen, pero no se limitan a: agentes alquilantes tales como tiotepa y ciclofosfamida (CYTOXAN™); alquilsulfonatos tales como busulfán, improsulfán y piposulfán; aziridinas tales como benzodopa, carboquona, meturedopa, y uredopa; se resumen las etileniminas y metilamelaminas, incluidas la altretamina, la trietilenmelamina, la trietilenfosforamida, la trietilentiofosforamida y la trimetilolomelamina; mostazas de nitrógeno como clorambucilo, clornafazina, colofosfamida, estramustina, ifosfamida, mecloretamina, clorhidrato de óxido de mecloretamina, melfalán, novembicina, fenesterina, prednimustina, trofosfamida, mostaza de uracilo; nitrosureas tales como carmustina, clorozotocina, fotemustina, lomustina, nimustina, ranimustina; antibióticos como aclacinomisinas, actinomicina, autramicina, azaserina, bleomicinas, cactinomicina, caliqueamicina, carabicina, carminomicina, carzinofilina, cromomicinas, dactinomicina, daunorrubicina, detorubicina, 6-diazo-5-oxo-L-norleucina, doxorrubicina y sus formulaciones pegiladas, epirubicina, esorrubicina, idarrubicina, marcelomicina, mitomicinas, ácido micofenólico, nogalamicina, olivomicinas, peplomicina, potfiromicina, puromicina, quelamicina, rodorrubicina, estreptonigrina, estreptozocina, tubercidina, ubenimex, zinoestatina, zorubicina; antimetabolitos como metotrexato y 5-fluorouracilo (5-FU); análogos del ácido fólico tales como denopterina, metotrexato, pteropterina, trimetrexato; análogos de purina tales como fludarabina, 6-mercaptopurina, tiamiprina, tioguanina; análogos de pirimidina tales como ancitabina, azacitidina, 6-azauridina, carmofur, citarabina, didesoxiuridina, doxifluridina, enocitabina, floxuridina, 5-FU; andrógenos tales como calusterona, propionato de dromostanolona, epitiostanol, mepitiostano, testolactona; antisuprarrenales tales como aminoglutetimida, mitotano, trilostano; reponedor de ácido fólico como el ácido frolínico; aceglatona; glucósido de aldofosfamida; ácido aminolevulínico; amsacrina; bestrabucilo; bisantreno; edatraxato; defofamina; demecolcina; diaziquona; elformitina; acetato de eliptinio; etoglúcido; nitrato de galio; hidroxiurea; lentinano; lonidamina; mitoguazona; mitoxantrona; mopidamol; nitracrina; pentostatina; fenamet; pirarrubicina; ácido podofilínico; 2-etilhidrazida; procarbazina; PSK®; razoxano; sizofiran; espirogermanio; ácido tenuazónico; triaziquona; 2,2',2"-triclorotrietilamina; uretano; vindesina; dacarbazina; mannomustina; mitobronitol; mitolactol; pipobromán; gacitosina; arabinósido (“Ara-C” ); ciclofosfamida; tiotepa; taxoides,. p. ej., paclitaxel (TAXOL®, Bristol-Myers Squibb Oncology, Princeton, Nueva Jersey) y docetaxel (TAXo Te RE®, Rhne-Poulenc Rorer, Antony, Francia); clorambucilo; gemcitabina; 6-tioguanina; mercaptopurina; metotrexato; análogos de platino tales como cisplatino y carboplatino; vinblastina; platino; etopósido (VP-16); ifosfamida; mitomicina C; mitoxantrona; vincristina; vinorelbina; navelbina; novantrona; tenipósido; aminopterina; xeloda; ibandronato; CPT-11; inhibidor de la topoisomerasa RFS 2000; difluorometilomitina (DMFO); derivados del ácido retinoico tales como Targretin™ (bexaroteno), Panretin™ (alitretinoína); ONTAK™ (denileucina diftitox); esperamicinas; capecitabina; y sales, ácidos o derivados farmacéuticamente aceptables de cualquiera de los anteriores. También se incluyen en esta definición los agentes antihormonales que actúan para regular o inhibir la acción hormonal en los cánceres, tales como los antiestrógenos, incluidos, por ejemplo, tamoxifeno, raloxifeno, 4(5)-imidazoles inhibidores de la aromatasa, 4-hidroxitamoxifeno, trioxifeno, keoxifeno, LY117018, onapristona, y toremifeno (Fareston); y antiandrógenos tales como flutamida, nilutamida, bicalutamida, leuprolida y goserelina; y sales, ácidos o derivados farmacéuticamente aceptables de cualquiera de los anteriores.
[0740] Los ejemplos ilustrativos de inmunomoduladores incluyen, pero no se limitan a: ciclosporina, tacrolimus, tresperimus, pimecrolimus, sirolimus, verolimus, laflunimus, laquinimod e imiquimod, así como análogos, derivados, sales, iones y complejos de los mismos.
[0742] En algunas realizaciones, un fármaco contra el cáncer puede incluir un inhibidor de poli-ADP ribosa polimerasa (PARP). Los ejemplos ilustrativos de inhibidores de PARP incluyen, pero no se limitan a, olaparib (AZD-2281), rucaparib (AGO 14699 o PF-01367338), niraparib (MK-4827), talazoparib (BMN-673), veliparib (ABT-888), CEP 9722, E7016, BGB-290, 3-aminobenzamida.
[0744] Los siguientes ejemplos se proporcionan únicamente a modo de ilustración y no a modo de limitación. Los expertos en la técnica reconocerán fácilmente una variedad de parámetros no críticos que podrían modificarse o cambiarse para producir resultados esencialmente similares.
[0746] La práctica de algunas realizaciones de la invención empleará, a menos que se indique específicamente lo contrario, métodos convencionales de química, bioquímica, química orgánica, biología molecular, microbiología, técnicas de ADN recombinante, genética, inmunología, y biología celular, que están dentro de la técnica, muchos de los cuales se describen más adelante a título ilustrativo. Dichas técnicas se explican completamente en la bibliografía. Véase, p. ej., Sambrook, y col.,Molecular Cloning: A Laboratory Manual(3a edición, 2001); Sambrook, y col.,Molecular Cloning: A Laboratory Manual(2a edición, 1989); Maniatis y col.,Molecular Cloning: A Laboratory Manual(1982); Ausubel y col.,Current Protocols in Molecular Biology(John Wiley y Sons, actualizado julio de 2008);Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology,Greene Pub. Associates and Wiley-Interscience; Glover,DNA Cloning: A Practical Approach,vol. I & II (IRL Press, Oxford, 1985); Anand,Techniques for the Analysis of Complex Genomes,(Academic Press, Nueva York, 1992);Transcription and Translation(B. Hames & S. Higgins, Eds., 1984); Perbal,A Practical Guide to Molecular Cloning(1984); y Harlow y Lane,Antibodies,(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1998).
[0747] Ejemplos
[0749] La descripción se ilustra adicionalmente en los siguientes ejemplos. Debe entenderse que los ejemplos se proporcionan para ilustrar determinadas realizaciones y que con ello no se pretende limitar el alcance de la descripción.
[0750] Además, se entiende que se puede recurrir a diversas otras realizaciones, modificaciones y equivalentes de las mismas que puedan sugerirse a aquellos expertos en la técnica sin apartarse del espíritu de la presente descripción.
[0752] Ejemplo 1: Preparación de la biblioteca de adn
[0754] En este ejemplo, se utilizó ADN libre de células y ADN genómico aislado de células inmortalizadas que llevan variantes genéticas (Instituto Coriell de Investigación Médica o SeraCare Life Sciences, Inc.) para la construcción de la biblioteca de NGS (biblioteca de ADN etiquetado con adaptador).
[0756] Tabla 1: Muestras utilizadas en el experimento
[0758]
[0761] El ADN libre de células de un donante sano se extrajo de muestras de plasma (véase la Tabla 1) utilizando un kit QiAmp DSP Circulating NA (Qiagen).
[0763] La ventaja de utilizar la muestra de enfermedad 1 y la muestra de enfermedad 2 generadas en laboratorio es que las composiciones se pueden controlar cuidadosamente como se detalla a continuación, y la disponibilidad de la muestra es esencialmente ilimitada.
[0765] El ADN genómico se cortó con ultrasonido, utilizando un homogeneizador ultrasónico (Covaris®) en un entorno para generar fragmentos de 200 pb, después se purificó adicionalmente y se seleccionó por tamaño utilizando purificación con perlas de “ doble cara” con perlas AmPure XP® paramagnéticas (Beckman®).
[0767] Se combinaron mezclas de ADN genómico de líneas celulares fragmentadas y de ADN sintético con el ADNlc de TS para producir la muestra de enfermedad 1 y la muestra de enfermedad 2 con variantes de un solo nucleótido (SNV), inserciones y deleciones (variantes de indeles), variantes de número de copias (CNV) y fusiones a frecuencias alélicas (FA) definidas, conocidas. Las combinaciones apropiadas de las cantidades de muestra de entrada enumeradas en la tabla anterior se combinaron en porcentajes definidos para permitir la detección de baja frecuencia alélica (FA), se repararon en los extremos y se convirtieron en bibliotecas de ADN etiquetado como se describe a continuación.
[0769] Ejemplo 2: Reparación de extremos de adn en una sola etapa opcional
[0771] Los fragmentos de ADN de entrada se convirtieron en “ fragmentos de ADN reparados en los extremos” , de modo que los fragmentos de ADN reparados en los extremos poseen grupos fosfato en 5' y salientes de nucleótidos de dA en 3' en una sola mezcla de reacción (reparación de extremos de una sola etapa).
[0773] Para la reparación de extremos de los fragmentos de ADN se utilizó un kit disponible en el comercio (módulo NEB Ultra II End Repair®/adición de cola de dA (E7546L)). La mezcla End Repair Master Mix® (“ End Repair MM” , mezcla maestra (MM) de reparación de extremos), se añadió a los fragmentos de ADN extendidos en una mezcla de reacción de un solo tubo. La mezcla End Repair MM se preparó combinando la mezcla NebNext Ultra II End Prep Enzyme Mix® con el tampón NebNext Ultra II End Prep Reaction Buffer®, siendo cada mezcla o tampón un componente del módulo NebNext Ultra II End Prep/adición de cola de dA(dA-tailing)(New England Biolabs®). La mezcla de reacción que contenía los fragmentos de ADN extendidos se incubó en un termociclador en las siguientes condiciones de reacción: 20 °C durante 15 minutos y después a 70 °C durante 10 minutos (una “ reacción de una sola etapa” ).
[0775] [0364] En algunas realizaciones, la etapa de reparación de extremos/adición de cola se optimizó de tal modo que, en la reacción de una sola etapa, se utilicen cantidades significativamente más bajas de mezcla maestra (MM) de reparación de extremos (End Repair) que las cantidades recomendadas por el fabricante para realizar dicha reacción. En algunas realizaciones, la reducción de las cantidades de la MM de reparación de extremos, tampoco tuvo, sorprendentemente, ningún impacto adverso en la formación de fragmentos de ADN con reparación de extremos (con un promedio de > 3500 GE), como lo demostró la eficiencia de clonación de los fragmentos de ADN con reparación de extremos utilizando los adaptadores de la descripción y los equivalentes genómicos de la biblioteca de NGS resultante que se observó. De hecho, sorprendentemente, la eficiencia de la clonación aumentó utilizando este proceso de reparación de extremos de una sola etapa, tal como se describe en la descripción. Ejemplo 3: Ligamiento con adaptador
[0776] Se ligó un conjunto de cadenas de ligamiento con cola de dT en 3' de los módulos adaptadores multifuncionales a fragmentos de ADN reparados en los extremos de las muestras anteriores, lo que dio como resultado la unión del adaptador al extremo 5' de los fragmentos. Las cadenas complementarias sin ligamiento no se ligaron al extremo con cola de 3' dA de los fragmentos de ADN. En la Tabla 2 y la Tabla 3 se proporciona una descripción de los adaptadores utilizados en este experimento.
[0777] Se añadieron 45 ul de la mezcla de reacción de reparación de extremos (que contenía fragmentos de ADN reparados en los extremos con extremos fosforilados en 5' y salientes de nucleótidos de dA en 3') a 5,0 pl de un conjunto de módulos adaptadores multifuncionales únicos (5 pM) y 30 pl de NEB Ultra II Ligation Mix® (New England Biolabs®, MA, EE. UU.). Cada cadena de ligamiento de los módulos adaptadores tenía una longitud de 47 nt y comprendía (de 5' -> 3') una región de amplificación (AMP, 25 nt), una región de iD multifuncional (8 nt) capaz de identificar tanto la muestra como el fragmento único, un multiplicador de UMI (3 nt), un anclaje (10 nt) y un saliente de dT en 3'. Las cadenas de ligamiento utilizadas en este ejemplo se proporcionan en la Tabla 2. El conjunto de los módulos adaptadores se preparó de tal modo que cada conjunto de adaptadores contenía cantidades equimolares de módulos adaptadores que comprendían los cuatro tipos de regiones de anclaje, donde cada tipo de anclaje tiene un nucleótido terminal en 3' seleccionado entre A, T, C y G.
[0778] Tabla 2: Estructuras adaptadoras
[0780]
[0782] La mezcla de reacción se incubó a 20 °C durante 30 minutos para generar los fragmentos de ADN etiquetados con adaptador.
[0783] Tabla 3. Secuencias adaptadoras ilustrativas utilizadas para crear una biblioteca amplificada y no amplificada de ADN etiquetado
[0785]
[0786] a continuación
[0788]
[0790] * NNN en las secuencias de la Tabla 3 representa un multiplicador de UMI de 3 nucleótidos, en donde cada N puede seleccionarse de una cualquiera de A, G, C, T.
[0792] Después del ligamiento, 100 j l de perlas de purificación de ADN (Ampure XP®); Beckman®) se añadieron a la mezcla de ligamiento. La mezcla de reacción se incubó a temperatura ambiente durante 2 min. Las perlas se lavaron dos veces con 200 j l de etanol/agua al 80 % (v/v) mientras estaban sobre un imán, se secaron al aire y después se eluyeron con 25 j l de TRIS-EDTA (TEZ). El sobrenadante clarificado eluido, de aproximadamente 25 j l que contenía los fragmentos de ADN etiquetados con adaptador, se transfirió a un tubo de PCR o a un pocillo de placa de microtitulación nuevo para su amplificación y generar la biblioteca de ADN etiquetado con adaptador.
[0793] Ejemplo 4: Extensión y amplificación de la biblioteca de adn etiquetado
[0795] Después del ligamiento con adaptador en el ejemplo 3, se añadieron 75 j l de una mezcla maestra (MM) que contenía reactivos y la enzima polimerasa de ADN termófila (NEB Ultra II 2X PCR Amplification®); New England Biolabs®) y la mezcla de reacción se amplificó utilizando los siguientes parámetros de procesamiento:
[0797] 60 °C durante 30 segundos, 72 °C durante 2 minutos, 98 °C durante 30 segundos;
[0799] 8 ciclos de 98 °C durante 30 segundos, 65 °C durante 30 segundos y 72 °C durante 30 segundos.
[0801] Se usó un único cebador de amplificación: TGCAGGACCAGAGAATTCGAATACA (Id. de sec. n.°: 70).
[0803] El ciclo de incubación inicial de 3 minutos se llevó a cabo para formar una pluralidad de 78 fragmentos contiguos de ADNbc etiquetados con adaptador mediante extensión con moldes de cadenas de ligamiento, seguido de una amplificación por PCR de 8 ciclos de los fragmentos contiguos de ADNbc etiquetados con adaptador para formar una biblioteca amplificada de ADN etiquetado que contenía moléculas de fragmentos de ADN etiquetado con adaptador.
[0805] Después de la amplificación, se añadieron 120 j l de perlas de purificación de ADN a la mezcla de ligamiento. La mezcla de reacción se incubó a temperatura ambiente durante 2 min. Las perlas se lavaron dos veces con 200 j l de etanol/agua al 80 % (v/v) mientras estaban sobre un imán, se secaron al aire y después se eluyeron con 14 j l de TEZ. El sobrenadante clarificado que contenía la biblioteca amplificada de ADN etiquetado se transfirió a un tubo de PCR nuevo.
[0807] Utilizando estos métodos, se redujo el tiempo de preparación de bibliotecas de alta eficiencia de aproximadamente 8 horas a aproximadamente 3 a 4 horas. La complejidad se redujo a medida que el número de reactivos enzimáticos/de kit, incluidas las enzimas utilizadas en los ejemplos, disminuyó de 16 a 4.
[0809] Ejemplo 5: Amplificación (profética) de la biblioteca de sondas de captura
[0811] Para capturar y enriquecer los locus genéticos de interés, cada biblioteca de ADN etiquetado (p. ej., la muestra de enfermedad 1 y la muestra de enfermedad 2) preparada como se describe en el ejemplo 2 se combina, multiplexa e hibrida con un conjunto de módulos de sonda de captura multifuncionales específicos para genes homólogos deficientes en reparación (p. ej., ATM, BRCA1, BRCA2, FANCA, HDAC2 y PALB2) o con un grupo de módulos de sonda de captura multifuncionales específicos para genes de cáncer de pulmón (p. ej., ERBB2, TP53, fusión EML4-ALK, EGFR, MET).
[0813] A continuación, se combinan 100 j l de perlas recubiertas con estreptavidina (MyOne Cl de Dynabeads) con la reacción de hibridación y se dejan reposar a temperatura ambiente durante 20 minutos. Las perlas se recogen con un imán y se lavan una vez con 200 j l de tampón TEZ. Las perlas lavadas se vuelven a suspender en 40 j l de tampón TEZ. Se añaden 160 j l de un tampón de lavado a las perlas resuspendidas y la mezcla se incuba durante 5 minutos a 45 °C. Después, las perlas se separan con un imán y se lavan con 200 j l de tampón TEZ.
[0815] Tras la hibridación, la extensión con cebador de la sonda de captura se utiliza para copiar las secuencias genómicas capturadas, el saliente de A/T en la unión del fragmento de ADN y el módulo adaptador unido para formar una biblioteca de moléculas híbridas. Las moléculas híbridas así formadas comprenden el fragmento de ADN flanqueado por el módulo de sonda de captura en un extremo y el módulo adaptador en el otro extremo.
[0817] Tras la extensión de la sonda en la perla, se realiza una PCR para incorporar los adaptadores de secuenciación Illumina®. Las perlas se resuspenden en 20 ul de TEZ, se combinan con una mezcla maestra de PCR (55 ul de mezcla de PCR Ultra II, 5,5 ul de Cebador directo (F), 5,5 ul de Cebador inverso (R)), se colocan en un termociclador y se procesan según el siguiente programa: 60 °C durante 30 segundos; 72 °C durante 30 segundos; 98 °C durante 30 segundos; 5 ciclos de 98 °C durante 30 segundos; 65 °C durante 30 segundos; 72 °C durante 30 segundos
[0819] A continuación, las perlas se separan de la mezcla de reacción con un imán. El sobrenadante se transfiere a un tubo de PCR nuevo, se combina con la MM de PCR y se amplifica en un termociclador utilizando los siguientes ciclos de amplificación: 10 ciclos de 98 °C durante 30 segundos; 65 °C durante 30 segundos; 72 °C durante 30 segundos
[0821] Cebador directo:
[0823] AATGATACGGCGACCACCGAGATCTACACGTCATGCAGGACCAGAGAATTCGAATACA (Id. de sec. n.°: 71).
[0825] Cebador inverso:
[0827] CAAGCAGAAGACGGCATACGAGATGTGACTGGCACGGGAGTTGATCCTGGTTTTCAC (Id. de sec. n.°: 72).
[0829] [0381] Esta biblioteca de moléculas híbridas se amplifica por PCR para proporcionar bibliotecas de ADN diana amplificadas que contienen moléculas híbridas amplificadas de cada una de las muestras. Estas moléculas híbridas amplificadas están “ listas para la secuenciación” porque contienen sitios de unión al cebador de secuenciación en los dos extremos de la molécula, como se muestra en la figura 8.
[0830] Ejemplo 6: Análisis de secuencias
[0831] El análisis genético se realizó en moléculas híbridas. Para el análisis genético se utilizaron las lectura de secuenciación 1 (151 nt) y 2 (17 nt). Para realizar correctamente los análisis de agrupamiento y alineación, cada lectura de secuencia individual se procesó para excluir bioinformáticamente las inserciones de nucleótidos A/T (que se generaron a partir de los salientes 3' terminal del adaptador y de los salientes 5' terminal de los fragmentos de ADN). Esta exclusión de la inserción de A/T se realizó sometiendo las lecturas de secuencia a un análisis genético utilizando métodos bioinformáticos. Los algoritmos de llamada de variantes identificaron las lecturas redundantes y procesaron las lecturas redundantes en una única lectura consenso que después se cuantificó en cada ubicación de la sonda. Los algoritmos de llamada de variantes identificaron además la unión del adaptador y el extremo 5' de cada fragmento de ADN para excluir bioinformáticamente los salientes de A/T insertados para obtener secuencias de fragmentos de ADN específicas de cada muestra de manera correcta. La exclusión de la inserción de A/T durante el análisis genético aumentó la calidad y redujo la alineación incorrecta y/o la agrupación inexacta de las lecturas de secuencia. Finalmente, se asignó significación estadística a las desviaciones detectadas en cada variante de medición.
[0832] Ejemplo 7: Mejora de la profundidad de secuenciación
[0833] La secuenciación se realizó en la biblioteca de ADN etiquetado generada anteriormente. La biblioteca de ADN etiquetado se alineó con un genoma de referencia humano y se mapeó al objetivo previsto.
[0834] Utilizando un proceso comparador y el proceso automatizable (véase la figura 4C), se midió la profundidad promedio de 3 bibliotecas de ADN etiquetado (ADNlc TS, muestra 1 de enfermedad y muestra 2 de enfermedad).
[0835] Ejemplo 8: Distribución uniforme de adaptadores
[0836] En el presente ejemplo, se redujo el sesgo contra la inclusión de determinadas secuencias adaptadoras en una biblioteca de ADN etiquetado, según lo medido por las lecturas de secuencias. La preparación de la biblioteca utilizando el proceso Atomatizable mostró una mejor distribución de los adaptadores en comparación con la preparación de la biblioteca utilizando el proceso Comparador, lo que eliminó la necesidad de compensar los adaptadores menos eficientes. La distribución del anclaje resultante se representa en la figura 9 y en la Tabla 4. Tabla 4: Comparación de preparación de bibliotecas para la distribución de adaptadores
[0838]
[0840] Ejemplo 9: Detección de variantes
[0841] Las tablas 6 y 7 muestran el número de lecturas de secuenciación para cada variante en las cadenas de Watson (+) o Crick (-) que se obtiene de muestras preparadas en el ejemplo 1 (muestra de enfermedad 1 y muestra de enfermedad 2). Como puede verse en la Tabla 5, para la muestra de enfermedad 1, el promedio de lecturas para la cadena variante positiva (cadena ) utilizando el proceso automatizable fue de 94, mientras que fue de 66 utilizando el proceso comparador. De manera similar, para la muestra de enfermedad 2, el promedio de lecturas para la cadena variante positiva (cadena ) utilizando el proceso automatizable fue de 238, mientras que fue de 199 utilizando el proceso comparador para la muestra de enfermedad 1. Estos resultados sugieren que, para cada una de las variantes detectadas ensayadas, el proceso para crear la biblioteca de ADN etiquetado y la biblioteca de sondas de captura, fue mucho más eficiente, ya que puede medirse por el aumento del número de lecturas de cada variante e indicar un aumento en la sensibilidad del ensayo.
[0842] Tabla 5: Comparación de detección de variantes entre el proceso automatizable y el proceso comparador utilizando bibliotecas preparadas a partir de la muestra de enfermedad 1
[0844]
[0845] a continuación
[0846]
[0848] Tabla 6: Comparación de detección de variantes entre el proceso automatizable y el proceso comparador utilizando bibliotecas preparadas a partir de la muestra de enfermedad 2
[0849]
[0850] a continuación
[0852]
[0854] Ejemplo 10: Mejoras en la amplificación de bibliotecas genómicas
[0855] Las condiciones para amplificar las bibliotecas genómicas se probaron en tres condiciones diferentes: 1) llevando a cabo la amplificación de una biblioteca que se había dividido en 2 tubos distintos a una temperatura de hibridación de 69 °C;
[0856] 2) llevando a cabo la amplificación de una biblioteca que se había dividido en 2 tubos distintos a una temperatura de hibridación de 65 °C; y
[0857] 3) llevando a cabo la amplificación sin dividir la biblioteca (en 1 tubo) a una temperatura de hibridación de 65 °C (Tabla 7).
[0858] Las condiciones de amplificación que se llevaron a cabo sin dividir la biblioteca a una temperatura de hibridación de 65 °C (condición 3) funcionaron bien, eliminando la necesidad de dividir la biblioteca en 2 tubos de muestra y simplificando el proceso de preparación de la biblioteca.
[0859] Tabla 7: Optimización de las condiciones de amplificación
[0861]

Claims (14)

1. REIVINDICACIONES
1. Un adaptador multifuncional que comprende:
a) un oligonucleótido de cadena de ligamiento, y
b) un oligonucleótido de cadena sin ligamiento que es capaz de hibridarse con una región en el extremo 3' del oligonucleótido de cadena de ligamiento y formar un dúplex con la misma;
en donde, al entrar en contacto con un fragmento de ADNbc de una muestra, el oligonucleótido de cadena de ligamiento se liga al extremo 5' de cada cadena del fragmento de ADNbc;
en donde el oligonucleótido de cadena de ligamiento comprende:
i) un saliente 3' terminal;
ii) una región de amplificación que comprende una secuencia de polinucleótidos capaz de servir como sitio de reconocimiento de cebadores;
iii) una región de ID multifuncional única;
iv) un multiplicador de identificador único de molécula (UMI); y
v) una región de anclaje que comprende una secuencia de polinucleótidos que es al menos parcialmente complementaria al oligonucleótido de cadena sin ligamiento;
en donde el fragmento de ADNbc comprende un grupo fosfato en el extremo 5' de cada cadena y un saliente en el extremo 3' de cada cadena;
en donde la combinación de la región de ID multifuncional y el multiplicador de UMI identifica el fragmento de ADNbc; y
en donde la región de ID multifuncional identifica la muestra.
2. El adaptador multifuncional de la reivindicación 1,
en donde el oligonucleótido de cadena de ligamiento comprende un saliente de dT en el extremo 3' y el fragmento de ADNbc comprende un saliente de dA en el extremo 3' de cada cadena;
en donde el oligonucleótido de cadena de ligamiento comprende un saliente de dA en el extremo 3' y el fragmento de ADNbc comprende un saliente de dT en el extremo 3' de cada cadena;
en donde el oligonucleótido de cadena de ligamiento comprende un saliente de dC en el extremo 3' y el fragmento de ADNbc comprende un saliente de dG en el extremo 3' de cada cadena; o
en donde el oligonucleótido de cadena de ligamiento comprende un saliente de dG en el extremo 3' y el fragmento de ADNbc comprende un saliente de dC en el extremo 3' de cada cadena;
y/o en donde el oligonucleótido de cadena sin ligamiento comprende una modificación en su extremo 3' que impide el ligamiento con el extremo 5' del fragmento de ADNbc y/o la formación del dímero adaptador, en donde la cadena sin ligamiento es capaz de desplazarse del dúplex.
3. El adaptador multifuncional de una cualquiera de las reivindicaciones 1-2,
en donde la región de amplificación tiene una longitud de 25 nucleótidos;
en donde la región de ID multifuncional tiene una longitud de 8 nucleótidos;
en donde el multiplicador de UMI tiene una longitud de 3 nucleótidos;
en donde la región de anclaje tiene una longitud de 10 nucleótidos;
en donde el multiplicador de UMI es adyacente a o está contenido en la región de ID multifuncional; y en donde la región de anclaje comprende una de las cuatro secuencias de nucleótidos.
4. Un complejo que comprende un adaptador multifuncional y un fragmento de ADNbc, en donde el adaptador multifuncional se selecciona de uno cualquiera de los adaptadores multifuncionales de las reivindicaciones 1-3.
5. Un método para crear una biblioteca de ADN etiquetado con adaptador que comprende:
a) ligar una pluralidad de adaptadores multifuncionales con una pluralidad de fragmentos de ADNbc para generar una pluralidad de complejos de adaptador multifuncional/fragmento de ADNbc, en donde cada una de la pluralidad de adaptadores multifuncionales se selecciona de uno cualquiera de los adaptadores multifuncionales de las reivindicaciones 1 a 3; y, opcionalmente,
b) poner en contacto la pluralidad de complejos de la etapa (a) con una o más enzimas para formar una biblioteca de ADN etiquetado con adaptador que comprende una pluralidad de fragmentos contiguos de ADN etiquetado con adaptador.
6. El método de la reivindicación 5, en donde cada complejo de adaptador multifuncional/fragmento de ADNbc de la pluralidad de complejos comprende un adaptador multifuncional ligado a cada extremo del fragmento de ADNbc.
7. El método de la reivindicación 5 o la reivindicación 6, en donde la pluralidad de fragmentos de ADNbc comprende ADN libre de células (ADNlc), ADN genómico (ADNg), ADN complementario (ADNc), ADN mitocondrial, ADN metilado o ADN desmetilado, y/o en donde la pluralidad de fragmentos de ADNbc se repara en los extremos antes de ligarlos con una pluralidad de adaptadores multifuncionales.
8. El método de una cualquiera de las reivindicaciones 5-7, en donde el oligonucleótido de cadena sin ligamiento se desplaza del complejo adaptador multifuncional/fragmento de ADNbc en la etapa (b).
9. El método de una cualquiera de las reivindicaciones 5-8, en donde el método comprende amplificar la pluralidad de fragmentos contiguos de ADN etiquetado con adaptador para generar una biblioteca amplificada de ADN etiqueto con adaptador que comprende una pluralidad de fragmentos contiguos de ADNbc etiquetado con adaptador amplificados, opcionalmente en donde uno o más cebadores se utilizan para la amplificación, en donde uno o más cebadores comprenden una secuencia de unión al cebador universal que se hibrida con la región de unión al cebador del adaptador.
10. Un método para crear una biblioteca capturada por sonda que comprende:
a) crear una biblioteca etiquetada con adaptador según el método de una cualquiera de las reivindicaciones 5 a 9; b) hibridar la biblioteca de ADN etiquetado con adaptador con una o más sondas de captura multifuncionales para formar uno o más complejos de ADN etiquetados con sonda de captura/adaptador, en donde cada sonda de captura multifuncional comprende
i) una primera región capaz de hibridarse con un oligonucleótido compañero, en donde, opcionalmente, la primera región comprende una secuencia de cola que comprende un sitio de unión al cebador de la PCR; y ii) una segunda región capaz de hibridarse con una región diana en la biblioteca de ADN etiquetado con adaptador; c) aislar el uno o más complejos de ADN etiquetados con sonda de captura/adaptador de la etapa (b), en donde cada complejo de a Dn etiquetado con sonda de captura/adaptador aislado, comprende una sonda de captura y un fragmento de ADN etiquetado con adaptador; y
d) procesar enzimáticamente los complejos aislados de sonda de captura/fragmento de ADN de la etapa (c) para generar una biblioteca de ADN capturada por sonda que comprende moléculas híbridas, comprendiendo cada molécula híbrida:
i) al menos una parte de una sonda de captura o un complemento de la misma;
ii) al menos una parte de un fragmento de ADN o un complemento del mismo; y
iii) un adaptador.
11. El método de la reivindicación 10, en donde la etapa de procesamiento enzimático de (d) comprende realizar la extensión de la sonda de captura con polimerasa de ADN en dirección 5'-3' utilizando, como molde, el fragmento de ADN marcado con adaptador del complejo, y/o en donde al menos una sonda de captura se hibrida en dirección 3' de una región diana y al menos una sonda de captura se hibrida en dirección 5' de la región diana.
12. El método de una cualquiera de las reivindicaciones 10-11, que adicionalmente comprende:
e) realizar una PCR en las moléculas híbridas de la etapa (d) para generar moléculas híbridas amplificadas.
13. Una biblioteca capturada por sonda que comprende moléculas híbridas o moléculas híbridas amplificadas producidas según una cualquiera de las reivindicaciones 10-12.
14. Un método que comprende realizar un análisis genético específico en la biblioteca capturada por sonda de la reivindicación 13, opcionalmente en donde el análisis genético específico comprende un análisis de secuencia o un análisis del número de copias, y/o en donde se secuencia toda o una parte de la región de la sonda de captura en cada una de las moléculas híbridas.
ES21867505T 2020-09-08 2021-09-08 Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis Active ES3045482T3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202063075543P 2020-09-08 2020-09-08
PCT/US2021/049448 WO2022055984A1 (en) 2020-09-08 2021-09-08 Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis

Publications (1)

Publication Number Publication Date
ES3045482T3 true ES3045482T3 (en) 2025-11-28

Family

ID=80469537

Family Applications (1)

Application Number Title Priority Date Filing Date
ES21867505T Active ES3045482T3 (en) 2020-09-08 2021-09-08 Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis

Country Status (13)

Country Link
US (1) US20220073906A1 (es)
EP (1) EP4211246B1 (es)
JP (1) JP2023540782A (es)
KR (1) KR20230065295A (es)
CN (1) CN116490613A (es)
AU (1) AU2021340632A1 (es)
CA (1) CA3189103A1 (es)
DK (1) DK4211246T3 (es)
ES (1) ES3045482T3 (es)
HU (1) HUE072019T2 (es)
PL (1) PL4211246T3 (es)
PT (1) PT4211246T (es)
WO (1) WO2022055984A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG10202009015SA (en) 2012-12-10 2020-10-29 Resolution Bioscience Inc Methods for targeted genomic analysis
US20160053301A1 (en) 2014-08-22 2016-02-25 Clearfork Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna
CN115029413A (zh) * 2022-05-17 2022-09-09 翌圣生物科技(上海)股份有限公司 一种dna和/或rna快速建库的方法和试剂盒
WO2024049276A1 (ko) * 2022-09-01 2024-03-07 주식회사 키오믹스 다중 표적 dna의 선택적 증폭용 조성물 및 이를 이용한 증폭 방법

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6709778B2 (ja) * 2014-08-22 2020-06-17 レゾリューション バイオサイエンス, インコーポレイテッド 無細胞DNA(cfDNA)の定量的遺伝子解析のための方法
CA3004435A1 (en) * 2015-11-11 2017-05-18 Resolution Bioscience, Inc. High efficiency construction of dna libraries
US11708574B2 (en) * 2016-06-10 2023-07-25 Myriad Women's Health, Inc. Nucleic acid sequencing adapters and uses thereof
GB201615486D0 (en) * 2016-09-13 2016-10-26 Inivata Ltd Methods for labelling nucleic acids
CA3268717A1 (en) * 2016-12-09 2025-11-29 Ncan Genomics, Inc. Bound ligature
EP3559255A1 (en) * 2016-12-23 2019-10-30 Grail, Inc. Methods for high efficiency library preparation using double-stranded adapters
EP4008796B1 (en) * 2017-01-27 2023-08-09 Integrated DNA Technologies, Inc. Construction of next generation sequencing (ngs) libraries using competitive strand displacement
AU2018252018A1 (en) * 2017-04-14 2019-10-10 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
JP7296969B2 (ja) * 2018-01-12 2023-06-23 クラレット バイオサイエンス, エルエルシー 核酸を解析するための方法および組成物
WO2020106906A1 (en) * 2018-11-21 2020-05-28 Avida Biomed, Inc. Methods for targeted nucleic acid library formation
WO2020132316A2 (en) 2018-12-19 2020-06-25 New England Biolabs, Inc. Target enrichment

Also Published As

Publication number Publication date
AU2021340632A1 (en) 2023-03-16
PL4211246T3 (pl) 2025-10-20
JP2023540782A (ja) 2023-09-26
CN116490613A (zh) 2023-07-25
CA3189103A1 (en) 2022-03-17
EP4211246A4 (en) 2024-07-24
DK4211246T3 (da) 2025-08-18
EP4211246A1 (en) 2023-07-19
PT4211246T (pt) 2025-07-30
EP4211246B1 (en) 2025-07-23
KR20230065295A (ko) 2023-05-11
HUE072019T2 (hu) 2025-10-28
WO2022055984A1 (en) 2022-03-17
US20220073906A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
JP7318054B2 (ja) Dnaライブラリーの高効率構築
US20220325353A1 (en) Methods for the detection of genomic copy changes in dna samples
ES2984266T3 (es) Métodos para el análisis genético cuantitativo del ADN libre de células
ES3045482T3 (en) Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis
US20240191293A1 (en) Compositions and methods for simultaneous genetic analysis of multiple libraries
HK40096223A (en) Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis
HK40096223B (en) Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis
BR112019003704B1 (pt) Método para realizar uma análise genética em uma região alvo de dna a partir de uma amostra de teste
BR112018009606B1 (pt) Método para construir uma biblioteca de dna e de previsão, diagnóstico ou monitoramento de doença genética