ES2855137T3 - Bibliotecas codificadas por ADN que tienen vínculos de oligonucleótidos codificadores que no se pueden leer por polimerasas - Google Patents

Bibliotecas codificadas por ADN que tienen vínculos de oligonucleótidos codificadores que no se pueden leer por polimerasas Download PDF

Info

Publication number
ES2855137T3
ES2855137T3 ES18158509T ES18158509T ES2855137T3 ES 2855137 T3 ES2855137 T3 ES 2855137T3 ES 18158509 T ES18158509 T ES 18158509T ES 18158509 T ES18158509 T ES 18158509T ES 2855137 T3 ES2855137 T3 ES 2855137T3
Authority
ES
Spain
Prior art keywords
group
oligonucleotide
tags
sequence
chemical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18158509T
Other languages
English (en)
Inventor
Anthony Keefe
Alexander Litovchick
Matthew Clark
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
X Chem Inc
Original Assignee
X Chem Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=49916571&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2855137(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by X Chem Inc filed Critical X Chem Inc
Application granted granted Critical
Publication of ES2855137T3 publication Critical patent/ES2855137T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1044Preparation or screening of libraries displayed on scaffold proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

Un método para determinar la secuencia de nucleótidos de un complejo que comprende: (i) una entidad química que comprende uno o más andamios o uno o más bloques de construcción; (ii) n número de etiquetas oligonucleotídicas que tienen n-1 enlaces, donde n es un número entero entre 1 y 10, y donde cada uno de dichos enlaces está entre dos etiquetas adyacentes y cada etiqueta codifica la identidad de al menos una de dichas una o más andamios o bloques de construcción; y (iii) un dominio auricular que tiene un primer grupo funcional asociado operativamente con dicha entidad química y un segundo grupo funcional asociado operativamente con al menos una de dicho n número de etiquetas a través de un primer enlace, en donde una polimerasa tiene una capacidad reducida para leer o translocar a través de al menos uno de dicho primer enlace y n-1 enlace; en donde al menos uno de dicho primer enlace y enlace n-1 comprende un enlace químico; y en donde dicho enlace químico comprende un grupo químico reactivo, un grupo fotorreactivo, un resto intercalante o un oligonucleótido reticulante, comprendiendo dicho método: (a) hibridar uno o más cebadores de relevo con dicho complejo, en donde dicho uno o más más cebadores de retransmisión abarcan dicho primer enlace y/o n-1 enlaces, en donde dicho complejo comprende un conector 5' en el extremo 5' de una o más etiquetas y un conector 3' en el extremo 3' de una o más más etiquetas, y en donde cada uno de dichos uno o más cebadores de retransmisión se hibrida con conectores 5' y 3' adyacentes; (b) extender dichos cebadores de retransmisión usando una polimerasa para producir fragmentos de oligonucleótidos; (c) ligar dichos fragmentos de oligonucleótidos para producir una plantilla; (d) opcionalmente amplificar dicha plantilla mediante reacción en cadena de la polimerasa para producir una mezcla amplificada; y (e) secuenciar dicha mezcla opcionalmente amplificada para determinar la secuencia de dicho complejo.

Description

DESCRIPCIÓN
Bibliotecas codificadas por ADN que tienen vínculos de oligonucleótidos codificadores que no se pueden leer por polimerasas
Antecedentes de la invención
[0001] En general, esta invención se refiere a bibliotecas codificadas en el ADN de los compuestos y métodos de uso de tales bibliotecas. También se describen composiciones para su uso en tales bibliotecas.
[0002] Las bibliotecas combinatorias codificadas por ADN proporcionan muchos beneficios para el descubrimiento de fármacos. Estas bibliotecas pueden proporcionar una gran cantidad de compuestos diversos que se pueden cribar e interrogar rápidamente. Para aumentar aún más la complejidad, se pueden programar y automatizar varios pasos del proceso de descubrimiento. Estos pasos incluyen el uso de síntesis de múltiples pasos, escisión y agrupación para agregar bloques de construcción a andamios atómicos o poliatómicos y el uso de ligación enzimática y/o química para agregar etiquetas de oligonucleótidos que codifican tanto los pasos sintéticos como los bloques de construcción.
[0003] A pesar de estos beneficios, numerosos problemas pueden surgir cuando las bibliotecas muy grandes o complejas se deben sintetizar y deconvolucionar. A medida que aumenta el tamaño de la biblioteca, pueden ser necesarios métodos mejorados para proporcionar altos rendimientos de ligación de etiquetas de oligonucleótidos codificantes utilizando metodologías sólidas y rápidas. Para crear bibliotecas en diversas condiciones de reacción, serían beneficiosas construcciones de oligonucleótidos estables, tales como construcciones que son estables en condiciones de pH alto y temperatura elevada. Para simplificar la deconvolución de las etiquetas, la secuencia de las etiquetas podría ser reconocida por polimerasas dependientes de ADN o ARN, de manera que los datos demográficos de la población de etiquetas se puedan determinar mediante polimerización dependiente de la plantilla y determinación de secuencia. Pueden surgir dificultades al crear una biblioteca que tenga todos estos atributos beneficiosos. Por consiguiente, existe la necesidad de métodos mejorados y más robustos de cribado e identificación de pequeños compuestos en bibliotecas codificadas por oligonucleótidos.
Resumen de la invención
[0004] La invención se refiere a un método para determinar la secuencia de nucleótidos de un complejo que comprende:
(i) una entidad química que comprende uno o más andamios o uno o más bloques de construcción;
(ii) n número de etiquetas oligonucleotídicas que tienen enlaces n-1, donde n es un número entero entre 1 y 10, y donde cada uno de dichos enlaces está entre dos etiquetas adyacentes y cada etiqueta codifica la identidad de al menos una de dichas una o más andamios o bloques de construcción; y
(iii) un dominio auricular que tiene un primer grupo funcional asociado operativamente con dicha entidad química y un segundo grupo funcional asociado operativamente con al menos una de dicho n número de etiquetas a través de un primer enlace,
en donde una polimerasa tiene una capacidad reducida para leer o translocar a través de al menos uno de dicho primer enlace y enlace n-1;
en donde al menos uno de dicho primer enlace y enlace n-1 comprende un enlace químico; y
en donde dicho enlace químico comprende un grupo químico reactivo, un grupo fotorreactivo, un resto intercalante o un oligonucleótido reticulante, comprendiendo dicho método:
(a) hibridar uno o más cebadores de relevo con dicho complejo, en donde dicho uno o más más cebadores de retransmisión abarcan dicho primer enlace y/o enlaces n-1, en donde dicho complejo comprende un conector 5’ en el extremo 5' de una o más etiquetas y un conector 3’ en el extremo 3' de una o más más etiquetas, y en donde cada uno de dichos uno o más cebadores de retransmisión se hibrida con conectores 5’ y 3' adyacentes;
(b) extender dichos cebadores de retransmisión usando una polimerasa para producir fragmentos de oligonucleótidos;
(c) ligar dichos fragmentos de oligonucleótidos para producir un molde;
(d) opcionalmente amplificar dicho molde mediante reacción en cadena de la polimerasa para producir una mezcla amplificada; y
(e) secuenciar dicha mezcla opcionalmente amplificada para determinar la secuencia de dicho complejo.
[0005] La invención también se refiere a un método para determinar la secuencia de nucleótidos de un complejo que comprende:
(i) una entidad química que comprende uno o más andamios o uno o más bloques de construcción; (ii) n número de etiquetas oligonucleotídicas que tienen enlaces n-1, donde n es un número entero entre 1 y 10, y donde cada uno de dichos enlaces está entre dos etiquetas adyacentes y cada etiqueta codifica la identidad de al menos una de dichos uno o más andamios o bloques de construcción; y
(iii) un dominio auricular que tiene un primer grupo funcional asociado operativamente con dicha entidad química y un segundo grupo funcional asociado operativamente con al menos una de dicho n número de etiquetas a través de un primer enlace,
en donde una polimerasa tiene una capacidad reducida para leer o translocar a través de al menos uno de dicho primer enlace y enlace n-1; y
en donde dicho primer enlace y/o enlaces n-1 comprenden un enlace químico,
comprendiendo dicho método:
(a) proporcionar dicho complejo que comprende el enlace químico, en donde dicho enlace químico es un oligonucleótido de reticulación que atraviesa la unión entre dicho dominio auricular y al menos una de dicho n número de etiquetas o entre dos etiquetas adyacentes y que se asocia operativamente con dicho dominio auricular y al menos uno de dicho n número de etiquetas o con dichas dos etiquetas adyacentes mediante uno o más grupos co-reactivos reversibles;
(b) ligar dichas etiquetas usando un proceso químico o un proceso enzimático;
(c) liberar dicho oligonucleótido reticulante para producir un molde;
(d) opcionalmente amplificar dicho molde mediante reacción en cadena de la polimerasa para producir una mezcla amplificada; y
(e) secuenciar dicha mezcla opcionalmente amplificada para determinar la secuencia de dicho complejo,
en donde dicho extremo 5’ y/o extremo 3' de dicho oligonucleótido reticulante comprende un grupo co-reactivo reversible; y
en donde dicho grupo co-reactivo reversible es un grupo cianovinilcarbazol, un grupo cianovinilo, un grupo acrilamida, un grupo tiol o un grupo vinilsulfona.
[0006] La presente exposición presenta complejos para uso en bibliotecas codificadas en el ADN, en los que estos complejos tienen uno o más enlaces para los que una polimerasa ha reducido la capacidad de leer o translocar a través. Para descubrir la identidad de las regiones codificadas (p. ej., pieza de cabeza, una o más etiquetas y/o pieza de cola), el enlace se invierte antes de que se exponga a la polimerasa o, alternativamente, se evita por la polimerasa. Este enlace se puede omitir de cualquier manera útil que no capture toda la información de secuencia de las etiquetas (p. ej., en los conectores 5’ o 3', como se describe en este documento) pero captura la información de secuencia de codificación de las etiquetas. Dichos enlaces podrían dar lugar a menores incidencias de etiquetado erróneo, ampliar el número y el tipo de enlaces que se utilizarán en la fabricación de complejos y bibliotecas, y proporcionar métodos no enzimáticos para crear y cribar complejos codificados por ADN. Aquí se describen ventajas adicionales de estos complejos y métodos.
[0007] Por consiguiente, en un aspecto, los métodos de la invención presentan un complejo que incluye: una entidad química que incluye uno o más andamios o uno o más bloques de construcción; una primera etiqueta oligonucleotídica que codifica la identidad de al menos uno de los uno o más andamios o bloques de construcción; y un dominio auricular que tiene un primer grupo funcional y un segundo grupo funcional, donde el primer grupo funcional se asocia operativamente con la entidad química y el segundo grupo funcional se asocia operativamente con la primera etiqueta a través de un primer enlace para el cual una polimerasa tiene capacidad reducida para leer o translocar a través.
[0008] En otro aspecto, los métodos de la invención incluyen un complejo que incluye: una entidad química que incluye uno o más andamios o uno o más bloques de construcción; n número de etiquetas de oligonucleótidos que tienen n-1 enlaces, donde n es un número entero entre 1 y aproximadamente 10, y donde cada uno de los enlaces está entre dos etiquetas adyacentes y cada etiqueta codifica la identidad de al menos uno de los uno o más andamios o bloques de construcción; y un dominio auricular que tiene un primer grupo funcional asociado operativamente con la entidad química y un segundo grupo funcional asociado operativamente con al menos uno de los n números de etiquetas a través de un primer enlace, donde una polimerasa tiene capacidad reducida para leer o translocar a través de al menos uno del primer vínculo y vínculos n-1.
[0009] En algunas realizaciones, n está entre 1 y 2, 1 y 3, 1 y 4, 1 y 5, 1 y 6, 1 y 7, 1 y 8, 1 y 9, 1 y 10, 1 y 12, 1 y 15, 1 y 18, 1 y 20, 2 y 3, 2 y 4, 2 y 5, 2 y 6, 2 y 7, 2 y 8, 2 y 9, 2 y 10, 2 y 12, 2 y 15, 2 y 18, 2 y 20, 3 y 4, 3 y 5, 3 y 6, 3 y 7, 3 y 8, 3 y 9, 3 y 10, 3 y 12, 3 y 15, 3 y 18, 3 y 20, 4 y 5, 4 y 6, 4 y 7, 4 y 8, 4 y 9, 4 y 10, 4 y 12, 4 y 15, 4 y 18, o 4 y 20.
[0010] En algunas realizaciones, la polimerasa tiene una capacidad reducida para leer o translocar al menos aproximadamente el 10% (p. ej., aproximadamente el 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, o incluso 100%, en comparación con el control) de la primera articulación y n-1 enlaces. En realizaciones particulares, la polimerasa tiene capacidad reducida para leer o translocar a través de aproximadamente un 10% a aproximadamente un 100% del primer enlace y n-1 enlaces (p. ej., 20% a 100%, 25% a 100%, 50% a 100%, 75% a 100%, 90% a 100%, 95% a 100%, 10% a 95%, 20% a 95%, 25% a 95%, 50% a 95%, 75% a 95%, 90% a 95%, 10% a 90%, 20% a 90%, 25% a 90%, 50% a 90% o 75% a 90%, en comparación con el control (p. ej., en comparación con un oligonucleótido de control que carece el enlace)).
[0011] En algunas realizaciones, una o más etiquetas incluyen un extremo 5’ del conector en el extremo 5' de las una o más etiquetas y un extremo 3’ del conector en el extremo 3' de la una o más etiquetas. En realizaciones particulares, cada conector 5’ y/o cada conector 3' incluye la misma secuencia. En otras realizaciones, cada conector 5’ y/o cada conector 3' incluye una secuencia diferente.
[0012] En algunas realizaciones, la primera unión y/o n-1 enlaces son al menos aproximadamente 3 angstroms de longitud (p. ej., en al menos aproximadamente 5, 8, 10, 15, 20, 30, 35, 40, 50, 60, 65 o 70 angstroms). En algunas realizaciones, el primer enlace y/o los n-1 enlaces tienen menos de aproximadamente 30 angstroms de longitud (p. ej., menos de aproximadamente 25, 20, 15 o 10 angstroms).
[0013] En algunas realizaciones, una polimerasa de ADN y/o una polimerasa de ARN (p. ej., como se describe aquí) ha reducido la capacidad de leer o se translocan a través de la primera articulación y/o n-1 enlaces. En algunas realizaciones, menos de aproximadamente el 10% (p. ej., aproximadamente el 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% o 95%) del primer enlace y los n-1 enlaces incluyen un enlace enzimático. En algunas realizaciones, la primera articulación y n-1 enlaces incluyen entre 0% a 90% de enlaces enzimáticos (p. ej., aproximadamente 0% a 40%, 0% a 45%, 0% a 50%, 0% a 55%, 0% a 60%, 0% a 65%, 0% a 70%, 0% a 75%, 0% a 80%, 0% a 85%, 0% a 90%, 0% a 95%, 0% a 96%, 0% a 97%, 0% a 98%, 0% a 99%, 5% a 40%, 5% a 45%, 5% a 50%, 5% a 55%, 5% a 60%, 5% a 65%, 5% a 70%, 5% a 75%, 5% a 80%, 5% a 85%, 5% a 90%, 5% a 95%, 5% a 96%, 5% a 97%, 5% a 98%, 5% a 99%, 10% a 40%, 10% a 45%, 10% a 50%, 10% a 55%. 10% a 60%, 10% a 65% 10% a 70%, 10% a 75% , 10% a 80%, 10% a 85%, 10% a 90% 10% a 95%, 10% a 96%, 10% a 97%, 10% a 98% 10% a 99%, 15% a 40% , 15% a 45%, 15% a 50%, 15% a 55%, 15% a 60%, 15% a 65%, 15% a 70%, 15% a 75% 15% a 80%, 15% a 85% , 15% a 90%, 15% a 95%, 15% a 96% 15% a 97%, 15% a 98%, 15% a 99%, 20% a 40% 20% a 45%, 20% a 50% , 20% a 55%, 20% a 60%, 20% a 65% 20% a 70%, 20% a 75%, 20% a 80%, 20% a 85%, 20% a 90%, 20% a 95%, 20% a 96%, 20% a 97%, 20% a 98% o 20% a 99%).
[0014] En algunas realizaciones, la primera unión y/o n-1 enlaces incluyen un enlace químico (p. ej., un grupo reactivo químico, un grupo foto-reactivo, un resto de intercalación, o un oligonucleótido de entrecruzamiento). En realizaciones particulares, al menos un (p. ej., dos, tres, cuatro, cinco o más) grupo reactivo químico, grupo fotorreactivo o resto intercalante está presente en un conector 5’ en o cerca del extremo 5’ de la etiqueta y/o en un conector 3’ en o en las proximidades del extremo 3’ de la etiqueta. En otras realizaciones, la secuencia de al menos uno de los conectores 5’ es complementaria a la secuencia del conector 3' adyacente o es idéntica o suficientemente similar para permitir la hibridación con un oligonucleótido complementario. En algunas realizaciones, al menos el 10% (p. ej., aproximadamente el 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o incluso 100%) del primer enlace y/o n-1 enlaces son enlaces químicos. En otras realizaciones, de aproximadamente el 10% a aproximadamente el 100% del primer enlace y n-1 enlaces (p. ej., 20% a 100%, 25% a 100%, 50% a 100%, 75% a 100%, 90% a 100%, 95% a 100%, 10% a 95%, 20% a 95%, 25% a 95%, 50% a 95%, 75% a 95%, 90% a 95%, 10% a 90%, 20% a 90%, 25% a 90%, 50% a 90% o 75% a 90%) son enlaces químicos.
[0015] En algunas realizaciones, el grupo químico-reactivo se selecciona a partir de un par de un grupo de alquinilo opcionalmente sustituido y un grupo azido opcionalmente sustituido; un par de un dieno opcionalmente sustituido que tiene un sistema de electrones de 4 n y un dienófilo opcionalmente sustituido o un heterodienofilo opcionalmente sustituido que tiene un sistema de electrones de 2 n; un par de un nucleófilo y un heterociclil electrófilo tensado; un par de un grupo amino opcionalmente sustituido y un aldehído o un grupo cetona; un par de un grupo amino opcionalmente sustituido y un grupo de ácido carboxílico; un par de una hidrazina opcionalmente sustituida y un aldehído o un grupo cetona; un par de una hidroxilamina opcionalmente sustituida y un aldehído o un grupo cetona; un par de un nucleófilo y un haluro de alquilo opcionalmente sustituido; un complejo de platino; un agente alquilante; o un nucleótido modificado con furano (p. ej., cualquiera de los descritos en este documento).
[0016] En algunas realizaciones, el grupo foto-reactivo incluye un resto intercalante, un derivado de psoraleno, un grupo cianovinilcarbazol opcionalmente sustituido (p. ej., un grupo 3-cianovinilcarbazol, tal como 3-cianovinilcarbazol-1'-p-deoxiribósido-5’-trifosfato), un grupo vinilcarbazol opcionalmente sustituido (p. ej., un grupo amidovinilcarbazol, un grupo carboxivinilcarbazol, o un grupo C2-7 alcoxicarbonilvinilcarbazol, como se describe en el presente documento), un grupo cianovinil opcionalmente sustituido, un grupo acrilamida opcionalmente sustituido, un grupo de diazirina opcionalmente sustituido, una benzofenona opcionalmente sustituida o un grupo azida opcionalmente sustituido (p. ej., cualquiera de los descritos en el presente documento).
[0017] En algunas realizaciones, el resto intercalante es un derivado de psoraleno (p. ej., psoraleno, 8-metoxipsoraleno, o 4-hidroximetil-4,5,8-trimetil-psoraleno (HMT-psoraleno), un derivado de alcaloide (p. ej., berberina, palmatina, coralina, sanguinarina (p. ej., iminio o sus formas de alcanolamina, o aristololactama-p-D-glucósido), un catión de etidio (p. ej., bromuro de etidio), un derivado de acridina (p. ej., proflavina, acriflavina o amsacrina), un derivado de antraciclina (p. ej., doxorubicina, epirubicina, daunorubicina (daunomicina), idarrubicina, y aclarrubicina) o talidomida.
[0018] En algunas realizaciones, el enlace químico incluye el oligonucleótido de reticulación, donde la secuencia de al menos cinco nucleótidos en el extremo 5’ del oligonucleótido reticulante es complementario a la secuencia de al menos cinco nucleótidos en el extremo 3' de una o más etiquetas o idéntico o suficientemente similar para permitir la hibridación con un oligonucleótido complementario, y donde la secuencia de al menos cinco nucleótidos en el extremo
3’ del oligonucleótido reticulante son complementarios a la secuencia de al menos cinco nucleótidos en el extremo 5' de una o más etiquetas o idénticos o suficientemente similares para permitir la hibridación con un oligonucleótido complementario. En realizaciones particulares, el extremo 3’ de una o más etiquetas incluye un conector 3'. En realizaciones particulares, el extremo 5’ de una o más etiquetas incluye un conector 5'.
[0019] En algunas realizaciones, el extremo 5’ y/o extremo 3’ de la reticulación de oligonucleótido incluyen un grupo co-reactivo reversible (p. ej., un grupo cianovinilcarbazol, un grupo cianovinil, un grupo acrilamida, un grupo tiol, o un grupo vinilsulfona, como se describe en este documento).
[0020] En algunas realizaciones, el conector 3’ y/o conector 5' incluyen un grupo co-reactivo reversible (p. ej., un grupo cianovinilcarbazol, un grupo cianovinilo, un grupo acrilamida, un grupo tiol o un grupo vinilsulfona, como se describe en el presente documento).
[0021] En algunas realizaciones, la entidad química está asociada operativamente a el dominio auricular a través de un espaciador bifuncional (p. ej., cualquiera de los descritos en este documento). En otras realizaciones, la entidad química está unida covalentemente al dominio auricular. En realizaciones particulares, el dominio auricular incluye un oligonucleótido seleccionado del grupo que consiste en un oligonucleótido bicatenario, un oligonucleótido monocatenario o un oligonucleótido en horquilla. En algunas realizaciones, el dominio auricular incluye una región de unión al cebador.
[0022] En cualquiera de las realizaciones descritas en el presente documento, el complejo o el método incluye, además, una o más etiqueta(s) identificadora(s) de primera biblioteca, el uso de la(s) etiqueta(s), y/o etiqueta(s) de origen. En algunas realizaciones, el complejo o método incluye entre 2 y 20 etiquetas (p. ej., entre 2 y 10 etiquetas de bloques de construcción o andamios, una primera etiqueta de identificación de biblioteca, una etiqueta de uso opcional y una etiqueta de origen). En algunas realizaciones, el complejo o método incluye de 5 a 75 nucleótidos (p. ej., como se describe en el presente documento, como aproximadamente 40 o 50 nucleótidos).
[0023] En cualquiera de las realizaciones descritas en este documento, cada una de las etiquetas dentro de un conjunto de etiquetas individual incluye aproximadamente la misma masa.
[0024] En cualquiera de las realizaciones descritas en el presente documento, el complejo incluye ARN, ADN, ADN modificado, y/o ARN modificado (p. ej., PNA, LNA, GNA, TNA, o una mezcla de los mismos dentro del mismo oligonucleótido, como se describe en el presente documento).
[0025] En cualquiera de las realizaciones descritas en el presente documento, el complejo o el método incluye además un tubo de desagüe. En otro aspecto, la divulgación presenta una biblioteca que incluye uno o más complejos descritos en el presente documento. En algunas realizaciones, la biblioteca incluye una pluralidad de dominios auriculares. En otras realizaciones, cada dominio auricular de la pluralidad de dominios auriculares incluye una región de secuencia idéntica (p. ej., una región de unión de cebador) y una región de codificación diferente (p. ej., una primera etiqueta que codifica para el uso de la biblioteca, origen de la biblioteca, identidad de la biblioteca, el historial de la biblioteca, un enlace, un espaciador o la adición de un primer componente o una secuencia de oligonucleótidos que facilite las tecnologías de hibridación, amplificación o secuenciación). En realizaciones particulares, la biblioteca incluye entre aproximadamente 102 a 1020 complejos (p. ej., aproximadamente 102 a 103, 102 a 104, 102 a 105, 102 102 a 108, 102 a 109, 102 a 1010, 102 a 1011, 102 a 1012, 102 a 1011, 102 a 1014, 102 a 1015, 102 a 1016, 102 a 1017, 102 a
1018, 102 a 1019, 104 a 105, 104 a 106, 104 a 107, 104 a 108, 104 a 109, 104 a 1010, 104 a 1011, 104 a 1012, 104 a 1013, 104 a 1014, 104 a 1015, 104 a 1016, 104 a 1017, 104 a 1018, 104 a 1019, 104 a 1020, 105 a 106, 105 a 107, 105 a 108, 105 a 109,
105 a 1010, 105 a 1011, 105 a 1012, 105 a 1013, 105 a 1014, 105 a 1015, 105 a 1016, 105 a 1017, 105 a 1018, 105 a 1019, o 105 a 1020 complejos). En algunas realizaciones, cada complejo es diferente.
[0026] En otro aspecto, la divulgación presenta un método de etiquetar una primera biblioteca que incluye una entidad química codificada, incluyendo el método: (a) proporcionar un dominio auricular que tiene un primer grupo funcional y un segundo grupo funcional (p. ej., donde el dominio auricular opcionalmente codifica información); (b) unir el primer grupo funcional del dominio auricular a un primer componente de la entidad química, donde el dominio auricular está conectado directamente al primer componente o el dominio auricular está conectado indirectamente al primer componente mediante un espaciador bifuncional; y (c) unir el segundo grupo funcional del dominio auricular a una primera etiqueta oligonucleotídica a través de un primer enlace para formar un complejo, donde una polimerasa tiene una capacidad reducida para leer o translocar a través del primer enlace; donde los pasos (b) y (c) pueden realizarse
en cualquier orden y donde la primera etiqueta codifica la reacción de unión del paso (b), proporcionando así una biblioteca etiquetada.
[0027] En aún otro aspecto, la divulgación presenta un método de etiquetar una primera biblioteca que incluye una entidad química codificada, incluyendo el método: (a) proporcionar un dominio auricular que tiene un primer grupo funcional y un segundo grupo funcional (p. ej., donde el dominio auricular opcionalmente codifica información); (b) unir el primer grupo funcional del dominio auricular a un primer componente de la entidad química, donde el dominio auricular está conectado directamente al primer componente o el dominio auricular está conectado indirectamente al primer componente mediante un espaciador bifuncional; (c) unir el segundo grupo funcional del dominio auricular a una primera etiqueta oligonucleotídica mediante un primer enlace; (d) unir nc número de componentes adicionales de la entidad química, donde nc es un número entero entre 1 y 10; y (e) unión nt número de etiquetas oligonucleotídicas adicionales que tienen nt enlaces para formar un complejo, donde nt es un número entero entre 1 y 10, donde cada uno de los enlaces está entre dos etiquetas adyacentes y donde cada etiqueta codifica la identidad de al menos uno de los componentes; donde una polimerasa ha reducido la capacidad de leer o translocar a través de al menos una de la primera articulación y nt enlaces; y donde los pasos (b) y (c) se pueden realizar en cualquier orden y donde la primera etiqueta codifica la reacción de unión del paso (b); donde los pasos (d) y (e) se pueden realizar en cualquier orden y donde cada etiqueta adicional codifica la reacción de unión de cada componente adicional del paso (d), proporcionando así una biblioteca etiquetada.
[0028] En algunas realizaciones, nc y nt son cada uno independientemente un número entero entre 1 y 2, 1 y 3, 1 y 4, 1 y 5, 1 y 6, 1 y 7, 1 y 8, 1 y 9, 1 y 10, 1 y 12, 1 y 15, 1 y 18, 1 y 20, 2 y 3, 2 y 4, 2 y 5, 2 y 6, 2 y 7, 2 y 8, 2 y 9, 2 y 10, 2 y 12, 2 y 15, 2 y 18, 2 y 20, 3 y 4, 3 y 5, 3 y 6, 3 y 7, 3 y 8, 3 y 9, 3 y 10, 3 y 12, 3 y 15, 3 y 18, 3 y 20, 4 y 5, 4 y 6, 4 y 7, 4 y 8, 4 y 9, 4 y 10, 4 y 12, 4 y 15, 4 y 18, o 4 y 20. En algunas realizaciones, la polimerasa tiene una capacidad reducida para leer o translocar a través de al menos aproximadamente el 10% del primer enlace y los nt enlaces (p. ej., aproximadamente 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o incluso 100%, como en comparación con el control, del primer enlace y nt enlaces). En realizaciones particulares, la capacidad reducida de leer o translocar a través de la primera articulación y nt enlaces está entre aproximadamente 10 a aproximadamente 100% (p. ej., 20% a 100%, 25% a 100%, 50% a 100%, 75% al 100%, del 90% al 100%, del 95% al 100%, del 10% al 95%, del 20% al 95%, del 25% al 95%, del 50% al 95%, del 75% al 95%, del 90% al 95%, 10% a 90%, 20% a 90%, 25% a 90%, 50% a 90% o 75% a 90%, en comparación con el control (p. ej., en comparación con un oligonucleótido de control que carece del enlace)).
[0029] En algunas realizaciones, el primer componente y/o componentes adicionales incluyen un andamio o un bloque de construcción.
[0030] En algunas realizaciones, el paso (b) incluye la unión del dominio auricular indirectamente con el primer componente a través de un espaciador bifuncional.
[0031] En algunas realizaciones, los métodos incluyen además la unión de una etiqueta de uso, una etiqueta de origen y/o una primera etiqueta de identificación de biblioteca al complejo. En realizaciones particulares, el método incluye además proporcionar una segunda biblioteca y combinar la primera biblioteca con la segunda biblioteca. En algunas realizaciones, el método incluye además unir un cordal al complejo.
[0032] En algunas realizaciones, el paso de unión incluye un grupo químico-reactivo, un grupo foto-reactivo, un resto de intercalación, o un oligonucleótido de reticulación (p. ej., como se describe en el presente documento por cualquiera de los complejos de la presente memoria). En realizaciones particulares, el método incluye además realizar la síntesis de división y agrupación en una o más etapas, separar uno o más complejos y/o purificar uno o más complejos.
[0033] En cualquiera de los métodos descritos en el presente documento, los resultados del método de cualquiera de los complejos descritos en este documento o cualquier de las bibliotecas descritas en el presente documento.
[0034] En aún otro aspecto, la divulgación presenta un método de cribado de una pluralidad de entidades químicas, el método incluye: (a) poner en contacto una diana con cualquier complejo descrito en el presente documento y/o una biblioteca descrita en este documento; y (b) seleccionar uno o más complejos que tengan una característica predeterminada para la diana, en comparación con un control, seleccionando así la entidad química.
[0035] En algunas realizaciones, la característica predeterminada incluye el aumento de la unión por la diana (p. ej., una diana biológica, tal como se describe en el presente documento), en comparación con un control.
[0036] En algunas realizaciones, antes del paso (a) una o más operaciones se realizan seleccionadas de la lista que consiste de: el recocido de uno o más cebadores de relevo con dicho complejo, en donde dicho uno o más cebadores de relevo se extienden sobre dicho primer enlace y/o n-1 enlaces; extender dichos cebadores de relevo usando una polimerasa para producir fragmentos de oligonucleótidos; y ligar dichos fragmentos de oligonucleótidos para producir una plantilla.
[0037] La invención presenta un método para determinar la secuencia de nucleótidos de cualquier complejo descrito en el presente documento, incluyendo el método: (a) hibridar uno o más cebadores de relevo con el complejo, en donde el uno o más cebadores de relevo abarcan la primera articulación y/o n-1 enlaces; (b) extender los cebadores de retransmisión usando una polimerasa para producir fragmentos de oligonucleótidos; (c) ligar los fragmentos de oligonucleótidos para producir una plantilla; (d) opcionalmente amplificar la plantilla mediante reacción en cadena de la polimerasa para producir una mezcla amplificada; y (e) secuenciar la mezcla opcionalmente amplificada para determinar la secuencia del complejo. En algunas realizaciones, el complejo incluye un conector 5’ en el extremo 5’ de una o más etiquetas y un conector 3’ en el extremo 3’ de una o más etiquetas, y donde cada uno de los uno o más cebadores de relevo se hibridan con conectores 5’ y 3' adyacentes. En realizaciones particulares, cada conector 5’ incluye la misma secuencia y/o cada conector 3' incluye la misma secuencia. En algunas realizaciones, la secuencia de al menos uno de los conectores 5’ es complementaria a la secuencia del conector 3' adyacente (p. ej., para formar un dúplex entre los conectores 5’ y 3' en condiciones de hibridación) o idénticos o suficientemente similares para permitir la hibridación con un oligonucleótido complementario. En realizaciones adicionales, el método incluye hibridar el conector 5’ con el conector 3' adyacente. En algunas realizaciones, cada cebador de relevo para una unión específica (p. ej., formando así una unión de tres hélices) entre los conectores 5’ y 3' incluye la misma secuencia.
[0038] La invención presenta un método para determinar la secuencia de nucleótidos de cualquier complejo descrito en este documento, incluyendo el método: (a) proporcionar el complejo que incluye el enlace químico, donde el enlace químico es un oligonucleótido de reticulación que atraviesa la unión entre dos etiquetas adyacentes y que se asocia operativamente con las dos etiquetas adyacentes mediante uno o más grupos co-reactivos reversibles; (b) liberar el oligonucleótido de reticulación (p. ej., cualquiera de los descritos en el presente documento) para producir una plantilla; (c) opcionalmente amplificar la plantilla mediante reacción en cadena de la polimerasa para producir una mezcla amplificada; y (d) secuenciar la mezcla opcionalmente amplificada para determinar la secuencia del complejo. En algunas realizaciones, una porción del oligonucleótido de reticulación se hibrida con los extremos de dos etiquetas adyacentes, produciendo así una muesca o un espacio entre las dos etiquetas adyacentes.
[0039] El método incluye la ligación de las etiquetas usando un proceso químico o un proceso enzimático (p. ej., 5'-fosforilación) antes del paso (b).
[0040] En algunas realizaciones, el método incluye además la reparación de la plantilla antes del paso de amplificación opcional o el paso de secuenciación. En realizaciones particulares, el paso de reparación incluye modificar al menos uno del primer enlace y/o n-1 enlaces para que sea un enlace reparado capaz de ser leído o translocado por una polimerasa. En algunas realizaciones, la polimerasa puede leer o translocar al menos el 50% (p. ej., al menos el 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o incluso 100%) de los enlaces reparados (p. ej., en comparación con un control, tal como un oligonucleótido de control que tiene el primer enlace y n-1 enlaces que no se han reparado). En realizaciones particulares, la polimerasa puede leer o translocar a través de aproximadamente 10% a aproximadamente 100% de los enlaces reparados (p. ej., 20% a 100%, 25% a 100%, 50% a 100%, 75% a 100%, 90% a 100%, 95% a 100%, 10% a 95%, 20% a 95%, 25% a 95%, 50% a 95%, 75% a 95%, 90% a 95%, 10% a 90%, 20% a 90%, 25% a 90%, 50% a 90% y 75% a 90%, en comparación con el control (p. ej., en comparación con un oligonucleótido de control que tiene el primer enlace y n-1 enlaces que no se han reparado). En realizaciones particulares, el paso de reparación incluye proporcionar a la plantilla una enzima de reparación (p. ej., una fotoliasa, una glicosilasa, una endonucleasa, una endonucleasa Flap, una endonucleasa apurínica/apirimidínica (AP), una polimerasa de ribosa poli ADP o una metiltransferasa, como se describe en este documento).
[0041] En cualquiera de las realizaciones anteriores, los métodos o complejos pueden incluir sólo las moléculas de cadena sencilla, en donde el dominio auricular, la primera etiqueta y/o la una o más etiquetas adicionales son de una sola hebra.
[0042] En cualquiera de las realizaciones anteriores, el procedimiento comprende además una o más etapas opcionales de diversificar la biblioteca o para interrogar a los miembros de la biblioteca, como se describe en el presente documento. En algunas realizaciones, el método comprende además identificar un pequeño miembro de biblioteca similar a un fármaco que se une o inactiva una proteína de interés terapéutico. En otras realizaciones, el método comprende además poner en contacto a un miembro de la biblioteca con una diana biológica en condiciones adecuadas para que al menos un miembro de la biblioteca se una a la diana, eliminando uno o más miembros de la biblioteca que no se unen a la diana, y analizar una o más etiquetas oligonucleotídicas asociadas con la diana.
[0043] Como se describe en el presente documento, el uso de moléculas de cadena simple podría tener numerosos beneficios. Por consiguiente, en cualquiera de las realizaciones descritas en este documento, los métodos y complejos incluyen un dominio auricular, una o más etiquetas, un complejo, una entidad química, una molécula o cualquier miembro de una biblioteca etiquetada que tenga una masa disminuida, una solubilidad aumentada (p. ej., en un solvente orgánico), menor costo, mayor reactividad, mayor accesibilidad a la diana, menor radio hidrodinámico y/o mayor precisión de las evaluaciones analíticas, en comparación con un método que incluye una o más moléculas de doble hebra (p. ej., un dominio auricular de doble hebra o una etiqueta de doble hebra). En algunas realizaciones, cada una de las etiquetas dentro de un conjunto de etiquetas (p. ej., la primera etiqueta o una etiqueta posterior, si está presente) tiene aproximadamente la misma masa (p. ej., cada etiqueta tiene una masa que es aproximadamente /- 10% de la masa media entre dos o más etiquetas). En realizaciones particulares, la etiqueta tiene una masa reducida (p. ej., menos de aproximadamente 15.000 Dalton, aproximadamente 14.000 Dalton, aproximadamente 13.000 Dalton, aproximadamente 12.000 Dalton, aproximadamente 11.000 Dalton, aproximadamente 10.000 Dalton, aproximadamente 9.000 Dalton, aproximadamente 8.000 Dalton, aproximadamente 7.500 Dalton, aproximadamente 7.000 Dalton, aproximadamente 6.000 Dalton, aproximadamente 6.500 Dalton, aproximadamente 5.000 Dalton, aproximadamente 5.500 Dalton, aproximadamente 4.000 Dalton, aproximadamente 4.500 Dalton o aproximadamente 3.000 Dalton) en comparación con una etiqueta de doble hebra (p. ej., una etiqueta de doble hebra que tiene una masa de unos 15.000 Dalton, unos 14.000 Dalton, unos 13.000 Dalton o unos 12.000 Dalton). En otras realizaciones, la etiqueta tiene una longitud reducida en comparación con una etiqueta de doble hebra (p. ej., una etiqueta de doble hebra que tiene una longitud de menos de aproximadamente 20 nucleótidos, menos de aproximadamente 19 nucleótidos, menos de aproximadamente 18 nucleótidos, menos de aproximadamente 17 nucleótidos, menos de aproximadamente 16 nucleótidos, menos de aproximadamente 15 nucleótidos, menos de aproximadamente 14 nucleótidos, menos de aproximadamente 13 nucleótidos, menos de aproximadamente 12 nucleótidos, menos de aproximadamente 11 nucleótidos, menos de aproximadamente 10 nucleótidos, menos de aproximadamente 9 nucleótidos, menos de aproximadamente 8 nucleótidos, o menos de aproximadamente 7 nucleótidos). En algunas realizaciones, una o más etiquetas o miembros de la biblioteca carecen de una región de unión a cebador y/o una región constante (p. ej., durante un paso de selección, tal como la selección usando cromatografía de exclusión por tamaño). En algunas realizaciones, una o más etiquetas o miembros de la biblioteca tienen una región constante reducida (p. ej., una longitud menor de aproximadamente 30 nucleótidos, menos de aproximadamente 25 nucleótidos, menos de aproximadamente 20 nucleótidos, menos de aproximadamente 19 nucleótidos, menos de aproximadamente 18 nucleótidos, menos de aproximadamente 17 nucleótidos, menos de aproximadamente 16 nucleótidos, menos de aproximadamente 15 nucleótidos, menos de aproximadamente 14 nucleótidos, menos de aproximadamente 13 nucleótidos, menos de aproximadamente 12 nucleótidos, menos de aproximadamente 11 nucleótidos, menos de aproximadamente 10 nucleótidos, menos de aproximadamente 9 nucleótidos, menos de aproximadamente 8 nucleótidos o menos de aproximadamente 7 nucleótidos). En otras realizaciones, los métodos incluyen un dominio auricular que codifica una molécula, una porción de una entidad química, una reacción de unión (p. ej., ligación química o enzimática) de un paso, o la identidad de una biblioteca, donde el dominio auricular codificador elimina la necesidad de una etiqueta adicional para codificar dicha información.
[0044] En cualquiera de las realizaciones anteriores, un oligonucleótido (p. ej., el dominio auricular, la primera etiqueta, y/o una o más etiquetas adicionales, si está presente) codifica para la identidad de la biblioteca. En algunas realizaciones, el oligonucleótido (p. ej., el dominio auricular, la primera etiqueta y/o una o más etiquetas adicionales, si están presentes) incluye una primera secuencia de identificación de biblioteca, donde la secuencia codifica la identidad de la primera biblioteca. En realizaciones particulares, el oligonucleótido es una primera etiqueta de identificación de biblioteca. En algunas realizaciones, el método incluye proporcionar una primera etiqueta de identificación de biblioteca, donde la etiqueta incluye una secuencia que codifica una primera biblioteca, y/o unir la primera etiqueta de identificación de biblioteca al complejo. En algunas realizaciones, el método incluye proporcionar una segunda biblioteca y combinar la primera biblioteca con una segunda biblioteca. En realizaciones adicionales, el método incluye proporcionar una segunda etiqueta de identificación de biblioteca, donde la etiqueta incluye una secuencia que codifica una segunda biblioteca. En algunas realizaciones, se combinan más de dos bibliotecas (p. ej., tres, cuatro, cinco, seis, siete, ocho, nueve, diez o más bibliotecas).
[0045] En cualquiera de las realizaciones anteriores, la información codificada se proporciona en una o más etiquetas o en una combinación de más de una etiqueta. En algunas realizaciones, la información codificada está representada por más de una etiqueta (p. ej., dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez o más etiquetas). En algunas realizaciones, la información codificada está representada por más de una etiqueta, donde todas las etiquetas de codificación están contenidas dentro de la secuencia de codificación (p. ej., mediante el uso de una combinación de etiquetas específica para codificar información). En algunas realizaciones, la información codificada está representada por más de una etiqueta, donde menos de todas las etiquetas de codificación están contenidas dentro de la secuencia de codificación (p. ej., utilizando una etiqueta de un conjunto de más de una etiqueta individual para codificar dentro de una secuencia de codificación individual). En algunas realizaciones, la información codificada se representa ortogonalmente, donde la información codificada se representa mediante una combinación de más de una etiqueta con menos de toda la información de codificación contenida dentro de un miembro de biblioteca individual, de modo que más de un miembro de biblioteca correspondiente necesita ser secuenciado con el fin de deconvolucionar la información codificada. En algunas realizaciones, más de un bloque de construcción químico está representado por una sola etiqueta (p. ej., para un bloque de construcción racémico, como dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez o más bloques de construcción representados por una sola etiqueta).
[0046] En cualquiera de las realizaciones anteriores, un oligonucleótido (p. ej., un dominio auricular y/o uno o más bloques de construcción) codifica para el uso del miembro de la biblioteca (p. ej., el uso en una etapa de selección o una etapa de unión, como se describe aquí). En algunas realizaciones, el oligonucleótido (p. ej., el dominio auricular, la primera etiqueta y/o una o más etiquetas adicionales, si están presentes) incluyen una secuencia de uso, donde la secuencia codifica para el uso de un subconjunto de miembros en la biblioteca en uno o más pasos (p. ej., un paso de selección y/o un paso de unión). En realizaciones particulares, el oligonucleótido es una etiqueta de uso que incluye una secuencia de uso. En algunas realizaciones, un oligonucleótido (p. ej., un dominio auricular y/o una o más etiquetas de oligonucleótidos) codifica el origen del miembro de la biblioteca (p. ej., en una parte particular de la biblioteca). En algunas realizaciones, el oligonucleótido (p. ej., el dominio auricular, la primera etiqueta y/o una o más etiquetas adicionales, si están presentes) incluye una secuencia de origen (p. ej., una secuencia aleatoria o
degenerada que tiene una longitud de aproximadamente 10, 9, 8, 7 o 6 nucleótidos), donde la secuencia codifica el
origen del miembro en la biblioteca, en comparación con otros miembros de la biblioteca. En realizaciones particulares,
el oligonucleótido es una etiqueta de origen que incluye una secuencia de origen. En algunas realizaciones, el método
incluye además unir, enlazar o asociar operativamente una etiqueta de uso y/o una etiqueta de origen al complejo.
[0047] En cualquiera de las realizaciones en el presente documento, los métodos, las composiciones y complejos
incluyen, opcionalmente, un tubo de desagüe, donde el tubo de desagüe incluye una o más de una secuencia de
biblioteca de identificación, una secuencia de uso, o una secuencia de origen, tal como se describe aquí. En
realizaciones particulares, los métodos incluyen además unir, enlazar o asociar operativamente el cordal (p. ej.,
incluyendo una o más de una secuencia de identificación de biblioteca, una secuencia de uso o una secuencia de
origen) al complejo.
[0048] En cualquiera de las realizaciones anteriores, los métodos, composiciones y complejos, o porciones de los
mismos (p. ej., el dominio auricular, la primera etiqueta, y/o la una o más etiquetas adicionales, si está presente),
incluye una modificación que apoyan solubilidad en condiciones semi, reducidas o no acuosas (p. ej., orgánicas). En
algunas realizaciones, el espaciador bifuncional, el dominio auricular o una o más etiquetas se modifican para
aumentar la solubilidad de un miembro de dicha biblioteca química codificada por ADN en condiciones orgánicas. En
algunas realizaciones, la modificación es una o más de una cadena de alquilo, una unidad de polietilenglicol, una
especie ramificada con cargas positivas o una estructura de anillo hidrófoba. En algunas realizaciones, la modificación
incluye uno o más nucleótidos modificados que tienen un resto hidrófobo (p. ej., modificado en las posiciones C5 de
las bases T o C con cadenas alifáticas, como en 5'-dimetoxitritilo-N4-diisobutilaminometiliden-5-(1- propinilo)-2'-desoxicitidina, 3’-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; 5'-dimetoxitritilo-5-(1-propinilo)-2'-desoxiuridina, 3'-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; 5'-dimetoxitritilo-5-fluoro-2'-desoxiuridina, 3’-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; y 5'-dimetoxitritilo-5-(piren-1-ilo-etinilo)-2'-desoxiuridina, o 3’-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita) o una inserción que tiene un resto hidrófobo (p. ej., un azobenceno). En algunas
realizaciones, el miembro de la biblioteca tiene un coeficiente octanol: agua de aproximadamente 1,0 a
aproximadamente 2,5 (p. ej., aproximadamente 1,0 a aproximadamente 1,5, aproximadamente 1,0 a
aproximadamente 2,0, aproximadamente 1,3 a aproximadamente 1,5, aproximadamente 1,3 a aproximadamente 2,0,
aproximadamente 1,3 a aproximadamente 2,5, aproximadamente 1,5 a aproximadamente 2,0, aproximadamente 1,5
a aproximadamente 2,5, o aproximadamente 2,0 a aproximadamente 2,5).
[0049] En cualquiera de las realizaciones anteriores, el dominio auricular, el tubo de desagüe, la primera etiqueta, la
una o más etiquetas adicionales, la etiqueta de biblioteca de identificación, la etiqueta de uso, y/o la etiqueta de origen,
os, de 6 a
10 nucle os, de 7 a
nucleótido nucleótido nucleótido nucleótido nucleótido nucleótido nucleótido nucleótido nucleótido nucleótid nucleótido nucleótido
Figure imgf000009_0001
nucleótido
En realizaciones particulares, el dominio auricular, la primera etiqueta, la segunda etiqueta, una o más etiquetas adicionales, la etiqueta de identificación de la biblioteca, la etiqueta de uso y/o la etiqueta de origen, si está presente, tienen una longitud de menos de 20 nucleótidos (p. ej., menos de 19 nucleótidos, menos de 18 nucleótidos, menos de 17 nucleótidos, menos de 16 nucleótidos, menos de 15 nucleótidos, menos de 14 nucleótidos, menos de 13 nucleótidos, menos de 12 nucleótidos, menos de 11 nucleótidos, menos de 10 nucleótidos, menos de 9 nucleótidos, menos de 8 nucleótidos o menos de 7 nucleótidos).
[0050] En cualquiera de las realizaciones anteriores, la secuencia de codificación (p. ej., el dominio auricular, el tubo de desagüe, la primera etiqueta, la una o más etiquetas adicionales, la etiqueta de biblioteca de identificación, la etiqueta de uso, y/o la etiqueta de origen, si está presente) puede incluir más de 20 nucleótidos (p. ej., más de 25, 30 35, 40, 45, 50, 55, 60, 65, 70 o 75 nucleótidos).
Definiciones
[0051] Por "nucleótido 2'-sustituido" se entiende una base de nucleótidos que tiene una sustitución en la posición 2' de la ribosa.
[0052] Por "aproximadamente" se quiere decir /- 10% del valor recitado.
[0053] Por "bifuncional" se entiende que tiene dos grupos reactivos que permiten la unión de dos restos químicos.
[0054] Por "espaciador bifuncional" se entiende un resto de espaciamiento que tiene dos grupos reactivos que permiten la unión de una entidad química y la información de codificación del complejo. En un ejemplo no limitativo, el espaciador bifuncional se proporciona entre la entidad química y una etiqueta. En otro ejemplo no limitativo, el espaciador bifuncional se proporciona entre la entidad química y un dominio auricular. Aquí se proporcionan espaciadores bifuncionales ejemplares.
[0055] Por "unión" se entiende adjuntar un enlace covalente o un enlace no covalente. Los enlaces no covalentes incluyen los formados por fuerzas de van der Waals, enlaces de hidrógeno, enlaces iónicos, atrapamiento o encapsulación física, absorción, adsorción y/u otras fuerzas intermoleculares. La unión se puede efectuar por cualquier medio útil, como mediante unión enzimática (p. ej., ligación enzimática para proporcionar un enlace enzimático) o mediante unión química (p. ej., ligación química para proporcionar un enlace químico).
[0056] Por "bloque de construcción" se entiende una unidad estructural de una entidad química, donde la unidad está directamente vinculada a otras unidades estructurales químicas o indirectamente enlazados a través del andamio. Cuando la entidad química es polimérica u oligomérica, los componentes básicos son las unidades monoméricas del polímero u oligómero. Los bloques de construcción pueden tener uno o más nodos de diversidad que permiten la adición de uno o más bloques de construcción o andamios. En la mayoría de los casos, cada nodo de diversidad es un grupo funcional capaz de reaccionar con uno o más bloques de construcción o andamios para formar una entidad química. Generalmente, los bloques de construcción tienen al menos dos nodos de diversidad (o grupos funcionales reactivos), pero algunos bloques de construcción pueden tener un nodo de diversidad (o grupo funcional reactivo). Alternativamente, los pasos químicos o de unión codificados pueden incluir varios componentes químicos (p. ej., reacciones de condensación de múltiples componentes o procesos de múltiples pasos). Los grupos reactivos en dos bloques de construcción diferentes deben ser complementarios, es decir, capaces de reaccionar juntos para formar un enlace covalente o no covalente.
[0057] Por "entidad química" se entiende un compuesto que comprende uno o más bloques de construcción y, opcionalmente, uno o más andamios. La entidad química puede ser cualquier fármaco peptídico o de molécula pequeña o candidato a fármaco diseñado o construido para tener una o más características deseadas, p. ej., capacidad para unirse a una diana biológica, solubilidad, disponibilidad de donantes y aceptores de enlaces de hidrógeno, grados de libertad de rotación de los enlaces, carga positiva, carga negativa y similares. En determinadas realizaciones, la entidad química puede reaccionar además como una entidad bifuncional o trifuncional (o mayor).
[0058] Por "grupo químico reactivo" se entiende un grupo reactivo que participa en una reacción modular, produciendo así un enlace. Los ejemplos de reacciones y grupos reactivos incluyen aquellos seleccionados de una reacción de cicloadición 1,3-dipolar de Huisgen con un par de un grupo alquinilo opcionalmente sustituido y un grupo azido opcionalmente sustituido; una reacción de Diels-Alder con un par de un dieno opcionalmente sustituido que tiene un sistema de electrones 4 n y un dienófilo opcionalmente sustituido o un heterodienofilo opcionalmente sustituido que tiene un sistema de electrones 2 n; una reacción de apertura de anillo con un nucleófilo y un electrófilo heterociclilo tensado; una reacción de ligación en férula con un grupo fosforotioato y un grupo yodo; y una reacción de aminación reductora con un grupo aldehído y un grupo amino, como se describe en el presente documento.
[0059] Por "complementario" se entiende una secuencia capaz de hibridarse, como se define aquí, para formar la estructura secundaria (un dúplex o una porción de doble hebra de una molécula de ácido nucleico). No es necesario que la complementariedad sea perfecta, pero puede incluir uno o más emparejamientos erróneos en uno, dos, tres o más nucleótidos. Por ejemplo, la secuencia complementaria puede contener nucleobases que pueden formar enlaces de hidrógeno de acuerdo con las reglas de emparejamiento de bases de Watson-Crick (p. ej., G con C, A con T o A con U) u otros motivos de enlaces de hidrógeno (p. ej., diaminopurina con T, 5-metilo C con G, 2-tiotimidina con A, inosina con C, pseudoisocitosina con G). La secuencia y su secuencia complementaria pueden estar presentes en el mismo oligonucleótido o en diferentes oligonucleótidos.
[0060] Por "complejo" o "complejo ligado" se quiere decir un dominio auricular que está asociado operativamente con una entidad química y/o una o más etiquetas de oligonucleótidos mediante un enlace covalente o un enlace no covalente. El complejo puede incluir opcionalmente un espaciador bifuncional entre la entidad química y el dominio auricular.
[0061] Por "componente" de una entidad química se entiende o bien un andamio o un bloque de construcción.
[0062] Por "conector" de una etiqueta de oligonucleótido se entiende una parte de la etiqueta en o en la proximidad de los extremos 5’ o 3’ que tienen una secuencia fija. Un conector 5’ está ubicado en o cerca del extremo 5' de un oligonucleótido, y un conector 3’ está ubicado en o cerca del extremo 3’ de un oligonucleótido. Cuando está presente en un complejo, cada conector 5’ puede ser el mismo o diferente, y cada conector 3' puede ser el mismo o diferente. En un ejemplo, el complejo no limitante que tiene más de una etiqueta, cada etiqueta puede incluir un conector 5’ y un conector 3', donde cada conector 5’ tiene la misma secuencia y cada conector 3' tiene la misma secuencia (p. ej., donde la secuencia del conector 5’ puede ser la misma o diferente de la secuencia del conector 3'). En otro complejo ejemplar, no limitante, la secuencia del conector 5’ está diseñada para ser complementaria, como se define aquí, a la secuencia del conector 3' (p. ej., para permitir la hibridación entre los conectores 5’ y 3'). El conector puede incluir opcionalmente uno o más grupos que permitan un enlace (p. ej., un enlace para el que una polimerasa tiene una capacidad reducida para leer o translocar, tal como un enlace químico).
[0063] Por secuencia "constante" o "constante fija" se entiende una secuencia de un oligonucleótido que no codifica información. Las porciones ejemplares no limitantes de un complejo que tiene una secuencia constante incluyen una región de unión al cebador, un conector 5’ o un conector 3'. El dominio auricular de la invención puede codificar información (por lo tanto, una etiqueta) o alternativamente no codificar información (por lo tanto, una secuencia constante). De manera similar, el cordal de la invención puede codificar o no codificar información.
[0064] Por "oligonucleótido reticulante" se entiende un oligonucleótido que se asocia operativamente, como se define aquí, en una unión especial entre dos etiquetas adyacentes en un complejo. En un ejemplo no limitante, un extremo del oligonucleótido de entrecruzamiento se hibrida con el conector 3’ de una primera etiqueta, y el otro extremo del oligonucleótido de entrecruzamiento se hibrida con el conector 5' de una segunda etiqueta que es adyacente a la primera etiqueta. Las realizaciones ejemplares, no limitantes de oligonucleótidos reticulantes incluyen aquellos que tienen uno o más grupos reactivos (p. ej., un grupo reactivo químico, un grupo fotorreactivo, un resto intercalante o un grupo coreactivo reversible, o cualquiera de los descritos en el presente documento) que se asocia operativamente con etiquetas adyacentes o conectores de etiquetas adyacentes.
[0065] Por "nodo de diversidad" se quiere decir un grupo funcional en una posición en el andamio o el bloque de construcción que permite la adición de otro bloque de construcción.
[0066] Por "dominio auricular" se entiende una estructura química para la síntesis de biblioteca que está unida operativamente a un componente de una entidad química y a una etiqueta, p. ej., un oligonucleótido de partida. Opcionalmente, un dominio auricular puede contener pocos nucleótidos o ninguno, pero puede proporcionar un punto en donde puedan estar asociados operativamente. Opcionalmente, un espaciador bifuncional conecta el dominio auricular al componente.
[0067] Por "hibridar" se entiende emparejar para formar una molécula de doble hebra entre oligonucleótidos complementarios, o porciones de los mismos, bajo diversas condiciones de rigurosidad. (Véase, p. ej., Wahl, GM y SL Berger (1987) Methods Enzymol. 152: 399; Kimmel, AR (1987) Methods Enzymol. 152: 507.) Por ejemplo, se puede obtener una hibridación de alta rigurosidad con una concentración de sal normalmente menor de aproximadamente 750 mM de NaCl y 75 mM de citrato trisódico, menos de aproximadamente 500 mM de NaCl y 50 mM de citrato trisódico, o menos de aproximadamente 250 mM de NaCl y 25 mM de citrato trisódico. Se puede obtener una hibridación de bajo rigor en ausencia de disolvente orgánico, p. ej., formamida, mientras que se puede obtener una hibridación de alto rigor en presencia de al menos aproximadamente un 35% de formamida o al menos aproximadamente un 50% de formamida. Las condiciones de temperatura de hibridación de alta rigurosidad incluirán normalmente temperaturas de al menos aproximadamente 30°C, 37°C o 42°C. Los expertos en la técnica conocen bien parámetros adicionales variables, tales como el tiempo de hibridación, la concentración de detergente, p. ej., dodecilsulfato de sodio (SDS), y la inclusión o exclusión de ADN portador. Se logran varios niveles de rigurosidad combinando estas diversas condiciones según sea necesario. En una realización, la hibridación se producirá a 30°C en NaCl 750 mM, citrato trisódico 75 mM y SDS al 1%. En una realización alternativa, la hibridación se producirá a 37°C en NaCl 500 mM, citrato trisódico 50 mM, SDS al 1%, formamida al 35% y 100 pg/ml de ADN de esperma de salmón desnaturalizado (ssADN). En una realización alternativa adicional, la hibridación se producirá a 42°C en NaCl 250 mM, citrato trisódico 25 mM, SDS al 1%, formamida al 50% y 200 pg/ml de ssADN. Las variaciones útiles en estas condiciones serán fácilmente evidentes para los expertos en la técnica.
[0068] Para la mayoría de aplicaciones, los pasos de lavado que siguen a la hibridación también variarán en rigurosidad. Las condiciones de rigurosidad del lavado se pueden definir mediante la concentración de sal y la temperatura. Como anteriormente, la rigurosidad del lavado se puede aumentar disminuyendo la concentración de sal o aumentando la temperatura. Por ejemplo, las concentraciones de sal de alta rigurosidad para los pasos de lavado pueden ser, p. ej., menos de aproximadamente 30 mM de NaCl y 3 mM de citrato trisódico, o menos de aproximadamente 15 mM de NaCl y 1,5 mM de citrato trisódico. Las condiciones de temperatura de alta rigurosidad para los pasos de lavado incluirán normalmente una temperatura de, p. ej., al menos aproximadamente 25°C, 42°C o 68°C. En una realización, los pasos de lavado se producirán a 25°C en 30 mM de NaCl, 3 mM de citrato trisódico y SDS al 0,1%. En una realización alternativa, los pasos de lavado se realizarán a 42°C en 15 mM de NaCl, 1,5 mM de citrato trisódico y SDS al 0,1%. En una realización alternativa adicional, los pasos de lavado se producirán a 68°C en 15 mM de NaCl, 1,5 mM de citrato trisódico y SDS al 0,1%. Las variaciones adicionales de estas condiciones resultarán evidentes para los expertos en la técnica. Las técnicas de hibridación son bien conocidas por los expertos en la técnica y se describen, p. ej., en Benton y Davis (Science 196: 180, 1977); Grunstein y Hogness (Proc. Natl. Acad. Sci., EE. UU. 72: 3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, Nueva York, 2001); Berger y Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, Nueva York); y Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Nueva York.
[0069] Por "resto intercalante" se entiende un grupo reactivo que resulta en la inclusión de un resto entre dos o más nucleótidos. En un ejemplo no limitante, el resto intercalante reacciona con uno o más nucleótidos para formar enlaces cruzados entre cadenas o entre cadenas entre oligonucleótidos dúplex o triples. En el presente documento se describen restos intercalantes no limitantes ejemplares.
[0070] Por "unión" se entiende una mella (falta de un enlace internucleotídico) o un espacio (falta de uno o más nucleótidos) entre dos etiquetas adyacentes en un complejo. La unión también puede ser entre dos conectores adyacentes presentes en dos etiquetas adyacentes (p. ej., entre el conector 3’ de una primera etiqueta y el conector 5' de una segunda etiqueta que es adyacente a la primera etiqueta).
[0071] Por "biblioteca" se entiende una colección de moléculas o entidades químicas. Opcionalmente, las moléculas o entidades químicas se unen a uno o más oligonucleótidos que codifican las moléculas o partes de la entidad química.
[0072] Por "enlace" se entiende una entidad de conexión química que permite asociar operativamente dos o más estructuras químicas, donde el enlace está presente entre el dominio auricular y una o más etiquetas, entre dos etiquetas, o entre una etiqueta y un tubo de desagüe. La entidad de conexión química puede ser un enlace no covalente (p. ej., como se describe en este documento), un enlace covalente o un producto de reacción entre dos grupos funcionales. Por "enlace químico" se entiende un enlace formado por una reacción química no enzimática entre dos grupos funcionales. Los grupos funcionales no limitantes, ejemplares, incluyen un grupo reactivo químico, un grupo fotorreactivo, un resto intercalante o un oligonucleótido reticulante (p. ej., como se describe en el presente documento). Por "enlace enzimático" se entiende un enlace internucleótido o internucleosídico formado por una enzima. Las enzimas ejemplares no limitantes incluyen una quinasa, una polimerasa, una ligasa o combinaciones de las mismas. Por un enlace "para el cual una polimerasa tiene una capacidad reducida para leer o translocarse" se entiende un enlace, cuando está presente en una plantilla de oligonucleótidos, que proporciona una cantidad reducida de productos alargados y/o amplificados por una polimerasa, en comparación con un oligonucleótido de control que carece del enlace. Los métodos ejemplares no limitantes para determinar tal enlace incluyen la extensión del cebador según se evalúa mediante análisis de PCR (p. ej., PCR cuantitativa), análisis de TI-PCR, cromatografía líquidaespectrometría de masas, demografía de secuencia u otros métodos. Ejemplos de polimerasas no limitantes incluyen polimerasas de ADN y polimerasa de ARN, tales como polimerasa de ADN I, polimerasa de ADN II, polimerasa de ADN III, polimerasa de ADN VI, polimerasa de ADN Taq, polimerasa de ADN Deep VentR™ (polimerasa de ADN termofílica de alta fidelidad, disponible en New England Biolabs), polimerasa de ADN T7, polimerasa de ADN T4, polimerasa de ARN I, polimerasa de ARN II, polimerasa de ARN III o polimerasa de ARN T7.
[0073] Por "catión multivalente" se quiere decir un catión capaz de formar más de un enlace con más de un ligando o anión. El catión multivalente puede formar un complejo iónico o un complejo de coordinación. Los cationes multivalentes ejemplares incluyen los de metales alcalinotérreos (p. ej., magnesio) y metales de transición (p. ej., manganeso (II) o cobalto (III), y aquellos que están opcionalmente unidos a uno o más aniones y/o uno o más ligandos univalentes o polidentados, tales como cloruro, amina y/o etilendiamina.
[0074] Por "oligonucleótido" se entiende un polímero de nucleótidos que tiene un extremo 5’, un extremo 3', y uno o más nucleótidos en la posición interna entre los extremos 5’ y 3'. El oligonucleótido puede incluir ADN, ARN o cualquier derivado de los mismos conocido en la técnica que pueda sintetizarse y usarse para el reconocimiento de pares de bases. El oligonucleótido no tiene por qué tener bases contiguas, pero se puede intercalar con restos enlazadores. El polímero oligonucleotídico y el nucleótido (p. ej., ADN o ARN modificado) pueden incluir bases naturales (p. ej., adenosina, timidina, guanosina, citidina, uridina, desoxiadenosina, desoxitimidina, desoxiguanosina, desoxicitidina, inosina o diamino purina), análogos de bases (p. ej. 2-aminoadenosina, 2-tiotimidina, inosina, pirrolo-pirimidina, 3-metilo adenosina, C5-propinilcitidina, C5-propiniluridina, C5-bromouridina, C5-fluorouridina, C5-yodouridina, C5-metilguina-deadenosina, 7-deadenosina, 8-oxoadenosina, 8-oxoguanosina, O(6)-metilguanina y 2-tiocitidina), bases modificadas (p. ej., nucleótidos sustituidos en 2’, tales como bases 2'-O-metiladas y bases 2'-fluoro), bases intercaladas, azúcares modificados (p. ej., 2'-fluororibosa; ribosa; 2'-desoxirribosa; arabinosa; hexosa; anhidrohexitol; altritol; manitol; ciclohexanilo; ciclohexenilo; morfolino que también tiene una cadena principal de fosforamidato; ácidos nucleicos bloqueados, p. ej., LNA, donde el 2'-hidroxilo de la ribosa está conectado por un puente de C1-6 alquileno o C1-6 heteroalquileno al carbono 4’ del mismo azúcar de ribosa, donde los puentes ejemplares incluyen puentes metileno, propileno, éter o amino); ácido nucleico de glicol (GNA, p. ej., R-GNA o S-GNA, donde la ribosa se reemplaza por unidades de glicol unidas a enlaces fosfodiéster); ácido nucleico treosa (TNA, donde la ribosa se reemplaza con a-L-treofuranosil-(3’^ 2 ')) ; y/o reemplazo del oxígeno en la ribosa (p. ej., con S, Se o alquileno, como metileno o etileno), cadenas principales modificadas (p. ej., ácido peptídico nucleico (PNA), donde los enlaces 2-amino-etilglicina reemplazan a la ribosa y estructura de fosfodiéster) y/o grupos fosfato modificados (p. ej., fosforotioatos, 5'-N-fosforamiditas, fosforoselenatos, boranofosfatos, ésteres de boranofosfato, hidrogenofosfonatos, fosforamidatos, fosforodiamidatos, alquil o aril fosfonatos, fosfotrioferamidatos, y metilenfosfonatos con puentes). El oligonucleótido puede ser monocatenario (p. ej., horquilla), bicatenario o poseer otras estructuras secundarias o terciarias (p. ej., estructuras de tallo-bucle, dobles hélices, triplex, cuádruples, etc.).
Por "operativamente enlazado" o "operativamente asociado" se entiende que dos o más estructuras químicas están directa o indirectamente enlazadas entre sí de tal manera que permanezcan enlazadas a través de las diversas manipulaciones que se espera que experimenten. Normalmente, la entidad química y el dominio auricular están asociados operativamente de manera indirecta (p. ej., covalentemente a través de un espaciador apropiado). Por ejemplo, el espaciador puede ser un resto bifuncional con un sitio de unión para la entidad química y un sitio de unión para el dominio auricular.
[0075] Por "grupo fotorreactivo" se entiende un grupo reactivo que participa en una reacción causada por la absorción de ultravioleta, visible o radiación infrarroja, produciendo de este modo un enlace. En el presente documento se describen ejemplos de grupos fotorreactivos no limitantes.
Por "grupo protector" se entiende un grupo destinado a proteger el extremo 3’ o el extremo 5' de un oligonucleótido o para proteger uno o más grupos funcionales de la entidad química, andamio o bloque de construcción contra reacciones indeseables durante uno o más pasos de unión para hacer, etiquetar o usar una biblioteca codificada por oligonucleótidos. Los grupos protectores comúnmente usados se describen en Greene, Protective Groups in Organic Synthesis, 4a edición (John Wiley & Sons, Nueva York, 2007). Los ejemplos de grupos protectores para oligonucleótidos incluyen grupos protectores irreversibles, tales como didesoxinucleótidos y didesoxinucleósidos (ddNTP o ddN) y, más preferiblemente, grupos protectores reversibles para grupos hidroxilo, tales como grupos éster (p. ej., O-(a-metoxietilo) éster, O-isovalerilo éster y O-levulinilo éster), grupos tritilo (p. ej., dimetoxitritilo y monometoxitritilo), grupos xantenilo (p. ej., 9-fenilxanten-9-ilo y 9-(p-metoxifenilo) xanten-9-ilo), grupos acilo (p. ej., fenoxiacetilo y acetilo) y grupos sililo (p. ej., t-butildimetilsililo). Los ejemplos de grupos protectores no limitantes para entidades químicas, andamios y bloques de construcción incluyen grupos protectores de N para proteger un grupo amino contra reacciones indeseables durante el procedimiento sintético (p. ej., grupos acilo; ariloílo; carbamilo, como formilo, acetilo, propionilo, pivaloílo, t-butilacetilo, 2-cloroacetilo, 2-bromoacetilo, trifluoroacetilo, tricloroacetilo, ftalilo, o-nitrofenoxiacetilo, a-clorobutirilo, benzoilo, 4-clorobenzoílo, 4-bromobenzoílo, y 4-nitrobenzoílo o auxiliares protegidos D, L o D, L-aminoácidos no protegidos, tales como alanina, leucina, fenilalanina y similares; grupos que contienen sulfonilo, tales como bencenosulfonilo, p-toluensulfonilo y similares; grupos formadores de carbamato, tales como benciloxicarbonilo, p-clorobenciloxicarbonilo, p-metoxibenciloxicarbonilo, p-nitrobenciloxicarbonilo, 2-nitrobenciloxicarbonilo, p-bromobenciloxicarbonilo, 3,4-dimetoxibenciloxicarbonilo, 3,5 dimetoxibenciloxicarbonilo, 2,4-dimetoxibenciloxicarbonilo, 4-metoxicarbonilo ycarbonil, 2-nitro-4,5-dimetoxibenciloxicarbonilo, 3,4,5 trimetoxibenciloxicarbonilo, 1 -(p-bifenilil)-1 -metiletoxicarbonilo, a,a-dimetil-3,5 dimetoxibenciloxicarbonilo, benzhidriloxicarbonilo, t-butiloxicarbonilo, diisopropilmetoxicarbonilo, isopropiloxicarbonilo, etoxicarbonilo, metoxicarbonilo, aliloxicarbonilo, 2,2,2,-tricloroetoxicarbonilo, fenoxicarbonilo, 4-nitrofenoxicarbonilo, fluorenil-9-metoxicarbonilo, ciclopentiloxicarbonilo, adamantiloxicarbonilo y el carbonilocarbonilo, adamantiloxicarbonilo; grupos alcarilo, tales como bencilo, trifenilmetilo, benciloximetilo y similares; y grupos sililo tales como trimetilsililo y similares; donde los grupos N-protectores preferidos son formilo, acetilo, benzoílo, pivaloílo, t-butilacetilo, alanilo, fenilsulfonilo, bencilo, t-butiloxicarbonilo (Boc) y benciloxicarbonilo (Cbz)); Grupos protectores de O para proteger un grupo hidroxilo contra reacciones indeseables durante el procedimiento de síntesis (p. ej., grupos alquilcarbonilo, como acilo, acetilo, pivaloilo y similares; grupos arilcarbonilo opcionalmente sustituidos, como benzoilo; grupos sililo, como trimetilsililo (TMS), tercbutildimetilsililo (TBDMS), tri-isopropilsililoximetilo (TOM), triisopropilsililo (TIPS), y similares; grupos formadores de éter con el hidroxilo, tales como metilo, metoximetilo, tetrahidropiranilo, bencilo, p-metoxibencilo, tritilo y similares; alcoxicarbonilos, tales como metoxicarbonilo, etoxicarbonilo, isopropoxicarbonilo, n-isopropoxicarbonilo, n-butiloxicarbonilo, isobutiloxicarbonilo, sec-butiloxicarbonilo, t-butiloxicarbonilo, 2-etilhexiloxicarbonilo, ciclohexiloxicarbonilo, metiloxicarbonilo, y similares; grupos alcoxialcoxicarbonilo, tales como metoximetoxicarbonilo, etoximetoxicarbonilo, 2-metoxietoxicarbonilo, 2-etoxietoxicarbonilo, 2-butoxietoxicarbonilo, 2-metoxietoximetoxicarbonilo, aliloxicarbonilo, propargiloxicarbonilo, 2-butenoxicarbonilo, 3-metilo-2-butenoxicarbonilo y similares; haloalcoxicarbonilos, tales como 2-cloroetoxicarbonilo, 2-cloroetoxicarbonilo, 2,2,2-tricloroetoxicarbonilo y similares; grupos arilalcoxicarbonilo opcionalmente sustituidos, tales como benciloxicarbonilo, pmetilbenciloxicarbonilo, p-metoxibenciloxicarbonilo, p-nitrobenciloxicarbonilo, 2,4-dinitrobenciloxicarbonilo, 3,5-dimetilbenciloxicarbonilo, p-clorobenciloxicarbonilo, p-bromobenciloxicarbonilo y similares; y grupos de ariloxicarbonilo opcionalmente sustituidos, tales como fenoxicarbonilo, p-nitrofenoxicarbonilo, o-nitrofenoxicarbonilo, 2,4-dinitrofenoxicarbonilo, p-metilo-fenoxicarbonilo, m-metilfenoxicarbonilo o-bromofenoxicarbonilo, 3,5-dimetilfenoxicarbonilo, p-clorofenoxicarbonilo, 2-cloro-4-nitrofenoxicarbonilo y similares); grupos protectores de carbonilo (p. ej., grupos acetal y cetal, tales como dimetilacetal, 1,3-dioxolano y similares; grupos acilal; y grupos ditiano, tales como 1,3-ditianos, 1,3-ditiolano y similares); grupos protectores de ácido carboxílico (p. ej., grupos éster, tales como éster metílico, éster bencílico, éster t-butílico, ortoésteres y similares; grupos sililo, tales como trimetilsililo, así como cualquiera de los descritos aquí; y grupos oxazolina); y grupos protectores de fosfato (p. ej., grupos éster opcionalmente sustituidos, tales como éster metílico, éster isopropílico, éster 2-cianoetílico, éster alílico, éster tbutílico, éster bencílico, éster fluorenilmetílico, éster 2-(trimetilsilil)etílico, éster 2-(metilsulfonil)etílico, éster 2,2,2-tricloroetílico, éster de 3’,5'-dimetoxibenzoína, éster de p-hidroxifenacilo y similares).
[0076] Por "proximidad" o "en la proximidad" a un terminal de un oligonucleótido se entiende cerca o más cerca del extremo indicado que el otro extremo restante. Por ejemplo, un resto o grupo en la proximidad del extremo 3’ de un oligonucleótido está cerca o más cerca del extremo 3' que el extremo 5’. En realizaciones particulares, un resto o grupo en las proximidades del extremo 3’ de un oligonucleótido es uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, quince o más nucleótidos del extremo 3’. En otras realizaciones, un resto o grupo en las proximidades del extremo 5’ de un oligonucleótido es uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, quince o más nucleótidos del extremo 5’.
[0077] Por "purificar" se entiende la eliminación de cualquier producto que no ha reaccionado o cualquier agente presente en una mezcla de reacción que puede reducir la actividad de un agente químico o biológico para ser utilizados en una etapa sucesiva. La purificación puede incluir una o más de separación cromatográfica, separación electroforética y precipitación del producto o reactivo que no ha reaccionado a eliminar.
[0078] Por "grupo co-reactivo reversible" se entiende un grupo reactivo que participa en una reacción reversible. Los grupos reactivos no limitativos ejemplares incluyen grupos fotorreactivos, donde la exposición a una radiación de absorción particular da como resultado un enlace entre los grupos fotorreactivos y la exposición a una radiación de absorción particular diferente da como resultado la escisión del enlace formado (p. ej., un grupo cianovinilcarbazol, grupo cianovinilo y grupo acrilamida). Otro grupo reactivo no limitante ejemplar incluye grupos reactivos redox, donde tales grupos pueden reducirse u oxidarse reversiblemente (p. ej., un grupo tiol).
[0079] Por "andamio" se entiende un resto químico que muestra uno o más nodos de la diversidad en una geometría especial en particular. Los nodos de diversidad se adjuntan típicamente al andamio durante la síntesis de la biblioteca, pero en algunos casos se puede adjuntar un nodo de diversidad al andamio antes de la síntesis de la biblioteca (p. ej., adición de uno o más bloques de construcción y/o una o más etiquetas). En algunas realizaciones, el andamio se deriva de manera que se puede desproteger ortogonalmente durante la síntesis de la biblioteca y posteriormente reaccionar con diferentes nodos de diversidad.
[0080] Por fármaco de "molécula pequeña" o candidato a fármaco de "molécula pequeña" se entiende una molécula que tiene un peso molecular por debajo de aproximadamente 1.000 Daltons. Las moléculas pequeñas pueden ser orgánicas o inorgánicas, aisladas (p. ej., de bibliotecas de compuestos o fuentes naturales) u obtenidas por derivatización de compuestos conocidos.
[0081] Por "identidad sustancial" o "sustancialmente idéntico" se quiere decir una secuencia de polipéptido o polinucleótido que tiene la misma secuencia de polipéptido o polinucleótido, respectivamente, como una secuencia de referencia, o tiene un porcentaje especificado de residuos de aminoácidos o nucleótidos, respectivamente, que son iguales en la ubicación correspondiente dentro de una secuencia de referencia cuando las dos secuencias están alineadas de manera óptima. Por ejemplo, una secuencia de aminoácidos que es "sustancialmente idéntica" a una secuencia de referencia tiene al menos 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o 100% de identidad con la secuencia de aminoácidos de referencia. Para los polipéptidos, la longitud de las secuencias de comparación será generalmente de al menos 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 aminoácidos contiguos, más preferiblemente al menos 25, 50, 75, 90, 100, 150, 200, 250, 300 o 350 aminoácidos contiguos y lo más preferiblemente la secuencia de aminoácidos de longitud completa. Para los ácidos nucleicos, la longitud de las secuencias de comparación será generalmente de al menos 5 nucleótidos contiguos, preferiblemente al menos 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24., o 25 nucleótidos contiguos, y más preferiblemente la secuencia de nucleótidos de longitud completa. La identidad de secuencia se puede medir usando software de análisis de secuencia en el ajuste predeterminado (p. ej., Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705). Dicho software puede hacer coincidir secuencias similares asignando grados de homología a varias sustituciones, deleciones y otras modificaciones.
[0082] Por "etiqueta" o "marca de oligonucleótido" se entiende una porción de oligonucleótido de la biblioteca al menos parte de la cual codifica la información. Los ejemplos no limitantes de dicha información incluyen la adición (p. ej., mediante una reacción de unión) de un componente (es decir, un andamio o un bloque de construcción, como en una etiqueta de andamio o una etiqueta de bloque de construcción, respectivamente), el dominio auricular en la biblioteca, la identidad de la biblioteca (es decir, como en una etiqueta de identidad), el uso de la biblioteca (es decir, como en una etiqueta de uso) y/o el origen de un miembro de la biblioteca (es decir, como en una etiqueta de origen).
[0083] Por "cordal" se entiende una porción de oligonucleótido de la biblioteca que se une al complejo después de la adición de todas las etiquetas anteriores y codifica para la identidad de la biblioteca, el uso de la biblioteca, y/o el origen de un miembro de la biblioteca.
[0084] Por "cebador" se entiende un oligonucleótido que es capaz de hibridar con una plantilla de oligonucleótido y luego se extiende por una polimerasa de una manera dependiente de la plantilla.
[0085] Por "cebador de relevo" se entiende un oligonucleótido que es capaz de hibridar con una plantilla de oligonucleótido que contiene, en la región de la plantilla a la que se hibrida el cebador, al menos un enlace internucleotídico que reduce la capacidad de una polimerasa para leer o trasladar. Tras la hibridación, uno o más cebadores de relevo permiten la extensión por una polimerasa de una manera dependiente de la plantilla.
[0086] Por "recombinación", como se usa en el presente documento, se quiere decir la generación de un producto de la polimerasa como resultado de al menos dos eventos de hibridación distintos.
[0087] Otras características y ventajas de la invención serán evidentes a partir de la siguiente descripción detallada y las reivindicaciones.
Breve descripción de los dibujos
[0088]
Las Figuras 1A-1B muestran complejos ejemplares. La Figura 1A muestra un complejo (de la dirección 5’ a 3') que tiene una entidad química (estrella), una secuencia constante fija (p. ej., un dominio auricular), seguida de tres secuencias de codificación variable (p. ej., tres etiquetas) y otra secuencia constante fija (p. ej., un cordal), donde se puede leer el enlace entre las secuencias constantes fijas y las secuencias codificadoras variables. El complejo se puede extender aún más usando una polimerasa con un cebador (hibridado con el extremo 3’ del complejo), opcionalmente amplificado con PCR y secuenciado. La Figura 1B muestra un complejo que tiene vínculos ilegibles. El complejo (de la dirección 5’ a 3') tiene una entidad química (estrella), una secuencia constante fija (p. ej., un dominio auricular), seguida de tres secuencias de codificación variables (p. ej., tres etiquetas) y otra secuencia constante fija (p. ej., un cordal), donde el enlace entre las secuencias constantes fijas y las secuencias de codificación variable son ilegibles. Cada una de las secuencias de codificación variable incluye un conector 5’ y un conector 3' que son secuencias constantes fijas. Debido a que los enlaces son ilegibles, los cebadores de retransmisión se utilizan para extender los enlaces y permitir la extensión con una polimerasa, formando así fragmentos de oligonucleótidos. A continuación, los fragmentos se ligan usando ligasa, opcionalmente se amplifican con PCR y se secuencian. El proceso de lectura (p. ej., extensión opcional, ligación, amplificación opcional y secuenciación) se puede realizar opcionalmente por completo después de la selección. Alternativamente, la parte opcional de extensión y ligación del proceso de lectura puede realizarse antes de la selección.
La Figura 2 muestra un complejo ejemplar que tiene un enlace ilegible formado por psoraleno. El esquema proporciona (desde la dirección 5’ a 3') una secuencia de codificación variable, un conector 3’, un conector 5' y otra secuencia de codificación variable. El conector 3’ y el conector 5' se hibridan para formar un dúplex, y el psoraleno (una fracción fotorreactiva intercalada) forma un enlace ilegible entre los conectores 5’ y 3'. El cebador de relevo se hibrida con los conectores 5’ y 3' y se extiende por el enlace ilegible. Las partes legibles del complejo (p. ej., la secuencia codificante variable) se extienden con una polimerasa para formar fragmentos de oligonucleótidos. Los fragmentos y cebadores de relevo se ligan usando ligasa, opcionalmente se amplifican con PCR y se secuencian. El proceso de lectura (p. ej., extensión, ligación, amplificación opcional y secuenciación) pueden realizarse opcionalmente por completo después de la selección. Alternativamente, la parte de extensión y ligación del proceso de lectura puede realizarse antes de la selección.
La Figura 3 muestra un complejo ejemplar que tiene enlaces ilegibles formados por un oligonucleótido reticulante. En el esquema superior, el complejo incluye (desde la dirección 5’ a 3') una entidad química (estrella), una secuencia constante fija (p. ej., un dominio auricular), un oligonucleótido reticulado que está reticulado a través de un grupo co-reactivo reversible (p. ej., grupos cianovinilcarbazol reticulados a aproximadamente 366 nm, reticulaciones marcadas con X), y seguido de una secuencia codificante variable que tiene secuencias constantes fijas en los extremos 5’ y 3' (p. ej., una etiqueta con conectores 5’ y 3'). La combinación del oligonucleótido de reticulación y la secuencia codificante variable se repite tres veces más. Luego, sigue el oligonucleótido de reticulación final y otra secuencia constante fija (p. ej., un cordal). Las reticulaciones se marcan con X. A continuación, el complejo se hace reaccionar con un proceso químico y/o un proceso enzimático (p. ej., una ligasa y opcionalmente una quinasa) para ligar las etiquetas. A continuación, los oligonucleótidos reticulantes se liberan para formar una plantilla (p. ej., usando absorción a aproximadamente 312 nm). Finalmente, la plantilla se amplifica opcionalmente con PCR y se secuencia. El proceso de lectura (p. ej., etapa de quinasa opcional, ligación, amplificación opcional y secuenciación) puede opcionalmente realizarse por completo después de la selección. Alternativamente, el paso de quinasa opcional y el paso de ligación del proceso de lectura pueden realizarse antes de la selección.
La Figura 4 muestra una reacción reversible ejemplar con grupos co-reactivos reversibles (un par de un grupo cianovinilcarbazol y una timidina) y el uso de estos grupos permite la formación de enlaces cruzados entre el oligonucleótido reticulante y la secuencia constante fija de la etiqueta de oligonucleótidos. Los grupos co-reactivos reversibles (marcados con X y X’) están presentes en el conector 3', el conector 5’ y el oligonucleótido reticulante.
La Figura 5 muestra el oligonucleótido CNVKJ, que contiene dos modificaciones de cianovinilcarbazol, CNVK2_P_EtiquetaB, CNVK_2_NP_EtiquetaB y CNVK2_EtiquetaA.
La Figura 6 muestra los resultados de la electroforesis de los productos de entrecruzamiento fotoquímico de los oligonucleótidos CNVKJ, CNVK2_P_EtiquetaB y CNVK2_EtiquetaA.
La Figura 7 muestra el CLEM de CNVK2_P_EtiquetaB y CNVK2_EtiquetaA purificados.
La Figura 8 muestra el CLEM de la recuperación de la Doble_CNVK_plantilla inicial.
La Figura 9 muestra el CLEM de tratamiento de un complejo de CNVK2_P_EtiquetaB, CNVK2_EtiquetaA y CNVKJ con T4 ligasa ADN.
La Figura 10 muestra los resultados de CLEM de la reacción de fosforilación-ligación del par de etiquetas modelo no fosforiladas fotoquímicamente reticuladas CNVK2_NP_EtiquetaB con CNVK2_EtiquetaA y CNVKJ.
La Figura 11 muestra el oligonucleótido 5PSO2_A9_TA, modificado con C2-Psoraleno en el extremo 5’ y el oligonucleótido PSO_HP_A9_TCT.
La Figura 12 muestra la CLEM del entrecruzamiento de oligonucleótidos fotoquímicos usando psoraleno dentro de un tallo para modelar un evento de marcado del oligonucleótido 5PSO2_A9_TA, modificado con C2-Psoraleno en el extremo 5’ y el oligonucleótido PSO_HP_A9_TCT.
La Figura 13 muestra los oligonucleótidos Etiqueta1_PsoCVU y FérulaC_PsoC2 y el oligonucleótido 5PSOC2_A9_GA (modificado en el extremo 5’ con psoraleno C2).
La Figura 14 muestra un esquema de fotoligación con psoraleno.
La Figura 15 muestra un gel del transcurso del tiempo de la fotoligación con psoraleno.
La Figura 16 muestra el CLEM del conjugado fotoligado de 5PsoC2_A9_GA y Etiqueta1_PsoCVU.
La Figura 17 muestra un oligonucleótido 5'-biotinilado 5Bio_Etiqueta_PsoCVU y un oligonucleótido 5'-psoraleno 5PsoC2_A9_GA junto con un oligonucleótido de férula FérulaC_PsoC2.
La Figura 18 muestra la CLEM de un conjugado de oligonucleótidos ligado fotoquímicamente de psoralenotimidina (Bio_Pso).
La Figura 19 muestra la CLEM de ADNc generado a partir de Bio_Pso usando extensión y ligación de cebadores terminales y no terminales.
La Figura 20 muestra la CLEM del control sin ligación del ADNc generado a partir de Bio_Pso usando extensión de cebador terminal y no terminal.
La Figura 21 muestra los oligonucleótidos CVU_G y CVU_A y los oligonucleótidos Etiqueta1_PsoCVU, FérulaC_CVU y FérulaA_CVU.
La Figura 22 muestra la estructura de la unión de ligación fotoquímica formada entre una 5'-5-(Carboxi) vinil-2'-desoxiuridina irradiada y una 3'-timidina.
La Figura 23 muestra un gel del curso temporal de la fotoligación de CVU a 365 nm.
La Figura 24 muestra el CLEM del producto de ligación fotoquímica de CVU_G con Etiqueta1_PsoCVU. La Figura 25 muestra la CLEM de un conjugado de oligonucleótido ligado fotoquímicamente de carboxivinil uridina-timidina (Bio_CVU).
La Figura 26 muestra la CLEM de la plantilla Bio_CVU menos un solo nucleótido dA.
La Figura 27 muestra los oligonucleótidos S_IDTN 3 y S_IDTalquino.
La Figura 28 muestra el análisis CLEM del conjugado purificado en gel de S_IDTN 3 y S_IDTalquino. La Figura 29 muestra los oligonucleótidos TKR_Central y S_IDTN 3 y el oligo TKR_d Bc O_S modificado con 5'-dibenzo-ciclooctina (DBCO).
La Figura 30 muestra el curso de tiempo CLEM de la reacción de clic sin cobre entre TKR_DBCO_S y TKR_Central.
La Figura 31 muestra el CLEM del conjugado 2cl_s.
La Figura 32 muestra Conyugado_Clic_S y Conyugado_Clic_L.
La Figura 33 muestra la generación de ADNc mediada por recombinación dependiente de la férula/amplificación por PCR de Conyugado_Clic_L y Conyugado_Clic_S mediante (exo-) polimerasa Deep Vent en presencia y ausencia de ePsplint. 24 ciclos, concentración de conjugado inicial de 200 pM. 1-Marcador; 2-sin plantilla; 3-sin plantilla ePférula; 4-Conyugado_Clic_S; 5-Conyugado_Clic_S ePférula; 6-Conyugado_Clic_L; 5-Conyugado_Clic_L ePférula.
La Figura 34 muestra el mecanismo propuesto de amplificación por PCR/generación de ADNc mediada por recombinación dependiente de férula.
La Figura 35 muestra la generación de ADNc mediada por recombinación dependiente de la férula/amplificación por PCR de Conyugado_Clic_S y Conyugado_Clic_L por exopolimerasa Deep Vent tanto por separado como mezcladas en solución libre. Todas las reacciones complementadas con ePférula. 1-Marcador; 2-sin plantilla; 3-Conyugado_Clic_S; 4-Conyugado_Clic_L; 5-Conyugado_Clic_S y Conyugado_Clic_L.
La Figura 36 muestra el posible mecanismo de recombinación de los productos de amplificación por PCR/generación de ADNc mediada por recombinación dependiente de la férula en solución libre con la consiguiente mezcla (pérdida) de asociaciones de etiquetas (información codificada).
La Figura 37 muestra la generación de ADNc/amplificación por PCR mediada por recombinación de la mezcla Conyugado_Clic_S y Conyugado_Clic_L por (exo-) polimerasa Deep Vent en solución libre y en compartimentos acuosos emulsionados con las siguientes condiciones: 30 segundos a 94°C, 30 segundos a 52°C y 60 segundos a 72°C durante 35 ciclos, y una concentración de conjugado inicial de 5 pM; 1 -Marcador; 2-solución libre, 3-compartimentos acuosos emulsionados.
La Figura 38 muestra los conjugados TKR_S y TKR_L y sus trazas CLEM.
La Figura 39 muestra la generación de ADNc/amplificación por PCR mediada por recombinación dependiente de repetición (exo) polimerasa Deep Vent de TKR_S y TKR_L. 1- Marcador, 2-sin plantilla, 3-TKR_S, 4-TKR_L, 5-TKR L y TKR_S. Condiciones: 5 uL de tampón Thermopol 10x; 2,5 uL de una solución 10 uM de cada cebador directo e inverso; 2,5 uL 10 mM de mezcla dNTP (NEB); Concentración final de 40 pM del conjugado o de su mezcla 1:1, 2,5 uL de polimerasa Deep Vent (exo-) y agua hasta 50 uL. La reacción se cicló 21 veces como sigue: 30 segundos a 94°C, 30 segundos a 52°C y 60 segundos a 72°C.
La Figura 40 muestra los datos de secuencia derivados del producto de amplificación clonado de la generación de ADNc mediada por recombinación dependiente de repetición/amplificación por PCR de TKR_S y TKR_L mixtos en solución libre.
La Figura 41 muestra los conjugados TKR_2_clic_S y TKR_2_clic_L y sus trazas CLEM.
La Figura 42 muestra la amplificación por PCR/generación de ADNc mediada por recombinación dependiente de repetición de (exo) polimerasa Deep Vent de 2_clic_S y 2_clic_L en solución libre. 1- Marcador; 2-Sin control de plantilla; 3-2_clic_S; 4-2_clic_L; 5-1:1 mezcla de 2_clic_S y 2_clic_L. Condiciones: 5 uL de tampón Thermopol 10x; 2,5 uL de una solución 10 uM de cada cebador directo e inverso; 2,5 uL de mezcla de dNTP 10 mM (NEB); Concentración final de 40 pM del conjugado o de su mezcla 1:1, 2,5 uL de polimerasa Deep Vent (exo-) y agua hasta 50 uL. La reacción se cicló 22 veces como sigue: 30 segundos a 94°C, 30 segundos a 52°C y 60 segundos a 72°C.
La Figura 43 muestra los datos de secuencia derivados del producto de amplificación clonado del producto de amplificación por PCR/generación de ADNc mediado por recombinación dependiente de repetición de la mezcla TKR_2_clic_S y TKR_2_clic_L en solución libre.
Descripción detallada
[0089] Hemos desarrollado complejos que tienen al menos un enlace (p. ej., un enlace químico) para el cual una polimerasa tiene capacidad reducida de leer o translocar a través. La capacidad de etiquetar bibliotecas sin verse limitado por la legibilidad de una polimerasa amplía enormemente la gama de métodos de etiquetado que se pueden utilizar. Las posibles ventajas no limitantes incluyen una masa reducida de etiquetas y/o miembros de la biblioteca; mayor solubilidad de los miembros de la biblioteca en diversas condiciones de reacción (p. ej., en condiciones acuosas y/u orgánicas adecuadas tanto para la síntesis de entidades químicas como de etiquetas); estabilidad incrementada (p. ej., en condiciones de reacción acuosas y/u orgánicas, donde tales etiquetas y enlaces oligonucleotídicos pueden ser más resistentes a condiciones de reacción particulares, en comparación con la etiqueta sin tales enlaces); menor costo (p. ej., reducir el uso de reactivos enzimáticos costosos); mayor facilidad de uso (p. ej., el uso de reticulación con cianovinilcarbazol se produce en un amplio intervalo de pH de 5,5 a 9,5, lo que permite la reticulación en condiciones de reacción adecuadas para formar la parte de entidad química del complejo); número reducido de pasos de reacción y uso reducido de reactivo(s) (p. ej., uso reducido de un paso de intercambio de tampón, como durante reacciones de división combinatoria, donde miles de alícuotas pequeñas individuales deben procesarse de forma independiente; un paso de precipitación o un paso de modificación del pH); mayor fidelidad (p. ej., cuando se utilizan métodos mediados por hibridación para reducir la frecuencia de aparición de eventos de etiquetado erróneo); y una mayor compatibilidad con las condiciones de reacción para formar la entidad química (p. ej., permite el uso de funcionalidades ortogonales, donde se pueden usar químicas de marcado únicas (p. ej., uso de irradiación UV) que no ocurrirán durante el paso posterior a la división/mezcla(s), lo que también reducirá la frecuencia de eventos de etiquetado incorrecto).
[0090] Debido a que tales vínculos pueden haber reducido la legibilidad por una polimerasa, también hemos desarrollado métodos para permitir la secuenciación de tales complejos. Estos métodos incluyen el uso de cebadores de relevo para expandir los enlaces y/o el uso de oligonucleótidos reticulantes liberables. Estos complejos y métodos pueden usarse para crear diversas bibliotecas de entidades químicas seleccionables mediante el establecimiento de una relación codificada entre etiquetas particulares y reacciones químicas o bloques de construcción particulares. Para identificar una o más entidades químicas, las etiquetas de oligonucleótidos se pueden amplificar, clonar, secuenciar y correlacionar utilizando la relación establecida. Los métodos para crear y etiquetar bibliotecas de estos complejos se describen en detalle a continuación.
Complejos
[0091] Los métodos de la invención incluyen un complejo que incluye una entidad química, una o más etiquetas, y un dominio auricular asociado operativamente con la entidad química y una o más etiquetas. Al menos uno de los enlaces entre el dominio auricular y la etiqueta o entre dos etiquetas es un enlace para el que una polimerasa tiene una capacidad reducida para leer o trasladar. Las entidades químicas, dominios auriculares, etiquetas, enlaces y espaciadores bifuncionales se describen con más detalle a continuación.
Entidades químicas
[0092] Los métodos de la invención incluyen entidades químicas o miembros (p. ej., pequeñas moléculas o péptidos) que pueden incluir uno o más bloques de construcción y opcionalmente incluyen uno o más andamios.
[0093] El andamio S puede ser un solo átomo o un andamio molecular. Los andamios de un solo átomo ejemplares incluyen un átomo de carbono, un átomo de boro, un átomo de nitrógeno o un átomo de fósforo, etc. Los andamios poliatómicos ejemplares incluyen un grupo cicloalquilo, un grupo cicloalquenilo, un grupo heterocicloalquilo, un grupo heterocicloalquenilo, un grupo arilo o un grupo heteroarilo. Las realizaciones particulares de un andamio de heteroarilo incluyen una triazina, tal como 1,3,5-triazina, 1,2,3-triazina o 1,2,4-triazina; una pirimidina; una pirazina; una piridazina; un furano; un pirrol; una pirrolina; una pirrolidina; un oxazol; un pirazol; un isoxazol; un pirano; una piridina; un indol; un indazol; o una purina.
[0094] El andamio S puede ser unido operativamente a la etiqueta mediante cualquier método útil. En un ejemplo, S es una triazina que está vinculada directamente al dominio auricular. Para obtener este andamio ejemplar, se hace reaccionar triclorotriazina (es decir, un precursor clorado de triazina que tiene tres cloros) con un grupo nucleófilo del dominio auricular. Usando este método, S tiene tres posiciones que tienen cloro que están disponibles para sustitución, donde dos posiciones son nodos de diversidad disponibles y una posición está unida al dominio auricular. A continuación, el bloque de construcción An se agrega a un nodo de diversidad del andamio, y la codificación de la etiqueta An para el bloque de construcción An ("etiqueta An”) se liga al dominio auricular, donde estos dos pasos se pueden realizar en cualquier orden. Luego, el bloque de construcción Bn se agrega al nodo de diversidad restante, y la codificación de la etiqueta Bn para el bloque de construcción Bn se liga al final de la etiqueta An. En otro ejemplo, S es una triazina que está operativamente unida a una etiqueta, donde la triclorotriazina reacciona con un grupo nucleófilo (p. ej., un grupo amino) de un conector PEG, alifático o aromático de una etiqueta. Se pueden agregar bloques de construcción y etiquetas asociadas, como se describe anteriormente.
[0095] En otro ejemplo, S es una triazina que está unida operativamente al bloque de construcción An. Para obtener este andamio, el bloque de construcción An que tiene dos nodos de diversidad (p. ej., un grupo electrófilo y un grupo nucleófilo, como un aminoácido Fmoc) se hace reaccionar con el grupo nucleófilo de un enlazador (p. ej., el grupo terminal de un PEG, alifático, o enlazador aromático, que se adjunta a un dominio auricular). Luego, la triclorotriazina se hace reaccionar con un grupo nucleofílico del bloque de construcción An. Con este método, las tres posiciones de cloro de S se utilizan como nodos de diversidad para los bloques de construcción. Como se describe en el presente documento, se pueden agregar bloques de construcción y etiquetas adicionales, y se pueden agregar andamios adicionales Sn.
[0096] Los bloques de construcción ejemplares An incluyen, p. ej., aminoácidos (p. ej., aminoácidos alfa, beta, gamma, delta y épsilon, así como derivados de aminoácidos naturales y no naturales), reactantes químicamente reactivos (p. ej., cadenas de azida o alquino) con una amina, o un reactivo tiol, o combinaciones de los mismos. La elección del bloque de construcción An depende, p. ej., de la naturaleza del grupo reactivo utilizado en el enlazador, la naturaleza de un resto de andamio y el disolvente utilizado para la síntesis química.
[0097] Los bloques de construcción ejemplares Bn's y Cn's incluyen cualquier unidad estructural útil de una entidad química, tal como grupos aromáticos opcionalmente sustituidos (p. ej., fenilo o bencilo opcionalmente sustituidos), grupos heterociclilo opcionalmente sustituidos (p. ej., quinolinilo, isoquinolinilo, indolilo, isoindolilo, azaindolilo, bencimidazolilo, azabencimidazolilo, bencisoxazolilo, piridinilo, piperidilo, o pirrolidinilo opcionalmente sustituidos), grupos alquilo (p. ej., grupos C1-6 alquilo opcionalmente sustituidos lineales o ramificados o grupos C1-6 aminoalquilo opcionalmente sustituidos), o grupos carbociclilo opcionalmente sustituidos (p. ej., ciclopropilo, ciclohexilo o ciclohexenilo opcionalmente sustituidos). Particularmente bloques de construcción útiles Bn’s y Cn’s incluyen los que tienen uno o más grupos reactivos, tal como un grupo opcionalmente sustituido (p. ej., cualquiera de los descritos en este documento) que tiene uno o más sustituyentes opcionales que son grupos reactivos o se pueden modificar químicamente para formar grupos reactivos. Los ejemplos de grupos reactivos incluyen uno o más de amina (-NR2 , donde cada R es, independientemente, H o un C1-6 alquilo opcionalmente sustituido), hidroxi, alcoxi (-OR, donde R es un C1-6 alquilo opcionalmente sustituido, como metoxi), carboxi (-COOH), amida o sustituyentes químicamente reactivos. Puede introducirse un sitio de restricción, p. ej., en la etiqueta Bn o Cn, donde se puede identificar un complejo realizando PCR y digestión de restricción con una de las enzimas de restricción correspondientes.
Dominio auricular
[0098] En la biblioteca, el dominio auricular enlaza operativamente cada entidad química a su etiqueta de oligonucleótido codificante. Generalmente, el dominio auricular es un oligonucleótido de partida que tiene dos grupos funcionales que pueden derivatizarse adicionalmente, donde el primer grupo funcional une operativamente la entidad química (o un componente de la misma) al dominio auricular y el segundo grupo funcional enlaza operativamente una o más etiquetas a la fuente. Opcionalmente, se puede usar un espaciador bifuncional como un resto espaciador entre el dominio auricular y la entidad química.
[0099] Los grupos funcionales del dominio auricular pueden utilizarse para formar un enlace covalente con un componente de la entidad química y un enlace covalente con una etiqueta. El componente puede ser cualquier parte de la molécula pequeña, como un andamio con nodos de diversidad o un bloque de construcción. Alternativamente, el dominio auricular se puede derivatizar para proporcionar un espaciador (es decir, un resto espaciador que separa el dominio auricular de la molécula pequeña que se formará en la biblioteca) que termina en un grupo funcional (p. ej., un hidroxilo, amina, carboxilo, sulfhidrilo, alquinilo, azido o grupo fosfato), que se usa para formar el enlace covalente con un componente de la entidad química. El espaciador se puede colocar en el extremo 5’, en una de las posiciones internas, o en el extremo 3' del dominio auricular. Cuando el espaciador está unido a una de las posiciones internas, el espaciador puede unirse operativamente a una base derivatizada (p. ej., la posición C5 de la uridina) o colocarse internamente dentro del oligonucleótido usando técnicas estándar conocidas en la técnica. En este documento se describen espaciadores ejemplares.
[0100] El dominio auricular puede tener cualquier estructura útil. El dominio auricular puede tener, p. ej., de 1 a 100 nucleótidos de longitud, preferiblemente de 5 a 20 nucleótidos de longitud y lo más preferiblemente de 5 a 15 nucleótidos de longitud. El dominio auricular puede ser monocatenario o bicatenario y puede consistir en nucleótidos naturales o modificados, como se describe en el presente documento. Por ejemplo, el resto químico se puede unir operativamente al extremo 3’ o al extremo 5' del dominio auricular. En realizaciones particulares, el dominio auricular incluye una estructura de horquilla formada por bases complementarias dentro de la secuencia. Por ejemplo, el resto químico se puede unir operativamente a la posición interna, el extremo 3’ o el extremo 5' del dominio auricular.
[0101] Generalmente, el dominio auricular incluye una secuencia no autocomplementaria en el extremo 5’ o 3' que permite la unión de una etiqueta oligonucleotídica mediante polimerización, ligación enzimática o reacción química. El dominio auricular puede permitir la ligación de etiquetas de oligonucleótidos y pasos opcionales de purificación y fosforilación. Después de la adición de la última etiqueta, se puede agregar una secuencia de adaptador adicional al extremo 5’ de la última etiqueta. Las secuencias adaptadoras ejemplares incluyen una secuencia de unión a cebador o una secuencia que tiene un marcador (p. ej., biotina). En los casos en los que se utilizan muchos bloques de construcción y etiquetas correspondientes (p. ej., 100), se puede emplear una estrategia de mezcla y división durante el paso de síntesis de oligonucleótidos para crear el número necesario de etiquetas. Tales estrategias de mezcla y división para la síntesis de ADN son conocidas en la técnica. Los miembros de la biblioteca resultantes pueden amplificarse mediante PCR después de la selección de entidades de unión frente a una diana de interés.
[0102] El dominio auricular o el complejo puede incluir opcionalmente una o más secuencias de unión a cebador. Por ejemplo, el dominio auricular tiene una secuencia en la región del bucle de la horquilla que sirve como región de unión del cebador para la amplificación, donde la región de unión del cebador tiene una temperatura de fusión más alta para su cebador complementario (p. ej., que puede incluir regiones de identificación flanqueantes) que para una secuencia en el dominio auricular. En otras realizaciones, el complejo incluye dos secuencias de unión de cebadores (p. ej., para permitir una reacción de PCR) en cualquier lado de una o más etiquetas que codifican uno o más bloques de construcción. Alternativamente, el dominio auricular puede contener una secuencia de unión del cebador en el extremo 5’ o 3'. En otras realizaciones, el dominio auricular es una horquilla y la región del bucle forma un sitio de unión del cebador o el sitio de unión del cebador se introduce mediante la hibridación de un oligonucleótido al dominio auricular en el lado 3’ del bucle. Un oligonucleótido cebador, que contiene una región homóloga al extremo 3’ del dominio auricular y que lleva una región de unión al cebador en su extremo 5' (p. ej., para permitir una reacción de PCR) puede hibridarse con el dominio auricular y puede contener una etiqueta. que codifica un bloque de construcción o la adición de un bloque de construcción. El oligonucleótido cebador puede contener información adicional, tal como una región de nucleótidos aleatorizados, p. ej., de 2 a 16 nucleótidos de longitud, que se incluye para el análisis bioinformático.
[0103] El dominio auricular puede incluir opcionalmente una estructura de horquilla, donde esta estructura se puede conseguir por cualquier método útil. Por ejemplo, el dominio auricular puede incluir bases complementarias que forman parejas de emparejamiento de bases intermoleculares, como por emparejamiento de bases de ADN Watson-Crick (p. ej., adenina-timina y guanina-citosina) y/o por emparejamiento de bases oscilantes (p. ej., guanina-uracilo, inosinauracilo, inosina-adenina e inosina-citosina). En otro ejemplo, el dominio auricular puede incluir nucleótidos modificados o sustituidos que pueden formar formaciones dúplex de mayor afinidad en comparación con los nucleótidos no modificados, siendo estos nucleótidos modificados o sustituidos conocidos en la técnica. En otro ejemplo más, el dominio auricular incluye una o más bases reticuladas para formar la estructura de horquilla. Por ejemplo, las bases de una sola hebra o las bases de diferentes hebras dobles pueden reticularse, p. ej., utilizando psoraleno.
[0104] El dominio auricular o complejo puede incluir opcionalmente una o más etiquetas que permitan la detección. Por ejemplo, el dominio auricular, una o más etiquetas de oligonucleótidos y/o una o más secuencias de cebadores pueden incluir un isótopo, un agente de radiografía, un marcador, un trazador, una etiqueta fluorescente (p. ej., rodamina o fluoresceína), una etiqueta quimioluminiscente, un punto cuántico y una molécula informadora (p. ej., biotina o una etiqueta his).
[0105] En otras realizaciones, el dominio auricular o etiqueta se puede modificar para soportar la solubilidad en condiciones semi, reducidas o no acuosas (p. ej., orgánicas). Las bases de nucleótidos del dominio auricular o etiqueta pueden volverse más hidrófobas modificando, p. ej., las posiciones C5 de las bases T o C con cadenas alifáticas sin alterar significativamente su capacidad de enlace de hidrógeno con sus bases complementarias. Ejemplos de nucleótidos modificados o sustituidos son 5'-dimetoxitritil-N4-diisobutilaminometiliden-5-(1-propinilo)-2'-desoxicitidina, 3’-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; 5'-dimetoxitritilo-5-(1-propinilo)-2'-desoxiuridina, 3’-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; 5’-dimetoxitritilo-5-fluoro-2'-desoxiuridina, 3’-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; y 5'-dimetoxitritilo-5-(piren-1-ilo-etinilo)-2'-desoxiuridina, o 3’-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita.
[0106] Además, el oligonucleótido de cordal se puede intercalar con modificaciones que promueven la solubilidad en disolventes orgánicos. Por ejemplo, la fosforamidita de azobenceno puede introducir un resto hidrófobo en el diseño del dominio auricular. Tales inserciones de amiditas hidrófobas en el dominio auricular pueden ocurrir en cualquier parte de la molécula. Sin embargo, la inserción no puede interferir con el etiquetado posterior utilizando etiquetas de ADN adicionales durante la síntesis de la biblioteca o la posterior PCR una vez que se completa la selección o el análisis de microarrays, si se usa para la deconvolución de etiquetas. Tales adiciones al diseño del dominio auricular descrito en este documento harían que el dominio auricular sea soluble en, p. ej., 15%, 25%, 30%, 50%, 75%, 90%, 95%, 98%, 99% o 100% de disolvente orgánico. Por tanto, la adición de residuos hidrófobos en el diseño del dominio auricular permite una solubilidad mejorada en condiciones semi o no acuosas (p. ej., orgánicas), mientras que hace que el dominio auricular sea competente para el marcado de oligonucleótidos. Además, las etiquetas de ADN que se introducen posteriormente en la biblioteca también se pueden modificar en la posición C5 de las bases T o C de modo que también hagan que la biblioteca sea más hidrófoba y soluble en disolventes orgánicos para los pasos posteriores de la síntesis de la biblioteca.
[0107] En realizaciones particulares, el dominio auricular y la primera etiqueta pueden ser la misma entidad, es decir, se puede construir una pluralidad de entidades de etiqueta de dominio auricular que comparten partes comunes (p. ej., una región de unión de cebador) y todas difieren en otra parte (p. ej., región de codificación). Estos pueden utilizarse en el paso de "división" y agruparse después de que se haya producido el evento que están codificando.
[0108] En realizaciones particulares, el dominio auricular puede codificar información, p. ej., al incluir una secuencia que codifica el primer paso de división o una secuencia que codifica la identidad de la biblioteca, tal como mediante el uso de una secuencia particular relacionada con una biblioteca.
Etiquetas de oligonucleótidos
[0109] Las etiquetas de oligonucleótidos descritas en este documento (p. ej., una etiqueta o una parte de un dominio auricular o una parte de un cordal) se pueden utilizar para codificar cualquier información útil, como una molécula, una parte de una entidad química, la adición de un componente (p. ej., un andamio o un bloque de construcción), un dominio auricular en la biblioteca, la identidad de la biblioteca, el uso de uno o más miembros de la biblioteca (p. ej., el uso de los miembros en una alícuota de una biblioteca) y/o el origen de un miembro de la biblioteca (p. ej., mediante el uso de una secuencia de origen).
[0110] Cualquier secuencia en un oligonucleótido puede usarse para codificar cualquier información. Por tanto, una secuencia de oligonucleótidos puede servir para más de un propósito, como codificar dos o más tipos de información o proporcionar un oligonucleótido de partida que también codifica uno o más tipos de información. Por ejemplo, la primera etiqueta puede codificar para la adición de un primer bloque de construcción, así como para la identificación de la biblioteca. En otro ejemplo, se puede usar un dominio auricular para proporcionar un oligonucleótido de partida que une operativamente una entidad química a una etiqueta, donde el dominio auricular incluye adicionalmente una secuencia que codifica la identidad de la biblioteca (es decir, la secuencia de identificación de la biblioteca). Por consiguiente, cualquier información descrita en el presente documento puede codificarse en etiquetas oligonucleotídicas separadas o puede combinarse y codificarse en la misma secuencia oligonucleotídica (p. ej., una etiqueta oligonucleotídica, como una etiqueta o un dominio auricular).
[0111] Una secuencia de bloques de construcción codifica la identidad de un bloque de construcción y/o el tipo de reacción de unión realizada con un bloque de construcción. Esta secuencia de bloques de construcción se incluye en una etiqueta, donde la etiqueta puede incluir opcionalmente uno o más tipos de secuencia descritos a continuación (p. ej., una secuencia de identificación de biblioteca, una secuencia de uso y/o una secuencia de origen).
[0112] Una biblioteca de identificación codifica secuencias para la identidad de una biblioteca en particular. Para permitir la mezcla de dos o más bibliotecas, un miembro de la biblioteca puede contener una o más secuencias de identificación de biblioteca, como en una etiqueta de identificación de biblioteca (es decir, un oligonucleótido que incluye una secuencia de identificación de biblioteca), en una etiqueta ligada, en una parte de la secuencia del dominio auricular o en una secuencia del cordal. Estas secuencias de identificación de bibliotecas se pueden usar para deducir relaciones de codificación, donde la secuencia de la etiqueta se traduce y se correlaciona con la información del historial químico (síntesis). Por consiguiente, estas secuencias de la biblioteca de identificación permiten la mezcla de dos o más bibliotecas juntas para la selección, amplificación, purificación, secuenciación, etc.
[0113] Una secuencia de uso codifica el historial (es decir, el uso) de uno o más miembros de la biblioteca en un individuo alícuota de una biblioteca. Por ejemplo, se pueden tratar alícuotas separadas con diferentes condiciones de reacción, bloques de construcción y/o etapas de selección. En particular, esta secuencia puede usarse para identificar tales alícuotas y deducir su historial (uso) y, por lo tanto, permitir la mezcla de alícuotas de la misma biblioteca con diferentes historiales (usos) (p. ej., distintos experimentos de selección) para los fines de la mezcla de muestras juntas para selección, amplificación, purificación, secuenciación, etc. Estas secuencias de uso se pueden incluir en un dominio auricular, un cordal, una etiqueta, una etiqueta de uso (es decir, un oligonucleótido que incluye una secuencia de uso) o cualquier otra etiqueta descrita en este documento (p. ej., una etiqueta de identificación de biblioteca o una etiqueta de origen).
[0114] Una secuencia de origen es una secuencia de oligonucleótidos degenerada (aleatoria generada estocásticamente) de cualquier longitud útil (p. ej., aproximadamente seis oligonucleótidos) que codifica para el origen del elemento de biblioteca. Esta secuencia sirve para subdividir estocásticamente los miembros de la biblioteca que son idénticos en todos los aspectos en entidades distinguibles por la información de la secuencia, de modo que las observaciones de los productos de amplificación derivados de plantillas progenitoras únicas (p. ej., miembros de la biblioteca seleccionados) se pueden distinguir de las observaciones de múltiples productos de amplificación derivados de la misma plantilla progenitora (p. ej., un miembro de la biblioteca seleccionado). Por ejemplo, después de la formación de la biblioteca y antes del paso de selección, cada miembro de la biblioteca puede incluir una secuencia de origen diferente, como en una etiqueta de origen. Después de la selección, los miembros de la biblioteca seleccionados se pueden amplificar para producir productos de amplificación, y la parte del miembro de la biblioteca que se espera que incluya la secuencia de origen (p. ej., en la etiqueta de origen) se puede observar y comparar con la secuencia de origen en cada una de los otros miembros de bibliotecas. Como las secuencias de origen están degeneradas, cada producto de amplificación de cada miembro de la biblioteca debe tener una secuencia de origen diferente. Sin embargo, una observación de la misma secuencia de origen en el producto de amplificación podría indicar múltiples amplicones derivados de la misma molécula de plantilla. Cuando se desee determinar las estadísticas y datos demográficos de la población de etiquetas de codificación antes de la amplificación, en contraposición a la post-amplificación, se puede usar la etiqueta de origen. Estas secuencias de origen se pueden incluir en un dominio auricular, un cordal, una etiqueta, una etiqueta de origen (es decir, un oligonucleótido que incluye una secuencia de origen) o cualquier otra etiqueta descrita en este documento (p. ej., una etiqueta de identificación de biblioteca o una etiqueta de uso).
[0115] Cualquiera de los tipos de secuencias descritos en este documento se puede incluir en el dominio auricular. Por ejemplo, el dominio auricular puede incluir uno o más de una secuencia de bloques de construcción, una secuencia de identificación de biblioteca, una secuencia de uso o una secuencia de origen.
[0116] Cualquiera de estas secuencias descritas en el presente documento se puede incluir en un cordal. Por ejemplo, el cordal puede incluir una o más de una secuencia de identificación de biblioteca, una secuencia de uso o una secuencia de origen.
[0117] Cualquiera de las etiquetas descritas en la presente memoria puede incluir un conector en o en la proximidad de los extremos 5’ o 3’ que tiene una secuencia fija. Los conectores facilitan la formación de enlaces (p. ej., enlaces químicos) al proporcionar un grupo reactivo (p. ej., un grupo reactivo químico o un grupo fotorreactivo) o al proporcionar un sitio para un agente que permite un enlace (p. ej., un agente de un resto intercalante o un grupo reactivo reversible en el conector o los oligonucleótidos de reticulación). Cada conector 5’ puede ser el mismo o diferente, y cada conector 3' puede ser el mismo o diferente. En un ejemplo, complejo no limitante que tiene más de una etiqueta, cada etiqueta puede incluir un conector 5’ y un conector 3', donde cada conector 5’ tiene la misma secuencia y cada conector 3' tiene la misma secuencia. (p. ej., donde la secuencia del conector 5’ puede ser la misma o diferente de la secuencia del conector 3'). El conector proporciona una secuencia que se puede utilizar para uno o más enlaces. Para permitir la unión de un cebador de relevo o para hibridar un oligonucleótido de reticulación, el conector puede incluir uno o más grupos funcionales que permitan un enlace (p. ej., un enlace para el cual una polimerasa tiene una capacidad reducida para leer o translocar, como un enlace químico).
[0118] Estas secuencias pueden incluir cualquier modificación descrita en el presente documento para los oligonucleótidos, tales como una o más modificaciones que promueven la solubilidad en disolventes orgánicos (p. ej., cualquiera de los descritos en el presente documento, tales como por el dominio auricular), que proporcionan un análogo del enlace fosfodiéster natural (p. ej., un análogo de fosforotioato), o que proporcionan uno o más oligonucleótidos no naturales (p. ej., nucleótidos sustituidos en 2’, tales como nucleótidos 2’-O-metilados y nucleótidos 2’-fluorados, o cualquiera de los descritos en el presente documento).
[0119] Estas secuencias pueden incluir cualesquiera características descritas en este documento para los oligonucleótidos. Por ejemplo, estas secuencias pueden incluirse en una etiqueta de menos de 20 nucleótidos (p. ej., como se describe en este documento). En otros ejemplos, las etiquetas que incluyen una o más de estas secuencias tienen aproximadamente la misma masa (p. ej., cada etiqueta tiene una masa que es aproximadamente /- 10% de la masa promedio dentro de un conjunto específico de etiquetas que codifican una variable específica); carecen de una región de unión a cebadores (p. ej., constante); carece de una región constante; o tienen una región constante de longitud reducida (p. ej., una longitud de menos de 30 nucleótidos, menos de 25 nucleótidos, menos de 20 nucleótidos, menos de 19 nucleótidos, menos de 18 nucleótidos, menos de 17 nucleótidos, menos de 16 nucleótidos, menos de 15 nucleótidos, menos de 14 nucleótidos, menos de 13 nucleótidos, menos de 12 nucleótidos, menos de 11 nucleótidos, menos de 10 nucleótidos, menos de 9 nucleótidos, menos de 8 nucleótidos o menos de 7 nucleótidos).
Las estrategias de secuenciación para bibliotecas y oligonucleótidos de esta longitud pueden incluir opcionalmente estrategias de concatenación o de cadena para aumentar la fidelidad de lectura o la profundidad de secuenciación, respectivamente. En particular, la selección de bibliotecas codificadas que carecen de regiones de unión a cebadores se ha descrito en la bibliografía para SELEX, tal como se describe en Jarosch et al., Nucleic Acids Res. 34: e86 (2006). Por ejemplo, un miembro de la biblioteca se puede modificar (p. ej., después de un paso de selección) para incluir una primera secuencia adaptadora en el extremo 5’ del complejo y una segunda secuencia adaptadora en el extremo 3’ del complejo, donde la primera la secuencia es sustancialmente complementaria a la segunda secuencia y da como resultado la formación de un dúplex. Para mejorar aún más el rendimiento, se agregan dos nucleótidos colgantes fijos (p. ej., CC) al extremo 5’. En realizaciones particulares, la primera secuencia adaptadora es 5'-GTGCTGC-3’ (SEQ ID NO: 1), y la segunda secuencia adaptadora es 5'-GCAGCACCC-3' (SEQ ID NO: 2).
Enlaces
[0120] Los métodos de la invención presentan enlaces que están presentes entre oligonucleótidos que codifican información (p. ej., entre el dominio auricular y una etiqueta, entre dos etiquetas o entre una etiqueta y un cordal), donde tales enlaces incluyen cualquier enlace para el cual una polimerasa tiene capacidad reducida para leer o translocar. Los enlaces ejemplares incluyen enlaces químicos que incluyen uno o más de un grupo reactivo químico, un grupo fotorreactivo, un resto intercalante, un oligonucleótido reticulante o un grupo coreactivo reversible.
[0121] Un enlace puede ser analizado para determinar si una polimerasa ha reducido la capacidad de leer o translocar a través de ese enlace. Esta capacidad se puede probar mediante cualquier método útil, como cromatografía líquidaespectrometría de masas, análisis RT-PCR, demografía de secuencia y/o análisis de PCR.
[0122] En realizaciones particulares, la ligación química incluye el uso de uno o más pares de reactivos químicos para proporcionar un enlace. Los pares de reactivos químicos ejemplares son un par que incluye un grupo alquinilo opcionalmente sustituido y un grupo azido opcionalmente sustituido para formar un triazol mediante una reacción de cicloadición 1,3-dipolar de Huisgen; un dieno opcionalmente sustituido que tiene un sistema de electrones 4 n (p. ej., un compuesto 1,3-insaturado opcionalmente sustituido, tal como 1,3-butadieno, 1 -metoxi-3-trimetilsililoxi-1,3-butadieno, ciclopentadieno opcionalmente sustituido, ciclohexadieno o furano) y un dienófilo opcionalmente sustituido o un heterodienófilo opcionalmente sustituido que tiene un sistema de electrones 2 n (p. ej., un grupo alquenilo opcionalmente sustituido o un grupo alquinilo opcionalmente sustituido) para formar un cicloalquenilo mediante una reacción de Diels - Alder; un nucleófilo (p. ej., una amina opcionalmente sustituida o un tiol opcionalmente sustituido) con un electrófilo heterociclilo deformado (p. ej., epóxido, aziridina, ion aziridinio o ion episulfonio opcionalmente sustituidos) para formar un heteroalquilo mediante una reacción de apertura de anillo; un grupo fosforotioato con un grupo yodo, tal como en una ligación ferulizada de un oligonucleótido que contiene 5’-yodo dT con un oligonucleótido 3'-fosforotioato; un grupo amino opcionalmente sustituido con un grupo aldehído o un grupo cetona, tal como una reacción de un oligonucleótido modificado con aldehído 3’, que puede obtenerse opcionalmente oxidando un oligonucleótido modificado en 3'-glicerilo disponible comercialmente, con 5’-oligonucleótido amino (es decir, en una reacción de aminación reductora) o un oligonucleótido 5'-hidrazido; un par de un grupo amino opcionalmente sustituido y un grupo de ácido carboxílico o un grupo tiol (p. ej., con o sin el uso de succinimidil trans-4-(maleimidilmetilo) ciclohexano-1-carboxilato (SMCC) o 1-etil-3-(3-dimetilaminopropilo)carbodiimida (EDAC); un par de una hidrazina opcionalmente sustituida y un aldehído o un grupo cetona; un par de una hidroxilamina opcionalmente sustituida y un aldehído o un grupo cetona; o un par de un nucleófilo y un haluro de alquilo opcionalmente sustituido.
[0123] Complejos de platino, agentes alquilantes, o los nucleótidos modificados por furano también se pueden usar como un grupo químicamente reactivo para formar inter o intra enlaces de hebra. Dichos agentes se pueden usar entre dos oligonucleótidos y opcionalmente pueden estar presentes en el oligonucleótido de reticulación. Ejemplos de complejos de platino no limitantes incluyen cisplatino (cis-diaminodicloroplatino (II), p. ej., para formar enlaces intracatenarios GG), transplatin (trans-diaminodicloroplatino (II), p. ej., para formar enlaces entre cadenas GXG, donde X puede ser cualquier nucleótido), carboplatino, picolatino (ZD0473), ormaplatino u oxaliplatino para formar, p. ej., enlaces GC, CG, Ag o GG. Cualquiera de estos enlaces puede ser enlaces entre cadenas o intracatenarias.
[0124] Los agentes alquilantes no limitantes ejemplares incluyen mostaza nitrogenada (mecloretamina, p. ej., para formar enlaces GG), clorambucilo, melfalán, ciclofosfamida, formas de profármaco de ciclofosfamida (p. ej., 4-hidroperoxiciclofosfamida e ifosfamida), 1,3-bisfamida (2-cloroetilo)-1-nitrosourea (BCNU, carmustina), una aziridina (p. ej., mitomicina C, trietilenmelamina o trietilentiofosforamida (tio-tepa) para formar enlaces GG o AG), hexametilmelamina, un alquil sulfonato (p. ej., busulfano para formar enlaces GG) o una nitrosourea (p. ej., 2-cloroetilnitrosourea para formar enlaces GG o CG, como carmustina (BCNU), clorozotocina, lomustina (CCNU) y semustina (metilo-CCNU)). Cualquiera de estos enlaces puede ser enlaces entre cadenas o intracatenarias.
[0125] Nucleótidos modificados por furano también se pueden utilizar para formar enlaces. Tras la oxidación in situ (p. ej., con N-bromosuccinimida (NBS), el resto de furano forma un derivado oxoenal reactivo que reacciona con una base complementaria para formar un enlace entre cadenas. En algunas realizaciones, los nucleótidos modificados con furano forman enlaces con un nucleótido A o C complementario. Los nucleótidos modificados con furano, no limitantes, incluyen cualquier nucleótido modificado con 2’-(furan-2-ilo)propanoilamino; o un nucleótido modificado acíclico de ácido nucleico de 2-(furan-2-ilo)etilglicol.
[0126] Los grupos fotorreactivos también se pueden usar como grupo reactivo. Ejemplos de grupos fotorreactivos no limitantes incluyen un resto intercalante, un derivado de psoraleno (p. ej., psoraleno, HMT-psoraleno u 8-metoxipsoraleno), un grupo cianovinilcarbazol opcionalmente sustituido, un grupo vinilcarbazol opcionalmente sustituido, un grupo cianovinilo opcionalmente sustituido, un grupo acrilamida opcionalmente sustituido, un grupo diazirina opcionalmente sustituido, una benzofenona opcionalmente sustituida (p. ej., éster succinimidílico del ácido 4-benzoilbenzoico o isotiocianato de benzofenona), un grupo 5-(carboxi)viniluridina opcionalmente sustituido (p. ej., 5-(carboxi)vinilo-2'-desoxiuridina), o un grupo azida opcionalmente sustituido (p. ej., una aril azida o una aril azida halogenada, como éster de succinimidilo del ácido 4-azido-2,3,5,6-tetrafluorobenzoico (ATFB)).
[0127] Los restos intercalados también se pueden usar como grupo reactivo. Ejemplos de restos intercalantes no limitantes incluyen un derivado de psoraleno, un derivado de alcaloide (p. ej., berberina, palmatina, coralino, sanguinarina (p. ej., iminio o sus formas de alcanolamina), o aristololactama-p-D-glucósido), un catión de etidio (por ejemplo, bromuro de etidio), un derivado de acridina (p. ej., proflavina, acriflavina o amsacrina), un derivado de antraciclina (p. ej., doxorrubicina, epirrubicina, daunorrubicina (daunomicina), idarubicina y aclarubicina), o talidomida.
[0128] Para un oligonucleótido de entrecruzamiento, cualquier grupo reactivo útil (p. ej., se describe en este documento) pueden usarse para formar enlaces inter o intra-hebra. Los grupos reactivos ejemplares incluyen un grupo reactivo químico, un grupo fotorreactivo, un resto intercalante y un grupo coreactivo reversible. Los agentes de reticulación para su uso con oligonucleótidos de reticulación incluyen, sin limitación, agentes alquilantes (p. ej., como se describe en el presente documento), cisplatino (cis-diaminedicloroplatino (II), trans-diaminodicloroplatino (II), psoraleno, HMT-psoraleno, 8-metoxipsoraleno, nucleótidos modificados con furano, 2-fluorodesoxiinosina (2-F-dl), 5-bromo-desoxicitosina (5-Br-dC), 5-bromo desoxiuridina (5-Br-dU), 5-yodo-desoxicitosina (5-IdC), 5-yodo-desoxiuridina (5-I-dU), succinimidil trans-4-(maleimidilmetilo) ciclohexano-1-carboxilato, SMCC, EDAC o acetiltioacetato de succinimidilo (SATA).
[0129] Los oligonucleótidos también se pueden modificar para que contengan restos de tiol que se pueden hacer reaccionar con una variedad de grupos reactivos con tiol tales como maleimidas, halógenos, yodoacetamidas y, por tanto, se pueden usar para reticular dos oligonucleótidos. Los grupos tiol se pueden unir al extremo 5’ o 3' de un oligonucleótido.
[0130] Para reticulación inter-hebra entre oligonucleótidos dúplex en una posición de pirimidina (p. ej., timidina), el resto intercalante, foto-reactivo psoraleno puede ser elegido. El psoraleno se intercala en el dúplex y forma enlaces cruzados covalentes entre cadenas con pirimidinas, preferentemente en los sitios 5'-TpA, tras la irradiación con luz ultravioleta (aproximadamente 254 nm). El resto de psoraleno se puede unir covalentemente a un oligonucleótido modificado (p. ej., mediante una cadena de alcano, como un C1-10 alquilo, o un grupo polietilenglicol, como -(CH2CH2Ü)nCH2CH2-, donde n es un número entero de 1 a 50). También se pueden usar derivados de psoraleno ejemplares, en los que los derivados no limitantes incluyen 4’-(hidroxietoximetilo)-4,5',8-trimetilpsoraleno (HMT-psoraleno) y 8-metoxipsoraleno.
[0131] Varias partes del oligonucleótido reticulante pueden ser modificadas para introducir un enlace. Por ejemplo, también se pueden usar fosforotioatos terminales en oligonucleótidos para unir dos oligonucleótidos adyacentes. Los uracilos/citosinas halogenados también pueden usarse como modificaciones de entrecruzamiento en el oligonucleótido. Por ejemplo, los oligonucleótidos modificados con 2-fluoro-desoxiinosina (2-F-dl) se pueden hacer reaccionar con diaminas o tiopropilaminas que contienen disulfuro para formar enlaces disulfuro.
[0132] Como se describe a continuación, los grupos co-reactivos reversibles incluyen los seleccionados de un grupo cianovinilcarbazol, un grupo cianovinil, un grupo acrilamida, un grupo tiol, o tioéteres de sulfoniletilo. También se puede usar un grupo cianovinilcarbazol (CNV) opcionalmente sustituido en oligonucleótidos para reticular a una base de pirimidina (p. ej., citosina, timina, y uracilo, así como sus bases modificadas) en cadenas complementarias. Los grupos CNV promueven la cicloadición [2+2] con la base de pirimidina adyacente tras la irradiación a 366 nm, lo que da como resultado una reticulación entre cadenas. La irradiación a 312 nm invierte el entrecruzamiento y, por tanto, proporciona un método para el entrecruzamiento reversible de cadenas de oligonucleótidos. Un grupo CNV no limitante es el 3-cianovinilcarbozaol, que puede incluirse como un nucleótido de carboxivinilcarbazol (p. ej., como 3-carboxivinilcarbazol-1'-p-desoxirribósido-5'-trifosfato).
[0133] El grupo CNV puede modificarse para reemplazar el grupo ciano reactivo con otro grupo reactivo para proporcionar un grupo vinilcarbazol opcionalmente sustituido. Los ejemplos de grupos reactivos no limitantes para un grupo vinilcarbazol incluyen un grupo amida de -CONRN 1RN2, donde cada Rn 1 y Rn2 pueden ser iguales o diferentes y son independientemente H y C1-6 alquilo, p. ej., -CONH2 ; un grupo carboxilo de -CO2H; o un grupo alcoxicarbonilo C2-7 (p. ej., metoxicarbonilo). Además, el grupo reactivo se puede ubicar en el carbono alfa o beta del grupo vinilo. Los grupos vinilcarbazol ejemplares incluyen un grupo cianovinilcarbazol, como se describe en el presente documento; un grupo amidovinilcarbazol (p. ej., un nucleótido de amidovinilcarbazol, tal como 3-amidovinilcarbazol-1'-pdesoxirribósido-5'-trifosfato); un grupo carboxivinilcarbazol (p. ej., un nucleótido de carboxivinilcarbazol, tal como 3-carboxivinilcarbazol-1'-p-desoxirribósido-5'-trifosfato); y un grupo C2-7 alcoxicarbonilvinilcarbazol (p. ej., un nucleótido alcoxicarbonilvinilcarbazol, tal como 3-methoxicarbonilvinilcarbazol-1'-p-deoxiribósido-5'-trifosfato). Los grupos vinilcarbazol opcionalmente sustituidos adicionales y los nucleótidos que tienen tales grupos se proporcionan en las fórmulas químicas de la Patente de EE.UU. N° 7,972,792 y Yoshimura y Fujimoto, Org. Lett. 10: 3227-3230 (2008).
[0134] Otros grupos reactivos reversibles incluyen un grupo tiol y otro grupo tiol para formar un disulfuro, así como un grupo tiol y un grupo vinil sulfona para formar tioéteres de sulfoniletilo. Los grupos tiol-tiol pueden incluir opcionalmente un enlace formado por una reacción con bis-((N-yodoacetilo)piperazinil)sulfonerodamina. Otros grupos reactivos reversibles (p. ej., como algunos grupos fotorreactivos) incluyen grupos benzofenona opcionalmente sustituidos. Un ejemplo no limitante es benzofenona uracilo (BPU), que se puede usar para la formación selectiva de sitio y secuencia de una reticulación entre cadenas de dúplex de oligonucleótidos que contienen BPU. Esta reticulación se puede revertir al calentar, proporcionando un método para la reticulación reversible de dos cadenas de oligonucleótidos.
[0135] En otras realizaciones, la ligación química incluye la introducción de un análogo del enlace fosfodiéster, p. ej., para análisis y secuenciación de PCR post-selección. Ejemplos de análogos de un fosfodiéster incluyen un enlace fosforotioato (p. ej., introducido mediante el uso de un grupo fosforotioato y un grupo saliente, como un grupo yodo), un enlace fosforamida o un enlace fosforoditioato (p. ej., introducido mediante el uso de un grupo fosforoditioato y un grupo saliente, como un grupo yodo).
[0136] Para cualquiera de los grupos descritos en el presente documento (p. ej., un grupo químico reactivo, un grupo foto-reactivo, un resto intercalante, un oligonucleótido de reticulación, o un grupo co-reactivo reversible), el grupo se puede incorporar en o en las proximidades del término de un oligonucleótido o entre los extremos 5’ y 3'. Además, pueden estar presentes uno o más grupos en cada oligonucleótido. Cuando se requieren pares de grupos reactivos, entonces se pueden diseñar oligonucleótidos para facilitar una reacción entre el par de grupos. En el ejemplo no limitante de un grupo cianovinilcarbazol que co-reacciona con una base pirimidina, el primer oligonucleótido puede diseñarse para incluir el grupo cianovinilcarbazol en el extremo 5’ o en sus proximidades. En este ejemplo, se puede diseñar un segundo oligonucleótido para que sea complementario del primer oligonucleótido y para incluir la base pirimidina co-reactiva en una posición que se alinee con el grupo cianovinilcarbazol cuando el primer y segundo oligonucleótidos hibrida. Cualquiera de los grupos de la presente y cualquiera de los oligonucleótidos que tienen uno o más grupos pueden diseñarse para facilitar la reacción entre los grupos para formar uno o más enlaces.
Espaciadores bifuncionales
[0137] El espaciador bifuncional entre el dominio auricular y la entidad química se pueden variar para proporcionar un resto de espaciamiento apropiado y/o para aumentar la solubilidad del dominio auricular en disolvente orgánico. Se encuentra disponible comercialmente una amplia variedad de espaciadores que pueden acoplar el dominio auricular con la biblioteca de moléculas pequeñas. El espaciador consiste típicamente en cadenas lineales o ramificadas y puede incluir un C1-10 alquilo, un heteroalquilo de 1 a 10 átomos, un C2-10 alquenilo, un C2-10 alquinilo, un C5-10 arilo, un sistema cíclico o policíclico de 3 a 20 átomos, un fosfodiéster, un péptido, un oligosacárido, un oligonucleótido, un oligómero, un polímero o un polialquilglicol (p. ej., un polietilenglicol, como -(CH2CH2O)nCH2CH2-, donde n es un número entero de 1 a 50), o combinaciones de los mismos.
[0138] El espaciador bifuncional puede proporcionar un resto de espaciado apropiado entre el dominio auricular y una entidad química de la biblioteca. En determinadas formas de realización, el espaciador bifuncional incluye tres partes. La parte 1 puede ser un grupo reactivo, que forma un enlace covalente con el ADN, como, p. ej., un ácido carboxílico, preferiblemente activado por un éster de N-hidroxisuccinimida (NHS) para reaccionar con un grupo amino en el ADN (p. ej., dT modificado por amino), una amidita para modificar el extremo 5’ o 3' de un dominio auricular monocatenario (logrado por medio de la química de oligonucleótidos estándar), pares químico-reactivos (p. ej., cicloadición azidoalquino en presencia del catalizador Cu(I), o cualquiera de los descritos en el presente documento) o grupos reactivos con tiol. La parte 2 también puede ser un grupo reactivo, que forma un enlace covalente con la entidad química, ya sea el bloque de construcción An o un andamio. Tal grupo reactivo podría ser, p. ej., una amina, un tiol, una azida o un alquino. La parte 3 puede ser una fracción espaciadora químicamente inerte de longitud variable, introducida entre las partes 1 y 2. Tal fracción espaciadora puede ser una cadena de unidades de etilenglicol (p. ej., PEG de diferentes longitudes), un alcano, un alqueno, una cadena de polienos o una cadena de péptidos. El espaciador puede contener ramificaciones o inserciones con restos hidrofóbicos (como, p. ej., anillos de benceno) para mejorar la solubilidad del dominio auricular en disolventes orgánicos, así como restos fluorescentes (p. ej., fluoresceína o Cy-3) usados con fines de detección de bibliotecas. Los residuos hidrófobos en el diseño del dominio auricular se pueden variar con el diseño del espaciador para facilitar la síntesis de bibliotecas en disolventes orgánicos. Por ejemplo, la combinación de dominio auricular y espaciador está diseñada para tener residuos apropiados en los que el coeficiente octanol:agua (Poct) es de, p. ej., 1,0 a 2,5.
[0139] Los espaciadores se pueden seleccionar empíricamente para un diseño de biblioteca de moléculas pequeñas dado, de modo que la biblioteca se puede sintetizar en un disolvente orgánico, p. ej., en 15%, 25%, 30%, 50%, 75%, 90%, 95%, 98%, 99% o 100% de disolvente orgánico. El espaciador se puede variar usando reacciones modelo antes de la síntesis de la biblioteca para seleccionar la longitud de cadena apropiada que solubiliza el dominio auricular en un solvente orgánico. Los espaciadores ejemplares incluyen aquellos que tienen una longitud de cadena de alquilo aumentada, unidades de polietilenglicol aumentadas, especies ramificadas con cargas positivas (para neutralizar las cargas de fosfato negativas en el dominio auricular) o cantidades aumentadas de hidrofobicidad (p. ej., adición de estructuras de anillo de benceno).
[0140] Los ejemplos de espaciadores disponibles comercialmente incluyen espaciadores aminocarboxílicos, tales como los que son péptidos (p. ej., Z-Gly-Gly-Gly-Osu (N-alfa-benciloxicarbonil-(glicina)3-N-succinimidil éster) o Z-Gly-Gly-Gly-Gly-Gly-Gly-Osu (éster de N-alfa-benciloxicarbonil-(glicina)6-N-succinimidilo, SEQ ID NO: 3), PEG (p. ej., Fmoc-aminoPEG2000-NHS o amino-PEG (12-24)-NHS), o cadenas de ácido alcano (p. ej., ácido Boc-saminocaproico-Osu); espaciadores de pares reactivos químicos, como los pares reactivos químicos descritos en este documento en combinación con un resto peptídico (p. ej., azidohomoalanina-Gly-Gly-Gly-OSu (SEQ ID NO: 4) o propargilglicina-Gly-Gly-Gly-OSu (SEQ ID NO: 5), PeG (p. ej., azido-PEG-NHS), o un resto de cadena de ácido alcano (p. ej., ácido 5-azidopentanoico, (S)-2-(azidometilo)-1-Boc-pirrolidina, 4-azidoanilina o éster de N-hidroxisuccinimida del ácido 4-azido-butan-1-oico); espaciadores reactivos con tiol, como los que son PEG (p. ej., SM(PEG)n NHS-PEG-maleimida), cadenas de alcanos (p. ej., ácido 3-(piridin-2-ildisulfanil)-propiónico-Osu o sulfosuccinimidil 6-(3’-[2-piridilditio]-propionamido)hexanoato)); y amiditas para la síntesis de oligonucleótidos, tales como modificadores de amino (p. ej., 6-(trifluoroacetilamino)-hexil-(2-cianoetilo)-(N,N-diisopropilo)-fosforamidita), modificadores de tiol (p. ej., S-tritilo-6-mercaptohexil-1-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita, o modificadores de pares reactivos químicos (p. ej., 6-hexin-1-ilo-(2-cianoetilo)-(N,N-diisopropilo)-fosforamidita, 3-dimetoxitritiloxi-2-(3-(3-propargiloxipropanamido)propanamido)propil-1-O-succinoilo, alquilamino CPG de cadena larga o éster de N-hidroxisuccinimida del ácido 4-azido-butan-1-oico)). Se conocen espaciadores adicionales en la técnica, y los que se pueden usar durante la síntesis de la biblioteca incluyen, pero no se limitan a 5'-O-dimetoxitritilo-1’,2'-didesoxirribosa-3'-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; 9-O-dimetoxitritilo-trietilenglicol, 1-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; 3-(4,4'-dimetoxitritiloxi)propil-1 -[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita; y 18-O-dimetoxitritil hexaetilenglicol, 1-[(2-cianoetilo)-(N,N-diisopropilo)]-fosforamidita. Cualquiera de los espaciadores de la presente puede agregarse en tándem entre sí en diferentes combinaciones para generar espaciadores de diferentes longitudes deseadas.
[0141] Los espaciadores también pueden ser ramificados, donde los espaciadores ramificados son bien conocidos en la técnica y los ejemplos pueden consistir en duplicadores simétricos o asimétricos o un agudo simétrico. Véase, p. ej., Newcome et al., Dendritic Molecules: Concepts, Synthesis, Perspectives, VCH Publishers (1996); Boussif et al., Proc. Natl. Acad. Sci. EE.UU. 92: 7297 - 7301 (1995); y Jansen et al., Science 266: 1226 (1994).
Técnicas de ligación enzimática y ligación química
[0142] Diversas técnicas de ligación pueden utilizarse para añadir andamios, bloques de construcción, espaciadores, vinculaciones, etiquetas, y/o el dominio auricular para producir un complejo. Por consiguiente, cualquiera de los pasos de unión descritos en este documento puede incluir cualquier técnica de ligación útil, como ligación enzimática y/o ligación química. Estos pasos de unión pueden incluir la adición de una o más etiquetas al dominio auricular o complejo; la adición de un espaciador al dominio auricular; y la adición de uno o más andamios o bloques de construcción al dominio auricular o complejo. En realizaciones particulares, las técnicas de ligación utilizadas para cualquier oligonucleótido proporcionan un producto resultante que se puede transcribir y/o transcribir de forma inversa para permitir la decodificación de la biblioteca o la polimerización dependiente de plantilla con una o más ADN o polimerasa de ARN.
[0143] En general, la ligación enzimática produce un oligonucleótido que tiene un enlace fosfodiéster nativo que puede ser transcrito y/o transcrito inverso. En este documento se proporcionan métodos ejemplares de ligación enzimática e incluyen el uso de una o más ligasas ARN o ADN, como ligasa T4 ARN, ligasa T4 ADN, ligasa ssADN CircLigase™, ligasa ssADN CircLigase™ II y ligasa ssADN ThermoPhage™ (Prokazyme Ltd., Reykjavik, Islandia).
[0144] La ligación química también se puede utilizar para producir oligonucleótidos capaces de transcripción o transcripción inversa. Puede que sea necesario ensayar la eficacia de una técnica de ligación química para proporcionar oligonucleótidos capaces de transcribirse o transcribirse de forma inversa. Esta eficacia se puede probar mediante cualquier método útil, como cromatografía líquida, espectrometría de masas, análisis TI-PCR y/o análisis PCR. En realizaciones particulares, la ligación química incluye el uso de uno o más pares de reactivos químicos para proporcionar un resto espaciador que se puede transcribir o transcribir de forma inversa. En particular, las reacciones adecuadas para pares de reactivos químicos son candidatos preferidos para el proceso de ligación (Kolb et al., Angew. Chem. Int. Ed., 40: 2004-2021 (2001); Van der Eycken et al., QSAR Comb Sci., 26: 1115 - 1326 (2007)). En una realización, los oligonucleótidos ligados contienen un enlace cuyas polimerasas tienen una capacidad reducida para leer o translocar el documento, p. ej., un enlace "ilegible".
Condiciones de reacción para promover la ligación enzimática o ligación química
[0145] Los métodos descritos aquí pueden incluir una o más condiciones de reacción que promueven ligación enzimática o química entre el dominio auricular y una etiqueta o entre dos etiquetas. Estas condiciones de reacción incluyen el uso de nucleótidos modificados dentro de la etiqueta, como se describe en el presente documento; usar etiquetas donantes y etiquetas aceptoras que tienen diferentes longitudes y varían la concentración de las etiquetas; usando diferentes tipos de ligasas, así como combinaciones de las mismas (p. ej., ligasa ADN CircLigase™ y/o ligasa T4 ARN), y variando su concentración; utilizando polietilenglicoles(PEG) que tienen diferentes pesos moleculares y varían su concentración; uso de agentes de apiñamiento no PEG (p. ej., betaína o albúmina de suero bovino); variando la temperatura y la duración de la ligación; variando la concentración de diversos agentes, incluyendo ATP, Co(NH3)6Cl3, y el pirofosfato inorgánico de levadura; utilizando etiquetas oligonucleotídicas fosforiladas enzimática o químicamente; usar etiquetas protegidas en 3’; y el uso de etiquetas preadeniladas. Estas condiciones de reacción también incluyen ligaciones químicas.
[0146] El dominio auricular y/o etiquetas pueden incluir uno o más nucleótidos modificados o sustituidos. En realizaciones preferidas, el dominio auricular y/o etiquetas incluyen uno o más nucleótidos modificados o sustituidos que promueven la ligación enzimática, tales como nucleótidos 2'-O-metilo (p. ej., 2'-O-metilo guanina o 2'-O-metilo uracilo), nucleótidos 2'-fluoro o cualquier otro nucleótido modificado que se utilice como sustrato para la ligación. Alternativamente, el dominio auricular y/o las etiquetas se modifican para incluir uno o más grupos químicamente reactivos para soportar la ligación química (p. ej., un grupo alquinilo opcionalmente sustituido y un grupo azido opcionalmente sustituido). Opcionalmente, los oligonucleótidos de etiqueta se funcionalizan en ambos extremos con grupos químicamente reactivos y, opcionalmente, uno de estos extremos está protegido, de modo que los grupos se pueden abordar de forma independiente y las reacciones secundarias pueden reducirse (p. ej., reacciones secundarias de polimerización reducidas).
[0147] La ligación enzimática puede incluir una o más ligasas. Ejemplos de ligasas incluyen ligasa ssADN CircLigase™ (EPICENTER Biotechnologies, Madison, WI), ligasa ssADN CircLigase™ II (también de EPICENTER Biotechnologies), ligasa ssADN ThermoPhage™ (Prokazyme Ltd., Reykjavik, Islandia), ligasa T4 ARN y ligasa T4 ADN. En realizaciones preferidas, la ligación incluye el uso de una ligasa ARN o una combinación de una ligasa ARN y una ligasa ADN. La ligación puede incluir además uno o más cationes multivalentes solubles, tales como Co(NH3)6Cl3, en combinación con una o más ligasas.
[0148] Antes o después del paso de ligación, el complejo puede purificarse por tres razones. En primer lugar, el complejo se puede purificar para eliminar el dominio auricular o las etiquetas que no han reaccionado que pueden dar lugar a reacciones cruzadas e introducir "ruido" en el proceso de codificación. En segundo lugar, el complejo puede purificarse para eliminar cualquier reactivo o material de partida sin reaccionar que pueda inhibir o disminuir la actividad de ligación de una ligasa. Por ejemplo, el fosfato puede reducir la actividad de ligación. En tercer lugar, es posible que sea necesario eliminar las entidades que se introducen en una etapa química o de ligación para permitir la posterior etapa química o de ligación. En este documento se describen métodos para purificar el complejo.
[0149] La ligación enzimática y química puede incluir polietilenglicol que tiene un peso molecular promedio de más de 300 Daltons (p. ej., más de 600 Daltons, 3.000 Daltons, 4.000 Daltons, o 4.500 daltons). En realizaciones particulares, el polietilenglicol tiene un peso molecular promedio de aproximadamente 3.000 Daltons a 9.000 Daltons (p. ej., de 3.000 Daltons a 8.000 Daltons, de 3.000 Daltons a 7.000 Daltons, de 3.000 Daltons a 6.000 Daltons, y de 3.000 Daltons a 5.000 Daltons). En realizaciones preferidas, el polietilenglicol tiene un peso molecular promedio de aproximadamente 3.000 Dalton a aproximadamente 6.000 Dalton (p. ej., de 3.300 Dalton a 4.500 Dalton, de 3.300 Dalton a 5.000 Dalton, de 3.300 Dalton a 5.500 Dalton, de 3.300 Dalton a 6.000 Dalton, de 3.500 Dalton a 4.500 Dalton, de 3.500 Dalton a 5.000 Dalton, de 3.500 Dalton a 5.500 Dalton, y de 3.500 Dalton a 6.000 Dalton, como 4.600 Dalton). El polietilenglicol puede estar presente en cualquier cantidad útil, tal como desde aproximadamente el 25% (p/v) hasta aproximadamente el 35% (p/v), tal como el 30% (p/v).
[0150] Preferiblemente, las etiquetas se instalan por ligación de un oligonucleótido monocatenario a un oligonucleótido de cadena sencilla utilizando el protocolo de ligación describen a continuación: Dominio auricular: 25 gm (extremo 5': 5'-monofosfo/2'-OMe G, nucleótidos intermedios: 2’-desoxi, y extremo 3': 2’-bloqueado/3'-bloqueado); Etiqueta: 25 gm (extremo 5’: 2'-OMe/5'-OH G, nucleótidos intermedios: 2'-desoxi y extremo 3': 3'-OH/2'-OMe); Co(NH3)6Cl3:1 mM; PEG 4600: 30% (p/v); ligasa T4 ARN (Promega): 1,5 unidades/ml; Pirofosfatasa inorgánica de levadura: 0,0025 unidades/ml; Tris: 50 mM; MgCb: 10 mM; ATP:1 mM; pH: 7,5; y Agua: Equilibrio.
En realizaciones adicionales, el protocolo incluye incubación a 37°C durante 20 horas. Para los propósitos de la construcción de la biblioteca real, se puede usar una mayor concentración de dominio auricular, etiquetas y/o ligasa, y tales modificaciones a estas concentraciones resultarán evidentes para los expertos en la técnica. Las metodologías de ligación química pueden incluir cualquier método químico que permita la asociación operativa de dos etiquetas codificantes, ya sea que una polimerasa pueda leer o translocar a través de la ligación asociada operativamente.
Métodos para determinar la secuencia de nucleótidos de un complejo
[0151] Esta invención presenta un método para determinar la secuencia de nucleótidos de un complejo, de modo que se pueden establecer relaciones de codificación entre la secuencia de la etiqueta y las unidades estructurales (o bloques de construcción) de la entidad química. En particular, la identidad y/o el historial de una entidad química pueden inferirse de la secuencia de bases en el oligonucleótido. Usando este método, una biblioteca que incluye diversas entidades o miembros químicos (p. ej., pequeñas moléculas o péptidos) puede direccionarse con una secuencia de etiqueta particular.
[0152] Las Figuras 1-4 proporcionan varios ejemplos de métodos para la determinación de la secuencia de nucleótidos de un complejo. Estas figuras proporcionan métodos ejemplares para abarcar enlaces ilegibles y/o liberar oligonucleótidos reticulantes, que dan como resultado la formación de una plantilla de oligonucleótidos.
[0153] La Figura 1b proporciona un método ejemplar que utiliza cebadores de retransmisión. En particular, los cebadores de retransmisión se hibridan con las porciones de secuencia constante fija (p. ej., los conectores 5’ y 3'), donde cada secuencia para los cebadores de retransmisión puede ser la misma o diferente. Los cebadores de retransmisión abarcan el enlace ilegible y la extensión prosigue a lo largo de las porciones legibles del complejo (es decir, la secuencia codificante, p. ej., una o más etiquetas) para producir fragmentos de oligonucleótidos. Luego, los cebadores de relevo y los fragmentos se pueden ligar para formar una plantilla, que opcionalmente se puede amplificar y secuenciar.
[0154] Las Figuras 2-4 proporcionan enlaces ilegibles ejemplares. La Figura 2 proporciona un enlace formado por psoraleno, que reacciona dentro de un dúplex formado por conectores 5’ y 3' adyacentes. La Figura 3 proporciona un enlace formado por un oligonucleótido reticulado, que hibridó con conectores 5’ y 3' adyacentes.
[0155] Cualquiera de los enlaces descritos aquí pueden ser reversibles o irreversibles. Los enlaces reversibles incluyen enlaces fotorreactivos (p. ej., un grupo cianovinilcarbozol y timidina, como en la Figura 4) y enlaces redox. En este documento se describen enlaces adicionales.
[0156] En una realización alternativa, un enlace "ilegible" puede repararse enzimáticamente para generar un enlace legible o al menos translocalizable. Los procesos de reparación enzimática son bien conocidos por los expertos en la técnica e incluyen, pero no se limitan a mecanismos de reparación del dímero de pirimidina (p. ej., Timidina) (p. ej., usando una fotoliasa o una glicosilasa (p. ej., glicosilasa de dímero de pirimidina T4 (PDG)), mecanismos de reparación por escisión de bases (p. ej., usando una glicosilasa, una endonucleasa apurínica/apirimidínica (AP), una endonucleasa Flap o una polimerasa poli ADP ribosa (p. ej., endonucleasa apurínica/apirimidínica (AP) humana, APE 1; endonucleasa III (N°) proteína; endonucleasa IV; endonucleasa V; formamidopirimidina [fapy]-ADN glicosilasa (Fpg); 8-oxoguanina glicosilasa humana 1 (isoforma a) (hOGG1); endonucleasa VIII humana similar a 1 (hNEIL1); uracilo-ADN glicosilasa (UDG); uracilo ADN glicosilasa monocatenaria selectiva humana (SMUG1); y alquiladenina ADN glicosilasa humana (hAAG), que pueden combinarse opcionalmente con una o más endonucleasas, polimerasas de ADN o ARN y/o ligasas para la reparación), mecanismos de reparación de metilación (p. ej., utilizando un metilo guanina metiltransferasa), mecanismos de reparación de AP (p. ej., usando una endonucleasa apurínica/apirimidínica (AP) (p. ej., APE 1; endonucleasa III; endonucleasa IV; endonucleasa V; Fpg; hOGG1; y hNEIL1), que pueden combinarse opcionalmente con una o más endonucleasas, ADN o polimerasa de ARN y/o ligasas para la reparación), mecanismos de reparación por escisión de nucleótidos (p. ej., usando proteínas de complemento cruzado de reparación por escisión o nucleasas de escisión, que pueden combinarse opcionalmente con una o más endonucleasas, ADN o polimerasa de ARN y/o ligasas para la reparación) y mecanismos de reparación de errores de apareamiento (p. ej., usando una endonucleasa (p. ej., endonucleasa I de T7; MutS, MutH y/o MutL), que pueden combinarse opcionalmente con una o más exonucleasas, endonucleasas, helicasas, ADN o polimerasa de ARN y/o ligasas para la reparación). Se encuentran disponibles mezclas de enzimas comerciales para proporcionar fácilmente este tipo de mecanismos de reparación, p. ej., PreCR® Repair Mix (New England Biolabs Inc., Ipswich MA), que incluye Ligasa ADN Taq, Endonucleasa iV , Polimerasa ADN Bst, Fpg, Glicosilasa Uracilo-ADN ( u D g ) , T4 P d G (T4 Endonucleasa V) y Endonucleasa VIII.
Métodos para el etiquetado de bibliotecas codificadas
[0157] Se describe un método para asociar operativamente las etiquetas de oligonucleótidos con entidades químicas, de manera que codifican las relaciones se pueden establecer entre la secuencia de la etiqueta y las unidades estructurales (o bloques de construcción) de la entidad química. En particular, la identidad y/o la historia de una entidad química pueden inferirse de la secuencia de bases en el oligonucleótido. Usando este método, una biblioteca que incluye diversas entidades químicas o miembros (p. ej., moléculas pequeñas o péptidos) se puede codificar con una secuencia de etiqueta particular.
[0158] Generalmente, estos métodos incluyen el uso de un dominio auricular, que tiene al menos un grupo funcional que puede ser elaborado químicamente y al menos un grupo funcional al que un oligonucleótido monocatenario puede unirse (o ligarse). La unión se puede efectuar por cualquier medio útil, como mediante unión enzimática (p. ej., unión con una o más de una ligasa ARN y/o una ligasa ADN) o mediante unión química (p. ej., mediante una reacción de sustitución entre dos grupos funcionales, como nucleófilo y grupo saliente).
[0159] Para crear numerosas entidades químicas dentro de la biblioteca, una solución que contiene el dominio auricular puede dividirse en múltiples alícuotas y luego colocarse en una multiplicidad de compartimentos físicamente separados, como los pocillos de una placa de múltiples pocillos. Generalmente, este es el paso "dividido". Dentro de cada compartimento o pocillo, se realizan sucesivas etapas de ligación y reacción química con una etiqueta monocatenaria dentro de cada alícuota. Se registra la relación entre las condiciones de la reacción química y la secuencia de la etiqueta monocatenaria. Los pasos de reacción y ligación pueden realizarse en cualquier orden.
Luego, las alícuotas reaccionadas y ligadas se combinan o "juntan" y, opcionalmente, se puede realizar la purificación en este punto. Estos pasos de división y agrupación se pueden repetir opcionalmente.
A continuación, la biblioteca puede probarse y/o seleccionarse para una característica o función particular, como se describe en el presente documento. Por ejemplo, la mezcla de entidades químicas etiquetadas se puede separar en al menos dos poblaciones, donde la primera población se une a una diana biológica particular y la segunda población no (p. ej., mediante selección negativa o selección positiva). A continuación, la primera población puede capturarse selectivamente (p. ej., eluyendo en una columna que proporciona la diana de interés o incubando la alícuota con la diana de interés) y, opcionalmente, analizada o probada adicionalmente, como con pasos de lavado opcional, purificación, selección negativa, selección positiva o separación.
[0160] Por último, las historias químicas de uno o más miembros (o entidades químicas) dentro de la población seleccionada se pueden determinar por la secuencia del oligonucleótido unido operativamente. Tras correlacionar la secuencia con el bloque de construcción particular, este método puede identificar los miembros individuales de la biblioteca con la característica seleccionada (p. ej., una mayor tendencia a unirse a la proteína diana y de ese modo provocar un efecto terapéutico). Para pruebas y optimización adicionales, los compuestos terapéuticos candidatos pueden prepararse luego sintetizando los miembros de la biblioteca identificados con o sin sus etiquetas oligonucleotídicas asociadas.
[0161] Los métodos descritos en el presente documento pueden incluir cualquier número de etapas opcionales para diversificar la biblioteca o para interrogar a los miembros de la biblioteca. Para cualquier método de marcado descrito en el presente documento, se puede añadir un número "n" sucesivo de etiquetas con un número adicional "n" de etapas de ligación, separación y/o fosforilación. Los pasos opcionales ejemplares incluyen la restricción de oligonucleótidos codificantes asociados a miembros de la biblioteca usando una o más endonucleasas de restricción; reparación de los oligonucleótidos codificantes asociados, p. ej., con cualquier enzima reparadora, como las descritas en el presente documento; ligación de una o más secuencias adaptadoras a uno o ambos extremos para oligonucleótidos codificantes asociados a miembros de la biblioteca, p. ej., como una o más secuencias adaptadoras para proporcionar una secuencia de cebado para amplificación y secuenciación o para proporcionar un marcador, como biotina, para la inmovilización de la secuencia; transcripción inversa o transcripción, opcionalmente seguida de transcripción inversa, de las etiquetas ensambladas en el complejo usando una transcriptasa inversa, transcriptasa u otra polimerasa dependiente de plantilla; amplificación de las etiquetas ensambladas en el complejo usando, p. ej., PCR; generación de aislados clonales de una o más poblaciones de etiquetas ensambladas en el complejo, p. ej., mediante el uso de transformación bacteriana, formación de emulsión, dilución, técnicas de captura de superficie, etc.; amplificación de aislados clonales de una o más poblaciones de etiqueta ensamblada en el complejo, p. ej., usando aislados clonales como plantillas para la polimerización de nucleótidos dependiente de la plantilla; y determinación de la secuencia de aislados clonales de una o más poblaciones de etiquetas ensambladas en el complejo, p. ej., usando aislados clonales como plantillas para la polimerización dependiente de plantilla con nucleótidos marcados con fluorescencia. En el presente documento se describen métodos adicionales para amplificar y secuenciar las etiquetas oligonucleotídicas.
[0162] Estos métodos se pueden utilizar para identificar y descubrir cualquier número de entidades químicas con una característica particular o función, p. ej., en una etapa de selección. La característica o función deseada puede usarse como base para dividir la biblioteca en al menos dos partes con el enriquecimiento concomitante de al menos uno de los miembros o miembros relacionados en la biblioteca con la función deseada. En realizaciones particulares, el método comprende identificar un pequeño miembro de biblioteca similar a un fármaco que se une o inactiva una proteína de interés terapéutico. En otra realización, se diseña una secuencia de reacciones químicas y se elige un conjunto de bloques de construcción de modo que la reacción de los bloques de construcción elegidos bajo las condiciones químicas definidas genere una pluralidad combinatoria de moléculas (o una biblioteca de moléculas), donde una o más moléculas pueden tener utilidad como agente terapéutico para una proteína particular. Por ejemplo, las reacciones químicas y los componentes básicos se eligen para crear una biblioteca que tenga grupos estructurales comúnmente presentes en los inhibidores de quinasas. En cualquiera de estos casos, las etiquetas de oligonucleótidos codifican la historia química del miembro de la biblioteca y, en cada caso, una colección de posibilidades químicas puede estar representada por cualquier combinación de etiquetas en particular.
[0163] En una realización, la biblioteca de entidades químicas, o una porción de la misma, se pone en contacto con una diana biológica en condiciones adecuadas para al menos un miembro de la biblioteca que se unen a la diana, seguido de la eliminación de los miembros de biblioteca que no se unen a la diana, y analizar una o más etiquetas oligonucleotídicas asociadas con la diana. Este método puede incluir opcionalmente amplificar las etiquetas mediante métodos conocidos en la técnica. Los ejemplos de dianas biológicas incluyen enzimas (p. ej., quinasas, fosfatasas, metilasas, demetilasas, proteasas y enzimas de reparación de ADN), proteínas implicadas en interacciones proteína:proteína (p. ej., ligandos para receptores), dianas de receptor (p. ej., GPCR y RTK), canales de iones, bacterias, virus, parásitos, ADN, ARN, priones y carbohidratos.
[0164] En otra realización, las entidades químicas que se unen a una diana no están sometidas a amplificación pero se analizan directamente. Los métodos de análisis ejemplares incluyen análisis de micromatrices, incluyendo análisis de cristales fotónicos de resonancia evanescente; métodos basados en cuentas para deconvoluntar etiquetas (p. ej., usando etiquetas his); análisis de biosensor de cristal fotónico sin etiquetas (p. ej., un lector BIND® de SRU Biosystems, Inc., Woburn, MA); o enfoques basados en hibridación (p. ej., mediante el uso de matrices de oligonucleótidos inmovilizados complementarios a las secuencias presentes en la biblioteca de etiquetas).
[0165] Además, los pares químico-reactivos (o grupos funcionales) se pueden incluir fácilmente en esquemas de síntesis de oligonucleótidos en fase sólida y apoyarán la ligación química eficiente de oligonucleótidos. Además, los oligonucleótidos ligados resultantes pueden actuar como plantillas para la polimerización dependiente de la plantilla con una o más polimerasas. Por consiguiente, cualquiera de los pasos de unión descritos en el presente documento para marcar bibliotecas codificadas puede modificarse para incluir una o más técnicas de ligación enzimática y/o ligación química. Las técnicas de ligación ejemplares incluyen ligación enzimática, tal como el uso de una o más ligasas de ARN y/o ligasas de ADN; y ligación química, tal como el uso de pares químicos reactivos (p. ej., un par que incluye grupos funcionales alquinilo y azido opcionalmente sustituidos).
[0166] Además, una o más bibliotecas pueden combinarse en una etapa de división y mezcla. Para permitir la mezcla de dos o más bibliotecas, el miembro de la biblioteca puede contener una o más secuencias de identificación de la biblioteca, como en una etiqueta de identificación de biblioteca, en una etiqueta ligada o como parte de la secuencia del dominio auricular, como se describe en el presente documento.
Métodos de tener masa reducida
[0167] La mayor parte de la motivación para las estrategias de codificación de cadena simple surge de la masa reducida de una etiqueta de una sola cadena, en comparación con una etiqueta de doble cadena. La masa reducida potencialmente confiere varios beneficios que incluyen mayor solubilidad, menor costo, mayor reactividad, mayor accesibilidad a la diana, menor radio hidrodinámico, mayor precisión de las evaluaciones analíticas, etc. Además de utilizar una metodología de marcado de una sola hebra, se pueden lograr mayores reducciones en la masa incluyendo el uso de uno o más de los siguientes: una o más etiquetas que tienen una longitud reducida, conjuntos de etiquetas de masa constante, un dominio auricular codificador, uno o más miembros de una biblioteca que carecen de una región de unión de cebadores y/o una región constante, uno o más miembros de una biblioteca que tienen una región constante reducida, o cualquier otra metodología descrita en el presente documento.
[0168] Para reducir al mínimo la masa de los miembros de la biblioteca, la longitud de una o más etiquetas se puede reducir, tal como a una longitud que es tan corta como sea posible para codificar cada tamaño de división. En particular, las etiquetas pueden tener menos de 20 nucleótidos (p. ej., menos de 19 nucleótidos, menos de 18 nucleótidos, menos de 17 nucleótidos, menos de 16 nucleótidos, menos de 15 nucleótidos, menos de 14 nucleótidos, menos de 13 nucleótidos, menos de 12 nucleótidos, menos de 11 nucleótidos, menos de 10 nucleótidos, menos de 9 nucleótidos, menos de 8 nucleótidos o menos de 7 nucleótidos). Como se describe a continuación en los Ejemplos, se pueden usar etiquetas más cortas (p. ej., aproximadamente 10 nucleótidos o más cortas) para la ligación de etiquetas.
[0169] Estrategias de masa constantes también se pueden utilizar, lo que podría ayudar en el análisis durante la síntesis de la biblioteca. Además, los conjuntos de etiquetas de masa constante podrían permitir el reconocimiento de todas las ocurrencias de errores individuales (p. ej., errores que surgen de una mala lectura de una secuencia o de la ligación química o enzimática de una etiqueta) y la mayoría de las ocurrencias de errores múltiples. La relación entre la longitud de un conjunto de etiquetas monocatenarias de masa constante y la capacidad de codificación (p. ej., longitudes mínimas para admitir tamaños de división de bloques de construcción específicos o identidades de biblioteca, etc.) se describe a continuación en la Tabla 1. En consecuencia, el uso de etiquetas de masa constante Los conjuntos podrían usarse para proporcionar una capacidad de codificación beneficiosa, mientras se mantiene el reconocimiento de errores durante la formación de la biblioteca.
Tabla 1
Figure imgf000029_0001
(Continuación)
Figure imgf000030_0001
[0170] Para minimizar la masa en la biblioteca, el dominio auricular se puede utilizar no solo para vincular el resto químico y una etiqueta, sino también para codificar la identidad de una biblioteca en particular o para un paso en particular. Por ejemplo, el dominio auricular puede codificar información, p. ej., una pluralidad de dominios auriculares que codifican la(s) primera(s) división(es) o la identidad de la biblioteca, p. ej., utilizando una secuencia particular relacionada con una biblioteca específica.
[0171] Además, regiones de unión a cebador (p. ej., constantes) de la biblioteca de entidades químicas codificadas por ADN pueden ser excluidas durante el (los) paso(s) de selección. Entonces, estas regiones pueden añadirse después de la selección mediante, p. ej., ligación monocatenaria. Una estrategia ejemplar incluiría proporcionar una entidad química en el extremo 5’ de un oligonucleótido codificante, seleccionar una entidad química particular en base a cualquier característica o función particular útil, y ligar un oligonucleótido de cordal al extremo 3' del oligonucleótido codificante que incluye una secuencia de unión a cebador y puede contener opcionalmente una o más etiquetas, p. ej., una etiqueta de "uso", una etiqueta de "origen", etc., como se describe en el presente documento. Esta secuencia de unión al cebador podría usarse luego para iniciar la polimerización dependiente de la plantilla para generar ADNc (o ARNc) que sea complementario al miembro de la biblioteca seleccionado. El ADNc o cARN luego se ligaría en su extremo 3’ a un oligonucleótido que contiene una secuencia de unión a cebador y, ahora que la información codificante está flanqueada en ambos lados por secuencias de unión a cebador, el oligonucleótido se puede secuenciar y/o amplificar usando enfoques establecidos, tales como cualquiera de los descritos en este documento.
[0172] La masa se puede minimizar además omitiendo o reduciendo el tamaño de una o más secuencias constantes que separan las etiquetas de codificación. La ligación monocatenaria no requiere ninguna relación complementaria entre los extremos a ligar o entre estos extremos y una férula. Por lo tanto, no se requiere una secuencia fija para soportar la ligación enzimática. Las regiones fijas cortas entre etiquetas pueden ser útiles para el análisis sintáctico de etiquetas u otros procesos de deconvolución in silico.
Métodos para la codificación de entidades químicas dentro de una biblioteca
[0173] Los métodos de la descripción se pueden utilizar para sintetizar una biblioteca que tiene un número diverso de entidades químicas que son codificadas por las etiquetas de oligonucleótidos. En la publicación de solicitud de patente de EE.UU. n° 2007/0224607 se encuentran ejemplos de bloques de construcción y etiquetas de ADN codificantes.
[0174] Cada entidad química está formada por uno o más bloques de construcción y opcionalmente un andamio. El andamio sirve para proporcionar uno o más nodos de diversidad en una geometría particular (p. ej., una triazina para proporcionar tres nodos dispuestos espacialmente alrededor de un anillo heteroarilo o una geometría lineal).
[0175] Los bloques de construcción y sus etiquetas que codifican pueden añadirse directamente o indirectamente (p. ej., a través de un espaciador) al dominio auricular para formar un complejo. Cuando el dominio auricular incluye un espaciador, el bloque de construcción o andamio se agrega al final del espaciador. Cuando el espaciador está ausente, el bloque de construcción se puede agregar directamente al dominio auricular o el propio bloque de construcción puede incluir un espaciador que reacciona con un grupo funcional del dominio auricular. En este documento se describen espaciadores y dominios auriculares ejemplares.
[0176] El andamio se puede añadir de cualquier forma útil. Por ejemplo, el andamio se puede agregar al final del espaciador o el dominio auricular, y se pueden agregar bloques de construcción sucesivos a los nodos de diversidad disponibles del andamio. En otro ejemplo, el bloque de construcción An se agrega primero al espaciador o el dominio auricular, y luego el nodo de diversidad del andamio S se hace reaccionar con un grupo funcional en el bloque de construcción An. Las etiquetas de oligonucleótidos que codifican un andamio particular se pueden añadir opcionalmente al dominio auricular o al complejo. Por ejemplo, Sn se agrega al complejo en n recipientes de reacción, donde n es un número entero más que uno, y la etiqueta Sn (es decir, la etiqueta S i , S2 ,... Sn-1, Sn) es ligado al grupo funcional del complejo. Los bloques de construcción se pueden agregar en varios pasos sintéticos. Por ejemplo, una parte alícuota del dominio auricular, que tiene opcionalmente un espaciador adjunto, se separa en n recipientes de reacción, donde n es un número entero de dos o más. En el primer paso, el bloque de construcción An se agrega a cada recipiente de reacción n (es decir, el bloque de construcción A i , A2 , ... An - i, An se agrega al recipiente de reacción 1, 2, ... n-1, n), donde n es un número entero y cada bloque de construcción An es único. En el segundo paso, se agrega el andamio S a cada recipiente de reacción para formar un complejo An-S. Opcionalmente, el andamio Sn se puede añadir a cada recipiente de reacción a partir de un complejo An-Sn, donde n es un número entero de más de dos, y cada andamio Sn puede ser único. En el tercer paso, el bloque de construcción Bn es para cada n recipiente de reacción que contiene el complejo An-S (es decir, el bloque de construcción B1, B2 ,. Bn-1, Bn se agrega al recipiente de reacción 1, 2, ... n-1, n que contiene el complejo A 1 -S, A2-S,. An-1-S, An-S), donde cada bloque de construcción Bn es único. En pasos posteriores, el bloque de construcción Cn se puede agregar a cada recipiente de reacción n que contiene el complejo Bn-An-S (es decir, el bloque de construcción C1, C2 , ... Cn -1, Cn se agrega al recipiente de reacción 1,2, ... n-1, n que contiene el complejo B1-A1 -S. Bn-An-S), donde cada bloque de construcción Cn es único. La biblioteca resultante tendrá n3 número de complejos que tienen n3 etiquetas. De esta manera, se pueden usar pasos sintéticos adicionales para unir bloques de construcción adicionales para diversificar aún más la biblioteca.
[0177] Después de formar la biblioteca, los complejos resultantes pueden opcionalmente purificarse y someterse a una reacción de polimerización o ligación, p. ej., a un cordal. Esta estrategia general se puede ampliar para incluir nodos de diversidad y bloques de construcción adicionales (p. ej., D, E, F, etc.). Por ejemplo, el primer nodo de diversidad se hace reaccionar con bloques de construcción y/o S y se codifica mediante una etiqueta oligonucleotídica. Luego, se hacen reaccionar bloques de construcción adicionales con el complejo resultante, y el nodo de diversidad posterior se deriva mediante bloques de construcción adicionales, que están codificados por el cebador utilizado para la reacción de polimerización o ligación.
[0178] Para formar una biblioteca codificada, se agregan etiquetas de oligonucleótidos. al complejo después o antes de cada paso sintético. Por ejemplo, antes o después de la adición del bloque de construcción An a cada recipiente de reacción, la etiqueta An está unida al grupo funcional del dominio auricular (es decir, la etiqueta A 1, A2 , ... An-1, An se añade al recipiente de reacción 1,2, ... n-1, n que contiene el dominio auricular). Cada etiqueta An tiene una secuencia distinta que se correlaciona con cada bloque de construcción único An, y la determinación de la secuencia de la etiqueta An proporciona la estructura química del bloque de construcción An. De esta manera, se utilizan etiquetas adicionales para codificar bloques de construcción adicionales o andamios adicionales.
[0179] Por otra parte, la última etiqueta que se añade al complejo puede incluir una secuencia de unión a cebador o proporcionar un grupo funcional para permitir la unión (p. ej., por ligación) de una secuencia de unión al cebador. La secuencia de unión al cebador se puede usar para amplificar y/o secuenciar las etiquetas de oligonucleótidos del complejo. Los métodos ejemplares para amplificar y secuenciar incluyen la reacción en cadena de la polimerasa (PCR), amplificación de cadena lineal (LCR), amplificación por círculo rodante (RCA) o cualquier otro método conocido en la técnica para amplificar o determinar secuencias de ácido nucleico.
[0180] El uso de estos métodos, bibliotecas grandes se pueden formar con un gran número de entidades químicas codificadas. Por ejemplo, un dominio auricular se hace reaccionar con un espaciador y un bloque de construcción An, que incluye 1.000 variantes diferentes (es decir, n = 1000). Para cada bloque de construcción An, se liga una etiqueta de ADN An o se extiende un cebador al dominio auricular. Estas reacciones se pueden realizar en una placa de 1.000 pocillos o en placas de 10 x 100 pocillos. Todas las reacciones pueden agruparse, opcionalmente purificarse y dividirse en un segundo conjunto de placas. A continuación, se puede realizar el mismo procedimiento con el bloque de construcción Bn, que también incluye 1.000 variantes diferentes. Se puede ligar una etiqueta de ADN Bn al complejo An-dominio auricular y se pueden combinar todas las reacciones. La biblioteca resultante incluye 1.000 x 1.000 combinaciones de An x Bn (es decir, 1.000.000 de compuestos) etiquetados por 1.000.000 de combinaciones diferentes de etiquetas. El mismo enfoque puede extenderse para agregar bloques de construcción Cn, Dn, En, etc. La biblioteca generada puede usarse luego para identificar compuestos que se unen a la diana. La estructura de las entidades químicas que se unen a la biblioteca se puede evaluar opcionalmente mediante PCR y secuenciación de las etiquetas de ADN para identificar los compuestos que se enriquecieron.
[0181] Este método se puede modificar para evitar el marcado tras la adición de cada bloque de construcción o para evitar la puesta en común (o mezcla). Por ejemplo, el método se puede modificar agregando el bloque de construcción An a n vasos de reacción, donde n es un número entero de más de uno, y agregando el bloque de construcción idéntico B1 a cada pozo de reacción. Aquí, B1 es idéntico para cada entidad química y, por lo tanto, no se necesita una etiqueta de oligonucleótido que codifique este bloque de construcción. Después de agregar un bloque de construcción, los complejos pueden agruparse o no agruparse. Por ejemplo, la biblioteca no se agrupa después del paso final de la adición de bloques de construcción, y las agrupaciones se analizan individualmente para identificar los compuestos que se unen a una diana. Para evitar agrupar todas las reacciones después de la síntesis, se puede utilizar un lector BIND® (de SRU Biosystems, Inc.), p. ej., para controlar la unión en la superficie del sensor en un formato de alto rendimiento (p. ej., placas de 384 pocillos y placas de 1536 pocillos). Por ejemplo, el bloque de construcción An puede estar codificado con la etiqueta de ADN An, y el bloque de construcción Bn puede estar codificado por su posición dentro de la placa de pocillos. Los compuestos candidatos pueden identificarse mediante un ensayo de unión (p. ej., utilizando un biosensor BIND®, también disponible por SRU Biosystems, Inc., o utilizando un ensayo ELISA) y analizando las etiquetas An mediante secuenciación, análisis de microarrays y/o análisis de digestión de restricción. Este análisis permite la identificación de combinaciones de componentes básicos An y Bn que producen las moléculas deseadas.
[0182] El método de amplificación puede incluir opcionalmente formar una emulsión de agua en aceite para crear una pluralidad de microrreactores acuosos. Las condiciones de reacción (p. ej., concentración de complejo y tamaño de microrreactores) se pueden ajustar para proporcionar, en promedio, un microrreactor que tiene al menos un miembro de una biblioteca de compuestos. Cada microrreactor también puede contener la diana, una sola perla capaz de unirse a un complejo o una porción del complejo (p. ej., una o más etiquetas) y/o unirse a la diana, y una solución de reacción de amplificación que tiene uno o más reactivos necesarios para realizar amplificación de ácido nucleico. Después de amplificar la etiqueta en los microrreactores, las copias amplificadas de la etiqueta se unirán a las cuentas en los microrreactores, y las cuentas recubiertas se pueden identificar mediante cualquier método útil.
[0183] Una vez que los bloques de construcción de la primera biblioteca que se unen a la diana de interés han sido identificados, una segunda biblioteca se pueden preparar de forma iterativa. Por ejemplo, se pueden agregar uno o dos nodos adicionales de diversidad, y se crea y muestrea la segunda biblioteca, como se describe en este documento. Este proceso puede repetirse tantas veces como sea necesario para crear moléculas con las propiedades moleculares y farmacéuticas deseadas.
[0184] Diversas técnicas de ligación pueden utilizarse para añadir el andamio, la construcción de bloques, espaciadores, vinculaciones, y las etiquetas. Por consiguiente, cualquiera de los pasos de unión descritos en el presente documento puede incluir cualquier técnica o técnicas de unión útiles. Las técnicas de ligación ejemplares incluyen ligación enzimática, tal como el uso de una o más ligasas de ARN y/o ligasas de ADN, como se describe en el presente documento; y ligación química, como el uso de pares químicos reactivos, como se describe en el presente documento.
Ejemplo 1
Estrategia general para complejos
[0185] Los complejos presentados en los métodos de la invención pueden formarse para incluir uno o más enlaces cuya polimerasa tiene capacidad reducida para leer o trasladar. Por ejemplo, se pueden formar complejos para incluir (desde la dirección 5’ a 3') una entidad química (estrella), una secuencia constante fija (p. ej., un dominio auricular), seguida de tres secuencias de codificación variable (p. ej., tres etiquetas), y otra secuencia constante fija (p. ej., un cordal), donde el enlace entre las secuencias constantes fijas y las secuencias de codificación variable puede ser ilegible (Figura 1B).
[0186] vínculos ilegibles se pueden formar por cualquier resto útil o grupo funcional. Un ejemplo no limitativo es el psoraleno (Figura 2), que puede formar un enlace ilegible entre los conectores 5’ y 3'.
[0187] Enlaces ilegibles pueden estar formados por un oligonucleótido de reticulación con un grupo co-reactivo reversible de un grupo cianovinilcarbazol. El complejo puede incluir (de la dirección 5’ a 3') una entidad química (estrella), una secuencia constante fija (p. ej., un dominio auricular), un oligonucleótido reticulante que está reticulado mediante un grupo co-reactivo reversible de un grupo cianovinilcarbazol (reticulado a aproximadamente 366 nm, marcado con X), y seguido de una secuencia codificante variable que tiene secuencias constantes fijas en los extremos 5’ y 3' (p. ej., una etiqueta que tiene conectores 5’ y 3') (Figura 3). Una reacción reversible ejemplar con grupos coreactivos reversibles (un par de un grupo cianovinilcarbazol y una timidina), que puede estar presente en el conector 3’, conector 5' y oligonucleótido de reticulación (Figura 4). Otros enlaces ilegibles pueden volverse desconvolucionables mediante el uso de enzimas reparadoras.
[0188] Como parte del proceso de lectura o de deconvolución, el complejo se puede hacer reaccionar con un proceso químico y/o un proceso enzimático (p. ej., una ligasa y, opcionalmente, una quinasa) para ligar las etiquetas. Cuando la unión entre etiquetas adyacentes es una muesca, entonces se puede usar ligasa para ligar las etiquetas. Opcionalmente, se puede usar una quinasa para convertir grupos 5'-hidroxilo terminales en grupos fosfato. Cuando la unión entre etiquetas adyacentes es un espacio que requiere extensión con uno o más nucleótidos, entonces se puede usar una polimerasa para extenderse a través del espacio antes de la ligación de las etiquetas (opcionalmente incluyendo quinasa). Opcionalmente, la polimerasa tiene una actividad de desplazamiento de cadena reducida. A continuación, los oligonucleótidos de reticulación se liberan para formar una plantilla (p. ej., usando irradiación a aproximadamente 312 nm). Finalmente, la plantilla se amplifica opcionalmente con PCR y se secuencia.
[0189] Para cualquiera de estos complejos, cada una de las secuencias de codificación variables puede incluir, opcionalmente, un conector 5’ y un conector 3' que son secuencias constantes fijas. Debido a que los enlaces son ilegibles, se pueden usar cebadores de retransmisión para extender los enlaces y permitir la extensión con una polimerasa, formando así fragmentos de oligonucleótidos. A continuación, los fragmentos pueden ligarse usando ligasa, opcionalmente amplificarse con PCR y secuenciarse.
[0190] Las secuencias que codifican alternativamente a ambos lados de un enlace ilegible pueden ser copiadas en una sola secuencia de ADNc usando un proceso de recombinación mediada en donde eventos de recombinación son favorecidos a ocurrir por secuencias derivadas de la misma secuencia de plantilla ancestral. Este mecanismo conserva la información de asociación de etiquetas y hace que estas asociaciones sean deducibles de los datos de secuencia derivados. Un posible método de generar enlaces ilegibles que pueden convertirse en plantillas para el ADNc propenso a la recombinación es establecer regiones homólogas repetidas a ambos lados del enlace.
Ejemplo 2
Reticulación de oligonucleótidos fotoquím icos usando carbazol de cianovinilo para modelar un evento etiquetado
[0191] Oligonucleótido CNVKJ, que contiene dos modificaciones de cianovinilo de carbazol, se obtuvo de Nihon Techno Service (Japón) (Figura 5). Los oligonucleótidos CNVK2_P_EtiquetaB, CNVK2_NP_EtiquetaB y CNVK2_EtiquetaA se obtuvieron de Integrated DNA Technologies (IDT) (IA). Cada oligonucleótido se disolvió en agua hasta una concentración de 1 mM.
[0192] Condiciones de reticulación fotoquímicas fueron como sigue: Los oligonucleótidos CNVKJ, CNVK2_P_EtiquetaB y CNVK2_EtiquetaA y se mezclaron en una relación equimolar a 100 uM cada uno en tampón de fosfato 500 mM a pH 7,0 en alícuotas de 20 uL o 50 uL en tubos de microcentrífuga de polipropileno de color natural de 1,5 ml (Fisher Scientific, 02-682-550). Luego se irradió cada reacción usando una lámpara UVL-21 (4 Watt) (95­ 0018-02) (Ultra Violet Products, CA) a 365 nm durante 2 horas a 4°C. A continuación, los productos de las reacciones se analizaron por electroforesis en un PAAG desnaturalizante al 10% así como por CLEM (Thermo Fisher Scientific) (Figura 6). Más del 70% del material de partida se convirtió en el conjugado de oligonucleótidos reticulado fotoquímicamente con un PM observado de 16.894 Da (calculado 16.890 Da). Cuando se realizó la misma reacción de reticulación en tampón fosfato 500 mM a pH 5,5 o tampón borato 500 mM a pH 9,5 se observaron resultados y rendimientos similares.
[0193] El conjugado de oligonucleótidos reticulado fotoquímicamente de CNVK2_P_EtiquetaB, CNVK2_EtiquetaA y CNVKJ se purificó en un PAAG de desnaturalización al10%y era no reticulado por calentamiento a 80°C en alícuotas de 50 uL en 1,5 ml de tubos de color natural de microcentrífuga de polipropileno (Fisher Scientific, 02-682-550) con irradiación (a 80°C) usando una lámpara Spectroline E-Series EB-160C (6 Watt) (Spectronics Corp., NY) a 312 nm durante 1 hora. Los productos fueron analizados por CLEM. La reacción produce cuantitativamente etiquetas de modelo de oligonucleótidos iniciales inalteradas CNVK2_P_EtiquetaB PM observado 6,578 Da (calculado 6,579 Da) y CNVK2_EtiquetaA observado PM 5,558 Da (calculado 5,558 Da) (Figura 7).
[0194] Para estudiar la disociación de múltiples oligonucleótidos reticulados que contienen CNVK, adaptamos el protocolo anterior para preparar un complejo con dos oligonucleótidos CNVK, CNVKJ y Férula_14_CNVK, (Splint_14_CNVK es CGAXCGTGTCAXCG, donde X es sintetizado por CNVK, Technologies, c A), fotoquímicamente reticulado a un solo oligonucleótido, Doble_cNVK_Plantilla (AAAAAAGTCGTGACACGTCGGAAAAAAAAAAAAACGGTGACACGGTCGAAAAAA, IDT (IA)). Este complejo se analizó por CLEM: PM observado 25.079 Da (calculado 25.055 Da). Luego se disolvió en agua hasta una concentración de 100 gM y se irradió con UV 312 nm durante 1 hora a 80°C, de nuevo como se describió anteriormente. Los productos se analizaron mediante CLEM para encontrar la recuperación de la plantilla de Doble_CNVK_plantilla: PM observado 16.492 Da (calculado 16.492 Da) (Figura 8).
Ejemplo 3
Ligación y no reticulación fotoquím ica de oligonucleótidos fotoquím icamente reticulados de cianovinilcarbazol para modelar la recuperación de información de la secuencia de etiquetas fotoquím icamente reticuladas
[0195] Un complejo de CNVK2_P_EtiquetaB, CNVK2_EtiquetaA y CNVKJ se preparó, se reticuló fotoquímicamente, y se purificó en gel como se describe en el Ejemplo 2.
[0196] El par de etiqueta de modelo fotoquímicamente reticulado se disolvió en 1 x tampón de ligasa ADN de T4 (NEB, MA) y se incubó con ligasa ADN de T4 (NEB, MA) durante 1 hora a 37°C. A continuación, el producto de esta reacción se descruzó como se describe en el Ejemplo 2 y se analizó mediante electroforesis en gel desnaturalizante y CLEM (Figura 9). El producto de la reacción de ligación se observó con alto rendimiento, observado PM 12.119 Da (calculado 12.119 Da).
[0197] El correspondiente par de etiquetas modelo no fosforilado fotoquímicamente reticulado CNVK2_NP_EtiquetaB con CNVK2_EtiquetaA y CNVKJ también se preparó, como se describió anteriormente. El análisis CLEM de este complejo reveló un PM observado de 16.503 Da (calculado 16.499 Da, Figura 10). El complejo fotoquímicamente reticulado se disolvió en 1x tampón de ligasa T4 (NEB) y se incubó con una mezcla de polinucleótido quinasa T4 y ligasa ADN T4 (NEB) durante 1 hora a 37°C. El producto de esta reacción de fosforilación-ligación acoplada se descruzó luego fotoquímicamente mediante irradiación con UV a 312 nm durante 1 hora a 80°C como se describe en el Ejemplo 2. El producto de esta reacción de fosforilación-ligación se observó mediante electroforesis en gel desnaturalizante y CLEM, revelando un PM observado de 11.894 Da (PM calculado 11.896 Da (fosforilación adicional en el extremo 5’ del producto ligado)) (Figura 10).
Ejemplo 4
Reticulación de oligonucleótidos fotoquím ica usando psoraleno dentro de un vástago para modelar un evento etiquetado
[0198] Oligonucleótido 5PSO2_A9_TA, modificado con C2-psoraleno en el extremo 5’ se obtuvo de Biosearch, CA (Figura 11). El oligonucleótido PSO_HP_A9_TCT se obtuvo de IDT (IA) (Figura 11). Ambos oligonucleótidos se disolvieron a una concentración de 0,5 mM cada uno en tampón fosfato 500 mM a pH 7,0 y se hibridaron calentando a 95°C y posteriormente enfriando a temperatura ambiente. Después, la reacción se irradió con luz UV a 365 nm a 4°C usando una lámpara UV compacta (UVP) UVL-21 durante 30 minutos. Los productos fueron analizados por CLEM. Observamos una rápida formación del producto fotoquímicamente reticulado con un PM observado de 17,643 Da (PM calculado de 17.643,4 Da, ver Figura 12).
Ejemplo 5
Ligación de oligonucleótidos fotoquím ica usando el psoraleno para modelar un evento etiquetado
[0199] Los oligonucleótidos Etiqueta1_PsoCVU y FérulaC_PsoC2 se obtuvieron de IDT (IA) (Figura 13). El oligonucleótido 5PSOC2_A9_GA (modificado en el extremo 5’ con psoraleno C2) se obtuvo de Biosearch (CA) (Figura 13).
[0200] El conjugado de oligonucleótidos ligado fotoquímicamente de Etiqueta1_PsoCVU y 5PSOC2_A9_GA se preparó como sigue. La fotoligación se logra mediante la reacción fotoquímica del resto de pirona 5'-psoraleno de un oligonucleótido con la timidina 3’ de un segundo oligonucleótido en presencia de un tercer oligonucleótido diseñado para hibridar con el primer y segundo oligonucleótidos y ubicar conjuntamente sus terminales reactivos (Figura 14).
[0201] Condiciones de ligación fotoquímica fueron las siguientes: Los oligonucleótidos 5PsoC2_A9_GA (final de 1 mM) y Etiqueta1_PsoCVU (final de 1,1 mM) y FérulaC_PsoC2 (final de 1,1 mM) se combinaron en una reacción de fotoligación 10 uL en 500 mM de tampón fosfato a pH 7,0 en 1,5 ml de tubos de microcentrífuga de polipropileno de color natural (Fisher Scientific, 02-682-550). La mezcla de reacción se calentó primero a 95°C seguido de enfriamiento lento a temperatura ambiente. Después, la reacción se irradió con luz UV a 365 nm a 4°C usando una lámpara UV compacta (UVP) UVL-21. Se tomaron alícuotas de 1 ul durante un transcurso de tiempo y se analizaron en un gel de poliacrilamida desnaturalizante de 15% TBE/urea 8 M (Figura 15). El gel fue visualizado y fotografiado usando el sombreado UV de una placa de TLC fluorescente. El conjugado fotoligado de 5PsoC2_A9_GA y Etiqueta1_PsoCVU se formó con alto rendimiento. Después de 24 horas, el rendimiento es aproximadamente del 90% (Figura 15).
[0202] La muestra de 24 horas se analizó mediante CLEM (Figura 16). El pico de CL principal correspondió al conjugado fotoligado de 5PsoC2_A9_GA y Etiqueta1_PsoCVU con un p M observado de 15.252,4 Da (PM calculado 15.243,1 Da).
Ejemplo 6
Generación de ADNc a partir de etiquetas modelo conjugadas por psoraleno fotoquím icamente ligado legible no de polimerasa utilizando term inal de extensión del cebador, extensión del cebador no terminal, y la ligación para modelar la lectura de un único evento etiquetado
[0203] Un conjugado de oligonucleótidos fotoquímicamente ligados a psoraleno-timidina (Bio_Pso) se generó usando un método similar al descrito en el Ejemplo 5 con los siguientes dos oligonucleótidos de etiqueta modelo: un oligonucleótido 5'-biotinilado 5Bio_Etiqueta_PsoCVU y un oligonucleótido 5'-Psoraleno 5PsoC2_A9_GA junto con tres oligonucleótidos Férula2 obtenidos de IDT (IA) y se muestran en la Figura 17. Después de 24 horas de la reacción, Bio_Pso se purificó en un PAAG desnaturalizante de TBE-Urea al 10% y se analizó por CLEM, revelando un producto con un PM observado de 15.834,0 Da (PM calculado 15.812,7 Da) (Figura 18).
[0204] El conjugado de oligonucleótidos fotoquímicamente ligado a psoraleno-timidina Bio_Pso se utilizó como una plantilla para generar ADNc por la extensión enzimática de tanto un cebador de oligonucleótido terminal (FAMprimer) como un cebador de oligonucleótido no terminal (Phos-FérulaC_PsoC2) con polimerasa de ADN de T4 (NEB, MA). Phos-FérulaC_PsoC2 se generó mediante la fosforilación en 5’ de FérulaC_PsoC2 usando T4 PNK (NEB, MA). La generación de ADNc se realizó en una reacción de 100 uL que contenía 10 uM de cada uno de cebador FAM, Phos-FérulaC_PsoC2 y Bio_Pso en tampón 1x T4 ligasa ADN (NEB, MA), complementado con 1 mM de cada dNTP y 10 uL de polimerasa de ADN T4 (NEB, MA). La mezcla de reacción se incubó a 37°C durante 1 hora y luego se complementó con ATP 0,5 mM y 5 uL de ligasa ADN T4 (2000 u/ul, NEB, MA) y luego se incubó durante otra hora a 37°C.
[0205] La mezcla de reacción se incubó con 200 uL de DynaBeads M280 recubierto de estreptavidina (Invitrogen, prelavado con PBS durante 1 hora a temperatura ambiente), las cuentas se lavaron con 1 ml de PBS y el producto se eluyó con 35 uL de 100 NaOH mM. A continuación, el eluyente se neutralizó mediante la adición de 5 uL de 1 M Tris HCl pH 7,0 y se analizó mediante CLEM.
El análisis CLEM del producto resultante, con detección a 495 nm, mostró que aproximadamente el 50% del cebador FAM se había extendido a la secuencia complementaria de longitud completa a la plantilla Bio_Pso menos un solo nucleótido dA (PM observado 15.170 Da, PM esperado de longitud completa 15.458 Da). La mayor parte del resto del cebador FAM se extendió hasta la unión de ligación fotoquímica (PM observado 11.154 Da, PM calculado 11.154 Da) (Figura 19).
[0206] Cuando la generación de ADNc, descrito anteriormente, se llevó a cabo sin adición de la enzima ligasa, la secuencia complementaria de longitud completa (menos una sola dA) no se observó (Figura 20).
Ejemplo 7
Ligación de oligonucleótidos fotoquím icos usando uridina de carboxivinilo para modelar un evento etiquetado
[0207] Los oligonucleótidos CVU_G y CVU_A fueron sintetizados por Trilink (CA) (Figura 21). Ambos oligonucleótidos están modificados en 5’ con una 5-(Carboxi)vinilo-2'-desoxiuridina (Figura 21). Los oligonucleótidos Etiqueta1_PsoCVU, FérulaC_CVU y FérulaA_CVU se obtuvieron de IDT ADN (IA) (Figura 21).
[0208] La estructura de la unión de ligación fotoquímica formado entre un 5’-5-(carboxi)vinilo-2'-desoxiuridina irradiada y un extremo 3' de timidina se muestra en la Figura 22.
[0209] Una mezcla de reacción de ligación fotoquímica de10 uL se generó con CVU_G 1 mM, Etiqueta1_PsoCVU 1,1 mM y FérulaC_CVU 1,1 mM disueltos en tampón de fosfato de sodio 500 mM pH 7,0 en tubos de microcentrífuga de polipropileno de color natural de 1,5 ml (Fisher Scientific, 02-682-550). La mezcla de reacción se calentó a 95°C seguido de un enfriamiento lento a temperatura ambiente. Después, la reacción se irradió con luz UV a 365 nm durante 24 horas a 4°C usando una lámpara UV compacta (UVP) UVL-21. Se tomaron alícuotas de 1 ul durante un transcurso de tiempo y se sometieron a electroforesis en un gel de poliacrilamida desnaturalizante de 15% TBE/urea 8 M (Figura 23). El gel se visualizó y fotografió mediante sombreado UV de una placa de TLC fluorescente. Después de 24 horas de irradiación, más del 90% del oligonucleótido CVU_G se había ligado fotoquímicamente.
[0210] La muestra de 24 horas se analizó mediante CLEM (Figura 24). El pico principal corresponde al producto de ligación fotoquímica de CVU_G con Etiqueta1_PsoCVU. El PM observado fue 15.260,6 Da (PM calculado 15.238,7 Da).
Ejemplo 8
Generación de ADNc a partir de etiquetas modelo conjugadas con carboxiviniluridina conjugadas fotoquím icamente no legibles por polimerasa usando extensión de cebador terminal, extensión de cebador no term inal y ligación para modelar la lectura de un único evento etiquetado
[0211] Un conjugado de oligonucleótidos ligados fotoquímicamente a carboxivinilo uridina-timidina (Bio_CVU) se generó usando un método similar al descrito en el Ejemplo 7 con los siguientes dos oligonucleótidos de etiqueta modelo: un oligonucleótido de 5’-5-carboxivinil uridina 5'- CVU_A y un oligonucleótido 5'-biotinilado 5Bio_Etiqueta_PsoCVU junto con un oligonucleótido de férula FérulaA_CVU, los tres oligonucleótidos se obtuvieron de IDT (lA) y se muestran en las Figuras 21 y 25. El producto de reacción se describió como purificado en el Ejemplo 6 y el análisis CLEM reveló un producto con un PM observado de 15.811,8 Da (PM calculado de 15.792,3 Da) (Figura 25).
[0212] El conjugado de oligonucleótidos ligados fotoquímicamente a carboxivinilo uridina-timidina Bio_CVU se utilizó como plantilla para generar ADNc por la extensión enzimática de tanto un cebador de oligonucleótido terminal (cebador FAM) como un cebador de oligonucleótido no terminal (Phos-FérulaA_CVU) con ADN T4 polimerasa (NEB, MA). Fos-FérulaA_CVU se generó mediante la fosforilación en 5’ de FérulaA_CVU usando T4 PNK (NEB, MA). La generación de ADNc se realizó en una reacción de 100 uL que contenía 10 uM de cada uno de cebador FAM, Fos-FérulaA_CVU y Bio_CVU en tampón 1x T4 ligasa ADN (NEB, MA), complementado con 1 mM de cada dNTP y 10 uL de polimerasa de ADN T4 (NEB, MA). La mezcla de reacción se incubó a 37°C durante 1 hora y luego se complementó con ATP 0,5 mM y 5 uL de ligasa ADN T4 (2000 u/ul, NEB, MA) y luego se incubó durante otra hora a 37°C.
[0213] La mezcla de reacción se incubó con 200 uL de DynaBeads M280 recubierto de estreptavidina (Invitrogen, prelavada con PBS durante 1 hora a temperatura ambiente), las cuentas se lavaron con 1 ml de PBS y el producto se eluyó con 35 ul de 100 NaOH mM. A continuación, el eluyente se neutralizó mediante la adición de 5 uL de 1 M Tris HCl pH 7,0 y se analizó mediante CLEM.
[0214] El análisis CLEM del producto resultante, con detección a 495 nm, mostró que aproximadamente el 80% del cebador FAM se había extendido a la secuencia complementaria de longitud completa a la plantilla Bio_CVU menos un solo nucleótido dA (PM observado 15.176 Da, PM 15,458 Da calculado de longitud completa). La mayor parte del resto del cebador FAM se extendió hasta tres nucleótidos antes de la unión de ligación fotoquímica (PM observado 10.560 Da, PM calculado 10.559 Da) (Figura 26).
[0215] Cuando, descrito anteriormente, se realizó el ADNc de generación sin adición de la enzima de ligasa, no se observó la secuencia complementaria de longitud completa (menos una sola dA).
Ejemplo 9
Ligación de oligonucleótidos usando una conjugación de clic no legible por polimerasa para modelar un evento de marcado
[0216] Los oligonucleótidos S_IDTN 3 y S_IDTalquino se obtuvieron de IDT (IA) (Fig. 27).
La modificación de azida 3’ del oligonucleótido SJDTN 3 es una modificación patentada de IDT (modificación de azida 3' IDT/3AzidaN/ (PM 350)).
[0217] Los oligonucleótidos que contienen la modificación/3AzidaN/ se purificaron por HPLC.
[0218] Se desalaron los oligonucleótidos que contenían la modificación de hexinilo y se usaron sin purificación adicional.
[0219] La conjugación por clic de estas etiquetas modelo se logró mediante una cicloadición de azido alquino 3 1 catalizada con Cu(I) de la siguiente manera:
Las soluciones madre se prepararon como sigue: Cu(OAc)2.H2O (FW 181,6), 10 mM en DMF; Ascorbato de sodio (FW 198,1), 20 mM en H2O y Tris-(BencilTriazolilmetilo)amina (TBTA) (FW 530,6), 10 mM en DMF. A un tubo Eppendorf se le añadió 10 uL de tampón fosfato pH 7,0 (solución acuosa 500 mM), 10 uL de S_IDTalquino (solución acuosa 1 mM, 10 nmol, 1 equivalente) y 10 uL de S-IDTN3 (solución acuosa 1 mM, 10 nmol, 1 equivalente molar). A esta solución se le añadieron 5 uL de Cu_Pre-mezcla (2 equivalentes molares de Cu(OAc)2, 4 equivalentes molares de ascorbato de sodio, 1 equivalente molar de TBTA). La reacción se incubó a temperatura ambiente durante la noche. El producto se analizó por CLEM (Thermo) (Figura 28) y se encontró que el PM era 26,304,8 Da (calculado: 26311,2 Da). El conjugado se purificó aún más mediante electroforesis usando PAAG al 10%/urea 8M. Este producto de conjugación se denominó Conjugado_Clic_S.
Ejemplo 10
Ligación de oligonucleótidos utilizando un par de conjugaciones clic ortogonales legibles no polimerasa para modelar un par de eventos de marcado ortogonales
[0220] TKR_Central y oligos SJDTN 3 se obtuvieron de IDT (Figura 29). El oligo TKR_DBCO_S modificado con 5'-dibenzo-ciclooctina (DBCO) se obtuvo de Biosearch Technologies (CA) (Figura 29).
[0221] En primer lugar, una conjugación clic se realizó con TKR_Central y TKR_DBCO_S utilizando una reacción clic libre de cobre basada en ciclooctino. Se mezclaron cantidades molares iguales de cada oligonucleótido (10 gl de soluciones acuosas 1 mM) en tampón fosfato de sodio 0,2 M a pH 7,0. El progreso de la reacción se controló mediante CLEM. La reacción se completó en 30 a 60 min, produciendo más del 90% del conjugado puro. EM indicó un PM de 25.336 Da (calculado 25.341,8 Da) (Figura 30).
[0222] En segundo lugar, una conjugación clic se realizó entre el producto de conjugación de TKR_Central y TKR_DBCO_S con SJDTN3 usando el procedimiento clic catalizado por Cu(I) descrito en el Ejemplo 9. El conjugado final resultante, 2cl_S se purificó en un gel de urea poliacrilamida de TBE/8M al 10% y se analizó por CLEM (Thermo) revelando el peso molecular esperado para 2cl_S 38578,1 Da, (calculado 38560,4 Da) (Figura 31).
Ejemplo 11
Am plificación por PCR de ADNc derivado de etiquetas modelo conjugadas con clic no legibles por polimerasa usando recombinación mediada por cebador no term inal en solución libre y en gotitas acuosas emulsionadas para modelar la lectura de información de secuencia de etiquetas conjugadas químicamente
[0223] Conjugado_Clic_S (Figura 32), se preparó mediante la conjugación de SJDTN 3 y S_IDTalquino, como se describe en el Ejemplo 9.
[0224] Conjugado_Clic_L (Figura 32) fue preparado por la conjugación de LJDTN 3 : TGCGGTCTAACTGTCTAGGCACTTGTTCGTTTGCCAGTGTGAGGAATGAACAGG/3AzidaN/ y L_IDTalquino:/5hexinilo/TACCGAATTGCCTTCCTCGTACAGTTCTAAGGCGCTTGGACACCACTTCAATCGGGTGC TA TGCTT (IDT, IA) de forma similar al protocolo de conjugación descrito en el Ejemplo 10. CLEM después de la purificación en gel confirmó el PM como 37.582,6 Da (calculado 37.584,4 Da).
[0225] Cebadores de oligodesoxinucleótidos, incluyendo cebador directo: TGCGGTCTAACTGTCTA, cebador inverso: AAG CATAGCACCCGATT y ePférula: GGCAATTCGGTACCTGTTCATTCC se obtuvieron de (IDT, IA).
[0226] Los conjugados Conjugado_Clic_L y Conjugado_Clic_S fueron cada uno diluidos a 1 nM y se utilizaron como plantillas para una generación de ADNc/amplificación de PCR mediada por recombinación dependiente de férulas usando polimerasa de ADN Deep Vent (exo-) (NEB, MA). Se preparó una reacción Deep Vent (exo-) de 50 uL de la siguiente manera: 5 uL de tampón Thermopol 10x; 2,5 uL de una solución 10 uM de cada cebador directo e inverso, 1 uL de cebador ePférula 100 nM; 2,5 uL de mezcla de dNTP 10 mM (NEB); 5 uL de una dilución 2 nM de conjugado o de su mezcla 1:1, 2,5 uL Deep Vent (exo-) y agua hasta 50 uL. La reacción se cicló 24 veces como sigue: 30 segundos a 94°C, 30 segundos a 52°C y 60 segundos a 72°C.
[0227] Cuando los conjugados Conjugado_Clic_L o Conjugado_Clic_S se amplifican por separado en solución libre en presencia de ambos cebadores terminales y el cebador de férula "ePférula" y luego se evalúan mediante electroforesis, cada uno da lugar a un único producto con una movilidad que se correlaciona con la longitud de la plantilla (carriles 5 y 7 en la Figura 33). Amplificaciones similares en ausencia del cebador de tablillas "ePférula" no dieron producto (carriles 4 y 6 en la Figura 33). Esto sugiere que la generación de ADNc mediada por recombinación dependiente de la férula/amplificación por PCR de ambos conjugados por polimerasa de Deep Vent (exo) depende de la presencia del cebador ePférula (Figura 33). Un posible mecanismo para esta recombinación y amplificación se presenta en la Figura 34.
[0228] Cuando los conjugados Conjugado_Clic_L y Conjugado_Clic_S se mezclan y amplifican juntos en solución libre en presencia de ambos cebadores terminales y el cebador de férula "ePférula" y luego se evalúan por electroforesis, se genera una escalera de productos de movilidad diferente con movilidades que se correlacionan con las longitudes de cada una de las plantillas, así como con movilidades que se correlacionan con longitudes intermedias entre cada una de las plantillas (carril 5 en la Figura 35). Un posible mecanismo para esta recombinación y amplificación se presenta en la Figura 36.
[0229] Cuando los conjugados Conjugado_Clic_L y Conjugado_Clic_S se mezclan y amplifican juntos en una emulsión de agua en aceite en presencia de ambos cebadores terminales y el cebador de férula "ePférula" a baja concentración de conjugados en relación con las gotitas de emulsión, y luego evaluados por electroforesis, se observan un par de productos con movilidades que se correlacionan con las longitudes de cada una de las plantillas (carril 3 en la Figura 37). Las gotitas de la emulsión actúan como microrreactores individuales, dentro de los cuales se amplifican los conjugados individuales aislados. La fase de aceite/tensioactivo se preparó mezclando 4,5% (vol/vol) de Span 80 (Fluka, cat n° 85548), 0,4% (vol/vol) de Tween 80 (Sigma, cat n° S-8074) y 0,05% (vol/vol) de Triton X-100 (Sigma, cat n° T-9284) en aceite mineral ligero (Sigma, cat n° M-3516). La fase acuosa (50 uL) se preparó mezclando 5 uL de tampón Thermopol 10x; 2,5 uL de una solución de cada cebador 10 uM, 1 uL de cebador ePférula 100 nM; 2,5 uL de mezcla de dNTP 10 mM (NEB); 2,5 uL de DVexo-(NEB), 2,5 uL de BSA (NEB) y agua hasta 50 uL. Se añadió una mezcla 1:1 de los conjugados Conjugado_Clic_L y Conjugado_Clic_S a la reacción hasta una concentración final de 5 pM. A 50 ul de la fase acuosa, se le añadieron entonces 150 ul de la fase no acuosa y la emulsificación se realizó agitando en vórtex durante 5 minutos. El proceso de recombinación/amplificación se llevó a cabo como sigue: 30 segundos a 94°C, 30 segundos a 52°C y 60 segundos a 72°C durante 32 ciclos.
[0230] Tras la generación de ADNc/amplificación de PCR mediada por recombinación dependiente de férula, la emulsión se rompió por microcentrifugación a 21.000g durante 20 minutos, entonces la fase no acuosa se eliminó y la fase acuosa y la interfase se extrajeron en cloroformo. A continuación, la fase acuosa se evaluó mediante electroforesis nativa (minigeles de agarosa al 4%, Invitrogen CA).
[0231] Los resultados de la generación de ADNc/amplificación de PCR mediada por recombinación dependiente de férula compartimentada por emulsión muestran que la extensión de la formación de productos de PCR barajadas se ve significativamente disminuida o inexistente (carril 3, Figura 37).
Ejemplo 12
Am plificación por PCR de ADNc derivado de etiquetas modelo conjugadas con clic no legibles por polimerasa usando recombinación mediada por homología de repetición en solución libre para modelar la lectura de un solo evento de marcación
[0232] Dos conjugados, TKR_S y TKR_L (Figura 38), conteniendo cada uno un único enlace de conjugación de clic no legible por polimerasa formado entre un oligonucleótido modificado con azido 3’ y un oligonucleótido modificado con hexinilo 5' usando cicloadición catalizada por Cu(I) y el protocolo descrito en el Ejemplo 9. TKR_S y TKR-L contienen cada uno una secuencia GGAATGAACAGG de 12 mer duplicada que flanquea el enlace no legible por polimerasa. TKR_S se preparó mediante la conjugación de los siguientes dos oligonucleótidos de ADN IDT, TKR_S_N 3: TGCGGTCTAACTGTCTAGTTCACCTTCTCCGGAATGAACAGG/3AzidoN/(también denominado S_IDTNa en el Ejemplo 9) y TKR_S_HexATT: /GGGGATT de ADN se preparó mediante la conjugación de dos oligonucleótidos TKR_S_HexATT/GAGGGATT TKR_L_N 3: TGCGGTCTAACTGTCTAGGCACTTGTTCGTTTGCCAGTGTGATGGACACCACTTGGAATGAACAGG/3 AzidaN/y TKR_L_Hex:/5'Hexinilo/GGAATGAACAGGGGAATGAACAGATGCGATGAACAGGGAGGATGAACAGCAT. Ambos conjugados se purificaron con PAGE en condiciones de desnaturalización y se analizaron por CLEM para revelar los pesos moleculares de TKR_S: 26.447,5 Da (26.449,2 Da calculado) y para TKR_L 37.582,6 Da (37.584,4 calculado).
[0233] Los dos conjugados eran cada uno diluidos a 1 nM y se utilizaron para una generación de ADNc/amplificación de PCR mediada por recombinación dependiente de repetición con polimerasa Deep Vent (exo-) de ADN (NEB) en solución libre con el cebador directo TGCGGTCTAACTGTCTA y el cebador inverso Aa GCa Ta g Ca CCCGATT (iDt ).
[0234] La reacción de generación de ADNc/amplificación de PCR mediada por recombinación dependiente de repetición se realizó usando polimerasa Deep Vent (exo-) de ADN (NEB). 5 uL de tampón Thermopol 10x; 2,5 uL de una solución 10 uM de cada cebador directo e inverso; 2,5 uL de mezcla de dNTP 10 mM (NEB); concentración final de 40 pM del conjugado o de su mezcla 1:1,2,5 uL de polimerasa Deep Vent (exo-) y agua hasta un volumen final de 50 uL. La reacción se cicló térmicamente 22 veces como sigue: 30 segundos a 94°C, 30 segundos a 52°C y 60 segundos a 72°C.
[0235] Los productos se visualizaron en un 4% de minigel de agarosa (Invitrogen) (Figura 39).
[0236] La reacción de generación de ADNc/amplificación de PCR mediada por recombinación dependiente de repetición de polimerasa Deep Vent (exo-) produjo grandes cantidades de amplicón derivadas de cada conjugado amplificado por separado (carriles 3 y 4, Figura 39). La amplificación de la mezcla de conjugados en las mismas condiciones no resultó en la producción de ningún producto de amplificación de longitud intermedia (carril 5, figura 39). Para confirmar aún más la falta de mezcla (pérdida) de asociaciones de etiquetas (información codificada) en estos productos de amplificación, clonamos y secuenciamos los productos de amplificación derivados de la mezcla coamplificada de TKR_S y TKR_L. Estos datos de secuencia confirmaron la ausencia total de mezcla de los pares de etiquetas modelo en los productos de amplificación derivados de los conjugados coamplificados (Figura 40).
Ejemplo 13
Am plificación por PCR de ADNc derivado de etiquetas ilegibles conjugadas con dos clics usando recombinación mediada por homología repetida en solución libre para modelar la lectura de un par de eventos de marcado
[0237] Dos conjugados, 2_cl_S y 2_cl_L (Figura 41), cada uno conteniendo dos enlaces de conjugación clic ilegibles, cada uno flanqueado por diferentes secuencias repetidas de 12 mer (GAAGGCGTTATG-clic-GAAGGCGTTATG) y (GGAATGAACAGG-clic-GGAATGAACAGG), respectivamente, se prepararon en un procedimiento de dos pasos similar al descrito en el Ejemplo 10.
[0238] En primer lugar, una conjugación se realizó utilizando una reacción basada en ciclooctino clic libre de cobre entre TKR_central:/5'-hexinilo/GGAATGAACAGGGTAAGCTGGAGTGAAGGCGTTATG/3azidaN/ (IDT) y, o bien TKR_DBCO_S: (DBCO) GAAGGCGTTATGTCCGTACTCTTGCAATCGGGTGCTATGCTT o TKR_DBCO_L (DBCO) GAAGGCGTTATGTGATATCCGTGGTGTCGTGAGTTCCAATCGGGTGCTATGC TT. Ambos oligonucleótidos que contienen DBCO se obtuvieron de Biosearch (CA), DBCO es la modificación 5'-dibenzo-ciclooctina para la que el reactivo de fosforamidita está disponible en Glen Research (VA)). Los productos de estas conjugaciones se denominaron TKR_S_N3 y TKR_L_N3 respectivamente.
[0239] En segundo lugar, se llevó a cabo una conjugación entre los productos de las primeras conjugaciones, TKR_S_N3 y TKR_L_N3, utilizando una reacción clic catalizada por Cu(I). Los conjugados resultantes, TKR_2_clic_S y TKR_2_clic_L (Figura 41) se purificaron mediante electroforesis en un gel de poliacrilamida de urea 10% TBE/8M y se analizaron por CLEM (Thermo) revelando los pesos moleculares esperados para TKR_2_clic_S 38.578,1 Da (38.560,4 Da), y calculado para TKR_2_clic_L 49.913,3 Da (49.916,7 Da calculado) (Figura 41).
[0240] Los dos conjugados eran cada uno diluidos a 1 nM y se utilizaron para una generación de ADNc/amplificación de PCR con polimerasa (NEB) de Deep Vent (exo-) mediada por recombinación dependiente de repetición. Para la amplificación, se usaron el cebador directo Tg Cg g Tc TAACTGTCTA y el cebador inverso AAGCATAGCACCCGATT (ADN IDT) con 5 uL de tampón Thermopol 10x; 2,5 uL de una solución 10 uM de cada cebador directo e inverso; 2,5 uL de mezcla de dNTP 10 mM (NEB); concentración final de 40 pM del conjugado o de su mezcla 1:1, 2,5 uL de polimerasa Deep Vent (exo-) y agua hasta 50 uL. La reacción se cicló térmicamente 22 veces como sigue: 30 segundos a 94°C, 30 segundos a 52°C y 60 segundos a 72°C. Los productos de amplificación se visualizaron en minigeles de agarosa al 4% (Invitrogen).
[0241] La generación de ADNc/amplificación de PCR con polimerasa (NEB) de Deep Vent (exo-) mediada por recombinación dependiente de repetición produce grandes cantidades de amplicón derivados de cada conjugado amplificado por separado (carriles 3 y 4, Figura 42). La amplificación de la mezcla de conjugados en las mismas condiciones no dio como resultado la producción de ningún producto de amplificación de longitud intermedia (carril 5, figura 42). Para confirmar aún más la falta de mezcla (pérdida) de asociaciones de etiquetas (información codificada) en estos productos de amplificación, clonamos y secuenciamos los productos de amplificación derivados de la mezcla coamplificada de TKR_2_clic_S y TKR_2_clic_L. Estos datos de secuencia confirmaron la ausencia total de mezcla de los pares de etiquetas modelo en los productos de amplificación derivados de los conjugados coamplificados (Figura 43).

Claims (14)

REIVINDICACIONES
1. Un método para determinar la secuencia de nucleótidos de un complejo que comprende:
(i) una entidad química que comprende uno o más andamios o uno o más bloques de construcción;
(ii) n número de etiquetas oligonucleotídicas que tienen n - 1 enlaces, donde n es un número entero entre 1 y 10, y donde cada uno de dichos enlaces está entre dos etiquetas adyacentes y cada etiqueta codifica la identidad de al menos una de dichas una o más andamios o bloques de construcción; y
(iii) un dominio auricular que tiene un primer grupo funcional asociado operativamente con dicha entidad química y un segundo grupo funcional asociado operativamente con al menos una de dicho n número de etiquetas a través de un primer enlace,
en donde una polimerasa tiene una capacidad reducida para leer o translocar a través de al menos uno de dicho primer enlace y n - 1 enlace;
en donde al menos uno de dicho primer enlace y enlace n - 1 comprende un enlace químico; y en donde dicho enlace químico comprende un grupo químico reactivo, un grupo fotorreactivo, un resto intercalante o un oligonucleótido reticulante, comprendiendo dicho método:
(a) hibridar uno o más cebadores de relevo con dicho complejo, en donde dicho uno o más más cebadores de retransmisión abarcan dicho primer enlace y/o n - 1 enlaces, en donde dicho complejo comprende un conector 5’ en el extremo 5' de una o más etiquetas y un conector 3’ en el extremo 3' de una o más más etiquetas, y en donde cada uno de dichos uno o más cebadores de retransmisión se hibrida con conectores 5’ y 3' adyacentes;
(b) extender dichos cebadores de retransmisión usando una polimerasa para producir fragmentos de oligonucleótidos;
(c) ligar dichos fragmentos de oligonucleótidos para producir una plantilla;
(d) opcionalmente amplificar dicha plantilla mediante reacción en cadena de la polimerasa para producir una mezcla amplificada; y
(e) secuenciar dicha mezcla opcionalmente amplificada para determinar la secuencia de dicho complejo.
2. El método de la reivindicación 1, en donde cada conector 5’ comprende la misma secuencia, preferiblemente en donde cada conector 3' comprende la misma secuencia.
3. El método de la reivindicación 2, en donde la secuencia de al menos uno de dichos conectores 5’ es complementaria a la secuencia del conector 3' adyacente o es idéntica o suficientemente similar para permitir la hibridación con el mismo oligonucleótido complementario en cualquier lado de la unión en eventos de hibridación separados, preferiblemente donde el método comprende además hibridar dicho conector 5’ con dicho conector 3' adyacente.
4. El método de una cualquiera de las reivindicaciones 2 o 3, donde cada cebador de relevo para una unión específica entre los conectores 5’ y 3' comprende la misma secuencia.
5. El método de cualquiera de las reivindicaciones 1 a 4, en donde:
(i) una o más etiquetas comprenden un conector 5’ en el extremo 5’ de dichas una o más etiquetas y un conector 3’ en el extremo 3’ de dichas una o más etiquetas; y/o
(ii) una polimerasa de ADN y/o una polimerasa de ARN tiene una capacidad reducida para leer o translocar a través de dicho primer enlace y/o n - 1 enlaces.
6. El método de una cualquiera de las reivindicaciones 1 a 5, en donde al menos un grupo reactivo químico, grupo fotorreactivo o resto intercalante está presente en un conector 5’ en o en las proximidades del extremo 5’ de dicha etiqueta y/o en un conector 3’ en o cerca del extremo 3’ de dicha etiqueta,
preferiblemente donde la secuencia de al menos uno de dicho conector 5’ es complementaria a la secuencia del conector 3' adyacente o es idéntica o es suficientemente similar para permitir la hibridación con el mismo oligonucleótido complementario en cualquier lado de la unión en eventos de hibridación separados.
7. El método de la reivindicación 6, en donde:
(a) dicho grupo químico reactivo se selecciona de un par de un grupo alquinilo opcionalmente sustituido y un grupo azido opcionalmente sustituido; un par de un dieno opcionalmente sustituido que tiene un sistema de electrones de 4 n y un dienófilo opcionalmente sustituido o un heterodienofilo opcionalmente sustituido que tiene un sistema de electrones de 2 n; un par de un nucleófilo y electrófilo de heterociclilo tensado; un par de un grupo amino opcionalmente sustituido y un aldehído o un grupo cetona; un par de un grupo amino opcionalmente sustituido y un grupo de ácido carboxílico; un par de una hidrazina opcionalmente sustituida y un aldehído o un grupo cetona; un par de una hidroxilamina opcionalmente sustituida y un aldehído o un grupo cetona; un par de un nucleófilo y un haluro de alquilo opcionalmente sustituido; un complejo de platino; un agente alquilante; o un nucleótido modificado con furano;
(b) dicho grupo fotorreactivo comprende un resto intercalante, un derivado de psoraleno, un grupo cianovinilcarbazol opcionalmente sustituido, un grupo vinilcarbazol opcionalmente sustituido, un grupo cianovinilo opcionalmente sustituido, un grupo acrilamida opcionalmente sustituido, un grupo diazirina opcionalmente sustituido, un grupo diazirina opcionalmente sustituido, un grupo benzofenona opcionalmente sustituido, un grupo 5-(carboxi)vinilo-uridina opcionalmente sustituido, o un grupo azida opcionalmente sustituido; y/o
(c) dicho resto intercalante es un derivado de psoraleno, un derivado de alcaloide, un catión de etidio, un derivado de acridina, un derivado de antraciclina o talidomida,
preferiblemente en donde dicho derivado de psoraleno es psoraleno, 8-metoxipsoraleno o 4-hidroximetilo-4,5,8-trimetilpsoraleno.
8. El método de una cualquiera de las reivindicaciones 1 a 7, en donde dicho enlace químico comprende dicho oligonucleótido de entrecruzamiento, en donde la secuencia de al menos cinco nucleótidos en el extremo 5’ de dicho oligonucleótido de entrecruzamiento es complementaria a la secuencia de al menos cinco nucleótidos en el extremo 3’ de una o más etiquetas, y en donde la secuencia de al menos cinco nucleótidos en el extremo 3' de dicho oligonucleótido reticulante es complementaria a la secuencia de al menos cinco nucleótidos en el extremo 5’ de una o más etiquetas, preferiblemente en donde
(i) dicho extremo 3' de una o más etiquetas comprende un conector 3’; y/o
(ii) dicho extremo 5’ de una o más etiquetas comprende un conector 5'.
9. El método de cualquiera de las reivindicaciones 1 a 8, en donde dicho extremo 5’ y/o extremo 3' de dicho oligonucleótido de reticulación comprende un grupo co-reactivo reversible,
preferiblemente en donde dicho grupo co-reactivo reversible es un grupo cianovinilcarbazol, un grupo cianovinilo, un grupo acrilamida, un grupo tiol o un grupo vinilsulfona.
10. Un método para determinar la secuencia de nucleótidos de un complejo que comprende:
(i) una entidad química que comprende uno o más andamios o uno o más bloques de construcción;
(ii) n número de etiquetas oligonucleotídicas que tienen n-1 enlaces, donde n es un número entero entre 1 y 10, y donde cada uno de dichos enlaces está entre dos etiquetas adyacentes y cada etiqueta codifica la identidad de al menos una de dichas una o más andamios o bloques de construcción; y
(iii) un dominio auricular que tiene un primer grupo funcional asociado operativamente con dicha entidad química y un segundo grupo funcional asociado operativamente con al menos una de dicho n número de etiquetas mediante un primer enlace,
en donde una polimerasa tiene una capacidad reducida para leer o translocar a través de al menos uno de dicho primer enlace y n-1 enlace; y en donde dicho primer enlace y/o n-1 enlaces comprenden un enlace químico, comprendiendo dicho método:
(a) proporcionar dicho complejo que comprende el enlace químico, en donde dicho enlace químico es un oligonucleótido de reticulación que atraviesa la unión entre dicho dominio auricular y al menos uno de dicho n número de etiquetas o entre dos etiquetas adyacentes y que se asocia operativamente con dicho dominio auricular y al menos uno de dicho n número de etiquetas o con dichas dos etiquetas adyacentes a través de uno o más grupos co-reactivos reversibles;
(b) ligar dichas etiquetas usando un proceso químico o un proceso enzimático;
(c) liberar dicho oligonucleótido reticulante para producir una plantilla;
(d) opcionalmente amplificar dicha plantilla mediante reacción en cadena de la polimerasa para producir una mezcla amplificada; y
(e) secuenciar dicha mezcla opcionalmente amplificada para determinar la secuencia de dicho complejo,
en donde dicho extremo 5’ y/o extremo 3' de dicho oligonucleótido reticulante comprende un grupo co-reactivo reversible; y en donde dicho grupo co-reactivo reversible es un grupo cianovinilcarbazol, un grupo cianovinilo, un grupo acrilamida, un grupo tiol o un grupo vinilsulfona.
11. El método de la reivindicación 10, en donde dicho proceso químico o proceso enzimático comprende 5'-fosforilación.
12. El método de cualquiera de las reivindicaciones 1 a 11, que comprende además reparar dicha plantilla antes de dicho paso de amplificación opcional o dicho paso de secuenciación,
preferiblemente en donde dicho paso de reparación comprende modificar al menos uno de dicho primer enlace y/o n-1 enlaces ser un enlace reparado capaz de ser leído o translocado por una polimerasa, más preferiblemente en donde dicha polimerasa puede leer o translocar al menos el 90% de dichos enlaces reparados.
13. El método de la reivindicación 12, que comprende además ligar dichas etiquetas usando un proceso químico o un proceso enzimático antes del paso (b), en donde dicho paso de reparación comprende proporcionar dicha plantilla con una enzima de reparación,
preferiblemente en donde dicha enzima de reparación es una fotoliasa, una glicosilasa, una endonucleasa, una endonucleasa Flap, una endonucleasa apurínica/apirimidínica (AP), una polimerasa de ribosa poli ADP o una metiltransferasa.
14. El método de una cualquiera de las reivindicaciones 1 a 13, en donde
(i) dicha entidad química está asociada operativamente a dicho dominio auricular mediante un espaciador bifuncional;
(ii) dicha entidad química está unida covalentemente a dicho dominio auricular;
(iii) dicho dominio auricular comprende un oligonucleótido seleccionado del grupo que consiste en un oligonucleótido bicatenario, un oligonucleótido monocatenario o un oligonucleótido en horquilla, preferiblemente en donde dicho dominio auricular comprende una región de unión a cebador;
(iv) dicho complejo comprende además una o más primeras etiquetas de identificación de biblioteca, etiquetas de uso y/o etiquetas de origen;
(v) dicho complejo comprende entre 2 y 20 etiquetas;
(vi) cada una de dichas etiquetas comprende de 5 a 75 nucleótidos;
(vii) cada una de dichas etiquetas dentro de un conjunto de etiquetas individual comprende aproximadamente la misma masa;
(viii) dicho complejo comprende ARN, ADN, ADN modificado y/o ARN modificado, preferiblemente en donde dicho ADN modificado o ARN modificado es PNA, LNA, GNA, TNA o una mezcla de los mismos dentro del mismo oligonucleótido; y/o
(ix) dicho complejo comprende además un cordal.
ES18158509T 2012-07-13 2013-07-12 Bibliotecas codificadas por ADN que tienen vínculos de oligonucleótidos codificadores que no se pueden leer por polimerasas Active ES2855137T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201261671406P 2012-07-13 2012-07-13

Publications (1)

Publication Number Publication Date
ES2855137T3 true ES2855137T3 (es) 2021-09-23

Family

ID=49916571

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18158509T Active ES2855137T3 (es) 2012-07-13 2013-07-12 Bibliotecas codificadas por ADN que tienen vínculos de oligonucleótidos codificadores que no se pueden leer por polimerasas
ES13816635.0T Active ES2675167T3 (es) 2012-07-13 2013-07-12 Bibliotecas codificadas por ADN que tienen enlaces oligonucleotídicos codificantes no legibles por polimerasas

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES13816635.0T Active ES2675167T3 (es) 2012-07-13 2013-07-12 Bibliotecas codificadas por ADN que tienen enlaces oligonucleotídicos codificantes no legibles por polimerasas

Country Status (16)

Country Link
US (1) US11674135B2 (es)
EP (3) EP3392338B1 (es)
JP (3) JP6426604B2 (es)
KR (2) KR102270554B1 (es)
CN (2) CN110257493A (es)
AU (3) AU2013289993B2 (es)
CA (1) CA2879018A1 (es)
DK (2) DK2872680T3 (es)
EA (2) EA034141B1 (es)
ES (2) ES2855137T3 (es)
IL (1) IL236633B (es)
MX (1) MX2015000598A (es)
NZ (3) NZ739931A (es)
SG (2) SG11201500250VA (es)
WO (1) WO2014012010A1 (es)
ZA (2) ZA201500328B (es)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2638324T3 (es) 2009-02-13 2017-10-19 X-Chem, Inc. Métodos de creación y examen de bibliotecas codificadas por ADN
AU2012304387B2 (en) 2011-09-07 2017-03-16 X-Chem, Inc. Methods for tagging DNA-encoded libraries
NZ739931A (en) 2012-07-13 2019-08-30 X Chem Inc Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
GB201322692D0 (en) 2013-12-20 2014-02-05 Philochem Ag Production of encoded chemical libraries
CA2956925C (en) 2014-08-01 2024-02-13 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
MA41298A (fr) * 2014-12-30 2017-11-07 X Chem Inc Procédés de marquage de banques codées par de l'adn
CA2976902A1 (en) 2015-02-17 2016-08-25 Dovetail Genomics Llc Nucleic acid sequence assembly
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
WO2016165621A1 (zh) * 2015-04-14 2016-10-20 成都先导药物开发有限公司 一种固相合成dna编码化合物库的方法
KR20180096586A (ko) 2015-10-19 2018-08-29 더브테일 제노믹스 엘엘씨 게놈 어셈블리, 하플로타입 페이징 및 표적 독립적 핵산 검출을 위한 방법
WO2017100343A1 (en) 2015-12-07 2017-06-15 Arc Bio, Llc Methods and compositions for the making and using of guide nucleic acids
SG11201807117WA (en) 2016-02-23 2018-09-27 Dovetail Genomics Llc Generation of phased read-sets for genome assembly and haplotype phasing
EP3954771A1 (en) 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
CN115820806A (zh) 2016-06-16 2023-03-21 哈斯达克科学公司 寡核苷酸指导和记录的编码探针分子的组合合成
US11198903B2 (en) * 2016-09-15 2021-12-14 Roche Molecular Systems, Inc. Methods for performing multiplexed real-time PCR
CN107130300A (zh) * 2016-10-08 2017-09-05 深圳劲宇生物科技有限公司 一种dna编码分子库的合成方法及dna模板
AU2018256367A1 (en) * 2017-04-18 2019-11-28 X-Chem, Inc. Methods for identifying compounds
EP3619340A4 (en) 2017-05-02 2021-01-20 Haystack Sciences Corporation MOLECULES FOR THE VERIFICATION OF OLIGONUCLEOTIDE DIRECTED COMBINATIONAL SYNTHESIS AND METHOD OF MANUFACTURING AND USING THEREOF
JP7282692B2 (ja) * 2017-06-07 2023-05-29 アーク バイオ, エルエルシー ガイド核酸の作製および使用
WO2019060856A1 (en) * 2017-09-25 2019-03-28 Haystack Sciences Corporation MULTINOMIAL CODING FOR COMBINATION CHEMISTRY DIRECTED BY OLIGONUCLEOTIDES
JP7264206B2 (ja) * 2020-09-30 2023-04-25 株式会社三洋物産 遊技機
WO2024020395A2 (en) 2022-07-19 2024-01-25 Digital Biology Inc. Barcode diffusion-based spatial omics

Family Cites Families (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5292967A (en) 1976-01-30 1977-08-04 Hanshin Diesel Works Separated matter accummulation takeout device for centrifugal separators
DE3788914T2 (de) 1986-09-08 1994-08-25 Ajinomoto Kk Verbindungen zur Spaltung von RNS an eine spezifische Position, Oligomere, verwendet bei der Herstellung dieser Verbindungen und Ausgangsprodukte für die Synthese dieser Oligomere.
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US5025388A (en) 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US6005087A (en) 1995-06-06 1999-12-21 Isis Pharmaceuticals, Inc. 2'-modified oligonucleotides
US5670633A (en) 1990-01-11 1997-09-23 Isis Pharmaceuticals, Inc. Sugar modified oligonucleotides that detect and modulate gene expression
US5723289A (en) 1990-06-11 1998-03-03 Nexstar Pharmaceuticals, Inc. Parallel selex
AU669489B2 (en) 1991-09-18 1996-06-13 Affymax Technologies N.V. Method of synthesizing diverse collections of oligomers
US5639603A (en) 1991-09-18 1997-06-17 Affymax Technologies N.V. Synthesizing and screening molecular diversity
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
US6503759B1 (en) 1992-10-01 2003-01-07 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
PT665897E (pt) 1992-10-01 2003-11-28 Trustees Of Columbia U In The Bibliotecas quimicas combinatorias complexas codificadas com etiquetas
US5807683A (en) 1992-11-19 1998-09-15 Combichem, Inc. Combinatorial libraries and methods for their use
ES2204913T3 (es) 1993-04-12 2004-05-01 Northwestern University Metodo para formacion de oligonucleotidos.
US5681943A (en) 1993-04-12 1997-10-28 Northwestern University Method for covalently linking adjacent oligonucleotides
US5840485A (en) 1993-05-27 1998-11-24 Selectide Corporation Topologically segregated, encoded solid phase libraries
DK0705279T3 (da) 1993-05-27 2003-06-10 Selectide Corp Topologisk adskilte, kodende fastfase-biblioteker
JPH09500378A (ja) 1993-07-02 1997-01-14 リンクス セラピューティクス,インコーポレイティド 枝分れされそして複雑に結合された高分子構造体の集中的合成
US5571903A (en) 1993-07-09 1996-11-05 Lynx Therapeutics, Inc. Auto-ligating oligonucleotide compounds
US6087186A (en) 1993-07-16 2000-07-11 Irori Methods and apparatus for synthesizing labeled combinatorial chemistry libraries
GB9315847D0 (en) 1993-07-30 1993-09-15 Isis Innovation Tag reagent and assay method
AU7390994A (en) 1993-08-25 1995-03-21 Symbicom Aktiebolag Molecular modelling and drug design
US5658782A (en) 1993-10-20 1997-08-19 State Of Oregon, Acting By And Through The Oregon State Board Of Higher Education On Behalf Of The Oregon Health Sciences University A Non-Profit Organization Amino acid transporters and uses
JPH09508353A (ja) 1993-11-02 1997-08-26 アフィマックス テクノロジーズ ナムローゼ フェンノートシャップ 分子多様性の合成及びスクリーニング
US6117976A (en) 1993-11-04 2000-09-12 Medical Research Council Manufacture and use of polypeptides tagged using binding molecules
AU692212B2 (en) 1993-12-17 1998-06-04 Roger S. Cubicciotti Nucleotide-directed assembly of bimolecular and multimolecular drugs and devices
US6936477B2 (en) 1994-04-13 2005-08-30 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
JPH08268A (ja) 1994-06-16 1996-01-09 Koichi Nishigaki 連結した2本鎖dnaの製造方法
US5525734A (en) 1994-06-22 1996-06-11 Affymax Technologies N.V. Methods for synthesizing diverse collections of pyrrolidine compounds
US5525735A (en) 1994-06-22 1996-06-11 Affymax Technologies Nv Methods for synthesizing diverse collections of pyrrolidine compounds
CA2195321A1 (en) 1994-07-26 1996-02-08 Kim Janda Soluble combinatorial libraries
US6406848B1 (en) 1997-05-23 2002-06-18 Lynx Therapeutics, Inc. Planar arrays of microparticle-bound polynucleotides
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
USRE43097E1 (en) 1994-10-13 2012-01-10 Illumina, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US6654505B2 (en) 1994-10-13 2003-11-25 Lynx Therapeutics, Inc. System and apparatus for sequential processing of analytes
US5780613A (en) 1995-08-01 1998-07-14 Northwestern University Covalent lock for self-assembled oligonucleotide constructs
DE19646372C1 (de) 1995-11-11 1997-06-19 Evotec Biosystems Gmbh Genotyp und Phänotyp koppelnde Verbindung
US5763175A (en) 1995-11-17 1998-06-09 Lynx Therapeutics, Inc. Simultaneous sequencing of tagged polynucleotides
US5962228A (en) 1995-11-17 1999-10-05 Lynx Therapeutics, Inc. DNA extension and analysis with rolling primers
US5780231A (en) 1995-11-17 1998-07-14 Lynx Therapeutics, Inc. DNA extension and analysis with rolling primers
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US5846839A (en) 1995-12-22 1998-12-08 Glaxo Group Limited Methods for hard-tagging an encoded synthetic library
US6027890A (en) 1996-01-23 2000-02-22 Rapigene, Inc. Methods and compositions for enhancing sensitivity in the analysis of biological-based assays
DE19642751A1 (de) 1996-10-16 1998-04-23 Deutsches Krebsforsch Saccharid-Bibliothek
WO1998031700A1 (en) 1997-01-21 1998-07-23 The General Hospital Corporation Selection of proteins using rna-protein fusions
US5888737A (en) 1997-04-15 1999-03-30 Lynx Therapeutics, Inc. Adaptor-based sequence analysis
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US20020034732A1 (en) 1997-07-30 2002-03-21 Daniel J. Capon Compositions and methods for determining anti-viral drug susceptibility and resistance and anti-viral drug screening
AU740541B2 (en) 1997-08-29 2001-11-08 Selective Genetics, Inc. Methods using phage display for selecting internalizing ligands for gene delivery
US6607878B2 (en) 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
DE19928591A1 (de) 1998-06-22 1999-12-23 Roxana Havlina Herstellung von Polymeren aus nukleotidischen und/oder nicht-nukleotidischen Bausteinen auf enzymatischem Weg
US6846655B1 (en) 1998-06-29 2005-01-25 Phylos, Inc. Methods for generating highly diverse libraries
WO2000020639A1 (en) 1998-10-05 2000-04-13 Lynx Therapeutics, Inc. Enzymatic synthesis of oligonucleotide tags
AU1318400A (en) 1998-10-19 2000-05-08 Board Of Trustees Of The Leland Stanford Junior University Dna-templated combinatorial library chemistry
US5942609A (en) 1998-11-12 1999-08-24 The Porkin-Elmer Corporation Ligation assembly and detection of polynucleotides on solid-support
WO2000032823A1 (en) 1998-12-02 2000-06-08 Phylos, Inc. Dna-protein fusions and uses thereof
US6087112A (en) 1998-12-30 2000-07-11 Oligos Etc. Inc. Arrays with modified oligonucleotide and polynucleotide compositions
US7033753B1 (en) 1999-01-15 2006-04-25 University Of Rochester Compositions and methods for nonenzymatic ligation of oligonucleotides and detection of genetic polymorphisms
EP1208219A1 (en) 1999-04-08 2002-05-29 Pavel Sergeev Synthesis of biologically active compounds in cells
AU4589000A (en) 1999-04-30 2000-11-17 Cyclops Genome Sciences Limited Polynucleotides
US7270969B2 (en) 1999-05-05 2007-09-18 Phylogica Limited Methods of constructing and screening diverse expression libraries
EP1212452B1 (en) 1999-08-27 2013-07-17 Bristol-Myers Squibb Company Methods for encoding and sorting in vitro translated proteins
DE60034954D1 (de) 1999-09-14 2007-07-05 Xenoport Inc Substrate und screeningverfahren für transportproteine
CA2386540A1 (en) 1999-10-04 2001-04-12 University Of Medicine And Dentistry Of New Jersey Novel carbamates and ureas
US6844324B1 (en) 1999-11-12 2005-01-18 Massachusetts Institute Of Technology Modular peptide mediated intracellular delivery system and uses therefore
WO2001062772A2 (en) 2000-02-23 2001-08-30 Xenoport, Inc. Self-encoded combinatorial synthesis of compound multiplets
US6936467B2 (en) 2000-03-27 2005-08-30 University Of Delaware Targeted chromosomal genomic alterations with modified single stranded oligonucleotides
US7998673B2 (en) 2000-03-29 2011-08-16 Lgc Limited Hybridisation beacon and method of rapid sequence detection and discrimination
US6479262B1 (en) 2000-05-16 2002-11-12 Hercules, Incorporated Solid phase enzymatic assembly of polynucleotides
US6994963B1 (en) 2000-07-10 2006-02-07 Ambion, Inc. Methods for recombinatorial nucleic acid synthesis
US20020072887A1 (en) 2000-08-18 2002-06-13 Sandor Szalma Interaction fingerprint annotations from protein structure models
US6627748B1 (en) 2000-09-11 2003-09-30 The Trustees Of Columbia University In The City Of New York Combinatorial fluorescence energy transfer tags and their applications for multiplex genetic analyses
US7493385B2 (en) 2000-09-20 2009-02-17 Arkray, Inc. Client support system
KR20040036676A (ko) 2000-10-27 2004-04-30 리서치 디벨럽먼트 파운데이션 시그날링 압타머의 시험관내 선별 방법
JP2002315577A (ja) 2000-11-14 2002-10-29 Gencom Co 核酸ライブラリーの作製方法
US20030049616A1 (en) 2001-01-08 2003-03-13 Sydney Brenner Enzymatic synthesis of oligonucleotide tags
DK1423400T4 (da) 2001-03-19 2013-09-02 Harvard College Evolution af hidtil ukendt molekylfunktion
WO2002102820A1 (en) 2001-06-20 2002-12-27 Nuevolution A/S Nucleoside derivatives for library preparation
US20030143561A1 (en) 2001-06-20 2003-07-31 Nuevolution A/S Nucleoside derivatives for library preparation
US20060234231A1 (en) 2001-06-20 2006-10-19 Nuevolution A/S Microarrays displaying encoded molecules
CN1539014A (zh) 2001-06-20 2004-10-20 ŦΤ¬ɭ��˾ 模控分子和使用这种分子的方法
WO2003078445A2 (en) 2002-03-15 2003-09-25 Nuevolution A/S A building block forming a c=c double bond upon reaction
DE60231436D1 (de) 2002-03-08 2009-04-16 Eidgenoess Tech Hochschule Kodierte, selbst-assemblierende chemische bibliotheken (esachel)
US20050176948A1 (en) 2002-03-15 2005-08-11 Gouliaev Alex H. Building block capable of functional entity transfer to nucleophil
US20050221318A1 (en) 2002-03-15 2005-10-06 Gouliaev Alex H Building block forming a c-c bond upon reaction
AU2003218629A1 (en) 2002-03-15 2003-09-29 Nuevolution A/S A building block forming a c-c or a c-hetero atom bond uponreaction
IL163822A0 (en) 2002-03-15 2005-12-18 Nuevolution As An improved method for synthesising templated molecules
EP1520040A2 (en) 2002-06-20 2005-04-06 Nuevolution A/S Microarrays displaying encoded molecules
WO2004010101A2 (en) 2002-07-18 2004-01-29 The Board Of Trustees Of The Leland Stanford Junior University Detection of chemical ligation using fluorescence quenching leaving groups
WO2004009814A1 (en) 2002-07-23 2004-01-29 Nuevolution A/S Gene shuffling by template switching
US10730906B2 (en) 2002-08-01 2020-08-04 Nuevolutions A/S Multi-step synthesis of templated molecules
WO2004016767A2 (en) 2002-08-19 2004-02-26 The President And Fellows Of Harvard College Evolving new molecular function
WO2004024929A2 (en) 2002-09-12 2004-03-25 Nuevolution A/S Proximity-aided synthesis of templated molecules
PT1558744E (pt) 2002-10-30 2011-09-22 Nuevolution As Codificação enzimática
ATE450609T1 (de) 2002-12-19 2009-12-15 Nuevolution As Durch quasizufallsstrukturen und funktionen geführte synthesemethode
US20060269920A1 (en) 2003-02-21 2006-11-30 Nuevolution A/S Method for obtaining structural information about an encoded molecule
US20070026397A1 (en) 2003-02-21 2007-02-01 Nuevolution A/S Method for producing second-generation library
ATE424455T1 (de) 2003-03-20 2009-03-15 Nuevolution As Ligationsvermittelnde codierung von kleinen molekülen
EP1652123A2 (en) 2003-07-03 2006-05-03 Biogen Idec MA Inc. STRUCTURAL INTERACTION FINGERPRINT (SIFt)
CN1836050A (zh) 2003-07-07 2006-09-20 单细胞系统公司 发夹标记的探针及其使用方法
EP1533385A1 (en) 2003-09-05 2005-05-25 Nuevolution A/S Templated compounds for generation of encoded molecules and directional methods using such compounds
US7365179B2 (en) 2003-09-09 2008-04-29 Compass Genetics, Llc Multiplexed analytical platform
ATE447626T1 (de) 2003-09-18 2009-11-15 Nuevolution As Methode zur gewinnung struktureller informationen kodierter moleküle und zur selektion von verbindungen
WO2005050224A2 (en) 2003-11-13 2005-06-02 Epitome Biosystems Inc. Small molecule and peptide arrays and uses thereof
US7972994B2 (en) 2003-12-17 2011-07-05 Glaxosmithkline Llc Methods for synthesis of encoded libraries
CA2549386C (en) * 2003-12-17 2014-07-29 Praecis Pharmaceuticals, Inc. Methods for synthesis of encoded libraries
DE602005018166D1 (de) 2004-02-12 2010-01-21 Population Genetics Technologi Genetische analyse mittels sequenzspezifischem sortieren
US20090239211A1 (en) 2004-02-17 2009-09-24 Nuevolution A/S Method For Enrichment Involving Elimination By Mismatch Hybridisation
EP1730277B1 (en) 2004-03-22 2009-10-28 Nuevolution A/S Ligational encoding using building block oligonucleotides
US7405287B2 (en) 2004-08-03 2008-07-29 Board Of Regents, The University Of Texas System Method of treating a cancer
US7745614B2 (en) 2004-09-03 2010-06-29 The Board Of Trustees Of The Leland Stanford Junior University Universal linker compositions for the release or transfer of chemical agents from a polynucleotide
WO2006047791A2 (en) 2004-10-27 2006-05-04 The Board Of Trustees Of The Leland Stanford Junior University Dna-templated combinatorial library device and method for use
KR101411361B1 (ko) 2004-11-08 2014-06-25 비퍼겐 에이피에스 구조적 핵산에 의해 가이드되는 화학적 합성
WO2006053571A2 (en) 2004-11-22 2006-05-26 Peter Birk Rasmussen Template directed split and mix systhesis of small molecule libraries
AU2005316503A1 (en) 2004-12-17 2006-06-22 Dynavax Technologies Corporation Methods and compositions for induction or promotion of immune tolerance
DE602006007819D1 (de) 2005-01-21 2009-08-27 Harvard College Verwendung freier reaktanten bei der nukleinsäuretemplatgesteuerten synthese
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7407757B2 (en) 2005-02-10 2008-08-05 Population Genetics Technologies Genetic analysis by sequence-specific sorting
WO2006099604A2 (en) 2005-03-16 2006-09-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
SI1910538T1 (sl) 2005-06-09 2011-09-30 Praecis Pharm Inc POSTOPKI ZA SINTEZO KODIRANIH KNJIĹľNIC
WO2006138560A2 (en) 2005-06-17 2006-12-28 President And Fellows Of Harvard College Nucleic acid-templated chemistry in organic solvents
WO2007014267A2 (en) 2005-07-26 2007-02-01 Oregon Health & Science University Nanoparticle probes for capture, sorting and placement of targets
WO2007016488A2 (en) 2005-07-29 2007-02-08 Ensemble Discovery Corporation Analysis of encoded chemical libraries
US20070212704A1 (en) * 2005-10-03 2007-09-13 Applera Corporation Compositions, methods, and kits for amplifying nucleic acids
EP2368868A1 (en) 2005-10-28 2011-09-28 Praecis Pharmaceuticals Inc. Methods for identifying compounds of interest using encoded libraries
DK3305900T3 (da) 2005-12-01 2021-10-25 Nuevolution As Enzymatic encoding methods for efficient synthesis of large libraries
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
EP2021470A1 (en) 2006-05-03 2009-02-11 Vipergen APS A method for preparing compounds by nucleic acid directed synthesis
US8153830B2 (en) 2006-10-26 2012-04-10 Sumitomo Chemical Company, Limited Production method of asymmetric copper complex crystal
CN101219219B (zh) 2007-01-10 2013-02-13 北京普罗吉生物科技发展有限公司 包含血管抑素或其片段的复合物、其制备方法及应用
AU2008315791B2 (en) 2007-10-22 2014-04-10 Lgc Limited Oligonucleotides and uses thereof
EP2216338B1 (en) 2007-11-19 2013-03-20 Japan Advanced Institute of Science and Technology Light-responsive artificial nucleotide having photo-crosslinking ability
WO2009077173A2 (en) * 2007-12-19 2009-06-25 Philochem Ag Dna-encoded chemical libraries
US20120107840A1 (en) 2008-04-09 2012-05-03 Sru Biosystems, Inc Methods for Label Free Testing of Cells
JP4814904B2 (ja) 2008-04-16 2011-11-16 国立大学法人北陸先端科学技術大学院大学 核酸類の配列選択的な精製方法
CA2723265C (en) 2008-05-02 2015-11-24 Epicentre Technologies Corporation Selective 5' ligation tagging of rna
TW201011006A (en) 2008-06-16 2010-03-16 Nuevolution As IAP binding compounds
ES2752025T3 (es) 2008-07-25 2020-04-02 Wagner Richard W Métodos de cribado de proteínas
AU2010209508C1 (en) 2009-01-30 2017-10-19 Oxford Nanopore Technologies Limited Hybridization linkers
US20120004137A1 (en) 2009-02-13 2012-01-05 X-Body, Inc. Identification of nucleic acid delivery vehicles using dna display
ES2638324T3 (es) * 2009-02-13 2017-10-19 X-Chem, Inc. Métodos de creación y examen de bibliotecas codificadas por ADN
CN102317475B (zh) 2009-02-16 2014-07-16 阿霹震中科技公司 单链dna的不依赖模板的连接
EP2464755B1 (en) 2009-11-05 2016-03-09 Epicentre Technologies Corporation Methods and kits for 3'-end-tagging of rna
DE102009058769A1 (de) 2009-12-16 2011-06-22 MagForce Nanotechnologies AG, 10589 Temperaturabhängige Aktivierung von katalytischen Nukleinsäuren zur kontrollierten Wirkstofffreisetzung
US20110237535A1 (en) 2010-03-26 2011-09-29 Sru Biosystems, Inc. Use of Induced Pluripotent Cells and other Cells for Screening Compound Libraries
LT2558577T (lt) * 2010-04-16 2019-03-12 Nuevolution A/S Bifunkciniai kompleksai ir tokių kompleksų gamybos ir naudojimo būdai
EP2686349B1 (en) 2011-03-15 2020-12-09 X-Body, Inc. Antibody screening methods
AU2012304387B2 (en) * 2011-09-07 2017-03-16 X-Chem, Inc. Methods for tagging DNA-encoded libraries
NZ739931A (en) * 2012-07-13 2019-08-30 X Chem Inc Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
CN104520456A (zh) * 2012-08-10 2015-04-15 新日铁住金株式会社 钛合金材料
GB201322692D0 (en) * 2013-12-20 2014-02-05 Philochem Ag Production of encoded chemical libraries

Also Published As

Publication number Publication date
SG11201500250VA (en) 2015-03-30
AU2018202665B2 (en) 2020-06-25
EA201590195A1 (ru) 2015-05-29
JP2019030324A (ja) 2019-02-28
NZ744078A (en) 2020-02-28
ZA201500328B (en) 2019-06-26
KR102270554B1 (ko) 2021-06-28
EP3392338A1 (en) 2018-10-24
AU2020239663A1 (en) 2020-10-15
EA201992285A1 (ru) 2020-05-31
EP2872680A4 (en) 2016-01-27
EP2872680B1 (en) 2018-04-04
AU2013289993A1 (en) 2015-02-26
AU2013289993B2 (en) 2018-05-10
KR102146721B1 (ko) 2020-08-21
IL236633B (en) 2022-07-01
US11674135B2 (en) 2023-06-13
JP2015529449A (ja) 2015-10-08
KR20150030260A (ko) 2015-03-19
DK3392338T3 (da) 2021-02-01
CN104685115A (zh) 2015-06-03
EP3851529A1 (en) 2021-07-21
JP2021167326A (ja) 2021-10-21
EP2872680A1 (en) 2015-05-20
NZ739931A (en) 2019-08-30
AU2018202665A1 (en) 2018-05-10
EA034141B1 (ru) 2020-01-09
SG10201907347YA (en) 2019-09-27
DK2872680T3 (en) 2018-07-09
WO2014012010A1 (en) 2014-01-16
IL236633A0 (en) 2015-02-26
KR20200100206A (ko) 2020-08-25
CN110257493A (zh) 2019-09-20
JP6426604B2 (ja) 2018-11-21
CA2879018A1 (en) 2014-01-16
ZA201900255B (en) 2022-04-28
ES2675167T3 (es) 2018-07-09
NZ703766A (en) 2018-03-23
JP6906492B2 (ja) 2021-07-21
EP3392338B1 (en) 2020-12-09
US20150211002A1 (en) 2015-07-30
MX2015000598A (es) 2016-01-12

Similar Documents

Publication Publication Date Title
ES2855137T3 (es) Bibliotecas codificadas por ADN que tienen vínculos de oligonucleótidos codificadores que no se pueden leer por polimerasas
ES2675111T3 (es) Métodos para etiquetar bibliotecas con codificación de ADN
AU2015374309B2 (en) Methods for tagging DNA-encoded libraries
NZ733158A (en) Methods for tagging dna-encoded libraries
TW202212568A (zh) 可切斷之dna編碼化文庫
NZ722289B2 (en) Methods for tagging dna-encoded libraries