ES2542015T3 - Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias - Google Patents

Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias Download PDF

Info

Publication number
ES2542015T3
ES2542015T3 ES14170383.5T ES14170383T ES2542015T3 ES 2542015 T3 ES2542015 T3 ES 2542015T3 ES 14170383 T ES14170383 T ES 14170383T ES 2542015 T3 ES2542015 T3 ES 2542015T3
Authority
ES
Spain
Prior art keywords
sequence
crispr
target
polynucleotide
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14170383.5T
Other languages
English (en)
Inventor
Le Cong
Feng Zhang
Patrick Hsu
Fei RAN
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=49920627&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2542015(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Harvard College, Massachusetts Institute of Technology, Broad Institute Inc filed Critical Harvard College
Application granted granted Critical
Publication of ES2542015T3 publication Critical patent/ES2542015T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/01Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/50Vectors comprising as targeting moiety peptide derived from defined protein
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Abstract

Un sistema vector asociado a CRISPR - Repeticiones Palindrómicas Cortas Agrupadas y Regularmente Interespaciadas (CRISPR) (Cas) (CRISPR-Cas) que no se encuentran en la naturaleza, de ingeniería, que comprende uno o más vectores que comprenden: a) un primer elemento regulador unido de manera operable a una o más secuencias de nucleótidos que codifican una o más secuencias de polinucleótidos del sistema CRISPR-Cas que comprende una secuencia guía, un ARNtracr y una secuencia de emparejamiento tracr, en la que la secuencia guía se hibrida con una o más secuencias objetivo en los sitios de los polinucleótidos en una célula eucariota, b) un segundo elemento regulador unido de manera operable a secuencia de nucleótidos que codifica una proteína Cas9 de Tipo II, en el que los componentes (a) y (b) están situados en los mismos vectores o diferentes vectores del sistema, en el que el sistema CRISPR-Cas comprende dos o más señales de localización nuclear (las NLS) expresadas con la secuencia de nucleótidos que codifica la proteína Cas9, según lo cual una o más secuencias guía fijan como objetivo uno o más sitios de polinucleótidos en una célula eucariota y la proteína Cas9 escinde uno o más sitios de polinucleótidos, según lo cual se modifica la secuencia de uno o más sitios de polinucleótidos.

Description

Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias.
Campo de la invención
La presente descripción se refiere en general a sistemas, métodos y composiciones usados para el control de la expresión de genes que implica fijar como objetivo una secuencia, tal como perturbación del genoma o edición de genes, que pueden usar sistemas vector relacionados con Repeticiones Palindrómicas Cortas Agrupadas y Regularmente Interespaciadas (CRISPR, por sus siglas en inglés) y componentes de los mismos
Informe en cuanto a investigación patrocinada federalmente
Esta invención se realizó con soporte del gobierno otorgado por el Pioneer Award del NIH, Institutos Nacionales de Salud, OP1 MH100706. El gobiemo tiene ciertos derechos en la invención.
Antecedentes de la invención
Los recientes avances en las técnicas de secuenciación del genoma y métodos de análisis han acelerado significativamente la capacidad para catalogar y cartografiar factores genéticos asociados a un diverso intervalo de funciones biológicas y enfermedades. Se requieren tecnologias precisas para fijar como objetivo genoma para permitir la ingeniería inversa sistemática de variaciones genéticas causales permitiendo la perturbación selectiva de elementos genéticos individuales, asi como avanzar las aplicaciones de la biología sintética, biotecnológicas y médicas. Aunque están disponibles técnicas de edición de genoma tales como dedos de cinc diseñadores, efectores del tipo activador de la transcripción (los TALE, por sus siglas en inglés) o meganucleasas de migración para producir perturbaciones del genoma fijado como objetivo, sigue existiendo la necesidad de nuevas tecnologías de ingeniería del genoma que tengan un precio asequible, fáciles de montar, escalables y susceptibles de fijar como objetivo múltiples posiciones dentro del genoma eucariota.
Sumario de la invención
Existe una necesidad apremiante de sistemas y técnicas altemativos y robustos para fijar como objetivo secuencias con una amplia serie de aplicaciones. Esta invención estudia esta necesidad y proporciona ventajas relacionadas. El CRISPRlCas o el sistema CRISPR-Cas (ambos términos se usan de manera intercambiable por toda esta solicitud) no requiere la generaciÓfl de proteínas personalizadas para secuencias específicas fijadas como objetivo sino más bien se puede programar una enzima Cas única mediante una molécula de ARN corta para reconocer un objetivo de AON especifico, en otras palabras la enzima Cas se puede reclutar para un objetivo de AON específico usando dicha molécula de ARN corta. Añadir el sistema CRISPR-Cas al repertorio de técnicas de secuenciación del genoma y métodos de análisis puede simplificar de manera significativa la metodología y acelerar la capacidad para catalogar y cartografiar factores genéticos asociados a un diverso intervalo de funciones biológicas y enfermedades. Para utilizar el sistema CRISPR-Cas de manera eficaz para editar genoma sin efectos pe~udiciales, es crítico comprender aspectos de ingeniería y optimización de estas herramientas de ingeniería del genoma, que son aspectos de la invención reivindicada
En un aspecto, la descripción proporciona un sistema vector que comprende uno o más vectores. En algunas realizaciones, el sistema comprende: (a) un primer elemento regulador ligado de manera operable a una secuencia de emparejado tracr y uno o más sitios de inserción para insertar una o más secuencias guía aguas arriba de la secuencia de emparejado tracr, en la que cuando se expresa, la secuencia guía se dirige a unión específica de secuencias de un complejo CRISPR a una secuencia fijada como objetivo en una célula, por ejemplo, célula eucariota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1 ) la secuencia guía que se hibrida a la secuencia fijada como objetivo y (2) la secuencia de emparejado tracr que se hibrida a la secuencia tracr y (b) un segundo elemento regulador ligado de manera operable a una secuencia codificadora de enzimas que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear; en el que los componentes
(a)
y (b) están situados en los mismos vectores o diferentes del sistema. En algunas realizaciones, el componente
(a)
comprende además la secuencia tracr aguas abajo de la secuencia de emparejamiento tracr bajo el control del primer elemento regulador. En algunas realizaciones, el componente (a) comprende además dos o más secuencias guía ligadas de manera operable al primer elemento regulador, en el que cuando se expresan, cada una de las dos
o más secuencias guía dirige unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo diferente en una célula euca riota. En algunas realizaciones, el sistema comprende la secuencia tracr bajo el control de un tercer elemento regulador, tal como un activador de polimerasa 111. En algunas rea lizaciones, la secuencia tracr presenta al menos 50%, 60%, 70%, 80%, 90%, 95% o 99% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejado tracr cuando se alinean de manera óptima. En algunas realizaciones, el complejo CRISPR comprende una o más secuencias de localización nuctear de suficiente fortaleza para conducir la acumulación de dicho complejo CRISPR en una cantidad detectable en el núcleo de una célula eucariota. Sin desear estar ligados por la teoría, se cree que una secuencia de localización nuclear no es necesariamente para actividad del complejo CRISPR en eucariotas, sino que incluyendo tales secuencias se mejora la actividad del sistema, especialmente en cuanto a moléculas de ácido nucleico fijadas como objetivo en el núcleo. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo 11. En algunas realizaciones, la enzima
CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 S. pneumoniae, S. pyogenes o S thermophilus y puede incluir Cas9 mutada derivada de estos organismos. La enzima puede ser un homólogo u ortólogo de Cas9. En algunas realizaciones, la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o dos hebras en la posición de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR carece de actividad de escisión de la cadena de ADN. En algunas realizaciones, el primer elemento regulador es un activador de la polimerasa 111. En algunas realizaciones, el segundo elemento regulador es un activador de la polimerasa 11. En algunas realizaciones, la secuencia guía tiene al menos 15, 16, 17, 18, 19, 20, 25 nucleótidos o entre 10-30 o entre 15-25 o entre 15-20 nucleótidos de longitud. En general y por toda esta memoria descriptiva, el término ~vector" se refiere a una molécula de ácido nucleico capaz de transportar otro ácido nucleico al que se ha unido. Los vectores incluyen, pero no se limitan a, moléculas de ácido nucleico que son monocatenarias, bicatenarias o parcialmente bicatenarias; moléculas de ácido nucleico que comprenden uno o más extremos libres, ningún extremo libre (por ejemplo, circular); moléculas de ácido nucieico que comprenden ADN, ARN o ambos y otras variedades de polinucleótidos conocidos en la técnica. Un tipo de vector es un ~plásmido~, que se refiere a un bucle de ADN de doble cadena circular en que se pueden insertar segmentos de ADN adicionales, tal como por técnicas de clonación molecular clásicas. Otro tipo de vector es un vector virico, en el que están presentes secuencias de ADN o ARN derivadas viricamente en el vector para empaquetamiento en un virus (por ejemplo, retrovirus, retrovirus de replicación defectuosa, adenovirus, adenovirus de replicación defectuosa y virus adenoasociados). Los vectores viricos también incluyen polinucleótidos soportados por un virus para transinfección a una célula huésped. Algunos vectores son capaces de replicación autónoma en una célula huésped en que se introducen (por ejemplo, vectores bacterianos con un origen bacteriano de rep licación y vectores de mamifero episomales). otros vectores (por ejemplo, vectores de mamiferos no episomales) se integran en el genoma de una célula huésped en la introducción en la célula huésped y se replican de ese modo junto con el genoma huésped. Por otra parte, algunos vectores son capaces de dirigir la expresión de los genes a los que están unidos de manera operativa. Dichos vectores se refieren en la presente memoria como "vectores de expresión" Los vectores de expresión comunes de utilidad en técnicas de ADN recombinante están con frecuencia en la forma de plásmidos
Los vectores de expresión recombinantes pueden comprender un ácido nucleico en una forma adecuada para expresión del ácido nucleico en una célula huésped, que significa que los vectores de expresión recombinantes incluyen uno o más elementos reguladores, que se pueden seleccionar sobre la base de las células huésped que se tienen que usar para expresiÓfl, que están unidos de manera operativa a la secuencia de ácidos nucleicos que se tiene que expresar. En un vector de expresión recombinante, "unido de manera operable" significa que la secuencia de nucleótidos de interés está unida al elemento o a los elementos reguladores de una manera que permite la expresión de la secuencia de nucleótidos (por ejemplo, en un sistema de transcripciónftraducción in vitro o en una célula huésped cuando el vector se introduce en la célula huésped).
Se pretende que el término "elemento regulador" incluya activadores, potenciadores, sitios de entrada de ribosomas internos (IRES, por sus siglas en inglés) y otros elementos de control de la expresión (por ejemplo, señales de terminación de la transcripción, tales como señales de poliadenilación y secuencias poli-U). Tales elementos reguladores se describen, por ejemplo, en Goeddel, GENE EXPRESS ION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1 .990). Los elementos reguladOfes incluyen aquellos que dirigen la expresión constitutiva de una secuencia de nucleótidos en muchos tipos de célula huésped y aquellos que dirigen la expresión de la secuencia de nucleótidos sólo en ciertas células huésped (por ejemplo, secuencias reguladoras específicas del tejido). Un activador específico del tejido puede dirigir la expresión principalmente en un tejido deseado de interés, tal como músculo, neurona, hueso, piel, sangre, órganos específicos (por ejemplo, hígado, páncreas) o tipos de células particulares (por ej., linfocitos). Los elementos reguladores también pueden dirigir la expresión de una manera dependiente temporal, tal como de una manera dependiente del ciclo celular o dependiente de la fase de desarrollo, que puede ser o no también específica del tejido o del tipo de célula. En algunas realizaciones, un vector comprende uno o más activadores de poi 111 (por ej., 1, 2, 3, 4, 5 o más activadores de poi 111), uno o más activadores de poi II (por ej., 1, 2, 3, 4, 5 o más activadores de poi 11), uno o más activadores de poli (por ej., 1,2,3, 4, 5 o más activadores de poli) o combinaciones de los mismos. Ejemplos de activadores de poi 111 incluyen, pero no se limitan a, activadores U6 y H1 Ejemplos de activadores de poi 11 incluyen, pero no se limitan a, el activador L TR del virus del sarcoma de Rous (RSV, por sus siglas en inglés) retrovírico (opciooalmente con el potenciador de RSV), el activador de citomegalovirus (CMV) (opcionalmente con el estimulador de CMV) [véase, por ej., Boshart et al, Cell, 41: 521-530 (1.985)], el activador de SV40, el activador de dihidrofolato reduclasa, el activador de ~-aclina, el aclivador de fosfoglicerol kinasa (PGK, por sus siglas en inglés) y el activador de EF1a También están incluidos en el término "elemento regulador~ los elementos estimuladores, tales como WPRE; estimuladores de CMV; el segmento R-U5' en LTR de HTLV-1 (Mol. Cell. BioL, Vol. 8 (1), pág. 466-472, 1.988); estimulador de SV40 y la secuencia del intrón entre los exones 2 y 3 de ~-globina de conejo (Proc. NatL Acad. Sei. USA., Vol. 78 (3), pág. 1.527-31, 1.981). Se apreciará por los expertos en la materia que el diseño del vector de expresión puede depender de factores tales como la elección de la célula huésped que se tiene que transformar, el nivel de expresión deseado, etc. Se puede introducir un vector en células huésped para producir de ese modo transcritos, proteínas o péptidos, incluyendo proteínas o péptidos de fusión, codificados por ácidos nucleicos como se describe en la presente memoria (por ejemplo, transcritos de repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR), proteínas, enzimas, formas mutantes de los mismos, proteínas de fusión de los mismos, elc.).
Vectores ventajosos incluyen lentivirus y virus adenoasociados y también se pueden seleccionar tipos de tales vectores para fijar como objetivo tipos particulares de células
En un aspecto, la descripciórJ proporciona un vector que comprende un elemento regulador unido de manera operable a una secuencia codificadora de enzimas que codifica una enzima CRISPR que comprende una o más secuencias de localización nucleares. En algunas realizaciones, dicho elemento regulador conduce la transcripción de la enzima CRISPR en una célu la eucariota de manera que dicha enzima CRISPR se acumu la en una cantidad detectable en el núcleo de la célula eucariota. En algunas realizaciones, el elemento regulador es un activador de la polimerasa 11. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo 11. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 de S. pneumoniae, S. pyogenes o S. thermophilus y puede incluir Cas9 mutada procedente de estos organismos. En algunas realizaciones, la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o dos hebras en la posición de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR carece de actividad de escisión de la cadena de ADN
En un aspecto, la descripción proporciona una enzima CRISPR que comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo 11. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 de S. pneumoniae, S. pyogenes o S. thermophilus y puede incluir Cas9 mutada procedente de estos organismos. La enzima pueden ser un homólogo u ortólogo de Cas9. En algunas realizaciones, la enzima CRISPR carece de capacidad para escindir una o más hebras de una secuencia objetivo a la que se une.
En un aspecto, la descripción proporciona una célula eucariota huésped que comprende: (a) un primer elemento regulador unido de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserciórJ para insertar una o más secuencias guía aguas arriba de la secuencia de emparejamiento tracr, en la que cuando se expresa, la secuencia guía dirige la unión especifica de la secuencia de un complejo CRISPR a una secuencia objetivo en una célula euca riota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia traer y/o (b) un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica a dicha enzima CRISPR que comprende una secuencia de 10calizaciórJ nuclear. En algunas realizaciones, la célula huésped comprende los componentes (a) y (b). En algunas realizaciones, el componente (a), el componente (b) o los componentes (a) y (b) están integrados de manera estable en un genoma de la célula eucariota huésped. En algunas realizaciones, el componente (a) comprende además la secuencia traer aguas abajo de la secuencia de emparejamiento Iracr bajo el conlrol del primer elemenlo regulador. En algunas realizaciones, el componente (a) comprende además dos o más secuencias guía unidas de manera operable al primer elemento regulador, en el que cuando se expresan, cada una de las dos o más secuencias guía dirige la uniórJ específica de la secuencia de un complejo CRISPR a una secuencia objetivo diferente en una célula eucariota. En algunas realizaciones, la célula huésped eucariota comprende además un tercer elemento regulador, tal como un activador de la polimerasa 111, unido de manera operable a una dicha secuencia tracr. En algunas realizaciones, la secuencia traer presenta al menos 50%, 60%, 70%, 80%, 90%, 95% o 99% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinean de manera óptima _ En algunas realizaciones, la enzima CRISPR comprende una o mas secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula euca riota. En algunas realizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo 11. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 de S. pneumoniae, s. pyogenes o
S. thermophilus y puede incluir Cas9 mutada procedente de estos organismos. La enzima puede ser un homólogo u ortólogo de Cas9. En algunas realizaciones, la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o dos hebras en la posición de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR carece de actividad de escisión de la hebra de ADN. En algunas realizaciones, el primer elemento regulador es un activador de la polimerasa 111. En algunas realizaciones, el segundo elemento regulador es un activador de la polimerasa 11. En algunas realizaciones, la secuencia guía es al menos 15, 16, 17, 18, 19, 20, 25 nucleótidos o entre 10-30 o entre 15-25 o entre 15-20 nucleótidos de longitud En un aspecto, la descripción proporciona un organismo eucariota no humano; preferiblemente un organismo eucariota multicelular, que comprende una célula eucariota huésped según cualquiera de las realizaciones descritas. En otros aspectos, la descripción proporciona un organismo eucariota; preferiblemente un organismo eucariota multicelular, que comprende una célula eucariota huésped según cualquiera de las realizaciones descritas. El organismo en algunas realizaciones de estos aspectos puede ser un animal; por ejemplo un mamífero. También, el organismo puede ser un artrópodo lal como un inseclo. El organismo puede también ser una planta. Además, el organismo puede ser un hongo
En un aspecto, la descripción proporciona un estuche que comprende uno o más de los componentes descritos en la presente memoria. En algunas realizaciones, el estuche comprende un sistema vector e instrucciones para usar el estuche. En algunas rea lizaciones, el sistema vector comprende: (a) un primer elemento regulador unido de manera operable a una secuencia de emparejamiento traer y uno o más sitios de inserción para insertar una o más secuencias guía aguas arriba de la secuencia de emparejamiento tracr, en el que cuando se expresan, la secuencia guía dirige la unión especifica de la secuencia de un complejo CRISPR a una secuencia fijada como objetivo en una célula eucariota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y/o (b) un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear. En algunas realizaciones, el estuche comprende los componentes (a) y (b) situados en los mismos vectores del sistema o diferentes. En algunas realizaciones, el componente (a) comprende además la secuencia tracr aguas abajo de la secuencia de emparejamiento tracr bajo el control del primer elemento regulador. En algunas realizaciones, el componente (a) comprende además dos o más secuencias guía unidas de manera operable al primer elemento regulador, en el que cuando se expresan, cada una de las dos o más secuencias guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo diferente en una célula eucariota. En algunas realizaciones, el sistema comprende además un tercer elemento regulador, ta l como un activador de la polimerasa 111 , un ido de manera operable a dicha secuencia tracr. En algunas realizaciones, la secuencia tracr presenta al menos 50%, 60%, 70%, 80%, 90%, 95% o 99% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento tracr cuando se alinea de manera óptima. En algunas realizaciones, la enzima CRISPR comprende una o más secuencias de localización nuclear de suficiente fortaleza para conducir la acumulación de dicha enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. En algunas rea lizaciones, la enzima CRISPR es una enzima del sistema CRISPR de tipo 11. En algunas realizaciones, la enzima CRISPR es una enzima Cas9. En algunas realizaciones, la enzima Cas9 es Cas9 de s. pneumoniae, s. pyogenes o s. thermophilus y puede incluir Cas9 mutada procedente de estos organismos. La enzima puede ser un homólogo u ortólogo de Cas9. En algunas realizaciones, la enzima CRISPR es codón-optimizada para expresión en una célula eucariota. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o dos hebras en la posición de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR carece de actividad de escisiÓfl de la hebra de AON. En algunas realizaciones, el primer elemento regulador es un activador de la polimerasa 111. En algunas rea lizaciones, el segundo elemento regulador es un activador de la polimerasa 11. En algunas realizaciones, la secuencia guía es al menos 15, 16, 17, 18, 19,20,25 nucle6tidos o entre 10-30 o entre 15-25 o entre 15-20 nudeótidos de longitud.
En un aspecto, la descripciÓfl proporciona un método para modificar un polinucle6tido objetivo en una célula eucariota. En algunas realizaciones, el método comprende permitir que se una un complejo CRISPR al polinucleótido objetivo para efectuar la escisión de dicho polinucle6tido objetivo modificando de ese modo el polinucJeótido objetivo, en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencía gula se transcribe a una secuencia fijada como objetivo dentro de dicho polinucleótido objetivo, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez se transcribe a una secuencia tracr. En algunas realizaciones, dicha escisión comprende escindir una o dos hebras en la posición de la secuencia objetivo mediante dicha enzima CRISPR. En algunas realizaciones, dicha escisión da como resultado la transcripción disminuida de un gen objetivo. En algunas realizaciones, el método comprende además reparar dicho polinudeótido objetivo escindido por recombinación homóloga con un polinucleótido exógeno de planti lla, en el que dicha reparación da como resultado una mutación que comprende una inserción, supresión o sustitución de uno o más nucleótidos de dicho polinucleótido objetivo. En algunas rea lizaciones, dicha mutación da como resultado uno o más cambios de aminoácido en una proteína expresada de un gen que comprende la secuencia objetivo. En algunas realizaciones, el método comprende además suministrar uno o más vectores a dicha célula eucariota, en el que uno o más vectOfes conducen la expresión de uno o más de: la enzima CRISPR, la secuencia guía ligada a la secuencia de emparejamiento tracr y la secuencia tracr. En algunas realizaciones, dichos vectores se suministran a la célula eucariota en un individuo. En algunas realizaciones, dicha modificación tiene lugar en dicha célula eucariota en un cultivo celular. En algunas realizaciones, el método comprende además aislar dicha célula eucariota de un individuo antes de dicha modificación. En algunas realizaciones, el método comprende además devolver dicha célula ylo células eucariotas procedentes de ahí a dicho individuo
En un aspecto, la descripciÓfl proporciona un método para modificar la expresión de un polinucleótido en una célula eucariota. En algunas realizaciones, el método comprende permitir que un complejo CRISPR se una al polinudeótido de manera que dicha unión dé como resultado la expresiÓfl aumentada o disminuida de dicho polinudeótido; en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía se transcribe a una secuencia fijada como objetivo dentro de dicho polinucleótido, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez se transcribe a una secuencia tracr. En algunas realizaciones, el método comprende además suministrar uno o más vectores a dichas células eucariotas, en el que uno o más vectores conducen la expresión de una o más de: la enzima CRISPR, la secuencia guía ligada a la secuencia de emparejamiento tracr y la secuencia tracr.
En un aspecto, la descripción proporciona un método para generar una célula eucariota modelo que comprende un gen mutado de la enfennedad. En algunas realizaciones, un gen de la enfermedad es cualquier gen asociado a un aumento del riesgo de tener o desarrollar una enfermedad. En algunas realizaciones, el método comprende (a) introducir uno o más vectores en una célula euca riota, en la que uno o mas vectores conducen la expresión de uno o más de: una enzima CRISPR, una secuencia guía ligada a una secuencia de emparejamiento tracr y una secuencia tracr y (b) permitir que un complejo CRISPR se una a un polinucleólido objetivo para efectuar la escisiÓfl del polinudeótido objetivo dentro de dicho gen de la enfermedad, en el que el complejo CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo dentro del polinudeótido objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr, generando de ese modo una célula eucariota modelo que comprende un gen mutado de la enfermedad. En algunas rea lizaciones, dicha escisión comprende escindir una o dos hebras en la posición de la secuencia objetivo mediante dicha enzima CRISPR. En algunas realizaciones, dicha escisión da como resultado la transcripción disminuida de un gen objetivo. En algunas realizaciones, el método comprende además reparar dicho polinucleótido objetivo escindido por recombinación homóloga con un polinucleótido exógeno de plantilla, en el que dicha reparación da como resultado una mutación que comprende una inserción, supresión o sustitución de uno o más nucleótidos de dicho polinucleótido objetivo. En algunas realizaciones, dicha mutación da como resultado uno o más cambios de aminoácido en una expresión de proteina de un gen que comprende la secuencia objetivo
En un aspecto, la descripción proporciona un método para desarrollar un agente biológicamente activo que module un caso de señalización celular asociado a un gen de la enfermedad. En algunas realizaciones, un gen de la enfermedad es cualquier gen asociado a un aumento del riesgo de tener o desarrollar una enfermedad. En algunas realizaciones, el método comprende (a) poner en contacto un compuesto de ensayo con una célula modelo de una cualquiera de las realizaciones descritas y (b) detectar un cambio en una lectura que sea indicativo de una reducción
o un aumento del caso de señalización celular asociado a dicha mutación en dicho gen de la enfermedad, desarrollando de ese modo dicho agente biológicamente activo que module dicho caso de señalización celular asociado a dicho gen de la enfermedad.
En un aspecto, la descripción proporciona un polinucleótido recombinante que comprende una secuencia guía aguas arriba de una secuencia de emparejamiento tracr, en el que la secuencia guía cuando se expresa dirige la unión específica de la secuencia de un complejo CRISPR a una correspondiente secuencia objetivo presente en una célula eucariota. En algunas realizaciones, la secuencia objetivo es una secuencia vírica presente en una célula eucariota. En algunas realizaciones, la secuencia objetivo es un proto-oncogén o un oncogén.
En un aspecto, la descripción proporciona un método para seleccionar una o más células procariotas por introducción de una o más mutaciones en un gen en una o más células procariotas, comprendiendo el método· introducir uno o más vectores en la célula o las células procariotas, en las que uno o más vectores conducen la expresión de uno o más de: una enzima CRISPR, una secuencia guía ligada a una secuencia de emparejamiento traer, una secuencia tracr y una plantilla de edición; en la que la plantilla de edición comprende una o más mutaciones que anula la escisión de la enzima CRISPR; permitir la recombinación homóloga de la plantilla de edición con el polinucleótido objetivo en la célula o las células que se tienen que seleccionar; permitir que un complejo CRISPR se una a un polinucleótido objetivo para efectuar la escisión del polinucleótido objetivo dentro de dicho gen, en el que el complejo CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo dentro del polinudeótido objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr, en la que la unión del complejo CRISPR al polinucleótido objetivo induce la muerte celular, permitiendo de ese modo que se seleccione una o más células procariotas en que se han introducido una o más mutaciones. En una realización preferida, la enzima CRISPR es Cas9. En otro aspecto de la invención, la célula que se tiene que seleccionar puede ser una célula eucariota. Los aspectos de la invención permiten la selección de células especificas sin que se requiera un marcador de selección o un procedimiento de dos etapas que pueda incluir un sistema de contraselección.
En algunos aspectos, la descripción proporciona una composición que no se encuentra en la naturaleza o de ingeníeria que comprende una secuencia de polinucleótidos de ARN quimérico (ARNqui) del sistema CRISPR-Cas, en el que la secuencia de polinucleótidos comprende: (a) una secuencia guía capaz de hibridizar una secuencia fijada como objetivo en una célula eucariota, (b) una secuencia de emparejamiento tracr y (c) una secuencia tracr en la que (a), (b) y (c) se disponen en una orientación 5' a 3', en la que cuando se transcribe, la secuencia de emparejamiento tracr se hibrida a la secuencia tracr y la secuencia guía dirige la unión específica de la secuencia de un complejo CRISPR a la secuencia objetivo, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1 ) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr o un sistema de enzima CRISPR, en el que el sistema está codificado por un sistema vector que comprende uno o más vectores que comprenden 1. un primer elemento regulador unido de manera operable a una secuencia de polinucleótidos de ARN quimérico (ARNqu i) del sistema CRISPR-Cas, en el que la secuencia de polinucleótidos comprende (a) una o más secuencias guia capaces de hibridar una o más secuencias objetivo en una célula eucariota, (b) una secuencia de emparejamiento tracr y (c) una o más secuencias tracr y 11. un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica una enzima CRISPR que comprende al menos una o más secuencias de localización nuclear, en la que (a),
(b) Y (c) se disponen en una orientación 5' a 3', en la que los componentes I y 11 se sitúan en los mismos vectores del sistema o diferentes, en la que cuando se transcribe, la secuencia de emparejamiento traer se hibrida a la secuencia tracr y la secuencia guia dirige la unión específica de la secuencia de un complejo CRISPR a la secuencia objetivo, en la que el complejo CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr o un sistema de enzima CRISPR multiplexado, en la que el sistema se codifica mediante un sistema vector que comprende uno o más vectores que comprenden l. un primer elemento regulador unido de manera operable a (a) una o más secuencias guía capaces de hibridar una secuencia objetivo en una célula y (b) al menos una o más secuencias de emparejamiento tracr, 11. un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que cod ifica una enzima CRISPR y 111. un tercer elemento regulador un ido de manera operable a una secuencia tracr , en la que los componentes 1, ti Y 111 se sitúan en los mismos vectores del sistema o diferentes, en la que cuando se transcribe, la secuencia de emparejamiento tracr se hibrida a la secuencia tracr y la secuencia guía dirige la unión especifica de la secuencia de un complejo CRISPR a la secuencia objetivo, en la que el complejo CRISPR comprende la enzima CRISPR complejada con (1) la secuencia guia que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y en la que en el sistema multiplexado se usan múltiples secuencias guía y una secuencia tracr única yen la que se modifica una o más de las secuencias guía, tracr y de emparejamiento tracr, para mejorar la estabilidad.
En aspectos de la invención, la modificación comprende una estructura secundaria de ingeniería. Por ejemplo, la modificación puede comprender una reducción en la región de hibridaciórJ entre la secuencia de emparejamiento tracr y la secuencia tracr. Por ejemplo, la modificación también puede comprender fusionar la secuencia de emparejamiento tracr y la secuencia tracr por un bucle artificial. La modificación puede comprender la secuencia tracr que tiene una longitud entre 40 y 120 pb. En las realizaciones, la secuencia tracr tiene entre 40 pb Y la longitud total de la secuencia tracr. En algunas realizaciones, la longitud de ARNtrac incluye al menos 1-67 nucle6tidos y en algunas realizaciones al menos 1-85 nucleótidos del ARNtrac de tipo natural. En algunas realizaciones, se pueden usar al menos los nucleótidos que corresponden a los nucleótidos 1.07 o 1-85 de ARNtrac de Cas9 de S. pyogenes de tipo natural. En el caso de que el sistema CRISPR use enzimas distintas de Cas9 o distintas de SpCas9, entonces pueden estar presentes los correspondientes nucleótidos en el ARNtrac de tipo natural relevante. En algunas realizaciones, la longitud de ARNtrac incluye no más de los nucleótidos 1-67 o 1-85 de ARNtrac de tipo natural. La modificación puede comprender optimización de la secuencia. En algunos aspectos, la optimización de secuencias puede comprender reducir la incidencia de secuencias poliT en la secuencia tracr y/o de emparejamiento tracr. La optimización de secuencias se puede combinar con la reducción en la región de hibridación entre la secuencia de emparejamiento tracr y la secuencia tracr; por ejemplo, una secuencia tracr de longitud reducida
En un aspecto, la descripción proporciona el sistema CRISPR-Cas o el sistema de enzima CRISPR en el que la modificación comprende la reducción de secuencias poliT en la secuencia tracr y/o de emparejamiento tracr. En algunos aspectos, una o más T presentes en una secuencia poli-T de la secuencia de tipo natural relevante (esto es, una extensión de más de 3, 4, 5, 6 o más bases T contiguas; en algunas realizaciones, un tramo de no más de 10, 9, 8, 7, 6 bases T contiguas) puede ser sustituido con un nucle6tido no T, por ej. una A, de manera que se rompa la cadena en tramos más pequeños de T teniendo cada tramo 4 o menos de 4 (por ejemplo 3 ó 2) T contiguos. Las bases distintas de A se pueden usar para sustituciórJ, por ejemplo C o G o nucleótidos que no se encuentran en la naturaleza o nucleótidos modificados. Si la cadena de T está implicada en la formación de una horquilla (o tallolazo), entonces es ventajoso que la base complementa ria para la base no T cambie para complementar el nucleótido no T. Por ejemplo, si la base no T es una A, entonces un complemento se puede cambiar a una T, por ejemplo para conselVar o ayudar a la conselVación de estructura secundaria. Por ejemplo, se puede modificar 5'-TTTTT para convertirlo en 5'-TTIAT y se puede cambiar eI5'-AAAAA complementario a 5'-ATAAA
En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende añadir una secuencia terminadora poliT. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende añadir una secuencia terminadora poliT en secuencias tracr y/o de emparejamiento tracr. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en la que la modificación comprende añadir una secuencia terminadora poliT en la secuencia guía. La secuencia terminadora poliT puede comprender 5 bases T contiguas o más de 5.
En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende modificar lazos y/u horquillas. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende proporcionar un mínimo de dos horquillas en la secuencia guía. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende proporcionar una horquilla formada por complementación entre la secuencia tracr y de emparejamiento tracr (repetición directa). En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificaciÓfl comprende proporcionar una o más horquillas adicionales en o hacia el extremo 3' de la secuencia ARNtracr. Por ejemplo, se puede formar una horquilla proporcionando secuencias autocomplementarias dentro de la secuencia de ARNtrac unida por un lazo de manera que se forma una horquilla en autoplegado. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende proporcionar horquillas adicionales añadidas a la 3' de la secuencia guia. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende extender el extremo 5' de la secuencia guía. En un aspecto, la descripciÓfl proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende proporcionar una o más horquillas en el extremo 5' de la secuencia guía. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende agregar la secuencia (S'-AGGACGAAGTCCTAA) al extremo 5' de la secuencia guia. otras secuencias adecuadas para formar horquillas serán conocidas para el experto y se pueden usar en ciertos aspectos de la invención. En algunos aspectos, se proporcionan al menos 2, 3, 4, 5 o más horquillas adicionales. En algunos aspectos se proporcionan no más de 10, 9, 8, 7, 6 horquillas adicionales. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende dos horquillas. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende tres horquillas. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende a lo sumo cinco horquillas
En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende proporcionar unión cruzada o proporcionar uno o más nucleótidos modificados en la secuencia de polinucleótidos. Los nucleótidos modificados yfo ligados cruzados se pueden proporcionar en cualquiera o en todas las secuencias tracr, de acoplamiento tracr y/o guía yfo en la secuencia codificadora de enzimas y/o en secuencias de vectores. Las modificaciones pueden incluir la inclusión de al menos un nucleótido que no se encuentra la naturaleza o un nucleótido modificado o análogos de los mismos. Se puede modificar nucleótidos modificados en el resto ribasa, fosfato y/o base. Los nucleótidos modificados pueden incluir 2'-Q-metilanálogos, 2'-desoxi-análogos o 2'-fluoro-análogos. La cadena principal de ácidos nucleicos se puede modificar, por ejemplo, se puede usar una cadena principal de fosforotioato. El uso de ácidos nucleicos bloqueados (LNA, por sus siglas en inglés) o ácidos nucleicos de puente (BNA, por sus siglas en inglés) también puede ser posible. Más ejemplos de bases modificadas incluyen, pero no se limitan a, 2-aminopurina, 5-bromo-uridina, pseudouridina, inosina, 7 -metilguallOsina
Se entenderá que cualquiera o todas las modificaciones anteriores se pueden proporcionar en aislamiento o en combinación en un sistema CRISPR-Cas o sistema de enzima CRISPR determinado. Dicho sistema puede incluir una, dos, tres, cuatro, cinco o más de dichas modificaciones.
En un aspecto, la invención proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la enzima CRISPR es una enzima del sistema CRISPR de tipo 11, por ej ., una enzima Cas9. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la enzima CRISPR está constituida por menos de mil aminoácidos, o menos de cuatro mil amillOácidos. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la enzima Cas9 es StGas9 o StlCas9 o la enzima Cas9 es una enzima Cas9 de un organismo seleccionado del grupo que consiste en el género Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Az.ospirillum, Sphaerochaeta, Lactobacillus, Eubacterium o Corynebacter. En un aspecto, la invención proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la enzima CRISPR es una nucleasa que dirige la escisión de ambas cadenas en la posición de la secuencia objetivo
En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que el primer elemento regulador es un activador de la polimerasa 111. En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que el segundo elemento regulador es un activador de la polimerasa 11.
En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la secuencia guía comprende al menos quince nucleótidos
En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la modificación comprende ARN de secuencia tracr optimizada yfo de secuencia guia optimizada y/o estructura coplegada de secuencia tracr y/o secuencia o secuencias de acoplamiento tracr yfo estructuras secundarias estabilizantes de secuencia tracr y/o secuencia tracr con una región reducida de emparejamiento de bases yfo elementos de ARN condensados de secuencia tracr y/o en el sistema multiplexado hay dos ARN que comprenden un trazador y que comprenden una pluralidad de guías o ARN que comprende una pluralidad de quimeras.
En aspectos, la arquitectura de ARN quimérico se optimiza además según los resultados de estudios de mutagénesis. En ARN quimérico con dos o más horquillas, las mutaciones en la repetición directa proximal para estabilizar la horquilla pueden dar como resultado ablación de la actividad del complejo CRISPR. Las mutaciones en la repetición directa distal para acortar o estabilizar la horquilla pueden no tener efecto sobre la actividad del complejo CRISPR. La aleatorización de secuencias en la región de la protuberancia entre las repeticiones proximal y distal puede reducir de manera significativa la actividad del complejo CRISPR. Los cambios en los pares de bases únicos o aleatorización de secuencias en la región ligadora entre horquillas pueden dar como resultado la pérdida completa de actividad del complejo CRISPR. La estabilización de horqu illas de las horquillas distales que siguen a la primera horquilla después de la secuencia guía puede dar como resultado el mantenimiento o la mejora de la actividad del complejo CRISPR. De acuerdo con esto, en realizaciones preferidas, la arquitectura de ARN quimérico se puede optimizar además por generación de un ARN quimérico más pequeño que puede ser beneficioso para opciones de suministro terapéutico y otros usos y esto se puede conseguir modificando la repetición directa distal de manera que se acorte o estabilice la horquilla. En realizaciones preferidas además, la arquitectura de ARN quimérico se puede optimizar además por estabilización de una o más horquillas distales. La estabilización de horquillas puede incluir modificar secuencias adecuadas para formar horqu illas. En algunos aspectos, se proporcionan al menos 2, 3, 4, 5 o más horquillas adicionales. En algunos aspectos, se proporcionan no más de 10, 9, 8, 7, 6 horquillas adicionales. En algunos aspectos, la estabilización puede ser unión cruzada u otras modificaciones. Las modificaciones pueden incluir la inclusión de al menos un nucleótido que no se encuentre en la naturaleza o un nucleótido modificado o análogos de los mismos. Los nucleótidos modificados se pueden modificar en el resto ribosa, fosfato y/o base. Los nucleótidos modificados pueden incluir 2'-O-metil-análogos, 2'-desoxi-análogos o 2'· fluoro-análogos. Se puede modificar la cadena principal de ácidos nucleicos, por ejemplo, se puede usar una cadena principal de fosforotioato. El uso de ácidos nucleicos bloqueados (LNA) o ácidos nucleicos de puente (BNA) también puede ser posible. Más ejemplos de bases modificadas incluyen, pero no se limitan a, 2-aminopurina, 5-bromo· uridina, pseudouridina, inosina, 7-metilguanosina
En un aspecto, la descripción proporciona el sistema CRISPR-Cas o sistema de enzima CRISPR en el que la enzima CRISPR es codón-optimizada para expresión en una célula eucariota.
De acuerdo con esto, en algunos aspectos, no se requiere necesariamente que sea fijada la longitud del ARNtracr requerida en una construcción de la invención, por ejemplo, una construcción quimérica, yen algunos aspectos puede tener entre 40 y 120 pb Y en algunos aspectos hasta la longitud total de la tracr, por ejemplo, en algunos aspectos hasta el extremo 3' de traer como se marca por la señal de tenninación de la transcripción en el genoma bacteriano. En algunas realizaciones, la longitud del ARNtracr incluye al menos 1-67 nucleótidos y en algunas realizaciones al menos 1-85 nucleótidos del ARNtracr de tipo natural. En algunas realizaciones, se pueden usar al menos los nucleótidos que corresponden a los nucleótidos 1-67 o 1-85 de ARNtracr de Cas9 de S. pyogenes de tipo natural. En el caso de que el sistema CRISPR use enzimas distintas de Cas9 u otras distintas de SpCas9, entonces pueden estar presentes los nucleótidos correspondientes en el ARNtracr de tipo natural relevante. En algunas realizaciones, la longitud del ARNtracr incluye no más de 1-67 o 1-85 nucleótidos del ARNtracr de tipo natural. Con respeclo a la optimización de secuencias (por ejemplo, reducción en las secuencias poli-T), por ejemplo en cuanto a las cadenas de Ts intemas a la secuencia de emparejamiento tracr (repetición directa) o al ARNtracr, en algunos aspectos, uno o más Ts presentes en una secuencia poli-T de la secuencia de tipo natural relevante (esto es, un segmento de más de 3,4,5,6 o más bases T contiguas; en algunas rea lizaciones, un segmento de no más de 10, 9, 8, 7, 6 bases T contiguas) pueden ser sustituidos con un nucleótido no T, por ejemplo, una A, de manera que la cadena se rompa en fragmentos más pequeños de T teniendo cada fragmento 4, o menos de 4 (por ejemplo, 3 o 2) T contiguas. Si la cadena de T está implicada en la formación de una horquilla (o tallo-lazo), entonces es ventajoso que la base complementaria para la base no T se cambie a complemento del nucleótido no T. Por ejemplo, si la base no T es una A, enlonces su complemento se puede cambiar a una T, por ejemplo, para conservar o ayudar a la conservación de estructura secundaria. Por ejemplo, se puede modificar 5'-TTTTT para que se convierta en 5'TITAT Y se puede cambiar la 5'-AAAAA complementaria a 5'-ATAAA. En cuanto a la presencia de secuencias terminadoras poli-T en transcrito de traer + emparejamiento traer, por ejemplo, un terminador poli.T (TTTTT o más), en algunos aspectos es ventajoso que se añada al extremo del transcrito, si está en forma de dos ARN (traer y emparejamiento de traer) o único ARN guia. Con respecto a los lazos y horquillas en los transcritos traer y de emparejamiento tracr, en algunos aspectos es ventajoso que esté presente un mínimo de dos horquillas en el ARN guía quimérico. Una primera horquilla puede ser la horquilla formada por complementación entre la secuencia tracr y la secuencia de emparejamiento traer (repetición directa). Una segunda horquilla puede estar en el extremo 3' de la secuencia ARNtracr y esto puede proporcionar estructura secundaria para interacción con Cas9. Se pueden añadir horquillas adicionales al 3' del ARN guía, por ejemplo, en algunos aspectos de la invención para aumentar la estabilidad del ARN guía. Adicionalmente, el extremo 5' del ARN guía, en algunos aspectos, se puede extender. En algunos aspectos, se puede considerar 20 pb en el extremo 5' como una secuencia guía. Se puede extender la porción 5' Se puede proporcionar una o más horquillas en la porción 5', por ejemplo, en algunos aspectos, esto también puede mejorar la estabilidad del ARN guia. En algunos aspectos, se puede proporcionar la horquilla específica adjuntando la secuencia (5'-AGGACGAAGTCCTAA) al extremo 5' de la secuencia guía y, en algunos aspectos, esto puede ayudar a mejorar la estabilidad. otras secuencias adecuadas para formar horquillas serán conocidas para el experto y se pueden usar en ciertos aspectos. En algunos aspectos, se proporcionan al menos 2, 3, 4, 5 o más horquillas adicionales. En algunos aspectos se proporcionan no más de 10, 9, 8, 7, 6 horquillas adicionales. Lo anterior también proporciona aspectos que implican estructura secundaria en secuencias guía. En algunos aspectos puede haber unión cruzada y otras modificaciones, por ejemplo, para mejorar la estabilidad. Las modificaciones pueden incluir inclusiones de al menos un nucleótido que no se encuentre en la naturaleza o un nucleótido modificado o análogos de los mismos. Los nucleótidos modificados se pueden modificar en el resto ribosa, fosfato y/o base. Los nucleótidos modificados pueden incluir 2'-O-metil-análogos, 2'-desoxi-análogos o 2'· fluoro-análogos. Se puede modificar la cadena principal del ácido nucleico, por ejemplo, se puede usar una cadena principal de fosforotioato. El uso de ácidos nucleicos bloqueados (LNA) o ácidos nucleicos de puente (BNA) también puede ser posible. Más ejemplos de bases modificadas incluyen, pero no se limitan a, 2-aminopurina, 5-bromo· uridina, pseudouridina, inosina, 7-metilguanosina. Dichas modificaciones o unión cruzada pueden estar presentes en la secuencia guía u otras secuencias adyacentes a la secuencia guía.
Breve descripción de los dibujos
Se tendrá un mejor entendimiento de las características y ventajas de la presente invención por referencia a la siguiente descripción detallada que explica realizaciones ilustrativas, en que se utilizan los principios de la invención, y los dibujos adjuntos de los que:
La Figura 1 muestra un modelo esquemático del sistema CRISPR. La nucleasa Cas9 de Streptococcus pyogenes (amarillo) se fija como objetivo para ADN genómico por un ARN guía sintético (ARNsg) que consiste en una secuencia guía de 20-nt (azul) y un andamio (rojo) Los pares de bases de la secuencia guía con el ADN objetivo (azul), directamente aguas arriba de una unidad adyacente protoespaciadora (PAM, por sus siglas en inglés; magenta) 5'-NGG requisito y Cas9 media una doble rotura de cadena (OSB, por sus siglas en inglés) -3 pb aguas arriba de la PAM (triángulo rojo)
La Figura 2A-F ilustra un sistema CRISPR ejemplar, un posible mecanismo de acción, una adaptación de ejemplo para la expresión en células eucariotas y los resultados de los ensayos que evalúan la localización nuclear y la actividad de CRISPR.
La Figura 3A-C ilustra una casete de expresión ejemplar para expresión de elementos del sistema CRISPR en células eucariotas, estructuras previstas de secuencias guia de ejemplo y actividad del sistema CRISPR cuando se mide en células eucariotas y procariotas_
La Figura 4A-O ilustra los resultados de una evaluación de especificidad de SpCas9 para un objetivo de ejemplo.
La Figura 5A-G ilustra un sistema de vectores ejemplar y los resultados para su uso en dirigir recombinaciÓfl homóloga en células eucariotas.
La Figura 6A-C ilustra una comparación de diferentes transcritos de ARNtracr para fijar como objetivo genes mediados por Cas9
La Figura 7 A-O ilustra un sistema CRISPR ejemplar, una adaptación de ejemplo para expresión en células eucariotas y los resultados de los ensayos que evalúan la actividad de CRISPR.
La Figura 8A-C ilustra manipulaciones ejemplares de un sistema CRISPR para fijar como objetivo sitios genómicos en células de mamíferos.
La Figura 9A-B ilustra los resultados de un análisis por el método Northem de tratamiento de ARNcr en células de mamífero.
La Figura 10A-C ilustra una representación esquemática de ARN quiméricos y los resultados de ensayos SURVEYOR para actividad del sistema CRISPR en células eucariotas.
La Figura lIA-B ilustra una representación gráfica de los resultados de ensayos SURVEYOR para actividad del sistema CRISPR en célu las eucariotas
La Figura 12 ilustra estructuras secundarias previstas para ARN quiméricos ejemplares que comprenden una secuencia guia, secuencia de acoplamiento tracr y secuencia tracr.
La Figura 13 es un árbol filogenético de genes Caso
La Figura 14A-F muestra el análisis filogenético que revelan cinco familias de Cas9s, incluyendo tres grupos de Cas9s grandes (-1.400 aminoácidos) y dos de Cas9s pequeños (-1.100 aminoácidos).
La Figura 15 muestra un gráfico que representa la función de diferentes ARN guia optimizados
La Figura 16 muestra la secuencia y estructura de diferentes ARN quiméricos guía.
La Figura 17 muestra la estructura ca-plegada del ARNtracr y repetición dirigida
La Figura 18 A YB muestra datos de la optimización de ARN guía quimérico de St1Cas9 in vitro.
La Figura 19A-B muestra la escisión de objetivos no metilados o metilados mediante lisado de células de SpCas9.
La Figura 20A-G muestra la optimización de la arquitectura de ARN guía para edición de genomas de mamífero mediada por SpCas9. (a) Esquema de vector de expresión bicistrónico (PX330) para ARN guía único conducido por activador U6 (ARNsg) y Cas9 de Streptococcus pyogenes codón-optimizada humana conducida por activador CBh (hSpCas9) usada para todos los experimentos posteriores. El ARNsg consta de una secuencia guía de 20-nt (azul) y andamio (rojo), truncados en diversas posiCiones como se indica. (b) Ensayo SURVEYOR para inserciones o supresiones mediadas por SpCas9 en los sitios EMX1 Y PVALB humanos. Las flechas indican los fragmentos SURVEYOR esperados (n = 3). (e) Análisis por el método Northem para las cuatro arquitecturas de truncado de ARNsg, con Ul como control de carga. (d) Ambos mutantes de tipo natural (wt, por sus siglas en inglés) o nickase (D10A) de inserción activada por SpCas9 de un sitio HindlU en el gen EMX1 humano. Se usaron oligonucleótidos monocatenarios (los ssOON, por sus siglas en inglés) orientados en la dirección sentido o antisentido en relación a la secuencia genómica, como planti llas de recombinación homólogas. (e) Esquema del sitio SERPINB5 humano. Se indican los ARNsg y las PAM mediante barras coloreadas por encima de las secuencias; se resaltan metilcitosina (Me) (rosa) y se enumeran en relación al sitio de inicio de transcripción (TSS, +1 ). (f) Estado de metilación de SERPINB5 ensayado mediante secuenciación de bisulfito de 16 clones. Círculos rellenos, CpG metilado; círculos abiertos, CpG no metilado. (g) Eficacia de modificaciÓfl por tres ARNsg fijando como objetivo la región metilada de SERPINB5, ensayada por secuenciación profunda (n =2). Las barras de error indican intervalos de Wilson (Métodos On line).
La Figura 21A-B muestra la optimización adicional de la arquitectura de ARNsg de CRISPR-Cas. (a) Esquema de cuatro arquitecturas adicionales de ARNsg, I-IV. Cada una consta de una secuencia guia de 20-nt (azul) unida a la repetición directa (RO, gris), que hibrida a la ARNtracr (rojo). El hibrido RD-ARNtracr es truncado en +12 o +22, como se indicaron con un tallo-lazo GAAA artificial. Las posiciones de truncado de ARNtracr se enumeran de acuerdo con el sitio de inicio de la transcripción indicado previamente para ARNtracr. Las arquitecturas de ARNsg 11 y IV soportan mutaciones dentro de sus tractos poli-U, que podían servir como terminadores de transcripción prematura. (b) Ensayo SURVEYOR para inserciones o supresiones mediadas por SpCas9 en el sitio EMX1 humano para los sitios 1-3 objetivo. Las flechas indican los fragmentos SURVEYOR expresados (n =3).
La Figura 22 ilustra la visualización de algunos sitios objetivo en el genoma humano.
La Figura 23A-B muestra (A) un esquema del ARNsg y (B) el análisis SURVEYOR para cinco variantes de ARNsg para SaCas9 para una arquitectura truncada óptima con la mayor eficacia de escisión.
Las figuras en la presente memoria son sólo para fines ilustrativos y no están necesariamente dibujadas a escala.
Descripción detallada de la invención
Los términos "polinucleótido", "nucleótido", "secuencia de nucleótidos", "ácido nucleico" y "oligonucleótido" se usan de forma intercambiable. Se refieren a una forma polimérica de nucleótidos de cualquier longitud, desoxirribonucleótidos o ribonucleótidos o análogos de los mismos. Los polinucleótidos pueden tener cualquier estructura tridimensional y pueden realizar cualquier función, conocida o desconocida. Los siguientes no son ejemplos limitantes de los polinucleótidos: regiones codificadoras o no codificadoras de un gen o fragmento de gen, sitios (sitio) definidos a partir de análisis de unión, exones, intrones, ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ARN de interferencia corta (ARNsi), ARN de horquilla corta (ARNsh), micro-ARN (ARNmi), ribozimas, y ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de cualquier secuencia, ARN aislado de cualquier secuencia, sondas de ácidos nucleicos y cebadores. Un polinucleótido puede comprender uno o más nucleótidos modificados, tales como nucleótidos metilados y análogos de nucleótidos. Si hay, se pueden impartir modificaciones a la estructura del nucleótido antes o después del ensamblado del polimero. La secuencia de nucleótidos puede ser interrumpida por componentes no nucleótidos Un polinucleótido puede ser modificado además después de polimerización, tal como por conjugación con un componente etiquetado.
En aspectos de la invención, los términos "ARN quimérico", "ARN guía quimérico", "ARN guía", "ARN guía único" y "ARN guía sintético" se usan de forma intercambiable y se refieren a la secuencia de polinucleótidos que comprende la secuencia guía, la secuencia traer y la secuencia de emparejamiento traer. El término "secuencia guía" se refiere a la secuencia de aproximadamente 20 pb dentro del ARN guia que especifica el sitio objetivo y se puede usar de manera intercambiable con los términos "guia" o "espaciador" El término "secuencia de emparejamiento traer" también se puede usar de forma intercambiable con el término "repetición o repeticiones directas".
Como se usa en la presente memoria el término "de tipo natural" es un término de la técnica entendido por los expertos y significa la forma típica de un organismo, cepa, gen o característica como se encuentra en la naturaleza como se distingue de formas mutantes o variantes.
Como se usa en la presente memoria el término "variante" se debería considerar que significa la exhibición de cualidades que presentan un patrón que se desvía de lo que ocurre en la naturaleza
Los términos "que no se encuentra en la naturaleza " o "de ingenieria " se usan de forma intercambiable e indican la implicación de la mano del hombre. Los términos, cuando se refieren a moléculas de ácido nucleico o polipéptidos significan que la molécula de ácido nucleico o el polipéptido está al menos sustancialmente exento de al menos otro componente con el que se asocian de manera natural en la naturaleza y como se encuentran en la naturaleza
"Complementariedad" se refiere a la capacidad de un ácido nucleico para formar el enlace o enlaces de hidrógeno con otra secuencia de ácidos nucleicos por emparejamiento de bases de Watson-Crick tradicional u otros tipos no tradicionales. Un porcentaje de complementariedad indica el porcentaje de restos en una molécula de ácido nucleico que puede formar enlaces de hidrógeno (por ej., emparejamiento de bases de Watson-Crick) con una segunda secuencia de ácidos nucleicos (por ej., 5, 6, 7, 8, 9, 10 de un total de 10 siendo la complementariedad del 50%, 60%, 70%, 80%, 90% Y 100%). "Perfectamente complementario" significa que todos los restos contiguos de una secuencia de ácidos nucleicos formarán un enlace de hidrógeno con el mismo número de restos contiguos en una segunda secuencia de ácidos nucleicos. " Sustancialmente complementario" como se usa en la presente memoria se refiere a un grado de complementariedad que es al menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%,99% o 100% por una región de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22,23, 24, 25, 30, 35, 40, 45, 50 o más nucleótidos o se refiere a dos ácidos nucleicos que se hibridan en condiciones rigurosas
Como se usa en la presente memoria, "condiciones rigurosas" para hibridación se refiere a las condiciones en las cuales un ácido nucleico que tiene complementariedad a una secuencia objetivo se hibrida predominantemente con la secuencia objetivo y sustancialmente no se hibrida a las secuencias no objetivo. Las condiciones rigurosas son en general dependientes de la secuencia, y varían dependiendo de una serie de factores. En general, cuanto más larga la secuencia, mayor la temperatura a la que se hibrida de manera específica la secuencia a su secuencia objetivo Se describen con detalle ejemplos no limitantes de condiciones rigurosas en Tijssen (1.993), Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization With Nucleic Acid Probes Part 1, Segundo Capítulo "Qverview of principies of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y
"Hibridación" se refiere a una reacción en que uno o más polinucleótidos reaccionan para formar un complejo que se estabiliza vía enlace de hidrógeno entre las bases de los restos de nucleótido. El enlace de hidrógeno puede tener lugar por apareamiento de bases de Watson Crick, unión de Hoogstein o de cualquier otra manera específica de la secuencia. El complejo puede comprender dos hebras que forman una estructura dúplex, tres o más hebras que forman un complejo multicatenario, una sola hebra que se autohibrida o cualquier combinación de éstas. Una reacción de hibridación puede constituir una etapa en un procedimiento más extenso, tal como la iniciación de PCR
o la escisión de un polinucleótido mediante una enzima. Una secuencia capaz de hibridación con una secuencia determinada se refiere como el "complemento" de la secuencia determinada.
Como se usa en la presente memoria, "estabilización" o "estabilidad aumentada" con respecto a componentes del sistema CRISPR se refieren a asegurar o estabilizar la estructura de la molécula. Esto se puede llevar a cabo por introducción de una o más mutaciones, incluyendo cambios de pares de base únicos o múltiples, aumentando el número de horquillas, unión cruzada, rompiendo tramos particulares de nucleótidos y otras modificaciones. Las modificaciones pueden incluir la inclusión de al menos un nucleótido que no se encuentra en la naturaleza o un nuc!eótido modificado o análogos de los mismos. Se pueden modificar nucleótidos modificados en el resto ribosa, fosfato y/o base. Los nucleótidos modificados pueden incluir 2'-Q-metil-análogos, 2'-desoxi-análogos o 2'-fluoroanálogos. La cadena principal de ácidos nucleicos se puede modificar, por ejemplo, se puede usar una cadena principal de fosforotioato. El uso de ácidos nucleicos bloqueados (LNA, por sus siglas en inglés) o ácidos nucleicos de puente (BNA, por sus siglas en inglés) también puede ser posible. Más ejemplos de bases modificadas incluyen, pero no se limitan a, 2-aminopurina, 5-bromo-uridina, pseudouridina, inosina, 7-metilguanosina. Estas modificaciones se pueden aplicar a cualquier componente del sistema CRSIPR. En una realización preferida estas modificaciones se realizan a los componentes de ARN, por ejemplo, el ARN guía o secuencia de polinucleótidos quiméricos.
Como se usa en la presente memoria, "expresión" se refiere al procedimiento por el que un polinucleótido se transcribe de una planti lla de ADN (tal como en ARNm u otro transcrito de ARN) y/o el procedimiento por el que se traduce con posterioridad un ARNm transcrito en péptidos, polipéptidos o proteínas. Los transcritos y polipéptidos codificados se pueden referir de manera colectiva como "producto génico". Si el polinucleótido procede de ADN genómico, la expresión puede incluir proceso de corte y empalme del ARNm en una célula eucariota.
Los términos "polipéptido", "péptido" y "proteína" se usan de forma intercambiable en la presente memoria para referirse a polímeros de aminoácidos de cualquier longitud. El polímero puede ser lineal o ramificado y puede comprender aminoácidos modificados y puede ser interrumpido por no aminoácidos. Los términos también incluyen un polímero de aminoácidos que ha sido modificado; por ejemplo, formación de enlace disulfuro, glucosilación, lipidación, acetilación, fosforilación o cualquier otra manipulación, tal como conjugación con un componente etiquetado. Como se usa en la presente memoria el término "aminoácido· incluye aminoácidos naturales y/o no naturales o sintéticos, incluyendo glicina y los dos isómeros ópticos O o L y análogos de aminoácido y peptidomiméticos
Los términos " individuo," "individual" y "paciente" se usan de forma intercambiable en la presente memoria para referirse a un vertebrado, preferiblemente un mamífero, más preferiblemente un ser humano. Los mamíferos incluyen, pero no están limitados a, murinos, simios, seres humanos, animales de granja, animales deportivos y mascotas. Los tejidos, las células y su progenie de una entidad biológica obtenida in vivo o cultivada in vitro también se incluyen. En algunas rea lizaciones, un individuo puede ser un animal invertebrado, por ejemplo, un insecto o un nematodo; mientras que en otros, un individuo puede ser una planta o un hongo.
Los términos "agente terapéutico", "agente terapéutico capaz" o "agente de tratamiento" se usan de forma intercambiable y se refieren a una molécula o compuesto que confiere algún efecto beneficioso en la administración a un individuo. El efecto beneficioso incluye permitir determinaciones de diagnóstico; alivio de una enfermedad, síntoma, trastOfno o afecciórJ patológica; reducir o prevenir el comienzo de una enfermedad, síntoma, trastorno o afección y en general contrarrestar una enfermedad, síntoma, trastorno o afección patológica
Como se usa en la presente memoria, "tratamiento" o " tratar," o "paliar" o "aliviar" se usan de forma intercambiable. Estos térm inos se refieren a una propuesta para obtener resultados beneficiosos o deseados incluyendo pero no limitándose a un beneficio terapéutico y/o un beneficio profiláctico. Por beneficio terapéutico se quiere decir cualquier mejora terapéuticamente relevante en, o efecto sobre, una o más enfermedades, afecciones o síntomas bajo tratamiento. Para beneficio profiláctico, las composiciones se pueden administrar a un individuo con riesgo de desarrollar una enfermedad particular, afección o síntoma o a un individuo que indica uno o más de los síntomas fisiológicos de una enfermedad, incluso aunque la enfermedad, afección o síntoma pueda no haberse manifestado aún
El término "cantidad eficaz" o "cantidad terapéuticamente eficaz" se refiere a la cantidad de un agente que es suficiente para efectuar resultados beneficiosos o deseados. La cantidad terapéuticamente eficaz puede variar dependiendo de uno o más de: el individuo y la enfermedad que se está tratando, el peso y la edad del individuo, la gravedad de la enfermedad, la manera de administraciórJ y similares, que se puede determinar fácilmente por un experto en la materia. El término también se aplica a una dosis que proporcionará una imagen para detección por uno cualquiera de los métodos de formación de imagen descritos en la presente memoria. La dosis específica puede variar dependiendo de uno o más de: el agente particular elegido, el régimen de dosificación que se tenga que seguir, si se administra en asociación con otros compuestos, la sincronización de la administración, el tejido que se tiene que someter a formación de imagen y el sistema de suministro físico en el cual esté soportado.
La práctica de la presente invención emplea, a menos que se indique de otro modo, técnicas convencionales de inmunología, bioquímica, química, biología molecular, microbiología, biología celular, ADN genómico y recombinante, que están dentro de la destreza de la técnica. Véase Sambrook, Fritsch y Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2a edición (1.989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F
M. Ausubel, et al. eds., (1.987»; las series METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M. J. MacPherson, B. D. Hames y G. R. Taylor eds. (1.995», Hartow and Lane, eds.
(1.988) ANT1BODIES, A LABORATORY MANUAL ANO ANIMAL CELL CULTURE (R. 1. Freshney, ed. (1.987».
Va rios aspectos de la invención se refieren a sistemas vector que comprenden uno o más vectores o vectores como tales. Se pueden diseñar vectores para expresión de transcritos CRISPR (por ejemplo, transcritos de ácidos nudeicos, proteínas o enzimas) en células procariotas o eucariotas. Por ejemplo, se pueden expresar transcritos de CRISPR en células bacterianas tales como Escherichia eoli, células de insecto (usando vectores de expresión de baculovirus), células de levaduras o células de mamíferos. Las células huésped adecuadas se discuten además en Goeddel, GENE EXPRESS ION TECHNOLOGY: METHODS IN ENZVMOLOGY 185, Academic Press, San Diego; Calif. (1.990). Como altemativa, el vector de expresión recombinante se puede transcribir y traducir in vitro, por ejemplo usando secuencias reguladoras de activador T7 y polimerasa TI
Se pueden introducir vectores y propagar en una procariota. En algunas realizaciones, se usó una procariota para multiplicar copias de un vector que se tiene que introducir en una célula eucariota o como un vector intermedio en la producción de un vector que se tiene que introducir en una célula eucariota (por ej., multiplicando un plásmido como parte de un sistema de empaquetamiento de vector vírico). En algunas realizaciones, se usa una procariota para multiplicar copias de un vector y expresar uno o más ácidos nucleicos, tal como para proporcionar una fuente de una
o más proteínas para suministro a una célula huésped u organismo huésped. La expresión de proteínas en procariotas se lleva a cabo lo más frecuentemente en Escherichia coli con vectores que contienen activadores constitutivos o inducibles que dirigen la expresión de proteínas de fusión o de no fusión. Los vectores de fusión añaden una serie de aminoácidos a una proteína codificada allí, tal como al término amino de la proteína recombinante. Dichos vectores de fusión pueden servir para uno o más fines, tales como: (i) para aumentar la expresión de proteína recombinante; (ii) para aumentar la solubilidad de la proteína recombinante y (iii) para ayudar en la purificación de la proteína recombinante actuando como un ligando de purificación de afinidad. Con frecuencia, en vectores de expresión de fusión, se introduce un sitio de escisión proteolitico en la unión del resto de fusión y la proteina recombinante para permitir la separación de la proteina recombinante del resto de fusión posterior a la purificación de la proteína de fusión. Tales enzimas, y sus secuencias de reconocimiento o de origen similar, incluyen Factor Xa, trombina y enterocinasa. Vectores de expresión de fusión de ejemplo incluyen pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1.988. Gene 67: 31-40), pMAL (New England Biolabs, Beverly, Mass _) y pRIT5 (Pharmacia, Piscataway, N. J.) que condensan glutationa S-transferasa (GST), proteina de unión maltosa E o proteína A, respectivamente, a la proteína recombinante objetivo.
Ejemplos de vectores de expresión E. coli no de fusión, inducibles, adecuados, incluyen pTrc (Amrann et al., (1.988) Gene 69: 301-315) y pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calf. (1 .990) 60-89)
En algunas realizaciones, un vector es un vector de expresión de levadura. Ejemplos de vectores para expresión en levadura Saccharomyces cerivisae incluyen pYepSec1 (Baldari, et aL, 1.987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowilz, 1.982. Cell 30: 933-943), pJRY88 (Schultz et al., 1.987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, Galif.) y picZ (lnVitrogen Corp, San Diego, Calif.).
En algunas realizaciones, un vector conduce la expresión de proteínas en células de insecto usando vectores de expresión de baculovirus. Los vectores baculovirus disponibles para expresión de protelnas en células de insecto cultivadas (por ej., células SF9) incluyen la serie pAe (Smith, et al., 1.983. Mol. CelL BioL 3: 2.156-2.165) y la serie pVL (Lucklow and Summers, 1.989. Virology 170: 31-39).
En algunas realizaciones, un vector es capaz de conducir la expresión de una o más secuencias en células de mamífero usando un vector de expresión de mamífero. Ejemplos de vectores de expresión de mamífero incluyen pCDM8 (Seed, 1.987. Nature 329: 840) y pMT2PC (Kaufman, et al., 1.987. EMBO J. 6: 187-195). Cuando se usa en células de mamífero, las funciones de control del vector de expresión se proporciooan típicamente por uno o más elementos reguladores. Por ejemplo, los activadores usados comúnmente proceden de polioma, adenovirus 2, citomegalovirus, virus 40 de simio y otros descritos en la presente memoria y cOllOcidos en la técnica Para otros sistemas de expresión adecuados para ambas células procariotas y eucariotas véanse, por ejemplo, los Capítulos 16 y 17 de Sambmok, et al., MOLECULAR CLONING: A LABORATORY MANUAL 28 ed., Cold Spring Harbar Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbar, N. Y , 1.989
En algunas realizaciones, el vector de expresión de mamiferos recombinante es capaz de dirigir la expresión del ácido nucleico preferentemente en un tipo de célula particular (por ejemplo, se usan elementos reguladores específicos del tejido para expresar el ácido nucleico). Los elementos reguladores específicos del tejido son conocidos en la técnica. Ejemplos no limitantes de activadores específicos del tejido adecuados incluyen el activador de albúmina (específico del hígado; Pinkert, et al., 1.987. Genes Dev. 1. 268-277 ), activadores específicos linfoides (Calame and Eaton, 1.988. Adv. ImmunoL 43: 235-275), en particular activadores de receptores de las células T (Winoto and Baltimore, 1.989. EMBO J. 8: 729-733) e inmunoglobulinas (Baneiji, et al., 1.983. Cell 33: 729-740; Queen and Baltimore, 1.983. Cell 33: 741-748), activadores específicos de las neuronas (por ej., el activador de neurofilamentos; Byrne and Ruddle, 1.989. Proc. Natl. Acad Sci. USA 86: 5.473-5.477), activadores específicos del páncreas (Edlund, et al., 1.985. Science 230: 912-916) y activadores especificos de las glándulas mamarias (por ej., activador de suero de leche; Patente de EE.UU. N° 4. 873. 316 Y Publicación de la Solicitud de Patente Europea N° 264 .166). También se incluyen activadores regulados por el desarrollo, por ej., los activadores de hox de murina (Kessel and Gruss, 1.990. Science 249: 374-379) y el activador de a-fetoproteína (Campes and Tilghman, 1.989. Genes Dev. 3: 537-546)
En algunas realizaciones, un elemento regu lador se une de manera operable a uno o más elementos de un sistema CRISPR a fin de conducir la expresión de uno o más elementos del sistema CRISPR. En general, las CRISPR (Repeliciooes Palindrómicas Cortas Agrupadas y Regularmente Interespaciadas), también conocidas como las SPIDR (Repeticiooes Directas Intercaladas Separadas, por sus siglas en inglés), constituyen una familia de sitios de ADN que son normalmente específicos para una especie bacteriana particular. Et sitio de CRISPR comprende una clase distinta de repeticiones de secuencias cortas intercaladas (las SSR) que se reconocieron en E. col; (Ishino et al., J. Bacteriol., 169: 5.429-5.433 {1.98?] Y Nakata et al., J. BacterioL, 171 ' 3.553-3.556 (1.989]) Y genes asociados Las SSR intercaladas similares han sido identificadas en Haloferax mediterranei, Streptococcus pyogenes, Anabaena y Mycobacterium tuberculosis (Véase, Groensn et al., Mol. MicrobioL, 10: 1.057-1.065 (1.993); Hoe et al., Emerg. Infect. Dis., 5: 254-263 (1.999) ; Masepohl et al., Biochim. Biophys. Acta 1.307: 26--30 (1.996) Y Mojica et al., Mol. MicrobioL, 17: 85-93 {1 .995]). El sitio de CRISPR difiere típicamente de las otras SSR por la estructura de las repeticiones, que se han denominado repeticiones espaciadas regularmente cortas (las SRSR) (Janssen et al. OMICS J. Integ. BioL, 6: 23-33 [2.002) Y Mojica et al., Mol. MicrobioL, 36: 244-246 (2.000]). En general, las repeticiones son elementos cortos que tienen lugar en agrupaciones que están regularmente espaciadas por secuencias de intervención únicas con una longitud sustancialmente constante (Mojica et al., (2.000], supra). Aunque las secuencias de repeticiones se conservan mucho entre cepas, el número de repeticiones intercaladas y las secuencias de las regiones espaciadoras difiere típicamente de cepa a cepa (van Embden et al., J. BacterioL, 182: 2.393-2.401 (2.000)). Se ha identificado el sitio de CRISPR en más de 40 procariotas (Véase por ej., Jansen et al., Mol. Microbiol., 43: 1.565-1.575 [2 .002] Y Mojica et al., [2.005)) incluyendo, pero no limitado a Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus. Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobaclerium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella. Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pastaurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema y Thennotoga
En general, "sistema CRISPR" se refiere colectivamente a transcritos y otros elementos implicados en la expresión de o dirigidos a la actividad de genes asociados a CRISPR ("Cas"), incluyendo secuencias que codifican un gen Cas, una secuencia traer (CRISPR trans-activante) (por ej., ARNtracr o un ARNtracr parcial activo), una secuencia de emparejamiento tracr (incluyendo una "repetición dirigida " y una repetición directa parcial tratada por ARNtracr en el contexto de un sistema CRISPR endógeno), una secuencia guía (también referida como un "espaciador" en el context:o de un sistema CRISPR endógeno) u otras secuencias y transcritos de un sitio CRISPR En algunas realizaciones, uno o más elementos de un sistema CRISPR procede de un sistema CRISPR tipo 1, tipo 11 o tipo 111 En algunas realizaciooes, uno o más elementos de un sistema CRISPR procede de un organismo particular que comprende un sistema CRISPR endógeno, tal como Streptococcus pyogenes. En general, un sistema CRISPR se caracteriza por elementos que activan la formación de un complejo CRISPR en el sitio de una secuencia objetivo (también referido como un protoespaciador en el contexto de un sistema CRISPR endógeno). En el contexto de formación de un complejo CRISPR, "secuencia objetivo" se refiere a una secuencia para la que se diseña que una secuencia guia presente complementariedad, donde la hibridación entre una secuencia objetivo y una secuencia guía active la formación de un complejo CRISPR. No se requiere necesariamente complementariedad completa, siempre que haya suficiente complementariedad para producir hibridación y activar la formación de un complejo CRISPR. Una secuencia objetivo puede comprender cualquier polinucleótido, tal como polinucleótido de ADN o ARN. En algunas realizaciones, se sitúa una secuencia objetivo en el núcleo o citoplasma de una célula. En algunas realizaciones, la secuencia objetivo puede estar dentro de un organelo de una célula eucariota, por ejemplo, mitocondria o cloroplasto. Una secuencia o plantilla que se puede usar para recombinación en el sitio fijado como objetivo que comprende las secuencias objetivo se refiere como" plantilla de edición" o ~polinucleótido de edición" o "secuencia de edición". En aspectos de la invención, un polinucleótido de plantilla exógeno se puede referir como una plantilla de edición. En un aspecto de la invención la recombinación es recombinación homóloga.
Típicamente, en el contexto de un sistema CRISPR endógeno, la formación de un complejo CRISPR (que comprende una secuencia guía hibridada a una secuencia objetivo y complejada con una o más proteínas Cas) da como resultado la escisión de una o más hebras en o cerca de (por ej., dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 o más pares de bases de) la secuencia objetivo. Sin desear estar limitados por la teoría, la secuencia tracr, que puede comprender o constar de toda o una porción de una secuencia traer de tipo natural (por ej ., aproximadamente o más de aproximadamente 20, 26, 32, 45, 48, 54, 63, 67, 85 o más nucleótidos de una secuencia traer de tipo natural), también puede formar parte de un complejo CRISPR, tal como por hibridación a lo largo de al menos una porción de la secuencia tracr a toda o una porción de una secuencia de emparejamiento tracr que esté ligada de manera operable a la secuencia guia. En algunas realizaciones, la secuencia tracr presenta suficiente complementa riedad a una secuencia de emparejamiento traer para hibridar y participar en la formación de un complejo CRISPR. Como con la secuencia objetivo, se cree que no es necesaria la complementa riedad completa, siempre que haya suficiente para que sea funcional. En algunas realizaciones, la secuencia tracr presenta al menos 50%, 60%, 70%, 80%, 90%, 95% o 99% de complementariedad de secuencias a lo largo de la longitud de la secuencia de emparejamiento traer cuando se alinea de manera óptima. En algunas realizaciones, uno o más vectores que conducen la expresión de uno o más elementos de un sistema CRISPR se introducen en una célula huésped de manera que la expresión de los elementos del sistema CRISPR dirija la formación de un complejo CRISPR en uno o más sitios objetivo. Por ejemplo, una enzima Cas, una secuencia guía ligada a una secuencia de emparejamiento tracr y una secuencia traer podían estar unidas cada una de manera operable a elementos reguladores separados en vectores separados Como alternativa, dos o más de los elementos expresados de los mismos o diferentes elementos reguladores, se pueden combinar en un vector único, proporcionando uno o más vectores adicionales cualquier componente del sistema CRISPR no incluido en el primer vector. Los elementos del sistema CRISPR que se combinan en un único vector se pueden disponer en cualquier orientación adecuada, tal como un elemento situado en 5' con respecto a raguas arriba" de) o 3' con respecto a ("aguas abajo" de) un segundo elemento. La secuencia codificadora de un elemento puede estar situada en la misma hebra u opuesta de la secuencia codificadora de un segundo elemento y orientada en la misma dirección u opuesta. En algunas realizaciones, un activador único conduce la expresión de una transcripción que codifica una enzima CRISPR y una o más de la secuencia guia, la secuencia de emparejamiento tracr (opcionalmente unida de manera operable a la secuencia guia) y una secuencia tracr embebida dentro de una o más secuencias intrón (por ej., cada una en un intrón diferente, dos o más en al menos un intr6n o todas en un solo intrón). En algunas realizaciones, la enzima CRISPR, secuencia guía, secuencia de emparejamiento tracr y secuencia tracr se unen de manera operable a y se expresan a partir del mismo ac!ivador
En algunas realizaciones, un vector comprende uno o más sitios de inserción, tal como una secuencia de reconocimiento de endonucleasa de restricción (también referido como un "sitio de clonación"). En algunas realizaciones, uno o más sitios de inserción (por ej., aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más sitios de inserción) están situados aguas arriba y/o aguas abajo de uno o más elementos de secuencia de uno o más vectores . En algunas realizaciones , un vector comprende un sitio de inserción aguas arriba de una secuencia de emparejamiento traer y opcionalmente aguas abajo de un elemento regulador unido de manera operable a la secuencia de emparejamiento tracr, de manera que después de la inserción de una secuencia guía en el sitio de inserción y en la expresión de la secuencia guia dirija la unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo en una célula eucariota. En algunas realizaciones, un vector comprende dos o más sitios de inserción, estando situado cada sitio de inserción entre dos secuencias de emparejamiento tracr de manera que se permita la inserción de una secuencia guía en cada sitio. En dicha disposición, dos o más secuencias guia pueden comprender dos o más copias de una secuencia guia única, dos o más secuencias guía diferentes o combinaciones de éstas. Cuando se usan múltiples secuencias guía diferentes, se puede usar una construcción de expresión única para fijar como objetivo la actividad de CRISPR a mÚltiples secuencias objetivo correspondientes, diferentes, dentro de una célula. Por ejemplo, un solo vector puede comprender aproximadamente
o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 o más secuencias guía. En algunas realizaciones, se pueden proporcionar aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más de tales vectores que contienen secuencia guía y se suministran opcionalmente a una célula.
En algunas realizaciones, un vector comprende un elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica una enzima CRISPR, tal como una proteína Caso Ejemplos no limitantes de proteinas Cas incluyen Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (también conocidas como Csn1 y Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, CsaS, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1 , Cmr3, Cmr4, Cmr5, Cmr6, Csb1 , Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1 , Csx15, Csf1 , CSf2, CSf3, CSf4, homólogos de las mismas o versiones modificadas de las mismas. Estas enzimas son conocidas; por ejemplo, la secuencia de aminoácidos de proteína cas9 de S. pyogenes se puede encontrar en la base de datos S""';ssProt con el número de acceso 099ZW2. En algunas rea lizaciones, la enzima CRISPR no modificada presenta actividad de escisión de ADN, tal como Cas9. En algunas realizaciones la enzima CRISPR es Cas9 y puede ser Cas9 de S. pyogenes o S. pneumoniae. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o ambas hebras en la posición de una secuencia objetivo, tal como dentro de la secuencia objetivo y/o dentro del complemento de la secuencia objetivo. En algunas realizaciones, la enzima CRISPR dirige la escisión de una o ambas hebras dentro de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 o más pares de bases del primer o el último nucleótido de una secuencia objetivo. En algunas realizaciones, un vector codifica una enzima CRISPR que muta coo respecto a una enzima de tipo natural correspondiente de manera que la enzima CRISPR mutada carece de la capacidad para escindir una o ambas hebras de un polinucleótido objetivo que contiene una secuencia objetivo. Por ejemplo, una sustitución de aspartato a alanina (D10A) en el dominio catalítico RuvC I de Cas9 de S. pyogenes coovierte Cas9 de una nucleasa que escinde ambas hebras a una nickasa (escinde una única hebra). Otros ejemplos de mutaciones que hacen Cas9 una nickasa incluyen, sin limitación, H840A, N854A y N863A. En algunas realizaciones, se puede usar una nickasa de Cas9 junto con secuencia o secuencias guía, por ejemplo, dos secuencias guía, que fijan como objetivo hebras transcrita y complementaria respectivamente del objetivo de ADN. Esta combinación permite que ambas hebras sean nickeadas y usadas para inducir NHEJ. Los solicitantes han demostrado (datos no mostrados) la eficacia de dos objetivos de nickasa (es decir, los ARNsg fijados como objetivo en la misma posición pero para diferentes hebras de ADN) en la inducción de NHEJ mutagénico. Una única nickasa (Cas9-D10A con un único ARNsg) es incapaz de inducir NHEJ y crear inserciones o supresiones pero los Solicitantes han demostrado en la nickasa doble (Cas9-D10A y dos ARNsg fijados como objetivo a diferentes hebras en la misma posición) lo puede hacer en células madre embrionarias humanas (las hESC). La eficacia es aproximadamente 50% de nucleasa (es decir, cas9 regular sin mutación 010) en las hESC
Como un ejemplo más, dos o más dominios catalíticos de Cas9 (RuvC 1, RuvC 11 y RuvC 111) pueden mutar para producir un Cas9 mulado que carece sustancialmente de toda actividad de escisión de ADN. En algunas realizaciones, una mutación de D10A se combina con una o más de las mutaciones H840A, N854A o N863A para producir una enzima Cas9 que carece sustancialmente de toda actividad de escisión de ADN. En algunas realizaciones, se considera que una enzima CRISPR carece sustancialmente de tada actividad de escisión de ADN cuando la actividad de escisión de ADN de la enzima mutada es menor que aproximadamente 25%, 10%, 5%, 1%, 0,1%, 0,01% o menor con respecto a su forma no mutada. Pueden ser útiles otras mutaciones; en el caso de que la Cas9 u otra enzima CRISPR sea de una especie distinta de S. pyogenes, se pueden realizar mutaciones en los correspondientes aminoácidos para conseguir efectos similares
En algunas realizaciones, una secuencia codificadora de enzimas que codifica una enzima CRISPR es codón optimizada para expresión en células particulares, tales como células eucariotas. Las células euca riotas pueden ser aquéllas de, o procedentes de, un organismo particular, tal como un mamífero, incluyendo pero no limitado a, ser humano, ratón, rata, conejo, perro o primate no ser humano. En general, optimización de codón se refiere a un procedimiento para modificar una secuencia de ácidos nucleicos para mejorar la expresión en las células huésped de interés reemplazando al menos un codón (por ej" aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 o más cadooes) de la secuencia natural con codones que se usan más frecuentemente o lo más frecuentemente en los genes de esa célula huésped al tiempo que se mantiene la secuencia de aminoácidos natural Diversas especies presentan sesgo particular para ciertos cadooes de un aminoácido particular. El sesgo de codones (diferencias en el uso de codones entre organismos) con frecuencia se correlaciona con la eficacia de traducción de ARN mensajero (ARNm), que se cree a su vez que depende de, entre otras cosas, las propiedades de los cadones que se están traduciendo y la disponibilidad de moléculas de ARN de transferencia (ARNt) particulares La predominancia de los ARNt seleccionados en una célula es en general una reflexión de los codones usados lo más frecuentemente en síntesis de péptidos. De acuerdo con esto, se pueden adaptar los genes para expresión óptima de los genes en un organismo determinado basándose en optimización de codones. Las tablas de utilización de cadones están fácilmente disponibles, por ejemplo, en la "Base de Datos de Uso de Cadones ", y estas tablas se pueden adaptar de una serie de maneras. Véase Nakamura Y., et al. "Codon usage tabulated from !he intemational DNA sequence databases: status far!he year 2000" Nud. Acids Res. 28: 292 (2.000). También están disponibles algoritmos de ordenador para codones optimizando una secuencia particular para expresión en una célula huésped particular, tales como Gene Forge (Aptagen; Jacobus, PAlo En algunas realizaciones, uno o más cadones (por ej., 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 o más o todos los codones) en una secuencia codificando una enzima CRISPR corresponden al cadón usado lo más frecuentemente para un aminoácido particular
En algunas realizaciones, un vector codifica una enzima CRISPR que comprende una o más secuencias de localización nuclear (las NLS, por sus siglas en inglés), tales como aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS. En algunas rea lizaciones, la enzima CRISPR comprende aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS en o cerca del amino terminal, aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS en o cerca del carboxi terminal o una combinación de estos (por ejemplo, una o más NLS en el amino terminal y una o más NLS en el carboxi terminal). Cuando está presente más de una NLS, cada una se puede seleccionar independientemente de las otras, de manera que puede estar presente una sola NLS en más de una copia y/o junto con otra u otras NLS más presentes en una o más copias. En una realización preferida de la invención, la enzima CRISPR comprende a lo sumo 6 NLS. En algunas realizaciones, se considera una NLS cerca del N-o C-terminal cuando el aminoácido más cercano de la NLS está dentro de aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 o más aminoácidos a lo largo de la cadena polipeptidica del N o e -terminal. Tipicamente, una NLS consta de una o más secuencias cortas de lisinas o argininas cargadas positivamente expuestas en la superficie de la proteína, pero se conocen otros tipos de NLS. Ejemplos no limitantes de las NLS incluyen una secuencia de NLS procedente de: la NLS del antígeno T grande del virus SV40, que tiene la secuencia de aminoácidos PKKKRKV; la NLS de nucleoplasmina (por ej., la NLS bipartita de nucleoplasmina con la secuencia KRPAATKKAGQAKKKK); la NLS de c-myc que tiene la secuencia de aminoácidos PAAKRVKLD o RQRRNELKRSP; la NLS M9 del hRNPA1 que tiene la secuencia NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; la secuencia RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV del dominio lBS de importina-alfa; las secuencias VSRKRPRP y PPKKARED de la proteína T de mioma; la secuencia POPKKKPL de p53 humano; la secuencia SALlKKKKKMAP de c-abl IV de ratón; las secuencias DRLRR y PKQKKRK del virus de la influenza NS 1, la secuencia RKLKKKIKKL del antígeno delta del virus de la Hepatitis; la secuencia REKKKFLKRR de la proteína Mx1 de ratón; la secuencia KRKGDEVDGVDEVAKKKSKK de la poli(ADP-ribosa) polimerasa humana y la secuencia RKCLQAGMNLEARKTKK del glucocorticoide de receptores de hormonas esteroideas (humano)
En general, una o más NLS son de suficiente fortaleza para conducir la acumulación de la enzima CRISPR en una cantidad detectable en el núcleo de una célula eucariota. En general, la fortaleza de actividad de localización nuclear puede proceder del número de las NLS en la enzima CRISPR, la o las NLS particulares usadas o una combinación de estos factores. La detección de acumulación en el núcleo se puede realizar pOf cualquier técnica adecuada. Por ejemplo, se puede condensar un marcador detectable a la enzima CRISPR, de manera que se pueda visualizar la localización dentro de una célula, tal como junto con un medio para detectar la loca lización del núcleo (por ejemplo, una mancha específica para el núcleo tal como DAP!). Ejemplos de marcadores detectables incluyen proteínas fluOfescentes (tales como proteínas fluorescentes Verdes o GFP; RFP; CFP) y etiquetas de epítopos (etiqueta HA, etiqueta bandera, etiqueta SNAP). También se pueden aislar los núcleos celulares de las células, los contenidos de los cuales se pueden analizar después por cualquier procedimiento adecuado para detectar proteína, tal como immunohistoquímica, ensayo de Western o ensayo de actividad enzimática. La acumulación en el núcleo también se puede determinar de una manera indirecta, tal como por un ensayo para el efecto de la formación de complejo CRISPR (pOf ejemplo, ensayo para escisión de ADN o mutación en la secuencia objetivo o ensayo para actividad de expresión de genes modificada afectada por la formación de complejo CRISPR y/o actividad de la enzima CRISPR), cuando se compara con un control 00 expuesto a la enzima o complejo CRISPR o expuesto a una enzima CRISPR que carece de una o más NLS.
En general, una secuencia guía es cualquier secuencia de polinucleótidos que tiene suficiente complementariedad con una secuencia de polinucleótidos objetivo para hibridación con la secuencia objetivo y dirigir la unión específica de la secuencia de un complejo CRISPR a la secuencia objetivo. En algunas realizaciones, el grado de complementariedad entre una secuencia guía y su correspondiente secuencia objetivo, cuando se alinean de manera óptima usando un algoritmo de alineación adecuado, es aproximadamente o más de aproximadamente 50%, 60%,75%, 80%, 85%, 90%, 95%,97,5%,99% o más. La alineación óptima se puede determinar con el uso de cualquier algoritmo adecuado para alinear secuencias, ejemplo no limitante de lo cual incluye el algoritmo Smith-Waterman, el algoritmo Needleman-Wunsch, los algoritmos basados en la transformación de Burrows-Wheeler (por ej., el Alineador de Surrows Wheeler), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies, ELAND (1lIumina, San Diego, CA), SOAP (disponible en soap.genomics.org.cn) y Maq (disponible en maq.sourceforge.net) En algunas realizaciones, una secuencia guía es aproximadamente o más de aproximadamente 5, 10, 11, 12, 13, 14,15,16, 17,18,19,20, 21,22, 23,24,25,26, 27, 28,29, 30, 35, 40, 45, 50, 75 o más nucleótidos de longitud. En algunas rea lizaciones, una secuencia guia es menor que aproximadamente 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 o menos nucle6tidos de longitud. La capacidad de una secuencia guía para dirigir la unión específica de la secuencia de un complejo CRISPR a una secuencia objetivo se puede evaluar por cualquier ensayo adecuado. Por ejemplo, los componentes de un sistema CRISPR suficientes para formar un complejo CRISPR, incluyendo la secuencia guia que se tiene que ensayar, se puede proporcionar a una célula huésped que tenga la correspondiente secuencia objetivo, tal como por transinfección con vectores que codifiquen los componentes de la secuencia CRISPR, seguido por una evaluación de la escisión preferente dentro de la secuencia objetivo, tal como mediante ensayo Surveyor como se describe en la presente memoria. De manera similar, la escisión de una secuencia de polinucleótido objetivo se puede evaluar en un tubo de ensayo proporcionando la secuencia objetivo, los componentes de un complejo CRISPR, incluyendo la secuencia guía que se tiene que ensayar y una secuencia guía de control diferente de la secuencia guía de ensayo y comparando la unión o velocidad de escisión en la secuencia objetivo entre las reacciones de la secuencia guía de ensayo y de control Son posibles otros ensayos, y tendrán lugar para los expertos en la materia.
Se puede seleccionar una secuencia guía para fijar como objetivo cualquier secuencia objetivo. En algunas realizaciones, la secuencia objetivo es una secuencia dentro de un genoma de una célula. Las secuencias objetivo ejemplares incluyen aquéllas que son únicas en el genoma objetivo. Por ejemplo, para la Cas9 de S. pyogenes, una secuencia objetivo única en un genoma puede incluir un sitio objetivo de Cas9 de la forma MMMMMMMMNNNNNNNNNNNNXGG donde NNNNNNNNNNNNXGG (N es A, G, T o C Y X puede ser cualquiera) presenta un solo caso en el genoma. Una única secuencia objetivo en un genoma puede incluir un sitio objetivo de Cas9 de S. pyogenes de la forma MMMMMMMMMNNNNNNNNNNNXGG donde NNNNNNNNNNNXGG (N es A, G, T o C y X puede ser cualquiera) presenta un solo caso en el genoma. Para la Cas9 de CRISPR1 de S. thermophifus, una única secuencia objetivo en un geooma puede incluir un sitio objetivo de Cas9 de la fOfma MMMMMMMMNNNNNNNNNNNNXXAGM W donde NNNNNNNNNNNNXXAGMW (N es A, G, T o C; X puede ser cualquiera y W es A o T) presenta un solo caso en el genoma. Una única secuencia objetivo en un genoma puede incluir un sitio objetivo de Cas9 de CRISPR1 de S thermophifus de la forma MMMMMMMMMNNNNNNNNNNNXXAGMW donde NNNNNNNNNNNXXAGMW (N es A, G, T o C; X puede ser cualquiera y W es A o T) presenta un solo caso en el genoma. Para la Cas9 de S. pyogenes, una sola secuencia objetivo en un geooma puede incluir un sitio objetivo de Cas9 de la forma MMMMMMMMNNNNNNNNNNNNXGGXG donde NNNNNNNNNNNNXGGXG (N es A, G, T o C Y X puede ser cualquiera) presenta un solo caso en el genoma.
Una única secuencia objetivo en un genoma puede incluir un sitio objetivo de Cas9 de S. pyogenes de la forma MMMMMMMMNMNNNNNNNNNNXGGXG donde NNNNNNNNNNNXGGXG (N es A, G, T o C y X puede ser cualquiera) presenta un único caso en el genoma. En cada una de estas secuencias ~M~ puede ser A, G, T o C y requiere que no se coosidere en la identificación de una secuencia como única.
En algunas realizaciones, una secuencia guía se selecciooa para reducir el grado de estructura secundaria dentro de la secuencia guía. La estructura secundaria se puede determinar por cualquier algoritmo de plegamiento de polinucleótidos adecuado. Algunos programas se basan en calcular la energía libre mínima de Gibbs. Un ejemplo de uno de tales algoritmos es mFold, como se describe por Zuker y Stiegler (Nucleic Acid Res. 9 (1.981 ), 133-148). Otro algoritmo de plegamiento de ejemplo es el RNAfold webserver online, desarrollado en el Instituto para Química Teórica de la Universidad de Viena, usando el algoritmo de predicción de estructura centroide (véase por ej., A. R Gruber et al., 2.008, Cel! 106 (1): 23-24 y PA Carr y GM Church, 2.009, Nature 8iotechnology 27 (12): 1.151-62).
En general, una secuencia de emparejamiento tracr incluye cualquier secuencia que presente suficiente complementariedad con una secuencia tracr para activar uno o más de: (1) escisión de una secuencia guía flanqueada por secuencias de emparejamiento tracr en una célula que contiene la correspondiente secuencia tracr y
(2) formación de un complejo CRISPR en una secuencia objetivo, en la que el complejo CRISPR comprende la secuencia de emparejamiento tracr hibridada a la secuencia tracr. En general, el grado de complementariedad es con referencia al alineamiento óptimo de la secuencia de emparejamiento tracr y la secuencia tracr, junto con la longitud del acortador de las dos secuencias. El alineamiento óptimo se puede determinar por cualquier algoritmo de alineamiento adecuado y puede justificar además estructuras secundarias, tal como autocomplementareidad dentro de cualquiera la secuencia tracr o la secuencia de emparejamiento tracr. En algunas realizaciones, el grado de complementariedad entre la secuencia tracr y la secuencia de emparejamiento tracr junto con la longitud del acortador de las dos cuando se alinean de manera óptima es aproximadamente o más de aproximadamente 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% o mayor. Las ilustraciones de ejemplo de alineación óptima entre una secuencia tracr y una secuencia de emparejamiento tracr se proporcionan en las Figuras 128 y
138. En algunas realizaciones, la secuencia tracr es aproximadamente o más de aproximadamente S, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 o más nucleótidos de longitud. En algunas realizaciones, la secuencia tracr y secuencia de emparejamiento tracr están contenidas dentro de una transcripción única, de manera que la hibridación entre las dos produce un transcripto con una estructura secundaria, tal como una horquilla. Las secuencias formadoras de lazo preferidas para uso en estructuras de horquilla tienen cuatro nucleótidos de longitud y lo más preferiblemente tienen la secuencia GAAA Sin embargo, se pueden usar secuencias de lazo más largas o más cortas, como se pueden usar secuencias alternativas. Las secuencias incluyen preferiblemente un triplete nudeótido (por ejemplo, AAA) y un nudeótido adiciooal (por ejemplo C o G). Ejemplos de secuencias formadoras de lazo incluyen CAAA y AAAG. En una rea lización, el transcripto o secuencia de polinucleótidos transcrita presenta al menos dos o más horquillas. En realizaciones preferidas, el transcripto presenta dos, tres, cuatro o cinco horquillas. En una rea lización más, el transcripto presenta a lo sumo cinco horquillas. En algunas realizaciones, el transcripto único incluye además una secuencia de terminación de la transcripción; preferiblemente esta es una secuencia poliT, por ejemplo seis nucleótidos T. Una ilustración de ejemplo de dicha estructura de horquilla se proporciona en la porción inferior de la Figura 138, doode la porción de la secuencia S' del "N" final yaguas arriba del lazo corresponde a la secuencia de emparejamiento tracr y la porción de la secuencia 3' del lazo corresponde a la secuencia tracr. Ejemplos no limitantes adicionales de polinucleótidos únicos que comprenden una secuencia guia, una secuencia de emparejamiento tracr y una secuencia tracr son como sigue (enumerados 5' a 3'), donde "N" representa una base de una secuencia guía, el primer bloque de letras minúsculas representan la secuencia de emparejamiento tracr y el segundo bloque de letras minúsculas secuencia representa la secuencia tracr y la secuencia poli-T final representa el terminador de la transcripción: (1) NNNNNNNNNNNNNNNNNNNNgttttlgtactctcaagatttaGAAAtaaatctlgcagaagctacaaagataaggctl catgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaa I I I I I 1; (2) NNNNNNNNNNNNNNNNNNNNgttttlgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatca acaccctgtcattttatggcagggtgttttcgtlatttaa ¡ I I ¡ I ¡ ; (3) NNNNNNNNNNNNNNNNNNNNgtltttgtactctcaGAAAtgcagaagctacaaagataaggctlcatgccgaaatca acaccctgtcattttatggcagggtgtl I ¡ I I ¡; (4) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaa agtggcaccgagtcggtgc I I I I I 1; (5) NNNNNNNNNNNNNNNNNNNNgtlttagagctaGAAATAGcaagtlaaaataaggctagtccgttatcaactlgaa aaagtg I I I I I I 1; Y (6) NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTT TTI En algunas realizaciones, las secuencias (1) a (3) se usan junto con Cas9 de CRISPR1 S. thermophilus. En algunas realizaciones, las secuencias (4) a (6) se usan junto con Cas9 de S. pyogones. En algunas realizaciones, la secuencia tracr es un transcrito separado de una transcripción que comprende la secuencia de emparejamiento tracr (tal como se ilustra en la porción superior de la Figura 138).
En algunas realizaciones, también se proporciona una plantilla de recombinación. Una plantilla de recombinaci6n puede ser un componente de otro vector como se describe en la presente memoria, contenido en un vector separado o proporcionado como un polinucleótido separado. En algunas realizaciones, se diseña una plantilla de recombinación para servir como una plantilla en recombinación homóloga, tal como dentro de o cerca de una secuencia objetivo nickeada o escindida por una enzima CRISPR como parte de un complejo CRISPR. Un polinucleótido de plantilla puede ser de cualquier longitud adecuada, tal como aproximadamente o más de aproximadamente 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1.000 o más nucleótidos de longitud. En algunas realizaciones, el polinucleótido de plantilla es complementario a una porción de un polinucleótido que comprende la secuencia objetivo. Cuando se alinea de manera óptima, un polinucleótido de plantilla puede solaparse con uno o más nucleótidos de una secuencia objetivo (por ej., aproximadamente o más de aproximadamente 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 o más nucleótidos). En algunas rea lizaciones, cuando una secuencia de plantilla y un polinucleótido que comprende una secuencia objetivo se alinean de manera óptima, el nucleótido más cercano del polinucleótido de plantilla está dentro de aproximadamente 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1.000, 5.000, 10.000 o más nucleótidos de la secuencia objetivo.
En algunas realizaciones, la enzima CRISPR es parte de una proteina de fusión que comprende uno o más dominios de proteína heteróloga (por ej., aproximadamente o más de aproximadamente 1,2,3,4,5,6,7,8,9, 10 o más dominios además de la enzima CRISPR). Una proteína de fusión de enzima CRISPR puede comprender cualquier secuencia de proteinas adicional y opcionalmente una secuencia ligadora entre dos dominios cualesquiera. Ejemplos de dominios de proteínas que se pueden condensar a una enzima CRISPR incluyen, sin limitación, etiquetas de epítopos, secuencias de genes informadores y dominios de proteínas con una o más de las siguientes actividades: actividad de metilasa, actividad de desmetilasa, actividad de activaciÓfl de la transcripción, actividad de represión de la transcripción, actividad del factor de liberación de la transcripción, actividad de modificación de histona, actividad de escisión de ARN y actividad de unión de ácidos nucleicos. Ejemplos no limitantes de etiquetas de epitopos incluyen etiquetas de histidina (His), etiquetas V5, etiquetas FLAG, etiquetas de hemaglutinina de la influenza (HA), etiquetas Myc, etiquetas VSV-G y etiquetas de tioredoxina (Trx). Los ejemplos de genes informadores incluyen, pero no se limitan a, glutationa-S-transferasa (GST), peroxidasa de rábano (HRP, por sus siglas en inglés), cloramfenicol acetiltransferasa (CAT, por sus siglas en inglés) beta-galactosidasa, betaglucuronidasa, luciferasa, proteína fluorescente verde (PFV), HcRed, OsRed, proteina ftuorescente cian (PFC) proteina fluorescente amarilla (PFAm) y proteinas autofluorescentes incluyendo proteina fluorescente azul (PFA) Una enzima CRISPR se puede condensar a una secuencia de genes que codifique una proteína o un fragmento de una proteína que una moléculas de ADN u otras moléculas celulares, incluyendo pero no limitándose a (por sus siglas en inglés), protelna de unión de maltosa (MBP), etiqueta S, fusiones de dominios de unión de AON Lex A (OBO), fusiones de dominios de unión de AON GAL4 y fusiones de proteínas BP16 de virus del herpes simple (HSV). Los dominios adicionales que pueden formar parte de una proteína de fusión que comprende una enzima CRISPR se describen en la patente de EE.UU. 20110059502. En algunas realizaciones, se usa una enzima CRISPR etiquetada para identificar la posición de una secuencia objetivo
En algunos aspectos, la descripción proporciona métodos que comprenden suministrar uno o más polinucleótidos, tales como o uno o más vectores como se describe en la presente memoria, uno o más transcritos de los mismos yfo una o proteínas transcritas de allí, a una célula huésped. En algunos aspectos, la descripción proporciona además células producidas por tales métodos y organismos (tales como animales, plantas u hongos) que comprenden o son producidos de tales células. En algunas rea lizaciones, se suministra una enzima CRISPR junto con (y opcionalmente complejada con) una secuencia guía a una célula. Se pueden usar métodos de transferencia de genes con base vírica y no virica convencionales para introducir ácidos nucleicos en células de mamifero o tejidos objetivo. Se pueden usar dichos métodos para administrar componentes que codifican ácidos nucleicos de un sistema CRISPR a células en cultivo o en un organismo huésped. Los sistemas de suministro de vectores no víricos incluyen plásmidos de AON, ARN (por ej., un transcrito de un vector descrito en la presente memoria), ácido nucleico desnudo y ácido nucleico complejado con un vehículo de suministro, tal como un liposoma. Los sistemas de suministro de vectores viricos incluyen virus de AON y ARN, que tienen genomas episomales o integrados después de suministro a la célula. Para una revisión de procedimientos de tratamiento de genes, véase Anderson, Science
256: 808-813 (1.992); Nabel & Felgner, TIBTECH 11: 211-217 (1.993); Mitani & Caskey, TIBTECH 11· 162-166 (1 .993); Dillon, TIBTECH 11 167-175 (1 .993); Miller, Nature 357: 455-460 (1 .992); Van Brunt, Biotechnology 6 (10) 1.149-1.154 (1.988); Vigne, Restorative Neurology and Neuroscience 8: 35-36 (1.995); Kremer & Perricaudet, British Medical Bulletin 51 (1): 31-44 (1.995); Haddada et al., en Current Topics in Microbiology and Immunology Ooerfler and B6hm (eds) (1.995) y Yu et al., Gene Therapy 1. 13-26 (1.994).
Los métodos de suministro no vírico de ácidos nucleicos incluyen lipofección, nucleofección, microinyecciÓfl, biolística, virosomas, liposomas, inmunoliposomas, conjugados de policatión o lípido:ácido nucleico, ADN desnudo, viriones artificiales y absorción de AON aumentada por agente. La lipofeción se describe en por ej., Las Patentes de EE.UU_ N° 5.049.386, 4.946.787 Y 4.897.355) Y se venden comercialmente los reactivos de lipofeción (por ej., Transfectam™ y Lipofectin™). Los lípidos catiónicos y neutros que son adecuados para lipafeción de reconocimiento de receptores eficaz de polinucleótidos incluyen aquéllos de Felgner, Patente Internacional WO 91117424; Patente Intemacional WO 91116024. El suministro puede ser a células (por ej., administración in vitro o ex vivo) o tejidos objetivo (por ej., administración in vivo)
La preparación de complejos de lípido:ácido nucleico, incluyendo liposomas fijados como objetivo tales como complejos de inmunolipidos, es conocida para un experto en la materia (véase, por ej., Crystal, Science 270: 404410 (1_995); Blaese et al., Cancer Gene Ther. 2: 291-297 (1.995); Behr et al., Bioconjugate Chem. 5: 382-389 (1.994); Remy et al., Bioconjugate Chem. 5: 647-654 (1.994); Gao et al., Gene Therapy 2: 710-722 (1.995); Ahmad et al., Cancer Res. 52: 4.817-4.820 (1.992); Patentes de EE.UU. N° 4.186.183; 4.217.344; 4.235.871, 4.261.975;
4.485.054; 4.501.728; 4.774.085; 4.837.028 Y 4.946.787).
El uso de sistemas de base vírica de ARN o AON para el suministro de ácidos nucleicos toma ventaja de los procedimientos altamente desarrollados para fijar como objetivo un virus a células específicas en el cuerpo y traficar la carga útil virica al núcleo. Se pueden administrar vectores víricos directamente a pacientes (in vivo) o se pueden usar para tratar células in vitro y las células modificadas se pueden administrar opcionalmente a los pacientes (ex vivo). Los sistemas con base vírica convenciooales podían incluir vectores retrovirales, de lentivirus, adenovirales, adenoasociados y del virus del herpes simple para transferencia de genes. La integración en el genoma huésped es posible con los métodos de transferencia de genes de retrovirus, lentivirus y virus adenoasociados, dando como resultado con frecuencia expresión a largo plazo del transgen insertado. Adicionalmente, se han observado altas eficacias de transducción en muchos tipos celulares diferentes y tejidos fijados como objetivo
El tropismo de un retravirus se puede modificar por incorporación de proteínas de sobre extrañas, expandiendo la población objetivo potencial de células objetivo. Los vectores lentivirales son vectores retrovirales que son capaces de transducir o infectar células no de división y típicamente producen títulos víricos altos. La selección de un sistema de transferencia de genes retrovirales dependería por lo tanto del tejido objetivo. Los vectores retrovirales están constituidos por repeticiones terminales largas que actúan en cis con capacidad de empaquetamiento para hasta 6· 10 kb de secuencia extraña. Las minimas LTR que actúan en cis son suficientes para la replicación y empaquetamiento de los vectores, que se usan después para integrar el gen terapéutico en la célula objetivo para proporcionar expresión de transgenes permanente. Los vectores relrovirales ampliamente usados incluyen los basados en virus de la leucemia murina (MuLV), virus de la leucemia del mono gibón (GaLV), virus de la inmunodeficiencia simia (VIS), virus de la inmunodeficiencia humana (VIH) y combinaciones de los mismos (véase, por ej., Buchscher et al., J. Viral. 66: 2.731·2.739 (1.992); Johann et al., J. Viral. 66: 1.635-1.640 (1.992); Sommnerfelt et al., Viral. 176: 58-59 (1.990); Wilson et al., J. Virol. 63: 2.374-2.378 (1.989); Miller et al., J. Virol. 65· 2.220-2.224 (1991 ); Patente de EE.UU. PCTfUS94(05700).
En aplicaciones donde se prefiere la expresión transitoria, se pueden usar sistemas a base de adenovirus. Los vectores a base de adenovirus son capaces de una eficacia de transducción muy alta en muchos tipos de células y no requieren división celular. Con tales vectores, se han obtenido altos titulas y niveles de expresión. Este vector se puede producir en grandes cantidades en un sistema relativamente simple. También se pueden usar vectores de virus adenoasociados r AAV", por sus siglas en inglés) para transducir células con ácidos nucleicos objetivo, por ejemplo, en la producción in vitro de ácidos nucleicos y péptidos y para procedimientos de tratamiento con genes in vivo y ex vivo (véase, por ej., West et al., Virology 160: 38-47 (1.987); la Patente de EE.UU. N° 4.797.368; la patente internacional WO 93f24641 , Kotin, Human Gene Therapy 5: 793-801 (1.994); Muzyczka, J. Clin. Inves!. 94: 1.351 (1.994). Se describe la construcción de vectores AAV recombinantes en una serie de publicaciones, incluyendo la Patente de EE.UU. N° 5.173.414; Tralschin el al., Mol. Cell. Biol. 5: 3.251-3.260 (1.985); Tratschin, et al., Mol. Cell Biol. 4: 2.072-2.081 (1.984); Hermonat & Muzyczka, PNAS 81· 6.466-6.470 (1.984) Y Samulski et al., J. Virol. 63· 03822-3828 (1 .989)
Típicamente se usan células de empaquetamiento para formar partículas de virus que sean capaces de infectar una célula huésped. Tales células incluyen células 293, que empaquetan adenovirus, y células 412 o células PA317, que empaquetan retrovirus. Los vectores víricos usados en terapia génica se generan habitualmente produciendo una estirpe celular que empaqueta un vector de ácidos nucleicos en una partícula vírica. Los vectores contienen típicamente las mínimas secuencias víricas requeridas para empaquetamiento y posterior integración en un huésped, siendo reemplazadas otras secuencias viricas por una casete de expresión para el polinucleótido o los polinucleótidos que se tienen que expresar. Las funciones víricas que faltan se suministran típicamente en trans por la estirpe celular de empaquetamiento. Por ejemplo, los vectores AAV usados en terapia génica típicamente poseen sólo secuencias ITR del genoma AAV que se requieren para empaquetamiento e integración en el genoma huésped. El ADN vírico se empaqueta en una estirpe celular, que contiene un plásmido auxiliar que codifica los otros genes AAV, es decir rep y cap, pero carecen de secuencias ITR. La estirpe celular también puede infectarse con adenovirus como auxiliar. El virus auxiliar activa la replicación del vector AAV y la expresión de genes AAV del plásmido auxiliar. El plásmido auxiliar no se empaqueta en cantidades significativas debido a ausencia de secuencias ITR. La contaminación con adenovirus se puede reducir pO(, por ejemplo, tratamiento térmico al cual es más sensible el adenovirus que AAV. Los métodos adicionales para el suministro de ácidos nucleicos a células son conocidos para los expertos en la materia. Véase, por ejemplo, la Patente de EE.UU. 20030087817
En algunas rea lizaciones, una célula huésped se transinfecta de manera transitoria o de manera no transitoria con uno o más vectores descritos en la presente memoria. En algunas realizaciones , una célula se transinfecta como tiene lugar de manera natural en un ind ividuo. En algunas rea lizaciones, una célula que se transinfecta es tomada de un individuo. En algunas rea lizaciones, la célula procede de células tomadas de un individuo, tales como una estirpe celular. Una amplia variedad de estirpes celulares de cultivos de tejido se conocen en la técnica. Ejemplos de estirpes celulares incluyen, pero no se limitan a, C8161 , CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1 , HUh4, HUh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, T F1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaC02, P38801, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01 , LRMB, BcI-1 , BC-3, IC21 , DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, CaS-1, COS-6, CaS-M6A, epitelial de riñón de mono BS-C-1 , fibroblasto de embrión de ratón BALBf 3T3, 3T3 Swiss, 3T3-L 1, fibroblastos fetales humanos 132-d5; fibroblastos de ratón 10.1, 293-T, 3T3, 721, 9L, A2780, A2780AoR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, células BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1I2, C6f36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO ohfr -f-, COR-L23, COR-L23fCPR, COR-L23f5010, COR-L23fR23, COS-7, COV-434, CML T1, CMT, CT26, 017, oH82, OU145, DuCaP, EL4, EM2, EM3, EMT6fAR1 , EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, células JY, células K562, Ku812, KCL22, KG1 , KY01 , LNCap, MaMel 1-48, MC-38, MCF-7, MCF-10A, MoA-MB-231, MDA-MB-468, MDA-MB-435, MDCK 11, MDCK 11, MORlO.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69fCPR, NCI-H69fLX10, NCI -H69fLX20, NCI -H69fLX4, NIH-3T3, NALM-1, NW-145 estirpes celulares OPCN / OPCT, Peer, PNT-1A f PNT 2, RenCa, RIN-5F, RMAlRMAS, células Saos-2, Sf9, SkBr3, T2, T-47o, T84, estirpe celular THP1, U373, U87, U937, VCaP, células Vero, WM39, WT-49, X63 YAC-1, YAR Y variedades transgénicas de los mismos. Las estirpes celulares están disponibles de una variedad de fuentes conocidas por los expertos en la materia (véase, por ej., La Colección de Cultivos de Tipo Americano (ATCC, por sus siglas en inglés) (Manassus, Va.)). En algunas realizaciones, una célula transinfectada con uno o más vectores descritos en la presente memoria se usa para establecer una nueva estirpe celular que comprende una o más secuencias procedentes de vector. En algunas realizaciones, una célula Iransinfectada de manera transitoria con los componentes de un sistema CRISPR como se describe en la presente memoria (tal como por transinfección transitoria de uno o más vectOfes o transinfección con ARN) y modificada por la actividad de un complejo CRISPR, se usa para establecer una nueva estirpe celular que comprende células que contienen la modificación pero carecen de otra secuencia exógena. En algunas realizaciones, las células Iransinfectadas de manera transitoria o de manera no transitoria con uno o más vectores descritos en la presente memoria o estirpes celulares procedentes de dichas células se usan en la valoración de uno o más compuestos de ensayo
En algunas realizaciones, uno o más vectOfes descritos en la presente memoria se usan para producir un animal transgénico no humano o planta transgénica. En algunas realizaciones, el animal transgénico es un mamifero, tal como un ratón, rata o conejo. En algunas realizaciones, el organismo o individuo es una planta. En algunas realizaciones, el organismo o individuo o planta es un alga. Los métodos para producir plantas y animales transgénicos son conocidos en la técnica y generalmente empiezan con un método de transinfección de células, tal como se describe en la presente memoria. También se proporcionan animales transgénicos como son plantas transgénicas, especialmente cultivos y algas. El animal o la planta transgénicos pueden ser útiles en aplicaciones fuera de proporcionar un modelo de enfermedad. Éstas pueden incluir producción de alimentos o de alimentación por expresión de, por ejemplo, mayores niveles de proteína, carbohidrato, nutriente o vitaminas que lo que se observaría normalmente en el tipo natural. Con respecto a esto, se prefieren las plantas transgénicas, especialmente legumbres y tubérculos y animales, especialmente los mamiferos tales como ganado (vacas, ovejas, cabras y cerdos), pero también aves de corral e insectos comestibles.
Las algas transgénicas u otras plantas tales como colza pueden ser útiles en particular en la producción de aceites vegetales o biocombustibles tales como alcoholes (especialmente metanol y etanol), por ejemplo. Estos se pueden conseguir por ingenieria para expresar o sobreexpresar altos niveles de aceite o alcoholes para uso en las industrias de aceites o biocombustibles
En un aspecto, la descripción proporciona métodos para modificar un polinucleótido objetivo en una célula eucariota En algunas realizaciones, el método comprende permitir que un complejo CRISPR se una al polinucleótido objetivo para efectuar la escisiÓfl de dicho polinucleótido objetivo modificando de ese modo el polinucleólido objetivo, en la que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia fijada como objetivo dentro de dicho polinucleótido objetivo, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez hibrida a una secuencia tracr
En un aspecto, la descripción proporciona un método para modificar la expresión de un polinucleótido en una célula eucariota. En algunas realizaciones, el método comprende permitir que un complejo CRISPR se una al polinucleótido de manera que dicha unión dé como resultado expresión aumentada o disminuida de dicho polinucJeótido; en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guia hibridada a una secuencia fijada como objetivo dentro de dicho polinucleótido, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento traer que a su vez hibrida a una secuencia traer.
Con los recientes avances en la genórn ica de cu ltivos , la capacidad para usar sistemas CRISPR-Cas para real izar edición de genes y manipulación eficaz y de coste eficaz permitirá la rápida selección y la comparación de manipulaciones genéticas únicas y multiplexadas para transformar dichos genomas para producción mejorada y cebos mejorados. Con respecto a esto se hace referencia a las Patentes y publicaciones de EE.UU .. Patente de EE.UU. N° 6.603.061 -Agrobacterium-Mediated Plant Transformation Method; la Patente de EE.UU. N° 7.868.149 -Plant Genome Sequences and Uses Thereof y la Patente de EE.UU. 2009f0100536 -Transgenic Plants with Enhanced Agronomic Traits. Morrell el al "Crop genomics: advances and applications" Na! Rev Gene!. 29 de diciembre de 2.011 , 13 (2): 85-96. En una realización ventajosa de la invención, el sistema CRISPRlCas9 se usa para lograr por ingeniería micro algas (Ejemplo 14). De acuerdo con esto, la referencia de la presente memoria a células de animales puede aplicarse también, mutatis mutandis, a células de plantas a menos que sea evidente de otro modo
En un aspecto, la descripción proporciona métodos para modificar un polinucleótido objetivo en una célula eucariota, que puede ser in vivo, ex vivo o in vitro En algunas realizaciones, el método comprende muestrear una célula o población de células de un animal humano o no humano o planta (incluyendo microalgas) y modificar la célula o células. Puede tener lugar cultivo en cualquier fase ex vivo. La célula o las células pueden ser introducidas de nuevo incluso en el animal no humano o planta (incluyendo microalgas)
En un aspecto, la descripción proporciona estuches que contienen uno o más cualesquiera de los elementos descritos en los métodos y composiciones anteriores. En algunas realizaciones, el estuche comprende un sistema vector e instrucciones para usar el estuche. En algunas realizaciones, el sistema vector comprende (a) un primer elemento regulador unido de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserción para insertar una secuencia guía aguas arriba de la secuencia de emparejamiento traer, en el que cuando se expresa, la secuencia guia dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia fijada como objetivo en una célula eucariota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia traer yfo (b) un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear. Los elementos se pueden proporcionar de manera individual o en combinaciones y se pueden proporcionar en cualquier envase adecuado, tal como un vial, un frasco o un tubo. En algunas realizaciones, el estuche incluye instrucciones en uno o más idiomas, por ejemplo en más de un idioma.
En algunas realizaciones, un estuche comprende uno o más reactivos para uso en un procedimiento utilizando uno o más de los elementos descritos en la presente memoria_ Los reactivos se pueden proporcionar en cualquier envase adecuado. Por ejemplo, un estuche puede proporcionar uno o más tampones de reacción o de almacenamiento. Los reactivos se pueden proporcionar en una forma que sea utilizable en un ensayo particular o en una forma que requiera la adición de otro u otros componentes más antes de uso (por ejemplo, en forma concentrada o liofilizada). Un tampón puede ser cualquier tampón, incluyendo pero no limitándose a tampón de carbonato de sodio, un tampón de bicarbonato de sodio, un tampórJ de bOfato, un tampón de Tris, un tampón de MOPS, un tampón de HEPES y combinaciones de los mismos. En algunas realizaciones, el tampón es alcalino. En algunas realizaciones, el tampón presenta un pH de aproximadamente 7 a aproximadamente 10. En algunas realizaciones, el estuche comprende uno
o más o ligonucle6tidos correspondientes a una secuencia guia para inserción en un vector de manera que se una de manera operable a la secuencia guia y un elemento regulador En algunas realizaciones, el estuche comprende un polinucleótido de plantilla de recombinación homólogo.
En un aspecto, la descripción proporciona métodos para usar uno o más elementos de un sistema CRISPR El complejo CRISPR de la invención proporciona un medio eficaz para modificar un polinucleótido objetivo. El complejo CRISPR de la invención presenta una amplia variedad de utilidad incluyendo modificación (por ej., supresión, inserción, traslocación, inactivaciórJ, activación) de un polinucleótido objetivo en una multiplicidad de tipos de células. Como tal el complejo CRISPR de la invención presenta un amplio espectro de aplicaciones en, por ej., tratamiento génico, investigación de fármacos, diagnóstico de enfermedades y prognosis. Un complejo CRISPR ejemplar comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia fijada como objetivo dentro del polinucleótido objetivo. La secuencia guía está ligada a una secuencia de emparejamiento tracr, que a su vez hibrida a una secuencia tracr
El polinucleótido objetivo de un complejo CRISPR puede ser cualquier polinucleótido endógeno o exógeno a la célula eucariota. Por ejemplo, el polinucle6tido objetivo puede ser un polinucle6tido que resida en el núcleo de la célula eucariota. El polinucleótido objetivo puede ser una secuencia que codifique un producto gérJico (por ej., una proteina) o una secuencia no codificadora (por ej., un polinucle6tido regulador o un ADN basura). Sin desear estar limitados por la teoría, se eree que la secuencia objetivo debería estar asociada a un PAM (unidad adyacente protoespaciadora); esto es, una secuencia corta reconocida por el complejo CRISPR Los requerimientos de secuencia y longitud precisos para el PAM difieren dependiendo de la enzima CRISPR usada, pero los PAM son típicamente secuencias de 2-5 pares de bases adyacentes al protoespaciador (esto es, la secuencia objetivo) Ejemplos de secuencias PAM se proporcionan en la sección de ejemplos a continuación y el experto podrá identificar secuencias PAM adicionales para uso con una enzima CRISPR determinada
El polinucleótido objetivo de un complejo CRISPR puede incluir una serie de genes y polinucleótidos asociados a enfermedades así como genes y polinucle6tidos asociados a ruta bioquímica de seña lización.
Ejemplos de polinucle6tidos objetivo incluyen una secuencia asociada a una ruta bioquímica de seña lización, por ej., un gen o polinucleótido asociado a una ruta bioquímica de señalización. Ejemplos de polinucleótidos objetivo incluyen un gen o polinucleótido asociado a una enfermedad. Un gen o polinucleótido "asociado a una enfermedad" se refiere a cualquier gen o polinucleótido que esté proporcionando productos de transcripción o traducción en un nivel anOfmal o en una forma anormal en las células procedentes de tejidos afectados por una enfermedad comparado con tejidos o células de un control no de enfennedad. Puede ser un gen que llegue a expresarse a un nivel anormalmente alto; puede ser un gen que llegue a expresarse a un nivel anormalmente bajo, donde la expresión modificada se correlaciona con la aparición y/o progresión de la enfermedad. Un gen asociado a la enfermedad también se refiere a un gen que posee mutación o mutaciones o variación genética que es directamente responsable o está ligada a desequilibrio con un gen, o genes, que es responsable de la etiología de una enfermedad. Los productos transcritos o traducidos pueden ser conocidos o desconocidos y puede ser a un nivel normal o anormal
Ejemplos de genes y polinucleótidos asociados a una enfermedad están disponibles en Instituto McKusick-Nathans de Medicina Genética, Universidad de Johns Hopkins (Baltimore, Md.) y Centro Nacional para Información de Biotecnología, Biblioteca Nacional de Medicina (Betesda, Md.l, disponible en la Red Informática Mundial
Ejemplos de genes y polinucleótidos asociados a una enfermedad se enumeran en las Tablas A y B. La información
5 específica de la enfermedad está disponible en el Instituto McKusick-Nathans de Medicina Genética, Universidad de Johns Hopkins (Baltimore, Md.) y Centro Nacional para InformaciórJ de Biotecnología, Biblioteca Nacional de Medicina (Betesda, Md.l, disponible en la Red Informática Mundial. Ejemplos de genes y polinucleótidos asociados a una ruta bioquímica de señalizaciórJ se enumeran en la Tabla C.
Las mutaciones en estos genes y rutas pueden dar como resultado la producción de proteínas inapropiadas o
10 proteínas en cantidades inapropiadas que afecten a la función. Tales genes, proteínas y rutas pueden ser el polinucleótido objetivo de un complejo CRISPR.
Tabla A Tabla B
ENFERMEDADrTRASTDRNOS
GEN (ES)
Neoplasia
PTEN ; ATM; ATR; EGFR; ERBB2; ERBB3; ERBB4;
Notch1 ; Notch2; Notch3; Notch4; AKT; AKT2 ; AKT3; HIF;
HIF1a; HIF3a; Met; HRG; Bcl2; PPAR alfa ; PPAR
gamma; WT1 (Tumor Wilms l ; Fam ilia Receptor FGF
miembros (5 miembros: 1, 2, 3, 4, 5); CDKN2a; APC ; RB
(retinoblastoma); MEN1 ; VHL; BRCA1 ; BRCA2; AR
(Receptor Andrógenos ); TSG101 ; IGF; Receptor IGF; Igf1 (4
variantes); Igf2 (3 variantes); Receptor Igf 1, Receptor Igf 2;
Bax; Bc12; familia caspases (9 miembros·
1, 2, 3,4,6, 7 , 8, 9,12); Kras ; Apc
Degeneración
Abcr; Cc12; Cc2; cp (ceruloplasmina); Timp3; catepsina D;
Macular relacionada con la edad
Vid Ir; Ccr2
Esquizofrenia
Neuregulina1 (Nrg1 ); Erb4 (receptor para Neuregulina);
Complexina1 (Cplx1 ); Tph1 Triptófano hidroxilasa; Tph2
Tript6fano hidroxilasa 2; Neurexina 1, GSK3; GSK3a;
GSK3b
Trastornos
5-HIT (Slc6a4); CDMT; DRD (Drd1a); SLC6A3; DADA;
DTNBP1 ; Dao (Oa01 )
Repetición del trinucleótido
HIT (Huntington's Dx) ; SBMAlSMAX1 fAR (Kennedy's
Trastornos
Dx); FXN/X25 (Friedrich's Ataxia); ATX3 (Machado
Joseph's Ox); ATXN1 y ATXN2 (ataxia
espinocerebelar); DMPK (distrofia miotón ica); Atrophin-1 y Atn1
(DRPLA Dx); CBP (Creb-BP -inestabilidad global); VLDLR
(Alzheimer's); Atxn7; Atxn10
Síndrome frágil X
FMR2 ; FXR1 ; FXR2; mGLUR5
Trastornos
APH-1 (alfa y beta); Presenilina (Psen1) ; nicastrina
Relacionados con la secrelasa
(Ncstn); PEN-2
Otros
Nos1 , Parp1 , Nat1 , Nat2
Trastornos relacionados con priones
P",
ALS
SOD1 , ALS2 ; STEX; FUS ; TAROBP; VEGF (VEGF-a;
VEGF-b; VEGF-c)
ENFERMEDADfTRASTORNOS
GEN (ES)
Drogadicción
Prkce (a lcohol); Drd2; Ord4; ABAT (alcohol); GRIA2;
Grm5; Grin1 ; Htr1b; Grin2a; Drd3; Pdyn; Gria1 (a lcohol)
Autismo
Mecp2; BZRAP1 , MOGA2; SemaSA; Neurexina 1; Frágil X
(FMR2 (AFF2); FXR1 , FXR2; Mglur5)
enfermedad de Alzheimer
E1 ; CHIP; UCH; UBB; Tau; LRP; PICALM _; Clusterina; PS1 ;
SORL 1; CR1 , Vid Ir; Uba1 ; Uba3; CHIP28 (Aqp1 ,
Aquaporina 1); Uch11; Uch l3; APP
Inftamación
IL-10; IL-1 (IL-1a; IL-1b); IL-13; IL-17 (IL-17a (CTLA8); IL
17b; IL-17c; IL-17d; IL-17f); 11 -23; Cx3cr1 ; ptpn22; TNFa;
NOD2ICARD15 para IBD; IL-6; IL-12 (IL-12a; IL-12b);
CTLA4; Cx3cl1
enfermedad de Parkinson
x-Synuclein; DJ -1; LRRK2; Parkin; PINK1
Enfermedades y trastomos
Anemia (CDAN1, CDA1, RPS19, DBA, PKLR, PK1, NT5C3, BUMPH1, PSN1, RHAG, de la sangre y la coagulación
RH50A, NRAMP2, SPTB, ALAS2, ANH1, ASB, ABCB7, ABC7, ASAT); síndrome de linfocito desnudo (TAPBP, TPSN, TAP2, ABCB3, PSF2, RING11, MHC2TA, C2TA, RFX5, RFXAP, RFX5), Trastomos de sangrado (TBXA2R, P2RX1 , P2X1 ); Factor H y factor H tipo -1 (HF1 , CFH, HUS); Factor V y factor VIII (MCF02); deficiencia de Factor VII (F7); deficiencia de Factor X (F10); deficiencia de Factor XI (F11); deficiencia de Factor XII (F12, HAF); deficiencia de Factor XJIIA (F13A1 , F13A); deficiencia de Factor XIIIB (F13B); anemia Fanconi (FANCA, FACA, FA1 , FA, FAA, FAAP9S, FAAP90, FLJ34064, FANCB, FANCC, FACC, BRCA2, FANC01, FANC02, FANCO, FACO, FAO, FANCE, FACE, FANCF, XRCC9, FANCG, BRIP1, BACH1, FANCJ, PHF9, FANCL, FANCM, KIAA1596); trastornos Linfohistiocitosis Hemofagocitica (PRF1 , HPLH2, UNC13D, MUNC13-4, HPLH3, HLH3, FHL3); Hemofilia A (F8, F8C, HEMA); Hemofilia B (F9, HEMB), trastornos hemorrágicos (PI, An, F5); deficiencias y trastomos de leuoocia (ITGB2, C018, LCAMB, LAO, EIF2B1, EIF2BA, EIF2B2, EIF2B3, EIF2BS, LVWM, CACH, CLE, EIF2B4); anemia depranocltica (HBB); Talasemia (HBA2, HBB, HBD, LCRB, HBA1)
Desregu lación celular y
Linfoma no de Hodgkin de célu las B (BCL7A, BCL7); Leucemia (TAL 1, TCL5, SCL,
enfermedades y trastomos
TAL2, FLT3 , NBS1 , NBS, ZNFN1A1 , IK1 , LYF1 , HOXD4, HOX4B, BCR, CML, PHL,
oncológicos
ALL, ARNT, KRAS2, RASK2, GMPS, AF10 , ARHGEF12, LARG, KlAA0382, CALM,
CLTH , CEBPA, CEBP, CHIC2 , BTL, FLT3, KIT, PBT, LPP, NPM1 , NUP214, D9S46E,
CAN , CAIN, RUNX1 , CBFA2, AML1 , WHSC1L 1, NS03, FLT3, AF1Q, NPM1 , NUMA1 ,
ZNF 145, PLZF , PML, MYL, STAT5B, AF 10, CALM , CLTH, ARL11 , ARLTS1 , P2RX7,
P2X7, BCR, CML, PHL, ALL, GRAF, NF1 , VRNF , WSS, NFNS, PTPN11 , PTP2C,
SHP2, NS1 , BCL2, CCN01 , PRA01 , BCL1 , TCRA, GATA1 , GF1 , ERYF1 , NFE1 ,
ABL 1, NQ01 , OIM, NMOR1 , NUP214, 09S46E , CAN, CAl N).
Inftamación y enfermedades
AIDS (KIR3DL 1, NKAT3, NKB1 , AMB11 , KIR3DS1 , IFNG, CXCL 12, SDF1); síndrome y trastornos
linfoproliferativo auloinmunitario (TNFRSF6, APT1 , FAS, CD9S, ALPS1A); inmunorelacionados
immunodeficiencia combinada, (IL2RG, SCIDX1, SCIDX, IMD4); HIV-1 (CCL5, SCYA5, D17S136E, TCP228), susceptibilidad o infección por V1H (IL 10, CSIF, CMKBR2, CCR2, CMKBRS, CCCKR5 (CCRS)); Inmunodeficiencias (C03E, C03G, AICOA, AIO, HIGM2, TNFRSF5, C040, UNG, OGU, HIGM4, TNFSFS, C040LG, HIGM1, IGM, FOXP3, IPEX, AIID, XPID, P1DX, TNFRSF14B, TACI ); Inftamación (IL10, IL-1 (IL-1a, IL-1b), IL-13, IL-17 (IL-17a(CTLA8), IL-17b, IL-17c, IL-17d, IL-17f), 1123, Cx3cr1, ptpn22, TNFa, NOO2/CAR01S for IBO, IL-6, IL-12 (IL-12a, IL-12b), CTLA4, Cx3c11 ); inmunodeficiencias combinadas severas (SCIOs)(JAK3, JAKL, OCLRE1C, ARTEMIS, SCIOA, RAG1, RAG2, ADA, PTPRC, C04S, LCA, IL7R, C030, T3D, IL2RG, SCIDX1, SCIDX, IMD4)
Enfermedades y trastornos
Neu ropatia amiloide (TTR, PAlB); Amiloidosis (APOA1 , APP, AAA, CVAP, AD1 ,
metabólicos, hepáticos,
GSN, FGA, LYZ, TIR, PAl B); Cirrosis (KRT18, KRT8 , C1RH1A, NAIC, TEX292 ,
renales y proteínicos
K1M1988); fibrosis quística (CFTR, ASCC7, CF, MRP7); enfermedades de almacenamiento de glucógeno (SlC2A2, GlUT2, G6PC, G6PT, G6PT1 , GAA, LAMP2 , LAMPB , AGl, GOE, GBE1 , GYS2, PYGl, PFKM); adenoma hepático, 142330 (TCF1, HNF1A, MODY3), fallo hepático, comienzo temprano y trastomo neurol6gico (SCOD1 , SC01 ), deficiencia de lipasa hepática (UPC), Hepatoblastoma, cáncer y carcinomas (CTNNB1 , PDGFRl, PDGRl, PRlTS, AXIN1 , AXIN , CTNNB1 , TP53, P53, lFS1 , IGF2R, MPRI, MET, CASpa, MCH5; enfermedad del riñón quístico medular (UMOD , HNFJ, FJHN, MCKD2, AOMCKD2); Fen ilcetonuria (PAH , PKU1 , QDPR, DHPR, PTS); enfermedad renal y hepática poliquística (FCYT, PKH01 , ARPKD, PKD 1, PKD2, PKD4, PKDTS, PRKCSH, G19P1 , PClD, SEC63).
enfermedades y trastornos
Distrofia muscular de Becker (DMD, BMD, MYF6), Distrofia muscular de Duchenne
musculares I del esqueleto
(DMD, BMD); Distrofia muscular de Emery-Dreifuss (lMNA, lMN1 , EMD2, FPlD, CMD1A, HGPS, lGMD1B, lMNA, LMN1 , EMD2, FPlD, CMD1A); Distrofia muscu lar de Facioscapulohumeral (FSHMD1A, FSH01A); Distrofia muscular (FKRP, MDC1C, lGMD21, LAMA2, LAMM, LARGE, KlM0609, MDC1D, FCMD, ITID, MYOT, CAPN3, CANP3, OYSF, lGMD2B, SGCG, lGMD2C, DMDA1 , SCG3, SGCA, ADl, OAG2, lGMD2D, DMDA2, SGCB, lGMD2E, SGCO, SGD, lGMD2F, CMD1 L, TCAP, lGMD2G , CMD1N, TRI M32, HT2A, lGMD2H, FKRP, MDC1C, lGMD21 , TTN , CMD1G, TMD, lGMD2J , POMT1 , CAV3, LGMD1C, SEPN1 , SELN, RSMD1 , PLEC1 , PlTN , EBS1 ); Osteopetrosis (LRP5, BMN01 , LRP7, lR3, OPPG, VBCH2, ClCN7, ClC7, OPTA2, OSTM1 , Gl, TCIRG1 , TIRC7, OC116, OPTB1 ); Atrofia muscu lar (VAPB , VAPC, AlSB, SMN1 , SMA1 , SMA2 , SMA3, SMA4 , BSCl2, SPG17, GARS, SMAD1 , CMT2D, HEXB, IGHMBP2, SMUBP2, CATF1 , SMARD1)
enfermedades y trastornos
AlS (S001 , AlS2, STEX, FUS, TARDBP, VEGF (VEGF-a, VEGF·b, VEGF-c);
neurológicos y neuronales
enfermedad de Alzheimer (APP, AAA, CVAP, AD1 , APOE, AD2, PSEN2, A04, STM2, APBB2, FE65l1, NOS3, PLAU, URK, ACE, DCP1 , ACE1 , MPO, PACIP1 , PAXIP1 l , PTIP, A2M , BlMH, BMH , PSEN1 , AD3); Autismo (Mecp2, BZRAP1 , MDGA2, Sema5A, Neu rexina 1, GL01 , MECP2, RIT, PPMX, MRX16, MRX79 , NlGN3, NlGN4, KIAA1260 , AUTSX2); Síndrome frágil X (FMR2, FXR1 , FXR2, mGlUR5); enfermedad de Huntington y trastornos tipo enfermedad (HO , 1T15, PRNP, PRIP, JPH3, JP3, HOL2, TBP, SCA17); enfermedad de Parkinson (NR4A2, NURR1 , NOT, TINUR, SNCAIP, TBP, SCA17, SNCA, NACP, PARK1 , PARK4, DJ1 , PARK7, lRRK2, PARK8, PINK1 , PARK6, UCHl1 , PARK5, SNCA, NACP, PARK1 , PARK4, PRKN, PARK2, PDJ, DBH , NDUFV2); síndrome de Rett (MECP2, RIT, PPMX, MRX16, MRX79, COKl5, STK9, MECP2, RIT, PPMX, MRX16, MRX79, x-Synuclein, DJ-1 ); Esquizofrenia (Neuregulin1 (Nrg1 ), Erb4 (receptor de Neuregulin), Complexin1 (Cplx1 ), Tph1 Triptófano hidroxilasa, Tph2, Triptófano hidroxilasa 2, Neurexina 1, GSK3, GSK3a, GSK3b, 5-HIT (Slc6a4), COMT, ORO (Ord1a), SlC6A3, DAOA, OTNBP1 , Oao (Oao1 )); Trastornos Relacionados con la secretasa (APH-1 (a lfa y beta), Presenilin (Psen1 ), nicastrin, (Nestn), PEN -2, Nos1 , Parp1 , Nat1 , Nat2); Trastornos Repetición del trinucleótido (HIT (Huntington's Ox), SBMAlSMAXlIAR (Kennedy's Ox), FXN/X25 (Ataxia de Friedrich), ATX3 (Machado-Joseph's Ox), ATXN1 y ATXN2 (ataxias espinocerebelares), DMPK (distrofia miotónica), Alrofina-1 y Atn1 (DRPLA Dx), CBP (Creb-BP -inestabilidad global), VLDlR (Alzheimer's), Atxn7, Atxn10).
enfermedades y trastornos oculares
degeneración rnacular relacionada con la edad (Abcr, Ccl2 , Cc2, cp (ceruloplasrnina), Timp3 , catepsinaD, Vldlr, Ccr2); Catarata (CRYAA, CRYA1 , CRYBB2, CRYB2, PITX3, BFSP2, CP49 , CP47, CRYM, CRYA1 , PAX6, AN2, MGDA, CRYBA1 , CRYB1 , CRYGC, CRYG3 , CCl, UM2, MP19, CRYGO, CRYG4, BFSP2, CP49, CP47, HSF4, CTM , HSF4, CTM, MIP, AQPO, CRYAB , CRYA2, CTPP2 , CRYBB1 , CRYGD, CRYG4, CRYBB2, CRYB2, CRYGC, CRYG3, CCl, CRYAA, CRYA1 , GJAB, CX50, CAE1 , GJA3, CX46, CZP3, CAE3, CCM1 , CAM, KRIT1 ); distrofia y turbidez de la córnea (APOA1 , TGFBI . CSD2, CDGG1 , CSD , BIGH3, CDG2, TACSTD2, TROP2, M1S1 , VSX1 , RINX, PPCO, PPD, KTCN , COl8A2, FECO , PPCD2 , PIP5K3, CFO); Cornea plana congénita (KERA, CNA2); Glaucoma (MYOC, TIGR, GlC1A, JOAG, GPOA, OPTN, GlC1E, FIP2, HYPl, NRP, CYP1B1 , GlC3A, OPA1 , NTG, NPG, CYP1 81 , GlC3A); amaurosis congénita de leber (CRB1 , RP12, CRX, CORD2 , CRD , RPGRIP1 , lCA6, CORD9, RPE65, RP20 , AIPL 1, lCA4, GUCY2D, GUC2D, lCA1 , COR06, ROH12, lCA3); distrofia macular (ElOVl4, AOMD , STG02, STG03, ROS,
IRP7, PRPH2, PRPH, AVMD, AOFMD, VMD2)
Tabla C
FUNCiÓN CELULAR
GENES
Señalización PI3KJAKT
PRKCE; lTGAM; ITGAS; IRAK 1; PRKAA2; EIF2AK2;
PTEN; EI F4E; PRKCZ; GRK6; MAPK1 ; TSC1 ; PLK1 ;
AKT2; IKBKB; PIK3CA; CDKB ; COKN1B; NFKB2; BCL2;
PIK3CB; PPP2R1A; MAPK8; BCL2L 1; MAPK3; TSC2 ;
lTGA1 , KRAS; EIF4EBP1 , REtA; PRKCO; NOS3;
PRKAA1 ; MAPK9; CDK2; PPP2CA; PIM1 ; lTGB7;
YWHAZ; ILK; TP53; RAF1 ; IKBKG; RELB; OYRK1A;
CDKN1A; ITGB1 ; MAP2K2; JAK1 ; AKT1 ; JAK2; PIK3R1 ;
CHUK; POPK1 , PPP2R5C; CTNNB1 , MAP2K1 , NFKB1 ,
PAK3; ITGB3; CCN01 ; GSK3A; FRAP1 , SFN ; ITGA2;
TIK; CSNK1A1 ; BRAF; GSK3B; AKT3; FOX01; SGK;
HSP90AA1 ; RPS6KB1
Señalización ERKJMAPK
PRKCE; lTGAM; ITGAS; HSPB1 ; IRAK1 ; PRKAA2;
EIF2AK2; RAC1 , RAP1A; TLN1 , EIF4E; ELK1 , GRK6;
MAPK1 ; RAC2; PLK1 ; AKT2; PIK3CA; COKB ; CREB1 ;
PRKCJ ; PTK2; FOS; RPS6KA4; PIK3CB; PPP2R1A;
PIK3C3; MAPK8; MAPK3; ITGA1 , ETS1 ; KRAS; MYCN;
EIF4EBP1 , PPARG; PRKCO; PRKCA1 ; MAPK9; SRC;
CDK2; PPP2CA; PIM1 ; PIK3C2A; ITGB7; YWHAZ;
PPP1CC ; KSR1 , PXN ; RAF1 , FYN ; OYRK1A; ITGB1 ,
MAP2K2; PAK4; PIK3R1 ; STAT3; PPP2R5C; MAP2K1 ;
PAK3; ITGB3; ESR1 , ITGA2; MYC; TIK; CSNK1A1 ,
CRKL; BRAF; ATF4; PRKCA; SRF; STAT1 ; SGK
Señalización
RAC1 ; TAF4B; EP300; SMA02; TRAF6; PCAF; ELK1 ;
Receptor Glucocorticoide
MAPK1 ; SMAD3; AKT2; IKBKB; NCOR2; UBE21 ;
PIK3CA; CREB1 ; FOS; HSPA5; NFKB2; BCL2;
MAP3K14; STATSB; PIK3CB; PIK3C3; MAPKB; BCL2L 1,
MAPK3; TSC2203; MAPK10; NRIP1 ; KRAS; MAPK13;
RELA; STAT5A; MAPK9; NOS2A; PBX1 , NR3C1 ,
PIK3C2A; CDKN1C; TRAF2; SERPINE1 ; NCOA3;
MAPK14; TNF; RAF1 ; IKBKG; MAP3K7; CREBBP;
COKN1A; MAP2K2; JAK1 ; ILB ; NCOA2; AKT1 , JAK2;
PIK3R1 ; CHUK; STAT3; MAP2K1 ; NFKB1 ; TGFBR1 ;
ESR1 , SMA04; CEBPB; JUN; AR ; AKT3; CCL2; MMP1 ; STAT1 , IL6; HSP90AA1
Señalización Guía Axonal
PRKCE; lTGAM; ROCK1 , ITGAS; CXCR4; AOAM12 ;
IGF1 ; RAC1 ; RAP1A; EIF4E; PRKCZ; NRP1 ; NTRK2;
FUNCiÓN CELULAR
GENES
ARHGEF7; SMO; ROCK2; MAPK1 ; PGF; RAC2;
PTPN11 ; GNAS; AKT2; PIK3CA; ERBB2; PRKCI; PTK2;
CFL 1, GNAQ; PIK3CB; CXCL 12; PIK3C3; W NT11 ,
PRKD1 , GNB2L 1, ABL1 , MAPK3; ITGA1 , KRAS ; RHOA;
PRKCD; PIK3C2A; ITGB7; GLl2; PXN ; VASP; RAF1 ;
FYN ; ITGB1 , MAP2K2; PAK4; ADAM17 ; AKT1 ; PIK3R1 ,
GU1 , WNT5A; ADAM10; MAP2K1 , PAK3; ITGB3;
CDC42; VEGFA; ITGA2; EPHA8; CRKL; RND1 ; GSK3B;
AKT3; PRKCA
Señalización Receptor Ephrin
PRKCE; ITGAM; ROCK1 ; ITGA5; CXCR4; IRAK 1;
PRKAA2 ; EIF2AK2; RAC 1; RAP1A; GRK6; ROCK2;
MAPK1 ; PGF; RAC2 ; PTPN11 ; GNAS; PLK1 ; AKT2 ;
DOK1 , COK8; CREB1 , PTK2; CFL 1; GNAQ; MAP3K14;
CXCL12; MAPK8; GNB2L 1; ABL1 ; MAPK3; ITGA1 ;
KRAS ; RHOA; PRKCD; PRKAA1 ; MAPK9; SRC; CDK2;
PIM1 , ITGB7; PXN; RAF1 ; FYN; OYRK1A; ITGB1 ;
MAP2K2; PAK4; AKT1 ; JAK2; STAT3; ADAM10;
MAP2Kl , PAK3; ITGB3; COC42; VEGFA; ITGA2;
EPHA8; TTK; CSNK1A1 ; CRKL; BRAF; PTPN1 3; ATF4;
AKT3; SGK
Seña lización
ACTN4 ; PRKCE; ITGAM; ROCK1 , ITGA5; IRAK1 ,
cictoesqueleto de acUna
PRKAA2 ; EIF2AK2; RAC1 ; INS; ARHGEF7; GRK6;
ROCK2; MAPK1 , RAC2 ; PLK1 , AKT2 ; PIK3CA; CDK8 ;
PTK2; CFL 1, PIK3CB; MYH9; OIAPH1 , PIK3C3; MAPK8;
F2R; MAPK3; SLC9A1 ; ITGA1 ; KRAS; RHOA; PRKCD;
PRKAA1 , MAPK9; COK2; PIM1 , PIK3C2A; ITGB7;
PPP1CC ; PXN; VIL2; RAF1 ; GSN; DYRK1A; ITGB1 ;
MAP2K2; PAK4; PIP5K1A; PIK3R1 ; MAP2K1 ; PAK3;
ITGB3; CDC42; APC ; ITGA2; TTK; CSNK1A1 ; CRKL;
BRAF; VAV3; SGK
Señalización
PRKCE; IGF1 ; EP300; RCOR1 ; PRKCZ; HOAC4; TGM2;
enfermedad de Huntington
MAPK1 ; CAPNS1 ; AKT2; EGFR; NCOR2; SP1 ; CAPN2;
PIK3CA; HDAC5; CREB1 , PRKCI; HSPA5; REST;
GNAQ; PIK3CB; PIK3C3; MAPKB; IGF1 R; PRK01 ,
GNB2L 1, BCL2L 1, CAPN1 , MAPK3; CASP8; HDAC2;
HDAC7A; PRKCD; HDAC11 ; MAPK9; HDAC9; PIK3C2A;
HDAC3; TP53; CASP9; CREBBP; AKT1 ; PIK3R1 ;
PDPK1 , CASP1 , APAF1 ; FRAP1 ; CASP2; JUN; BAX;
ATF4; AKT3 ; PRKCA; CLTC; SGK; HOAC6; CASP3
Señalización de muerte celular programada
PRKCE; ROCK1 ; BID ; IRAK1 ; PRKAA2; EIF2AK2; BAK1 ;
FUNCiÓN CELULAR
GENES
BIRC4; GRK6; MAPK1 , CAPNS1 , PLK1 , AKT2 ; IKBKB;
CAPN2; CDK8; FAS; NFKB2; BCL2; MAP3K14; MAPK8;
BCL2L 1; CAPN1 , MAPK3; CASP8; KRAS ; RELA;
PRKCO; PRKAA1 , MAPK9; COK2; PIM1 ; TP53; TNF;
RAF1 ; IKBKG; RELB ; CASP9; OYRK1A; MAP2K2;
CHUK; APAF1 ; MAP2K1 ; NFKB1 ; PAK3; LMNA; CASP2;
BIRC2; TIK; CSNK1A1 , BRAF; BAX; PRKCA; SGK;
CASP3; BIRC3; PARPl
Seña lización de Receptor de células B
RAC1 ; PTEN ; LYN ; ELK1 ; MAPK1 ; RAC2 ; PTPNll ;
AKT2; IKBKB; PIK3CA; CREB1 ; SYK; NFKB2; CAMK2A;
MAP3K14; PIK3CB; PIK3C3; MAPK8; BCL2Ll ; ABL 1;
MAPK3; ETS1 ; KRAS ; MAPK13; RELA; PTPN6; MAPK9;
EGRI ; PIK3C2A; BTK; MAPK14; RAF1 , IKBKG; RELB ;
MAP3K7; MAP2K2; AKT1 ; PIK3Rl ; CHUK; MAP2Kl ;
NFKB1 ; CDC42; GSK3A; FRAP1 ; BCL6; BCL10; JUN;
GSK3B; ATF4; AKT3;VAV3; RPS6KB1
Señalización de diapédesis
ACTN4 ; C044; PRKCE; ITGAM; ROCK1 ; CXCR4 ; CYBA;
RAC1 , RAP1A; PRKCZ; ROCK2; RAC2; PTPN11 ,
MMP14; PIK3CA; PRKCI; PTK2; PIK3CB; CXCL12;
PIK3C3; MAPK8; PRK01 ; ABL1 , MAPK10; CYBB;
MAPK13; RHOA; PRKCO; MAPK9; SRC; PIK3C2A; BTK;
MAPK14; NOX1 ; PXN ; VIL2; VASP; TTGB1 ; MAP2K2;
CTNND1 , PIK3R1 , CTNNB1 , CLON1 , CDC42; F11R; ITK;
CRKL; VAV3; CTTN ; PRKCA; MMP1 , MMP9
Seña lización de Integrina
ACTN4 ; ITGAM; ROCK1 ; ITGA5; RAC1 ; PTEN; RAP1A;
TLN1 ; ARHGEF7; MAPK1 , RAC2 ; CAPNS1 , AKT2;
CAPN2; PIK3CA; PTK2; PIK3CB; PIK3C3; MAPK8;
CAV1 ; CAPN1 ; ABL1 ; MAPK3 ; ITGA1 ; KRAS ; RHOA;
SRC; PIK3C2A; ITGB7; PPP1CC; ILK; PXN ; VASP;
RAF1 ; FYN; ITGB1 , MAP2K2; PAK4; AKT1 , PIK3R1 ,
TNK2; MAP2K1 ; PAK3; ITGB3 ; C0C42 ; RN03; ITGA2;
CRKL; BRAF; GSK3B; AKT3
Seña lización
IRAK1 , S002; MY088; TRAF6 ; ELK1 , MAPK1 ; PTPN11 ,
de Respuesta de fase aguda
AKT2; IKBKB; PIK3CA; FOS; NFKB2; MAP3K14;
PIK3CB; MAPK8; RIPK1 , MAPK3; ILBST; KRAS ;
MAPK13; IL6R; RELA; SOCS1; MAPK9; FTL; NR3Cl ;
TRAF2 ; SERPINE1 ; MAPK14; TNF; RAF1 ; POK1 ;
IKBKG ; RELB; MAP3K7; MAP2K2; AKT1 ; JAK2; PIK3R1 ;
CHUK; STAT3; MAP2Kl ; NFKB1 ; FRAP1 ; CEBPB; JUN;
AKT3; IL 1 Rl ; ILB
FUNCiÓN CELULAR
GENES
Señalización de PTEN
ITGAM; ITGA5; RAC1 , PTEN ; PRKCZ; BCL2L 11 ,
MAPK1 ; RAC2; AKT2 ; EGFR; IKBKB; CBL; PIK3CA;
CDKN1 B; PTK2; NFKB2; BCL2; PIK3CB ; BCL2L 1;
MAPK3; ITGA1 , KRAS; ITGB7; ILK; PDGFRB; INSR;
RAF1 ; IKBKG; CASP9; CDKN1A; ITGB1 ; MAP2K2;
AKT1 , PIK3R1 ; CHUK; PDGFRA; PDPK1 , MAP2K1 ,
NFKB1 , ITGB3; CDC42; CCN01 , GSK3A; ITGA2;
GSK3B; AKT3; FOX01 ; CASP3; RPS6KB1
Seña lización de p53
PTEN ; EP300; BBC3; PCAF; FASN; BRCA1 ; GADD45A;
BIRC5; AKT2 ; PIK3CA; CHEK1 ; TP53INP1 ; BCL2;
PIK3CB; PIK3C3; MAPK8; THBS1 ; ATR; BCL2L1 ; E2F1 ;
PMAIP1 ; CHEK2; TNFRSF10B; TP73; RB1 ; HOAC9;
CDK2; PIK3C2A; MAPK14; TP53; LRDD; CDKN1A;
HIPK2; AKT1 ; PIK3R1 ; RRM28 ; APAF1 ; CTNNB1 ;
SIRT1 ; CCN01 ; PRKDC; ATM ; SFN; CDKN2A; JUN;
SNAI2; GSK3B; BAX; AKT3
Señalización
HSPB1 ; EP300; FASN ; TGM2 ; RXRA; MAPK1 ; NQ01 ;
de Receptor Arilhidrocarbonado
NCOR2; SP1 ; ARNT; CDKN1 B; FOS; CHEK1 ,
SMARCA4; NFK82; MAPK8; ALDH1A1 ; ATR; E2F1 ;
MAPK3; NRIP1 , CHEK2; RELA; TP73; GSTP1 ; RB1 ,
SRC; CDK2; AHR; NFE2L2; NCOA3; TP53 ; TNF ;
CDKN I A; NCOA2; APAF1 ; NFK81 ; CCND1 ; ATM; ESR1 ;
CDKN2A; MYC; JUN; ESR2; BAX; IL6; CYP181 ,
HSP90AA1
Seña lización de
PRKCE; EP300; PRKCZ; RXRA; MAPK1 ; NQ01 ;
Metabolismo Xenobi6tico
NCOR2; PIK3CA; ARNT; PRKCI ; NFKB2; CAMK2A;
PIK3CB; PPP2R1A; PIK3C3; MAPK8; PRKD1 ;
ALDH1A1 ; MAPK3; NRIP1 ; KRAS; MAPK13; PRKCD;
GSTP1 ; MAPK9; NOS2A; ABC81 ; AHR; PPP2CA; FTL;
NFE2L2; PIK3C2A; PPARGC1A; MAPK1 4; TNF; RAF1 ,
CRE8BP; MAP2K2; PIK3R1 ; PPP2R5C; MAP2K1 ;
NFK81 ; KEAP1 ; PRKCA; EIF2AK3; IL6; CYP1 81 ;
HSP90AA1
Señalización de SAPKlJNK
PRKCE; IRAK1 , PRKAA2; EIF2AK2; RAC I , ELK1 ;
GRK6; MAPK1 , GADD45A; RAC2 ; PLK1 , AKT2; PIK3CA;
FADD; CDK8; PIK3CB; PIK3C3; MAPK8; R1PK1 ;
GNB2L 1; IRS1 ; MAPK3; MAPK10; DAXX; KRAS;
PRKCD; PRKAA1 , MAPK9; COK2; PIM1 ; PIK3C2A;
TRAF2 ; TP53; LCK; MAP3K7; DYRK1A; MAP2K2;
PIK3R1 ; MAP2K1 ; PAK3; CDC42; JUN; TIK; CSNK1A1 ;
FUNCiÓN CELULAR
GENES
CRKL; BRAF; SGK
Seña lización de PPAr/RXR
PRKAA2 ; EP300; IN S; SMAD2; TRAF6 ; PPARA; FASN;
RXRA; MAPK1 , SMAD3; GNAS; IKBKB; NCOR2;
ABCA1 , GNAQ; NFKB2; MAP3K14; STATSB; MAPK8;
IRS1 ; MAPK3; KRAS ; RELA; PRKAA1 ; PPARGC1A;
NCOA3; MAPK14; INSR; RAF1 ; IKBKG; RELB ; MAP3K7;
CREBBP; MAP2K2; JAK2; CHUK; MAP2K1 , NFKB 1,
TGFBR1 ; SMAD4; JUN; IL1R1; PRKCA; IL6; HSP90AA1 ; ADIPOQ
Seña lización de NF-KB
IRAK1 ; EIF2AK2; EP300; INS; MYD88; PRKCZ; TRAF6;
TBK1 ; AKT2 ; EGFR; IKBKB; PIK3CA; BTRC; NFKB2;
MAP3K14; PIK3CB; PIK3C3; MAPK8; RIPK1 ; HDAC2;
KRAS ; RELA; PIK3C2A; TRAF2; TLR4 ; PDGFRB; TNF;
INSR; LCK; IKBKG; RELB ; MAP3K7; CREBBP ; AKT1 ,
PIK3R1 ; CHUK; PDGFRA; NFKB1 ; TLR2; BCL 10;
GSK3B; AKT3; TNFAIP3; IL 1 R1
Seña lización de Neuregulina
ERBB4; PRKCE; ITGAM; ITGAS; PTEN; PRKCZ; ELK1 ;
MAPK1 ; PTPN11 ; AKT2 ; EGFR; ERBB2; PRKCI;
CDKN1B; STATSB; PRKD1 , MAPK3; ITGA1 , KRAS ;
PRKCD; STAT5A; SRC; ITGB7; RAF1 ; ITGB1 ; MAP2K2;
ADAM17 ; AKT1 , PIK3R1 ; PDPK1 , MAP2K1 , ITGB3;
EREG; FRAP1 , PSEN1 , ITGA2; MYC; NRG1 , CRKL;
AKT3; PRKCA; HSP90AA 1; RPS6KB 1
Seña lización de
CD44; EP300; LRP6; DVL3; CSNK1E; GJA1 , SMO;
caten ina Wnt y Beta
AKT2; PIN1 , CDH1 , BTRC; GNAQ; MARK2; PPP2R1A;
WNT11 ; SRC; DKK1 ; PPP2CA; SOX6; SFRP2; ILK;
LEF1 , SOX9; TP53 ; MAP3K7; CREBBP; TCF7L2; AKT1 ,
PPP2R5C; WNT5A; LRP5; CTNNB1 ; TGFBR1 ; CCND1 ;
GSK3A; DVL 1; APC ; CDKN2A; MYC; CSNK1A 1; GSK3B;
AKT3; SOX2
Seña lización de Receptor de Insulina
PTEN ; INS; EIF4E; PTPN1 , PRKCZ; MAPK1 , TSC1 ,
PTPN11 ; AKT2 ; CBL; PIK3CA; PRKCI ; PIK3CB; PIK3C3;
MAPK8; IRS1 ; MAPK3; TSC2; KRAS ; EIF4EBP1 ;
SLC2A4 ; PIK3C2A; PPP1CC; INSR; RAF1 , FYN;
MAP2K2; JAK1 , AKT1 , JAK2; PIK3R1 , PDPK1 ; MAP2K1 ;
GSK3A; FRAP1 , CRKL; GSK3B; AKT3; FOX01 , SGK;
RPS6KB1
Seña lización de IL-6
HSPB1 ; TRAF6 ; MAPKAPK2; ELK1 ; MAPK1 ; PTPN11 ;
IKBKB ; FOS ; NFKB2; MAP3K1 4; MAPK8; MAPK3;
MAPK10; IL6ST; KRAS ; MAPK13; IL6R; RELA; SOCS1 ;
MAPK9; ABCB1 ; TRAF2 ; MAPK14; TNF; RAF 1; IKBKG;
FUNCiÓN CELULAR
GENES
RELB; MAP3K7; MAP2K2; ILB ; JAK2; CHUK; STAT3;
MAP2K1 ; NFKB1 ; CEBPB; JUN; IL1R1 ; SRF; IL6
Colestasis Hepática
PRKCE; IRAK1 , INS; MYOB8; PRKCZ; TRAF6 ; PPARA;
RXRA; IKBKB; PRKCI; NFKB2; MAP3K1 4; MAPK8;
PRK01 ; MAPK10; RELA; PRKCO; MAPK9; ABCB1 ;
TRAF2 ; TLR4; TNF ; INSR; IKBKG; RELB; MAP3K7; IL8;
CHUK; NR1H2; TJP2; NFKB1 ; ESR1 , SREBF1 , FGFR4;
JUN; IL1R1 ; PRKCA; IL6
Seña lización de IGF-1
IGF 1; PRKCZ; ELK1 ; MAPK1 ; PTPN11 ; NE004; AKT2;
PIK3CA; PRKCI; PTK2; FOS; PIK3CB ; PIK3C3; MAPK8;
IGF1 R; IRS1 ; MAPK3; IGFBP7; KRAS ; PIK3C2A;
YWHAZ; PXN ; RAF1 ; CASP9; MAP2K2; AKT1 ; PIK3R1 ;
POPK1 , MAP2K1 , IGFBP2; SFN ; JUN; CYR61 ; AKT3;
FOX01 ; SRF; CTGF; RPS6KB1
Respuesta de Estrés
PRKCE; EP300; S002; PRKCZ; MAPK1 ; SQSTM1 ;
Oxidativo mediado por NRF2
NQ01 , PIK3CA; PRKCI ; FOS; PIK3CB; PIK3C3; MAPK8;
PRKD1 ; MAPK3; KRAS; PRKCD; GSTP1 ; MAPK9; FTL;
NFE2L2; PIK3C2A; MAPK14; RAF1 , MAP3K7; CREBBP;
MAP2K2; AKT1 ; PIK3R1 ; MAP2K1 ; PPIB; JUN; KEAP1 ;
GSK3B; ATF4; PRKCA; EIF2AK3; HSP90AA1
Fibrosis Hepática I
EON1 , 1GF1 , KOR; FLT1 , SMA02; FGFR1 , MET; PGF;
Activación de células estelares hepáticas
SMAD3; EGFR; FAS ; CSF1 ; NFKB2; BCL2; MYH9;
IGF1R; IL6R; RELA; TLR4 ; PDGFRB; TNF ; RELB; ILB;
POGFRA; NFKB1 , TGFBR1 , SMA04; VEGFA; BAX;
IL 1R1 ; CCL2; HGF; MMP1 ; STAT1 ; IL6; CTGF; MMP9
Señalización de PPAR
EP300; INS; TRAF6; PPARA; RXRA; MAPK1 , IKBKB;
NCOR2; FOS; NFKB2; MAP3K14; STAT5B; MAPK3;
NRIP1 ; KRAS; PPARG; RELA ; STAT5A; TRAF2 ;
PPARGC1A; PDGFRB; TNF; INSR; RAF1 ; IKBKG;
RELB; MAP3K7; CREBBP; MAP2K2; CHUK; POGFRA;
MAP2K1 ; NFKB1 ; JUN; IL1R1 ; HSP90AA1
Seña lización de Fc Epsilon RI
PRKCE; RAC1 ; PRKCZ; LYN; MAPK1 ; RAC2; PTPN11 ;
AKT2; PIK3CA; SYK; PRKCI; PIK3CB; PIK3C3; MAPK8;
PRKD1 , MAPK3; MAPK10; KRAS ; MAPK13; PRKCD;
MAPK9; PIK3C2A; BTK; MAPK14; TNF ; RAF1 ; FYN ;
MAP2K2; AKT1 ; PIK3R1 ; PDPK1 ; MAP2K1 ; AKT3;
VAV3; PRKCA
Seña lización de Receptor
PRKCE; RAP1A; RGS16; MAPK1 ; GNAS; AKT2 ; IKBKB;
Acoplado a proteína G
PIK3CA; CREB1 ; GNAQ; NFKB2 ; CAMK2A; PIK3CB;
PIK3C3; MAPK3; KRAS ; RELA; SRC; PIK3C2A; RAF1 ;
FUNCiÓN CELULAR
GENES
IKBKG ; RELB; FYN; MAP2K2; AKT1 ; PIK3R1 , CHUK;
PDPK1 ; STAT3; MAP2K1 ; NFKB1 ; BRAF; ATF4; AKT3 ;
PRKCA
Metabolismo de
PRKCE; IRAK1 , PRKAA2; EIF2AK2; PTEN; GRK6;
Inositol fosfato
MAPK1 ; PLK1 ; AKT2 ; PIK3CA; CDK8; PIK3CB; PIK3C3;
MAPK8; MAPK3; PRKCD; PRKAA1 ; MAPK9; CDK2;
PIM1 , PIK3C2A; DYRK1A; MAP2K2; PIPSK1A; PIK3R1 ,
MAP2K1 ; PAK3; ATM ; TIK; CSNK1A1 ; BRAF; SGK
Seña lización de PDGF
EIF2AK2; ELK1 ; ABL2; MAPK1 ; PIK3CA; FOS; PIK3CB;
PIK3C3; MAPK8; CAV1 ; ABL 1; MAPK3; KRAS ; SRC;
PIK3C2A; PDGFRB; RAF1 ; MAP2K2; JAK1 ; JAK2;
PIK3R1 ; PDGFRA; STAT3; SPHK1 ; MAP2K1 ; MYC;
JUN; CRKL; PRKCA; SRF; STAT1 , SPHK2
Seña lización de VEGF
ACTN4 ; ROCK1 ; KDR; FL T1 ; ROCK2; MAPK1 ; PGF;
AKT2; PIK3CA; ARNT; PTK2; BCL2; PIK3CB ; PIK3C3;
BCL2L 1; MAPK3; KRAS ; HIF1A; NOS3; PIK3C2A; PXN;
RAF1 ; MAP2K2; ELAVL1 ; AKT1 ; PIK3R1 ; MAP2K1 ; SFN;
VEGFA; AKT3; FOX01 , PRKCA
Seña lización de células
PRKCE; RAC1 ; PRKCZ; MAPK1 ; RAC2 ; PTPN11 ;
an iqu ilantes naturales
KIR2DL3 ; AKT2; PIK3CA; SYK; PRKCI ; PIK3CB;
PIK3C3; PRKD1 , MAPK3; KRAS; PRKCO; PTPN6;
PIK3C2A; LCK; RAF1 ; FYN; MAP2K2; PAK4; AKT1 ;
PIK3R1 , MAP2K1 , PAK3; AKT3; VAV3 ; PRKCA
Ciclo celula r: G1 /S
HOAC4; SMA03; SUV39H1 , HOACS; COKN1B; BTRC;
Regu lación de control
ATR; ABL1 ; E2F1 ; HDAC2; HDAC7A; RB1 ; HDAC11 ;
HOAC9; COK2; E2F2; HOAC3; TP53 ; CDKN1A; CCN01 ,
E2F4; ATM; RBL2; SMAD4; CDKN2A; MYC ; NRG1 ;
GSK3B; RBL1 ; HDAC6
Señalización de Receptor de células T
RAC1 ; ELK1 ; MAPK1 ; IKBKB; CBL; PIK3CA; FOS;
NFKB2; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS;
RELA; PIK3C2A; BTK; LCK; RAF1 ; IKBKG; RELB; FYN;
MAP2K2; PIK3R1 ; CHUK; MAP2K1 ; NFKB1 ; ITK; BCL10;
JUN; VAV3
Señalización de Receptor de la muerte
CRADD; HSPB1 , BID ; BIRC4; TBK1 , IKBKB; FADO;
FAS; NFKB2; BCL2; MAP3K14; MAPK8; RIPK1 , CASP8;
OAXX; TNFRSF10B; RELA; TRAF2; TNF; IKBKG; RELB;
CASP9; CHUK; APAF1 ; NFKB1 ; CASP2; BIRC2; CASP3;
BIRC3
Seña lización de FGF
RAC1 ; FGFR1 ; MET; MAPKAPK2; MAPK1 ; PTPN11 ;
AKT2; PIK3CA; CREB1 ; PIK3CB; PIK3C3; MAPK8;
FUNCiÓN CELULAR
GENES
MAPK3; MAPK13; PTPN6; PIK3C2A; MAPK14; RAF1 ;
AKT1 ; PIK3R1 ; STAT3; MAP2K1 ; FGFR4; CRKL; ATF4;
AKT3; PRKCA; HGF
Seña lización de GM-CSF
LYN ; ELK1 ; MAPK1 , PTPN11 ; AKT2 ; PIK3CA; CAMK2A;
STAT5B; PIK3CB; PIK3C3; GNB2L 1; BCL2L 1; MAPK3;
ETS1 , KRAS ; RUNX1 , PIM1 , PIK3C2A; RAF1 ; MAP2K2;
AKT1 , JAK2; PIK3R1 , STAT3; MAP2K1 , CCN01 , AKT3 ;
STAT1
Seña lización de esclerosis
BID; IGF1 ; RAC1 ; BIRC4; PGF; CAPNS1 ; CAPN2;
lateral amiotrófica
PIK3CA; BCL2; PIK3CB; PIK3C3; BCL2L1 ; CAPN1 ;
PIK3C2A; TP53; CASP9; PIK3R1 ; RAB5A; CASP1 ;
APAF1 ; VEGFA; BIRC2; BAX; AKT3 ; CASP3 ; BIRC3
Señalización de JAK/Stat
PTPN1 ; MAPK1 , PTPN11 ; AKT2; PIK3CA; STAT5B;
PIK3CB; PIK3C3; MAPK3; KRAS ; SOCS1 ; STAT5A;
PTPN6; PIK3C2A; RAF1 ; CDKN1A; MAP2K2; JAK1 ;
AKT1 , JAK2; PIK3R1 , STAT3; MAP2K1 ; FRAP1 ; AKT3 ;
STAT1
Metabolismo de
PRKCE; IRAK1 , PRKAA2; EIF2AK2; GRK6; MAPK1 ,
Nicotinato y
Nicotinamida
PLK1 , AKT2 ; CDK8; MAPK8; MAPK3; PRKCD; PRKAA1 ,
PBEF1 , MAPK9; CDK2; PIM1 , DYRK1A; MAP2K2;
MAP2K1 ; PAK3; NT5E; TTK; CSNK1A1 ; BRAF; SGK
Seña lización de quimiocinas
CXCR4; ROCK2; MAPK1 , PTK2; FOS; CFL 1, GNAQ;
CAMK2A; CXCL12; MAPK8; MAPK3; KRAS; MAPK13;
RHOA; CCR3; SRC; PPP1CC; MAPK14; NOX1 ; RAF1 ;
MAP2K2; MAP2K1 , FLAN;CCL2; PRKCA
Señalización de IL-2
ELK1 ; MAPK1 ; PTPN11 ; AKT2 ; PIK3CA; SYK; FOS;
STAT5B; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS ;
SOCS1 ; STAT5A; PIK3C2A; LCK; RAF1 ; MAP2K2;
JAK1 , AKT1 , PIK3R1 , MAP2K1 , JUN; AKT3
Depresión sináptica
PRKCE; IGF1 ; PRKCZ; PRDX6; LYN ; MAPK1 ; GNAS;
a largo lazo
PRKCI; GNAQ; PPP2R1A; IGF1 R; PRKD1 ; MAPK3;
KRAS ; GRN; PRKCD; NOS3; NOS2A; PPP2CA;
YVVHAZ; RAF1 , MAP2K2; PPP2R5C; MAP2K1 , PRKCA
Seña lización de
TAF4B ; EP300; CARM1 , PCAF; MAPK1 , NCOR2;
Receptor de EstrógellOs
SMARCA4; MAPK3; NRIP1 ; KRAS; SRC; NR3C1 ;
HDAC3; PPARGC1A; RBM9; NCOA3; RAF1 ; CREBBP;
MAP2K2; NCOA2; MAP2K1 , PRKDC; ESR1 , ESR2
Ruta de
TRAF6 ; SMURF1 ; BIRC4; BRCA1 ; UCHL 1; NEDD4;
Ubiquilinación de proteínas
CBL; UBE21 ; BTRC; HSPA5; USP7; USP10; FBXW7;
FUNCiÓN CELULAR
GENES
USP9X; STUB1 , USP22; B2M ; BIRC2; PARK2; USP8;
USP1 ; VHL; HSP90AA1 ; BIRC3
Seña lización de IL-1 0
TRAF6 ; CCR1 , ELK1 , IKBKB; SP1 , FOS; NFKB2;
MAP3K14; MAPK8; MAPK13; RELA; MAPK1 4; TNF ;
IKBKG ; RELB; MAP3K7; JAK1; CHUK; STAT3; NFKB1 ;
JUN; IL1R1 , IL6
Activación de VORlRXR
PRKCE; EP300; PRKCZ; RXRA; GA004SA; HES1 ,
NCOR2; SP1 ; PRKCI; COKN1B; PRK01 ; PRKCO;
RUNX2; KLF4; YY1 ; NCOA3; COKN1A; NCOA2; SPP1 ;
LRPS; CEBPB; FOX01 ; PRKCA
Seña lización de TGF-beta
EP300; SMAD2; SMURF1 ; MAPK1 ; SMA03; SMA01 ;
FOS; MAPK8; MAPK3; KRAS; MAPK9; RUNX2;
SERPINE1 ; RAF1 ; MAP3K7; CREBBP; MAP2K2;
MAP2K1 ; TGFBR1 ; SMAD4; JUN; SMADS
Señalización de Receptor tipo TolI
IRAK1 ; EIF2AK2; MYD88; TRAF6 ; PPARA; ELK1 ;
IKBKB ; FOS ; NFKB2; MAP3K1 4; MAPK8; MAPK13;
RELA; TLR4 ; MAPK14; IKBKG; RELB; MAP3K7; CHUK;
NFKB1 ; TLR2; JUN
Seña lización de p38 MAPK
HSPB1 ; IRAK1 ; TRAF6 ; MAPKAPK2; ELK1 ; FADO; FAS ;
CREB1 , 001T3; RPS6KA4 ; OAXX; MAPK13; TRAF2 ;
MAPK14; TNF; MAP3K7; TGFBR1 , MYC ; ATF4 ; IL1R1 ,
SRF; STAT1
Seña lización de NeurolrofinafTRK
NTRK2; MAPK 1, PTPN11 , PIK3CA; CREB1 ; FOS;
PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS ; PIK3C2A;
RAF1 ; MAP2K2; AKT1 ; PIK3R1 ; POPK1 ; MAP2K1 ;
C0C42; JUN; ATF4
Activación de FXRlRXR
INS; PPARA; FASN ; RXRA; AKT2; SDC1 ; MAPK8;
APOB; MAPK10; PPARG; MTTP; MAPK9; PPARGC1A;
TNF ; CREBBP; AKT1 ; SREBF1 ; FGFR4; AKT3; FOX01
Potenciación sináptica
PRKCE; RAP1A; EP300; PRKCZ; MAPK1 ; CREB1 ,
a largo plazo
PRKCI; GNAQ; CAMK2A; PRK01 ; MAPK3; KRAS;
PRKCD; PPP1CC; RAF1 ; CREBBP; MAP2K2; MAP2K1 ;
ATF4; PRKCA
Señalización de calcio
RAP1A; EP300; HOAC4; MAPK1 , HDACS; CREB1 ,
CAMK2A; MYH9; MAPK3; HOAC2; HOAC7A; HOAC11 ,
HOAC9; HOAC3; CREBBP; CALR; CAMKK2; ATF4 ;
HOAC6
Seña lización de EGF
ELK1 , MAPK1 ; EGFR; PIK3CA; FOS; PIK3CB; PIK3C3;
MAPK8; MAPK3; PIK3C2A; RAF1 ; JAK1 ; PIK3R1 ;
STAT3; MAP2K1 ; JUN; PRKCA; SRF; STAT1
FUNCiÓN CELULAR
GENES
Señalización de Hipoxia en el
EDN1 , PTEN ; EP300; NQ01 , UBE21; CREB1 ; ARNT;
Sistema Card iovascular
HIF1A; SLC2A4; NOS3; TP53 ; LDHA; AKT1 ; ATM;
VEGFA; JUN; ATF4; VHL; HSP90AA1
Inhibición mediada por LPS/IL-1
IRAK1 , MYD88; TRAF6; PPARA; RXRA; ABCA1 ;
de función RXR
MAPK8; ALDH1A1 ; GSTP1 ; MAPK9; ABCB1 ; TRAF2;
TLR4; TNF; MAP3K7; NR1 H2; SREBF1 , JUN; IL 1 R1
Activación de LXRlRXR
FASN; RXRA ; NCOR2; ABCA1 , NFKB2; IRF3; RELA;
NOS2A; TLR4; TNF; RELB; LDLR; NR1H2; NFKB1 ;
SREBF1 ; Il 1 R1 ; CCL2; IL6; MMP9
Proceso amiloide
PRKCE; CSNK1 E; MAPK1 ; CAPNS 1; AKT2; CAPN2;
CAPN1 ; MAPK3; MAPK13; MAPT; MAPK14; AKT1 ;
PSEN1 ; CSNK1A1 ; GSK3B; AKT3 ; APP
Señalización de IL-4
AKT2; PIK3CA; PIK3CB; PIK3C3; IRS1 , KRAS ; SOCKS1 ,
PTPN6; NR3C1 ; PIK3C2A; JAK1 ; AKT1 ; JAK2; PIK3R1 ;
FRAP1 ; AKT3; RPS6KB1
Regu lación
EP300; PCAF; BRCA1 , GADD45A; PLK1 ; BTRC;
Control de daño
CHEK1 ; ATR; CHEK2 ; YWHAZ; TP53; CDKN1A;
Ciclo celula r: ADN G2IM
PRKDC; ATM; SFN; CDKN2A
Seña lización de óxido nítrico en el
KDR; Fl T1 ; PGF; AKT2; PIK3CA; PIK3CB; PIK3C3;
Sistema Card iovascular
CAV1 , PRKCD; NOS3; PIK3C2A; AKT1 , PIK3R1 ,
VEGFA; AKT3; HSP90AA1
Metabolismo de Purina
NME2; SMARCA4; MYH9; RRM2; ADAR; EIF2AK4;
PKM2; ENTP01 , RAD51 , RRM2B; TJP2 ; RAD51C;
NT5E; POLD1 ; NME1
Seña lización med iada por cAMP
RAP1A; MAPK 1; GNAS; CREB1 ; CAMK2A; MAPK3 ;
SRC; RAF1 , MAP2K2; STAT3; MAP2K1 , BRAF; ATF4
Disfunción mitocond rial
SOD2; MAPK8; CASP8; MAPK10; MAPK9; CASP9;
PARK7; PSEN1 ; PARK2; APP; CASP3
Señalización de Notch
HES1 ; JAG1 ; NUMB; NOTCH4; ADAM 17; NOTCH2;
PSEN1 , NOTCH3; NOTCH1 , DLL4
Ruta del estrés del
HSPA5; MAPK8; XBP1 ; TRAF2; ATF6; CASP9; ATF4 ;
Reticulo endoplasmático
EIF2AK3; CASP3
Metabolismo de pirimidina
NME2; AICDA; RRM2; EIF2AK4; ENTPD1 , RRM2B ;
NTSE; POlD1; NME1
Seña lización de Parkinson
UCHL1 , MAPK8; MAPK13; MAPK14; CASP9; PARK7;
PARK2; CASP3
Seña lización
GNAS; GNAQ; PPP2R1A; GNB2l1 ; PPP2CA; PPP1CC;
Ca rdíaca y beta adrenérgica
PPP2RSC
GlucolisislGluconeogénesis
HK2; GCK; GPI; ALDH1A1 ; PKM2; lDHA; HK1
Señalización de interferón
IRF1 ; SOCS1 ; JAK1 ; JAK2; IFITM1 ; STAT1 ; IFIT3
FUNCiÓN CELULAR
GENES
Señalización Sonic Hedgehog
ARRB2; SMO; GLl2; DYRK1A; GLl1 , GSK3B; DYRK1B
Metabolismo
PLD1 ; GRN; GPAM; YWHAZ; SPHK1 ; SPHK2
Gl icerofosfolípidos
DegradaciÓfl de fosfolíp idos
PRDX6; PLD1;GRN;YWHAZ;SPHK1;SPHK2
Metabolismo de Iriplofano
SIAH2; PRMTS; NEDD4; ALDH1A1 ; CYP1B1 ; SIAH1
Degradación de lisina
SUV39H1 , EHMT2; NSD1 , SET07; PPP2RSC
Rula
ERCCS; ERCC4; XPA; XPC ; ERCC1
Reparación escisión de nucleólidos
Metabolismo de
UCH L 1; HK2; GCK; GPI; HK1
Almidón y sacarosa
Metabolismo de aminoazúcares
NQ01 ; HK2; GCK; HK1
Metabolismo de
PRDX6; GRN ; YWHAZ; CYP1B1
Ácido araquidónico
Seña lización de ritmo circadiano
CSNK1E; CREB1 ; ATF4; NR1D1
Sistema de coagulación
BDKRB1 ; F2R; SERPINE1 ; F3
Receptor de Dopamina
PPP2R1A; PPP2CA; PPP1CC; PPP2R5C
Señalización
Metabolismo de glutationa
IDH2; GSTP1 , ANPEP; IDH1
Metabolismo de glicerolípidos
ALDH1A1 ; GPAM; SPHK1 ; SPHK2
Metabolismo de ácido linoleico
PRDX6; GRN ; YWHAZ; CYP1B1
Metabolismo de Metionina
DNMT1 , ONMT3B; AHCY; ONMT3A
Metabolismo de piruvato
GL01 ; ALOH1A1 ; PKM2; LOHA
Metabolismo de
ALDH1A1 , NOS3; NOS2A
Argin ina y Prolina
Seña lización Eicosanoide
PRDX6; GRN ; YWHAZ
metabolismo de
HK2; GCK; HK t
Fructosa y Manosa
Metabolismo de Galactosa
HK2; GCK; HK1
Biosintesis de estilbeno ,
PRDX6; PRDX1 ; TYR
cuma rina y lignina
Ruta de
CALR; B2M
Presentación de antígenos
Biosíntesis de esteroides
NQ01 , OHCR7
Metabolismo de Butanoato
ALDH1A1 , NLGN1
Ciclo del Citrato
IOH2; IOH1
Metabolismo de ácidos grasos
ALDH1A1 ; CYP1B1
Metabolismo de
PRDX6; CHKA
Gl icerofosfolípidos
Metabolismo de Histidina
PRMTS; ALDH1A1
Metabolismo de Inositol
ER01L; APEX1
FUNCiÓN CELULAR
GENES
Metabolismo de xenobi6ticos
GSTP1 , CYP1 81
por citocromo p450
Metabolismo de metano
PRDX6; PRDX1
Metabolismo de fenilalanina
PRDX6; PRDX1
Metabolismo de Propanoato
ALDH1A1 ; LDHA
Metabolismo de
PRMT5; AHCY
Selenoaminoácido
Metabolismo de esfingolipidos
SPHK1 ; SPHK2
Aminofosfonato
PRMT5
Metabolismo
Andrógenos yestrágenos
PRMT5
Metabolismo de
Ascorbato y Aldarato
ALDH1A1
Metabolismo de
Biosinteis de ácidos biliares
ALDH1A1
Metabolismo de cisteína
LDHA
Biosinteis de ácidos grasos
FASN
Receptor de Glutamato
GN82L1
Señalización de
Respuesta de estrés
PRDX1
Oxidativa mediada por NRF2
Ruta de
GPI
Pentosa fosfato
Interconversiones de
UCHL1
Pentosa y Glucuronato
Metabolismo de Retinol
ALDH1A1
Metabolismo de Riboflavina
TYR
Metabolismo de tirosina
PRMT5, TYR
Biosintesis de Ubiquinona
PRMT5
Degradación de Valina, Leucina e
ALDH1A1
Isoleucina
Metabolismo de Glicina, Serina y
CHKA
Treonina
Degradación de lisina
ALDH1A1
dolorlsabor
TRPM5; TRPA1
dolor
TRPM7; TRPC5; TRPC6; TRPC1 ; Cnr1 ; cnr2; Grk2;
Trpa1 ; Pomc; Cgrp; Crf; Pka; Era; Nr2b; TRPM5; Prkaca;
Prkacb; Prkar1a; Prkar2a
Función mitocondrial
AIF; CytC; SMAC (Diablo); Aifm-1; Aifm-2
Neurología de desarrollo
BMP-4; Chordin (Chrd); Noggin (Nog); WNT (Wnt2;
FUNCiÓN CELULAR
GENES
Wnt2b; Wnt3a; Wnt4; Wnt5a; Wnt6; Wnt7b; Wnt8b;
Wnt9a; Wnt9b; Wnt10a; Wnt10b; Wnt16); beta--eatenin;
Dkk-1 , proteínas relacionadas con Frizzled; Otx-2; Gbx2; FGF-8;
Reelin; Dab1; unc-B6 (Pou4f1 or Brn3a); Numb; Reln
Las realizaciones también se refieren a métodos y composiciones relacionadas con eliminación de genes, la multiplicación de genes y reparación de mutaciones particulares asociadas a la inestabilidad de repeticiones de ADN y trastornos neurológicos (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Segunda Edición, Academic Press 13 de octubre de 2.011-Medical). Aspectos especificos de secuencias de repetición en tándem se han encontrado responsable de más de veinte enfermedades humanas (Nuevos conocimientos en la inestabilidad de la repetición: función de hibridos de ARN·ADN. Mclvor El, Polak U, Napierala
M. RNA Biol. Sep-Oct 2.010; 7 (5): 551-8). El sistema CRISPR-Cas puede ser aprovechado para corregir estos defectos de inestabilidad gellÓmica
Un aspecto más de la descripción se refiere a la utilización del sistema CRISPR-Cas para corregir defectos en los genes EMP2A y EMP2B que se ha identificado que están asociados a la enfermedad Lafora. La enfermedad de Lafora es un trastomo autos6mico recesivo que se caracteriza por epilepsia mioclónica progresiva que puede empezar como ataques epilépticos en la adolescencia. Algunos casos de la enfermedad pueden estar causados por mutaciones en genes que se tienen que identificar sin embargo. La enfermedad produce ataques, espasmos musculares, dificultad para caminar, demencia y eventualmente la muerte. En la actualidad no hay tratamiento que se haya demostrado eficaz contra el progreso de la enfermedad. Otras anormalidades genéticas asociadas a la epilepsia también pueden ser fijadas como objetivo mediante el sistema CRISPR-Cas y la genética subyacente se describe además en Genetics of Epilepsy and Genetic Epilepsies, editado por Giu liano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology: 20; 2.009)
En otro aspecto más, el sistema CRISPR-Cas puede ser usado para corregir defectos oculares que surgen de mutaciones genéticas diversas descritas además en Genetic Diseases of the Eye, Segunda Edición , editado por Elias l. Traboulsi, Oxford University Press, 2.012
Diversos aspectos adicionales se refiere a corregir defectos asociados a un amplio intervalo de enfermedades genéticas que se describen además en la página web del Instituto Nacional para la Salud bajo la subsección tópica Trastornos Genéticos Las enfermedades cerebrales genéticas pueden incluir pero no se limitan a, Adrenoleucodistrofia, Angenesia del Cuerpo Ca lloso, Slndrome de Aicard i, Enfermedad de Alper, Enfermedad de Alzheimer, Síndrome de Barth, Enfermedad de Balten, CADASIL, Degeneración Cerebelar, Enfermedad de Fabry, Enfermedad de Gerstmann-Straussler-Scheinker, Enfermedad de Huntington y otros Trastomos de Triple Repetición, Enfermedad de Leigh, Síndrome de Lesch-Nyhan, Enfermedad de Menkes, Miopatías Mitocondriales y Colpocefalia de NINDS (por sus siglas en inglés). Estas enfermedades se describen además en la página web del Instituto Nacional de la Salud bajo la subsección Trastornos Cerebrales Genéticos.
En algunas realizaciones, la afección puede ser neoplasia. En algunas realizaciones, donde la afección es neoplasia, los genes que se tienen que fijar como objetivo son cualquiera de los enumerados en la Tabla A (en este caso PTEN etc). En algunas realizaciones, la afección puede ser Degeneración Macular Relacionada con la Edad En algunas realizaciones, la afección puede ser un Trastorno Esquizofrénico. En algunas realizaciones, la afección puede ser un trastomo de Repetición del Trinucleótido. En algunas realizaciones, la afección puede ser Síndrome de Frágil X. En algunas realizaciones, la afección puede ser un Trastorno Relacionado con la Secretasa. En algunas realizaciones, la afección puede ser un trastomo relacionado con el Prión. En algunas realizaciones, la afección puede ser ALS (por sus siglas en inglés). En algunas realizaciones, la afección puede ser una drogadicción. En algunas rea lizaciones, la afección puede ser Autismo. En algunas realizaciones, la afección puede ser Enfermedad de Alzheimer. En algunas realizaciones, la afección puede ser inflamación. En algunas realizaciones, la afección puede ser Enfermedad de Par1<inson
Ejemplos de proteínas asociadas a la enfermedad de Pal1<inson incluyen pero no se limitan a a-sinucleína, DJ-1, LRRK2, PINK1, Par1<in, UCHL 1, Synphilin-1 y NURR1
Ejemplos de proteínas relacionadas con la adicción pueden incluir ABAT por ejemplo.
Ejemplos de proteínas relacionadas con la inflamación pueden incluir la proteína quimioatrayente de monocitos -1 (MCP1 ) codificada por el gen Ccr2, el receptor de quimiocina C-C tipo 5 (CCR5) codificada por el gen Ccr5, el receptor IIB de IgG (FCGR2b, también denominado CD32) codificada por el gen Fcgr2b o la proteina de R1g Fc épsilon (FCER1g) codificada por el gen Fcer1g, por ejemplo
Ejemplos de proteínas asociadas a enfermedades cardiovasculares pueden incluir IL1B (interleucina 1, beta), XDH (xantina deshidrogenasa), TP53 (proteína tumoral p53), PTGIS (prostaglandina 12 (prostaciclina) sintasa), MB (mioglobina), IL4 (inteneucina 4), ANGPT1 (angiopoyetina 1), ABCG8 (casete de unión a ATP, sub-familia G (WHITE), miembro 8) o CTSK (catepsina K), por ejemplo
Ejemplos de proteínas asociadas a la enfermedad de Alzheimer pueden incluir la proteína receptora de lipoproteína de densidad muy baja (VLDLR, por sus siglas en inglés) codificada pOf el gen VLDLR, la enzima aclivadora de modificador de tipo ubiquitina 1 (UBA1) codificada por el gen UBA1 o la proteína de subunidad cata lítica de enzima E1 activadora de NEDD8 (UBE1C) codificada por el gen UBA3, por ejemplo
Ejemplos de proteínas asociadas a Trastorno por Espectro Autista pueden incluir la proteína 1 asociada a receptor de benzodiazapina (periférica) (BZRAP1) codificada por el gen BZRAP1, la proteína del miembro 2 de la familia AF4/FMR2 (AFF2) codificada por el gen AFF2 (también denominado MFR2), la proteína de homólogo 1 autosómico de retraso mental frágil X (FXR1) codificada por el gen FXR1 o la proteina de homólogo 2 autosómico del retraso mental frágil X (FXR2) codificada por el gen FXR2, por ejemplo
Los ejemplos de proteinas asociadas a Degeneración Macular pueden incluir la casete de unión de ATP, proteina del miembro 4 (ABCA4) de la sub-familia A (ABC 1) codificada por el gen ABCR, la proteína apolipoproteína E (APOE) codificada por el gen APOE o la proteína de Ligando 2 (CCL2) de quimiocina (unidad C-C) codificada por el gen CCL2, por ejemplo.
Ejemplos de proteínas asociadas a Esquizofrenia pueden incluir NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BoNF, DISC1 , GSK3B y combinaciones de las mismas.
Ejemplos de proteínas implicadas en la supresión de tumores pueden incluir ATM (ataxia telangiectasia mutada), ATR (ataxia telangiectasia y relacionada con Rad3), EGFR (receptor de factor de crecimiento epidérmico), ERBB2 (homólogo 2 de oncogén vírico de leucemia eritroblástica v-erb-b2), ERBB3 (homólogo 3 de oncogén vírico de leucemia eritroblástica v-erb-b2), ERBB4 (homólogo 4 de oncogén vírico de leucemia eritroblástica v-erb-b2), Notch 1, Notch2, Notch 3 o Notch 4, por ejemplo.
Ejemplos de proteínas asociadas a trastorno de la secretas pueden incluir PSENEN (homólogo de estimulador 2 de presenilina (C. elegans)), CTSB (catepsina B), PSEN1 (presenilina 1), APP (proteína precursora de amiloide beta (A4», APH1 B (homólogo B defectuoso 1 anteriOf de la faringe (C. elegans)), P8EN2 (presenilina 2 (enfermedad de Alzheimer 4)) o BACE1 (enzima 1 de escisión de APP de sitio beta), por ejemplo.
Los ejemplos de proteínas asociadas a Esclerosis Lateral Amiotrófica pueden incluir 8001 (superóxido dismutasa 1), ALS2 (esclerosis lateral amiotrófica 2), FUS (fusionado en sarcoma), TARoBP (proteina de unión de AoN TAR), VAGFA (factor A de crecimiento endotelial vascular ), VAGFB (factor B de crecimiento endotelial vascular) y VAGFC (factor C de crecimiento endotelial vascular) y cualquier combinación de los mismos
Ejemplos de proteínas asociadas a enfermedades por priones pueden incluir S001 (superóxido dismutasa 1), ALS2 (esclerosis lateral amiotrófica 2), FUS (fusionado en sarcoma ), TARDBP (proteina de unión de AoN TAR), VAGFA (factor A de crecimiento endolelial vascular), VAGFB (factor B de crecimiento endotelial vascular) y VAGFC (factor C de crecimiento endotelial vascular) y cualquier combinación de los mismos
Los ejemplos de proteínas relacionadas con enfermedades neurodegenerativas en trastornos por priones pueden incluir A2M (Alfa-2-Macroglobu lina), AATF (Factor de transcripción de antagonización de muerte celular programada), ACPP (fosfatasa ácida prostática), ACTA2 (Actina alfa 2 de músculo liso aona), ADAM22 (dominio de la metalopeptidasa AOAM), ADORA3 (Receptor de adenosina A3) o ADRA10 (Receptor adrenérgico Alfa-1o para adrenoreceptor Alfa-1D), por ejemplo
Los ejemplos de proteínas asociadas a Inmunodeficiencia pueden incluir A2M [alfa-2-macroglobulina); AANAT [arilalquilamina N-acetiltransferasa); ABCA1 [casete de unión a ATP, sub-familia A (ABC1 ), miembro 1]; ABCA2 [casete de unión a ATP, sub-familia A (ABC1), miembro 2) o ABCA3 [casete de unión a ATP, sub-fam ilia A (ABC1 ), miembro 3) ; por ejemplo .
Ejemplos de proteínas asociadas a Trastomos de Repetición del Trinucleótido incluyen AR (receptor de andrógeno), FMR1 (retraso mental 1 frágil X), HTT (huntingtina) o oMPK (distrofia miotónica-proteína cinasa), FXN (frataxina), ATXN2 (ataxina 2), por ejemplo.
Ejemplos de proteínas asociadas a Trastornos de Neurotransmisión incluyen SST (somatostatina), NOS1 (óxido nítrico sintasa 1 (neuronal)), AORA2A (receptor alfa-2A-adrenérgico), AORA2C (receptor alfa-2C-adrenérgico), TACR1 (receptor de taquicinina 1) o HTR2c (receptor 2C de 5-hidroxitriptamina (serotonina», por ejemplo
Ejemplos de secuencias asociadas al neurodesarrollo incluyen A2BP1 [proteína 1 de unión de ataxina 2), AAOAT [amillOadipato aminotransferasa), AANAT [arilalquilamina N-acetiltransferasa), ABAT [4-aminobutirato aminotransferasa), ABCA1 [casete de unión a ATP, sub-familia A (ABC1). miembro 1) o ABCA13 [casete de unión a ATP, sub-familia A (ABe1 l, miembro 13), por ejemplo.
Más ejemplos de trastornos preferidos tratables con el presente sistema se pueden selecciooar de: Síndrome de Aicardi-Goutiéres; Enfermedad de Alexander; Sindrome de Allan-Hemdon+Dudley; Trastomos Relacionados con POLG; Alfa-Manosidosis (Tipo 11 y 111); Síndrome de Alstr6m; Angelman; Síndrome; Ataxia-Telangiectasia; Lipofuscinosis Ceroide Neuronal; Beta-Talasemia; Atrofia Óptica Bilateral y Atrofia Óptica (Infantil) Tipo 1; Retinoblastoma (bilateral); Enfermedad de Canavan; Sindrome 1 Cerebroculofacioesquelético [COFS1]; xantomatosis Cerebrotendinosa; Sindrome de Camelia de Lange; Trastomos Relacionados con MAPT; Enfermedades Genéticas por Priones; Sindrome de Dravet; Enfermedad de Alzheimer Familiar de Comienzo Temprano; Ataxia de Friedreich [FRDA]; Síndrome de Fryns; Fucosidosis; Distrofia Muscular Coogénita de Fukuyama; Galactosialidosis; Enfermedad de Gaucher; Acidemias Orgánicas; Linfohistiocitosis Hemofagocítica; Sindrome de Progeria de Hutchinson-Gilford; Mucolipidosis 11; Enfermedad de Almacenamiento de Ácido Siálico Libre Infantil; Neurodegeneración Asociada a PlA2G6; Sindrome de Jervell y Lange-Nielsen; Epidermolisis Bullosa sobre las Articulaciones; Enfermedad de Huntington; Enfermedad de Krabbe (Infantil); Síndrome de Leigh Asociado al ADN Mitocondrial y NARP; Síndrome de Lesch-Nyhan; Lisencefalia Asociada a LlS1; Síndrome de Lowe; Enfermedad Urinaria de Jarabe de Maple; Síndrome de Duplicación de MECP2; Trastomos de Transporte de Cobre Relacionado con ATP7 A; Distrofia Muscular Relacionada con LAMA2; Deficiencia de Arilsulfatasa A; Mucopolisacaridosis Tipos 1, 11 o 111; Trastornos de la Biogénesis del Peroxisoma, Espectro del Síndrome de Zellweger; Neurodegeneración con Trastornos de Acumulación de Hierro en el Cerebro; Deficiencia de Esfingomielinasa Ácida; Enfermedad de Niemann-Pick Tipo C; Encefalopatía por Glicina; Trastornos Relacionados con ARX; Trastomos del Ciclo de la Urea; Osteogénesis Imperfecta Relaciooada con COL 1A1/2; Síndrome de Supresión de ADN Mitocondrial; Trastornos Relacionados con PLP1; Síndrome de Perry; Síndrome de PhelanMcDermid; Enfermedad de Almacenamiento de Glucógeno Tipo 11 (Enfermedad de Pompe) (Infantil); Trastomos Relacionados con MAPT; Trastomos Relacionados con MECP2; Condrodisplasia Punctata Rizomélica Tipo 1, Síndrome de Roberts; Enfermedad de Sandhoff; Enfermedad de Schindler -Tipo 1; Deficiencia de Adenosina Deaminasa; Síndrome de Smith-Lemli-Opitz; Atrofia Muscular Espinal; Ataxia Espinocerebelar de Comienzo Infantil; Deficiencia de Hexosaminidasa A; Displasia Tanatofórica de Tipo 1; Trastomos Relacionados con el Colágeno Tipo VI; Síndrome de Usher Tipo 1; Distrofia Muscular Congénita; Síndrome de Wolf-Hirschhom; Deficiencia de Lipasa Ácida Lisosomal y Xerodermia Pigmentosa.
La administración crónica de terapéutica proteínica puede provocar respuestas inmunitarias inaceptables a la proteína específica. La inmunogenicidad de fármacos de proteínas puede ser atribuida a algunos epítopos de linfocitos de auxiliar T inmunodominante (HTL, por sus siglas en inglés). Reducir la afinidad de unión de MHC de estos epítopos HTL contenidos dentro de estas proteínas puede generar fármacos con inmunogenicidad menor (Tangri S, el al. CRationally engineered therapeutic proteíns with reduced ímmunogenícity" J Immunol. 15 de marzo de 2.005; 174( 6): 3.187-96.) La inmunogenicidad de la enzima CRISPR en particular se puede reducir siguiendo la propuesta explicada primero en Tangri et al con respecto a eritropoyetina y desarrollada con posterioridad. De acuerdo con esto, se puede usar la evolución directa o el diseño racional para reducir la inmunogenicidad de la enzima CRISPR (por ejemplo una Cas9) en la especie huésped (ser humano u otras especies)
En las plantas, los patógenos son con frecuencia específicos del huésped. Por ejemplo, Fusarium oxysporum f. sp. Iycopersici produce marchitamiento del tomate pero ataca sólo al tomate y F. oxysporum r. dianthii Puccinia graminis f sp. tritici ataca sólo al trigo. Las plantas tienen defensas existentes e inducidas para resistir a la mayoría de los patógenos. Las mutaciones y casos de recombinación a lo largo de las generaciones de plantas conducen a variabilidad genética que da lugar a susceptibilidad, especialmente cuando se reproducen los patógenos con más frecuencia que las plantas. En las plantas puede haber resistencia al no huésped, por ejemplo, el huésped y el patógeno son incompatibles. También puede ser Resistencia Horizontal, por ejemplo, resistencia parcial contra todas las razas de un patógeno, controlado típicamente por muchos genes y Resistencia Vertical, por ejemplo, resistencia completa a algunas razas de un patógeno pero no a las demás razas, típicamente controlado por algunos genes. En un nivel gen por gen, las plantas y los patógenos evolucionan juntos y los cambios genéticos en uno equilibran los cambios en otro. De acuerdo con esto, usando Variabilidad Natural, los criadores combinan la mayoría de los genes útiles para Rendimiento, calidad, Uniformidad, Dureza, Resistencia. Las fuentes de genes de la resistencia incluyen Variedades naturales o extrañas, Variedades Heirloom, Mutaciones Relativas a las Plantas Silvestres e Inducidas, por ej., tratando material vegetal con agentes mutagénicos. Usando la presente descripción, se proporciona a los criadores de plantas una nueva herramienta para inducir mutaciones. De acuerdo con esto, un experto en la materia puede analizar el genoma de fuentes de genes de resistencia y en Variedades con características o rasgos deseados emplea la presente invención para inducir el aumento de genes de resistencia, con más precisión que los agentes mutagénicos previos y por lo tanto acelera y mejora los programas de cultivo
Como será evidente, se prevé que el presente sistema se pueda usar para fijar como objetivo cualquier secuencia de polinucleótidos de interés. Algunos ejemplos de afecciones o enfermedades que se podían tratar positivamente usando el presente sistema se incluyen en las Tablas anteriores y también se proporcionan allí ejemplos de genes asociados en la actualidad a esas enfermedades Sin embargo, los genes ejemplificados no son exhaustivos
Ejemplos
Los siguientes ejemplos se proporcionan con fines ilustrativos de diversas realizaciones de la invención y no están destinados a limitar la presente invención de ningún modo. Los presentes ejemplos, junto con los métodos descritos en la presente memoria son representativos en el momento presente de realizaciones preferidas, son ejemplares, y no se destinan a limitar el alcance de la invención.
Ejemplo 1. Actividad del complejo CRISPR en el núcleo de una célula eucariota.
Un sistema CRISPR de ejemplo de tipo 11 es el sitio CRISPR de tipo II de Streptococcus pyogenes SF370, que contiene una agrupaciÓfl de cuatro genes Cas9, Cas1 , Cas2 y Csn1 , asi como dos elementos de ARN no codificante, ARNtracr y una serie característica de secuencias repetitivas (repeticiones directas) inter espaciadas por tramos cortos de secuencias no repetitivas (espaciadores, aproximadamente 30 pb cada uno). En este sistema, se genera rotura de doble cadena (RoC) de AoN fijado como objetivo en cuatro etapas secuenciales (Figura 2A). Primero, dos ARN no codificantes, la serie pre· ARNcr y ARNtracr, se transcriben del sitio CRISPR. Segundo, ARNtracr se hibrida a las repeticiones directas de pre-ARNcr, que se tratan después en ARNcr maduros que contienen secuencias espaciadoras individuales. Tercero, el complejo ARNcr:ARNtracr maduro dirige Cas9 al AON objetivo que consiste en el protoespaciador y la correspondiente PAM via la fonnación de heterodúplex entre la región espaciadora del ARNcr y el AON protoespaciador. Finalmente, Cas9 media la escisión de AoN objetivo aguas arriba de PAM para crear una ROC dentro del protoespaciador (Figura 2A). Este ejemplo describe un procedimiento de ejemplo para adaptar este sistema de nucleasa programable de ARN para dirigir la actividad del complejo CRISPR en el núcleo de las células eucariotas
Para mejorar la expresión de los componentes CRISPR en células de mamífero, se codón-optimizaron dos genes del sitio 1 de SF370 de Streptococcus pyogenes (S. pyogenes), Cas9 (SpCas9) y RNasa 111 (SpRNasa 1/1). Para facilitar la localización nuclear, se incluyó una señal de localización nuclear en el ténnino (N) amino o (C) carboxilo de ambas SpCas9 y SpRNasa 111 (Figura 2B). Para facilitar la visualización de la expresión de proteínas, también se incluyó un marcador de proteína nuorescente en el N· o C-terminal de ambas proteinas (Figura 28). También se generó una versión de SpGas9 con un NLS unido a ambos N-y C-terminal (2xNLS-SpCas9). Se transinfeclaron construcciones que contenían SpCas9 NLS-fusionada y SpRNasa 111 en células de riñón embriónico humano (HEK, por sus siglas en inglés) 293FT y se encontró el posicionamiento relativo de la NLS a SpCas9 y SpRNasa 111 para afectar a su eficacia de localización nuclear. Mientras la NLS C-terminal fue suficiente para fijar como objetivo SpRNasa 111 para los núcleos, la unión de una sola copia de estas NLS particulares en cualquiera de los N-o Cterminal de SpCas9 no pudo conseguir la localización nuclear adecuada en este sistema. En este ejemplo, la NLS C· terminal fue la de nucleoplasmina (KRPAATKKAGOAKKKK) y la NLS C-terminal fue la del antígeno T grande SV40 (PKKKRKV). De las versiones de SpCas9 ensayadas, sólo 2xNLS-SpCas9 presentó localización nuclear (Figura 2B)
La secuencia ARNtracr del sitio CRISPR de S. pyogenes SF370 presenta dos sitios de comienzo transcripcional, dando lugar a dos transcritos de 89 nucleótidos (nt) y 171 nt que se tratan con posterioridad en ARNtracr maduros de 75 nt idénticos. Se seleccionó el ARNtracr de 89 nt más corto para expresión en células de mamifero (construcciones de expresión ilustradas en la Figura 6, con funcionalidad cuando se determina por los resultados del ensayo de Surveryor mostrado en la Figura 68). Los sitios de comienzo de la transcripción se señalan como +1 yel terminador de la transcripción y la secuencia probada por el ensayo de northem se indican también. La expresión de ARNtracr tratado también se confirmó por ensayo de Northem. La Figura 7C muestra los resultados de un ensayo de Northern de ARN total extraído de células 293FT transinfectadas con construcciones de expresión U6 que soportan ARNtracr largo o corto, así como SpCas9 y OR-EMX1(1)-OR. Los paneles izquierdo y derecho son de células 293FT transinfectadas sin o con SpRNasa 111, respectivamente. U6 indica control de carga representado gráficamente con una sonda que fija como objetivo ARNsn U6 humano. La transinfección de la construcción de expresión de ARNtracr corto conduce a niveles abundantes de la forma tratada de ARNtracr (-75 pb). Se detectan cantidades muy bajas de ARNtracr largo en el análisis de Northem.
Para activar la iniciación precisa transcripcional, se seleccionó el activador de U6 basado en ARN polimerasa 111 para conducir la expresión de ARNtracr (Figura 2C). De manera similar, se desarrolló una construcción a base de activador U6 para expresar una serie pre-ARNcr que consiste en un único espaciador flanqueado por dos repeticiones directas (las RO, también induida por el término ~secuencias de emparejamiento traer"; Figura 2C). Se diseñó el espaciador inicial para fijar como objetivo un sitio objetivo de 33 pares de bases (pb) (protoespaciador de 30 pb más una secuencia de unidad (PAM) CRISPR de 3 pb que satisface la unidad de reconocimiento NGG de Cas9) en el sitio EMX1 humano (Figura 2C), un gen clave en el desarrollo de la corteza cerebral
Para ensayar si la expresión heter610ga del sistema CRISPR (SpCas9, SpRNasa 111, ARNtracr y pre-ARNcr) en células de mamífero puede conseguir la escisión fijada como objetivo de cromosomas de mamífero, se transinfectaron células HEK 293FT con combinaciones de componentes CRISPR. Puesto que las RoC en núcleos de mamifero se reparan parcialmente por la ruta de unión de extremos no homólogos (NHEJ, por sus siglas en inglés), que conduce a la formación de inserciones o supresiones, se usó el ensayo Surveyor para detectar potencial actividad de escisión en el sitio EMX1 objetivo (véase por ej., Guschin el al., 2.010, Methods Mol Biol 649: 247). La transinfección conjunta de los cuatro componentes CRISPR pudo inducir una escisión hasta del 5,0% en el protoespaciador (véase la Figura 20). La transinfección conjunta de todos los componentes CRISPR menos SpRNasa tll también indujo hasta 4,7% de inserción o supresión en el protoespaciador, que sugiere que puede haber Rnasas de mamífero endógenas que son capaces de ayudar a la maduración de ARNcr, tal como por ejemplo las enzimas oicer y Orosha relacionadas. Retirar cualquiera de los tres componentes restantes anula la actividad de escisión del genoma del sistema CRISPR (Figura 20) La secuenciación Sanger de amplicones que contiene el sitio fijado como objetivo verificó la actividad de escisión: en 43 clones secuenciados, se encontraron 5 alelas mutados (11 ,6%). Experimentos similares usando una variedad de secuencias guia produjeron porcentajes de inserción o supresión tan altos como 29% (véanse las Figuras 4-8, 10 Y 11). Estos resultados definen un sistema de tres componentes para modificación de genomas mediada por CRISPR eficaz en células de mamífero.
Para optimizar la eficacia de escisión, los solicitantes también ensayaron si diferentes isoformas de ARNtracr afectaban a la eficacia de la escisión y encontraron que, en este sistema de ejemplo, sólo la forma transcrita corta (89 pb) era capaz de mediar la escisión del sitio gellÓmico EMX1 humano. La Figura 9 proporciona un análisis de Northern adicional de tratamiento de ARNcr en células de mamífero. La Figura 9A ilustra un esquema que muestra el vector de expresión para un único espaciador nanqueado por dos repeticiones directas (RO-EMX1(1}-RO). El espaciador de 30 pb que fija como objetivo el protoespaciador 1 del sitio EMX1 humano y las secuencias de repetición directa se muestran en la secuencia debajo de la Figura 9A. La línea indica la región cuya secuencia de complemento inverso se usó para generar sondas de Northern para detección de ARNcr de EMX1(1). La Figura 9B mueslra un análisis Northem de ARN total extra ido de células 293FT Iransinfectadas con construcciones de expresión U6 que soportan RO-EMX1(1)-RO. Los paneles izquierdo y derecho son de células 293FT transinfectadas sin o con SpRNasa 111 respectivamente. Se trató RO-EMX1(1)-RO en ARNcr maduros sólo en presencia de SpCas9 y ARNtracr corto y no fue dependiente de la presencia de SpRNasa 111. El ARNcr maduro detectado de ARN total de 293FT transinfectado es -33 pb Y es más corto que el ARNcr maduro de 39-42 pb de S. pyogenes. Estos resultados demuestran que un sistema CRISPR se puede trasplantar en células eucariotas y reprogramar para facilitar la escisión de pol inudeótidos objetivo de mamiferos endógenos
La Figura 2 ilustra el sistema CRISPR bacteriano descrito en este ejemplo. La Figura 2A ilustra un esquema que mueslra el sitio 1 de CRISPR de Streptococcus pyogenes SF370 y un mecanismo propuesto de escisión de AON mediada por CRISPR por este sistema. El ARNcr maduro tratado de la serie repetición directa -espaciador dirige Cas9 a objetivos genómicos que constan de protoespaciadores complementario y una unidad adyacente al protoespaciador (PAM). En el emparejamiento de base objetivo-espaciador, Cas9 media una rotura de doble cadena en el AON objetivo. La Figura 2B ilustra el logro de Cas9 de s. pyogenes (SpCas9) y RNasa lit (SpRNasa 111) con señales de localización nuclear (las NLS) para permitir la importación al núcleo del mamifero. La Figura 2C ilustra la expresión de mamifero de SpCas9 y SpRNasa 111 conducida por el activador EF1a constitutivo y ARNtracr y la serie pre-ARNcr (RO-Espaciador-RO) conducidos por el activador U6 de ARN Pol3 para activar iniciación y terminación de transcripción precisa. Un protoespaciador del sitio EMX1 humano con una secuencia PAM satisfactoria se usa como el espaciador en la serie pre-ARNcr. La Figura 20 ilustra ensayo de la nucleasa sUNeyor para inserciones y supresiones minoritarias mediadas por SpCas9. SpCas9 se expresÓ con y sin SpRNasa 111, ARNtracr y una serie pre-ARNcr que soporta el espaciador objetivo EMX1 . La Figura 2E ilustra una representación esquemática de emparejamiento de bases enlre el sitio objetivo y ARNcr que fija como objetivo EMX1 , así como un cromatograma de ejemplo que muestra una microsupresión adyacente al sitio de escisión de SpCas9. La Figura 2F ilustra alelas mutados identificados de análisis de secuenciación de 43 amplicones clona les que muestran una variedad de microinserciones y supresiones. Las líneas discontinuas indican bases suprimidas y bases no alineadas o desajustadas indican inserciones o mutaciones. Barra de escala =10 ~m.
Para simplificar además el sistema de Ires componentes, se adaptó un diseño híbrido de ARNcr-ARNlracr quimérico, donde un ARNcr maduro (que comprende una secuencia guía) se fusiooa a un ARNtracr parcial vía un tallo-lazo para imitar el dúplex ARNcr:ARNtracr natural (Figura 3A)
Las secuencias guía se pueden insertar enlre sitios Bbsl usando oligonucle6tidos hibridados. Los protoespaciadores en las hebras transcrita y complementaria se indican por encima y por debajo de las secuencias de AON, respectivamente. Se consiguió una tasa de modificación de 6,3% y 0,75% para los sitios PVALB humano y Th de ratón, respectivamente, que demuestra la amplia aplicabilidad del sistema CRISPR en la modificación de diferentes sitios a través de múltiples organismos. Aunque la escisión sólo se detectó con uno de tres espaciadores para cada sitio usando las construcciones quiméricas, todas las secuencias objetivo se escindieron con eficacia de producción de inserción o supresión que alcanzó el 27% cuando se usó la disposición de pre-ARNcr expresada conjuntamente (Figuras 4 y 5).
La Figura 5 proporciona una ilustración más de que SpCas9 puede ser reprogramado para fijar como objetivo múltiples sitios gerlÓmicos en células de mamífero. La Figura 5A proporciona un esquema del sitio EMX1 humano que muestra la posición de cínco protoespaciadores, indicado por las secuencias subrayadas. La Figura 58 proporciona un esquema del complejo pre-ARNcr/ARNtrcr que muestra la hibridación entre la región de repeticiÓfl directa del pre-ARNcr y ARNlracr (parte superior) y un esquema de un diseño de ARN quimérico que comprende una secuencia guia de 20 pb Y secuencias de emparejamiento traer y traer que consisten en secuencias de repetición directa parcial y ARNtracf hibridadas segun la estructura de horquilla (fondo). Los resultados de un ensayo SUNeyor comparando la eficacia de escisión mediada por Cas9 en cinco protoespaciadores en el sitio EMX1 humano se ilustra en la Figura 5C. Cada proloespaciador se fija como objetivo usando complejo preARNcrfARNtracr tratado (ARNcr) o ARN quimérico (ARNqui).
Puesto que la estructura secundaria de ARN puede ser crucial para interacciones intermoleculares, se usó un conjunto de algoritmo de predicción de estructuras basado en energía libre mínima y estructura pesada de 801lzmann para comparar la eslructura secundaria putativa de todas las secuencias guia usadas en nuestro experimento de fijación como objetivo de genoma (Figura 38) (véase por ej., Gruber et al., 2.008, Nucleic Acids Research, 36: W70). El análisis reveló que en la mayoria de los casos, las secuencias guía eficaces en el contexto de ARNcr quimérico estaban sustancialmente exentas de unidades de estructura secundaria, mientras las secuencias guía ineficaces era más probable que formaran estructuras secundarias intemas que podían evitar el emparejamiento de bases con el AON de protoespaciador objetivo. Así es posible que la variabilidad en la estructura secundaria del espaciador puede impactar en la eficacia de la interferencia mediada por CRISPR cuando se usa un ARNcr quimérico
La Figura 3 ilustra vectores de expresión de ejemplo. La Figura 3A proporciona un esquema de un vector bicistrónico para conducir la expresión de una quimera ARNcr-ARNtracr sintética (ARN quimérico) así como SpCas9 El ARN guía quimérico contiene una secuencia guía de 20 pb correspondiendo al protoespaciador en el sitio objetivo genómico. La Figura 38 proporciona un esquema que muestra secuencias guía que fijan como objetivo los sitios EMX1, PVALB humano y Th de ratón, así como sus estructuras secundarias previstas. La eficacia de la modificaciÓfl en cada sitio objetivo se indica debajo del dibujo de la estructura secundaria del ARN (EMX1, n :; 216 lecturas de secuenciaciÓfl de amplicones; PVALB, n :; 224 lecturas; Th, n :; 265 lecturas). El algoritmo de plegamiento produjo una salida con cada base coloreada de acuerdo con su probabilidad de asumir la estructura secunda ria prevista, como se indica por una escala en arco iris que se reproduce en la Figura 38 en escala de grises. Más diseños de vectores para SpCas9 se presentan en la Figura 3A, incluyendo vectores únicos de expresión que incorporan un activador U6 ligado a un sitio de inserción para un aligo guía y un activador Cbh ligado a secuencia de cod ificación SpCas9
Para ensayar si los espaciadores que contienen estructuras secundarias son capaces de funcionar en células procariotas en las cuales los CRISPR operan de manera natural, se ensayó interferencia de transformación de plásmidos que soportan protoespaciadores en una cepa E. coli que expresa de manera heteróloga el sitio 1 CRISPR SF370 de S. pyogenes (Figura 3C). Se clonó el sitio CRISPR en un vector de expresión E. coli de copia baja y se reemplazó la serie ARNcr con un espaciador único flanqueado por un par de las RO (pCRISPR). Se transformaron cepas E. coli que albergaban diferentes plásmidos pCRISPR con plásmidos cuestionados conteniendo el correspondiente protoespaciador y secuencias PAM (Figura 3C). En el ensayo de bacterias, todos los espaciadores facilitaron interferencia de CRISPR eficaz (Figura 3C). Estos resultados sugieren que puede haber factores adicionales que afecten a la eficacia de la actividad de CRISPR en células de mamífero.
Para investigar la especificidad de la escisión mediada por CRISPR, se analizó el efecto de mutaciones de único nudeótido en la secuencia guía sobre la escisión del protoespaciador en el genoma de mamífero usando una serie de ARNcr quiméricos que fijan como objetivo EMX1 con mutación de puntos únicos (Figura 4A). La Figura 48 ilustra los resultados de un ensayo de nudeasa Surveyor comparando la eficacia de la escisión de Cas9 cuando se empareja con diferentes ARN quiméricos mutantes. El desajuste de bases únicas hasta 12 pb 5' de la PAM sustancialmente anuló la escisión gellÓmica por SpCas9, mientras los espaciadores con mutaciones en posiciones aguas arriba más lejos retuvieron la actividad frente al objetivo del protoespaciador original (Figura 48). Además de la PAM, SpCas9 presenta especificidad de base única dentro de los últimos 12 pb del espaciador. Además, CRISPR es capaz de mediar la escisiÓfl gen6mica tan eficazmente como un par de nucleasas TALE (TALEN) fijando como objetivo el mismo protoespaciador EMX1 . La Figura 4C proporciona un esquema que muestra el diseño de las TALEN que fijan como objetivo EMX1 y la Figura 40 muestra un gel Surveyor comparando la eficacia de TALEN y Cas9 (n=3)
Teniendo establecida una serie de componentes para conseguir edición de genes mediada por CRISPR en células de mamífero a través del mecanismo NHEJ con predisposición a errores, se ensayó la capacidad de CRISPR para estimular la recombinación homóloga (RH), una ruta de reparación de genes de alta fidelidad para preparar mediciones precisas en el genoma. SpCas9 de tipo natural es capaz de mediar las ROC específicas del sitio, que se pueden reparar a través de tanto NHEJ como RH. Además, se logró una sustitución de aspartato a alanina (010A) en el dominio catalítico RuvC t de SpCas9 para convertir la nudeasa en una nickasa (SpCas9n; ilustrado en la Figura 5A) (véase por ej., Sapranausaks et al., 2.011 , Cucleic Acis Research, 39: 9.275; Gasiunas et al., 2.012, Proc Natl. Acad. Sci. USA, 109: E2579), de manera que el AON genómico nickeado experimenta la reparación dirigida por homología de alta fidelidad (HOR, por sus siglas en inglés). El ensayo Surveyor confirmó que SpCas9n no generaba inserciones o supresiones en el objetivo del protoespaciador EMX1 . Como se ilustra en la Figura 58, la expresión conjunta de ARNcr quimérico que fija como objetivo EMX1 con SpCas9 produjo inserciones o supresiones en el sitio fijado como objetivo, mientras la expresión conjunta con SpCas9n no lo hizo (n::3). Por otra parte, la secuenciación de 327 amplicooes no detectó ninguna inserción o supresión inducida por SpCas9n. Se seleccionó el mismo sitio para ensayar RH mediada por CRISPR por transinfección conjunta de células HEK 293FT con el ARN quimérico que fija como objetivo EMX1 , hSpCas9 o hSpCas9n, asi como una plantilla de RH para introducir un par de sitios de restricción (Hindlll y Nhel) cerca del protoespaciador. La Figura SC proporciona una ilustraciÓfl en esquema de la estrategia de la RH, con posiciones relativas de puntos de recombinación y secuencias de hibridación de cebadores (flechas). SpCas9 y SpCas9n por supuesto catalizaron la integración de la plantilla de RH en el sitio EMX1. La multiplicación por PCR de la región fijada como objetivo seguida por digestión de restricción con Hindlll reveló productos de escisión correspondiendo a tamaños de fragmentos esperados (nechas en análisis de gel de polimorfismo de longitud del fragmento de restricción mostrado en la Figura 50), mediando SpCas9 y SpCas9n niveles similares de eficacias de la RH. Los sol icitantes verificaron además RH usando secuenciación de Sanger de
3D
amplicones genómicos (La Figura 5E). Estos resultados demuestran la utilidad de CRISPR para facilitar la inserción de genes fijados como objetivo en el genoma del mamifero. Dada la especificidad objetivo de 14 pb (12 pb del espaciador y 2 pb de la PAM) de SpCas9 de tipo natural, la disponibilidad de una nickasa puede reducir significativamente la probabilidad de modificaciones fuera de lo proyectado, puesto que las roturas de hebra única no son sustratos para la ruta NHEJ con predisposición a errores
Las construcciones de expresión que imitan la arquitectura natural de sitios CRISPR con espaciadores formados (Figura 2A) se construyeron para ensayar la posibilidad de fijar como objetivo secuencias multiplexadas. Usando una única serie CRISPR cod ificando un par de espaciadores que fijan como objetivo EMX1 y PVALB, se detectó la escisión eficaz en ambos sitios (Figura 4F, que muestra tanto un diseño esquemático de la serie ARNcr como un análisis SurveyOf mostrando la mediación eficaz de la escisión). La supresión fijada como objetivo de regiones genómicas mayores a través de las ROe usando espaciadores frente a dos objetivos dentro de EMX1 espaciado por 119 pb también se ensayó y se detectó una eficacia de la supresión del 1,6% (3 de un total de 182 amplicones; Figura 5G). Esto demuestra que el sistema CRISPR puede mediar la edición multiplexada dentro de un único genoma.
Ejemplo 2: Modificaciones y alternativas del sistema CRISPR
La capacidad para usar ARN para programar escisión de ADN específica de la secuencia define una nueva clase de herramientas de ingeniería del genoma para una variedad de aplicaciones de investigación e industriales. Diversos aspectos del sistema CRISPR se pueden mejorar además para aumentar la eficacia y la versatilidad de la fijación como objetivo de CRISPR. La actividad óptima de Cas9 puede depender de la disponibilidad de Mgz> libre en niveles mayores que los presentes en el núcleo de los mamíferos (véase por ej., Jinek et al., 2.012, Science, 337: 816) y la preferencia para una unidad de NGG inmediatamente aguas abajo del protoespaciador restringe la capacidad para fijar como objetivo de promedio cada 12 pb en el genoma humano. A lgunas de estas restricciones se pueden superar explorando la diversidad de los sitios CRISPR a través del metagenoma microbiano (véase por ej., Makarova et al., 2.011, Nat Rev Microbiol, 9: 467). Otros sitios CRISPR pueden ser trasplantados en el medio celular de los mamiferos mediante un procedimiento similar al descrito en el Ejemplo 1 La eficacia de la modificación en cada sitio fijado como objetivo se indica debajo de las estructuras secundarias de ARN. El algoritmo que genera las estructuras colorea cada base de acuerdo con su probabilidad de asumir la estructura secundaria prevista. Los espaciadores 1 y 2 guia de ARN indujeron 14% y 6,4%, respectivamente. El análisis estadístico de la actividad de escisión a través de réplicas biológicas en estos dos sitios del protoespaciador se proporciona también en la Figura 7
Ejemplo 3: Algoritmo de selección de secuencias objetivo de muestra
Se diseña un programa informático para identificar secuencias objetivo de CRISPR candidato en ambas cadenas de una secuencia de AON de entrada basada en longitud deseada de secuencias guía y una secuencia de unidad CRISPR (PAM) para una enzima CRISPR especificada. Por ejemplo, los sitios objetivo para Cas9 de S. pyogenes, con secuencias NGG de PAM, se pueden identificar por investigación para 5'-N.-NGG-3' ambas en la secuencia de entrada y en el complemento inverso de la entrada. Asimismo los sitios objetivo para Cas9 de CRISPR1 de S lhermophilus , con secuencia NNAGAAW de PAM, se pueden identificar por investigación para 5'-N.-NNAGAAW-3' ambos en la secuencia de entrada y en el complemento inverso de la entrada. Asimismo, los sitios objetivo para Cas9 de CRISPR3 de S. thennophilus, con secuencia NGGNG de PAM, se pueden identificar por investigación para 5'-N.-NGGNG-3' ambos en la secuencia de entrada y en el complemento inverso de la entrada. El valor ~x" en N. puede ser fijado por el programa o especificado por el usuario, tal como 20.
Puesto que múltiples apariciones en el genoma del sitio objetivo de ADN pueden conducir a edición de genoma no especifica, después de identificar todos los sitios potenciales, el programa filtra secuencias basadas en el número de veces que aparecen en el genoma de referencia relevante. Para esas enzimas CRISPR para las cuales se determina la especificidad de secuencia mediante una secuencia "simiente", tal como la 5' de 11-12 pb de la secuencia PAM, incluyendo la propia secuencia PAM, la etapa de filtración puede estar basada en la secuencia simiente. Así, para evitar la edición en sitios genómicos adicionales, los resultados se filtran basándose en el número de apariciones de la secuencia simiente:PAM en el genoma relevante. Se puede permitir que el usuario elija la longitud de la secuencia simiente. También se puede permitir que el usuario especifique el número de apariciones de la secuencia simiente:PAM en un genoma para fines de pase del filtro. El defecto es investigar secuencias únicas. El nivel de filtración se modifica cambiando tanto la longitud de la secuencia simiente como el número de apariciones de la secuencia en el genoma. El programa puede proporcionar además o como alternativa la secuencia de una secuencia gu ia complementaria a la secuencia o secuencias objetivo indicadas proporcionando el complemento inverso de la secuencia o secuencias objetivo identificadas.
Ejemplo 4: Evaluación de híbridos ARNcr-ARNtracr quiméricos múltiples
Este ejemplo describe los resultados obtenidos para los ARN quiméricos (los ARNqui; que comprenden una secuencia guía, una secuencia de emparejamiento traer y una secuencia traer en un transcrito único) que tienen secuencias traer que incorporan diferentes longitudes de secuencia ARNtracr de tipo natural. La Figura 18a ilustra un esquema de un vector bicistrónico de expresión para ARN quimérico y Cas9 Cas9 es conducido por el activador
CBh y el ARN quimérico es cooducido por un activador U6. El ARN guía quimérico consta de una secuencia guía de 20 pb (Ns) unida a la secuencia tracr (barriendo desde la primera "U" de la hebra menor al extremo del transcrito). que se trunca en diversas posiciones como se indica. Las secuencias guía y tracr se separan mediante la secuencia de emparejamiento tracr GUUUUAGAGCUA seguido por la secuencia lazo GAAA. Los resultados de los ensayos 5 SURVEYOR para inserciones o supresiones mediadas por Cas9 en los sitios EMX1 Y PVALB humanos se ilustran en la Figura 18b y 18c, respectivamente. Las flechas indican los fragmentos SURVEYOR esperados. Los ARNqui se indican por su designación "+n" y ARNcr se refiere a un ARN híbrido donde las secuencias guía y traer se expresan como transcritos separados. La cuantificación de estos resultados. realizados por triplicado. se ilustran por histograma en las Figuras 11a y 11b, que corresponden a las Figuras 10b y 10c, respectivamente eN. D." indica no
10 inserciones o supresiones detectadas). Los ID del protoespaciador y su correspondiente objetivo genómico. secuencia del protoespaciador, secuencia PAM y posición de la cadena se proporcionan en la Tabla o. Las secuencias guía se diseñan para que sean complementarias a la secuencia completa del protoespaciador en el caso de transcritos separados en el sistema hibrido o sólo a la porción subrayada en el caso de ARN quiméricos.
Tabla D:
ID del protoespaciador
objetivo genómico secuencia del protoespaciador (5' a 3') PAM Hebra
1
EMX1 GGACATCGATGTCACCTCCAATGACTAG GG TGG +
2
EMX1 CATIGGAGGTGACATCGATGTCCTCCCC AT TGG -
3
EMX1 GGAAGGGCCTGAGTCCGAGCAGAAGAA GGG +
GAA
4
PVALB GGTGGCGAGAGGGGCCGAGATTGGGTGT Te AGG +
5
PVALB ATGCAGGAGGGTGGCGAGAGGGGCCGA TGG +
GAT
Cultivo celular y transinfección
Se mantuvo la estirpe celular 293FT (Life Technologies) de riñón embriónico humano (HEK, por sus siglas en inglés)
en Medio Eagle modificado de Oulbecco (OMEM) enriquecido con suero fetal bovino al 10% (HyClone), GlutaMAX 2
mM (Life Technologies), 100 U/mi de penicilina y 100 ¡Jglml de estreptomicina a 3rC con incubación en C02 a15%
20 Se sembraron células 293FT en placas de 24 pozos (Corning) 24 horas previamente a transinfección a una densidad de 150.000 células por pozo. Se transinfectaron las células usando Lipofectamine 2000 (Life Technologies) siguiendo el protocolo recomendado por el fabricante. Para cada pozo de una placa de 24 pozos, se usó un total de 500 ng de plásmido
Ensayo SURVEYOR para modificación de genomas
25 Se transinfectaron células 293FT con ADN de plásmido como se describió anteriormente. Se incubaron las células a 3rC durante 72 horas post-transinfección previamente a extracción de AON genómico Se extrajo AON genómico usando la solución de extracción de ADN QuickExtract (Epicentre) siguiendo el protocolo del fabricante. En resumen, se volvieron a suspender las células del botón en solución QuickExtract y se incubaron a 65 "c durante 15 minutos y 98 "c durante 10 minutos. La región genómica que flanquea el sitio objetivo de CRISPR para cada gen se multiplicó
30 por PCR (cebadores enumerados en la Tabla E) y se purificaron los productos usando una columna de QiaQuick Spin (Qiagen) siguiendo el protocolo del fabricante. Se mezclaron 400 ng totales de los productos PCR purificados con 2 ¡J110X de tampón PCR ADN Taq Polimerasa (Enzymatics) yagua ultra pura a un volumen final de 20 ¡.JI Y se sometieron a un procedimiento de rehibridación para permitir la formación de heteroduplex: 95"C durante 10 min, 95"C a 85"C descendiendo a -2"Cfs, 85"C a 25"C a -0.25"Cfs y 25"C mantenidos durante 1 minuto. Después de
35 rehibridación, se trataron los productos con nucleasa SURVEYOR y estimulador S SURVEYOR (Transgenomics) siguiendo el protocolo recomendado por el fabricante y se analizaroo sobre geles de poliacrilamida Novex TBE al 420% (Life Technologies). Se tiñeron los geles con tinción de AoN SYBR Gold (Life Technologies) durante 30 minutos y se formaron imágenes con un sistema de formación de imágenes de gel Gel Doc (Bio-rad). La cuantificación estuvo basada en intensidades de banda relativas
Tabla E:
nombre del cebador
objetivo genómico secuencia del cebador (5' a 3')
Sp-EMX1.F
EMX1 AAAACCACCCTTCTCTCTGGC
Sp-EMX1-R
EMX1 GGAGATTGGAGACACGGAGA G
Sp-PVALB-F
PVALB CTGGAAAGCCAATGCCTGAC
Sp-PVALB-R
PVALB GGCAGCAAACTCCTTGTCCT
Identificación computacional de sitios fijados como objetivo de CRISPR únicos
Para identificar sitios fijados como objetivo únicos para la enzima SF370 Cas9 (SpCas9) de S pyogenes en genoma
5 de ser humano, ratón, rata, pez cebra, mosca de la fruta y C. e/egans, se desarrolló un paquete informático para escanear ambas hebras de una secuencia de AON e identificar todos los posibles sitios objetivo de SpCas9. Para este ejemplo, cada sitio objetivo SpCas9 se definió operacional mente como una secuencia de 20 pb seguido por una secuencia de unidad adyacente del protoespaciador (PAM) de NGG y se identificaron todas las secuencias que satisfacían esta definición de 5'-Nro-NGG-3' en todos los cromosomas. Para evitar la edición de genoma no
10 específica, después de identificar todos los sitios potenciales, se filtraron todos los sitios objetivo basándose en el número de veces que aparecían en el genoma de referencia relevante. Para sacar provecho de la especificídad de la secuencia de la actividad de Cas9 conferida por una secuencia ~simiente", que puede ser, por ejemplo, secuencia 5' de aproximadamente 11-12 pb de la secuencia PAM, se seleccionaron secuencias 5'-NNNNNNNNNN-NGG-3' para que fueran únicas en el genoma relevante. Todas las secuencias gen6micas se descargaron de UCSC Genome
15 Browser (genoma humano hg19, genoma de ratón mm9, genoma de rata m5, genoma de pez cebra danRer7, genoma dm4 de D. me/anogaster y genoma ce10 de C. e/egans). Los resultados de la investigación completa están disponibles para navegar usando la información de UCSC Genome Browser. Una visualización de ejemplo de algunos sitios objetivo en el genoma humano se proporciona en la Figura 22.
Inicialmente, se fijaron como objetivo tres sitios dentro del sitio de EMX1 en célu las HEK 293FT humanas. Se evaluó
20 la eficacia de la modificación del genoma de cada ARNqui usando el ensayo de la nucleasa SURVEYOR, que detecta mutaciones que resultan de las roturas de la doble cadena de ADN (las RDC) y su posterior reparación por la ruta de reparaciórJ de daños de AON de unión del extremo no homólogo (NHEJ). Las construcciones designadas ARNqui(+n) indican que hasta el nucleótido +n de ARNtracr de tipo natural se incluye en la construcción de ARN quimérico, con valores de 48, 54, 67 Y85 usados para n. Los ARN quiméricos que contienen fragmentos mayores de
25 ARNtracr de tipo natural (ARNqui (+67) y ARNqui (+85)) mediaron la escisión de AON en los tres sitios objetivo de EMX1, demostrando ARNqui (+85) en particular niveles significativamente mayores de escisión de AON que los correspondientes híbridos ARNcrfARNtracr que expresaron secuencias guía y tracr en transcritos separados (Figuras 10b y 10a). También se fijaron como objetivo dos sitios en el sitio PVALB que no proporcionaron escisión detectable usando el sistema hibrido (secuencia guía y secuencia tracr expresadas como transcritos separados)
30 usando ARNquis. ARNqui(+67) y ARNqui(+85) fueron capaces de mediar escisión significativa en los dos protoespaciadores PVALB (Figuras 10c y 10b).
Para los cinco objetivos en los EMX1 y PVALB, se observó un incremento consistente en la eficacia de modificaciórJ del genoma con longitud creciente de la secuencia tracr. Sin desear estar limitados por ninguna teoria, la estructura secundaria formada por el extremo 3' de la ARNtracr puede desempeñar una función en la activación de la tasa de 35 formación de complejo CRISPR. Una ilustración de las estructuras secundarias previstas para cada uno de los ARN quiméricos usados en este ejemplo se proporciona en la Figura 21 . Se predijo la estructura secundaria usando ARNfold (hllp:flrna.tbi.univie.ac.atlcgi-bin/RNAfold.cgi) usando energía libre mínima y algoritmo de función de partición El pseudocolor para cada base (reproducido en escala de grises) indica la probabilidad de emparejamiento. Debido a que los ARNquis con secuencias traer más largas eran capaces de escindir objetivos que 40 no eran escindidos por híbridos ARNcrfARNtracr de CRISPR naturales, es posible que se pueda cargar ARN quimérico en Cas9 más eficazmente que su cootrapartida híbrida natural. Para facilitar la aplicación de Cas9 para edición de genoma especifica del sitio en células y organismos eucariotas, todos los sitios objetivo únicos previstos para la Cas9 de S. pyogenes se identificaron de manera computacional en los genomas del ser humano, ratón, rata, pez cebra , C. e/egans y D. me/anogaster. Se pueden diseñar ARN quiméricos para enzimas Cas9 de otros microbios
45 para expandir el espacio fijado como objetivo de las nucleasas programables de ARN de CRISPR.
Las Figuras 11 y 21 ilustran vectores de expresiórJ bicistrónicos ejemplares para expresión de ARN quimérico incluyendo hasta el nucleótido +85 de secuencia de ARNtracr de tipo natural y SpCas9 con secuencias de localización nuclear. SpCas9 se expresa a partir de un activador CBh y termina con la señal poliA bGH (bGH pA). La secuencia expandida ilustrada inmediatamente debajo del esquema corresponde a la región que rodea al sitio de inserción de la secuencia guía e incluye, desde 5' a 3', la porción 3' del activador U6 (primera región sombreada), sitios de escisión Bbsl (flechas), repetición directa parcial (secuencia de emparejamiento traer GTTTIAGAGCTA,
5 subrayada), secuencia lazo GAAA y secuencia tracr +85 (secuencia subrayada después de la secuencia lazo). Un inserto de la secuencia guia ejemplar se ilustra debajo del sitio de la inserción de la secuencia guía, con nucleótidos de la secuencia guía para un objetivo seleccionado representado por una ~N"
Las secuencias descritas en los ejemplos anteriores son como sigue (las secuencias de polinucleótidos son 5' a 3'):
ARNtracr corto U6 (Streptococcus pyogenes SF370):
10 GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGA GAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTG ACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAAT GGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATC TTGTGGAAAGGACGAAACACCGGAACCATTCAAAACAGCATAGCAAGTTAAAAT AAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCIIIIIII
(negrita = secuencia ARNtracr; subrayado = secuencia terminadora)
ARNtracr largo U6 (Streptococcus pyogenes SF370)· GAGGGCCTATTTCCCATGATTCCTTCATATTrOCATATACGATACAAGGCTGTTAGA
GAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTG ACGTAOAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAAT GGACTATCATATGC1TACCGTAACTTGAAAOTATTTCGArnCTTGGCTTTATATATC TTGTGGAAAGGACGAAACACCGGTAGTATTAAGTATTGTTTTATGGCTGATAAATTT CTTTOAATTTCTCCTTGATTATTTGTTATAAAAGTTATAAAATAATCTTGTTGGAACC ATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAG
15 TGGCACCGAGTCGGTGC II 1 1111
U6-0R-Bbsl cadena principal-RO (Streptococcus pyogenes SF370)·
GAGGOCCTATITCCCATOATTCcrrCAT A'rITOCAT ATACGATACAAOGCTGTTAOA OAOATAAITGOAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTG ACGTAGAAAOTAATAATTTCTTGGOTAOTTTGCAGTTTTAAAATTATGTTTTAAAAT GGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATC lTGTGGAAAGGACGAAACACCGGGTTTTAGAGCTATGCTGTTTTGAATGOTCCCAAA ACGGGTCrrCGAGAAGACGTTTTAGAGCTATGCTGTITroAATGGTCCCAAAAC
U6-ARN quimérico-Cadena principal Bbsl (Streptococcus pyogenes SF370)
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGA GAOATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTG ACOTAGAAAGTAATAATncrTGGGTAGTlTGCAGlTITAAAATTATGTIlTAAAAT GGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATC TTGTGGAAAGGACGAAACACCGGGTCITCGAGAAGACCTGTITrAGAOCTAGAAAT
AGCAAGTTAAAATAAGGCTAGTCCG
20 NLS-SpCas9-EGFp·
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGlHGVPAADKKYSIGLDIGTNSVO
WAVITDEYKVPSK.KFKVLGNTDRHSIKK.NLIGALLFDSGETAEATRLK.RTARRRYTRRK
NRICYLQEIFSNEMAK VDDSFFHRLEESFL VEEDKKHERHPIFONIVD EYA YHEKYPTTYH LRKKL VDSTDK.ADLRLIYLALAHMIKFRGHFl.IEGDLNPDNSDVDKLFIQL VQTl'NQLFE ENPINASGVDAKA ILSARLSKSRRLENL TAQLPGEKKNGLFGNLlALSLGL TPNFKSNFDL AEDAKLQLSKDTYDDDLDNLLAQIGDQY ADLFLAAKNLSDAlLLSDILR VNTEITKAPLS A$M IKRYDEHHQDL TLLKAL VRQQLPEK YKEIFFDQSKNGY AGYIDGGASQEEFYKFIK PILEKMDGTEELLVK.LNREDLLRKQRTFDNGSIPHQIHLGElHAlLRRQEDFYPFLKDNR EKlEKILTFRlPYYVGPlARGNSRfAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTN FDK NLPNEKVLPKHSLL YEYFTVYNEL TKVKYVTEGMRKP AFLSGEQKKAJVDLLFKTN
RKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHOLLKIIKDKDFLDNEENEDILE DIVLTLTLFEDREMIEERLKTY AHLFODK VMKQLURRYTGWGRLSRKUNG1RDKQSG KTILDFLKSDGFAt'lRNFMQLJHDDSL TFKEDlQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVK VMGRHKPEN IVIEMARENQlTQKGQKNSRERM KRlEEGIKELGSQI LKEHPVENTQLQNEKL YL YYLQNGRDMYVDQELDINRLSDYDVDHlVPQSFLKDDSlD NKVL TRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLlTQRKFDNL TKAERGGLSE LDKAGFIKRQL VETRQITK.HV AQILDSRMNTKYDENDKUREVKVITLKSKL VSDFRKD F QFYK VREINNY HHAHDA YLNA VVGT ALIKKYPKLESEFVYGDYK VYDVRK.MlAKSEQE IGKATAKYFFYSNlMNFFKTEITLANGEIRKRPLlETNGETGEIVWOKGRDFATVRKVLS MPQVNrvKKTEVQTGGFSKESllPKRNSDKLlARKKDWDPKKYGGFDSPTV A YSVLVV AKVEKGKSKKLKSYKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELE NGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEONEQKQLFVEQHKH YLDEIIEQISEFSKRVILADANLDKVLSA YNKHRDKP1REQAENII HLFTL TNLGAPAAFK Y FDlTIDR.KRYTSTKEVLDATLIHQSITGlYETRIDLSQLGGOAAA YSKGEELFTGYVP IL V ELDGDVNGHKFSVSGEGEGOATI'GKLTLKFICTTGKLPVPWPTL VTTLTYGVQCFSRY P DHMKQHDFFKSAMPEGYVQERTIFFKODGNYKTRAEVKfEGDTL VNRlELKG IDFKED GNILGHKLEYNYNSHN VY lM ADKQKNGIKVNFKJRHNIEOGSVQLADHYQQNTPIGDGP VLLPDNHVLSTQSALSK.DPNEKRDHMVlLEFVTAAGITLGMDELYK
SpCas9-EGFP-NLS:
MDKKYSJGLDIGTNSVGWA VlTDEYKVPSKKFKVLGNTDRHSIK.KNLlGALLFDSGET A EATRLK.RT ARRR YTRRKNRJCYLQEIFSNEMAK VDDSFFHRLEESFL VEEDK.KHERHPIF GNIVDEVA YHEKYPTIY HLRKKL VDSTDKADLRLI YLALAHMIKFRGHFLlEGDLNPONS DVDKLFIQL VQTYNQLFEENPINASG VDAKAILSARLSKSRRLENLlAQlPGEKKNGLFG NLlALSLGL TPNFKSNFDLAEDAKLQlSKDTYDDDLDNLLAQIGOQY ADLFLAAKNLSD AlLLSDILR VNTEITKAPLSASMIKRYDEHHQDl TLLKAL VRQQLPEKYKE1FFDQSKNGY AGYIDGGASQEEFY KFIKPILEKMDGTEELL VKLNREDLLRKQRTFDNGSIPHQIH LGEL HAJ LRRQEDFYPFLKDNREKIEKIL TF RlPYYVGPLARONSRF A WMTRKSEETITPWNFEE VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLL YEYFTVYNEL TKVKYVTEGMRKP A FLSGEQKKArvOLLFKTNRKVTVKQLKEDYFK.KIECFOSVE1SGVEDRFNASLGTYHOLL KIIKDKDFLDNEENEDlLEDIVL TLTLFEDREMIEERLKTYAHlFDOKVMKQLKRRRYTG WGRLSRKLlNGIRDKQSGKTfi.OFLKSOGfANRNFMQL IHDDSL TFKEDlQKAQVSGQG
DSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTIQKGQKN
SRERM K R IEEGIKELGSQI LKEHPVENTQLQNEKL YLYYLQNGRDMYVDQELDINRLSD YDVDHI VPQSFLKDDSIDNK VLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNA.KLIT QRKFDNLTK.AEROGLSELDKAOFJKRQL VETRQITKHV AQILDSRMNTKYOENOKLIRE VK V1TLKSKL VSDFRKDFQFYKVREJNNYHHAHDA YLNA VVOTALIKKYPKLESEFVYG DYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEffiKRPLlETNGETGEI VWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKK YGGFDSPTV A YSVlVV AK VEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKE VKK.DLlI KLPKYSLFELENGRKRMLASAGELQKGNELALPSKVVNFLYLASHYEKLKGS PEDNEQKQLFVEQHKHYLDEJIEQISEFSKR V1LADANLDKVLSA YNKHRDKPIREQAENI IHLFTLTNLGAPAAFKYFDTIIDRKRYTSTKEVLDATLlHQSITGLYETRIDLSQLGGDAA AVSKGEELFTGVVPILVELDGnvNGHKFSVSGEGEGDATYOKLTLKF1CTfOKLPVPWP TLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEOYVQERTlFFKDDGNYKTRAEVKFEG DTLVNRIElKGIDFKEDGNILGHKLEYNYNSHNVYlMADKQKNGIKVNfKlRHNIEDGSV QLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAOrrLGMD
ELYKKRPAATKKAGQAKKKK
NLS-SpCas9-E GFP-NLS·
MDYKDHDGDYKDHDlDYKDDDDKMAPKKKRKVGIHGVPAADKKYSIGLD1GTNSVG
WA VITDEYKVPSKK.FKVLGNTDRHSlKKNLlGALLFDSGET AEA TR..LKRT ARRRYTRRK
NRJCYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKK.HERHPfFGNIVDEVA YHEK YPTrYH
LRKKlVDSTDKADlRLIYLAlAHMJKFRGHFLlEGDlNPDNSDVDKLFIQLVQTYNQLFE ENPINASGVDAKA ILSARLSKSRRLENLlAQLPGEKK.NGlfGNLlALSLGLTI'NFKSNFDL AEDA KlQLSKDTYDDDLDNLLAQJGDQYADLFLAAK.NLSDA ILLSOILR VNTETfKAPLS ASM IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGOASQEEFYKFIK PILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQJHLGELHAILRRQEDFYPFLKDNR EKIEKI L TFRIPYYVGPLARGNSRF A WMTRKSEETITPWNFEEVVDKGASAQSFIERMTN FDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAJVDlLFKTN RKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKllKDKDFLONEENEDILE DNLTLTLFEDREMIEERLKTY AHLFDDKVMKQLKRRRYTGWGRLSR.KLINGIROKQSG KTILDfLKSDGFANRNfMQlDiDDSLTFKEDlQKAQVSGQGDSLHEHIANLAGSPAJKKG ILQTVKVVDEL VK VMGRHKPENIVrEMARENQTTQKGQKNSRERMKR1EEGIKELGSQI
LKEHPVENTQLQNEKLYL VYLQNGRDMYVDQELDINRLSDYDVDHTVPQSFLKDDSTD NKVL TRSDKNROKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGlSE LDKAGFIKRQLVETRQlTKHVAQILDSRMNTKYDENDKLlREVKVITLKSKLVSDFRKDF QFY K VRElNNYHliAJiDAYLNAVVOT ALlKKYPKLESEFVYODYKVYDVRKMJAKSEQE IOKATAKYFFYSNlMNFfKTEITLANGEIRKRPLIETNGETGEIVWDKGROFATVRKVLS MPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTV A YSVL VV AKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELE
NGRKRMLASAGELQKGNELALPSKYVNFLYl..ASHYEKLKGSPEDNEQKQLFVEQHKH
y LDEIIEQISEFSKRVI LADANLDKVLSAYNKHRDKPlREQAENIIHLFTLTNLGAPAAFKY FDlTIDRKRYTSTKEVLDA TLTHQSITGL YETRIDLSQLGGDAAA VSKGEELFTGVVPIL V ELDGDVNGHKfSVSGEGEGDATYGKlTLKFICTIGKLPVrWPTLVITLTYGVQCFSRY r DHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIOFKED ONILOHK.LEYNYNSHNVYIMAOKQKNOIKVNFKJRHNJEDGSVQLADHYQQNTrIGDGr VLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKKRPAATKKAGQA
KKKK
NLS-SpCas9-NLS' MDYKDHDGDYKDHDIDYKDDOOKMAPK.KKRKVGIHGVPAADK.KYSIGLDlGTNSVG \VAVrrDEYKVPSKKFKVLGNTDRHSIKKNLlGALLFDSGETAEATRLKRTARRRYTRRK NRICYLQEIFSNEMAKVOOSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTTYH LRKK.LVDSTDKADLRUYLALAHMIKFRGHFLlEGDLNPDNSDVDK.LFIQL VQTYNQLFE ENPINASGVDAKAll..sARLSKSRRLENLlAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDL AEDA KLQLSKDTYDDDLDNLLAQIGDQY ADLFLAAKNLSDAILLSDlLR VNTEITKAPLS ASMlKR YDEHHQDL TLLKALVRQQLPEK YKEIFFDQSKNGY AGYIDGGASQEEFYKFIK PILEK MDGTEELLVKLNREDLLRKQRTFDNGSI PHQIHLGELHAlLRRQEOFYPFLK.DNR EK1EKIL TFRIPYVVGPLARGNSRFA WMTR KSEETITPWNFEEVVOKGASAQSFlERMTN FDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTN RKVTVKQLKEDYFKKJECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILE DIVLTLTLFEDREMIEERLKiY AHLFDDK VMKQlKRRR YiGWGRLSRKUNGIROKQSG KTILDFLKSDGFANRNFMQLlHDDSLTFKED1QKAQVSGQGDSLHEHIANlAGSPAJK.KG ILQTVKVVDELVKVMGRHKPENfVIEMARENQITQKGQKNSRERMKIDEEG!KELGSQI LKEHPVENTQLQNEKL YLYVLQNGRDMYVDQELDfNRLSDYDVDHrvPQSFLKDDS1D
NKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSE LDKAGFIKRQLVETRQITKHVAQILDSRMNTKYOENDKLIREVKVITLKSKLVSDFRKDF QFYKVREINNYHHAHDA YLNA VVGT ALlKKYPK LESEFVYGDYKVYDVRKM1AKSEQE JGKA T AKYFFYSNIMNFFKTEITLANGE1RKRPLIETNGETGEIVWDKG RDF A TVRKVLS MPQVNTVKKTEVQTGGFSKESILPKRNSDKUARKK.DWDPKKYGGFDSPTV A YSVL VV AKVEKGKSKKLKSVKElLGITIMERSSFEKNPIOFLEAKGYKEVKKDLIIKLPKYSLFELE NORKRMLASAOElQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKH
YLDEJIEQISEFSKRVILADANLDKVLSAYNKHR DKPfREQAENIIHLFTlTNLGAPAAFKY FDTIIDRKRYTSTKEVLDATLlHQSITGL YETRIDLSQLGGDKRPAA TKKA.GQA.K.KKK
NLS-mCherry-SpRNasa3:
MFlFLSLTSFLSSSR TL VSKGEEDNMAlIKEfMRFKVHMEGSVNGHEFEIEGEGEGRPYE
GTQTAKLKVTKGGPLPFAWDILSPQFMYGSKA YVKHPADlPDYLKLSFPEGFKWERVM
NFEDGGVVTVTQDSSlQDGEFIYKVKlROTNFPSDOPVMQKKTMGWEASSERMYPED
GALKGEIKQRLKLKDGGHYDAEVKTTVKA K KPVQLPOA YNVNIKLOITSHN EDYTIVE
QYERAEGRHSTGOMOELYKGSKQLEELLSTSFDlQFNDL TLLET AFTHTSY ANEHRLLN
VSHNERLEFLGDA VLQLlISEYLF AKy PKKTEGDMSKLRSMIVREESLAGFSRfCSFDAYI
KLGKGEEKSGGRRRDTll...GDLFEAFLGALLLDKGIDA VRRFLKQVMlPQVEKGNFERVK
DYKTCLQEFLQTKGDVAIDYQVISEKGPAHAKQFEVSNVNGAVLSKGLGKSKKlAEQD
AAKNALAQlSEV
SpRNasa3-mCherry-NLS·
MKQLEELLSTSFDlQFNDLTLLETAFTHTSYANEHRLLNVSHNERLEFl.GDAVLQLJISEY
LFAKYPKKTEGDMSKLRSMIVREESLAGFSRFCSFDA YIKLGKGEEKSGGRRRDTILGDL
FEAFLGALLLOKG IDA VRRFLKQVMIPQVEKGNFERVKDYKTCLQEFLQTKGDV AlDYQ
VISEKGPAH.AKQFEVSTVVNGA VLSKGLGKSKKLAEQDAAKNALAQLSEVGS VSKGEE
DNMAllKEFM RFK VHMEGSVNGHEFEIEGEGEGRPYEGTQT AK.LKVTKGGPLPF A WDlL
SPQFMYGSKAYVKHPADlPDYLKLSFPEGFK WERVMNFEDGOVvrvfQDSSLQDGEFl
YKVK.LRGTNFPSDOPVMQK.KTMGWEASSERMYPEDGALKGEJKQRLKLK.DGGHYDAE
VK1TYKAKKPVQLPGA YNVNIKlDlTSHNEDYTIVEQYERAEGRHSTGGMDELYKKRP
AATKKAGQAKKK.K
NLS-SpCas9n-NLS (la mutación de nickasa D10A e,
minúscula):
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVG IHGVPAAOKKYSTGLalGTNSVGW
A VITDEYK VPSKKFK VLGNTDRI1SIK.KNLIGALLFDSGET AEATRLKR TARRR YTRRKN
RJCYLQEIFSNEMAK VDDSFFHRLEESFL VEEDKKHERHPlFONIVDEV A y HEK YPTIYHL
RKKL VDSTOKADLRLJYLALAHMlK.FRGHFLlEGDLNPDNSDVDKLFIQL VQTYNQLFEE
NPINASGVDAKAJLSARLSKSRRLENlIAQLPGEKKNG LFGNLlALSLGL TPNFKSNFDLA
EDAKLQLSKDTYDDDLDNLLAQTGDQY ADLFLAAKNLSDAlLLSDILR VNTEITKAPLSA
SMIKR YDEHHQDL TLLKALVRQQLPEKYKEIFFDQSKNGY AGYIDGGASQEEFYKFIKPI
LEKMDGTEELL VKlNREDLLRKQRTfDNGSIPHQIHLGELHAILRRQE DFYPFLKDNREK
IEKIL TFRIPYYVGPLARGNSRFA WMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFD
KNLPNEKVLPKHSLL YEYFTVYNElTKVKYVTEGMRKPAFLSGEQKKA TVDLlFKTNR
KVTVKQLKEDYFKKlECFDSVEISGVEDRfNASLGTYHDLLKlJKDKDFLDNEENEDILE
DTVLTLTLFEDREMIEERLKTY AHLFDDK VMKQLKRRRYTGWGRLSAAlfNGIRDKQSG
KTILDFLKSDGF ANRNFMQllHDDSlTFKEDlQK.AQVSGQGDSLHEHlANLAGSPA IKKG
ILQTVKVVDElVKVMGRHKPENIVIEMARENQTIQKGQKNSRERMKRlEEGIKELGSQI
LKEH PVENTQLQNEKL YLYYLQNGRDMYVDQELDINRLSDYDVDHNPQSFLKODSID
NKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLlTQRK.FONLTKAERGGLSE
LDKAGFIKRQLVETRQITKJNAQILDSRMNTKYDENDKLIREVKVITLKSKL VSDFRKDF
QFYK VREINNYHHAHDA YLNA VVGT ALlKKYPKLESEFVYGDYK VY DVRK}.{IAKSEQE
IGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLS
MPQVNIVKKTEVQTGGFSKESIlPKRNSDKLIARKKDWDPKK YGGFDSPTV A YSVL VV
AKVEKGKSKKLKSVK.ELLOITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSlFELE
NGRK.RMLASAGELQKGNELALPSK y VNFL YLASHYEKLKGSPEDNEQKQLFVEQH KH
YLDE1IEQlSEFSKRV1LAOANLDK VLSA YNKHRDKPIREQAENIIHLFTL TNLGAPAAFK Y
FO"ITIDRKRYTSTK.EVLDATL1HQSITGL YETRJDLSQLGGDKRPAA TK KAGQAKKKK
hEMX1-Plantilla
GAATGCTGCCCTCAGACCCGCTICCTCCCTGTCCITGTCTGTCCAAGGAGAATGAGG TCTCACTGGTGGATTTCGGACTACCCTGAGGAGCTGGCACCTGAGGGACAAGGCCC CCCACCTGCCCAGCTCCAGCCTCTGATGAGGGGTGGGAGAGAGCTACATGAGGTTG CTAAGAAAGCCTCCCCTGAAGGAGACCACACAGTGTGTGAGGTTGGAGTCTCTAGC AGCGGGTTCTGTGCCCCCAOGGATAGTCTOGCTGTCCAGGCACTGCTCTIGATATAA ACACCACCTCCTAGTTATGAAACCATGCCCATTCTGCCTCTCTGTATGGAAAAGAGC
RH-Hindll-Nhel"
ATGGGGCTGGCCCGTGGGGTGGTGTCCACTTTAGGCCCTGTGGGAGATCATGGGAA CCCACGCAGTGGGTCATAGGCTCTCTCA1ITACTACTCACATCCACTCTGTGAAGAA GCGA rrATGATCTCTTCTc r AGAAACTCGTAGAGTCCCATGTCTGCCGGCTICCAGA GCCTGCACTCCTCCACCTTGGCTTGGCTTTGCTGGGGCTAGAGGAGCTAGGATGCAC AGCAGCTCTGTGACCCTTTGTTTGAGAGGAACAGGAAAACCACCCTTCTCTCTGGCC CACTGTGTCCTCTTCCTGCCCTGCCATCCCCTTCTGTGAATGTTAGACCCATGGGAGC AGCTGGTCAGAGGGGACCCCGGCCTGOGGCCCCTAACCCTATGTAGCCTCAGTCTTC CCATCAOGCTCTCAGCTCAGCCTGAGTGTTGAGGCCCCAGTGOCTGCTCTGGGGGCC TCCTOAGTTTCTCATCTGTGCCCCTCCCTCCCTGGCCCAGGTGAAGGTGTGGTTCCAG AACCGGAGGACAAAGTACAAACGGCAGAAGCTGGAGGAGGAAGGGCCTGAGTCCG AGCAGAAGAAGAAGGGCTCCCATCACATCAACCGGTGGCGCATTGCCACGAAGCAG GCCAATGGGGAGGACATCGATGTCACCTCCAATGACaagcttgclagcGGTGGGCAACCAC AAACCCACGAGGGCAGAGTGCTGCTTGCTGCTGGCCAGGCCCCTGCGTGGGCCCAA GCTGGACTCTGGCCACrCCCTOOCCAGOCTTTGGGGAGGCcrGGAGTCATGGCCCCA CAGGGCTTGAAGCCCGGGGCCGCCATTGACAGAGGGACAAGCAATGGGCTGGCTGA GGCCTGGGACCACTTGGCCTTCTCCTCGGAGAGCCTGCCTGCCTGGGCGGGCCCGCC CGCCACCGCAGCCTCCCAGCTGCTCTCCGTGTCTCCAATCTCCcnTIGTITIGATGC ATTTCTGTTTTAA1TTATTTTCCAGGCACCACTGTAGTTTAGTGATCCCCAGTGTCCC CCTTCCCTATGGGAATAATAAAAGTCTCTCTCTTAATGACACGGGCATCCAGCTCCA GCCCCAGAGCCTGGGGTGGTAGATTCCGGCTCTGAOGGCCAGTGGGGGCTGGTAGA GCAAACGCGTTCAGGGCCTGGGAGCCTGGGGTOGGGTACTGGTGOAGGGGGTCAAG GGTAATTCATTAA CTCCTCTCTTTTGn"GGGGGACCCTGGTCTCTACCTCCAGCTCCA CAGCAGOAGAAACAGGCTAGACATAGGOAAGGGCCATCCTGTATCTTGAGGGAGGA CAGGCCCAGGTCTTTCTTAACGTATTGAGA GGTGGGAATCAGGCCCAGGTAGTTCAA TGGGAGAGGGAGAGTGCTTCCCTCTGCCTAGAGACTCTGGTGGCTTCTCCAGliGAG GAGAAACCAGAGGAAAGGGGAOGATTGGOOTCrGGGGGAGGGAACACCATICACA AAGGCTGACGGTTCCAGTCCGAAGTCGTGGGCCCACCAGGATGCTCACCTGTCCTTG GAGAACCGCTGGGCAGGTTGAGACTGCAGAGACAGGGCTTAAGGCTGAGCCTGCAA CCAGTCCCCAGTGAcrCAGGGccrCCTCAGCCCAAGAAAGAOCAACGTGCCAGGGC CCGCTGAGCTCTTGTGTTCACCTG
NLS-StCsn 1-NLS:
MKRPAATKKAGQAKKKKSDLVLGLDIGIGSVGVG1 LNKVTGEll HKNSRJFPAAQAENN L VRRTNRQGRRLARRKKHRR VRLNRLFEESGLn'DFrKISrNLNPYQLRVKGL TDELSNE ELFlALKNMVKHRGISYLDDASDDGNSSVGDYAQIVK.ENSKQLETKTPGQIQLERYQTY GQLRGDFTVEK.DGKKHRLINVFPTSA YRSEALRlLQTQQEFNPQITDEFINRYLEIL TGKR KYYHGPGNEKSRTDYG RYRTSGETLONlFGLLIGKCTFYPDEFRAAKASYTAQEFNLLND LNNL TVPTETK.KLSKEQKNQIJNYVKNEKAMGPAKLFKY1AKLLSCDYADIKGYRIDKS OKAE1HTFEA YRKMKTLETLDIEQMDRETLDKLA YVL TLNTEREG lQEALEHEF ADGSFS QKQVDEL VQFRKANSSIfGKGWHNFSVKLMMELlPEL YETSEEQMTIL TRLGKQKITSS SNKTKYIDEKLLTEEIYNPWAKSVRQAlKIVNAAlKEYGDFDNMEMARETNEDDEKK AlQK lQKA NK DEK DAAt'-.tLKAANQYNGKAELPHSVFHGHKQLATKlRL WHQQGERCL y TGKTlSJHDLINNSNQfEVDHILPLSITF'DDSLANK VLVY A TANQEKGQRTPYQALDSMO DA WSFRELUFYRESKTLSNKKKEYLL TEED1SKfDVRKKFIERNL VOTR y ASR VVLNA LQEHFRAHKJOTK VSVVRGQFrSQLR.R.HWGIEKTRDTYHHHA VDALI IAASSQLNL WKK QKNTLVSYSEDQLLDIETGELISDDEYKESVFKAPYQHFVDTLKSKEFEDSILFSYQVDSK FNRKISDATIY ATRQAKVGKDKADETYVLGK1KDIYTQDGYDAFMKIYKKDKSKfLMY RHDPQTFEKV1EPILENYPNKQINEKGKEVPCNPFLKYKEEHGYIRKYSKKGNGPEIKSLK YVDSKLGNHIDTTPKDSNNK YVLQSVSPWRADVYFNKlTGKYEILGLKy ADLQFEKGT GTYKJSQEK YNDIKKKEOVDSDSEFKFTL YKNDLLL VKDTETKEQQLFRFLSRTMPKQK I-IYVELKPYDKQKFEGGEALIKVLGNVANSGQCKKGLGKSNISIYKVRTDVLGNQHIIKN EGDKPKLDFKRPAATKKAGQAKK.KK
U6-St ARNtracr(7 -97):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGA GAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTG ACGTAGAAAGTAATAATTTCITGGGTAGTlTGCAGTITTAAAAlTATGITITAAAAT GGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATC 'ITGTGGAAAGGACGAAACACCGTTACTTAAATClTGCAGAAGCTACAAAGATAAOG CnCATGCCGAAATCAACAccc rGTCATlTIATGGCAGGGTGTTTTCGTTATITAA
U6-RD-espaciador-RD(S. pyogenes SF370)
gagggcctamcccatgaltccncalatt1gcatatacgaf~caaggctgnagagagalaall ggaallaalllgactgtaaacacaaagalal
tagtacaaaalacgtgacglagaaagtaalaamcltgggtaglltgcaglltlaaaattalgttnaaaatggactatcatalgcttaccgtaaclI
5 gaaagtamcgamCtlggclttatatalcttgtggaaaggacgaaacaccgglrttttagagctatgctgtttlgaalggtcccaaaacNNN
NlINl'INNlINl'INNlJN1>INNlJN1>INNrNNNNlI.lNgttltagagcI31gcIgtltlgaatggtcccaaaacTTTTTTT (subrayado minúsculas =repetición directa; N -secuencia guía; negrita -terminador)
ARN quimérico que contiene +48 ARNtracr (S pyogenes SF370)
1 O gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatat tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaactt gaaaglatttcgafflettggctttalalatcttglggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttaga gctagaaatagcaagttaaaataaggctagtccg 11 111 11 (N = secuencia guía; primer subrayado = secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita =terminador)
15 ARN quimérico que contiene +54 ARNtracr (S pyogenes SF370) gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatat tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagtttta aaattatgttttaaaatggactatcatatgctta ccgtaactt gaaaglatttcgatttcttggctttatatatcttglggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttaga ~aaatagcaagttaaaataaggclaglccgltatca I 1I 1I 1I 1 (N = secuencia guía; primer subrayado = secuencia de
20 emparejamiento traer; segundo subrayado -secuencia traer; negrita =terminador) ARN quimérico que contiene +67 ARNtracr (S pyogenes SF370) gagggectatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatat tagtacaaaatacglgacgtagaaagtaataaltlcttgggtagltlgcagtltla aaattalgltltaaaalggactatcatalgctta ccgtaactt gaaaglatttcgattlcttggclttalalatcttglggaaaggacgaaacaccNNNNNNNNNNNNNNNNNNNNgttttaga
5 ~aaalagcaagtlaaaataaggclagtccgttatcaacttgaaaaagtg 1111 11 1 (N = secuencia guía; primer subrayado = secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita =tenninador)
ARN quimérico que contiene +85 ARNtracr (S pyogenes SF370) gagggectatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatat tagtacaaaatacglgacgtagaaagtaataaltlcttggglagtttgcagtltlaaaattalgttttaaaaIggactatcatalgcttaccgtaactt
1 O gaaaglatttcgattlcttggclttatatatcttglggaaaggacgaaacaccNNNNNNN NN NN N N NN NN N NNgttttaga ~aaalagcaagtlaaaataaggclagtccgttatcaacttgaaaaagtggcaccgagtcgglgc 1111 11 1 (N = secuencia guía; primer subrayado -secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita =tenninador)
CBh-NLS-SpCas9-NLS
CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCC ATTGACGTCAATAATGACGTATCljCCCATAGTAACCCCAATACCGACTTTCCATTG ACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTA
TCATATGCCAAGTACGCCCCCTATTGACGTCAATGACOOTAAATGGCCCOCCTGGCA TIATGCCCAGTACATGACCITATGGGACTITCCTAcn'GGCAGTACATeTACOTATTA OTCATeGCTATTAeCATGGTeGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCT CCCCCCCCTCCCCACccccAArrrroTATITATITA'1 111 IIAAITAITITQTQCAGCO ATGGGGGCGGGGGGGGOOOGGOGOCOCGCGCCAGOCGGGGCGOOGCGGGGCGAG GGGCGGGOCGOGGCGAGGCGGAGAGGTGCGGCO(;CAOCCAATCAGAGCGGCGCGC TCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGOCGGCGGCCCTATAAAAAGCGA AGCGCGCGGCGGGCGGGAGTCGCTGCOACGCTGCCTTCGCCCCOTOCCCCGCTCCG CCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGOTGA
GCGOGCGGGACGGCCCTTCTCCTCCGGOCTGTAATTAGCTGAGCAAOAOGTAAOGO TTTAAGGGATGOTTGOTTGGTGOOGTATTAATGTrrAATTACCTOGAGCACCTGCCT GAAATCAC III ! Ill CAGOTTGGaccgglgccaccATGGACTATAAGGACCACQACGGAGA CTACAAOGATCATOATATTGATTACAAAGACGATGACGATAAGATGGCCQCAAAGA AGAAGCGGAAGGTCGGTATCeACOGAGTCCCAOCAOCCGACAAGAAGTACAOCATC GGCCTGGACAICGGCACCAACTCTGTGGGCTGGQCCGTGATCACCGACGAGTACAA GGTGCCCAOCAAGAAAlTCAAGGTGCTGGGCAACACCQACCGGCACAGCAICAAGA AGAACCTGATCGGAGCCCTGCTQTTCGACAGCGGCGAAACAGCCOAGGCCACCCGG CTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAOAACCGOATCTGCTATCT GCMGAGATCITCAGCAACOAGATGGCCAAGGTGGACGACAGcrrCITCCACAGAC TGQAAQAGICClTCCTGGTGGMGAGGATMQMGCACGAGCGGCACCCCATCITC GGCAACATCOTGGACGAGGTGGCCIACCACOAGAAGTACCCCACCATCTACCACCI GAGAAA GAAACTGGTQGACAGCACCGACAAGOCCGACCTGCGGCIGAICIATCTGG CCCTGGCCCACATGATCAAGTTCCGGGGCCACTICCTGATCOAOGOCGACCIGAACC CCGACAACAGCGACGTGGACAAGCfGTTCATCCAGCTQGTGCAGACCTACMCCAG CTGITCGAGGAAMCCCCATCAACGCCAGCOOCGTGGACGCCAAGGCCATCCTGTC TGCCAGACTGAGCAAGAGCAGACGGCTGGAAMTcroATCGCCCAGCfOCCCGGCG AGMGAAGAATGGCCTGTICGGCAACCTGATIGCCCTGAGCCTGGGCCTGACCCCC AACTICAAGAGCAACTTCGACCTGGCCGAGGATGC:CAAACTGCAGCIGAGCAAGOA CACCTACGACGACOACCIGGACMCCTGCTGGCCCAGATCGGCGACCAGTA CGCCG
ACCTOITTCTOOCCGCCAAGAACCTGTCCGAQGCC¡~TCCTGCTGAGCGACAICCTGA
GAGTGAACACCGAGATCACCAAGGCCCCC(TGAGCGCCTCTATGATCAAGAGATAC
GACGAGCACCACCAGGACcrGACCCTGCTGAAAGCTcrcOTGCGGCAGCAGCIGCC TGAGAAGTACAAAGAGAITTTCTICGACCAGAGCAAGAACGGCIACGCCGGCIACA TIGACGGCGGAGCCAGCCAGGAAGAGITCfACAAGITCATCMGCCCATCCTGGAA AAGATOGACGOCACCOAGGMCTOCTCGTGMOCrGMCAOAOAGOACCIOCTOCG GAAGCAGCOGACCITCGACAACOGCAGCAICCCCCACCAGAICCACCfOOOAGAGC TGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCAITCCTGAAGGACAAccGGO AAAAOATCOAGMOATCCIOACCTTCCGCAICCQCTACIACGTOGGCCCTCTGGCCA GGGGAAACAGCAGATICGCCTGGAIOACCAGMAGAGCGAGGAAACCATCACCCC CTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCrrCCGCCCAGAGCTTCATCGAGC GGATGACCAAClTCGATAAGAACCTGCCCMCGAOMGGTGCTGCCCAAGCACAGC CTGerGIAQGAGTACTICACCGTGTATAACGAGCIGACCAAAGTGAAATACGTGACC OAGGGMTGAGAMGCCCGCCTICCIGAGCGOCGAGCAGAAAAAGGCCAICGIOQ ACCTGCIGTTCAAGACCAACCGGMAGTGACCGTGMGCAGCTGMAGAGQACIAC lTCAAGAAAATCGAGTGC1TCGACTCCQTGQAAATCTCCGGCGTGGAAGATCGGITC AACGCCICCCDQGGCACAIACCACGATCTOCTGAAAATTATCAAGGACAAGGACTI CCIGGACAAIGAGOAAMCGAGGACATTCTGGMOAIATCOIGCTGACCCTGACAC IQITroAGGACAGAGAGATGAICGAGGAACOGCTGMAACCTATGCCCACcrGTTC OACOACAAAGIOAIOAAOCAGCIGAAOCGGCGOAGAIACACCGGCIGGGGCAOGC TGAoccOGAAGCTQAICAACOOCATCCGGGACAAGCAOTCCGOCAAGACAATCCTG GATTICCIGAAGICCGACGGCTrCGCCAACAGAA6CITCATGCAGCIGATCCACGAC GACAGCCTGACCTITAAAGAOGACAICCAGAAAGCCCAGGIGTCCOGCCAGGOCQA TAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCAITAAGAAGGGCA TCCTGCAGACAGTGAAGGTGGTQGACGAGCTCGTGAAAGTOAIGGOCCGGCACAAG CCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAG6AGGGAC AGMGMCAGCCGCGAGAGAATGMGCGGATCGAAGAGGGCATCAAAGAGCIGGG CAGCCAGATCCIGAAAGAACACccCGTGGAAAAC¡\CCCAGCTGCAGAACGAGAAG CTGTACCTGTACTACCTGCAGMIGGGCGOGAIATGTACOTGGACCAGGAACTGGA CAICAACCGGCTQTCCGACIACOATGTGGACCAIATCGTGCCICAGAGCTTTCTGAA GGACOACTCCATCGACMCMGGTGCTGACCAGAJ\GCGACMOAACCGGGGCAAG
AGCGACAACGIGCCCICCGAAGAGGTCGIGAAOAJ~GAIGMGAACTACTGGCGGCA
GCIOCTGMCGCCAAGCfGATIACCCAGAGAAAGTTCGACAATCTGACCAAGGCCG
AGAGAGOCOOCCIGAGCQAACTOOATAAOQCCOGCTTGATCAAGAQACAOCTOOTG oAAACCCGGCAGATCACAAAGCACGTGGCACAOATCCTQGACTCcCQGATQAAcAc TAAGIACGACGAGAATQACAAGCIGATCCGGGAAGTGAAAGTGATCACCCIQAAGT CCAAGCTGGTGICcOATTTCCGGAAGGATTICCAGTITTACAAAGTGCGCGAGATCA ACAACTACCACCACGCCCACGACGCCTACO<;AACOCCGTCQTQQGAACCGCCCTG ATCAAAAAGTACCCIAAGCIQGAAAGCGAGTJCQTGTAQQGCGACIACAAGGTGTA CGACGTGCGGAAGATGATCGQCAAGAGQQAGCAGGAAATCOGCAAGGCIACCGCC AAGTACITCTTCTACAGCAACATCATGAA( II II ICAAGACCOAOATTACCCTGGCC AACGGCGAGATCCGGAAGCGGCCTCIGATCGAGACAAAQGGCOAAACCGGGGAGA TCGTGTOGGAIAAOGGCCQGGATnTGCCACCOTGCQGAAAGTGCTQAGCATGQCC CAAGTGAATAICGTG6AAAAGACCQAQGTGCAGACAOOCOGCTICAOCAAAGAGTC TATcCTQccCAAGAGGAACAGCGATAAGCTQATCGCCAGAAAGAAGGACIGGGACC CTAAGAAGTACGGCGGCTICGACAGQCCCAQCGTGGCCIATTCIQTGCIGGTGGTGG CCAAAGTGGAAAAQQQCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCIGGG GATCACCATCATQQAAAOAAOCAQCJTCGAGAAGAATCCCATCGACTTICTGGAAG CCAAGGGCIACAAAGAAGTQAAAAAGGAcCTQATCATCAAGCIGcCTAAGTACICC CIGTICGAGCTQGAAAACGGCCGGAAGAGAATGCIGGCCICIGCCGGCGAACIGCA GAAGGGAAACGAACTQGcQCTGccCICcAAATATGTGAAcTTCCIGTAQCTGGCCA GccACIATGAGAAGCTQAAGGGCICcccQQAGGAIAATGAGCAGAAACAGCTGTTT GTGGAACAGCACAAGCACTACCTQGACGAGAICAJCQAQCAGAICAGCGAGTTCTC CAAGAGAGIGATCCTGGCCQACGCIAATCIOGACAAAGIGCTGICCGCCTACAACA AGCAccooQAIAAGCCCAICAGAQAGCAGQQCGAGAAIATCATCCACCIGTTTACC CIGACCAATCIGGGAGCCCCIGCCQCCITCAAGTAC'rl'TGACACCACCATCGACCGQ AAOAGGTACACCAGCACCAAAGAGGIOCTGGACGQCAcccTGATCCACCAGAGCAT CAQCGGCCTQTACGAGACACQGATQGACCTGTCICAGCTGGGAGGCOACIIICJI J I TCITAGCITGACCAGCTITOTAGIAOCAGCAGGACGCTITM (subrayado -NLS
hSpCas9-NLS)
ARN quimérico de ejemplo para S. thermophilus lMD-9 CRISPR1 Cas9 (con PAM de NNAGAAW) NNNNNNNNNNNNNNNNNNNNglttttglaclctcaagatttaGAAAtaaatcttgcagaaoctacaaagataaggctt catgccaaaatcaacaccclglcattllalggcagaalgtttloottatuaa I 1I I 1I (N -secuencia gula; primer subrayado = secuencia de emparejamiento traer; segundo subrayado =secuencia traer; negrita = terminador)
ARN quimérico de ejemplo para S. thermophilus lMD-9 CRI$PRl Cas9 (con PAM de NNAGAAW ) NNNNNNNNNNNNNNNNNNNNgltlttglactclcaGAAAlgcagaagclacaaagataaggcttcalgcooaaatca acaccctgtcattttataacaoggtgttttoottaltlaa I 1II I 1 (N -secuencia guia; primer subrayado secuencia de emparejamiento traer, segundo subrayado = secuencia traer; negrita = terminador)
ARN quimérico de ejemplo para S. thermophilus lMD-9 CRISPR1 Cas9 (con PAM de NNAGAAW) NNNNNNNNNNNNNNNNNNNNgltttlgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaalca acaccc!gtcatlttalaocaggglgt 111 II I (N secuencia gula; primer subrayado = secuencia de emparejamiento traer; segundo subrayado =secuencia traer; negrita = terminador)
ARN quimérico de ejemplo para s . thermophilus lMD-9 CRISPR1 Cas9 (oon PAM de NNAGAAW) NNNNNNNNNNNNNNNNNNNNgttatlgtactctcaagaltlaGAAAtaaalctlgcagaagctacaaagalaaggcttcatgccgaaalcaacaccclgtcattttatggcagogtgttttoottatttaa I I 1I II (N -secuencia gula; primer subrayado = secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita -terminador)
1 O
ARN quimérico de ejemplo para S. thermophilus LMD-9 CRISPR1 Cas9 (con PAM de NNAGAAW) NNNNNNNNNNNNNNNNNNNNgttattgtactctcaGAAAtgcagaaectacaaagataaoocttcatgccgaaatc aacaccctgtcattttatggcagggtgttttcattatttaa 111 111 (N -secuencia guia; primer subrayado = secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita =terminador)
ARN quimérico de ejemplo para S. thermophilus LMD-9 CRISPR1 Cas9 (con PAM de NNAGAAW) NNNNNNNNNNNNNNNNNNNNgltaltgtactctcaGAAAtgcagaagctacaaagataagoctlcatgccgaaatc aacaccctgtcattttatggcagggtgtlll 11 1 (N -secuencia guía; primer subrayado -secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita =terminador)
ARN quimérico de ejemplo para S. thermophilus LMD-9 CRISPR1 Cas9 (con PAM de NNAGAAW) NN NN NNNN NN NN NN NNN NN NgltaltglaclctcaagatttaGAAAlaaatcltgcagaagclacaatgataagqctt catgccaaaatcaacaccctgtcattttatggcagggtgttttcgttatttaa 11 1 1 11 (N secuencia guía; primer subrayado = secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita -terminador)
ARN quimérico de ejemplo para S. thermophilus LMD-9 CRISPR1 Cas9 (con PAM de NNAGAAW) NNNNNNNNNNNNNNNNNNNNgttattgtactctcaGAAAtgcagaagctacaatgataaggcttcatgccgaaatca acaccc1gtcattttatggcagggtgttttcgttatttaa 1IIIII (N -secuencia guia; primer subrayado = secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita =terminador)
ARN quimérico de ejemplo para S. thermophilus LMD-9 CRISPR1 Cas9 (con PAM de NNAGAAW) NNNNNNNNNNNNNNNNNNNNgltaltgtactctcaGAAAtgcagaagctacaatgataasscltcatgccgaaatca acaccctgtcattttatggcagggtgt l 111 11 (N -secuencia guía; primer subrayado -secuencia de emparejamiento traer; segundo subrayado :: secuencia traer; negrita :: terminador)
ARN quimérico de ejemplo para S thermophilus LMD-9 CRISPR3 Cas9 (COfl PAM de NGGNG) NNNNNNNNNNNNNNNNNNNNgttttagagctgtgGAAAcacagcgagttaaaataaaoctlagtccgtactcaactt gaaaaggtggcaccgattcggtgtll III I (N -secuencia guia; primer subrayado -secuencia de emparejamiento traer; segundo subrayado -secuencia traer; negrita ;;; terminador)
Versión codón-optimizada de Cas9 de sitio CRISPR3 LMD-9 de S. fhermophilus (con una NLS en ambos extremos 5' y 3')
ATGAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAOAAAAAOACCA
AGCCCTACAGCATCGGCCTGGACATCCGCACCAATAGCGTGGGCTGGGCCGTGACC
ACCGACAACTACAAGGTGCCCAGCAAGAAAATGAAOGTGCTGGGCAACACCTCCAA
OAAGTACATCAAOAAAAACCTGCTGOGCOTGCTGCTGTTCGACAGCOGCATTACAG
CCGAGGGCAOACGGCTOAAGAGAACCGCCAGACGGCGGTACACCCGGCGGAOAAA
CAGAATCCTGTATCTGCAAGAGATCTTCAOCACCGAGATGGCTACCCTGGACGACG
CCTTCTTCCAGCGGCTGGACGACAGCTTCCTGGTGCCCGACGACAAGCGGGACAGC
AAGTACCCCATCTTCGGCAACCTGGTGGAAGAGAAGGCCTACCACGACGAGTTCCC
CACCATCTACCACCTGAGAAAGTACCTGGCCGACAGCACCAAGAAGGCCGACCTGA
GACTGGTGTATCTGGCCCTGGCCCACATGATCAAGTACCGGOGCCACITCCTGATCG
AOCGCGAGTTCAACAGCAAGAACAACGACATCCAGAAGAACTTCCAGGACTTCCTG GACACCTACAACGCCATCTTCGAGAGCGACCTGTCCCTGGAAAACAGCAAGCAGCT GGAAGAGATCGTOAAOOACAAGATCAGCAAOCTGGAAAAGAAGGACCGCATCCTG AAGCTGTTCCCCOOCGAGAAGAACAOCOOAATCnrCAOCGAGTTTCTGAAOCTGAT CGTOOGCAACCAOGCCGACITCAGAAAGTGCTTCAACCTGGACOAGAAAOCCAGCC TOCAClTCAGCAAAGAGAOCTACGACOAOGACCTGOAAACCCTGCTGGGATATATC
GGCGACGAcrACAGCGACGTGTTCCTGAAGGCCAJ~GAAGCTGTACGACGCTATCCT
GCTOAOCOGClTccrGACCGTGACCGACAACGAGACAGAGGCCCCACTGAGCAGCG CCATGATTAAOCGGTACAACGAGCACAAAGAGGATCTGGCTCTGCTGAAAGAGTAC ATCCGGAACATCAGCCTGAAAACCTACAATGAGOTGlTCAAGGACGACACCAAGAA CGOCfACGCCOGCTACATCGACOOCAAGACCAACCAGGAAGATITCTATGTGTACC TOAAGAAGCTOCTGGCCGAGTICGAGGGGGCCGACTACTITCTGGAAAAAATCGAC CGCOAGGATTTCCTGCGGAAGCAOCGGACCTTCGACAACGGCAGCATCCCCTACCA OATCCATCTGCAGGAAATGCOOGCCATCCTGGACAAGCAOGCCAAGTTCTACCCAT TCCTGGCCAAGAACAAAGAGCGGATCGAGAAGATCCTGACCTTCCGCATCCCTTACT ACOTGGGCCCCCTOGCCAGAGGCAACAGCGATnnúCCTGGTCCATCCOGAAGCGC AATGAGAAOATCACCCCCTGGAACTICGAOGACGTGATCGACAAAGAGTCCAGCGC CGAGGCCTTCATCAACCGGATGACCAGCTTCGACCTGTACCTGCCCGAGGAAAAGG TGCTGCCCAAGCACAOCCTGCTOTACGAGACATTCAATOTGTATAACGAGCTGACCA AAGTGCOGTTTATCGCCOAGTCTATGCGGGACTACCAGTTCCTGGACTCCAAGCAGA AAAAGGACATCGTGCGGCTGTACnCAAGGACAAGCGGAAAGTGACCOATAAGGAC ATCATCGAGTACCTGCACGCCATCTACGGCTACGATGGCATCGAGCTGAAGGGCAT CGAGAAGCAGTICAACTCCAGCCTGAGCACATACCACGACCTGCTGAACATTATCA ACGACAAAGAATITCfOGACGACTCCAGCAACGAGGCCATCATCGAAGAGATCATC CACACCCTGACCATCrITGAGGACCGCGAGATGATCAAGCAGCGGCTGAGCAAGTI CGAGAACATCITCOACAAGAGCGTGCTGAAAAAGCTOAOCAGACUGCACTACACCG GCTGGGOCAAGCraAOCOCCAAGCTGATCAACGGCATCCGOGACGAGAAGTCCGGC AACACAATCCTOGACTACCTGATCGACGACGGCATCAGCAACCGGAACTTCATGCA GCTGATCCACGACGACGCCCTGAGCTTCAAGAAGAAGATCCAGAAGGCCCAGATCA TCGGGGACOAGGACAAGOGCAACATCAAAGAAGTCGTGAAGTCCCTGCCCGGCAGC
CCCGCCATCAAGAAGGGAATCCTGCAGAGCATCAJ~GATCGTGGACGAGCTCGTGAA
AGTGATGGGCGGCAGAAAGCCCGAGAGCATCGTGGTGGAAATGGCTAGAGAGAAC
60
CAGTACACCAATCAGGGCAAGAGCAACAOCCAGCAGAGACTGAAGAGACTGGAAA AGTCCCTGAAAGAGCTGGGCAGCAAGATrcrOAAAGAGAATATCCCTGCCAAOCTO TCCAAGATCGACAACAACGCCCTGCAGAACGACCGGCTGTACCTGTACTACCTOCA GAATGGCAAGGACATOTATACAGGCGACGACCTGGATATCGACCGCCTGAGCAACT ACGACATCGACCATATTATCCCCCAGGCCTTCCTGAAAGACAACAGCATTGACAAC AAAGTOCTGGTGTCCTCCGCCAGCAACCGCGGCAAGTCCOATGATGTGCCCAGCCT GGAAGTCGTGAAAAAGAGAAAGACcn'CTGGTATCAGCTGCTGAAAAGCAAGCTGA TTAGCCAGAGGAAGTTCGACAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCCCT GAAGATAAGGCCGGCTTCATCCAOAGACAGCTGGTOGAAACCCOGCAGATCACCAA OCACGTGGCCAGACTGCTGOATGAGAAGTTTAACAACAAGAAOGACGAGAACAACC OGGCCOTOCOGACCOTGAAGATCATCACCCTGAAGTCCACCCTGGTGTCCCAGTTCC GGAAGGACTTCGAGCTGTATAAAGTGCGCGAOATCAATGACTTTCACCACGCCCAC GACGCCTACCTGAATGCCGTOOTGGCTTCCOCCCTGCTGAAOAAOTACCCTAAGCTG GAACCCGAGTICGTOTACGGCGACTACCCCAAGTACAACTCCTTCAGAGAGCOOAA GTCCOCCACCGAGAAGGTGTACTTCTACTCCAACATCATGAATATCTTTAAGAAGTC CATCTCCCTGGCCGATGGCAGAGTGATCGAGCGGCCCCTGATCGAAGTGAACGAAG AGACAGGCGAGAGCGTGTGGAACAAAGAAAGCGACCTGGCCACCGTGCGGCGGGT GCTGAGTTATCCTCAAGTGAATGTCOTGAAGAAGGTOGAAGAACAGAACCACGGCC TGGATCGGGGCAAGCCCAAGGGCCTGTTCAACGCCAACCTGTCCAGCAAGCCTAAG CCCAACTCCAACGAGAATCTCGTGGGGGCCAAAGAGTACCTGGACCCTAAGAAGTA CGGCGGATACGCCGGCATCTCCAATAGCTTCACCGTGCTCGTGAAGGGCACAATCO AGAAGGGCGCTAAGAAAAAOATCACAAACGTGCTGGAATTTCAGGGGATCTCTATC CTGGACCGGATCAACTACCGGAAGGATAAGCTGAACTTTCTGCTGGAAAAAGGCTA CAAGGACATTGAGCTGATTATCGAGCTGCCTAAGTACTCCCTGTTCOAACTGAGCGA CGGCTCCAGACGGATGCTGGCCTCCATCCTGTCCACCAACAACAAGCGGGGCGAGA TCCACAAGGGAAACCAGATCTTCCTGAGCCAGAAATTTGTGAAACTGCTGTACCACO CCAAOCGOATCTCCAACACCATCAATGAGAACCACCGGAAATACGTGGAAAACCAC AAGAAAGAUITrGAGOAACTGTrCTACTACATCCTGGAGTTCAACOAGAACTATOTO GGAOCCAAGAAGAACGGCAAACTOCTGAACTCCGCCTTCCAGAGCTGGCAGAACCA CAGCATCGACGAGCTGTOCAGCTCcrrCATCGOCCCl'ACCGGCAGCGAGCGGAAGG GACTGTlTGAGCTGACCTCCAGAGGCTCTGCCGCCOACTTTGAGTTCCTGGGAGTGA
AGATCCCCCGGTACAGAGACTACACCCCCTCTAGTCTGCTGAAGGACGCCACCCTGA
TCCACCAGAGCGTGACCGGCCTGTACGAAACCCOGATCGACCTGGCTAAGCTGGGC
GAGGGAAAGCGTCCTGCTGCTACTAAGAAAGCTGGTCAAGCTAAGAAAAAGAAATA
A
Ejemplo 5: Optimización del ARN guía para Cas9 de Streptococcus pyogenes (referido como SpCas9)
5 Los solicitantes mutaron las secuencias ARNtracr y de repetición directa o mutaron el ARN guía quimérico para activar los ARN en las células
La optimización se basa en la observación de que hay tramos de timinas (Ts) en la ARNtracr y ARN guía, que podía conducir a terminación de la transcripción temprana por el activador Poi 3. Por lo tanto los Solicitantes generaron las siguientes secuencias optimizadas, ARNtracr optimizada y la repetición directa optimizada correspondiente se
10 presentan en parejas,
ARNtracr optimizado 1 (mutación subrayada):
GGAACCATTCAtAACAGCATAGCAAGTTAtAATAAGGCTAGTCCGTTATCAACTTGAA AAAGTGGCACCGAGTCGGTGCrnnT Repetición directa optimizada 1 (mutación subrayada): GTTaTAGAGCTATGCTGTTaTGAATGGTCCCAAAAC
5 ARNtracr optimizado 2 (mutación subrayada)· GGAACCA TTCAAtACAGCAT AGCAAGTTAAtA T AAGGCT AGTCCGTT ATCAACTTGAA AAAGTGGCACCGAGTCGGTGCrnnT Repetición directa optimizada 2 (mutación subrayada)· GTaTT AGAGCT ATGCTGTaTTGAA TGGTCCCAAAAC
10 Los solicitantes también optimizaron el ARN guia quimérico para actividad óptima en células eucariotas ARN guía original
NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGC TAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC I IIIIII
Secuencia de ARN guia quimérico optimizado 1·
~~~~~~NNNNNNNNNGTATTAGAGCTAGAAATAGCAAGTTAAIATAAGGC
TAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC I I II I I I
15 Secuencia de ARN guia quimérico optimizado 2:
NNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTATGCTGTTTTGGAAACAAAACAGCA TAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCG
GTGC I I IIIII
Secuencia de ARN guía quimérico optimizado 3:
NNNNNNNN~NNGTATTAGAGCTATGCTGTATTGGAAACAAIACAGC
ATAGCAAGTTAAIATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTC GGTGC II 1 111 [
Los solicitantes mostraron que el ARN guía quimérico optimizado funciona mejor como se indica en la Figura 9. El
20 experimento se realizó por co-transinfección de células 293FT con Cas9 y una casete de ADN ARN guía U6 para expresar una de las cuatro formas de ARN mostradas anteriormente. El objetivo del ARN guia es el mismo sitio objetivo en el lugar Emx1 humano: "GTCACCTCCAATGACTAGGG"
Ejemplo 6: Optimización de Cas9 CRISPR1 LMO-9 de Streptococcus thermophilus (referido como StICas9).
Los solicitantes diseñaron los ARN quiméricos guía como se muestra en la Figura 12
25 Los ARN guia de StlCas9 pueden experimentar el mismo tipo de optimización que para los ARN guía SpCas9, por rotura de los tramos de poli timinas (Ts).
Ejemplo 7: Mejora del sistema Cas9 para aplicación in vivo
Los solicitanles realizaron una búsqueda Metagenómica para un Cas9 coo un peso molecular pequeño. La mayoria de los homólogos de Cas9 fue bastante grande Por ejemplo el SpCas9 tiene alrededor de 1368aa de largo, que es demasiado largo para ser empaquetado fácilmente en vectores víricos para suministro. Algunas de las secuencias
puede que se hayan desanotado y por lo tanto la frecuencia exacta para cada longitud puede no ser necesariamente precisa. Sin embargo, proporciona un atisbo de la distribución de proteinas Cas9 y sugiere que hay homólogos de Cas9 más cortos .
5 Por análisis computacional, los solicitantes encontraron que en la cepa bacteriana Campylobacter, hay dos proteinas Cas9 con menos de 1 .000 aminoácidos. La secuencia para una Cas9 de Campylobacter jejuni se presenta a continuación. A esta longitud, CjCas9 se puede empaquetar fácilmente en AAV, lentivirus, Adenovirus, y otros vectores víricos para suministro robusto en células primarias e in vivo en modelos de animales
Cas9 de Campylobacter jejuni (CjCas9)
MARJLAFDIGISSIGWA FSENDELKDCGVRIFTKVENPKTGESLALPRRLARSARKRLARR
KARLNHLKH LIANEFKLNY EDYQSFDESLAKA YKGSLlSPYELRFRALN ELLSKQDF AR
VILHIAKRRGYDDfKNSDDKEKGAlLKAIKQNEEKLANYQSVGEYLYKEYFQKfKENSK
EFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFS
HLVGNCSFFTDEKRAPKNSPLAFMFVAL TRJINLLNNLKNTEGIL YTKDDLNALLNEVLK
NGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFfKALGEHNLSQDDLNEIAKDIT
LIKDEIKLKKALAKYDLNQNQJDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNE
LNLKVAlNEDKKDFLPAFNETYYKDEVTNPVVLRAlKEYRKVLNALLKKYGKVHKJNIE
LAREVGKNHSQRAKlEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKEFCA
YSGEKlKlSDLQDEKMLElDHIYPYSRSFDDS YMNK VL VFTKQNQEKLNQTPFEAFGNDS
AKWQKlEVLAKNLPTKKQKRlLDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYL
DFLPLSDDENTKLNDTQKGSK VHVEAKSGML TSALRHTWGFSAKDRNNHLHHAlDA VI
lA Y ANNSIVKAFSDFKKEQESNSAEL y AKKJSELDYKNKRlKFFEPFSGFRQKVLDKIDEIF
VSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFR
VDIFKHKKTNKfY A VPIYTMDF ALKVLPNKA V ARSKKGEJKDWILMDENYEFCFSL YK
DSLILIQTKDMQEPEFVYYNAFTSSTVSLlVSKHDNKFETLSKNQKlLFKNANEKEVlAKS
IGIQNLKVFEKYIVSALGEVTKAEFRQREDFKK.
El elemento de ARNtracr putativo para esta CjCas9 es:
TATAATCTCATAAGAAATTTAAAAAGGGACTAAAATAAAGAGTTTGCGGGACTCTG CGGGGTTACAATCCCCTAAAACCGCTTTTAAAATT
La secuencia de repetición directa es·
~IIIIACCATAAAGAAATTTAAAAAGGGACTAAAAC
15 La estructura ca-plegada del ARNtracr y repetición directa se proporciona en la Figura 6
Un ejemplo de un ARN guía quimérico para CjCas9 es:
NNNNNNNNNNNNNNNNNNNNGUUUUAGUCCCGAAAGGGACUAAAAUAAAGAGUU UGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU
Los solicitantes también optimizaron ARN guia de Cas9 usando métodos in vitro. La Figura 18 muestra datos de la optimización de ARN guía quimérico St1 Cas9 in vi/ro.
20 Aunque se han presentado realizaciones preferidas de la presente invención y se han descrito en la presente memoria, será evidente para los expertos en la materia que tales realizaciones se proporcionan como ejemplo solamente. Ahora tendrán lugar numerosas variaciones, cambios y sustituciones para los expertos en la materia sin apartarse de la invención . Se debería entender que se pueden emplear en la práctica de la invención diversas alternativas a las realizaciones de la invención descritas en la presente memoria. Se desea que las siguientes
25 reivindicaciones definan el alcance de la invención y que los métodos y las estructuras dentro del alcance de las reivindicaciones y sus equivalentes estén cubiertos de ese modo
Ejemplo 8: Optimización de ARNsg Sa
Los solicitantes diseñaron cinco variantes de ARNsg para SaCas9 para una arquitectura truncada óptima con la
mayor eficacia de escisión. Además, se ensayó el sistema dúplex Iracr:repetición directa natural junto a los ARNsg
Se transinfectaron conjuntamente guías con longitudes indicadas con SaCas9 y se ensayaron en células HEK
293FT para la actividad. Se transinfectaroo conjuntamente un total de 100 ng de amplicon U6-PCR de ARNsg (o 50
ng de repetición directa y 50 ng de ARNtracr) y 400 ng de plásmido de SaCas9 en 200.000 hepatocitos de ratón
Hepa1.-6 y se recogió el ADN en 72 horas post -lransinfección para análisis SURVEYOR. Los resultados se
presentan en la Fig. 23
REFERENCIAS
1. Urnov, F.D., Rebar, EJ., Holmes, M.C., Zhang, H.S. & Gregory, P.D. Genome editing with engineered zinc finger nueleases. Na/. Re\'. Gene/. 11,636-646 (2010).
2. Bogdanove, AJ. & Voytas, D.F. TAL effectors: customizable proteins for ONA
targeting. Science 333, 1843-1846 (2011).
3. Stoddard, B.L. Homing endonuclease S!ructure and function. Q. Rev. Binphys. 38, 4995 (2005).
4. Bae, T. & Schneewind, O. Allelic replacement in Slaphylococcus aureus with
inducible counter-selection. P/asmid SS, 58-63 (2006).
5. Sung, C.K., Li, H., Claverys, J.P. & Monison, D.A. An rpsL cassene, janus, for gene
replacement through ncgative selection in Streptococcus pneumoniae. Appl. Enviro1l. Microbio/.
67,5190-5196 (2001).
6. Sharan. S.K., Thomason, LC., Kuznetsov, S.O. & Court, D.L Recombineering: a homologous rccombination·based method of genetic cngineering. Nat. Protoc. 4, 206·223
(2009).
7. Jinek. M. et al. A programmable dual-RNA-guidcd DNA endonuclease in adaptive
bacterial immunity. Science 337,8 16-821(2012).
8.
Deveau, H., Garneau, J.E. & Moineau, S. CRlSPR-Cas system and its role in phagebacteria interacrions. Annu. Rev. Microbio/. 64, 475-493 (2010)_
9.
Horvath, P. & Sarrangou, R. CRlSPR-Cas, the immune system of bacteria and archaea. Science 327, 167-170 (2010).
10.
Tems, M.P. & Tems, R.M. CR.ISPR·bascd adaptive irnrnune systems. Curro Opino Microbio/. 14, 321·327 (2011).
11.
van der 0051, J., Jore, M.M., Westra, E.R., Lundgren, M. & Brouns, S.1. CRISPR· based adaplive and heritable irnmunity in prok2lryotes. Trends. Biochem. Sci. 34,401407 (2009).
12.
Brouns, S.J. et al. SmaJl CRlSPR RNAs !,'Uide antiviroll defense in prokaryotes. Science3Z1, 960·964 (2008).
13.
Cane, J., Wang, R., Li, H., Tems, IR.M. & Tems, M.P. Cas6 is an cndoribonuclease
thal generoltcs guidc RNAs for invader dcfcnse in prokaryotes. Genes Del'. 22, 3489·3496 (2008).
14.
Deltcheva, E. et al. CRlSPR RNA maturation by lrans·encoded small RNA and host factor RNasc JI!. Nature 471 , 602-607 (20 11 ).
15.
Haloum·Aslan, A., Maniv, l. & Marraffini, L.A. Mature c1ustered, regularly inlerspaeed, short palindromic repeals RNA (crRNA) length is rneasurcd by a ruler mechanism anchored al the precursor processing sitc. Proc. NaIf. Acad. Sci. USA. 10H, 21218-2 1222 (20 11 ).
16.
Haurwitz, R.E., Jinek, M., Wiedenheft, B., Zhou, K. & Doudna, J.A. Sequence-and structure-specific RNA processing by a CRlS PR endonuclease. Science 329, 1355-1358 (2010).
17.
Dcvcau, H. et al. Phagc response lO CRlSPR-encodcd rcsistance in Slreptococcus Ihermophilus. J. Bacteriol. 190, 1390-1400 (2008).
18.
Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9·crRNA ribonucleoprolein complex mediales specific DNA cleavage for adaplive irnmunity in bacteria.
Proc. Natl. Acad. Sci. U.S.A. (2012).
19.
Makarova, K.s., Aravind, L., Wolf, Y.1. & Koonin, E.V. Unification of Cas proteio furni lics and a simple scenario for the origin and cvolution ofCRJSPR-Cas systems. Biol. Direcl. 6,38 (20 11 ).
20.
Barrangou, R. RNA-medialed prograrnmable DNA cleavage. Nat. Biolechnol. 30, 836·838 (20 12).
21.
Brouns. SJ. Molecular biology. A Swiss anny kni fe of immunity. Science 337. 808· 809 (2012).
22.
Carroll, D. A CRISPR Approach 10 Gene Targeling. Mol. Ther. 20, 1658-1660 (2012).
23.
Bikard, D., Hatoum-Aslan, A., Mucida, D. & Marraffini, L.A. CRJSPR interference can prevent natural transfonnation and virulence acquisi tion during in vivo bacterial infection. Cell Host Microbe 12, 177-186 (2012).
24.
Sapranauskas, R. el al. The StreplOCOCcus Ihermophilus CRJSPR-Cas syslem provides immunity in Escherichia eolio Nucleie Acids Res. (20 11 ).
25.
Semenova, E. et al. Interference by clustercd rcgularly interspaccd short palindromic repcat (CRISPR) RNA is govemed by a sccd scquence. Proe. Nall. Acod. Sci. U.SA. (20 11 ).
26.
Wiedenheft, B. et al. RNA-guided complex from a bacterial immune system enhances targct rccognition through secd sequcnce inleractions. Proc. Nal/. Acad. Sci. U.S.A. (2011 ).
27.
Zahncr, D. & Hakenbcck, R. Th(: Slreplococcus pneumoniae bCla-galactosidase is a surface protcin.J. Bacteriol. 182,5919-592 1 (2000).
28.
Marraffini, L.A., Dedcnl, A.e. &. Schneewind. O. Sonases and the art of anchoring
proteins 10 Ihe envelopes of gram-posilive bacteria. Microbio/. Mol. Biol. Re\'. 70, 192-221 (2006).
29.
Motamedi, M.R., Szigety, S.K. & Rosenberg, S.M. Double-strand-break repair recombinalion in Escheriehia coli: physieal evidence for a DNA replicalion mechanism in vivo. Genes Dev. 13,2889-2903 ( 1999).
30.
Hosaka, T. et al. The novel mutalion K87E in ribosomal prolein S 12 enhanccs proteio synlhcsis activiry during Ihe late growth phasc in Eseherichia eolio Mo/. Genet. Geflomies 271, 317-324 (2004).
31.
Coslantino, N. & Court, D.L. Enhaneed le veis of lambda Red-mediated recombinants in mismalch repair mulanlS. Proc. Nad. Acad. Set". U.S.A. IOO, 15748-15753 (2003).
32.
Edgar, R. & Qimron, U. The Escherichio con CRJSPR syslem prulccls from lambda Iysogcnizalion, Iysogens, and prophage induclion. J. Bacterio/. 192, 6291-6294 (2010).
33.
Marruffini, L.A. & Sontheimer, E.J. Self versus non-self discrimination during C RI SPR RNA-direclcd immunity. Nature 463, 568-571 (2010).
34.
Fischcr, S. el al. An archaeal immune syslem can delecl multiple Protospacer Adjaccnt Motifs (PAMs) to target invader DNA. J. Biol. Chem. 281, 3335 1-33363 (20 12).
35.
Gudbergsdonir, S. el al. Dynamic properties of Ihe Sulf%bus CRISPR-Cas and CRlSPRlCmr syslems whcn challenged wilh vector-borne vir.il and plasmid genes and prolospacers. Mol. Microbio/. 79,35-49 (20 11).
36. Wang, H.H. et al. Genome-scale promoter enginecring by coselection MAOE. Nar
Melhads 9, 59 1-593 (2012).
37.
Cong, L. et al. Multiplex Genome Engineering Using CRJSPR-Cas Systems. Science In pr... (2013).
38.
Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science ln press (2013).
39.
Hoskins, J. et al. Genome of the baeterium S/rep/ococcus pneumoniae strain R6. J. BaClerial. 183, 5709-57 17 (2001).
40.
Havarstein, L.S., Coomaraswarny, G. & Morrison, O.A. An unmodified heptadecapeplide pheromone induces compctence for genelic trdnsfonnalion in S/replococCUs pneumoniae. Proc. Nal/. Acad. Sci. U.S.A. 92, 1 J140-1 J144 (1995).
41.
Horinouchi, S. & Weisblum, B. Nucleolide sequence and funclional map ofpCl94, a plasmid that specifics inducible ehlordmphenicol resislance. J. Bacterio/. 150,815-825 (1982).
42.
Horton, R.M. In Vitro Recombination and Mutagenesis of DNA : SOEing Together
Tailor-Madc Genes. Melhods Mol. Biol. 15,251-261 (1993).
43. Podbielski, A., Spellerberg, 8., Woisehnik, M., Pohl, 8. & Lunicken, R. Novel series
of plasmid vectors for gene inactivation and expression analysis in group A streptococci (GAS). Gene 177,137-147 (1996).
44.
Husmann, L.K., Seon, J.R., Lindahl, G. & Stcnberg, L. Expression oflhe Arp protein, a member of Ihe M protein family, is nol suffieicnt 10 inhibil phagocytosis of SlreplococCUs pyogenes. Infeclion and immunity 63, 345-348 (1995).
45.
Gibson, D.G. el al. Enzyrnalic assembly of ONA molecules up 10 several hundred kilobases. Nm Melhods 6, 343-345 (2009).
46.
Tangri S, ct al. ("Ralionally cngineered Iherapeutic proteins with reduced immunogenicity" J lmmunol. 2005 Mar 15; 174(6):3187-96.
Aunque se han presentado realizaciones preferidas de la presente invención y se han descrito en la presente memoria, será evidente para los expertos en la materia que tales real izaciones se proporcionan como ejemplo solamente. Ahora tendrán lugar numerosas variaciones, cambios y sustituciones para los expertos en la materia sin apartarse de la invención. Se debería entender que se pueden emplear diversas alternativas a las realizaciones de la invención descritas en la presente memoria en la práctica de la invención.
LISTADO DE SECUENCIAS
<110> THE BROAD INSTITUTE, INe. INSTITUTO DE TECNOLOGíA DE MASSACHUSETIS
<120> INGENIERíA DE SISTEMAS, METODOS y COMPOSICIONES GUíA OPTIMIZADAS PARA MANIPULACiÓN DE SECUENCIAS
<130> PC927381 EPA
<140> Patente de EE.UU. PCTfUS2013f074819
< 141> 2013-12-12
<150> 61f836 .127
< 151> 2013-06-17
<150> 61 f835.931
< 151> 2013-06-17
<150> 61 f828 .130
< 151> 2013-05-28
<150> 61 f819 .803
< 151> 2013-05-06
<150> 61 f81 4.263
< 151> 2013-04-20
<150> 61f806.375
< 151> 2013-03-28
<150> 61/802.174
< 151> 2013-03-15
<150> 61 f791 .409
< 151> 2013-03-15
<150> 61f769.046
< 151> 2013-02-25
<150> 61 f758 .468
< 151> 2013-01-30
<150> 61f748 .427
< 151> 2013-01-02
<150> 61f736.527
< 151> 2012-12-12
<160> 264
<170> Patentln version 3.5
<210> 1
<211> 15
<
212> ADN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial Oligonucleótido sintético~
<400> 1 aggacgaagt cctaa 15
<210> 2 <211>7
<212> PRT
< 213> Virus 40 del simio
<400> 2
Pro Lys Lys Lys Arq Lys Val 1 5
<210> 3
<211> 16
<212> PRT
< 213> Desconocido
<220>
<
221> fuente
<
223> Inota=~Descripción de Desconocido· Secuencia de NLS bipartita de nucleoplasmina~
<400> 3
Lyt Arq Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15
<210> 4 <211>9
<212> PRT
< 213> Desconocido
<220>
<
221> fuente
<
223> Inota=~Descripción de Desconocido· Secuencia NLS C-myc·
<400> 4 Pro Ala Al.a Lys Arg Val Lys Leu Asp 1 5
<210> 5
<211> 11
<212> PRT
< 213> Desconocido
<220>
<
221> fuente
<
223> Inota="Descripción de Desconocido· Secuencia NLS C-myc"
<400> 5
Arq Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10
<210> 6
<211> 38
<212> PRT
< 213> Homo sapiens
<400> 6
Aan Gln Ser Ser Asn Phe Gly Pro Mat Lys Gly Gly Asn Phe Gly Gly 1 S 10 15
Arq Ser Ser Gly pro Tyr Gly G1y Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30
Arq Asn Gln Gly Gly Tyr 35
<210> 7
<211>42 5 < 212> PRT
< 213> Desconocido
<220>
<
221> fuente
<
223> Inota=-Descripción de Desconocido: dominio lBS de secuencia de importina-alfa
10 <400> 7
Arq Mat Arq Ila G1x Phe Lys Asn Lys Gly Lys Aap Thr Als Glu Leu 1 5 la 15
Arq ~9 ~ Arq Val Glu Val Ser Val Glu Lau Arq Lys Ala Lys Lys 20 25 30
Asp Glu Gln Ile Leu Lys ArO Arq Aan Val 3S 40
<210> 8
<211> 8
<212> PRT 15 < 213> Desconocido
<220>
<
221> fuente
<
223> Inota=-Descripción de Desconocido: Secuencia d e proteína de mioma T
<400> 8
Val Ser Arg Lys Arq Pro Arq Pro 20 1 5
<210> 9
<211> 8
<212> PRT
< 213> Desconocido
25 <220>
<
221> fuente
<
223> Inota=-Descripci6n de Desconocido: Secuencia de proteína de mioma T
<400> 9
Pro Pro Ly8 Lys Ala Arq Glu ABp 1 5
30 <210> 10
<211> 8
<212> PRT
< 213> Horno sapiens
<400> 10
Pro Gln Pro Lys Lys Lys Pro LBu 1 5
<210>11 <211>12
<
212> PRT
<
213> Mus musculus
<400> 11
Ser Ala LBu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10
<210> 12
<211> 5
<212> PRT
< 213> Virus de la inftuenza
<400> 12 Asp Arg Leu Arg Arg 1 5
<210> 13 <211>7
<212> PRT
< 213> Virus de la inftuenza
<400> 13
Pro Lys Gln Lys Lys Arq Lys 1 5
<210> 14
<211> 10
<212> PRT
< 213> Virus de Hepatitis delta
<400> 14
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10
<210> 15
<211> 10
<212> PRT
< 213> Mus musculus
<400> 15
Argo Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10
<210> 16 <211>20
<
212> PRT
<
213> Homo sapiens
<400> 16
Lys Arg Lya G1y Asp Glu Val Asp Gly val Asp Glu Val Ala Lys Lys 1 5 10 15
Lys Ser Ly8 Lys 20
<210> 17
<211> 17
<212> PRT
< 213> Homo sapiens
5 <400> 17
ArO Lye Cye Leu Gln Ala Gly Met Asn Leu Glu Ale Arq Lye Thr Lye 1 S 10 lS
Lys
<210> 18 <211>27
< 212> ADN 10 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleólido sinlélico~
<220> 15 < 221> base modificada
< 222> (1 )..(20) <223>a,c, t og
<220>
< 221> base modificada 20 < 222> (21) ..(22)
< 223> a, c, t, g, Desconocido u olro
<400> 18 nnnnnnnnnn nnnnnnnnnn nnagaaw 27
<210> 19 25 <211>19
<
212> ADN
<
213> Secuencia Artificial
<220>
< 221> fuente 30 < 223> Inola=~Descripción de Secuencia Artificial· Oligonucleólido sintélico"
<220>
< 221> base modificada
<222> (1) ..(12)
<223> a,c, log
35 <220>
<
221> base modificada
<
222> (13) ..(1 4)
<
223> a, c, t, g, Desconocido u otro
<400> 19 40 nnnnnnnnnn nnnnagaaw 19
<210> 20 <211>27
<
212> ADN
<
213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Descripción de Secuencia Artificial Ol igonucleótido sintét ico~
<220> < 221> base modificada < 222> (1 )..(20) <223> a,c, tog
<220> < 221> base modificada < 222> (21) ..(22) < 223> a, e, t, g, Desconocido u otro
<400> 20 nnnnnnnnnn nnnnnnnnnn nnagaaw
27
<210> 21 <211>18 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Descripción de Secuencia Artificial· Oligonucleótido sintético"
<220> < 221> base modificada < 222> (1 )..(11) <223>a,c, t og
<220> < 221> base modificada < 222> (12) ..(13) < 223> a, e, t, g, Desconocido u otro
<400> 21 nnnnnnnnnn nnnagaaw
18
<210> 22 <211> 137 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota="Descripción de Secuencia Artificial· Polinucleótido sintético"
<220> < 221> base modificada < 222> (1 )..(20) < 223> a, e, t, g, Desconocido u otro
<400> 22 nnnnnnnnnn
nnnnnnnnnn qtttttqtac tctcaaqatt taqaaataaa tcttqcaqaa 60
qctacaaaqa taaqqcttca
tqccgaaatc aacaccctqt cattttatqq caqqqtqttt 120
t cqttattta atttttt
131
<210> 23
<21 1> 123
< 212> ADN
< 213> Secuencia Artificial
5 <220>
< 221> fuente
< 223> Inota:::MDescripción de Secuencia Artificial : Polinucleótido sintético"
<220>
< 221> base modificada 10 < 222> (1) ..(20)
< 223> a, c, t, g, Desconocido u otro
<400> 23
nnnnnnnnnn nnnnnnnnnn qtttttqtac tctcaqaaat qcaqaaqcta caaa;ataa; 60
octtcatgcc qaaatcaaca ccctqtcatt t tatggcagg gtgttttcqt tatttaattt 120
ttt 123
<210> 24 15 <211> 110
< 212> ADN
< 213> Secuencia Artificial
<220>
< 221> fuente 20 < 223> Inota:::MDescripción de Secuencia Artificial: Polinucleótido sintético"
<220>
< 221> base modificada
< 222> (1 ) .. (20)
< 223> a, c, t, g, Desconocido u otro
25 <400> 24 nnnnnnnnnn nnnnnnnnnn qtttttgtac tctcaqaaat qcaqaaqcta caaagat aaq 60
octtcatocc oaaatcaaca ccctgtcatt ttatgqcaqg gtgttttttt 110
<210> 25
<211> 102
< 212> ADN 30 < 213> Secuencia Artificial
<220>
< 221> fuente
< 223> Inota:::MDescripción de Secuencia Artificial: Polinucleótido sintético"
<220> 35 < 221> base modificada
< 222> (1 )..(20)
< 223> a, c, t, g, Desconocido u otro
<400> 25
nnnnnn~nn nnnn~nnnn qttttaqaqc taqaaataqc aaqttaaaat aaqqctaqtc 60
cgttatcaac ttqaaaaagt qqcaccqagt cqgtqctttt tt 102
40 <210>26
<211> 88 < 212> ADN
< 213> Secuencia Artificial
<220>
< 221> fuente 5 < 223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<220>
< 221> base modificada
< 222> (1 )..(20)
< 223> a, c, t, g, Desconocido u otro
10 <400> 26
nnnnnnnnnn nnnnnnnnnn qttttagaqc tagaaataqc aaqttaaaat aaqqctaqtc 60
cqttatcaac ttqaaaaagt qttttttt 88
<210> 27
<211> 76
< 212> ADN 15 < 213> Secuencia Artificial
<220>
< 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<220> 20 < 221> base modificada
< 222> (1 )..(20)
< 223> a, c, t, g, Desconocido u otro
<400> 27
nnnnnnnnnn nnnnnnnnnn gttttagaqc tagaaatagc aagttaaaat aaqgctagtc 60
cgttatcatt tttttt 76
25 <210>28
<211> 12
< 212> ARN
< 213> Secuencia Artificial
<220> 30 < 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 28 guuuuagagc ua 12
<210> 29 35 <211> 33
< 212> ADN
< 213> Homo sapiens
<400> 29 ggacatcgat gtcacctcca atgactaggg Igg 33
40 <210>30
<211> 33
< 212> ADN
< 213> Horno sapiens <400> 30 cattggaggt gacatcgatg tcctccccat tgg 33
<210> 31 <211>33
<212>ADN
< 213> Horno sapiens
<400> 31 ggaagggcct gagtccgagc agaagaagaa ggg 33
<210> 32 <211>33
<
212> ADN
<
213> Horno sapiens
<400> 32 ggtggcgaga ggggccgaga ttgggtgttc agg 33
<210> 33
<211> 33
<
212> ADN
<
213> Horno sapiens
<400> 33 atgcaggagg gtggcgagag gggccgagat tgg 33
<210> 34
<211> 21
<
212> ADN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota="Descripción de Secuencia Artificial " Cebador sintético"
<400> 34 aaaaccaccc ttctctctgg c 21
<210>35
<211> 21
<
212> ADN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota="Descripción de Secuencia Artificial: Cebador sintético"
<400> 35 ggagattgga gacacggaga 9 21
<210> 36
<211> 20
<
212> ADN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota="Descripción de Secuencia Artificial: Cebador sintético"
<400> 36 ctggaaagcc aatgcctgac
20
5
<210> 37 <211>20 <212>ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Descripción de Secuencia Artificial " Cebador sintético~
10
<400> 37 ggcagcaaac tccttgtcct 20
15
<210> 38 <211> 12 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Descripci ón de Secuencia Artificial: Ol igonucieótido sintético"
20
<400> 38 gttttagagc ta 12
<210> 39 <211> 335 < 212> ADN < 213> Secuencia Artificial
25
<220> < 221> fuente < 223> Inota=~Descripci ón de Secuencia Artificial " Polinucleótido sintético"
<400> 39 qaqqqcctat
ttcccatgat tccttcatat ttqcatatilC qatilcaaggc tgttagagag 60
ataattqgaa
ttaatttgac tgtaaacaca aaqatattaq tacaaaatac gtgacgtaqa 120
aagtaataat
ttcttqqqt.a gtttqcaqtt ttaaaattat qttttaaaat qqactatc at 180
atqcttaccq
taacttqaaa gtatttcqat ttcttqqctt tatatatctt qtqqaaaqqa 2.0
cqaaacaccq
qaaccattca aaacaqcata qcaagttaaa ataaqqctag tcc qttatca 300
acttqaaaaa
qtqqcaccqa qtcqqtqctt ttttt 335
30
<210>40 <211>423 < 212> ADN < 213> Secuencia Artificial
35
<220> < 221> fuente < 223> Inota="Descripción de Secuencia Artificial: Polinucleótido sintético"
<400> 40
gaqgqcctat ttcccatqat tccttcatat ttqcatatac qatacaaqqc tqttaqaqaq 60 ataattgqaa ttaatttgac tgtaaacaca aagatattaq tacaaaatac qtqacqtaga 120 aaqtaataat ttcttgqgta gtttgcaqtt ttaaaattat gttttaaólat ggactatcat 180 atgcttaccg taClcttqClaa gtatttcqat ttcttqqctt tatCltCltctt qt,qqaaaqgCl 240 cgaaacaccg qtClgtattaa qtattqtttt atqqctqata aatttctttq aatttctcct 300 tgattatttq ttataaaaqt tataaaataa tcttgttqqa accattcaaa acaqcataqc 360
aaqttaaaat aa9Qctaqtc cqttat caac ttgaaaaaqt qgcaccgagt cgqtqctttt 420 ttt 423
5 <210> 41 <211>339
< 212> ADN
< 213> Secuencia Artificial
<220> 10 < 221> fuente
< 223> Inota=~Descripci6n de Secuencia Artificia l: Polinucleótido sintéticoH
<400> 41
gagQ9cctat ttcccatqat tccttcatat ttqcatatac qatacaaqqc tqttaqagag 60 ataattqgaa ttaatttgac tqtaaacaca aaqatattaq tacaaaatac qtgacgtaga 120 aaqtaataat ttcttqqqta qtttqcaqtt ttaaaattat qttttaaaat qqactatcat 180 atgcttaccg taacttqaaa qtatttcgat ttcttqqctt tatatatctt qtqqaaa99a 240 cqaaacaccq qqttttaga.q ctatqctgtt ttga.a.tgqtc ccaaaacggg tcttcgagaa 300 gacqttttag agctatqc tg ttttgaatqg tcccaaaac 339
<210> 42 15 <211>309
< 212> ADN
< 213> Secuencia Artificial
<220>
< 221> fuente 20 < 223> Inota=~Descripción de Secuencia Artificial " Polinucleótido sintético" <400> 42
qagqqcctat ttcccatgat tccttcatat ttgcatatac gatacaaqqc tqttaqagag 60 ataattqqaa ttaatttgac tqtaaacaca aagatattaq tacaaaatac qtgacqtaga 120 aaqta,a,taat ttcttgqqta qtttgcagtt ttaaaattat gttt.taaaat ggaetatcat 180 atgcttaccg taacttgaaa qtatttcgat ttcttggctt tatatatctt qtgqaaag9a 240 cqaaacaccq qqtcttcqaq aaqacctqtt ttaqaqctac¡ aaatac¡caaq ttaaaataaq 300 qctaqtccq 309
<210> 43
<211> 1648 5 < 212> PRT
< 213> Secuencia Artificial
<220>
< 221> fuente
< 223> Inota=~Descripci6n de secuencia artificial" polipéplido sintético~
<400>
43
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lya Asp His ASp
Ila Asp
1
5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arq Lys Val 20 25 30
Gly Ile His Gly val Pro Ala Ala Asp LyS Lys Tyr Ser Ile Gly Leu 35 40 015
Asp Ile G~y Thr Asn Ser Va~ G~y Trp A~a Val Ile Thr Asp Glu Tyr 50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg Bis ~ 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu 85 ~ ~
100 105 110
-~-~--~---~-----
Arg Arg Lys Aso Arq Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu 115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe Bis Arg Leu Glu Glu Ser Phe 130 135 140
Leu val Glu Glu Asp Lys Lys Bis Glu Arg Bis Pro Ile Phe Gly Asn 145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr Bis 165 170 175
Leu Arq Lys Lys Leu Val Asp Ser thr A9p Lys Ala Asp Leu Arg Leu 180 185 190
Ile Tyr Leu Ala Leu Ala Bis Met Ile Lys Phe Arq Gly His Phe Leu 195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val ASp Lys Leu Phe 210 21.5 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile 225 230 235 240
Aso Ala
Ser Gly Val Asp Ala Lys Ala Ile Leu Ser JUa Arg Leu Ser
245
250 255
81
Lys Ser Arq Arq Leu G1u Asn Leu I1e A1¡!l G1n Lau Pro Gly G1u Lys 260 265 270
Lys Asn Gly Leu Phe Gly Asn Lau Ile Al¡!l Lau Ser Leu G1y Leu Thr 275 280 285
"ro Asn ¡lhe Lys Ser Aan Phe Asp Leu Al¡!!. Glu Asp Ala Lys Leu Gln 290 295 300
Leu Ser Lye Asp Thr Tyr Asp Asp Asp Le1.l Asp Asn !.eu Leu Ala GIn 305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Pha Leu Ala Ala Lys Asn Leu Ser 325 330 335
~sp Ala I1a Leu Leu Ser Asp 11e Leu Arl;J Val Aan Thr G1u Il. orhr 340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Ly:s Arg Tyr Asp GIu His His 355 360 365
G1n Asp Leu Thr Leu Leu Lys Ala Leu Va:l ArQ G1n Gln Leu Pro GIu 370 375 380
Ly8 Tyr Lys Glu 119 Phe Phe Asp Gln Se:1:' Lys Asn Gly Tyr Ala Gly 385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe 11e Lys 405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Gl1l1 Gl.u Leu Leu Val. Lys Leu 420 425 430
P6sn Arg Glu Asp !.eu Leu ~g Lys Gl.n Ar9 Thr Phe Asp Asn Gly Ser 435 440 445
Ila Pro His Gl.n Ile His Leu Gl.y Gl.u Leu His Ala I1e Leu Arq Arq 450 455 460
Gln Glu Asp Phe Tyr Pro Pha Leu Lys AsIP Aso Arq Glu Lys Ile Glu 465 470 475 480
Lys Ile Leu Thr Phe Arq Ile Pro Tyr Ty:1:' Val Gly Pro :t.eu Ala Arg 485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Ar'iJ Lys Ser Gl.u Gl.u Thr Ile 82
500 sos
_~~ ~~~~_~~~_ll._
515 520 525
Ser Phe Ile Glu Arq Ket Thr Asn Phe ~.8p Lys Asn Leu Pro Asn Glu 530 535 540
Lys Val Leu Pro Lys Bis Ser Leu Leu 'I'yr Glu Tyr phe thr Val Tyr 545 550 555 560
Asn Glu Leu Thr Lys val Lys 'l'yr val 'I'hr Glu Gly Met Arq Lys Pro 565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys 1I.1a Ile Val Asp Leu Leu Pbe 580 585 590
Lys Thr Asn Arq Ly8 Val Thr Val Ly8 Giln Leu Ly8 Glu Asp Tyr Phe 595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val G:lu IIa Ser Gly Val Glu Asp 610 615 620
Arq Phe Asn Ala Ser Leu Gly 'l'hr Tyr IIlia Asp Leu Leu Lys Ile Ile 625 630 635 .40
Lys Asp Lys Asp Phe Leu Asp Asn Gl.u Gilu Asn Glu Asp Il.e Leu Glu
645 E;SO 655
Asp Ile Val Leu 'l'hr Leu 'l'hr Leu Phe Gau Asp Arg Glu Het Ile Glu 660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu F'he Asp Asp Lys Val Met Lys 675 680 685
Gln Leu Lys Arg Arg Arq 'l'yr thr Gly 'I'rp Gly Arg Leu Ser Arq Lys 650 695 700
Leu Ile Asn Gly Ile Arq Asp Lys Gln Sier Gly Lys 'l'hr Ile Leu ASp 70S 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn ~~g Asn Phe Met Gln LBu Ile 725 1'30 735
His ASp Asp Ser Leu Thr Phe Lys Glu ~~p Ile Gln Lys Ala Gln Val 740 145 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile ~a Asn Leu ~a Gly 755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys val Val Asp 710 775 780
Glu Leu Val Lys Val Met Gly Arq His Lys Pro Glu Asn Ile Val Ile 785 790 795 800
Glu Met Ala Arq Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 805 810 815
Arq Glu Arq Met Lys Arq Ile Glu Glu Gly Ila Lys Glu Leu Gly Ser 820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu 835 840 845
Lys Léu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arq Asp Het Tyr Val Asp 850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Bis Ile 865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu 885 890 895
Thr Arq Ser Asp Lys Asn Arq Gly Lys Ser Asp Asn Val Pro Ser Glu 900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arq Gln Leu Leu Asn Ala 915 920 925
Lys Leu Ile Thr Gln Arq Lys Phe Asp Asn Leu Thr Lys ~a Glu Arq 930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys ~a Gly Phe Ile Lys Arq Gln Leu 945 950 955 960
Val Glu Thr Arq Gln Ile Thr Lys His Val ~a Gln Ile Leu Asp Ser 965 970 975
Arq Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arq Glu Val 980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arq Lys Asp 995 1000 1005
Phe Gln Phe Tyr Lys Val Arq 1010 1015
Bis Asp Ala Tyr Leu ASn Al. 1025 1030
Lya Tyr Pro Lys Leu Glu Ser 1040 1045
Val Tyr Asp Val Arg Lys Met 1055 1060
Gly Lys Ala 'l'hr Ala Lys Tyr 1070 1.075
'he 'he Lya 'l'hr Glu Ile Thr 1085 1 090
Arq Pro Leu lle Glu Thr Aan 1100 1105
AaP Lye Gly Arq Asp phé Ala 1115 1120
pro Gln Val Asn lle Val Lys 1130 1135
Phe Ser Lys Glu Ser Ile Leu 1145 1150
ne Al. Arq Lys Lys Asp Trp l160 1165
Asp Ser Pro Thr Val Ala Tyr 1175 1180
Glu Lys Gly Lys Ser Lys Lys 1190 1195
Gly ne Thr Ile Met Glu Ar9 1205 1210
Asp Phe Leu Glu Ala Lye Gly 1220 1225
n. ne Lys Leu Pro Lys Tyr 1235 1240
Glu 11e Asn Aso Tyr His His Ala 1020
Val Val Gly Thr Ala Leu 11e Lys 1035
Glu Phe Val '1'yr Gly Asp Tyr Lys 1050
lle Ala Lys Ser Glu Gln Glu rle 1065
Phe Phe Tyr Ser Asn Ile Met Asn lOBO
Leu Ala Asn Gly Glu He Arq I..ys 1095
Gly Glu Thr Gly Glu lle Val Trp
Thr Val Arq Lys Val Leu Sér Met 1125
Lys Thr Glu Val Gln rhr Gly Gly 1140
Pro Lys Arq Asn Ser Asp Lys I..eu 1155
Asp Pro Lys Lys Tyr Gly Gly Phe 1170
Ser Val Leu Val Val Ala Lys Val 1185
Leu Lys Ser Val Lys Glu Leu Leu 1200
Ser Ser Phe Glu Lys Asn Pro Ile 1215
Tyr Lys Glu Val Lys Lys Asp Leu 1230
Ser Leu Phe Glu Leu G1u Asn Gly 1245
Arq Lys Arq Met Leu Ala Ser Ala Gly Glu Leu GI. Lys Gly Asn 12 50 1255 1260
Glu Leu AICl Lau Pro Ser Lya Tyr Val Asn Phe Leu Tyr Leu Ala 1265 1270 1215
Se r His Tyr Glu Lys Leu Lys Gly S-sr Pro Glu Asp Asn Glu Gln 1280 1285 1290
Lys GI. Leu Phe Val Glu GI. Bis Lys Bi s Tyr Leu Asp Glu Ile 1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arq Val Ile Leu Ala Asp 1310 1315 1320
Ala As. Lau Asp Lys Val Lau Ser Ala Tyr Asn Lys Bis Arq Asp 1325 1330 1335
Lys Pro Ile Arq Glu Gln Ala Glu Asn Ile Ile Hi s Lau Phe Thr 1340 1345 1350
Leu Thr Asn Lau Gly Ala Pro Al.a Ala Phe LyS Tyr phe Asp Thr 1355 1360 1365
Thr Ile Asp Arq Lys Arq Tyr Thr Ser Thr Lys Glu Val Lau Asp 1370 1375 1380
Ala Thr Lau Ile His GIn Ser Ile Thr Gly Lau Tyr Glu Thr Arq 1385 1390 1395
Ile Asp Lau Ser Gln Leu Gly Gly Asp Ala Ala Ala Val Ser Lys 1400 140 5 1410
Gly Glu Glu Leu Pha Thr Gly Val Val Pro Ile Leu Val Glu Leu 1415 1420 1425
Asp Gly Asp Val Asn Gly Bis Lys Phe Ser Val Ser Gly Glu Gly 1430 1435 1440
Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys 1445 1450 14"
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 1460 1465 1470
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met
Lys Gln 1490
Gln Glu 1505
Arg Al. 1520
Glu Leu 1535
His Ly. 1550
Al. Asp 1565
Bis Asn 1580
Gln Asn 1595
Bis Tyr 1610
Ly. Arq 1625
Ile Thr 1640
<210> 44
<211> 1625
<212> PRT
Bis Asp Phe Phe
Arg 'rhr Ile Phe
Glu Val Lys Phe
Lys Gly 11e Asp
Leu Glu Tyr Asn
Lys Gln Lys Asn
11e Glu Asp Gly
Thr Pro I 1e G1y
Leu Ser Thr Gln
Asp His Met Val
Leu Gly Met Asp
Ly. 1495
Phe 1510
Glu 1525
Phe 1540
Tyr 1555
Gly 1570
Ser 1585
Asp 1 600
Ser 1615
Leu 1630
Glu 1645
1485 Ser Ala Het Pro Glu 1500 Lys Asp Asp Gly Asn 1515 Gly Asp 'l'hr Leu Val 1530 Lys Glu Asp Gly Asn 1545 Asn Ser His Asn Val 1560 lle Lys Val Asn Phe 1575 Val Gln Leu Ala Asp 1590 Gly Pro val Leu Leu 1605 Ala Leu Ser Lys Asp 1620 Leu Glu Phe Val Thr 1635 Leu Tyr Lys
Gly 'ryr Val
Tyr Lys 'l'hr
Asn Arq Ile
Ile LQu Gly
'l'yr 11e Met
Lys I1e Arq
Bis Tyr Gln
Pro Asp Asn
Pro Asn Glu
Ala Ala Gly
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota="Descripción de Secuencia Artificial Polipéptido sintético"
<400> 44
H8t ABp Lya Lya Tyr Ser 1le Gly Leu Aap 1le Gly rhr ABn Ser Val 1 S 10 15
Gly Trp ~a Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg Bis Ser Ile Lys Lys Asn Leu Ila
35 40 4S
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu ~a Thr Arg Leu 50 ~ 60
Ly8 Arq Thr Ala Arq Arg Arg Tyr Thr Arg Arq Lys Asn Arq Ile eye 65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110
His Glu Arq Bis Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr Bis Leu Arg Lys Lys Leu Val Asp 130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160
Het Ile Lys Phe Arq Gly Bis Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175
Asp Asn Ser Aep Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arq Arq Leu Glu Asn 210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu rle Ala Leu Ser Leu G~y Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
2GO 265 270
ASp Asp Leu Asp Asn Leu Leu A~a G~n ]:~e G~y Asp G~n Tyr A~a Asp 215 280 285
Leu Phe Leu A~a Ala Lys Asn Leu Ser }~sp Ala Ile Leu Leu Ser Asp 290 295 300
Ile Leu Arq val Asn Thr Glu Ile Thr I,ys Ala Pro Leu Ser Ala Ser 305 310 315 320
Met Ile Lys Arq Tyr Asp Glu His Bis Gln Asp Leu Thr Leu Leu Lys 325 ~130 335
Ala Leu Val Arq Gln Gln Leu Pro Glu I,ya Tyr Lys Glu Ile Phe Phe 340 345 350
_~ ~_~~_~_~~li._
355 360 365
Gln Glu Glu Phe Tyr Lys Phe l1e Lys E'ro Ile Leu Glu Lys Met Asp 310 315 380
Gly Thr Glu Glu Leu Leu Val Lys Leu l~n Ar9 Glu Asp Leu Leu Ar9 385 390 395 400
Lys Gln Arq Thr Phe Asp Asn G1y Ser 1:18 Pro Bis Gln I1e Bis Leu 405 ~IIO 415
Gly Glu Leu Bis Ala Ile Leu Arq Arg Oln G1u Asp Phe Tyr Pro Phe 420 425 430
Leu Lys Asp Asn Arq Glu Lys Ila Glu I.ys Ile Leu Thr Phe Arq 11a .35 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arq Cay Asn Ser Arq Phe Ala Trp 450 455 460
MAt. Thr Arq Lys Sar Glu Glu Thr Ile 1~hr Pro Trp Aso Phe Glu Glu 465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Pha Ila Glu Arq Met Thr 485 ~190 495
Aso Phe Asp Lys Aso Leu Pro Asn Glu ]~yB Val Leu Pro Lys His Ser 500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr J~sn Glu Leu Thr Lys Val Lys 515 520 525
Tyr Val Thr Glu Gly Met Arq Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arq Lys Val Thr 545 550 555 560
Val Lys Gln Leu Lya Glu Asp Tyr Phe Lya Lys Ile Glu eye Phe ASp 565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arq pha Asn Ala Ser Leu Gly 580 585 590
Thr Tyr Ris Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620
Leu Phe Glu Asp Arq Glu Met Ile Glu Glu Arq Leu Lys Thr Tyr Ala 625 630 635 640
Ris Lau Phe Asp A8P Lys Val Met Lys Gln Leu Lys Arq Arq Arq Tyr 645 650 655
Thr Gly Trp Gly Arq Leu Ser Arq Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685
Ala Asn Arq Asn Phe Het Gln Leu Ile Bis Asp Asp Ser Leu Thr Phe 690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720
Ris Glu His 11e Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735
l1e Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750
Arq Ris Lys Pro Glu Asn 11e Val Ile Glu Met Ala Arq Glu Aso G1n 755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arq Glu Arq Met Lys Arq Ile 770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser G,ln Ile Leu Lys Glu Uis Pro 785 790 795 800
val Glu Asn Thr Gln Leu Gln Asn Glu L:ys Leu Tyr Leu Tyr Tyr Léu 805 810 815
Gln Asn Gly Arq Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830
Leu Ser Asp Tyr Asp Val Asp 8is Ile v.al Pro Gln Ser Phe Leu Lys 835 8~0 845
Asp Asp Ser Ile Asp A9n Lys Val Leu Tjhr Arg Ser Asp LyS Asn Arg 850 8SS 860
Gly Lys Ser Asp Asn Val Pro Ser Glu G,lu Val Val Lys Lys Met Lys 865 870 875 880
Asn t'yr Trp Arg Gln Leu Leu Asn Ala L:ys Leu Ile t'hr Gln Arg Lys 885 890 89~
Phe Asp Asn Leu Thr Lys Ala Glu Arg G,ly Gly Leu Ser Glu Leu Asp .00 905 '10
Lys Ala Gly Phe Ile Lys Arg Gln Leu V.al Glu Thr Arq Gln Ile Thr '15 '20 .25
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp '30 935 9~0
Glu Asn Asp Lys Leu Ile Arq Glu Val L:ys val Ile Thr Leu Lys Ser '45 '50 .55 960
Lys Leu Val Ser Asp phe Arg Ly8 Asp Phe Gln Phe Tyr Lys val Arq 965 9'70 975
Glu
Ile Asn Asn Tyr Bis 980 Bis Ala Bis Aisp Ala Tyr Leu Asn 985 990 Ala val
Val
Gly Thr Ala 995 Leu Ile Lys Lys 1000 Tyr ¡Pro Lys I.eu Glu 1005 Ser Glu Phe
Val Tyr Gly A8p Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020
Lys Ser Glu Gln Glu tle Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030
Tyr Ser Asn r1e Met Asn Phe 1040 1045
Asn Gly Glu rle Arg Lys Arq 1055 1060
Thr Gly Glu Ile Val Trp Asp 1010 1015
Arg Lys val Leu Ser Met Pro 1085 1090
Glu Val Gln Thr Gly Gly Phe 1100 1105
Arq Asn Ser Asp Lys Leu ne 1115 1120
Lys Lys Tyr Gly Gly Phe Asp 1130 1135
LeU Val Val Ala Lys Val Glu 1145 1150
Ser Val Lys Glu Leu Leu Gly 1160 1165
Phe Glu Lys Asn Pro Ile Asp 1175 1180
Glu Val Lys Lys Asp Leu Ile 1190 1195
Phe Glu Leu Glu Asn Gly Arg 1205 1210
Glu LeU Gln Lys Gly Asn Glu 1220 1225
Asn Phe Leu Tyr Leu Ala Ser 1235 1240
Pro Glu Asp Aen Glu Gln Lys 1250 1255 1035
Phe Lys: 'l'hr G1u ne Thr Leu Ala 1050
Pro Leu Ile Glu Thr Asn Gly Glu 1065
Lys Gly Arq Asp Phe Ala Thr Val 1080
Gln Val. Aan Ile Val Lys Lys 'lhr 1095
Ser Lysl Glu Ser ne Leu Pro Lys 1110
Ala Ar~r Lys Lys Asp trp Asp Pro 1125
Ser Prcl 'l'hr Val Ala 'l'yr Ser Val 1140
Lys Gl~' Lys Ser Lys Lys Leu Lys 1155
Ile Thl: Ile Met Glu Arq Ser Ser 1170
Phe Leu Glu Ala Ly. G1y 'l'yr Lys 1185
.ne Lyl!l Leu pro Lys Tyr Ser Leu 1200
Lys Art;;r Met Leu Ala Ser Ala G1y 1215
Leu AleL Leu Pro Ser Lys Tyr Val 1230
His Tyl: Glu Lys Leu Lya Gly Ser 1245
Gln Let:l Phe Val Glu Gln Bis Lys 1260
Bis Tyr Lel,l Asp Glu Ile ne 1265 1270
Arq Val I1e Leu Ala Asp Ala 1280 1285
Tyr Asn Lys Bis Arq Asp Lys 1295 1300
ne ne Mia Leu Phe Thr Leu 1310 1315
Phe Lys Tyr Phe Asp Thr Thr 1325 1330
Thr Lys Glu Val Leu Asp Ala 1340 1345
Gly Leu Tyr Glu Thr Are¡ ne 1355 1360
Ala Ala Ala Val Ser Lys Gly 1310 1315
Pro no Leu Val Glu Leu Asp 1385 1390
Ser val Ser G1y Glu G1y Glu 1400 1405
Thr Leu Lys Phe Ile eys Thr 1415 1420
Pro Thr Leu Val Thr Thr Leu 1430 1435
Arq Tyr Pro Aep Mis Met Lys 1445 1450
"et Pro G1u G1y Tyr Val Gln 1460 1465
Asp Gly Aan Tyr Lys Thr Arq 1475 1480
Thr Leu Val Asn Are¡ Ile Glu 1490 1495
Glu Gl:n Ile Ser Glu Phe Ser Lys 1275
Asn Le'u Asp Lya Val Leu Ser Ala 1290
Pro Il,e Are¡ G1u Gln Ala G1u Asn 1305
Thr Asn Leu G1y Ala Pro Ala Ala 1320
Ile As:p Arq Lys Arq Tyr Thr Ser 1335
Thr Le'u I1e Mis Gln Ser Ile Thr 1350
Asp Leu Ser Gln Leu Gly Gly Asp 1365
Glu Glu Leu Phe Thr Gly Val Val 1380
Gly As,p Val Asn Gly His Lys Phe 1395
Gly As:p Ala Thr Tyr Gly Lys Leu 1410
Thr Gly Lys LQu Pro Val Pro Trp 1425
Thr Tyr Gly Val Gln eya Phe Ser 1440
G1n Bis Aap Phe .h. Ly. Ser Ala 1455
G1u Arg Thl; Ile Phe Phe Lys Asp 1410
Ala Glu Val Lys Phe G1u G1y Aap 1485
Leu Lys Gly Ile Asp Phe Lys Glu 1500
Asp G1y Asn Ile Leu Gly His Lys Leu Glu Tyr ASn Tyr Asn Ser 1505 1510 1515
Bis Asn Val Tyr I1e Met Ala Asp Lys Gln Lys Asn Gly I1e Lys 1520 1525 1530
Val Asn Phe Lys Ile Arg Bis Asn 11e Glu Asp Gly Ser Val Gln 1535 1540 1545
Leu Ala Asp His Tyr Gln G1n Aso Thr Pro 1le G1y ABp Gly Pro 155Q 1555 1560
Val Leu Leu Pro Asp Asn Hie Tyr Leu Ser Thr G1n Ser Ala. Leu 1565 1510 1575
Sor Lys Asp Pro Asn Glu Lyo Arq Asp His Met Val Leu Leu Glu 1580 1585 1590
Phe val Thr Ala Ala Gly ne Thr Leu Gly Met ASp Glu Leu Tyr 1595 1600 1605
Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly G1n Ala Lys Lys 1510 1615 1620
Lys Lys
<210> 45
<211> 1664 5 <212> PRT
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota="Descripción de Secuencia Artificial " Polipéptido sintético"
10 <400> 45
Mat Asp Tyr Lys Asp Bis Asp Gly Asp '~yr Lys Asp Bis Asp Ile Asp 1 S lO 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Are¡ Lys val 20 25 30
Gly Ile His Gly val Pro Ala Ala Asp l:'ys Lys Tyr Ser Ile Gly Leu
35 .0 '5
Asp Ile Gly Thr Asn Ser Val Gly Trp JUa val Ile Thr Asp Glu Tyr 50 SS 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arq His 65 70 75 80
Ser Ile Lye Lys Asn Leu Ila Gly ~a Leu Leu Phe Aep Ser Gly Glu 85 90 95
Thr Ala Glu Ala Thr Arq Leu Lys Arg Thr Ala Arq Arq Arq Tyr Thr 100 105 110
Arg Arg Lys Asn Arq Ila eye Tyr Leu Gln Glu Ile Phe Ser Asn Glu 115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe ais Arq Leu Glu Glu Ser Phe 130 135 140
Leu Val Glu Glu ASp Lys Lys ~iB Glu Arq His Pro Xle Phe Gly Asn 145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr Bis 165 170 175
Leu Arq Lys LY8 Leu Val ASp Ser Thr Asp Ly8 Ala Asp Lau Arq Leu 180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly Mis Phe Leu 195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp val Asp Lys Leu Phe 210 215 220
Ila Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe GLu Glu Asn Pro Ile 225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser 245 250 255
Lys Ser Arg Arl} Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys 26D 265 270
LyS Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr 275 280 .285
Pro Asn Phe Ly8 Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln 305 310 315 320
Ile Gly ASp Gln Tyr Ala ASp Leu Phe Leu Ala Ala Lys Asn Leu Ser 325 330 335
Aap Ala Ile Leu Leu Ser ASp Ile Leu Arg Val Asn Thr Glu Ile rhr 340 345 350
Lys Ala Pro Leu Ser Ala Ser Met 11e Lys Arq Tyr Asp Glu His Bis 355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arq Gln Gln Leu Pro Glu 370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly 385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser G1n Glu Glu Phe Tyr Lys Phe I1e Lys 405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu 420 425 430
Asn Arg Glu ASp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser 435 440 445
Ile Pro His Gl.n Ile His Leu Gly Glu Leu Bis Ala Ile Leu Arq Arq 450 455 460
Gln Glu ASp Phe Tyr Pro Phe Leu Lys Asp ASn Arg Glu Lys Ile Glu 465 470 415 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr val Gly Pro Leu Ala Ar9
485 490 495
Gly Aan Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile 500 505 510
Thr Pro Trp Asn phe Glu Glu val Val Aap Lys Gly Ala Ser Ala Gln 515 520 525
Ser Phe Ile Glu Arg Met Thr ABn Phe Asp Lys Asn Leu Pro Aan Glu 530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr 545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lya Pro
565 5'70
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe 580 585 5.0
Lys Thr Asn Arq Lys Val Thr Val Lys Gln Leu Lys Glu Asp 'I'yr Phe 595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Gl\,1 Ile Ser Gly Val Glu Asp 610 615 620
___ ~_~m.~_tis_~~~sI~I~
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu G,lu Asn Glu Asp IIa Leu Glu 645 6.50 655
Asp He Val Leu Thr Leu Thr Leu Phe Glu ASp Arq Glu Met Ila Glu 650 665 670
Glu Arq Leu Ly. Thr Tyr Ala His Leu Phe Asp Asp Lya Val Met Lys 675 680 685
Gln Leu Lys Argo Arg Arq Tyr 'I'hr Gly T:tp Gly Arq Leu Ser Arq Lys 690 695 700
Leu rIe Asn Gly rle Argo Asp Lys Gln SI9r Gly Lys Thr Ile Leu Asp 705 110 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn A~q Asn Phe Met Gln Leu Ile 725 7:30 735
His Asp A.sp Ser Leu 'I'hr Phe Lys Glu ~9p rle Gln Lys Ala Gln val
740 745 750
Ser Gly Gln Gly Asp Ser Leu Bis Glu His !le Ala Asn Leu Ala Gly
7.5.5 760 76.5
Ser Pro ~a lle Lys Lys G'. Ile Leu G:Ln Thr Vd Lys Val Val Asp 770 775 780
Glu Lau Val Lys Val Met Gly Arq Mis L:í'8 Pro Glu Asn Ile Val ne 785 790 795 800
=~~_=_~~~~~s_~__ _
Arg Glu Arg Met Lys Arq Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser 820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu 835 840 845
Lys Leu ryr Leu Tyr Tyr Leu Gln Asn Gly Arq Asp Met Tyr Val Asp 850 855 860
Gln Glu Leu Asp Ile Asn Arq Leu Ser Asp ryr Asp Val Asp Bis Ile 865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu 885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu 900 905 910
Glu val val Lys Lys Het Lys Asn ryr Trp Arg Gln Leu Leu Asn Ala 915 920 925
Lys Leu Ile rhr Gln Arq Lys Phe ASp Asn Leu rhr Lys Ala Glu Arq 930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arq Gln Leu 945 950 955 960
Val Glu Thr Arq Gln Ile Thr Lys Bis Val Ala Gln Ile Leu Asp Ser 965 970 975
Arq Met Asn rhr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arq Glu Val 980 985 990
Lys val Ile rhr Leu Lys Ser Lys Leu Val Ser Asp Phe Arq Lys A 995 1000 1005
Phe Gln Phe ryr Lys Val Arq Glu Ile Asn Asn Tyr Bis His Ala 1010 1015 1020
Bis Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys 1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp t'yr Lys 1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile 1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr 1070 1015
Phe Phe Lys Thr Glu Ile Thr 1085 1090
Arq Pro Leu l1e Glu Thr A8n 1100 1105
A8p Lys Gly Arq Asp Phe Al. 1115 1120
Pro Gln Val Asn Ile Val Lys 1130 1135
Phe Ser Lys Glu Ser Ile Leu 1145 1150
ne Ala Arq Lya Lye Asp Trp
1160 1165
Asp Ser Pro Thr Val Ala Tyr 1175 1180
Glu Ly8 Gly Lys Ser Lys Lys 1190 1195
Gly He Thr I1e Met Glu Arg 1205 1210
Asp phe Leu Glu Ala Lys Gly 1220 1225
ne ne Lys Leu Pro Lys Tyr
1235 1240
Arq Lys Arq Met Leu Ala Ser
1250 1255
Glu Leu Ala Leu Pro Ser Lys 1265 1270
Ser His Tyr Glu Lys Leu Lys 1280 1285
Lys Gln Leu Phe Val Glu Gln 1295 1300
Phe Phe Tyr Ser Asn Ila Het Asn 1080
Leu Ala Asn Gly Glu Ile Arq Lya 1095
Gly Glu Thr Gly Glu l1e Val 'I'rp 1110
Thr Val Are¡ Lys Val Leu Ser Met 1125
Lys 'rhr GIu Val Gln Thr Gly Gly 1140
Pro Lye Arg Asn Ser Asp Lys Leu 1155
ASp Pro Lys Lys Tyr Gly Gly Phe 1170
Ser Val Leu Val Val Ala Ly6 Val 1185
Leu Lys Ser Val Lys Glu Leu Leu l200
Ser Ser Phe Glu Lys Asn Pro Ile 1215
Tyr Lys Glu Val Lys Lys Asp Leu 1230
Ser Leu Phe Glu Leu Glu Asn Gly 1245
Ala Gly Glu Leu Gln Lys Gly Asn 1260
Tyr Val Asn Phe Leu Tyr Leu A1a 1215
Gly Ser Pro Glu Aap Aan Glu Gln 1290
Bis Lys His Tyr Leu Asp Glu Ile 1305
Ile Glu Gln Ile Ser Glu Phe Ser Ly!1 Arg Val Ile Leu Ala Asp 1310 1315 1320
Al. Aan Leu Asp Lys Val Leu Ser Alu Tyr Asn Lys His Arg Asp 1325 1330 1335
Lys Pro Ila Are¡ GI u Gln Ala Glu Asn Ile IIa His Leu Pbe Thr 1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro A1a Ala Phe Lys Tyr Phe Asp Thr 1355 1360 1365
Thr Ile Asp Arg Lys Arq Tyr Thr 581:' Tbr Lya Glu Val Leu Asp 1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile 'lh):, Gly Leu Tyr Glu Thr Arq 1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Ala Ala Val Ser Lys 1400 1405 1410
Gly Glu Glu Leu Pbe Thr Gly Val val Pro Ile Leu Val Glu Leu 1415 1420 1425
Asp Gly Asp Val Asn Gly Ris Lys PhH Ser Val Ser Gly Glu Gly 1430 1435 1440
Glu Gly Asp Ala orbr Tyr Gly Lys Leu 'l'hr Leu Lys Phe Ile eys 1445 1450 1455
Thr Thr Gly Lye Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 1460 1465 1470
Leu Thr Tyr Gly Val Gln Cys Phe Sel:' Arq Tyr Pro Aap His Mat 1475 1480 1485
Lys Gln His Asp Phe Phe Lys Ser AJ.a Mat Pro Glu Gly Tyr Val 1490 1495 1500
Gln Glu Arq Thr Ile Phe Phe Lys Asp Asp Gly Aan Tyr Lys Thr 1'05 1510 1515
Arq Ala Glu Val Ly8 Phe Glu Gly Asp Thr Leu Val Aso ArO' 1le 1520 1525 1530
G1u Leu Lys Gly l1e Asp Phe Lye Glu Asp G1y Asn 11e Leu Gly
1535
1540 1545
Bis
Ly. 1550 Leu Glu Tyr Asn Tyr 1555 Asn Sar Bis Asn val 1560 Tyr I1e Met
Al. Asp 1565
Lys Gln Lys Asn Gly 1570 Ila Lys Val Asn Phe 1575 Lys I1e Arq
His Asn 1580
11a Glu Asp Gly Ser 1585 val Gln LeU Ala ASp 1590 Bis Tyr G1n
Gln Asn 1595
'l'hr Pro Ile Gly Asp 1600 Gly Pro Val Leu Leu 1605 Pro Asp Asn
Bis
'yr 1610 Leu Ser Thr Gln Ser 1615 Ala Leu Ser Lys ASp 1620 Pro Asn Glu
Lys Arq 1625
Asp Bis Het Val. Leu 1630 Leu Glu Phe Val Thr 1635 Ala Ala Gly
Ile Thr 1640
Leu Gly Met Asp Glu 1645 Leu 'l'yr Lys Lys Arq 1650 Pro Ala Ala
Thr Ly. 1655
Lys Ala Gly Gln Ala 1660 Lya Lys Lys Lys
5
<210> 46 <211> 1423 <212> PRT < 213> Secuencia Artificial
10
<220> < 221> fuente < 223> Inota=~Descripci ón de Secuencia Artificia l: Polipéptido si ntét i co~
<400> 46
Met ASp Tyr Lya Asp 8is Asp Gly Asp 'l~yr Lys Asp His ASp 11e ASp 1 5 1,0 15
Tyr Lys Aep Asp Asp Asp Lys Met AlOl P'ro Lye Lye Ly" Arq Lys Val 20 25 30
Gly Ile Mis Gly val Pro Ala Ala Asp ¡,ys Lys Tyr Ser 11e Gly Leu 35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp ~~a Val Ile Thr Asp Glu Tyr 50 55 ~
Lys VOll Pro Ser Lys Lys Phe Lys Val l~u Gly Asn Thr Aep Ar9 Hie
70 75 80
Ser lle Lys Lys Asn Leu I1e Gly Ala Leu Leu Phe Asp Ser Gly Glu 85 90 95
Tbr Ala Glu Ala Thr Arq Leu Lys Ar. 'thx: Ala Arq Arq Arq Tyr 1'hr 100 105 110
Arq Arq Lys Asn Arq rle Cys Tyr Leu Gln Slu Ile Phe Ser Asn Glu 115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe Hisl Ar9 Leu Glu Glu Ser Phe 130 135 140
Leu Val Glu Glu Asp Lyo Lys His Glu Ar9r His Pro I1e Phe Gly Asn 145 150 155 160
I1e Val Asp Glu val Ala Tyr Hie Glu Lys: Tyr Pro Thr Ile t'yr Bis 165 1701 175
Leu Arq Lys Lys Leu Val Asp Ser Tbr Asp Lys Ala Asp Leu Arq Leu 180 185 190
Ila Tyr Leu Ala Leu Ala His Met Ile Lyl!l: Phe Arq Gly ais Phe Leu 195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Se.I: Asp Val Asp Lys Lau Phe 210 215 220
rle Gln Leu Val Gln Thr Tyr Asn Gln Le\ll Ph. Glu Glu Asn Pro n. 225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala 11.. , Leu Ser Ala Arq Leu Ser 245 250 255
Lys Ser Arq Arq Leu Glu Asn Leu Ile Alal Gln Leu Pro Gly Glu Lys 260 265 270
Lye Asn Gly Leu Phe Gly Asn Leu Ila Ala, Leu Ser Leu Gly Leu Thr 215 280 285
Pro Asn Phe Lya Ser Aan phe Asp Leu Al~L Glu Asp A1a Lya Leu Gln 290 2'5 300
Len Ser Lys A8p Thr Tyr Asp A8p Asp Leu Asp Asn Leu Leu Ala Gln 305 310 315 320
Ile Gly Asp Gln Tyr A1a Asp Leu Phe Le\:! Ala Ala Lys Asn Leu Ser 325 330 335
Asp Ala Ile Lau Lau Ser Asp Ile Lau ~, Val Asn Thr G1u Ile Thr 340 345 350
Lys Ala Pro Leu Ser A1a Ser Met Ile Lyl!1 Argo Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu LeU Lys Ala Leu Val. Arg G1n Gln Leu Pro Glu
370 375 380
• y. 'l:yr Lys Glu Ile Phe Phe Asp Gln Sel: .y• Asn Gly Tyr A1a G1y 385 390 395 400
Tyr Ile Asp Gly Gly A1a Ser Gln Glu GI";I Phe Tyr Lya phe ne .y. 405 41(1 415
Pro Ile Leu G1u Lys Met Aep Gly Thr Gl";l Glu Leu Leu Va1 Lys Leu 420 425 430
Asn Arg Glu Asp Leu Leu Arq Lys Gln Ar~, Thr Phe Asp Asn Gly Ser 435 440 445
Ile Pro 8is Gln Ile Bis Leu Gly Glu Le";1 8is A1a Ile Leu Arq Arq
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Aap Asn Arq Glu Lys Ile G1u 465 470 475 480
Lys Ile LeU Thr Phe Arq Ile pro Tyr Tyl: val Gly Pro Leu A1. Arq 485 490 495
Gly Asn Ser Arq Phe A1a Trp Met Thr ~, Lys Ser Glu Glu Thr Ile 500 505 510
Thr Pro Trp Asn Phe Glu Glu va1 val Asp Lys Gly "a Ser Ala Gln 515 520 525
Ser Phe Ile Glu Argo Met '1'hr Asn Phe Asp Lys Asn Leu Pro Asn Glu 530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyl: Glu Tyr Phe Thr Val Tyr 545 550 555 560
Asn Glu Leu Thr .ya Val Lys Tyr Val Thr Glu Gly Met Arq .ya Pro 565 57C1 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala lla Val Asp Leu Leu Phe S80 S8S 590
Lys Thr Aan Arq Lys Va1 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe 595 600 605
Lys Lys lla Glu eye Phe Asp Ser Val Glu lla Ser Gly Val Glu Asp 610 615 620
Arq Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys lle n.
6.25 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu 645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp ArO Glu Met lle Glu 660 665 670
Glu Arq Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys 675 680 685
Gln Leu Lys ArO ArO Arq Tyr 'l'hr Gly Trp Gly ArO Leu Ser Arq Lys 690 695 700
Leu Ile Asn Gly Ile Arq Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp 70S 710 715 720
Phe Leu Lys Ser Aap Gly Phe Ala Asn ArO Asn Phe Met Gln Leu lle 725 730 735
Bis ASp Asp Ser Leu Thr Phe Lys Glu Asp tle Gln Lys Ala Gln Val 740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu Bis Lle Ala Asn Leu Ala Gly 755 '60 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Va1 Asp 770 775 780
Glu Leu Val Lys Val Met Gly Arq His Lys Pro Glu Asn Ile Val ne 785 790 795 800
Glu Mot Ala Arg GIu Asn GIn Thr Thr G1n Lys G1y GIn Lys Asn Ser 805 810 815
Arg Glu Arq Met Lys Arq Ile Glu Glu Gly Ile Lye Glu Leu Gly Ser 820 '25 830
Gl.n Il.e Leu Lys Gl.u His Pro val Gl.u ASn Thr Gl.n Leu Gl.n Asn Glu 835 840 845
Lya Leu Tyr Leu Tyr Tyr Leu Gl.n Asn Gly Arq Asp Met Tyr Val Asp 850 855 860
Gln Glu Leu Aap Ile A.n Arq Leu Ser Asp Tyr Asp Val Asp Bis Ue 865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Aap Ser Ile Asp Asn Lys Val Leu 885 890 .95
Thr Arq Ser Aap Lys Asn Arq Gly Ly8 Ser Asp Asn Val Pro Ser Glu 900 905 910
Glu val Val Lys Lys Met Lys Asn Tyr Trp Arq Gln Leu Leu Asn Ala 915 920 925
Lys Leu 11e Thr Gln Arq Lys Phe Asp Asn Leu Thr Lys Al.a Glu Arq 930 935 940
Gly Gly Leu Ser Glu Leu Asp Lya Ala Gly Ph. Ile Lys Arq Gln Leu 945 950 955 960
Val Glu Thr Arq Gln Ile Thr Lys Bis Val Ala Gln 11. Leu Asp Ser 965 970 975
Arq Met Aso Thr Ly5 Tyr Asp Glu Asn A4p Lye Leu Ile Arq Glu Val 980 9.5 990
Lys Val Ile Thr Leu Lys Ser LyS Leu Y-al Ser Asp Phe Arq Lys Aap 995 1000 1005
Phe Gln Phe Tyr Lys Val Arq Glu Ile Asn Asn Tyr Bis Bis Ala 1010 1015 1020
Bis Aap Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys 1025 1030 103!i
Lys Tyr Pro Lys Leu Glu Ser Glu Phe val Tyr Gly Asp Tyr Lys 1040 1045 lOSO
Val Tyr Asp Yal Arq Lys Met Ile Ala Lys Ser Glu Gln Glu 11e 1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser ASn Ile Met Asn
1070 1075 1080
Ph. Phe Lys Thr Glu Ile Thr Lau Alél Asn Gly Glu :Ue Arg Lys 1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Tbr Gly Glu tle Val Trp 1100 1105 1110
Asp Lys Gly Arq Asp Phe Ala Thr Val Arq Lys val Leu Ser Meto 1115 1120 1125
Pro Gln Val Asn Ile Val Lys Ly s ThJ: Glu Val Gln Thr Gly Gly 1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lyfl Arq Asn Ser Asp Lys Leu 1145 1150 1155
Ile Ala ArQ Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe 1160 1165 1170
Asp Ser Pro Thr val Ala Tyr Ser Val Leu Val Val A1e Lys Val 1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Ly!1 Ser Val Lys Glu Leu Leu 1190 1195 1200
Gly Ile Thr Ile Meto Glu Arq Ser Sel: Phe Glu Lys Asn Pro Ila 1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Ly~1 Glu Val Lys Lys Asp Leu 1220 1225 1230
u. Ile Lyo Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Aon Gly 1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala GI~r Glu Leu Gln Lys Gly Aso 1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys 7yr Val. Asn Phe Leu Tyr Leu Ala 1265 1270 1275
Ser Bis Tyr Glu Lys Leu Lys Gly Se%~ Pro Glu Asp Asn Clu Gln 1280 1285 1290
Lys Gln Leu pha Val Glu Gln His Lyfl Hia Tyr Leu Asp Glu Ile 1295 1300 1305
ne Glu 1310
Gln I1e Ser Glu Ph. 1315 Ser Lys Arg Val ne 1320 Leu Ala Asp
Al. Asn 1325
Leu ASp Lys Val Leu 1330 Ser Ala Tyr Asn Lys 1335 Bis Arq Asp
LyS
Pro 1340 Ile Arg Glu Gln Ala 1345 Glu Asn Ile Ile Bis 1350 Leu Phe Thr
Leu
Thr 1355 Asn Leu Gly Ala Pro 1360 Ala Ala Phe Lys Tyr 1365 Phe Asp Thr
Thr
ne 1370 Asp Arq Lys Arg Tyr 1375 Thr Ser Thr Lys Glu 13 80 val Leu Asp
Al. Thr 1385
Leu Ile Bis Gln Ser 1390 Ile Thr Gly Leu Tyr 1395 Glu Thr Arq
n. Asp 1400
Leu Ser Gln Lau Gly 1405 Gly Asp Lys Arq Pro 1410 Al.a Ala Thr
Lys
Lys 1415 Ala Gly Gln AJ.a Lys 1420 Lys Lys Lys
5
<210> 47 <211>483 <212> PRT < 213> Secuencia Artificial
10
<220> < 221> fuente < 223> Inota=~Descripci ón de Secuencia Artificial" Polipéptido si ntético~
<400> 47
Het Phe Leu Phe Leu Se~ Leu Th~ Se~ Phe Leu Ser Ser Ser Arq Thr 1 5 ID 15
Leu Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe 20 25 30
Met Arq Phe Lys Val Bis Met Glu Gly Ser Val Asn Gly His Glu Phe 35 40 45
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr 50 55 60
~a Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe ~a Trp ASp 65 70 75 80
I~ __~mn ~S~~.~_~_~
~ H e
Pro Ala Asp Ile Pro Asp Tyr Leu Lys lAU Ser Phe Pro Glu Gly Phe 100 105 110
Lys Trp Glu Arq Val Met Aso Phe Glu J.~p Gly Gly Val Val Thr Val 115 120 125
Thr Gln Asp Ser Ser Leu Gln Aap Gly 01u Phe na Tyr Lys val Lys 130 135 140
Leu Arq Gly Thr Asn Phe Pro Ser Asp c:ay Pro Val !<!et Gln Lys Lys 145 150 155 UO
Thr Met Gly Trp Glu A1a Ser Ser Glu I~q Met Tyr Pro Glu Asp Gly 165 1.1'0 175
Ala Leu Lys Gly Glu Ile Lys Gln Arg l~u Lys Leu Lys Asp Gly Gly lBO lB5 190
Mis Tyr A8p Ala Glu val Lys Thr Thr 1~r Lys Ala Lys Lys Pro val 195 200 205
Gln Leu Pro Gly Al.a Tyr Aso Val Aso 1:1e Lys Leu Asp Ile Thr Ser 210 215 220
His Aso Glu Asp Tyr Thr Ile vOl1 Glu Gln Tyr Glu ArO Ala Glu Gly 225 230 235 240
Arg His Ser Thr Gly Gly Met Asp Glu ]~u Tyr Lys Gly Ser Lys Gln 245 ~!50 255
Leu Glu Glu Leu Leu Ser Thr Ser Phe }~SP Ile Gln Phe Aao Asp Leu 260 265 270
Thr Leu Leu Glu Thr A1a Phe Thr Nis ,~h:r: Se :r: Ty:r: lia Asn Glu Hi. 275 280 285
Arg Leu Leu Asn Val Ser His Asn Glu }~q Leu Glu Phe Leu Gly Asp 290 295 300
Ala Val Leu Gln Leu Ile Ila Ser Glu '~yr Leu Phe Al.a Lys Tyr Pro 305 310 315 320
Lys Lys Thr Glu Gly Asp Met Ser Lys l~u Arg Ser Met Ile Val Arg 325 330 335
Glu Glu Ser Leu Ala Gly Phe Ser Arq Phe Cys Ser Phe Asp Ala Tyr 340 345 350
11e Lys Leu Gly Lys Gly Glu Glu Lys Ser Gly Gly Arq Arq Arq ASp 355 360 365
Thr Ile Leu Gly Asp Leu Phe Glu Ala Phe Leu Gly ~a Leu Leu Leu
370 375 380
ASp Lys Gly Ile Asp Ala val Arq Arq Phe Leu Lys Gln val Met Ile 385 390 395 400
Pro Gln Val Glu Lys Gly Asn Phe Glu Arq Val Lys Asp Tyr Lys Thr 405 410 415
Cys Leu Gln Glu Phe Leu G1n Thr Lys Gly Aep Val ~a Ile Asp Tyr 420 425 430
Gln Val Ile Ser Glu Lys Gly Pro Ala Mis Ala Lye Gln Phe Glu Val
435 440 445
Ser Ile Val Val ABn Gly Ala Val LeU Ser Lys Gly Leu Gly Lys Ser 450 455 460
Lys Lys Leu Ala Glu Gln Aap Ala Ala Lys Asn Ala Leu Ala Gln Leu
465 470 475 480
Ser Glu val
<210> 48 <211>483
<212> PRT 5 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Polipéptido sintético~
<400> 48
Met Lys Gln Leu Glu Glu Leu Leu Ser Thr Ser Phe Asp Ile Gln Phe 1 5 10 15
Asn Asp Leu Thr Leu Leu Glu Thr Ala Pha Thr His Thr Ser Tyr Ala 20 25 3D
Asn Glu Bis Arq Leu Leu Asn Val Ser His Asn Glu Arq Leu Glu Phe 35 40 45
Leu Gly Asp Ala Val Leu Gln Leu Ile Ile Ser Glu 'I:yr Leu Phe Ala 50 55 60
Lys '1'yr Pro Lys Lys Thr Glu Gly Asp Het 1~er Lys Leu Arq Ser Net. 65 70 '15 80
Ile Val Are¡ Glu Glu Ser Lau Ala Gly Phfil Sfilr Arq Phe Cys Ser Phe 85 90 95
ASp Ala Tyr Ile Lys Leu Gly Lys Gly Glu I;lu Lys Ser Gly Gly Are¡ 100 105 110
Arg A.rq Asp Thr Ile Leu Gly Asp Leu Phe l:;lu Ala Phe Leu Gly Ala 115 120 125
Leu Leu Leu Asp Lys Gly Ile Aap Ala. Val Ju-g Arg Phe Leu Lys Gln 130 135 140
val Met Ile Pro Gln Val Glu Lys Gly Asn l?he Glu Are¡ Val Lys Asp 145 150 155 160
Tyr Lys Thr Cys Leu Gln Glu Phe Leu Gln ~rhr Lys Gly Asp Val Ala
165 170 175
Ile Asp Tyr Gln Val Ila Ser Glu Lys Gly l?ro Al.a. 8is Al.a Lys Gln 180 185 190
Phe Glu Val Ser Ile Val Val Asn Gly Ala Val Leu Ser Lys Gly Leu 195 200 205
Gly Lys Sar Lys Lys Leu Ala Glu Gln Asp JUa Ala Lys Asn Ala Leu 210 215 220
Ala Gln Leu Ser Glu Val Gly Ser Val Ser Lys Gly G1u Glu Asp Asn 225 230 :~35 240
Met Ala Ile 11e Lys Glu Phe Mét Are¡ Phe Lys val His Met Glu Gly 245 250 255
Ser val ASR Gly Bis Glu Phe Glu Ile Glu I;ly Glu Gly Glu Gly Are¡ 260 265 270
Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu lt.ys Val Thr Lys Gly Gly 275 280 285
Pro Leu Pro Phe Ala 'I'rp Asp Ile Leu Ser ][)ro Gln Phe Met. 'l'yr Gly 2'0 2'5 300
Ser Lys ~a Tyr Val Lys Bis Pro Ala Asp Ile Pro Asp Tyr Leu Lys 305 310 315 320
Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arq Val Met Asn Phe Glu 325 330 335
ASp Gly Gly val Val Thr Val Thr Gln Asp Ser Ser Leu Gln Asp Gly 340 345 350
Glu Phe :J:le Tyr Lys Val Lys Leu Arg Gly Thr Asn Phe Pro Ser Asp 355 360 365
Gly Pro Val Het Gln Lys Lys Thr Het Gly Trp Glu Ala Ser Ser Glu 370 375 380
Arq Met Tyr Pro Glu Asp Gly Ala Leu Lys Gly Glu Ile Lys Gln Arq 385 390 395 400
Leu Lys Leu Lys Asp Gly Gly Bis Tyr Asp Ala Glu Val Lys Thr Thr 405 410 415
Tyr Lys Ala Lys Lys Pro Val Gln Leu Pro Gly Ala Tyr Asn Val Asn 420 425 430
Ile Lys Leu Asp Ile Thr Ser Ris Asn Glu Asp Tyr Thr Ile Val Glu 435 440 445
Gln Tyr Glu Arq A1a Glu Gly Arg Ris Ser Thr Gly Gly Met Asp Glu 450 455 460
Leu Tyr Lys Lys Arq Pro ~a A1a Thr Lys Lys Ala Gly Gln A1a Lys 465 470 415 480
Lys Lys Lys
<210> 49
<21 1> 1423
<212> PRT 5 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Polipéptido sintético~
<400> 49 Het Asp Tyr Lys Asp Bis Asp Gly Asp Tyr Lys Asp Bis Asp Ile Asp
1 5 10 15 10
Tyr Lys Asp Asp Asp Asp Lys Het Al.a Pro Lys Lys Lys Arg Lye Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu 35 40 45
Al.a U. Gly Tbr Asn Ser Val Gly Trp Ala Val Ue Tbr Asp Glu Tyr 50 55 60
Lys Val Pro Ser Lys Lys Pbe Lys Val Leu Gly Asn Tbr Asp Arg His 65 70 15 80
Ser Ile Lys Lys Asn Leu Ile Gly ~a Leu Leu Pbe Asp Ser Gly Glu 85 90 95
Tbr Ala Glu Ala Thr Arg Leu Lys Arg Tbr Ala Arg Arg Are¡ Tyr Thr 100 105 110
Arg-Are¡ Lys Asn Arg Ile eye Tyr Leu Gln Glu Ile Phe Ser Asn Glu 115 120 125
Met Ala Lys val Asp As p Ser Phe Pbe His Arg Leu Glu Glu Ser Phe 130 135 140
Leu Val Glu Glu Asp Lys Lys Bis Glu Are¡ Bis Pro Ile Phe Gly Asn 145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Tbr Ile Tyr Bis 165 170 175
Leu Arg Lys Lys Leu val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Aloa His Met Ile Lys Phe Are¡ Gly His Phe Leu 195 200 205
Ue .lu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe 210 215 220
Ila Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Uo 225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Uo Leu Ser ~a Are¡ Leu Ser 245 250 255
Lys Sar Arq Arq Leu Glu Asn Leu Ile Ala aln Leu Pro Gly Glu Lys
260 265
Lya Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr 275 280 285
Pro Asn Phe Lys Ser Asn Phe As? Leu ~a Glu Asp Ala Lys Leu Gln
2.0 2.5 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln 30S 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser 325 330 335
ASp Ala Ile Leu Leu Ser Asp Ile Leu Ar9 Val Asn Thr Giu Ile Thr 340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ila Lys Arq Tyr Asp Glu 8is His 355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arq Gln Gln Leu Pro Glu 310 315 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly 385 3.0 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln GIu Glu Phe Tyr Lys Phe Ile Lya 405 410 415
Pro Ile Leu Glu Lys Mat Asp Gly Thr Glu Glu Leu Leu Val Lys Leu 420 425 430
Asn Arq Glu Asp Leu Leu Arg Lys Gln Arq Thr Phe Asp Asn Gly Ser 435 440 445
Ile Pro His Gln Ile Bis Leu Gly GIu Leu His Ala Ile Leu Arq ArO' 450 455 460
Gln GIu Asp Phe Tyr Pro Leu Lys Asp Asn Arg Glu Lys Ile Glu
.,0 Phe
465 415 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr val Gly Pro Leu Ala Arg 485 495
4'.
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile 500 505 510
Thr Pro Trp Asn Phe Glu Glu val Val Asp Lys Gly Ala Ser Ala Gln 515 5.20 525
Ser Phe Ile Glu Arq Met Thr Aan Phe Asp Lye Asn Leu Pro Asn Glu 530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr 545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr G1u Gly Met Arq Lys Pro 565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe 580 585 590
Lys Thr Asn Arq Lys val Thr Val Lye Gln Leu Lys Glu Asp Tyr Phe 595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp 610 615 620
ArO Phe Asn Ala Ser Leu Gly Thr Tyr His ABp Leu Leu Lye Ile Ile 625 630 635 640
Lys Asp Lys Asp Phe Leu ASp Asn Glu Glu Asn Glu Asp Ile Leu Glu 645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arq Glu Met Ile Glu 660 665 670
Glu Arq Leu Lys Thr Tyr ~a Hia Leu Phe Asp Asp Lys Val Met Ly& 675 680 685
G1n Leu Lys Arq Arq Arq Tyr Thr Gly Trp Gly Arq Leu Ser Arq Lys 690 695 700
Leu Ile Asn G1y Ile Arq Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp 705 710 715 720
Phe Leu Lys Ser Asp Gly Phe A1a Asn Arq Asn Phe Met Gln Leu !le 725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys A1a Gln Val 740 745 750
Ser Gly Gln G1y Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly 755 160 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val A$p 770 775 180
Glu Lau val Lya Val Met Gly Arq Bis Lys Pro Glu Aan Ile Val Ile 185 790 795 800
Glu Met Ala Arq Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 805 S10 815
Arq GIu Arq Met Lys Arq I~e Glu Glu Gly Ile Lys GIu Leu Gly Ser 820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Lau Gln Asn Glu 835 840 845
Lys Lau Tyr Leu Tyr Tyr Leu GIn Asn Gly Arg Aep Met Tyr Val Asp 850 855 860
Gln Glu Lau Asp Ile Asn Arq Lau Ser Asp Tyr Asp Val Asp His Ile 865 870 875 aao
Val Pro Gln Ser Phe Lau Lys Asp Asp Ser Ile Asp Asn Lys Val Leu 885 890 895
thr Arq Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu 900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arq Gln Lau Lau Asn Ala 915 920 925
Lys Lau Ile Thr Gln ArO Lys Phe Asp Asn Leu Thr Lys Ala Glu Arq 930 935 940
Gly Gly lAu Ser Glu Lau Asp Lys Ala Gly Phe 11e Lys Arg Gln Leu 945 950 955 960
Val Glu Thr Arq GIn Ile Thr Lys Bis Val Ala Gln Ile Lau Asp Ser 965 970 975
Arq Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Lau Ile Arg Gla Val 980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Lau Val Ser Asp Phe Arq Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arq Glu Ile Asn Asn Tyr Bis His Ala 1010 1015 1020
His Asp Ala Tyr .Leu Asn Al. Val Val G1y Thr Ala Leu I1e Lys 1025 1030 1035
Lys Tyr Pro Lya Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys 1040 1045 lOSO
Val Tyr Asp Val Arq Lys Met Ile Ala Lys Ser Glu Gln Glu Ila 1055 1060 1065
Gly Lya Al.a Thr Al.a Lys Tyr Phe Phe Tyr Ser Asn Il.e Met. Asn 1070 1075 10aO
Phe Phe Lys Thr G1u Il.e Thr Leu Ala. Asn Gly Glu Ile Arq Lys
l.085 1090 l.095 Arq Pro Leu Ila Glu Thr Asn Gly Glu Thr Gly Glu Ila Val Trp 1100 1105 1110 Asp Lya Gl.y Arq Asp Phe Ala Thr Val Arq Lys Val Leu Ser Het 1115 1120 1125 Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1130 1135 1140 Phe Ser Lys G1u Ser Ile Leu Pro Lys Arq Asn Ser Asp Lys Leu 1145 1150 1155 Ile Ala Arq Lys Lys Asp Trp Asp Pro Lys Lys Tyr G1y G1y Phe 1160 1165 1170 Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val. Val Al.a Lys Val. 1175 1180 1185 Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val. Lys Glu Leu Leu
1190 1195 1200 Gly Ile Tbr r1e Met Glu Arq Ser Ser Phe Glu Ly. A.I!In Pro rla
120.5 1210 1215 Asp Phe Leu Glu Ala Lys Gly Tyr Lys Gl.u Val Lys Lys Asp Leu 1220 1225 1230 11e Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Gl.u Asn Gly
1235 1240 1245 Arg Lys Arq Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
G1u Leu 1265
Ser His 1280
Lys G1n 1295
ne G1u 1310
A1a Asn 1325
Lys Pro 1340
Leu Thr 1355
Thr n. 1310
Ah Thr 1385
n. Asp 1400
Lys LyS 1415
<210> 50
<211 > 2012
< 212> ADN
Ala Leu Pro Ser
Tyr Glu Lys Leu
Leu Phe Val Glu
Gln Ile Ser Glu
Leu Asp Lys Val
Ile Arq Glu Gln
Asn Leu Gly Ala
Asp ArQ Lys Arq
Leu 11a His Gln
Leu Ser Gln Leu
Ala G1y Gln Ala.
Lys 1210
Lys 1285
G1n 1300
Phe 1315
Leu 1330
A1. 1345
Pro 1360
Tyr 1375
Ser 1390
G1y 1405
Lys 1420
1260 Tyr Val Asn Phe Leu 1215 Gly Ser Pro Glu Asp 12 90 His Lys His Tyr Leu 1305 Ser Lys ArQ Val n. 1320 Se r Ala Tyr Asn Lys 1335 Glu Asn Ile Ile His 1350 Ala Ala Phe Lys Tyr 1365 Thr Ser Thr Lys G1u 1380 Ile Thr Gly Leu Tyr 1395 Gly Asp Lys Arq Pro 1410 Lys Lys Lys
Tyr Leu Ala
A$n Glu Gln
Aep Glu Ile
Leu Ala Asp
His Arq .Asp
Leu Phe Thr
Phe Asp Thr
Val Leu Asp
Glu Thr Arq
Ala Ala Thr
< 213> Secuencia Artificial 10 <220>
<
221 > fuente
<
223> Inota=~Descripción de Secuencia Artificia l: Polinucleótido sintético"
<400> 50
qaatqctqcc ctcaqacccg cttcctccct gtccttqtct qtccaaoqaq aatqaqqtct 60 cactqqtqqa tttcqqacta ccetqaqqaq ctqqcacetq aqqqaeaaqq ecccccaoct 120 qeceagetee aqcctctqat qaqqqgtqqg agagaqetae atqaqqttqc taaqaaaqcc 180
tcccctgaaq gaqaccacac aqtqtqtgaq qttg'gagtct ctagcagcgq qttctqtqcc 240 cceagqgata gtetggetgt eeagqeactg etct,tgatat aaaeaeeaee teetagttat 300 qaaaccatqc ccattctqcc tctctgtatg gaaa,agagca tgqqqctgqc ccgtgqqgtg 360 gtgtecactt taqqcectgt ggq&qatcat qooa,acccac qcagtOQgtc ataq9ctctc 420 teatttacta etcacatcca ctctqtgaa('jJ aagc'gattat gatctctcct etagaaactc 480 gtagilgtcec atgtctgccq qettccaqaq cctg'cactcc tccaccttqq cttqqetttq 540 etgggQ'ctaq aqqagctagg atgcacagca qctc:tqtgac cctttgtttg aqaqqaacaq 600 qaaaaccaec cttctctctq qcccactqtq tcctcttcct qccetgccat ccccttetgt 660 qaatgttaga eccatqgqaq cagctqqtca gagg'qqaecc cqqcctgqqq cccetaaccc 720 tatgtaqeet eagtcttcee ateaqgctct eagc:teagcc tqagtgttga ggccecaqtg 7.0 qctgctctgg qqgcctcctq agtttctcat ctqt,qccect ccctccctqq cccaqqtgaa .40 qqtqt_tc caqaaccqqa qqacaaaqta caaa,cgqcaq aaqctqgagq aggaaqqqcc 900 tgagtccgag cagaagaaga agggctccca tcac.atcaac cqgtggcqca ttqccacgaa 960 qeaggccaat qgqqaqqaca tcqatgtcac ctcc:aatgac aaqcttqcta qcqqtqqgca 1020 accaeaaacc cacgagggca gagtqctqct tgctgctqqc cagqcccctq cqtqqqccca 1080 aqctqgactc tqqccactcc ctqqccaggc tttg:qqqaqq cctqqagtca tqgccccaca 1140 gqqcttqaaq cccgqqqccq ccattgacaq aqqgracaaqc aatqqgctqg ctqaqqcctg 1200 qgaccacttq qccttctcct cgO'aqagcct qcct,gcctqg gcqqqcccqc ccgccaceqc 1260 aqectcccaq ctgctctccq tqtctccaat ctcc:cttttq ttttgatqca tttctqtttt 1320 aatttatttt ccaqqcacca ctqtagttta qtga,tcccca qtgtccccct tccctatgqg 1380 aataataaaa gtctetctct taatqacacq qgca,tccaqc tccagcccca qaqcctqggg 1440 t.gqtaqattc cqqctct.qaq qqccaqt.qqq O'octqqtaqa qcaaacqcqt tcaO'qqcctq 1500 ggaqcctqgg qtgqqqtact gqtqgagqgg qtca.aq9Qta attcattaac tcctctcttt 1560 tqtt.qqggqa ccctqc¡tctc tacetccaqc tcca.caqcaq qaqaaacaqq ctagacatag 1620 qqaagggcca tcctqt:atct tgaqqgaqqa caqq'cccaqq tctttcttaa eqtattqaqa 1680 qqtqggaatc agqcccaqgt aqttcaatgg gaga,gqgaga qtqcttccct ctgcctagaq 1740 actctgqtqq cttctccaqt tqaqqagaa. ccaq'aqqaaa qqggaqqatt qqggtctggq 1800 Qqag9gaaca ccattcacaa agqctqacqq ttcc,aqteeg aaqtcqtqqq cccaccagqa 1860 tgctcacctq tccttgqaqa accqetqgqc aqqttgagac tgcagaqaca qqgcttaaqq 1920 ctgagcctgc aaccaqtccc caqt.qactca 99qc,ctcctc aqcccaaqaa aga9caaeqt 1980 qccaqqqccc qctqaqctct tqtqttcacc tq 2012
<210> S1
<211> 1153
<212> PRT
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=MDescripción de secuencia artificial: polipéptido sintéticoM
<400> S1
Met Lys Arq Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1 5 10 15
Lys Ser Aap Leu Val Leu Gly Leu Asp 11e Gly Ile Gly Ser Val Gly 20 25 30
V~l Gly Ile Leu Asn Lys Val Thr Gly Glu Ile Ile Bis Lys Asn Ser 35 40 45
Arg Ile Phe Pro Ala Ala Gln Ala Glu Asn Asn Leu Val Arq Arq orhr 50 55 ~
Asn Arg Gln Gly Arq Arg Leu Ala Arg Arg Lys Lys Bis Arg Arq Val 65 70 75 80
Arg Leu Asn Arg Leu Phe Glu Glu Ser Gly Leu 11. Thr Asp Phe orhr S5 90 n
Lys Ile Ser Ile Asn Leu Asn Pro Tyr Gln Leu Arq Val Lys Gly Leu 100 105 110
Thr Asp Glu Leu Ser Asn Glu Glu Leu Phe Ile Ala Leu Lys Asn Met 115 120 125
Val Lys Uis Arq Gly Ile Ser Tyr Leu Asp Asp Ala Ser Asp Asp Gly 130 135 140
Aan Ser Ser Val Gly Asp Tyr Ala Gln Ile Val Lys Glu A3n Ser Lys 145 150 155 160
Gln Leu Glu Thr Lys Thr Pro Gly Gln Ile Gln Leu Glu Arq Tyr Gln 165 1"70 175
Thr Tyr Gly Gln Leu Arq Gly Asp Phe Thr Val Glu Lys Asp Gly Lys 180 185 190
Ly8 His Arq Leu Ile Asn Val phe Pro Tbr Ser Ala Tyr Arq Ser Glu 195 200 205
Ile Leu Thr Arq Leu Gly Lys Gln Lye Thr Thr Ser Ser Ser Asn Ly. 465 470 475 4S0
Thr Lys Tyr Ile Asp Glu Ly. Leu Leu Thr Glu Glu Ile Tyr Asn Pro 485 490 495
Val Val Ala Lys Ser Val Arq Gln Ala 11. Lys Ile Val Asn Ala Ala 500 505 510
Ile Lys Glu Tyr Gly Asp Phe Asp Asn Ile Val 118 Glu Met Ala Arq 515 520 525
Glu Thr Asn Glu ASp Asp Glu Lys Lys Ala Ile Gln Lys Ile Gln Lye 530 535 540
Ala Asn Lys Asp Glu Lys Asp Ala Ala Met Leu Lys Ala Ala Asn Gln 545 550 555 560
Tyr Asn Gly Lys Ala Glu Leu Pro Bis Ser Val Phe His Gly His Lys 565 570 575
Gln Leu Ala Thr Lye Ile Arq Leu Trp Kis Gln GIn Gly GIu Arq Cys
580 585 590
Leu Tyr Thr Gly Lys Thr Ile Ser Ile His Asp Leu Ile Asn Asn Ser 595 600 605
Asn Gln Phe Glu Val Asp His lle Leu Pro Le:u Ser Ile Tbr Phe Asp 610 615 620
Aap Ser Leu Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn GIn GIu 625 630 635 640
Lys Gly Gln Arq Thr Pro Tyr Gln Ala Leu Asp Ser Mat Asp Asp Ala 645 650 655
Trp Ser Phe Arq Glu Lau Ly8 Ala Phe Val Arq Glu Ser Lys Thr Leu 660 665 670
Ser Asn Lys Lys Lys Glu Tyr Leu Leu Thr Glu Glu Asp Ile Ser Lys 675 680 685
Phe Asp Val Arq Lys Lye Phe Ile Glu Arq Asn Leu Val Asp Thr Arq 690 695 700
Tyr Ala Ser Arq Val Val Leu Asn Ala Leu Gln Glu His Phe Arq Ala
70S 710 715
His Lys Ile Asp rhr Lys val Ser val Val Arq G1y Gln Phe Thr Ser
725 '730 135
Gln Leu Arq Arq His Trp Gly Ile Glu :[.ys Thr Arq ASp Thr Tyr His 740 745 750
His His Ala Val ASp Ala Leu Ile l1e JUa Ala Ser Ser Gln Leu Asn 755 760 765
Leu Trp Lys Lys Gln Lys Asn Thr Leu 1~al Ser Tyr Ser Glu Asp GIn 710 715 780
Leu Leu Asp I1e Glu Thr G1y Glu Leu :Ue Ser Asp Asp Glu Tyr Lys 785 790 795 900
Glu Ser Val Phe Lys Ala Pro Tyr GIn l~i8 Phe Val Asp Thr Leu Lys 805 ~lO 815
Ser Lys Glu Phe Glu Asp Ser Ile Leu l~he Ser Tyr Gln Val Asp Ser 820 825 830
Lys Phe Asn Arq Lys l1e Ser Asp Ala 'rhr I1e Tyr Ala Thr Arg Gln 835 840 845
Ala Lys Val Gly Lys Asp Lys ~a Asp t~lu Thr Tyr Val Leu Gly Lys 850 855 860
Ile Lys Asp I1e Tyr Thr Gln Asp G1y 'ryr Asp Ala Phe Met Lys Ila 865 870 875 880
Tyr LyS Lys ASp Lys Ser Lys Phe Leu l:>Iet Tyr Arq His Asp Pro GIn
885 :890 895
Thr Phe Glu Lys Val Ile Glu Pro Ile :Leu Glu Asn Tyr Pro Asn Lys 900 905 910
Gln Ile Asn Glu Lys Gly Lys Glu Val IEtro Cys Asn Pro Phe Leu Lys 915 920 925
Tyr Lys Glu Glu Bis Gly Tyr Ile Arq :Lys ryr Ser Lys Lys Gly Asn 930 935 940
Gly Pro Glu Ile Lys Ser Leu Lys Tyr 'ryr ASp Ser Lys Leu Gly Asn 945 950 955 960
Hi8 Ile Asp Ile Thr Pro Lye Aep Ser Asn Asn Lys Val Val Leu Gln 965 970 975
Ser Val Ser Pro Trp Arq ~a Asp Val Tyr Phe As n Lys Thr Thr Gly 980 985 990
Lys Tyr Glu Ile Leu Gly Leu Lys Tyr Ala Asp Leu Gln Phe Glu Lya 995 1000 1005
Gly Thr Gly Th r Tyr Lys Ile Ser Gln Glu Lys Tyr Asn Asp Ile 1010 1015 1020
Lys Lys Lys Glu Gly Val Asp Se r Asp Ser Glu Phe Lys Phe Thr 1025 1030 1035
I.eu Tyr Lys Asn Asp Leu Leu Leu Val Lys Asp Thr Glu Thr Lys 1040 1045 1050
G1u G1n G1n Leu Phe Arq Phe Leu Ser Arq Thr Met Pro Lys Gln 1055 1060 1065
Lys His Tyr Val Glu Leu Lys Pro Tyr Asp LyS Gln Ly& Phe Glu 1070 1075 1080
Gly Gly Glu Al.a Leu Ile Lys Val Leu Gly Asn Val Ala Asn Ser 1085 1090 1095
Gly Gln Cys Lys Lys Gly Leu Gly Lys Ser As n Ile Ser Ile Tyr 1100 1105 1110
Lys Val Argo Thr Asp va l Leu Gly Asn Gln His Ile Ile Lys Asn 1115 1120 1125
Glu Gly Asp Lys Pro Lys Leu Asp Phe Lys Arq Pro Ala Ala Thr 1130 1135 1140
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1145 1150
<210> 52
<211> 340
<212>ADN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial Polinucleótido sinlélico~
<400> 52 qaqqqcctat
ttcccatqat t ccttcatat ttqcatatac qatacaaqqc t.qttaqa9aq 60
ataat.tggaa ttaatttgac tgtaaaca.ca aaqatattaq tacaaa.atac qtqacqtaqa
120
aaqtaataat ttcttqqqta qtttgcaqtt ttaaaattat qttttaaaat qqactatcat
180
atqcttaccq taacttqaaa qtatttcqat ttcttqgctt tat atatct t
qtgqaaaqga 2.0
cqaaacaccq ttacttaaat cttqcaqaaq ctacaaaqat aaqqcttcat qccqaaatca
300
acaccctgtc attttatqqc aqgqtgtttt cgttatttaa
340
5
<210> 53 <211>360 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota="DescripciÓfl de Secuencia Artificial: Polinucleótido sintético"
10
<220> < 221 > base modificada < 222> (288) ..(317) < 223> a, c, t, g, Desconocido u otro
<400> 53 gafJ0'9cctat
ttcccatqat tccttcatat ttqcatatac qatacaaqge tqttaqaqaq 60
a.ta.attqqaa ttaatttqac tqtaaacaca aaqatattaq tacaaaatae qtqacqt.aga
120
aaqtaataat ttctt.gqqta qtttqcaqtt. t.taaaattat qttttaaaat qgactatcat
180
atqcttaccg taacttgaaa qtatttcgat ttcttggctt tatatatctt qtgqaaagqa
2.0
cqaaacaccq qqttttaqaq ctatqctgtt ttgaa.tqgtc
ccaaaacnnn nnnnnnnnnn 300
15
nnnnnnnnnn nnnnnnnqtt ttaqaqctat getqttttqa atqqt.cccaa aacttttttt 360
<210> 54 < 211> 318 < 212> ADN < 213> Secuencia Artificial
20
<220> < 221 > fuente < 223> Inota="Descripci6n de Secuencia Artificial: Polinucleótido sintético·
25
<220> < 221> base modificada < 222> (250) .. (269) < 223> a, c, t, g, Desconocido u otro
<400> 54 gaqqqcctat ttcceatqat tccttcatat ttqcatatac oatacaaq;c tgttagagaq
60
ataattqqaa ttaatttqac tqtaaacaca aaqatattaq t acaaaatac
qtqacqtaoa 120
129
aaqtaataat ttcttgqqta qtttqcaqtt
ttaaaattat qttttaaaat qqactatcat 180
atqcttaccq taacttqaaa qtatttcqat ttcttqqctt tatatatctt otqqaaaqqa
240
c qaaacaccn
nnnnnnnnnn nnnnnnnnoq ttttaqaqc t agaaatagea agtt aaaata 300
aqqctaqtce qttttttt
318
5
<2 10> 55 <211>325 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuenle < 223> Inola=-Oescripci6n de Secuencia Artificial: Polinucle6lido s¡ntélico~
10
<220> < 221> base modificada < 222> (250) ..(269) < 223> a, c, 1, g, Desconocido u olro
<400> 55 qaqqgeetat
ttcceatqat tccttcatat ttqeatatac qatacaaqqe tqttaqaqaq 60
ataattqqaa
ttaatttqae tgtaaacaca aaqatattaq tacaaa ata e qtqacqtag& 120
aaqtaataat
ttcttqqqta qtttqcaqtt ttaaaattat qttttaaaat qqactatcat 180
at.qctt.ac cq
taacttqaaa qtatttcgat ttcttqqctt tatatatctt qt9qaaaqqa 2.0
cqaaacaecn
nnno.nnnnnn nnnnnnnnnq t.ttta qagct agaaataqca aqttaaaat.a 300
aqqctaqtcc
gttatcattt ttttt 325
15
<210> 56 <211> 337 < 212> AON < 213> Secuencia Artificial
20
<220> < 221> fuenle < 223> Inota=-Oescripciórl de Secuencia Artificial: Polinucle6lido s¡nlélico~
25
<220> < 221> base modificada < 222> (250) ..(269) < 223> a, c, l. g, Desconocido u olro
<400> 56
qaqqqcctat ttc:c:catqat tccttcatat ttqcatatae oatacaagqc tgttaqagaq 60 at&&ttogaa tta&tttgac tqta&acaca aagatattag tacaaaatac qtqacqtaqa 120 aaqtaataat ttcttqgqta qtttgcagtt ttaaaattat qttttaaaat ggactatcat. 1.0 atqcttaccq taacttqaaa qtatttcgat ttctt9gctt tatatatc:tt gtggaaaqqa 240 cqaaacaccn nnnnnnnnnn nnnnnnnnnq ttttagaqct aqaaataqca agttaaaata 300 aggctaqtcc qttatcaact tqaaaaaqt:q ttttttt 337
<210> 57 <21 1>352 5 < 212> ADN
< 213> Secuencia Artificial
<220>
< 221> fuente
< 223> Inota="Oescripci6n de Secuencia Artificial: Polinucle6tido sintético·
10 <220>
< 221> base modificada
< 222> (250) .. (269)
< 223> a, c, t, g, Desconocido u otro
<400> 57
gagqgcctat ttcccatqat tccttc8tat ttge &t&tao gatac&aq9c tgttaqaqaq 60 ataattqqa8 tt8attt98e tqtaaacaca aaqatattaq tacaa.aatae qt.qaeqtaga 120 aaotaataat ttcttqqqta qtttgcagtt ttaaaattat qttttaaaat qgactatcat '.0 &t90ttaecg taaettgaaa gtatttcqat ttcttgqctt t8tat&tctt qtqqaaaqqa 240 cqaaacaccn nnnnnnnnnn nnnnnnnnnq ttttaqagct aqaaa.taqca aqttaaaata 300 aggctaqtce qttatcaact tgaaaaaqtq qcac:cqagtc: qqtgcttttt tt 352 15
<210> 58
< 21 1> 5101
< 212> AON
< 213> Secuencia Artificial
20 <220>
< 221 > fuente
< 223> Inota="Descripción de Secuencia Artificial: Polinucle6tido sintético· <400> 58
c:qttac:ataa cttacgqtaa atggcccgcc tggctgaccg cccaacqacc cccgcccatt 60 gacqtc:aata atgacgtatg ttcccatagt aacgccaata qqgactttcc attqacqtca 120 atqqqtqgag tatttacqgt aaactgccca cttqqc:aqta catcaaqtqt atc:atatgc:c: 180 aaqtac:gccc cctattqacq tcaatgacgq taaatqqccc qcctgqcatt atqc:c:caqta 2.0 catqacctta tqqqactttc ctacttqqca qtacatctac qtattaqtca tcqctattac 300 catqgtcgag qtgaqcccca cgttctgctt cac:tc:tcccc atctcccccc cctccccacc 360 cccaatttt.g tat.t.tattt.a t.tttt.taatt attttgtgca gcgatqgggq c9Q9g99999 .20 ggqq.qggcgc qcqccaqqcq q.qgcqqqqcq qgqcoaqQ09' cgqQgcqqQq cQaqqcqqaq .80
aqgtqcggcg gcagccaatc &gaqcggcgc qctccqaa.aq tttcctttta tqgcqaqqcq 5.0 qCCiJqcqgcc¡q cc¡c¡ccctata aaaaqc:qaaq cgcc¡cqqcqq CiJcCiJCiJqaqtcq ctqcqacqct 600 qc:c:ttcqccc cqtqccccgc: tcc:gc:c:qcc:q ccteqcqccq cc::c:gc:cccgq ctc::tqactqa 660 ccqcqttact cccacagqtg agcgqqcqqq aeqqcccttc tcctccqqqc tgtaattagc 720 tgagcaagag gtaaqgqttt aaqgqatqqt tgqttqqt.gg qqtattaatq tttaattacc 7'0 tgqaqcacct qcctqaaatc actttttttc agqttt;Jqacc qqtgccacca tqgactataa 840 ggaccacqac qqaqactaca agqat catqa tattg;"ttac aaagacgatq acqataaqat 900 ggccccaaaq aaqaaqeqqa aqqtcgqtat ccacql;Jaqtc ccagcaqccq acaaqaaqta 960 caqcatcqqc ctgqacatcq gcaccaactc tqtqqqctqq gccqtqatca ccqacqaqta 1020 caaqgtqc:c:c agcaaqaaat tcaaqqtqct qCiJqc:a;acacc gaccqgcaea qcatcaaqaa 1080 qaacc::tqatc qqaqccctqc tgttcgacaq cgqcqaaaca CiJccqaCiJqcca cccqqctqaa 1140 qaqaaccqcc aqaaqaaqat acaccagacq qaaqaaccqq atctqctatc tqcaaqagat 1200 cttcaqcaac qagatqqcca agqtqqacqa c:aqc:ttcttc cacaqactqq aagaqtcctt 1260 eetqqtqqaa gaqqataaga ageacgagcq qcaceceate ttcqqcaaca tcqtqqacga 1320 qqtqqcetac cacqaqaaqt accccaccat ctaccacctq agaaaqaaac tqqtqqaeaq 1380 caccqacaaq gccgacctgc qqctgatcta tctqgccctq qcceaeatqa tc:aaqttccg 1440 qqqccacttc ctgatcgagg qcqacctqaa ccccq."caac aqcqacqtgg acaaqctgtt 1500 catccagctq qtgcaqacct acaaccaqct qttcgaggaa aaccccatca acO'ccaqcgq 1560 cqtc¡gacgcc aaqqccatcc tqtctqccag actga';Jcaaq agcagacqqc tggaaaatct 1620 qatcgcccag ctgcccgqcq aqaaqaaqaa tqqcc't:qttc qqcaacctqa ttqccctqaq 1680 cctqqqcctq acccccaact teaagagcaa cttcqacctg gccqaqgatq ccaaactgca 1740 c¡ctgagcaaq qacacctacq acqacgacct qgacaacctq ctq9cccaga tcggcgacca 1800 qtacqccqac ctgtttct99 ccqccaaqaa cctqtccqac 9ccatcctqc tqagcqacat 1960 ec.tgaqaqtg aacaccqaqa tca.ccaagqc ccccctqaqc qc.ctctatqa tcaagagata 1920 cgacqaqcac caccaqgacc tgaccctqct qaaagctctc Qt.qcqqcaqc agctqcctqa 1980 qaaqtacaaa qagattttct tcgaccagag caagaacqgc tacqccc¡qct acattqacqq 2040 cqCiJac¡ccagc caqqaaQaqt tctacaaqtt catca..aqcec atcctgqaaa aqatqgacqq 2100 caccqaqqaa ctqctcqtga &qctgaacaq aqaqgacctq ctqcqgaagc aqcggacctt 2160 cgacaacqqc aqcatccccc accaqatcca cctqqqagaq ctgcacgcca ttctqcqgcq 2220 qcaqgaaqat ttttacCCat tcctQaaqga caaccqqqaa aagatcqaqa aqatcctqac 2280 cttccqC:Atc: ccctActacq tqq9ccctct qqcca.qqqqa Aaeaqcaqat tcqcctqqat 2340 gaccaqaaaq aqcqagqaaa ccatcaeccc ctgqaacttc qaIJIJaaQtIJO tlJlJ&caalJlJg 2400 cgcttccqce calJaqcttca tcqagcgqat qaceaaette qataaqaacc tqceeaacga 2460 c¡aac¡qtc¡ctq cccaaqcaca qcctqctqta. cqa.9tacttc accCJt.qtata acc¡aqetqac 2520 caaaqtqaaa tacqtqaceq agqqaatgaq aaac¡cceqcc ttcctqac¡cc¡ gcqaliJcaliJaa 2580 aaaqgccat c qtqqacct qe tgttcaaqac caaecqqaaa gtqaccqtqa aqcagctqaa 2640 agagqactae ttcaagaaaa tcgagtqctt cqact:ccqtg qaaatetccq qeqtggaaga 2700 teggtteaac gccteectqq qeaeataeca cgatc:tqctg aaaattatca aqgacaaqqa 2760 cttcctqqac aat9a99aaa acgaqqacat tctq9aaqat atcgtqct9a ccctqacact 2820 qtttgaqgilc ilqaqaqatqa tcqaggaacg qctgllaaacc tatqcccac:c tqttcqaega 2880 eaaagtgatg aagcaqctg& aqcqqcggag ataCi:lccggc tqqqgcagge tqaqccggaa 2940 gctqatc:aac qqcatecggq acaagcaqtc cggCi:laqaca atcctggatt tcctgaagtc 3000 cqaeq9cttc gceaacaqaa acttcatgca qctgutecac qacgacaqc:c tliJac:ctttaa 3060 agaqgacatc: cagaaagccc aggtgtccqq ccaqgqcgat agcctgcaC:1iJ aqcaeattqe 3120 caatctqqcc ggcagccccg ccattaagaa qqge.ateetg cagacaqtga aggtqqtqqa 3180 eqac¡ctcqtg aaaqtqatqq qccqgcaca& qcccuagaac atcqtqatcg aaatggccaq 3240 agaqaaccaq aeeac:cc:aqa agqqacagaa gaacuqccqc gagagaatqa aqcqqatcqa 3300 aqaqqgcatc aaagagetgg gcagccaqat cc:tguaagaa cacccc:gtqq aaaaeaeeca 3360 gctgcagaac gagugctqt acctqt.aeta cetq<:agaat qqqc9'ggata tgtaegtgga 3420 ccaggaaetg gacatcaacc qqctqtcc9a ctaC~Jatqtq qaccatatcq tgcctcagag 3480 ctttctgaaq gacgactcca tegacaacaa 9qt.q<;tgacc aqallqcqac:a aqaaecq999 3540 c&aqagcqac aacqtgccct ccqaaqagqt cqtqi:laqaag atqaagaact actgqcliJqC& 3600 gctqctgaae qccaaqctga ttacccagaq aaaqt:tcqac &a.tctga.cca a.qqcegagaq 3660 &gqcqg:cctq agcqaactgg ataaqqccqq cttcntcaaq aqac:agctqg tqqaaacccq 3720 qcaqatc.ea aagcacqtqg c:acaqatcet qgacteccqq atqaaeaeta aqtaeqacq& 3780 gaatgaeaaq ctgatccqgg aaqtgaaaqt qatcnccctq aaqtccaage tqqt.qtc:cga 3840 tttce9gaa.9 gatttecagt tttaeaaaqt qcqcqagatc aacaactacc accacgeeca 3900 cqacqcctac ctqaacqccq tcqtqqgaac cgecctqate aaaaagtacc ct.aagctgga 3960 aagcqaqttc qtqtacqqcg actacaagqt. qtacqacqt.g eggaagatga tegecaagag 4020 C949c499aa atc9Qce.aqq ctaccqccaa qte.c1;tcttc tacaqcaaca tcatqaactt 4080 t.ttcaaqacc qaqattaccc tqqccaacqq cgaqlltccqq aagcggcctc tgatcg&qac 4140 aaaeqgcqaa accq9qQaqa tcqtgtqqqa taag"l;lqccq9 gattttqcea ccqtqcqqaa 4200 agtgctgagc atqccccaag tqaatatcqt gaaallagacc qaqgtqcaqa eaggcqgctt 4260
caqeaaagag tctatcctqc ccaagaqgaa caqcqataaq ctqatcqcca qaaaqaaqga 4320 ctgqqaccct aaqaaqtacq qcqgcttcga cagccccacc qtqqcctatt ctqtgctgqt 4380 qqtoqccaaa 9tqqaaaaqq qcaaqtccaa qaaactqaaq aqtqtqaaaq aQctqctq9Q 4440 qatcaccatc atc;rqaaagaa gce-qcttcga qaagaatccc atcqactttc tggaagccaa 4500 gqgctacaaa qe-aqtgaaaa aggacctgat catcaaqctg ccte-aqtact ccctgttcga 4560 gctqgae-ae-c 9qcC9qaaga qaatgctqqc ctctqccqqc gaactqcaqa aqgqaaacga 4620 actqgccctg ccctccaaat atqtgaactt cctqtacctq gccaqccact atqaqaaqct 4680 qaagqqctcc cccqagqata atqagcaqaa acagctqttt qt:ggaacagc acaagcacta 41 40 cetqqaeqaq atcatcqaqc agatcaqcqa qttctccaaq aqaqtqatcc tgqccqacqc 4800 taatctqqac •••qtgctqt ccqcctacaa caaqcac cgg gataaqccca tcaqaqagca 4860 qqccqaqaat atcatccacc tgtttaccct qaccaatctq qoaqcccctg ccgccttcaa 4920 qtactttgac accaccatcq accgqaagag qtacaccagc accaaaqaqq tqctggacqc 4980 caccctqatc caccaqagca tcaccgqcct qtacqaqaca cqqatcqacc tqtctcaqct 5040 qqgaqgcgac tttctttttc ttaqcttgac caqctttctt aqtaqcaqca qqacqcttta 5100 • 5101
<210> 59
<21 1> 137 5 < 212> ADN
< 213> Secuencia Artificial
<220>
< 221> fuente
< 223> Inota=~Descripci6n de Secuencia Artificial: Polinucle6tido sintético"
10 <220>
< 221> base modificada
< 222> (1 )..(20)
< 223> a, c, 1, g, Desconocido u otro
<400> 59
nnnnnnnnnn nnnnnnnnnn qtttttqtac tctcaaqatt taqaaataaa tcttgcagaa 60 9cta.caaaqa taaggcttca tgccqaaatc aacaccctqt cattttatqq caq9qtqt.tt 120 tcqttattta atttttt 137 15
<210> 60
<21 1> 123 <; 212> ADN
< 213> Secuencia Artificial
20 <220>
< 221> fuente
< 223> Inota=~Descripci6n de Secuencia Artificial: Polinucle6tido sintético"
<220> < 221 > base modificada < 222> (1) .. (20) < 223> a, c, 1, g, Desconocido u otro
5
<400> 60 nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaqaaat qcaqaaqcta caaaqataaq 60
gcttcatqcc qaaatcaaca ccctgtcatt ttatqqcagq qtqttttcqt tatttaattt
120
ttt
123
10
<210> 61 <211> 110 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota="OescripciÓfl de Secuencia Artificial: Polinucle6tido sintético·
15
<220> < 221> base modificada < 222> (1) .. (20) < 223> a, c, t, g, Desconocido u otro
<400> 61 nnnnnnnnnn
nnnnnnnnnn gtttttgtac tctcaqaaat qcaqaaqcta eaaaqataaq 60
qcttcatqcc gaaatcaaca ccctqtcatt ttatqqcaqq qtqttttttt
Il0
20
<210> 62 <21 1> 137 < 212> ADN < 213> Secuencia Artificial
25
<220> < 221> fuente < 223> Inota="Oescripci6n de Secuencia Artificial: Polinucle6tido sintético·
30
<220> < 221 > base modificada < 222> (1) .. (20) < 223> a, c, t, g, Desconocido u otro
<400> 62 nnnnnnnnnn
nnnnnnnnnn qttattqtac tctcaaqatt taqaaataaa tcttgcaqaa 60
gctacaaaqa taaqqcttca tgecgaaatc aacaecctqt cattttatg9 caggqtgttt
120
tcqttattta atttttt
137
35
<210> 63 <21 1> 123 <212>AON < 213> Secuencia Artificial
136
<220> < 221> fuen te < 223> Inola=~Descripci6n de Secuencia Artificial: Polinucle6tido sinlético~
5
<220> < 221> base modificada < 222> (1) ..(20) < 223> a, c, 1, g, Desconocido u otro
<400> 63 nnnnnnnnnn
nnnnnnnnnn qttattqtac tctcaqaaat gcagaa9cta caaaq.taaq 60
qottcatqcc qaaatcaaca ccctqtcatt ttatqqoagg qtqttttcqt tatttaattt
120
ttt
123
10
<210> 64 <21 1>1 10 < 212> ADN < 213> Secuencia Artificial
15
<220> < 221 > fuen te < 223> Inola="Descripci6n de Secuencia Artificial: Polinucle6tido sinlético~
20
<220> < 221> base modificada < 222> (1) .. (20) < 223> a, c, 1, g, Desconocido u otro
<400> 64 nnnnnnnnnn
nnnnnnnnnn qttattqtac tctcaqaaat qcagaagcta caaaqataaq 60
gcttcatgcc gaaatcaaca ccctgtcatt ttat9qcaqq gtgttttttt
110
25
<210> 65 <21 1>137 <212>ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota="Descripci6n de Secuencia Artificial: Polinucle6lido sinlélico~
30
<220> < 221> base modificada < 222> (1) .. (20) < 223> a, c, 1, g, Desconocido u otro
<400> 65 nnnnnnnnnn
nnnnnnnnnn gttattgtac tctcaagatt tagaaataaa tcttqcagaa 60
qctaeaatga taaggcttca tqccgaaatc aacaccctgt cattttatgg cagggtqttt
120
tcqttattta atttttt
137
35
<210> 66 <21 1>123
< 212> AON < 213> Secuencia Artificial
5
<220> < 221 > fuente < 223> Inota=~Oescripci6n de Secuencia Artificial : Polinucle6tido sintético ..
<220> < 221> base modificada < 222> (1) ..(20) < 223> a, c, t, g, Desconocido u otro
10
<400>66 nnnnnnnnnn nnnnnnnnnn qttattgtac tctcagaaat qcaoaagcta eaatgataag 60
qcttcatqcc q_aatcaaea ecctgtcatt ttatQ9caqq qtgttttcqt tatttaattt
120
ttt
<210> 67
<21 1> 110
< 212> ADN 15 < 213> Secuencia Artificial
<220>
<221> fuente
< 223> Inota=~Oescripci6n de Secuencia Artificial : Polinucle6tido sintético ..
<220> 20 < 221> base modificada
<222> (1) ..(20)
<223> a, c, 1, g, Desconocido u otro
<400>67 nnnnnnnnnn nnnnnnnnnn gttattgtae tetcaqaaat qcaqaaqct a
qcttcatqcc qaaateaaea ecctgtcatt ttatqqcaqq qtqttttttt
25 <210>68
<
211 > 107
<
212> AON
< 213> Secuencia Artificial
<220> 30 < 221> fuente
< 223> Inota=~Oescripci6n de Secuencia Artificial : Polinucle6tido sintético ..
<220>
<221> base modificada
<222> (1) .. (20) 35 < 223> a, e, 1, g, Desconocido u otro
<400> 68
caatqataaq 60 110
nnnnnnnnnn
nnnnnnnnnn
gttttagaqc tqtqqaaaca c&qcqaqtta aaataaqqct 60
taqtecgtac tcaacttqaa aaggtqqeac cqattegqtg ttttttt
107
138
<210> 69
< 211> 4263
< 212> ADN 5 < 213> Secuencia Artificial
<220>
< 221> fuente
< 223> Inota=MDescripción de Secuencia Artificial: Polinucle6tido sintético"
<400> 69
atqaaaaqqc cqqeqqccac qaaaaaqgcc qqceaggeaa aaaaQaaaaa Q'aeeaaqccc 60 tacaqcatcq qcctqqacat cqqcaccaat aqcgtqqqct qqqccqtgac caccqacaac 120 tacaaqgtgc ccaqcaaqaa aatq-aaggtq ctqgqcaaca cctccaagaa gtacatcaaq 180 aaaaacctqc tqgqcgtqct gctgttcgac aqcqqcatta cagccqagqq cagacqgctg 240 aagagaaccq ccaqacggcq qtacacccqq cqqagaaaca gaatcctqta tctqcaaqaq 300 atcttcaqca ccqaqatqgc taccctgqac gacgccttct tccaqcqgct qgacgacaqc 360 ttcctgqtgc ccgacgacaa gcqggacagc aaqtacccca tcttcqgcaa cctggtqqaa 420 gagaaqgcct accacqacga qttccccacc atctaccacc tgaqaaagta cctgqccgac 480 aqcaccaaqa aqqccqacct qaqactqqtq tatctqqccc tqqcccacat qatcaaqtac 540 cgqqqccact tcctgatcqa qqqcgaqttc aacaqcaaga acaacqacat ccagaagaac 600 ttccaqqact tcctggacac ctacaacqcc atcttcqaqa qcqac::ctqtc cctqqaaaac 660 agcaagcaqc tqgaaqaqat cqtqaaggac aagatcagca aqctgqaaaa gaaqqaccqc 720 atcctgaaqc tgttccccqq cgagaagaac agcggaatct tcaqcqaqtt tctqaaqctg 780 atcqtgqgca accaggccqa cttc8qaaag tgcttcaacc tgqacqagaa aqccaqcctq 840 cacttcaqea aaqagageta cqac.qaqqac ctqgaaaccc tqctqgqata tatcqqeqac 900 qactacaqcq acqtqttcct gaagqccaaq aagctgtacq acgctatcct qctgaqcqqc 960 ttcctgaccq tgaccg8caa cqaqacagaq qccccactga gcaqcqccat gattaagcqq 1020 taca.acgaqc acaaaqaqqa tctqqctctq ctqaaaqaQt acatccggaa catcaqcctq lOBO aaaacctaca atgagqtgtt caaqqacqac accaagaacg qctacqcC99 ctacatcqac 1140 qqcaagacca Bccaqqaaga tttctatgtg tacctgaaga aqctgctgqc cgaqttcgag 1200
qqgqccgact actttctqqa aaaaatcqac cqcqaqqatt tcctgcqqaa gcagcqqacc 1260 ttcgacaacq qcaqcatccc ctaccaqatc catctqcaqg aaatqcqgqc catcctqqac 1320 aaqcagqcca aqttctaccc attcctgqcc aaqaacaaag agcgqatcqa qaagatcctq 1380 accttccqca tcccttacta cqtqqqcccc ctqqccaqag qcaacagcga ttttqcctgg 1440 tccatccqqa agcgcaatqa qaaqatcacc ccctqqaact tcgaqgacqt gatcqacaaa 1500 qaqtccaqcq ccqaggcctt catcaaccqg atgaccaqct tcgacctgta cctgcccgaq 1560 gaaaagqtgc tqcccaaqca caqcctgctq tacqaqacat tcaatgtgta taacqaqctg 1620 accaaagtgc qgtttatcqc cqaqtctatq cqqqactacc aqttcctqqa ctccaaqcaq 1680 aaaaillqqaca tcqtgcqqct qtacttcaaq gacaagcgga aaqtqaccqa taaqqacatc 1740 atcqagtacc tqcacqccat ctacqqctac qatqqcatcg agctgaaqqg catcqagaag 1800 cagttcaact ccaqcctgag cacataccac gacctqctga acattatcaa cgacaaagaa 1860 tttctqqacq actccaqcaa cgagqccatc atcgaagaqa tcatccacac cctqaccatc 1920 t.t.tgaqqacc gcgagatgat caaqcaqcgq ctgaqcaaqt tcgagaacat cttcgacaaq 1980 agcgtqctga aaaaqctgaq caqacgqcac tacaccqqct ggqqcaaqct gagcqccaaq 2040 ctgatcaacq gcatccqqqa cqaqaaqtcc qqcaacacaa tcctgqacta cctqatcqac 2100 qacqqcatca qcaaccggaa cttcatqcag ctgatccacg acqa c<¡ccct. gagcttcaaq 2160 aagaagatcc aqaaqqccca qatcatcqgq qacqaqqaca aqqqcaacat caaaqaaqtc 2220 qtqaaqteec tqeecqqcaq eeccqecatc aaqaaqgqaa tcctgcagag catcaaqatc 2280 qtgqacqagc tcqt.qaaaqt. gatqqqcqgc agaaaqcccq agagcatcqt. gqtqqaaatg 2340 qctaqaqaga aceaqtacac caatcaqqgc aaqagcaaca gccagcaqaq actqaagaga 2400 ct.ggaaaagt ccctgaaaqa gctgqqca<¡c aaqattctqa aagagaatat ccctqccaag 2460 ctqtccaaga tcqacaacaa cqccctqcaq aacqaccqqc tgtacctgta ctacctqcaq 2520 aatgqcaag<¡ acatqtatac aggcgacgac ctgqatatcq accqcctgag caactacgac 2580 atcgaccata ttatccccca ggccttcctg aaaqacaaca gcattgacaa caaagtgctg 2640 qtgtcctccq ccaqcaaccg cgqcaaqtcc qatqatqtgc ccaqcctqga aqtcgtqaaa 2700 aaqaqaaaqa ccttctqqta tcaqctqctg aaaaqcaaQ'c tgattaqcca gaqqaaqttc 2760 <¡acaacctqa ccaa9Q'ccqa qaqaqgcqqc ctqagccctq aaqataaggc cqgcttcatc 2820 caqagacaqc tqqt.qqaaa.c cCQ'qcaQ'atc accaaqcacq tggccagact qctqqatgag 2880 aaqtttaaca acaaqaagqa cgaqaacaac cgqQ'ccqt.<¡c qqaccqtqaa qatcatcacc 2940 ct<¡aaqtcca ccctqgtgtc ccaqttccgq aaggacttcg aqctgtataa aqt.<¡cqcqaq 3000 atcaatgact ttcaccacqe ccacgacqcc tacctgaatq ccgtqqtCJO'c ttccqccctq 3060 ctqaaqaaqt accctaagct gqaacccqaq ttcqtgtacg gcgactaccc caaqtacaac 3120 140
tccttcaqaq aqcgqaagtc cgccaccgag aaqqtgtact tctact ccaa catcatgaat 3180 atctttaaga agtccatctc cctqqccqat qqcaqagtga tcgagcqgcc cctgatcqaa 3240 qtgaacqaaq agacaggcqa gagcgtgtqg aacaaagaaa gcgacctgqc caccgtqcgq 3300 cgggtqctga qttatcctca aqtgaatgtc qtqaagaagq tqqaagaaca qaaccacggc 3360 ctggatcqgg gcaaqcccaa qgqcctqttc aac"lccaacc tgtccaqcaa qcctaagccc 3420 aactccaacg aqaatctcqt qqqggccaaa gaqtacctgg accctaagaa gtacggcgga 3480 tacgecqqea tctceaataq ctteaecqt.g etcgtqaagq gcacaatcqa gaa"lgqcqct 3540 aagaaaaaga tcacaaaeqt qctgqaattt eaqqqgatct ctat.cctqqa ccq"latcaac 3600 taccqqaaqq ataaqctgaa ctttctqctg qaaaaaqgct acaaqqacat tgagctgatt 3660 atcgaqctqc ctaagtactc cctgttcgaa ctqagcgacg gctccagacg gatgctqqcc 3720 tccatcctgt ccaccaacaa caaqeqgqqe qaqatecaea aqqoaaaeca gatcttcctg 3780 aqccaqaaat ttqtqaaact qctgtaccac qccaaqcgga tctccaacac catcaatgag 3840 aaccacegqa aatacqtgga aaaccacaaQ aaaqaqtttq aqqaactgtt ctactacatc 3900 ctqoaqttca acqagaacta tqtqqgagcc aagaagaacg gcaaactqct gaactccgcc 3960 ttccaqaqct qqcaqaacca caqcatcqac qaqctqtqca qctccttcat cqgccctacc 4020 ggcagcgagc qqaaqqqact qtttqagctq acctccaQag qctctgccqc cqactttgaq 4080 ttcctqqqag tqaaqatccc ccqqt.acaqa qactacaccc cctctaqtct gctqaaqqac 4140 qccaccctqa tccaccaqaq cqtgaccc¡qc ctqtacqaaa ccc9gatcqa cctggctaaq 4200 ctqqqcqaqq qaaaqcqtcc tgctqctact aaqaaaqctc¡ qtcaac¡ctaa qaaaaaqaaa 4260 taa 4263
<210> 70 5 <211> 84
< 212> ADN
< 213> Secuencia Artificial
<220>
< 221> fuente 10 < 223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético"
<400> 70
gqaaccattc ataacaqcat agcaagttat aataa9gcta qtccqttatc aacttgaaaa 60 aqtgqcaccq aqtcc¡otc¡ct tttt 94
<210> 71 <211>36
< 212> AON < 213> Secuencia Artificial
5
<220> < 221> fuente < 223> Inota=~Oescripci6n de Secuencia Artificial : Oligonucle6tido sintético~
<400> 71 gtlatagagc tatgctgtla tgaatggtcc caaaac
36
10
<210> 72 <211> 84 <212>AON < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Oescripci 6n de Secuencia Artificial: Oligonucle6tido sintético"
'5
<400> 72 99aaec attc aat aeageat agcaaqttaa tataa99cta qtccqttatc a acttgaaaa 60
aqtqgcaccq aqtcqqtgct tttt
84
20
<2 10> 73 <211 >36 < 212> AON < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota="Oescripci6n de Secuencia Artificial : Oligonucle6ticlo sintético"
25
<400> 73 gtatlagagc tatgclgtat tgaatggtcc caaaac 36
<210> 74 <21 1>103 < 212> AON < 213> Secuencia Artificial
30
<220> < 221> fuente < 223> Inota="Oescripci6n de Secuencia ArtifICial : Polinucleótido sintético"
35
<220> < 221> base modificada < 222> (1) .. (20) < 223> a, c, 1, g, Oesconocido u otro
<400> 74 nnnnnnnnnn
nnnnnnnnnn gttttagaqc tagaaatagc aaqttaaaat aaqqctagtc 60
cqttatcaac ttgaaaaagt ggcaecgagt cgqtgctttt
ttt 103
40
<210> 75 <211> 103 < 212> AON < 213> Secuencia Artificial
'42
<220> < 221 > fuente < 223> Inola=~Descripci6n de Secuencia Artificial : Polinucle6tido sinlético~
5
<220> < 221> base modificada < 222> (1) " (20) < 223> a, c, 1, g, Desconocido u otro
<400> 75 nnnnnnnnnn
nnnnnnnnnn qtattaqaqc taga aataqc aaqt~aat.t aaggctaqtc 60
cqttatcaac ttgaaaaagt 9qcaccgagt cqgtqctttt ttt
103
10
<210> 76 <211 > 123 < 212> ADN < 213> Secuencia Artificial
15
<220> < 221> fuenle < 223> Inota="DesCfipciÓfl de Secuencia Artificial: Polinucle6tido sinlético~
20
<220> < 221> base modificada < 222> (1) " (20) < 223> a, c, 1, g, Desconocido u otro
<400> 76 nnnnnnnnnn
nnnnnnnnnn qttttaqaqc tatqctqttt tooaaacaaa acaqcataqc 60
:laqttaaaat aaqqctaqtc cqttatcaac ttqaaaaaqt 9qcaccqaqt cqqtqctttt
120
ttt
123
25
<210> 77 <211 > 123 <212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota="DesCfipciÓfl de Secuencia Artificial : Polinucle6tido sinlético~
30
<220> < 221> base modificada < 222> (1) " (20) < 223> a, c, 1, g, Desconocido u otro
35
<400> 77
aaqttaatat aaqqctagtc cgttatcaac ttqaaaaaqt oqcaccqaqt cgqtqctttt
120
ttt
123
nnnnnnnnnn
nnnnnnnnnn
qtattaqagc tatqctqtat tgqaaaca at acagcatagc 60
40
<210> 78 <211>20
<
212> ADN
<
213> Horno sapiens
<400> 78 gtcacctcca atgactaggg 20
5 <210> 79
<211> 984
<212> PRT
< 213> Campylobacter jejuni
<400> 79
Met Ala Arq Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp 1 5 10 15
Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp eys Gly Val Arq Ile Phe 20 25 30
Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arq 35 40 45
Arq Lau Ala Arg Ser Ala Arq Lys Arq Leu Ala Arq Arq Lys Ala Arq 50 55 60
Lau Aan His Lau Lys His Lau Ile Ala Asn Glu Phe Lys Leu Asn Tyr 65 70 75 60
Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly 85 90 95
Ser Lau Ile Ser Pro Tyr Glu Lau Arq Phe Arq Ala Lau Asn Glu Leu 100 105 110
Lau Ser Lys Gln Asp Phe Ala Arq Val Ile Lau His Ile Ala Lys Arq 115 120 125
Arq Gly Tyr Asp Asp 11e LY8 Asn Ser Asp Asp Lys Glu Lys Gly Ala 130 135 140
Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Lau Ala Asn Tyr Gln 145 150 155 160
Ser Val Gly Glu Tyr Lau Tyr Lys Glu Tyr phQ G1n Lys Phe Lys Glu 165 170 175
Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu 180 185 190
Arg eye Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe 195 200 205
Lys Lys Gln Arq Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu 210 215 220
Glu Val Leu Ser Val ~a Phe Tyr Lys Arq Ala Leu Lys Asp Phe Ser 225 230 235 240
His Leu Val Gly Asn eye Ser Phe Phe Thr Asp G1u Lys Arg Ala Pro 245 250 255
Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile 260 265 270
Asn Leu Leu Asn Asn Leu Lys Aso Thr Glu Gly Ile Leu Tyr Thr Lys 275 280 285
Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu 290 295 300
Thr Tyr Ly. Gln Thr Lya Lys Leu Leu Gly Leu Ser Asp Aap Tyr Glu 305 310 315 320
Phe Lya Gly Glu Lys Gly Thr Tyr Pha Ila Glu Pha Lys Lys Tyr Lys 325 330 335
Glu Phe Ile Lys Ala Leu Gly Glu Bis Asn Leu Ser Glo Asp Asp Leu 340 345 350
Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu 355 360 365
Lys Lys Ala Léu Ala Lys Tyr Asp Leu Asn Glo Aso Gln Ile Asp Ser 370 375 380
Leu Ser Lys Leu Glu Phe Lys Asp Bis Leu Aso Ile Ser Pha Lys Ala 385 390 395 400
Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu 405 410 415
Ala eye Asn Glu Leu Asn Leu Lys Val Ala Ila Asn Glu Asp Lys Lys 420 425 430
Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr
435 440 445
Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn 450 455 460
Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys 118 Asn Ile Glu Leu
465 470 475 480
Ala Arg Glu val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys 485 490 495
Glu Gln ~n Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu eys 500 505 510
Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys ABn Ile Leu Lys Leu Arq 515 520 525
Leu Phe Lys Glu Gln Lys Glu Phe eys Ala Tyr Ser Gly Glu Lys Ile 530 535 540
Lys Ile Ser Asp Leu Gln Asp Glu Lys Mat Leu Glu Ile Asp Hia Ile 545 550 555 560
Tyr Pro Tyr Ser Arq Ser Phe ASp Asp Ser Tyr Met Asn Lys Val Leu 565 570 515
Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu 580 585 590
Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala 595 600 605
Lys Asn Leu Pro Thr Lys Lys Gln LyS ArO Ile Leu Asp Lys Aso Tyr 610 615 620
Lys ASp Lys Glu Gln Lys Asn Phe Lys Asp Arq Asn Leu Asn Asp Thr 625 630 635 640
Arg Tyr Ile Ala Arg Leu Val Leu Aso Tyr Thr Lys Asp Tyr Leu Asp 645 650 655
Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln 660 665 670
Lys Gly Ser Lys val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser
675 680 685
Ala Leu Ar9 Mis
Thr Trp Gly Phe Ser ~a Lys Asp Arq Asn Asn His
690
695 700
Leu
Bis His Ala Ile Asp Ala val Ile l1a Ala Tyr Ala Asn Asn Ser
705
710 715 720
Ile val Lys Ala Phe
Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser
725
730 135
Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys 7~O 745 150
Arq Lys phe Phe Glu Pro Phe Ser Gly Phe Arq Gln Lys Val Leu ASp 755 760 165
Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arq Lys Lys Pro Ser 770 175 780
Gly Ala Leu Mis Glu Glu Thr Phe Arq Lys Glu Glu Glu Phe Tyr Gln
785 790 795 800
Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys ~a Leu Glu Leu Gly Lys 805 810 815
11. Arq Lys val Asn Gly Ly. Ile Val Lys Asn Gly Aap Met Phe Arq 820 825 830
Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Al.a Val Pro 835 840 B45
Ile Tyr Thr Met Asp Pho Ala
Leu Lys Val Lo u Pro Asn Lya Ala Val
850
855 860
Ala Arq Ser Lys Lys Gly Glu
Ile Lye Asp Trp Ile Leu Met Asp Glu
865
8"10 875 880
Aan Tyr Glu Phe Cys Phe Ser Leu Tyr
Lys Asp Ser Leu Ile Leu Ile
BBS
B90 B95
Gln Thr Lys Asp Met Gln Glu Pro Glu
Phe Val Tyr Tyr Asn A1a Phe
900
905 910
Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys Mis Asp Asn Lys Phe 915 920 925
Glu Thr Leu Ser Ly8 930
Asn Gln Ly8 935 Ile Leu Phe LyB Asn Ala Asn Glu 940
Lys 945
Glu Val Ile Ala Lys 950 Ser Ile Gly Ile Gln Asn LeU Lys Val Phe 955 960
Glu Lys Tyr
Ile Val 965 Ser A1a Leu Gly Glu Val 910 Thr Ly8 A1a Glu Phe 915
Arq Gln Arq Glu Asp Phe Lys 980
Lys
5
<210> 80 <211>91 < 212> ADN < 213> Secuencia Artificial
10
<220> < 221> fuente < 223> Inota::-Descripción de Secuencia Artificial: Ol igonucle6tido sintético"
<400> 80 tataatetea taaqaaattt aaaaaqqqac taaaataaaq agtttqcqqq actctgcgqq
60
qttacaatcc cctaaaaccq cttttaaaat t
91
15
<210> 81 <211> 36 < 212> ADN < 213> Secuencia Artificial
20
<220> < 221> fuente < 223> Inola=-Descripción de Secuencia Artificial· Oligonucleótido sintético"
<400> 81 attttaccat aaagaaattt aaaaagggac taaaac
36
25
<210> 82 <211>95 <212>ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota::-Descripción de Secuencia Artificial Ol igonucleótido sintético"
30
<220> < 221> base modificada < 222> (1 )..(20) < 223> a, c, u, g, Desconocido u otro
<400> 82
nnnnnnnnnn nnnnnnnnnn quuuuagucc cgaaagggac uaaaauaaaq aquuugcgqg
ac ucuqcqqo quuacaaucc ccuaaaaccg cuuuu
<210> 83
<211> 69 5 <212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial " Oligonucleótido sintético"
10 <400>83
qucaccucca augacuaqgg quuuuagaqc uaqaaauaqc aaquuaaaau aagqcuaguc
cguuuuuuu
<210> 84 <211>69
< 212> ARN 15 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 84
qgqqccgaga uuggguquuc guuuuaqagc uagaaauagc aaguuaaaau aaqgcuaguc
cquuuuuuu
<210> 85
<211> 69
<
212> ARN
<
213> Secuencia Artificial
25 <220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial : Oligonucleótido sintético"
<400> 85
guqgcgagag gggccgagau guuuuagagc uagaaauagc aaquuaaaau aaggcuaguc
cquuuuuuu
30 <210>86 <211>69
<
212> ARN
<
213> Secuencia Artificial
<220> 35 < 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial: Oligonucleólido sintético"
60 95
60 69
bU 69
60 69
<400> 86
qgqqccqaqa uuqgguquuc quuuuaqaqc uaqaaauaqc aaquuaaaau aaqgcuaquc
cguuuuuuu
<210> 87
<211> 69 5 <212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético~
10 <400> 87
qugqcqaqaq qqqccqaqau guuuuaqaqc uaqaaauaqc aaquuaaaau aaqqcuaguc
cguuuuuuu
<210> 88
<211> 76
< 212> ARN 15 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético"
<400> 88
qucaccucca augacuaqqq quuuuaqaqc uaqaaauaqc aaquuaaaau aaqgcuaquc
cguuaucauu uuuuuu
<210> 89 <211>76
<
212> ARN
<
213> Secuencia Artificial
25 <220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético"
<400> 89
qacaucqauq uccuccccau quuuuaqaqc uaqaaauaqc aaquuaaaau aaggcuaquc
cguuaucauu uuuuuu
30 <210>90
<211> 76
<
212> ARN
<
213> Secuencia Artificial
<220> 35 < 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético"
bU
60 69
60 76
60 76
<400> 90
gaquccgaqc aqaagaagaa guuuuagagc uaqaaauagc aaquuaaaau aaqqcuaquc
cquuaucauu uuuuuu
<210> 91
<21 1> 76 5 <212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintétjco~
10 <400> 91
gaquccgaqc aqaagaagaa quuuuagagc uaqaaauagc aaquuaaaau aaqqcuaquc
cquuaucauu uuuuuu
<210> 92 <211>76
< 212> ARN 15 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota::~Descripción de Secuencia Artificial : Ol igonucleótido sintético"
<400> 92
ggqqccgaqa uugqguquuc quuuuagagc uagaaauagc aaquuaaaau aagqcuaquc
cquuaucauu uuuuuu 20
<210> 93
<211> 88
<
212> ARN
<
213> Secuencia Artificial
25 <220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial " Ol igonucleótido sintético~
<400> 93
qucaccucca augacuaggg quuuuagaqc uaqaaauagc aaquuaaaau aaqqcuaguc
cguuaucaac uuqaaaaagu quuuuuuu
30 <210>94
<211> 88
<
212> ARN
<
213> Secuencia Artificial
<220> 35 < 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial : Oligonucleótido sintético"
60 16
60 16
60 76
60 88
<400> 94
qacaucqauq uccuccccau quuuu&qagc
cguuaucaac uugaaaaaqu quuuuuuu
<210> 95
<211> 88 5 <212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial
10 <400> 95
uaqaaauaqc aaquuaaaau aaqqcuaquc
aa
" Oligonucleótido sintético~
qaquccqaqc aqaaqaagaa quuuuaqaqc uaqaaauaqc aaquuaaaau aa9qcuaquc 60
cquuaucaac uuqaaaaaqu quuuuuuu aa
<210> 96 <211>88
< 212> ARN 15 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota::~Descripción de Secuencia Artificial : Oligonucleótido sintético"
<400> 96
qoqqccqaqa uuqgququuc guUUU&q&qc u&oaaauaqc aaguuaaaau aagqcuaquc 60
cquuaucaac uuqaaaaaqu quuuuuuu 88
<210> 97
<211> 88
<
212> ARN
<
213> Secuencia Artificial
25 <220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial " Oligonucleótido sintético~
<400> 97
guqqcqaqaq 90qccqaqau guuuuaqaqc uaqaaauaqc aaquuaaaau Baqgcuaguc 60
cguuaucaac uuqaaaaaqu guuuuuuu 88
30 <210>98
<211> 103
<
212> ARN
<
213> Secuencia Artificial
<220> 35 < 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético" <400> 98
qucaccucca augacuaggq quuuuaqaqc uaqaaauagc aaquuaaaau aaggcuaquc
cquuaucaac uugaaaaaqu qqcaccqaqu oqquqcuuuu uuu
<210> 99
<211> 103 5 <212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético~
10 <400> 99
qucaccucca augacuaggg quuuuaqaqc uaqaaauagc aaquuaaaau aagqcuaquc
cquuaucaac uuqaaaaaqu qqcaccqaqu oqqugcuuuu uuu
<210> 100 <211>103
< 212> ARN 15 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificia l: Oligonucleótido sintético"
<400> 100
qaquccgagc aqaaqaaqaa quuuuagaqc uaqaaauaqc aaquuaaaau aaqqcuaquc
cquuaucaac uuqaaaaaqu qgcaccgaqu cgqugcuuuu uuu 20
<210> 101 <211>103
<
212> ARN
<
213> Secuencia Artificial
25 <220>
<
221> fuente
<
223> Inota="Descripción de Secuencia Artificial" Oligonucleótido sintético"
<400> 101
gggqccgaga uugqququuc quuuuagaqc uaqaaauaqc aaquuaaaau aaq9Cu&qUC
cquuaucaac uuqaaaaaqu qqcaccqaqu cqquqcuuuu uuu
30 <210> 102
<211> 103
<
212> ARN
<
213> Secuencia Artificial
<220> 35 < 221> fuente
< 223> Inota="Descripción de Secuencia Artificial" Oligonucleótido sintético"
60 103
60 103
60 103
60 103
<400> 102 9\1Qg-Cg-·9·9 Q99cc9agau quuuuaqaqc uaqaaauaqc aaquu••••u
aag-9Cu.quC 60
cquuauc••c
uuqa••aaqu qqcaccqaqu cqQ'Uqcuuuu uuu 103
5
<2 10> 103 <211 > 102 < 212> AON < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Descripci6n de Secuencia Artificial: Polinucle6tido sintético"
10
<400> 103 qttttaqaqc tatqctqtt.t. t.qaat.qqtcc caaaacqqaa qqqcctqaqt ccqaqcagaa 60
qaaqaaqttt taqaqct.atq ctgttttqaa tqqt.ccca.a
&C 102
15
<210> 104 <21 1>100 < 212> ADN < 213> Horno sapiens
<400> 104 cqgaqqacaa aqtacaaacq qcaqaa9ct.q qa9qaqqaaq qqcct.qaqtc cqaqcaqaaq
60
aaqaaqqqet
cccat.cacat. caacC{lgtqq cqcat.tqcca 100
20
<210> 105 <211 > 50 <212> AON < 213> Horno sapiens
<400> 105 agctggagga ggaagggcct gagtccgagc agaagaagaa gggctcccac
50
25
<210> 106 <21 1>30 < 212> ARN < 213> Secuencia Artificial
30
<220> < 221> fuente < 223> Inota=-Descripción de Secuencia Artificial: Oligonucle6tido sintético·
<400> 106 gaguccgagc agaagaagaa guuuuagagc
30
35
<2 10> 107 <211>49 <212>ADN < 213> Secuencia Artificial
<220> < 221> fu ente < 223> Inota=~Descripci 6n de Secuencia Artificial : Oligonucle6tido sintético"
<400> 107 agctggagga ggaagggcct gagtccgagc agaagagaag ggctcccat 49
<210> 108 <211>53
<212>ADN
< 213> Horno sapiens
<400> 108 ctggaggagg aagggcctga gtccgagcag aagaagaagg gctcccatca cat 53
<210> 109 <211>52
<
212> ADN
<
213> Horno sapiens
<400> 109 ctggaggagg aagggcctga gtccgagcag aagagaaggg ctcccatcac al 52
<210> 110
<211> 54
<
212> ADN
<
213> Horno sapiens
<400>110 ctggaggagg aagggcctga gtccgagcag aagaaagaag ggctcccatc acat 54
<210>111
<211> 50
<
212> ADN
<
213> Horno sapiens
<400> 111 ctggaggagg aagggcctga gtccgagcag aagaagggct cccatcacat 50
<210> 112 <211>47
<
212> ADN
<
213> Horno sapiens
<400> 112 ctggaggagg aagggcctga gcccgagcag aagggctccc atcacat 47
<210> 113
<211> 66
<212>ADN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota="Descripción de Secuencia Artificia l: Oligonucleótido sintético"
<220>
<
221> fuente
<
223> Inota="Descripción de Molécula de ADN/ARN Combinada: Oligonucleótido sintético"
<220>
<
221> base modificada
< 222> (1) (20)
<
223> a, c, t, g, Desconocido u otro
<400>113 nnnnnnnnnn
nnnnnnnnnn guuuuagaqc uagaaauaqc aaguuaaaau aaggctagtc 60
cquuuu
66
<210> 114 <21 1> 20 <212>ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Descripción de Secuencia Artificial " Ol igonucleótido sintético~
<400> 114 gaguccgagc agaagaagaa
20
<210> 115 <211>20 < 212> ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota"'~Descripci ón de Secuencia Artificial Oligonucle6tido sintético"
<400> 115 gacaucgauguccuccccau
20
<210> 116 <211> 20 < 212> ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Descripción de Secuencia Artificial : Oligonucleótido sintético"
<400>116 gucaccucca augacuaggg
20
<210> 117 <211> 20 < 212> ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota:::~Descripci ón de Secuencia Artificial: Oligonucleótido sintético"
<400> 117 auuggguguu cagggcagag
20
<210> 118 <211> 20 < 212> ARN < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial Oligonucleótido sintético~
<400>118 guggcgagag gggccgagau 20
<210> 119 <211>20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético"
<400> 119 ggggccgaga uuggguguuc 20
<210> 120
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificia l: Oligonucleótido sintético~
<400> 120 gugccauuag cuaaaugcau 20
<210> 121 <211>20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético~
<400> 121 guaccaccca caggugccag 20
<210> 122
<211> 20
<212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificia l: Oligonucleótido sintético~
<400> 122 gaaagccucu gggccaggaa 20
<210> 123 <211>48
<
212> ADN
<
213> Horno sapiens
<400> 123 ctggaggagg aagggcctga gtccgagcag aagaagaagg gctcccat 48
<210> 124 <211>20
<212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial " Oligonucleótido sintético"
<400> 124 gaguccgagc agaagaagau 20
<210> 125
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 125 gaguccgagc agaagaagua 20
<210> 126
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial " Oligonucleótido sintético"
<400> 126 gaguccgagc agaagaacaa 20
<210> 127
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 127 gaguccgagc agaagaugaa 20
<210> 128
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 128 gaguccgagc agaaguagaa 20
<210> 129 <211>20
<212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial " Oligonucleótido sintético"
<400> 129 gaguccgagc agaugaagaa 20
<210> 130
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 130 gaguccgagc acaagaagaa 20
<210> 131
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial " Oligonucleótido sintético"
<400> 131 gaguccgagg agaagaagaa 20
<210> 132
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 132 gaguccgugc agaagaagaa 20
<210> 133
<211> 20
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 133 gagucggagc agaagaagaa 20
<210> 134 <211>20
<212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético"
<400> 134 gagaccgagc agaagaagaa 20
<210> 135
<211> 24
<
212> ADN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 135 aatgacaagc ttgctagcgg tggg 24
<210> 136
<211> 39
<
212> ADN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético"
<400> 136 aaaacggaag ggcctgagtc cgagcagaag aagaagttt 39
<210> 137
<211> 39
<
212> ADN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 137 aaacaggggc cgagattggg tgttcagggc agaggtttt 39
<210> 138
<211> 38
<
212> ADN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<
222> (1) "" (20)
<
223> a, c, u, g, Desconocido u otro
<400> 138 aaaacggaag ggcclgaglc cgagcagaag aagaagtt
38
5
<210> 139 <211>40 <212>ADN < 213> Secuencia Artificial
<220> < 221> fuenle < 223> Inota=~Descripci ón de Secuencia Artificial" Ol igonucleólido sintético"
10
<400> 139 aacggaggga ggggcacaga tgagaaactc agggttttag 40
15
<210> 140 <211> 38 < 212> ADN < 213> Horno sapiens
<400> 140 agccctLctt cttctgctcg gaclcaggcc cttcctcc
38
20
<210> 141 <211>40 <212>ADN < 213> Horno sapiens
<400> 141 cagggaggga ggggcacaga tgagaaactc aggaggcccc
40
25
<210> 142 <211>80 < 212> ADN < 213> Secuencia Artificial
30
<220> < 221> fuenle < 223> Inola=~Descripci ón de Secuencia Artificial: Ol igonucleótido sinlético"
<400> 142 qqcaatqcqc caccqqttqa tqtqatqgga gcccttctag gaggccccca gagcagccac
60
tgqqgcctca acactcagqc
80
35
<210> 143 <211> 98 <212>ADN < 213> Secuencia Artificial
<220> < 221> fuenle < 223> Inota=~Descripción de Secuencia Artificial " Oligonucleólido sintélico"
40
<400> 143 qqacgaaaca cC9gsaccat tcaaaacagc atagcaaqtt aaaataag9c tagtccgtta 60
tcaacttgaa &aagtqqcac cqagtcgqtg cttttttt
98
161
<210> 144 <211>186 < 212> ADN < 213> Secuencia Artificial
5
<220> < 221 > fuente < 223> Inota=~Descripción de Secuencia Artificial: Polinucle6tido sintético"
<400> 144 gqacgaaBca ccggtagtat taaqtattgt tttatqqctq ataaatttct ttgaatttct
60
ccttqattat ttgttataaa aqttataaaa taatcttqtt gqaaccattc aaaacaqcat
120
aqcaaqttaa aataaqqcta qtccqttatc aacttqaaaa aqtqqcaccq aqtcqgtgct
180
tttttt
186
10
<210> 145 <211>46 < 212> ARN < 213> Secuencia Artificial
15
<220> < 221 > fuente < 223> Inota="Descripción de Secuencia Artificial : Oligonucleótido sintético"
20
<220> < 221> base modificada < 222> (1) .. (19) < 223> a, c, u, g, Desconocido u otro
<400> 145 nnnnnnnnnn nnnnnnnnng uuauuguacu cucaagauuu auuuuu
46
25
<210> 146 <21 1> 91 <212>ARN < 213> Secuencia Artificial
<220> < 221> fuen te < 223> Inota="Descripción de Secuencia Artificial: Oligonucleótido sintético"
30
<400> 146 quuacuuaaa ucuuqcaqaa qcuacaaaqa uaaqqcuuca uqccqaaauc aacacccuqu 60
eauuuuauqq
caqqququuu ucguuauuua a 91
35
<2 10> 147 <211>70 < 212> ADN < 213> Horno sapiens
<400> 147 ttttctagtq ctqaqtttct qtqactcctc tacattctac ttctctgtgt ttctqtatac
60
tacct cct cc
70
162
<210> 148 <21 1>122 < 212> ADN < 213> Homo sapiens
5
<400> 148
ggaq9a8999 cctqaqtccq aqcaqaagaa qaaq9qetce eateaeatea aeegqtg9cq
60
cattqecacq aaqcagqeca atqqqqaqqa eatcqatqtc aceteeaatq actagqgtg9
120
qe
122
10
<210> 149 <211>48 < 212> ARN < 213> Secuencia Artificial
15
<220> < 221> fuente < 223> Inota="Oescripciórl de Secuencia Artificial: Oligonucleótido sintético"
<220> < 221> base modificada < 222> (3) .. (32) < 223> a, c, u, 9, Desconocido u otro
20
<400> 149 acnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnguuuuaga gcuaugcu 48
25
<2 10> 150 <21 1> 67 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota="Descripción de Secuencia Artificial: Oligonucleótido sintético"
30
<220> < 221> fuente < 223> Inota="Descripciórl de Molécula de ADN/ARN Combinada: Oligonudeótido sintético"
<4qQ":, 150 ageauageaa quuaaaauaa qqetaguccg
uuaucaaeuu qaaaaaqu99 cacegaqucq 60
qugcuuu
67
35
<2 10> 151 <211 >62 < 212> ARN < 213> Secuencia Artificial
40
<220> < 221> fuente < 223> Inota="Descripción de Secuencia Artificial : Ol igonucleótido sintético"
<220> < 221> base modificada
163
<400> 151
nnnnnnnnnn nnnnnnnnnn quuuuaqaqc uagaaauaqc aaquuaaaau aaqqcuaguc
cq
5 <210> 152 <211>73
<
212> ADN
<
213> Secuencia Artificial
<220> 10 < 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 152
tqaatgqtcc caa88c9gaa ggqcctqaqt ccgaqcaqaa qaagaagttt taqagctatg
ctgttttgaa t90
<210> 153 15 <211>99
<
212> ARN
<
213> Secuencia Artificial
<220>
< 221> fuente 20 < 223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético"
<220>
<
221> base modificada
<
222> (1) (20)
<
223> a, c, u, g, Desconocido u otro
25 <400> 153
nnnnnnnnnn nnnnnnnnnn quuuuaqagc uagaaauaqc aaquuaaaau aaqqcuaquc
cquuaucaac uugaaa••qu ggcaccqagu cgquqcuuu
<210> 154
<211> 127
< 212> ARN 30 < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Polinucleótido sintético"
<400> 154
quuuuuquac ucucaaqauu uaaquaacuq uacaaeguu. cuuaaaueuu qeagaaqcua
caaagauaaq gcuucaugcc qaaaucaaca cceuqucauu uuauqgcaqq ququuuucqu
uauuuaa 35
6.
6.
6.
60 120 127
<210> 155 <211> 56 < 212> ADN < 213> Secuencia Artificial
5
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial : Oligonucleótido sintético"
10
<220> < 221> base modificada <222>(1) .. (20) < 223> a, c, t, g, Desconocido u otro
<400> 155 nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt taagtaactg tacaac
56
15
<210> 156 <211> 91 < 212> ADN < 213> Secuencia Artificial
20
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial · Oligonucleótido sintético"
<400> 156 gttacttaaa tcttqcaqaa qctac aaaga taaggcttca tgccqaaatc aacaccctgt
60
cattttatqq caqqqtgttt tcqttattta a
91
25
<210> 157 <211> 134 <212>ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial: Polinucleótido sintético"
30
<220> < 221> base modificada < 222> (1) .. (20) < 223> a, c, t, g, Desconocido u otro
<40º~ J57 nnnnnnnnnn
nnnnnnnnnn gtttttqtae teteaagatt taaqgaaaet aaatettqea 60
qaagctaeaa aqataaqget teatgcegaa ateaacacee tgtcatttta tggcaggqtg
120
35
ttttcqttat ttaa 134
<210> 158 <211>131 < 212> ADN < 213> Secuencia Artificial
<220>
< 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial Polinucleótido sintético"
<220> 5 < 221> base modificada
< 222> (1) .. (20)
< 223> a, c, t, g, Desconocido u olro
<400> 158
nnnnnnnnnn nnnnnnnnnn qtttttgtac tctcaaqatt tagaaataaa tcttqcaqaa 60
qctacaaaqa taaqqcttca tqccqaaatc aacaccctgt cattttatqq caqqqtqttt 120
tcqttattta a 131
10 <210> 159
<211> 125
< 212> ADN
< 213> Secuencia Artificial
<220> 15 < 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial: Polinucleótido sintético"
<220>
< 221> base modificada
<222> (1) .. (20) 20 < 223> a, c, t, g, Desconocido u airo
<400> 159
nnnnnnnnnn nnnnnnnnnn qtttttqtac tctcaaqatq aaaatcttgc aqaaqctaca 60
aaqataaqqc ttcatqccqa aatcaacacc ctgtcatttt atqqcaq9gt gttttcgtta 120
tttaa 125
<210> 160
<211> 112 25 <212>ADN
< 213> Secuencia Artificial
<220>
< 221> fuente
< 223> Inota=~Descripción de Secuencia Artificial: Polinucleótido sintético"
30 <220>
< 221> base modificada
< 222> (1) .. (20)
< 223> a, c, t, g, Desconocido u airo
<400> 160
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctgaaaaqa aqctacaaaq ataaqqcttc 60
atqccqaaat caacaccctq tcattttatq qcaqqgtgtt ttcgttattt aa ll2
<210> 161 <21 1> 107 < 212> ADN < 213> Secuencia Artificial
5
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial : Polinucleótido sintético"
10
<220> < 221> base modificada <222>(1)..(20) < 223> a, c, t, g, Desconocido u olro
<400> 161 nnnnnnnnnn
nnnnnnnnnn qtttt tqtec tqaaaaqcta caaaqataaq qcttcatqcc 60
qaaat caaca
ccctqtcatt ttatqqcagq qtqttttcqt tatttaa 101
15
<210> 162 <211> 108 < 212> ADN < 213> Secuencia Artificial
20
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial: Polinucle6lido sintético"
<220> < 221> base modificada < 222> (1) .. (20) < 223> a, c, t, g, Desconocido u airo
25
<400> 162 nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60
qctacaaaqa taa;qcttca
tqccqaaatc aacaccctqt cattttat loa
30
<210> 163 <211> 86 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial: Oligonucleótido sintéticoM
35
<220> < 221> base modificada < 222> (1) .. (20) < 223> a, c, t, g, Desconocido u otro
<400> 163 nnnnnnnnnn
nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcaqaa 60
qctacaaaqa taaqqcttca tqccqa
86
40
<210> 164 <211>79 < 212> ADN < 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial Oligonucleótido sintético~
<220>
<
221> base modificada
<
222> (1) "" (20)
<
223> a, c, t, g, Desconocido u olro
<400> 164
nnnnnnnnnn nnnnnnnnnn
qctacaaaqa taaqqctte
10 <210> 165
<211> 73
<
212> ADN
<
213> Secuencia Artificial
<220> 15 < 221> fuente
qtttttqtac t ctcaaqatt taqaaataaa tcttqcaqaa 60 19
< 223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético~
<220>
< 221> base modificada
< 222> (1 )..(20) 20 < 223> a, c, t, g, Desconocido u otro
<400> 165
nnnnnnnnnn nnnnnnnnnn qtttttgtae teteaaqatt taqaaataaa tettqeaqaa 60
qcteeaaaga taa 13
<210> 166
<211>125 25 <212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Polinucle6tido sintético"
30 <400> 166
quuuuaqucc cuuuuuaaau uucuuuaugg uaaaauuaua aucucauaaq aaauuuaaaa 60
aqgqacuaaa auaaaqaquu ugcgqqacuc uqcqqqquua caaucceeua aaaeeqcuuu 120
uaaaa 125
<210> 167 35 <211> 91
<
212> ARN
<
213> Secuencia Artificial
<220>
< 221> fuente 40 < 223> Inota=~Descripción de Secuencia Artificial" Oligonucleótido sintético~
<400> 167
quuacuuaaa ucuuqcaqaa qcuacaaaqa uaaqqcuuca uqccgaaauc aacaeecugu 60
cauuuuauqq caqqququuu ucquuauuua a 91
<210> 168 <211> 56 < 212> ARN < 213> Secuencia Artificial
5
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 168 gggacucaac caagucauuc guuuuuguac ucucaagauu uaaguaacug uacaac 56
10
<210> 169 <211> 147 < 212> ARN < 213> Secuencia Artificial
15
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial: Polinucle6tido sintético"
<400> 169 qgqacucaac
caaqucauuc quuuuuqu~c ucucaaqa uu uaaqua acuq uacaa eguua 60
cuuaaaue uu
geaqaaqcua caaaqauaag q c uucaugcc gaaaucaaea cccuqucauu 120
uuauqqcagg ququuuucqu
u auuua a 147
20
<210> 170 <211> 70 < 212> ARN < 213> Secuencia Artificial
25
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial" Ol igonucleótido sintético"
<400> 170 cuuqeaqaag cuacaaagau
a aqgcuuea u gccgaaauca a cacccuquc auuuua uggc 60
aqqququuuu
70
30
<210> 171 <211>42 <212>ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial: Oligonucleótido sintético"
35
<400> 171 gggacucaac caagucauuc guuuuuguac ucucaagauu ua 42
40
<210> 172 <211>112 < 212> ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial" Polinucleótido sintético" 169
<400> 172
gggacucaac caagucauuc guuuuuguac ucucaa9auu uacuugcaga &gcuacaaag
auaaqqcuuc augccgaaau caacacccug ucauuuuauq gcaqgguquu uu
<210> 173
<21 1> 116
<212>ARN
< 213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota::~Descripción de Secuencia Artificial" Polinucleótido sintético"
<400> 173
gggacucaac caaqucauuc quuuuuquac ucucaaqauu ua9aaacuuq ca9aaqcuac
aaaqauaago cuucauqccg aaaucaacae eeugueauull uauqqeaqqq uguuuu
<210> 174
<211> 116
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial " Polinucleótido sintético"
<400> 174
ggqacucaac caaqucauuc quuuuuquac ucueaagauu uagaaacuuq cagaaqcuac
aaagauaagg cuucaugccg aaaucaacac ccugucauuu UBuqgcaggg uguuuu
<210> 175 <211>102
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial" Polinucleótido sintético"
<400> 175
99gacucaac caaqucauue guuuuuquaq aaauaeaaa; auaaggcuuc augcegaaau
caacacecug ucauuuuaug gcagQ9Uguu uucquuauuu aa
<210> 176
<211> 102
<
212> ARN
<
213> Secuencia Artificial
<220>
<
221> fuente
<
223> Inota=~Descripción de Secuencia Artificial: Polinucle6tido sintético"
<400> 176
gggacucaac caaqucauuc quuuuuguag aaauacaaag auaaggcuuc augccqaaau
caacaceeug ucauuuuauq qcaqqguguu uucquuauuu aa
60 112
60 116
60 102
60 102
<210> 177 <211> 57 < 212> ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial : Oligonucleótido sintético"
<400> 177 gggacucaac caagucauuc guuuuuguag aaauacaaag auaaggcuuc augccga
57
<210> 178 <211> 57 < 212> ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial: Oligonucleótido sintético"
<400> 178 gggacucaac caagucauuc guuuuuguag aaauacaaag auaaggcuuc augccga
57
<210> 179 <211> 23 < 212> ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota::MDescripción de Secuencia Artificial " Oligonucleótido sintético"
<400> 179 gtggtgtcac gctcgtcgtt t99
23
<210> 180 <211> 23 <21 2>ADN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota:::MDescripción de Secuencia Artificial Oligonucleótido sintético"
<400> 180 tccagtctat taattgllgc cgg
23
<210> 181 <211>64 < 212> ADN < 213> Horno sapiens
<400> 181 caagaggett gagtaggaga gqagtgecgc cgagqcgggg eggggcgggg cqtggagctg
60
gqct
64
<210> 182 <211> 99
171
< 212> ARN < 213> Secuencia Artificial
5
<220> < 221> fuente < 223> Inota=~Descripción de Secuencia Artificial: Oligonucleótido sintético"
<220> < 221> base modificada < 222> (1 )..(20) < 223> a, c, u, g, Desconocido u otro
10
<400> 182 nnnnnnnnnn nnnnnnnnnn quauuaqaqc uaqaaauagc aaquuaauau aaggcuaquc 60
cguuaucaac
uugaaaaaqu ggcaccqaqu cgguqcuuu 99
15
<210> 183 <211> 119 < 212> ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inota=~Descripción de Secuencia Artificial: Polinucle6tido sintético"
20
<220> < 221> base modificada < 222> (1 ) .. {20) < 223> a, c, u, g, Desconocido u otro
<400> 183 nnnnnnnnnn
nnnnnnnnnn quuuuagagc uaugcuquuu ugqaaacaaa acagcauaqc 60
aaquuaaaau
aaqqcuaquc cquuaucaac uugaaaaaqu qqcaccqagu cqquqcuuu 119
25
<210> 184 <211>119 < 212> ARN < 213> Secuencia Artifi cial
30
<220> < 221> fuente < 223> Inota=~Descripción de Secuencia Artificial· Polinucleótido sintético"
35
<220> < 221> base modificada < 222> (1) (20) < 223> a, c, u, g, Desconocido u otro
<400> 184 nnnnnnnnnn
nnnnnnnnnn gu&uuaqaqc uauqcuquau uqqaaacaau acagcauagc 60
aaquuaauau
aagqcuaquc cquuaucaac uuqaaaaaqu qqcaccgaqu cqquqcuuu 119
40
<210> 185 <211> 12 <212>ADN < 213> Homo sapiens
<400> 185 tagcgggtaa gc
12 172
<210> 186
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 186 tcggtgacat 9t 12
<210> 187 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 187 actccccgta 99 12
<210> 188 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 188 aclgcglgtl aa 12
<210> 189
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 189 acgtcgcclg at 12
<210> 190
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 190 tagglcgacc ag 12
<210> 191 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 191 ggcgttaalg al 12
<210> 192 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 192 Igtcgcatgl ta 12
<210> 193 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 193 atggaaaege at 12
<210> 194 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 194 gecgaattee te 12
<210> 195 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 195 geatggtaeg ga 12
<210> 196
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 196 cggtaetett ae 12
<210> 197
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 197 geetgtgeeg ta 12
<210> 198
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 198 taeggtaagt eg 12
<210> 199
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 199 cacgaaatta ce 12
<210> 200
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 200 aaccaagata cg 12
<210> 201
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 201 gaglcgalac gc 12
<210> 202 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 202 glclcacgal cg 12
<210> 203 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 203 tcgtcgggtg ca 12
<210> 204
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 204 aclccgtagl ga 12
<210> 205
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 205 caggacgtcc gt 12
<210> 206 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 206 tcglatccct ac 12
<210> 207 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 207 tltcaaggcc gg 12
<210> 208 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 208 cgccgglgga al 12
<210> 209 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 209 gaacccglcc la 12
<210> 210 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 210 gattcalcag eg 12
<210>211
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 211 aeaeeggtet le 12
<210> 212
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 212 ateglgccet aa 12
<210> 213
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 213 gegtcaatgt te 12
<210> 214
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 214 ctecgtatel cg 12
<210> 215
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 215 eegattcctt cg 12
<210> 216
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 216 Igcgcctcca gl 12
<210> 217 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 217 laacglcgga gc 12
<210> 218 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 218 aagglcgccc al 12
<210> 219
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 219 glcggggact al 12
<210> 220
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 220 ttcgagcgattt 12
<210> 221 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 221 tgagtcgtcg ag 12
<210> 222 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 222 tltacgcaga gg 12
<210> 223 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 223 aggaagtatc gc 12
<210> 224 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 224 actcgatacc al 12
<210> 225 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 225 cgclacalag ca 12
<210> 226
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 226 ttcataaccg gc 12
<210> 227
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 227 ccaaacggtt aa 12
<210> 228
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 228 cgattccttc gt 12
<210> 229
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 229 cglcatgaal aa 12
<210> 230
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 230 agtggcgatg ac 12
<210> 231
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 231 eecctacgge ae 12
<210> 232 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 232 gecaaccege ae 12
<210> 233 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 233 Igggaeaecg gl 12
<210> 234
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 234 ttgaetgcgg eg 12
<210> 235
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 235 aetalgcgta 99 12
<210> 236 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 236 lcaeccaaag cg 12
<210> 237 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 237 geaggacgle eg 12
<210> 238 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 238 acaccgaaaa cg 12
<210> 239 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 239 cgglgtattg ag 12
<210> 240 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 240 cacgaggtat gc 12
<210> 241
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 241 taaagcgacc cg 12
<210> 242
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 242 cttagtcggc ca 12
<210> 243
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 243 cgaaaacglg gc 12
<210> 244
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 244 cglgccclga ac 12
<210> 245
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 245 tttaccatcg aa 12
<210> 246
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 246 cgtagccalg ti 12
<210> 247 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 247 cccaaacggl ta 12
<210> 248 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 248 gcgltalcag aa 12
<210> 249
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 249 Icgatgglaa ac 12
<210> 250
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 250 cgactlttlg ca 12
<210> 251 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 251 Icgacgaclc ac 12
<210> 252 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 252 acgcgtcaga la 12
<210> 253 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 253 cgtacggcac ag 12
<210> 254 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 254 ctatgccgtg ca 12
<210> 255 <211>12
<
212> ADN
<
213> Horno sapiens
<400> 255 cgcgtcagat at 12
<210> 256
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 256 12 aagatcggta gc 12
<210> 257
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 257 cttcgcaagg ag 12
<210> 258
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 258 gtcgtggact ac 12
<210> 259
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 259 gglcgtcatc aa 12
<210> 260
<211> 12
<
212> ADN
<
213> Horno sapiens
<400> 260 gttaacagcg tg 12
<210> 261 <211> 12 < 212> ADN < 213> Horno sapiens
<400> 261 tagctaaccg ti
12
<210> 262 <211>12 < 212> ADN < 213> Horno sapiens
<400> 262 aglaaaggcg el
12
<210> 263 <211>12 < 212> ADN < 213> Horno sapiens
<400> 263 gglaaltlcg 19
12
<210> 264 <211> 147 < 212> ARN < 213> Secuencia Artificial
<220> < 221> fuente < 223> Inola=~Descripci ón de Secuencia Artificial· Polinucleótido sintético"
<220> < 221> base modificada < 222> (1 )..(20) < 223> a, e, u, g, Desconocido u otro
<400> 264 nnnnnnnnnn
nnnnnnnnnn quuuuaquac ucuquaauuu uagquaugag quagacgaaa 60
auuquacuua
uaccuaaaau uacagaaucu acuaaaacaa 9gcaaaau9c cququuuauc 120
uc quC&acuu
guugqcgaqa uuuuuUu '47

Claims (16)

  1. REIVINDICACIONES
    1. Un sistema vector asociado a CRISPR -Repeticiones Palindrómicas Cortas Agrupadas y Regularmente Interespaciadas (CRISPR) (Cas) (CRISPR-Cas) que no se encuentran en la naturaleza, de ingeniería, que comprende uno o más vectores que comprenden:
    a) un primer elemento regulador unido de manera operable a una o más secuencias de nucleótidos que codifican una o más secuencias de polinucleótidos del sistema CRISPR-Cas que comprende una secuencia guía, un ARNtracr y una secuencia de emparejamiento tracr, en la que la secuencia gura se hibrida con una o mas secuencias objetivo en los sitios de los polinucleótidos en una célula eucariota,
    b) un segundo elemento regulador unido de manera operable a secuencia de nucleótidos que codifica una proteína Cas9 de Tipo 11 ,
    en el que los componentes (a) y (b) están situados en los mismos vectores o diferentes vectores del sistema,
    en el que el sistema CRISPR-Cas comprende dos o más señales de localización nuclear (las NLS) expresadas con la secuencia de nucleótidos que codifica la proteína Cas9,
    según lo cual una o más secuencias guía fijan como objetivo uno o más sitios de polinucleótidos en una célula eucariota y la proteína Cas9 escinde uno o más sitios de polinucleótidos, según lo cual se modifica la secuencia de uno o más sitios de polinucleÓtidos
  2. 2. Un sistema vector CRISPR-Cas de TIpo 11, que no se encuentra en la naturaleza, de ingeniería, según la reivindicación 1,
    en el que la proteína Cas9 muta con respecto a una proteína Cas9 de tipo natural correspondiente de manera que la proteína mutada es una nickasa que carece de capacidad para escindir una hebra de un polinucleótido objetivo,
    según lo cual una o más secuencias guía fijan como objetivo uno o más sitios de polinucleótidos en una célula eucariota y la proteína Cas9 sólo escinde una hebra de los sitios de polinucleótidos, según lo cual se modifica la secuencia de uno o más sitios de polinucleótidos.
  3. 3.
    El sistema de la reivindicación 1 ó 2, en el que los vectores son vectores víricos
  4. 4.
    El sistema de la reivindicación 3, en el que los vectores víricos son vectores víricos retrovirales, lentivíricos, adenovíricos, adenoasociados o de herpes simple
  5. 5.
    El sistema según cualquiera de las reivindicaciones 2-4, en el que la proteína Cas9 comprende una o más mutaciones en los dominios catalíticos RuvC 1, RuvC 11 o RuvC 111
  6. 6.
    El sistema según cualquiera de las reivindicaciones 2-4, en el que la proteína Cas9 comprende una mutación seleccionada del grupo que consiste en D10A, H840A, N854A y N863A con referencia a la numeración de la posición de una proteína Cas9 de Streptococcus pyogenes (SpCas9).
  7. 7.
    El sistema según cualquier reivindicación precedente, en el que al menos una NLS está en o cerca del término amino de la proteína Cas9 y/o al menos una NLS está en o cerca del término carboxi de la proteína Cas9
  8. 8.
    El sistema de la reivindicación 7, en el que al menos una NLS está en o cerca del término amino de la proteína Cas9 yJo al menos una NLS está en o cerca del término carboxi de la proteina Cas9
  9. 9.
    El sistema según cualquier reivindicación precedente, en el que una o más secuencias de polinucleótidos del sistema CRISPR-Cas comprenden una secuencia guía fusionada a una secuencia cr de activación trans (traer)
  10. 10.
    El sistema según cualquier reivindicación precedente, en el que la secuencia de polinucleótidos del sistema CRISPR-Cas es un ARN quimérico que comprende la secuencia guía, la secuencia traer y una secuencia de emparejamiento traer
  11. 11.
    El sistema según cualquier reivindicación precedente, en el que la célula eucariota es una célula de mamífero o una célula humana
  12. 12.
    El sistema según cualquier reivindicación precedente, en el que la proteína Cas9 es codón-optimizada para expresión en una célula eucariota.
  13. 13.
    Uso del sistema según cualquiera de las reivindicaciones 1 a 12, para ingeniería de genomas, siempre que el uso no comprenda un procedimiento para modificar la identidad genética de la línea germinal de seres humanos y siempre que dicho uso no sea un método para tratamiento del cuerpo humano o de un animal por cirugía o terapia.
    14 El uso de la reivindicación 13, en el que la ingeniería de genomas comprende modificar un polinucleótido objetivo en una célula eucariota, modificar la expresión de un polinucleótido en una célula eucariota, generar una célula eucariota modelo que comprenda un gen de enfermedad mutado o eliminar un gen
  14. 15. El uso de la reivindicaciórJ 13, en el que el uso comprende además reparar dicho polinucleótido fijado como objetivo escindido insertando un polinucleótido de plantilla exágeno, en el que dicha reparación da como resultado
    5 una mutación que comprende una inserción, supresión o sustitución de uno o más nucle6tidos de dicho polinucleótido objetivo.
  15. 16. El uso de la reivindicaciórJ 13, en el que el uso comprende además editar dicho polinucle6tido objetivo escindido insertando un polinucleótido de plantilla exágeno, en el que dicha ediciórJ da como resultado una mutación que comprende una inserción, supresión o sustitución de uno o más nucleótidos de dicho polinucleótido objetivo
    10 17. El uso según la reivindicación 15ó 16, en el que la inserción es por recombinación homóloga
  16. 18. Uso del sistema según cualquiera de las reivindicaciones 1 a 12, en la producción de un animal transgénico no humano o planta transgénica .
ES14170383.5T 2012-12-12 2013-12-12 Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias Active ES2542015T3 (es)

Applications Claiming Priority (24)

Application Number Priority Date Filing Date Title
US201261736527P 2012-12-12 2012-12-12
US201261736527P 2012-12-12
US201361748427P 2013-01-02 2013-01-02
US201361748427P 2013-01-02
US201361758468P 2013-01-30 2013-01-30
US201361758468P 2013-01-30
US201361769046P 2013-02-25 2013-02-25
US201361769046P 2013-02-25
US201361791409P 2013-03-15 2013-03-15
US201361802174P 2013-03-15 2013-03-15
US201361802174P 2013-03-15
US201361791409P 2013-03-15
US201361806375P 2013-03-28 2013-03-28
US201361806375P 2013-03-28
US201361814263P 2013-04-20 2013-04-20
US201361814263P 2013-04-20
US201361819803P 2013-05-06 2013-05-06
US201361819803P 2013-05-06
US201361828130P 2013-05-28 2013-05-28
US201361828130P 2013-05-28
US201361836127P 2013-06-17 2013-06-17
US201361835931P 2013-06-17 2013-06-17
US201361836127P 2013-06-17
US201361835931P 2013-06-17

Publications (1)

Publication Number Publication Date
ES2542015T3 true ES2542015T3 (es) 2015-07-29

Family

ID=49920627

Family Applications (4)

Application Number Title Priority Date Filing Date
ES15154539.9T Active ES2553782T3 (es) 2012-12-12 2013-12-12 Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
ES14170383.5T Active ES2542015T3 (es) 2012-12-12 2013-12-12 Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
ES13818570.7T Active ES2536353T3 (es) 2012-12-12 2013-12-12 Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
ES15154566.2T Active ES2598115T3 (es) 2012-12-12 2013-12-12 Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES15154539.9T Active ES2553782T3 (es) 2012-12-12 2013-12-12 Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES13818570.7T Active ES2536353T3 (es) 2012-12-12 2013-12-12 Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
ES15154566.2T Active ES2598115T3 (es) 2012-12-12 2013-12-12 Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias

Country Status (16)

Country Link
US (5) US20140242664A1 (es)
EP (2) EP4279588A3 (es)
JP (10) JP2016504026A (es)
KR (1) KR20150105633A (es)
CN (2) CN105121648B (es)
AU (4) AU2013359123B2 (es)
CA (1) CA2894701A1 (es)
DK (1) DK2771468T3 (es)
ES (4) ES2553782T3 (es)
HK (5) HK1202586A1 (es)
IL (2) IL307735A (es)
MX (1) MX2015007549A (es)
PL (2) PL2921557T3 (es)
PT (4) PT2784162E (es)
RU (1) RU2701850C2 (es)
WO (1) WO2014093712A1 (es)

Families Citing this family (545)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9637739B2 (en) * 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
CA2869016C (en) 2012-04-25 2020-05-05 Regeneron Pharmaceuticals, Inc. Nuclease-mediated targeting with large targeting vectors
EP2841572B1 (en) 2012-04-27 2019-06-19 Duke University Genetic correction of mutated genes
LT2800811T (lt) 2012-05-25 2017-09-11 The Regents Of The University Of California Būdai ir kompozicijos, skirti tikslinės dnr modifikavimui, panaudojant adresuotą rnr, ir transkripcijos moduliavimui, panaudojant adresuotą rnr
BR112014031891A2 (pt) 2012-06-19 2017-08-01 Univ Minnesota direcionamento genético nas plantas utilizando vírus de dna
US10648001B2 (en) 2012-07-11 2020-05-12 Sangamo Therapeutics, Inc. Method of treating mucopolysaccharidosis type I or II
AU2013289206B2 (en) 2012-07-11 2018-08-09 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of lysosomal storage diseases
EP2877213B1 (en) * 2012-07-25 2020-12-02 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9567631B2 (en) 2012-12-14 2017-02-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
CN111748607B (zh) 2012-08-14 2024-04-30 10X基因组学有限公司 微胶囊组合物及方法
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
KR101656237B1 (ko) 2012-10-23 2016-09-12 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
ES2884925T3 (es) 2012-11-27 2021-12-13 Childrens Medical Ct Corp Elementos reguladores distales de BCL11A como dianas para la reinducción de la hemoglobina fetal
PL3138910T3 (pl) 2012-12-06 2018-01-31 Sigma Aldrich Co Llc Oparta na CRISPR modyfikacja i regulacja genomu
EP2940140B1 (en) 2012-12-12 2019-03-27 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
IL239317B (en) 2012-12-12 2022-07-01 Broad Inst Inc Providing, engineering and optimizing systems, methods and compositions for sequence manipulation and therapeutic applications
EP3825401A1 (en) 2012-12-12 2021-05-26 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
US8697359B1 (en) * 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
PL2931898T3 (pl) 2012-12-12 2016-09-30 Le Cong Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi
PT2784162E (pt) * 2012-12-12 2015-08-27 Broad Inst Inc Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
KR20150105634A (ko) 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화
WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
MX2015007743A (es) * 2012-12-17 2015-12-07 Harvard College Ingenieria del genoma humano guiada por ácido robonucleico.
CN104995302B (zh) 2013-01-16 2021-08-31 爱默蕾大学 Cas9-核酸复合物及其相关用途
CN108753766A (zh) 2013-02-08 2018-11-06 10X基因组学有限公司 多核苷酸条形码生成
US10138509B2 (en) 2013-03-12 2018-11-27 President And Fellows Of Harvard College Method for generating a three-dimensional nucleic acid containing matrix
JP2016519652A (ja) 2013-03-14 2016-07-07 カリブー・バイオサイエンシーズ・インコーポレイテッド 核酸ターゲティング核酸の組成物および方法
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US20140273235A1 (en) * 2013-03-15 2014-09-18 Regents Of The University Of Minnesota ENGINEERING PLANT GENOMES USING CRISPR/Cas SYSTEMS
WO2014144592A2 (en) 2013-03-15 2014-09-18 The General Hospital Corporation Using truncated guide rnas (tru-grnas) to increase specificity for rna-guided genome editing
CN105518146B (zh) 2013-04-04 2022-07-15 哈佛学院校长同事会 利用CRISPR/Cas系统的基因组编辑的治疗性用途
BR112015026197B1 (pt) 2013-04-16 2022-12-06 Regeneron Pharmaceuticals, Inc Método para modificação marcada de um lócus genômico de interesse em uma célula de rato pluripotente
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
EP3597755A1 (en) 2013-06-17 2020-01-22 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
CN105492611A (zh) 2013-06-17 2016-04-13 布罗德研究所有限公司 用于序列操纵的优化的crispr-cas双切口酶系统、方法以及组合物
KR20160044457A (ko) 2013-06-17 2016-04-25 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 탠덤 안내 시스템, 방법 및 조성물의 전달, 조작 및 최적화
CN113425857A (zh) 2013-06-17 2021-09-24 布罗德研究所有限公司 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途
WO2014202250A1 (en) 2013-06-19 2014-12-24 Kolibree Toothbrush system with sensors for a dental hygiene monitoring system
EP3019595A4 (en) 2013-07-09 2016-11-30 THERAPEUTIC USES OF A GENERIC CHANGE WITH CRISPR / CAS SYSTEMS
JP7019233B2 (ja) * 2013-07-11 2022-02-15 モデルナティエックス インコーポレイテッド CRISPR関連タンパク質をコードする合成ポリヌクレオチドおよび合成sgRNAを含む組成物ならびに使用方法
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
CN105829536A (zh) 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
TW201542816A (zh) 2013-09-18 2015-11-16 Kymab Ltd 方法、細胞與生物體
WO2015054507A1 (en) 2013-10-10 2015-04-16 Pronutria, Inc. Nutritive polypeptide production systems, and methods of manufacture and use thereof
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
LT3066201T (lt) 2013-11-07 2018-08-10 Editas Medicine, Inc. Su crispr susiję būdai ir kompozicijos su valdančiomis grnr
RU2725520C2 (ru) 2013-12-11 2020-07-02 Регенерон Фармасьютикалс, Инк. Способы и композиции для направленной модификации генома
WO2015089427A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
BR112016013547A2 (pt) 2013-12-12 2017-10-03 Broad Inst Inc Composições e métodos de uso de sistemas crispr-cas em distúrbios de repetições de nucleotídeos
EP4219699A1 (en) 2013-12-12 2023-08-02 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
SG10201804977UA (en) 2013-12-12 2018-07-30 Broad Inst Inc Delivery, Use and Therapeutic Applications of the Crispr-Cas Systems and Compositions for Targeting Disorders and Diseases Using Particle Delivery Components
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
CA2932478A1 (en) 2013-12-12 2015-06-18 Massachusetts Institute Of Technology Delivery, use and therapeutic applications of the crispr-cas systems and compositions for genome editing
WO2015089486A2 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
EP3080261B1 (en) 2013-12-12 2019-05-22 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for hbv and viral diseases and disorders
CN111705365A (zh) 2014-02-11 2020-09-25 科罗拉多州立大学董事会(法人团体) Crispr支持的多路基因组工程化
AU2015219167A1 (en) 2014-02-18 2016-09-08 Duke University Compositions for the inactivation of virus replication and methods of making and using the same
EP3514246B1 (en) 2014-02-27 2021-11-17 The Broad Institute, Inc. T cell balance gene expression and methods of use thereof
CA3194412A1 (en) 2014-02-27 2015-09-03 Monsanto Technology Llc Compositions and methods for site directed genomic modification
EP3114227B1 (en) 2014-03-05 2021-07-21 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
CA2947941C (en) 2014-03-05 2021-02-23 National University Corporation Kobe University Genome sequence modification method for specifically converting nucleic acid bases of targeted dna sequence, and molecular complex for use in same
DK3116997T3 (da) 2014-03-10 2019-08-19 Editas Medicine Inc Crispr/cas-relaterede fremgangsmåder og sammensætninger til behandling af lebers kongenitale amaurose 10 (lca10)
US11141493B2 (en) 2014-03-10 2021-10-12 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
US11339437B2 (en) 2014-03-10 2022-05-24 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
WO2015148863A2 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
AU2015236033B2 (en) 2014-03-26 2018-06-07 University Of Maryland, College Park Targeted genome editing in zygotes of domestic large animals
EP3498845B1 (en) * 2014-04-01 2022-06-22 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 1 (hsv-1)
KR102596508B1 (ko) 2014-04-10 2023-10-30 10엑스 제노믹스, 인크. 시약을 캡슐화 및 구획화하기 위한 유체 디바이스, 시스템, 및 방법, 및 이의 응용
MX2016013832A (es) 2014-04-25 2017-03-09 Children´S Medical Center Corp Composiciones y metodos para tratar hemoglobinopatias.
AU2015266776A1 (en) 2014-05-30 2016-12-08 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods of delivering treatments for latent viral infections
CA2952121A1 (en) 2014-06-13 2015-12-17 Childrens' Medical Center Corporation Products and methods to isolate mitochondria
KR102425438B1 (ko) 2014-06-23 2022-07-27 더 제너럴 하스피탈 코포레이션 서열결정에 의해 평가된 DSB의 게놈 전체에 걸친 비편향된 확인 (GUIDE-Seq)
WO2015200555A2 (en) * 2014-06-25 2015-12-30 Caribou Biosciences, Inc. Rna modification to engineer cas9 activity
CN106795553B (zh) 2014-06-26 2021-06-04 10X基因组学有限公司 分析来自单个细胞或细胞群体的核酸的方法
AU2015288157A1 (en) 2014-07-11 2017-01-19 E. I. Du Pont De Nemours And Company Compositions and methods for producing plants resistant to glyphosate herbicide
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
CN104195177B (zh) * 2014-08-05 2017-06-09 南京大学 一种显著提高鱼类基因组编辑效率的方法
EP3180426B1 (en) 2014-08-17 2019-12-25 The Broad Institute, Inc. Genome editing using cas9 nickases
EP3633047B1 (en) 2014-08-19 2022-12-28 Pacific Biosciences of California, Inc. Method of sequencing nucleic acids based on an enrichment of nucleic acids
US9970030B2 (en) 2014-08-27 2018-05-15 Caribou Biosciences, Inc. Methods for increasing CAS9-mediated engineering efficiency
WO2016036754A1 (en) 2014-09-02 2016-03-10 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification
EP3191595B1 (en) 2014-09-12 2019-12-25 E. I. du Pont de Nemours and Company Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
WO2016049251A1 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
WO2016049163A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
US10040048B1 (en) 2014-09-25 2018-08-07 Synthego Corporation Automated modular system and method for production of biopolymers
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
EP3212788A2 (en) 2014-10-27 2017-09-06 The Broad Institute, Inc. Compositions, methods and use of synthetic lethal screening
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
US20170362627A1 (en) * 2014-11-10 2017-12-21 Modernatx, Inc. Multiparametric nucleic acid optimization
WO2016086197A1 (en) 2014-11-25 2016-06-02 The Brigham And Women's Hospital, Inc. Method of identifying and treating a person having a predisposition to or afflicted with a cardiometabolic disease
KR101833433B1 (ko) * 2014-11-25 2018-02-28 한국생명공학연구원 돼지 t 세포 및 b 세포 면역결핍 세포주 생산 및 그의 제조 방법
CA2969145A1 (en) 2014-11-26 2016-06-02 The Regents Of The University Of California Therapeutic compositions comprising transcription factors and methods of making and using the same
GB201421096D0 (en) 2014-11-27 2015-01-14 Imp Innovations Ltd Genome editing methods
WO2016089866A1 (en) * 2014-12-01 2016-06-09 President And Fellows Of Harvard College Rna-guided systems for in vivo gene editing
KR20240013283A (ko) * 2014-12-03 2024-01-30 애질런트 테크놀로지스, 인크. 화학적 변형을 갖는 가이드 rna
CN113699116A (zh) 2014-12-10 2021-11-26 明尼苏达大学董事会 用于治疗疾病的遗传修饰的细胞、组织和器官
WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
EP3230451B1 (en) 2014-12-12 2021-04-07 The Broad Institute, Inc. Protected guide rnas (pgrnas)
DK3234133T3 (da) 2014-12-18 2021-02-08 Integrated Dna Tech Inc Crispr-baserede sammensætninger og fremgangsmåder til anvendelse
WO2016100974A1 (en) 2014-12-19 2016-06-23 The Broad Institute Inc. Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
EP3702456A1 (en) 2014-12-24 2020-09-02 The Broad Institute, Inc. Crispr having or associated with destabilization domains
WO2016108926A1 (en) 2014-12-30 2016-07-07 The Broad Institute Inc. Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis
WO2016114972A1 (en) 2015-01-12 2016-07-21 The Regents Of The University Of California Heterodimeric cas9 and methods of use thereof
KR102321863B1 (ko) 2015-01-12 2021-11-08 10엑스 제노믹스, 인크. 핵산 시퀀싱 라이브러리의 제조 방법 및 시스템 및 이를 이용하여 제조한 라이브러리
US11180792B2 (en) 2015-01-28 2021-11-23 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
KR20170126875A (ko) 2015-01-28 2017-11-20 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 Crispr 하이브리드 dna/rna 폴리뉴클레오티드 및 사용 방법
AU2016225179C1 (en) 2015-02-23 2022-11-03 Crispr Therapeutics Ag Materials and methods for treatment of hemoglobinopathies
US10697000B2 (en) 2015-02-24 2020-06-30 10X Genomics, Inc. Partition processing methods and systems
EP3262193A2 (en) 2015-02-26 2018-01-03 The Broad Institute Inc. T cell balance gene expression, compositions of matters and methods of use thereof
US11261466B2 (en) 2015-03-02 2022-03-01 Sinai Health System Homologous recombination factors
EP3858990A1 (en) 2015-03-03 2021-08-04 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
EP4019635A1 (en) * 2015-03-25 2022-06-29 Editas Medicine, Inc. Crispr/cas-related methods, compositions and components
BR112017017260A2 (pt) 2015-03-27 2018-04-17 Du Pont construções de dna, vetor, célula, plantas, semente, método de expressão de rna e método de modificação de local alvo
KR20240038141A (ko) * 2015-04-06 2024-03-22 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
US11180793B2 (en) 2015-04-24 2021-11-23 Editas Medicine, Inc. Evaluation of Cas9 molecule/guide RNA molecule complexes
JP7288302B2 (ja) 2015-05-08 2023-06-07 ザ チルドレンズ メディカル センター コーポレーション 胎児型ヘモグロビン再誘導のための、bcl11aエンハンサー機能性領域を標的とする方法
WO2016182893A1 (en) 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
WO2016182959A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
US10117911B2 (en) 2015-05-29 2018-11-06 Agenovir Corporation Compositions and methods to treat herpes simplex virus infections
US10392607B2 (en) 2015-06-03 2019-08-27 The Regents Of The University Of California Cas9 variants and methods of use thereof
WO2016196887A1 (en) 2015-06-03 2016-12-08 Board Of Regents Of The University Of Nebraska Dna editing using single-stranded dna
US20180296537A1 (en) 2015-06-05 2018-10-18 Novartis Ag Methods and compositions for diagnosing, treating, and monitoring treatment of shank3 deficiency associated disorders
JP7396783B2 (ja) 2015-06-09 2023-12-12 エディタス・メディシン、インコーポレイテッド 移植を改善するためのcrispr/cas関連方法および組成物
US20160362667A1 (en) * 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
WO2016205680A1 (en) 2015-06-17 2016-12-22 The Uab Research Foundation Crispr/cas9 complex for introducing a functional polypeptide into cells of blood cell lineage
WO2016205703A1 (en) 2015-06-17 2016-12-22 The Uab Research Foundation Crispr/cas9 complex for genomic editing
WO2016205728A1 (en) 2015-06-17 2016-12-22 Massachusetts Institute Of Technology Crispr mediated recording of cellular events
EP3929287A3 (en) 2015-06-18 2022-04-13 The Broad Institute, Inc. Crispr enzyme mutations reducing off-target effects
US10648020B2 (en) 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
WO2016205745A2 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Cell sorting
EP3436575A1 (en) 2015-06-18 2019-02-06 The Broad Institute Inc. Novel crispr enzymes and systems
EP3666895A1 (en) 2015-06-18 2020-06-17 The Broad Institute, Inc. Novel crispr enzymes and systems
JP2018519811A (ja) 2015-06-29 2018-07-26 アイオーニス ファーマシューティカルズ, インコーポレーテッドIonis Pharmaceuticals,Inc. 修飾crispr rna及び修飾単一crispr rnaならびにその使用
WO2017004279A2 (en) * 2015-06-29 2017-01-05 Massachusetts Institute Of Technology Compositions comprising nucleic acids and methods of using the same
WO2017023803A1 (en) 2015-07-31 2017-02-09 Regents Of The University Of Minnesota Modified cells and methods of therapy
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
US11214800B2 (en) 2015-08-18 2022-01-04 The Broad Institute, Inc. Methods and compositions for altering function and structure of chromatin loops and/or domains
KR20180038558A (ko) * 2015-08-25 2018-04-16 듀크 유니버시티 Rna-가이드된 엔도뉴클레아제를 이용하는 게놈 조작에서 특이성을 개선하는 조성물 및 방법
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
EP3341477B1 (en) 2015-08-28 2022-03-23 The General Hospital Corporation Engineered crispr-cas9 nucleases
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
CN107922949A (zh) * 2015-08-31 2018-04-17 安捷伦科技有限公司 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法
CN108271384B (zh) 2015-09-09 2022-04-15 国立大学法人神户大学 用于特异性转变靶向dna序列的核酸碱基的革兰氏阳性菌的基因组序列的转变方法、及其使用的分子复合体
JP2018530536A (ja) 2015-09-11 2018-10-18 ザ ジェネラル ホスピタル コーポレイション ヌクレアーゼDSBの完全照合およびシーケンシング(FIND−seq)
EP3350203A4 (en) * 2015-09-17 2019-06-26 The Regents of The University of California CAS9 VARIANTS POLYPEPTIDES COMPRISING INTERNAL INSERTIONS
CN108350454B (zh) * 2015-09-21 2022-05-10 阿克丘勒斯治疗公司 等位基因选择性基因编辑及其用途
EP3786294A1 (en) 2015-09-24 2021-03-03 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
JP2018529353A (ja) 2015-09-30 2018-10-11 ザ ジェネラル ホスピタル コーポレイション 配列決定法による切断事象の包括的生体外報告(CIRCLE−seq)
WO2017069958A2 (en) 2015-10-09 2017-04-27 The Brigham And Women's Hospital, Inc. Modulation of novel immune checkpoint targets
US11970710B2 (en) 2015-10-13 2024-04-30 Duke University Genome engineering with Type I CRISPR systems in eukaryotic cells
KR20180133374A (ko) 2015-10-22 2018-12-14 더 브로드 인스티튜트, 인코퍼레이티드 타입 vi-b crispr 효소 및 시스템
WO2017070633A2 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
WO2017070598A1 (en) 2015-10-23 2017-04-27 Caribou Biosciences, Inc. Engineered crispr class 2 cross-type nucleic-acid targeting nucleic acids
EP3368687B1 (en) 2015-10-27 2021-09-29 The Broad Institute, Inc. Compositions and methods for targeting cancer-specific sequence variations
US11092607B2 (en) 2015-10-28 2021-08-17 The Board Institute, Inc. Multiplex analysis of single cell constituents
WO2017075478A2 (en) 2015-10-28 2017-05-04 The Broad Institute Inc. Compositions and methods for evaluating and modulating immune responses by use of immune cell gene signatures
WO2017075294A1 (en) 2015-10-28 2017-05-04 The Board Institute Inc. Assays for massively combinatorial perturbation profiling and cellular circuit reconstruction
WO2017075451A1 (en) 2015-10-28 2017-05-04 The Broad Institute Inc. Compositions and methods for evaluating and modulating immune responses by detecting and targeting pou2af1
WO2017075465A1 (en) 2015-10-28 2017-05-04 The Broad Institute Inc. Compositions and methods for evaluating and modulating immune responses by detecting and targeting gata3
AU2016349288A1 (en) 2015-11-03 2018-05-31 President And Fellows Of Harvard College Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix
EP4036228A1 (en) 2015-11-13 2022-08-03 Avellino Lab USA, Inc. Methods for the treatment of corneal dystrophies
WO2017087395A1 (en) * 2015-11-16 2017-05-26 Research Institute At Nationwide Children's Hospital Materials and methods for treatment of titin-based myopathies and other titinopaties
WO2017087708A1 (en) 2015-11-19 2017-05-26 The Brigham And Women's Hospital, Inc. Lymphocyte antigen cd5-like (cd5l)-interleukin 12b (p40) heterodimers in immunity
CN108350499B (zh) * 2015-11-19 2022-05-13 10X基因组学有限公司 可转化标记组合物、方法及结合其的过程
US11371094B2 (en) 2015-11-19 2022-06-28 10X Genomics, Inc. Systems and methods for nucleic acid processing using degenerate nucleotides
KR102061438B1 (ko) * 2015-11-27 2019-12-31 고쿠리츠다이가쿠호진 고베다이가쿠 표적화 dna 서열 중의 핵산 염기가 특이적으로 전환되어 있는 단자엽식물 게놈 서열을 전환시키는 방법, 및 그것에 사용되는 분자 복합체
EP3397261A4 (en) 2015-11-30 2019-07-03 Flagship Pioneering Innovations V, Inc. METHODS AND COMPOSITIONS RELATING TO THE CHONDRISOMES
SG11201803593QA (en) 2015-12-04 2018-06-28 Caribou Biosciences Inc Engineered nucleic-acid targeting nucleic acids
SG11201804086VA (en) 2015-12-04 2018-06-28 10X Genomics Inc Methods and compositions for nucleic acid analysis
WO2017100376A2 (en) 2015-12-07 2017-06-15 Zymergen, Inc. Promoters from corynebacterium glutamicum
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
WO2017106569A1 (en) 2015-12-18 2017-06-22 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
WO2017106767A1 (en) * 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
AU2016382512A1 (en) 2015-12-30 2018-07-12 Novartis Ag Immune effector cell therapies with enhanced efficacy
IL304088A (en) 2016-01-11 2023-08-01 Univ Leland Stanford Junior Systems containing chimeric proteins and their uses for controlling gene expression
MY194127A (en) 2016-01-11 2022-11-14 Univ Leland Stanford Junior Chimeric proteins and methods of immunotherapy
US11845933B2 (en) * 2016-02-03 2023-12-19 Massachusetts Institute Of Technology Structure-guided chemical modification of guide RNA and its applications
WO2017139309A1 (en) 2016-02-12 2017-08-17 Ceres, Inc. Methods and materials for high throughput testing of mutagenized allele combinations
EP3417061B1 (en) 2016-02-18 2022-10-26 The Regents of the University of California Methods and compositions for gene editing in stem cells
US20190144942A1 (en) 2016-02-22 2019-05-16 Massachusetts Institute Of Technology Methods for identifying and modulating immune phenotypes
EP3420089B1 (en) * 2016-02-26 2021-12-29 LanzaTech NZ, Inc. Crispr/cas systems for c-1 fixing bacteria
JP2019515654A (ja) 2016-03-16 2019-06-13 ザ ジェイ. デヴィッド グラッドストーン インスティテューツ 肥満及び/又は糖尿病を処置するための方法及び組成物、並びに候補処置薬剤を識別するための方法及び組成物
WO2017161325A1 (en) 2016-03-17 2017-09-21 Massachusetts Institute Of Technology Methods for identifying and modulating co-occurant cellular phenotypes
EP3219799A1 (en) 2016-03-17 2017-09-20 IMBA-Institut für Molekulare Biotechnologie GmbH Conditional crispr sgrna expression
CA3018729A1 (en) 2016-03-23 2017-09-28 The Regents Of The University Of California Methods of treating mitochondrial disorders
WO2017165859A1 (en) * 2016-03-24 2017-09-28 Research Institute At Nationwide Children's Hospital Modified viral capsid proteins
EP3433364A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
WO2017165826A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
WO2017180694A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof
SG11201808920RA (en) * 2016-04-14 2018-11-29 Boco Silicon Valley Inc Genome editing of human neural stem cells using nucleases
EP3445853A1 (en) 2016-04-19 2019-02-27 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
CA3026055A1 (en) * 2016-04-19 2017-10-26 The Broad Institute, Inc. Novel crispr enzymes and systems
AU2017257624B2 (en) 2016-04-25 2023-05-25 President And Fellows Of Harvard College Hybridization chain reaction methods for in situ molecular detection
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10767175B2 (en) * 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
CA3028158A1 (en) 2016-06-17 2017-12-21 The Broad Institute, Inc. Type vi crispr orthologs and systems
LT3474669T (lt) 2016-06-24 2022-06-10 The Regents Of The University Of Colorado, A Body Corporate Barkodu pažymėtų kombinatorinių bibliotekų generavimo būdai
US11471462B2 (en) 2016-06-27 2022-10-18 The Broad Institute, Inc. Compositions and methods for detecting and treating diabetes
CA3029271A1 (en) 2016-06-28 2018-01-04 Cellectis Altering expression of gene products in plants through targeted insertion of nucleic acid sequences
KR102345899B1 (ko) 2016-06-30 2021-12-31 지머젠 인코포레이티드 박테리아 헤모글로빈 라이브러리를 생성하는 방법 및 이의 용도
JP2019519241A (ja) 2016-06-30 2019-07-11 ザイマージェン インコーポレイテッド グルコース透過酵素ライブラリーを生成するための方法およびその使用
WO2018013840A1 (en) 2016-07-13 2018-01-18 Vertex Pharmaceuticals Incorporated Methods, compositions and kits for increasing genome editing efficiency
US11566263B2 (en) 2016-08-02 2023-01-31 Editas Medicine, Inc. Compositions and methods for treating CEP290 associated disease
US11078481B1 (en) 2016-08-03 2021-08-03 KSQ Therapeutics, Inc. Methods for screening for cancer targets
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
US11352647B2 (en) 2016-08-17 2022-06-07 The Broad Institute, Inc. Crispr enzymes and systems
US20210166783A1 (en) 2016-08-17 2021-06-03 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
US11630103B2 (en) 2016-08-17 2023-04-18 The Broad Institute, Inc. Product and methods useful for modulating and evaluating immune responses
US11810649B2 (en) 2016-08-17 2023-11-07 The Broad Institute, Inc. Methods for identifying novel gene editing elements
WO2020225754A1 (en) 2019-05-06 2020-11-12 Mcmullen Tara Crispr gene editing for autosomal dominant diseases
KR102594051B1 (ko) 2016-08-20 2023-10-26 아벨리노 랩 유에스에이, 인크. 단일 가이드 RNA, CRISPR/Cas9 시스템, 및 이의 사용방법
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11078483B1 (en) 2016-09-02 2021-08-03 KSQ Therapeutics, Inc. Methods for measuring and improving CRISPR reagent function
WO2018049025A2 (en) 2016-09-07 2018-03-15 The Broad Institute Inc. Compositions and methods for evaluating and modulating immune responses
US20190225974A1 (en) 2016-09-23 2019-07-25 BASF Agricultural Solutions Seed US LLC Targeted genome optimization in plants
CA3034931A1 (en) 2016-09-23 2018-03-29 Board Of Trustees Of Southern Illinois University Tuning crispr/cas9 activity with chemically modified nucleotide substitutions
US11873504B2 (en) 2016-09-30 2024-01-16 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
US10669539B2 (en) 2016-10-06 2020-06-02 Pioneer Biolabs, Llc Methods and compositions for generating CRISPR guide RNA libraries
WO2018067991A1 (en) 2016-10-07 2018-04-12 The Brigham And Women's Hospital, Inc. Modulation of novel immune checkpoint targets
KR102606680B1 (ko) 2016-10-07 2023-11-27 인티그레이티드 디엔에이 테크놀로지스 아이엔씨. S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드
US11242542B2 (en) 2016-10-07 2022-02-08 Integrated Dna Technologies, Inc. S. pyogenes Cas9 mutant genes and polypeptides encoded by same
CA3039928A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
GB201617559D0 (en) 2016-10-17 2016-11-30 University Court Of The University Of Edinburgh The Swine comprising modified cd163 and associated methods
CN110520530A (zh) 2016-10-18 2019-11-29 明尼苏达大学董事会 肿瘤浸润性淋巴细胞和治疗方法
WO2018083606A1 (en) 2016-11-01 2018-05-11 Novartis Ag Methods and compositions for enhancing gene editing
EP4256951A3 (en) 2016-11-04 2023-12-06 Flagship Pioneering Innovations V. Inc. Novel plant cells, plants, and seeds
AU2017364084A1 (en) 2016-11-22 2019-05-16 Integrated Dna Technologies, Inc. CRISPR/Cpf1 systems and methods
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
WO2018111947A1 (en) 2016-12-12 2018-06-21 Integrated Dna Technologies, Inc. Genome editing enhancement
CN110582302A (zh) 2016-12-14 2019-12-17 利甘达尔股份有限公司 用于核酸和/或蛋白有效负载递送的组合物和方法
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
AU2018212986A1 (en) 2017-01-28 2019-08-08 Inari Agriculture Technology, Inc. Novel plant cells, plants, and seeds
CN117512066A (zh) 2017-01-30 2024-02-06 10X基因组学有限公司 用于基于微滴的单细胞条形编码的方法和系统
TW201839136A (zh) 2017-02-06 2018-11-01 瑞士商諾華公司 治療血色素異常症之組合物及方法
US10995333B2 (en) 2017-02-06 2021-05-04 10X Genomics, Inc. Systems and methods for nucleic acid preparation
EP3580337A4 (en) 2017-02-10 2020-12-02 Zymergen, Inc. MODULAR UNIVERSAL PLASMID DESIGN STRATEGY FOR COMPILING AND PROCESSING SEVERAL DNA CONSTRUCTS FOR SEVERAL HOST
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
WO2018170184A1 (en) 2017-03-14 2018-09-20 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
EP4361261A2 (en) 2017-03-15 2024-05-01 The Broad Institute Inc. Novel cas13b orthologues crispr enzymes and systems
US20200115753A1 (en) 2017-03-17 2020-04-16 Massachusetts Institute Of Technology Methods for identifying and modulating co-occurant cellular phenotypes
IL306092A (en) 2017-03-23 2023-11-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
WO2018183908A1 (en) 2017-03-31 2018-10-04 Dana-Farber Cancer Institute, Inc. Compositions and methods for treating ovarian tumors
WO2018183921A1 (en) 2017-04-01 2018-10-04 The Broad Institute, Inc. Methods and compositions for detecting and modulating an immunotherapy resistance gene signature in cancer
WO2018191553A1 (en) 2017-04-12 2018-10-18 Massachusetts Eye And Ear Infirmary Tumor signature for metastasis, compositions of matter methods of use thereof
US11840711B2 (en) 2017-04-12 2023-12-12 The Broad Institute, Inc. Type VI CRISPR orthologs and systems
WO2018191520A1 (en) 2017-04-12 2018-10-18 The Broad Institute, Inc. Respiratory and sweat gland ionocytes
US20200405639A1 (en) 2017-04-14 2020-12-31 The Broad Institute, Inc. Novel delivery of large payloads
EP3612629A1 (en) 2017-04-18 2020-02-26 The Broad Institute, Inc. Compositions for detecting secretion and methods of use
US20200384115A1 (en) 2017-04-21 2020-12-10 The Broad Institute , Inc. Targeted delivery to beta cells
CA3059956A1 (en) 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
WO2018204777A2 (en) 2017-05-05 2018-11-08 The Broad Institute, Inc. Methods for identification and modification of lncrna associated with target genotypes and phenotypes
WO2018208067A1 (ko) * 2017-05-08 2018-11-15 주식회사 툴젠 인위적으로 조작된 조작면역세포
WO2018209158A2 (en) 2017-05-10 2018-11-15 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
EP3625343A1 (en) 2017-05-18 2020-03-25 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
US11326157B2 (en) 2017-05-25 2022-05-10 The General Hospital Corporation Base editors with improved precision and specificity
US11788087B2 (en) 2017-05-25 2023-10-17 The Children's Medical Center Corporation BCL11A guide delivery
SG11201901822QA (en) 2017-05-26 2019-03-28 10X Genomics Inc Single cell analysis of transposase accessible chromatin
US10844372B2 (en) 2017-05-26 2020-11-24 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
EP3409104A1 (en) 2017-05-31 2018-12-05 Vilmorin et Cie Tomato plant resistant to tomato yellow leaf curl virus, powdery mildew, and nematodes
EP3409106A1 (en) 2017-06-01 2018-12-05 Vilmorin et Cie Tolerance in plants of solanum lycopersicum to the tobamovirus tomato brown rugose fruit virus (tbrfv)
WO2020249996A1 (en) 2019-06-14 2020-12-17 Vilmorin & Cie Resistance in plants of solanum lycopersicum to the tobamovirus tomato brown rugose fruit virus
CA3102054A1 (en) 2017-06-05 2018-12-13 Fred Hutchinson Cancer Research Center Genomic safe harbors for genetic therapies in human stem cells and engineered nanoparticles to provide targeted genetic therapies
ES2875579T3 (es) 2017-06-06 2021-11-10 Zymergen Inc Plataforma de ingeniería genómica de HTP para mejorar Escherichia coli
JP7227162B2 (ja) 2017-06-06 2023-02-21 ザイマージェン インコーポレイテッド 真菌株を改良するためのhtpゲノム操作プラットフォーム
JP2020524497A (ja) 2017-06-09 2020-08-20 エディタス・メディシン,インコーポレイテッド 操作されたcas9ヌクレアーゼ
JP2020524993A (ja) 2017-06-13 2020-08-27 フラッグシップ パイオニアリング イノベーションズ ブイ, インコーポレイテッド クロンを含む組成物及びその使用
WO2018232195A1 (en) 2017-06-14 2018-12-20 The Broad Institute, Inc. Compositions and methods targeting complement component 3 for inhibiting tumor growth
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
AU2018290843A1 (en) 2017-06-26 2020-01-16 Massachusetts Institute Of Technology CRISPR/Cas-adenine deaminase based compositions, systems, and methods for targeted nucleic acid editing
WO2019006418A2 (en) 2017-06-30 2019-01-03 Intima Bioscience, Inc. ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY
US20200140896A1 (en) 2017-06-30 2020-05-07 Novartis Ag Methods for the treatment of disease with gene editing systems
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
EP3640333A4 (en) * 2017-07-14 2020-12-30 Cure Genetics Co., Ltd GENE EDITING SYSTEM AND GENE EDITING METHOD
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
WO2019040650A1 (en) 2017-08-23 2019-02-28 The General Hospital Corporation GENETICALLY MODIFIED CRISPR-CAS9 NUCLEASES HAVING MODIFIED PAM SPECIFICITY
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CA3073848A1 (en) 2017-09-21 2019-03-28 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
EP3684389A4 (en) 2017-09-21 2021-06-16 Dana Farber Cancer Institute, Inc. INSULATION, PRESERVATION, COMPOSITIONS AND USES OF EXTRACTS FROM JUSTICIA PLANTS
US11572574B2 (en) 2017-09-28 2023-02-07 Toolgen Incorporated Artificial genome manipulation for gene expression regulation
SG11202002130WA (en) * 2017-09-28 2020-04-29 Toolgen Inc Artificial genome manipulation for gene expression regulation
US20200255828A1 (en) 2017-10-04 2020-08-13 The Broad Institute, Inc. Methods and compositions for altering function and structure of chromatin loops and/or domains
WO2019075197A1 (en) 2017-10-11 2019-04-18 The General Hospital Corporation METHODS OF DETECTION OF INDIVIDUAL SITE-SPECIFIC PARASITE GENOMIC DEAMINATION BY BASE EDITING TECHNOLOGIES
WO2019079347A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
US11680296B2 (en) 2017-10-16 2023-06-20 Massachusetts Institute Of Technology Mycobacterium tuberculosis host-pathogen interaction
BR112020007823A2 (pt) 2017-10-20 2020-10-27 Fred Hutchinson Cancer Research Center sistemas e métodos para produzir células b geneticamente modificadas para expressar anticorpos selecionados
WO2019089803A1 (en) 2017-10-31 2019-05-09 The Broad Institute, Inc. Methods and compositions for studying cell evolution
EP3704245A1 (en) 2017-11-01 2020-09-09 Novartis AG Synthetic rnas and methods of use
WO2019084664A1 (en) * 2017-11-02 2019-05-09 The Governors Of The University Of Alberta Chemically-modified guide rnas to improve crispr-cas protein specificity
EP3710039A4 (en) 2017-11-13 2021-08-04 The Broad Institute, Inc. METHODS AND COMPOSITIONS FOR CANCER TREATMENT BY TARGETING THE CLEC2D-KLRB1 PATH
SG11201913654QA (en) 2017-11-15 2020-01-30 10X Genomics Inc Functionalized gel beads
EP3710583A1 (en) * 2017-11-16 2020-09-23 Astrazeneca AB Compositions and methods for improving the efficacy of cas9-based knock-in strategies
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
BR112020009663A2 (pt) 2017-11-17 2020-11-10 Iovance Biotherapeutics, Inc. método para a expansão de linfócitos infiltrantes de tumor (tils) em uma população terapêutica de tils, método para o tratamento de um indivíduo com câncer, composição
JP2021503885A (ja) 2017-11-22 2021-02-15 アイオバンス バイオセラピューティクス,インコーポレイテッド 末梢血からの末梢血リンパ球(pbl)の拡大培養
US11332736B2 (en) 2017-12-07 2022-05-17 The Broad Institute, Inc. Methods and compositions for multiplexing single cell and single nuclei sequencing
US11939575B2 (en) 2017-12-19 2024-03-26 City Of Hope Modified tracrRNAs gRNAs, and uses thereof
RU2652899C1 (ru) * 2017-12-28 2018-05-03 Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) РНК-проводники для подавления репликации вируса гепатита B и для элиминации вируса гепатита B из клетки-хозяина
CN111566121A (zh) 2018-01-12 2020-08-21 巴斯夫欧洲公司 小麦7a染色体上决定每穗小穗数QTL的基因
CN111757876B (zh) 2018-01-17 2024-03-22 沃泰克斯药物股份有限公司 Dna-pk抑制剂
JP7466448B2 (ja) 2018-01-17 2024-04-12 バーテックス ファーマシューティカルズ インコーポレイテッド Dna-pk阻害剤
BR112020013626A2 (pt) 2018-01-17 2020-12-01 Vertex Pharmaceuticals Incorporated compostos de quinoxalinona, composições, métodos e kits para aumentar a eficiência de edição de genoma
US20190233816A1 (en) 2018-01-26 2019-08-01 Massachusetts Institute Of Technology Structure-guided chemical modification of guide rna and its applications
US11926835B1 (en) 2018-01-29 2024-03-12 Inari Agriculture Technology, Inc. Methods for efficient tomato genome editing
US11566236B2 (en) 2018-02-05 2023-01-31 Vertex Pharmaceuticals Incorporated Materials and methods for treatment of hemoglobinopathies
EP3749768A1 (en) 2018-02-05 2020-12-16 Vertex Pharmaceuticals Incorporated Materials and methods for treatment of hemoglobinopathies
KR20200119239A (ko) 2018-02-08 2020-10-19 지머젠 인코포레이티드 코리네박테리움에서 crispr을 사용하는 게놈 편집
EP3752832A1 (en) 2018-02-12 2020-12-23 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
PL235163B1 (pl) * 2018-04-05 2020-06-01 Inst Hodowli I Aklimatyzacji Roslin Panstwowy Inst Badawczy Sekwencja nukleotydowa syntetycznego genu Cas9, kaseta kierująca sgRNA do edytowania genomu roślinnego i wydajny system do ukierunkowanej mutagenezy wybranego regionu genomu roślinnego
CA3096274A1 (en) 2018-04-06 2019-10-10 Children's Medical Center Corporation Compositions and methods for somatic cell reprogramming and modulating imprinting
CN112262218A (zh) 2018-04-06 2021-01-22 10X基因组学有限公司 用于单细胞处理中的质量控制的系统和方法
CN112313241A (zh) 2018-04-17 2021-02-02 总医院公司 核酸结合、修饰、和切割试剂的底物偏好和位点的灵敏体外试验
CN117534769A (zh) 2018-04-19 2024-02-09 加利福尼亚大学董事会 用于基因编辑的组合物和方法
EP3781711A4 (en) 2018-04-19 2022-01-26 Massachusetts Institute Of Technology SINGLE STRAND BREAK DETECTION IN DOUBLE STRAND DNA
DK3560330T3 (da) 2018-04-24 2022-07-11 Kws Saat Se & Co Kgaa Planter med forbedret fordøjelighed og markørhaplotyper
US11957695B2 (en) 2018-04-26 2024-04-16 The Broad Institute, Inc. Methods and compositions targeting glucocorticoid signaling for modulating immune responses
KR20210005932A (ko) 2018-04-27 2021-01-15 진에딧 인코포레이티드 양이온성 폴리머 및 생분자 전달을 위한 이용
SG11202010319RA (en) 2018-04-27 2020-11-27 Iovance Biotherapeutics Inc Closed process for expansion and gene editing of tumor infiltrating lymphocytes and uses of same in immunotherapy
US20210147831A1 (en) 2018-04-27 2021-05-20 The Broad Institute, Inc. Sequencing-based proteomics
EP3788144A4 (en) * 2018-05-01 2022-05-11 The Children's Medical Center Corporation DELIVERY AND EDITING OF EXTENDED BCL11A-RNP/CRISPR USING A 3XNLS-CAS9
US20210386829A1 (en) 2018-05-04 2021-12-16 The Broad Institute, Inc. Compositions and methods for modulating cgrp signaling to regulate innate lymphoid cell inflammatory responses
JP2021523745A (ja) 2018-05-16 2021-09-09 シンテゴ コーポレイション ガイドrna設計および使用のための方法およびシステム
CN108707628B (zh) * 2018-05-28 2021-11-23 上海海洋大学 斑马鱼notch2基因突变体的制备方法
US20210371932A1 (en) 2018-06-01 2021-12-02 Massachusetts Institute Of Technology Methods and compositions for detecting and modulating microenvironment gene signatures from the csf of metastasis patients
US11866719B1 (en) 2018-06-04 2024-01-09 Inari Agriculture Technology, Inc. Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants
EP3802790A4 (en) 2018-06-07 2022-03-23 The Brigham and Women's Hospital, Inc. METHODS FOR GENERATION OF HEMATOPOIETIC STEM CELLS
US20220403001A1 (en) 2018-06-12 2022-12-22 Obsidian Therapeutics, Inc. Pde5 derived regulatory constructs and methods of use in immunotherapy
KR20210024009A (ko) 2018-06-26 2021-03-04 더 브로드 인스티튜트, 인코퍼레이티드 Crispr/cas 및 트랜스포사제 기반 증폭 조성물, 시스템 및 방법
WO2020006036A1 (en) 2018-06-26 2020-01-02 Massachusetts Institute Of Technology Crispr effector system based amplification methods, systems, and diagnostics
WO2020002592A1 (en) 2018-06-29 2020-01-02 Stichting Het Nederlands Kanker Instituut - Antoni Van Leeuwenhoek Ziekenhuis Traf2 inhibitors for use in the treatment of a cancer
CN112513270A (zh) 2018-07-13 2021-03-16 加利福尼亚大学董事会 基于逆转录转座子的递送媒介物及其使用方法
US20200032335A1 (en) 2018-07-27 2020-01-30 10X Genomics, Inc. Systems and methods for metabolome analysis
WO2020028555A2 (en) 2018-07-31 2020-02-06 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
AU2019318079A1 (en) 2018-08-07 2021-01-28 Massachusetts Institute Of Technology Novel Cas12b enzymes and systems
EP3607819A1 (en) 2018-08-10 2020-02-12 Vilmorin et Cie Resistance to xanthomonas campestris pv. campestris (xcc) in cauliflower
CN112703250A (zh) 2018-08-15 2021-04-23 齐默尔根公司 CRISPRi在高通量代谢工程中的应用
WO2020041387A1 (en) 2018-08-20 2020-02-27 The Brigham And Women's Hospital, Inc. Degradation domain modifications for spatio-temporal control of rna-guided nucleases
WO2020041380A1 (en) 2018-08-20 2020-02-27 The Broad Institute, Inc. Methods and compositions for optochemical control of crispr-cas9
US20230021641A1 (en) * 2018-08-23 2023-01-26 The Broad Institute, Inc. Cas9 variants having non-canonical pam specificities and uses thereof
KR20210049124A (ko) 2018-08-23 2021-05-04 상가모 테라퓨틱스, 인코포레이티드 조작된 표적 특이적 염기 편집기
US11459551B1 (en) 2018-08-31 2022-10-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
EP3847650A1 (en) 2018-09-06 2021-07-14 The Broad Institute, Inc. Nucleic acid assemblies for use in targeted delivery
US20220098613A1 (en) 2018-09-12 2022-03-31 Fred Hutchinson Cancer Research Center Reducing cd33 expression to selectively protect therapeutic cells
CN113164623A (zh) 2018-09-18 2021-07-23 维恩维纽克公司 基于arc的衣壳及其用途
WO2020069029A1 (en) 2018-09-26 2020-04-02 Emendobio Inc. Novel crispr nucleases
WO2020077236A1 (en) 2018-10-12 2020-04-16 The Broad Institute, Inc. Method for extracting nuclei or whole cells from formalin-fixed paraffin-embedded tissues
WO2020081730A2 (en) 2018-10-16 2020-04-23 Massachusetts Institute Of Technology Methods and compositions for modulating microenvironment
EP3870600A1 (en) 2018-10-24 2021-09-01 Obsidian Therapeutics, Inc. Er tunable protein regulation
US20210371590A1 (en) 2018-10-24 2021-12-02 GenEdit, Inc. Cationic polymer with alkyl side chains and use for biomolecule delivery
US11407995B1 (en) 2018-10-26 2022-08-09 Inari Agriculture Technology, Inc. RNA-guided nucleases and DNA binding proteins
CA3117805A1 (en) 2018-10-31 2020-05-07 Zymergen Inc. Multiplexed deterministic assembly of dna libraries
US20220010321A1 (en) * 2018-11-01 2022-01-13 Keygene N.V. Dual guide rna for crispr/cas genome editing in plants cells
US11434477B1 (en) 2018-11-02 2022-09-06 Inari Agriculture Technology, Inc. RNA-guided nucleases and DNA binding proteins
TW202039829A (zh) 2018-11-05 2020-11-01 美商艾歐凡斯生物治療公司 改善之腫瘤反應性t細胞的選擇
EP3877513A2 (en) 2018-11-05 2021-09-15 Iovance Biotherapeutics, Inc. Processes for production of tumor infiltrating lymphocytes and uses of the same in immunotherapy
MX2021004775A (es) 2018-11-05 2021-06-08 Iovance Biotherapeutics Inc Expansion de linfocitos infiltrantes de tumores (tils) usando inhibidores de la via de proteina cinasa b (akt).
BR112021008549A2 (pt) 2018-11-05 2022-01-04 Iovance Biotherapeutics Inc Método de tratamento de carcinoma pulmonar de células não pequenas com uma população de linfócitos infiltrantes de tumor
CN111655042A (zh) 2018-11-08 2020-09-11 特里同阿盖亚创新公司 藻类中过量产生原卟啉ix的方法及由此产生的组合物
US11459607B1 (en) 2018-12-10 2022-10-04 10X Genomics, Inc. Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes
US11166996B2 (en) 2018-12-12 2021-11-09 Flagship Pioneering Innovations V, Inc. Anellovirus compositions and methods of use
CN113166744A (zh) 2018-12-14 2021-07-23 先锋国际良种公司 用于基因组编辑的新颖crispr-cas系统
EP3898958A1 (en) 2018-12-17 2021-10-27 The Broad Institute, Inc. Crispr-associated transposase systems and methods of use thereof
US20220062394A1 (en) 2018-12-17 2022-03-03 The Broad Institute, Inc. Methods for identifying neoantigens
US20220193131A1 (en) 2018-12-19 2022-06-23 Iovance Biotherapeutics, Inc. Methods of Expanding Tumor Infiltrating Lymphocytes Using Engineered Cytokine Receptor Pairs and Uses Thereof
WO2020142754A2 (en) 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
US11739156B2 (en) 2019-01-06 2023-08-29 The Broad Institute, Inc. Massachusetts Institute of Technology Methods and compositions for overcoming immunosuppression
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
US20220119871A1 (en) 2019-01-28 2022-04-21 The Broad Institute, Inc. In-situ spatial transcriptomics
WO2020163396A1 (en) 2019-02-04 2020-08-13 The General Hospital Corporation Adenine dna base editor variants with reduced off-target rna editing
US20220098621A1 (en) 2019-02-05 2022-03-31 Emendobio Inc. Crispr compositions and methods for promoting gene editing of ribosomal protein s19 (rps19) gene
WO2020163856A1 (en) 2019-02-10 2020-08-13 The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone Modified mitochondrion and methods of use thereof
US11851683B1 (en) 2019-02-12 2023-12-26 10X Genomics, Inc. Methods and systems for selective analysis of cellular samples
US20220133795A1 (en) 2019-03-01 2022-05-05 Iovance Biotherapeutics, Inc. Expansion of Tumor Infiltrating Lymphocytes From Liquid Tumors and Therapeutic Uses Thereof
DE212020000516U1 (de) 2019-03-07 2022-01-17 The Regents of the University of California CRISPR-CAS-Effektorpolypeptide
US11053515B2 (en) 2019-03-08 2021-07-06 Zymergen Inc. Pooled genome editing in microbes
US20230026259A1 (en) 2019-03-08 2023-01-26 Obsidian Therapeutics, Inc. Ca2 compositions and methods for tunable regulation
CA3129871A1 (en) 2019-03-08 2020-09-17 Zymergen Inc. Iterative genome editing in microbes
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
WO2020206036A1 (en) 2019-04-01 2020-10-08 The Broad Institute, Inc. Novel nucleic acid modifier
JP7426120B2 (ja) 2019-04-05 2024-02-01 国立大学法人大阪大学 ノックイン細胞の作製方法
KR20220005019A (ko) 2019-04-23 2022-01-12 진에딧 인코포레이티드 알킬 곁사슬을 갖는 양이온성 폴리머
BR112021022411A2 (pt) 2019-05-13 2022-03-15 Kws Saat Se & Co Kgaa Tolerância à seca em milho
WO2020232029A1 (en) 2019-05-13 2020-11-19 Iovance Biotherapeutics, Inc. Methods and compositions for selecting tumor infiltrating lymphocytes and uses of the same in immunotherapy
US20220235340A1 (en) 2019-05-20 2022-07-28 The Broad Institute, Inc. Novel crispr-cas systems and uses thereof
US20220220469A1 (en) 2019-05-20 2022-07-14 The Broad Institute, Inc. Non-class i multi-component nucleic acid targeting systems
AR118995A1 (es) 2019-05-25 2021-11-17 Kws Saat Se & Co Kgaa Mejorador de la inducción de haploides
CA3142035A1 (en) 2019-05-28 2020-12-03 Genedit Inc. Polymer comprising multiple functionalized sidechains for biomolecule delivery
US20220243178A1 (en) 2019-05-31 2022-08-04 The Broad Institute, Inc. Methods for treating metabolic disorders by targeting adcy5
WO2020254850A1 (en) 2019-06-21 2020-12-24 Vilmorin & Cie Improvement of quality and permanence of green color of peppers at maturity and over-maturity
BR112021026220A2 (pt) 2019-06-25 2022-02-15 Inari Agriculture Tech Inc Edição aprimorada do genoma por reparo dependente de homologia
BR112021026832A2 (pt) 2019-07-02 2022-05-10 Hutchinson Fred Cancer Res Vetores ad35 recombinantes e aprimoramentos da terapia gênica relacionada
WO2021019272A1 (en) 2019-07-31 2021-02-04 Vilmorin & Cie Tolerance to tolcndv in cucumber
EP3772542A1 (en) 2019-08-07 2021-02-10 KWS SAAT SE & Co. KGaA Modifying genetic variation in crops by modulating the pachytene checkpoint protein 2
WO2021028359A1 (en) 2019-08-09 2021-02-18 Sangamo Therapeutics France Controlled expression of chimeric antigen receptors in t cells
WO2021041922A1 (en) 2019-08-30 2021-03-04 The Broad Institute, Inc. Crispr-associated mu transposase systems
CA3150235A1 (en) 2019-09-05 2021-03-11 Alireza Rezania UNIVERSAL DONOR CELLS
JP2022547053A (ja) 2019-09-05 2022-11-10 クリスパー セラピューティクス アクチェンゲゼルシャフト ユニバーサルドナー細胞
WO2021046451A1 (en) 2019-09-06 2021-03-11 Obsidian Therapeutics, Inc. Compositions and methods for dhfr tunable protein regulation
WO2021055874A1 (en) 2019-09-20 2021-03-25 The Broad Institute, Inc. Novel type vi crispr enzymes and systems
EP4041894A1 (en) 2019-09-23 2022-08-17 Omega Therapeutics, Inc. COMPOSITIONS AND METHODS FOR MODULATING HEPATOCYTE NUCLEAR FACTOR 4-ALPHA (HNF4a) GENE EXPRESSION
CN114391040A (zh) 2019-09-23 2022-04-22 欧米茄治疗公司 用于调节载脂蛋白b(apob)基因表达的组合物和方法
EP4045522A1 (en) 2019-10-17 2022-08-24 KWS SAAT SE & Co. KGaA Enhanced disease resistance of crops by downregulation of repressor genes
CA3155727A1 (en) 2019-10-25 2021-04-29 Cecile Chartier-Courtaud Gene editing of tumor infiltrating lymphocytes and uses of same in immunotherapy
GB201916020D0 (en) 2019-11-04 2019-12-18 Univ Of Essex Enterprise Limited Crispr-mediated identification of biotinylated proteins and chromatin regions
EP4057802A1 (en) 2019-11-14 2022-09-21 Vilmorin & Cie Resistance to acidovorax valerianellae in corn salad
JP2023506734A (ja) 2019-12-11 2023-02-20 アイオバンス バイオセラピューティクス,インコーポレイテッド 腫瘍浸潤リンパ球(til)の産生のためのプロセス及びそれを使用する方法
CA3164591A1 (en) 2020-01-13 2021-07-22 William Dowdle Modification of blood type antigens
AU2021211713A1 (en) 2020-01-23 2022-08-25 The Children's Medical Center Corporation Stroma-free T cell differentiation from human pluripotent stem cells
EP3872190A1 (en) 2020-02-26 2021-09-01 Antibodies-Online GmbH A method of using cut&run or cut&tag to validate crispr-cas targeting
WO2021170787A1 (en) 2020-02-28 2021-09-02 KWS SAAT SE & Co. KGaA Method for rapid genome modification in recalcitrant plants
EP4110929A1 (en) 2020-02-28 2023-01-04 KWS SAAT SE & Co. KGaA Immature inflorescence meristem editing
AU2021234302A1 (en) 2020-03-11 2022-11-10 Omega Therapeutics, Inc. Compositions and methods for modulating forkhead box p3 (foxp3) gene expression
WO2021202938A1 (en) 2020-04-03 2021-10-07 Creyon Bio, Inc. Oligonucleotide-based machine learning
WO2021216622A1 (en) 2020-04-21 2021-10-28 Aspen Neuroscience, Inc. Gene editing of gba1 in stem cells and method of use of cells differentiated therefrom
WO2021216623A1 (en) 2020-04-21 2021-10-28 Aspen Neuroscience, Inc. Gene editing of lrrk2 in stem cells and method of use of cells differentiated therefrom
EP4138805A1 (en) 2020-04-23 2023-03-01 Genedit Inc. Polymer with cationic and hydrophobic side chains
EP4146794A1 (en) 2020-05-04 2023-03-15 Iovance Biotherapeutics, Inc. Processes for production of tumor infiltrating lymphocytes and uses of the same in immunotherapy
US20230193212A1 (en) 2020-05-06 2023-06-22 Orchard Therapeutics (Europe) Limited Treatment for neurodegenerative diseases
KR20230019843A (ko) 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
UY39237A (es) 2020-05-29 2021-12-31 Kws Saat Se & Co Kgaa Inducción de haploides en plantas
WO2021245435A1 (en) 2020-06-03 2021-12-09 Vilmorin & Cie Melon plants resistant to scab disease, aphids and powdery mildew
EP4161552A1 (en) 2020-06-05 2023-04-12 The Broad Institute, Inc. Compositions and methods for treating neoplasia
CA3186284A1 (en) 2020-06-05 2021-12-09 Vilmorin & Cie Resistance in plants of solanum lycopersicum to the tobrfv
EP4172340A1 (en) 2020-06-29 2023-05-03 KWS SAAT SE & Co. KGaA Boosting homology directed repair in plants
WO2022034474A1 (en) 2020-08-10 2022-02-17 Novartis Ag Treatments for retinal degenerative diseases
WO2022069693A1 (en) 2020-10-02 2022-04-07 Vilmorin & Cie Melon with extended shelf life
WO2022076606A1 (en) 2020-10-06 2022-04-14 Iovance Biotherapeutics, Inc. Treatment of nsclc patients with tumor infiltrating lymphocyte therapies
US20230372397A1 (en) 2020-10-06 2023-11-23 Iovance Biotherapeutics, Inc. Treatment of nsclc patients with tumor infiltrating lymphocyte therapies
EP4237568A1 (en) 2020-10-27 2023-09-06 KWS SAAT SE & Co. KGaA Use of enhanced pol theta activity for eukaryotic genome engineering
US20230416709A1 (en) 2020-11-06 2023-12-28 Editforce, Inc. Foki nuclease domain mutant
EP4243608A1 (en) 2020-11-11 2023-09-20 Leibniz-Institut für Pflanzenbiochemie (IPB) Fusion protein for editing endogenous dna of a eukaryotic cell
EP4001429A1 (en) 2020-11-16 2022-05-25 Antibodies-Online GmbH Analysis of crispr-cas binding and cleavage sites followed by high-throughput sequencing (abc-seq)
JP2023551722A (ja) 2020-12-03 2023-12-12 ビルモラン エ コンパニー ToBRFV、TMV、ToMV、およびToMMVに対する耐性を有するトマト植物および対応する耐性遺伝子
US20240123067A1 (en) 2020-12-17 2024-04-18 Iovance Biotherapeutics, Inc. Treatment of cancers with tumor infiltrating lymphocyte therapies
WO2022133140A1 (en) 2020-12-17 2022-06-23 Iovance Biotherapeutics, Inc. Treatment with tumor infiltrating lymphocyte therapies in combination with ctla-4 and pd-1 inhibitors
WO2022140605A2 (en) * 2020-12-22 2022-06-30 Ensoma, Inc. Adenoviral serotype 35 helper vectors
KR20230124682A (ko) 2020-12-23 2023-08-25 플래그쉽 파이어니어링 이노베이션스 브이, 인크. Rna를 봉입하는 아넬로바이러스 캡시드의 시험관 내어셈블리
WO2022144856A1 (en) 2020-12-31 2022-07-07 Crispr Therapeutics Ag Universal donor cells
JP2024506557A (ja) 2021-01-29 2024-02-14 アイオバンス バイオセラピューティクス,インコーポレイテッド 修飾された腫瘍浸潤リンパ球を作製する方法及び養子細胞療法におけるそれらの使用
WO2022198141A1 (en) 2021-03-19 2022-09-22 Iovance Biotherapeutics, Inc. Methods for tumor infiltrating lymphocyte (til) expansion related to cd39/cd69 selection and gene knockout in tils
KR20240009393A (ko) 2021-03-31 2024-01-22 엔트라다 테라퓨틱스, 인크. 사이클릭 세포 침투 펩티드
WO2022208489A1 (en) 2021-04-02 2022-10-06 Vilmorin & Cie Semi-determinate or determinate growth habit trait in cucurbita
EP4326287A2 (en) 2021-04-19 2024-02-28 Iovance Biotherapeutics, Inc. Chimeric costimulatory receptors, chemokine receptors, and the use of same in cellular immunotherapies
WO2022235929A1 (en) 2021-05-05 2022-11-10 Radius Pharmaceuticals, Inc. Animal model having homologous recombination of mouse pth1 receptor
JP2024518068A (ja) 2021-05-10 2024-04-24 エントラーダ セラピューティクス,インコーポレイティド 細胞内治療のための組成物及び方法
WO2022240760A2 (en) 2021-05-10 2022-11-17 Entrada Therapeutics, Inc. COMPOSITIONS AND METHODS FOR MODULATING mRNA SPLICING
WO2022240721A1 (en) 2021-05-10 2022-11-17 Entrada Therapeutics, Inc. Compositions and methods for modulating interferon regulatory factor-5 (irf-5) activity
EP4340850A1 (en) 2021-05-17 2024-03-27 Iovance Biotherapeutics, Inc. Pd-1 gene-edited tumor infiltrating lymphocytes and uses of same in immunotherapy
GB202107057D0 (en) 2021-05-18 2021-06-30 Univ York Glycosylation method
WO2022243437A1 (en) 2021-05-19 2022-11-24 KWS SAAT SE & Co. KGaA Sample preparation with oppositely oriented guide polynucleotides
IL308806A (en) 2021-06-01 2024-01-01 Arbor Biotechnologies Inc Gene editing systems including nuclease crisper and their uses
WO2022256448A2 (en) 2021-06-01 2022-12-08 Artisan Development Labs, Inc. Compositions and methods for targeting, editing, or modifying genes
EP4352131A1 (en) 2021-06-11 2024-04-17 Genedit Inc. Biodegradable polymer comprising side chains with polyamine and polyalkylene oxide groups
WO2022266538A2 (en) 2021-06-18 2022-12-22 Artisan Development Labs, Inc. Compositions and methods for targeting, editing or modifying human genes
KR20240038967A (ko) 2021-06-23 2024-03-26 엔트라다 테라퓨틱스, 인크. Cug 반복을 표적화하기 위한 안티센스 화합물 및 방법
WO2023283359A2 (en) 2021-07-07 2023-01-12 Omega Therapeutics, Inc. Compositions and methods for modulating secreted frizzled receptor protein 1 (sfrp1) gene expression
CA3226111A1 (en) 2021-07-22 2023-01-26 Iovance Biotherapeutics, Inc. Method for cryopreservation of solid tumor fragments
WO2023009716A1 (en) 2021-07-28 2023-02-02 Iovance Biotherapeutics, Inc. Treatment of cancer patients with tumor infiltrating lymphocyte therapies in combination with kras inhibitors
AR126622A1 (es) 2021-07-30 2023-10-25 Kws Saat Se & Co Kgaa Plantas con digestibilidad mejorada y haplotipos marcadores
WO2023012325A1 (en) 2021-08-06 2023-02-09 Vilmorin & Cie Resistance to leveillula taurica in pepper
KR20240055811A (ko) 2021-09-10 2024-04-29 애질런트 테크놀로지스, 인크. 프라임 편집을 위한 화학적 변형을 갖는 가이드 rna
EP4166670A1 (en) 2021-10-18 2023-04-19 KWS SAAT SE & Co. KGaA Plant-tag-based weeding control
AR127482A1 (es) 2021-10-27 2024-01-31 Iovance Biotherapeutics Inc Sistemas y métodos para coordinar la fabricación de células para inmunoterapia específica de paciente
WO2023077148A1 (en) 2021-11-01 2023-05-04 Tome Biosciences, Inc. Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo
WO2023081756A1 (en) 2021-11-03 2023-05-11 The J. David Gladstone Institutes, A Testamentary Trust Established Under The Will Of J. David Gladstone Precise genome editing using retrons
WO2023086803A1 (en) 2021-11-10 2023-05-19 Iovance Biotherapeutics, Inc. Methods of expansion treatment utilizing cd8 tumor infiltrating lymphocytes
WO2023093862A1 (en) 2021-11-26 2023-06-01 Epigenic Therapeutics Inc. Method of modulating pcsk9 and uses thereof
GB202118058D0 (en) 2021-12-14 2022-01-26 Univ Warwick Methods to increase yields in crops
US20230279442A1 (en) 2021-12-15 2023-09-07 Versitech Limited Engineered cas9-nucleases and method of use thereof
TW202342757A (zh) 2021-12-17 2023-11-01 美商薩那生物科技公司 經修飾副黏液病毒科附著醣蛋白
WO2023115039A2 (en) 2021-12-17 2023-06-22 Sana Biotechnology, Inc. Modified paramyxoviridae fusion glycoproteins
WO2023118349A1 (en) 2021-12-21 2023-06-29 Alia Therapeutics Srl Type ii cas proteins and applications thereof
WO2023122764A1 (en) 2021-12-22 2023-06-29 Tome Biosciences, Inc. Co-delivery of a gene editor construct and a donor template
WO2023122800A1 (en) 2021-12-23 2023-06-29 University Of Massachusetts Therapeutic treatment for fragile x-associated disorder
WO2023133595A2 (en) 2022-01-10 2023-07-13 Sana Biotechnology, Inc. Methods of ex vivo dosing and administration of lipid particles or viral vectors and related systems and uses
WO2023141602A2 (en) 2022-01-21 2023-07-27 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2023147488A1 (en) 2022-01-28 2023-08-03 Iovance Biotherapeutics, Inc. Cytokine associated tumor infiltrating lymphocytes compositions and methods
WO2023150518A1 (en) 2022-02-01 2023-08-10 Sana Biotechnology, Inc. Cd3-targeted lentiviral vectors and uses thereof
WO2023150647A1 (en) 2022-02-02 2023-08-10 Sana Biotechnology, Inc. Methods of repeat dosing and administration of lipid particles or viral vectors and related systems and uses
WO2023167882A1 (en) 2022-03-01 2023-09-07 Artisan Development Labs, Inc. Composition and methods for transgene insertion
WO2023194359A1 (en) 2022-04-04 2023-10-12 Alia Therapeutics Srl Compositions and methods for treatment of usher syndrome type 2a
WO2023196877A1 (en) 2022-04-06 2023-10-12 Iovance Biotherapeutics, Inc. Treatment of nsclc patients with tumor infiltrating lymphocyte therapies
EP4256950A1 (en) 2022-04-06 2023-10-11 Vilmorin et Cie Tolerance to cgmmv in cucumber
WO2023201369A1 (en) 2022-04-15 2023-10-19 Iovance Biotherapeutics, Inc. Til expansion processes using specific cytokine combinations and/or akti treatment
WO2023205744A1 (en) 2022-04-20 2023-10-26 Tome Biosciences, Inc. Programmable gene insertion compositions
WO2023215831A1 (en) 2022-05-04 2023-11-09 Tome Biosciences, Inc. Guide rna compositions for programmable gene insertion
WO2023219933A1 (en) 2022-05-09 2023-11-16 Entrada Therapeutics, Inc. Compositions and methods for delivery of nucleic acid therapeutics
WO2023220608A1 (en) 2022-05-10 2023-11-16 Iovance Biotherapeutics, Inc. Treatment of cancer patients with tumor infiltrating lymphocyte therapies in combination with an il-15r agonist
WO2023225670A2 (en) 2022-05-20 2023-11-23 Tome Biosciences, Inc. Ex vivo programmable gene insertion
WO2023225410A2 (en) 2022-05-20 2023-11-23 Artisan Development Labs, Inc. Systems and methods for assessing risk of genome editing events
WO2023230578A2 (en) 2022-05-25 2023-11-30 Flagship Pioneering Innovations Vii, Llc Compositions and methods for modulating circulating factors
WO2023230573A2 (en) 2022-05-25 2023-11-30 Flagship Pioneering Innovations Vii, Llc Compositions and methods for modulation of immune responses
WO2023230566A2 (en) 2022-05-25 2023-11-30 Flagship Pioneering Innovations Vii, Llc Compositions and methods for modulating cytokines
WO2023230570A2 (en) 2022-05-25 2023-11-30 Flagship Pioneering Innovations Vii, Llc Compositions and methods for modulating genetic drivers
WO2023230549A2 (en) 2022-05-25 2023-11-30 Flagship Pioneering Innovations Vii, Llc Compositions and methods for modulation of tumor suppressors and oncogenes
JP7152094B1 (ja) * 2022-06-30 2022-10-12 リージョナルフィッシュ株式会社 tracrRNAユニット、及びゲノム編集方法
GB2621813A (en) 2022-06-30 2024-02-28 Univ Newcastle Preventing disease recurrence in Mitochondrial replacement therapy
EP4299739A1 (en) 2022-06-30 2024-01-03 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
EP4299733A1 (en) 2022-06-30 2024-01-03 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
WO2024005864A1 (en) 2022-06-30 2024-01-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
WO2024005863A1 (en) 2022-06-30 2024-01-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
WO2024020346A2 (en) 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
WO2024020587A2 (en) 2022-07-22 2024-01-25 Tome Biosciences, Inc. Pleiopluripotent stem cell programmable gene insertion
WO2024044655A1 (en) 2022-08-24 2024-02-29 Sana Biotechnology, Inc. Delivery of heterologous proteins
WO2024044723A1 (en) 2022-08-25 2024-02-29 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2024042199A1 (en) 2022-08-26 2024-02-29 KWS SAAT SE & Co. KGaA Use of paired genes in hybrid breeding
WO2024053964A1 (ko) * 2022-09-06 2024-03-14 주식회사 툴젠 캄필로박터 제주니 유래 cas9의 가이드 rna 구조변화를 통한 유전자교정 향상 시스템
WO2024056880A2 (en) 2022-09-16 2024-03-21 Alia Therapeutics Srl Enqp type ii cas proteins and applications thereof
WO2024064838A1 (en) 2022-09-21 2024-03-28 Sana Biotechnology, Inc. Lipid particles comprising variant paramyxovirus attachment glycoproteins and uses thereof
WO2024081820A1 (en) 2022-10-13 2024-04-18 Sana Biotechnology, Inc. Viral particles targeting hematopoietic stem cells
CN115982034B (zh) * 2022-12-30 2023-11-28 云舟生物科技(广州)股份有限公司 载体构建系统虚拟终端的测试方法、存储介质及电子设备

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
DE3751873T2 (de) 1986-04-09 1997-02-13 Genzyme Corp Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US7150982B2 (en) * 1991-09-09 2006-12-19 Third Wave Technologies, Inc. RNA detection assays
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7868149B2 (en) 1999-07-20 2011-01-11 Monsanto Technology Llc Plant genome sequence and uses thereof
US6603061B1 (en) 1999-07-29 2003-08-05 Monsanto Company Agrobacterium-mediated plant transformation method
US7033744B2 (en) * 2001-03-16 2006-04-25 Naoya Kobayashi Method for proliferating a liver cell, a liver cell obtained thereby, and use thereof
US20090100536A1 (en) 2001-12-04 2009-04-16 Monsanto Company Transgenic plants with enhanced agronomic traits
US20070134796A1 (en) * 2005-07-26 2007-06-14 Sangamo Biosciences, Inc. Targeted integration and expression of exogenous nucleic acid sequences
EP1994182B1 (en) * 2006-03-15 2019-05-29 Siemens Healthcare Diagnostics Inc. Degenerate nucleobase analogs
JP5932207B2 (ja) * 2007-03-02 2016-06-08 デュポン ニュートリション バイオサイエンシス エーピーエス 改善されたファージ耐性をもつ培養物
US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
US20100076057A1 (en) * 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
JP5681114B2 (ja) * 2008-12-04 2015-03-04 サンガモ バイオサイエンシーズ, インコーポレイテッド 亜鉛フィンガーヌクレアーゼを使用したラットのゲノム編集
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
JP5944320B2 (ja) * 2009-11-27 2016-07-05 ビーエーエスエフ プラント サイエンス カンパニー ゲーエムベーハー 最適化エンドヌクレアーゼおよびその使用
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
EP2569425B1 (en) 2010-05-10 2016-07-06 The Regents of The University of California Endoribonuclease compositions and methods of use thereof
AU2011256838B2 (en) * 2010-05-17 2014-10-09 Sangamo Therapeutics, Inc. Novel DNA-binding proteins and uses thereof
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
JP6158170B2 (ja) * 2011-04-27 2017-07-12 アミリス, インコーポレイテッド ゲノム修飾のための方法
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
LT2800811T (lt) * 2012-05-25 2017-09-11 The Regents Of The University Of California Būdai ir kompozicijos, skirti tikslinės dnr modifikavimui, panaudojant adresuotą rnr, ir transkripcijos moduliavimui, panaudojant adresuotą rnr
KR101656237B1 (ko) * 2012-10-23 2016-09-12 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
PL3138910T3 (pl) * 2012-12-06 2018-01-31 Sigma Aldrich Co Llc Oparta na CRISPR modyfikacja i regulacja genomu
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
US8697359B1 (en) * 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
PT2784162E (pt) * 2012-12-12 2015-08-27 Broad Inst Inc Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
MX2015007743A (es) 2012-12-17 2015-12-07 Harvard College Ingenieria del genoma humano guiada por ácido robonucleico.

Also Published As

Publication number Publication date
KR20150105633A (ko) 2015-09-17
CN113528577A (zh) 2021-10-22
IL239344B1 (en) 2024-02-01
US20140273232A1 (en) 2014-09-18
AU2019229420B2 (en) 2022-06-02
IL307735A (en) 2023-12-01
JP6960950B2 (ja) 2021-11-05
PL2771468T3 (pl) 2015-07-31
JP2022023118A (ja) 2022-02-07
US8906616B2 (en) 2014-12-09
JP2018099131A (ja) 2018-06-28
PT2771468E (pt) 2015-06-02
HK1209154A1 (en) 2016-03-24
JP2016165307A (ja) 2016-09-15
HK1209153A1 (zh) 2016-03-24
HK1216759A1 (zh) 2016-12-02
RU2015128098A (ru) 2019-03-28
ES2598115T3 (es) 2017-01-25
AU2019229420A1 (en) 2019-10-03
CA2894701A1 (en) 2014-06-19
EP2771468B1 (en) 2015-02-11
WO2014093712A1 (en) 2014-06-19
AU2016244241B2 (en) 2019-06-20
JP6726225B2 (ja) 2020-07-22
ES2536353T3 (es) 2015-05-22
JP6960951B2 (ja) 2021-11-05
PT2896697E (pt) 2015-12-31
CN105121648B (zh) 2021-05-07
AU2013359123B2 (en) 2016-07-14
JP2019103510A (ja) 2019-06-27
JP7198328B2 (ja) 2022-12-28
JP2016129516A (ja) 2016-07-21
JP6420273B2 (ja) 2018-11-07
US20150232882A1 (en) 2015-08-20
HK1202586A1 (en) 2015-10-02
AU2016244241C1 (en) 2020-12-17
US20140242664A1 (en) 2014-08-28
RU2019127300A (ru) 2019-09-19
RU2015128098A3 (es) 2019-03-28
ES2553782T3 (es) 2015-12-11
AU2016244241A1 (en) 2016-11-03
HK1210221A1 (en) 2016-04-15
EP4279588A2 (en) 2023-11-22
DK2771468T3 (en) 2015-05-26
JP2016504026A (ja) 2016-02-12
AU2013359123A1 (en) 2015-07-30
RU2701850C2 (ru) 2019-10-01
US20150247150A1 (en) 2015-09-03
PL2921557T3 (pl) 2017-03-31
PT2921557T (pt) 2016-10-19
JP2017205127A (ja) 2017-11-24
EP4279588A3 (en) 2024-01-17
EP2771468A1 (en) 2014-09-03
US20160340662A1 (en) 2016-11-24
JP6203879B2 (ja) 2017-09-27
CN105121648A (zh) 2015-12-02
WO2014093712A9 (en) 2014-08-21
JP2019103511A (ja) 2019-06-27
PT2784162E (pt) 2015-08-27
JP6495395B2 (ja) 2019-04-03
JP2023040015A (ja) 2023-03-22
AU2022203762A1 (en) 2022-06-23
JP2016093196A (ja) 2016-05-26
IL239344A0 (en) 2015-07-30
MX2015007549A (es) 2017-01-20

Similar Documents

Publication Publication Date Title
ES2542015T3 (es) Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
ES2552535T3 (es) Sistemas de CRISPR-Cas y métodos para alterar la expresión de productos génicos
EP2784162B1 (en) Engineering of systems, methods and optimized guide compositions for sequence manipulation
ES2635244T3 (es) Sistemas, métodos y composiciones de componentes de CRISPR-Cas para manipulación de secuencias
US8932814B2 (en) CRISPR-Cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
ES2576126T3 (es) Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
EP4286402A2 (en) Crispr-cas component systems, methods and compositions for sequence manipulation
RU2796017C2 (ru) Конструирование систем, способы и оптимизированные направляющие композиции для манипуляции с последовательностями