MXPA03011801A - Secuencias de acido desoxirribonucleico (adn) que comprenden cualidades reguladoras de transcripcion de genes y metodos para deteccion y uso de secuencias de acido desoxirribonucleico (adn). - Google Patents

Secuencias de acido desoxirribonucleico (adn) que comprenden cualidades reguladoras de transcripcion de genes y metodos para deteccion y uso de secuencias de acido desoxirribonucleico (adn).

Info

Publication number
MXPA03011801A
MXPA03011801A MXPA03011801A MXPA03011801A MXPA03011801A MX PA03011801 A MXPA03011801 A MX PA03011801A MX PA03011801 A MXPA03011801 A MX PA03011801A MX PA03011801 A MXPA03011801 A MX PA03011801A MX PA03011801 A MXPA03011801 A MX PA03011801A
Authority
MX
Mexico
Prior art keywords
sequence
star
transcription
dna
gene
Prior art date
Application number
MXPA03011801A
Other languages
English (en)
Inventor
Leo Kruckberg Arthur
Original Assignee
Chromagenics Bv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP01202581A external-priority patent/EP1273666A1/en
Application filed by Chromagenics Bv filed Critical Chromagenics Bv
Publication of MXPA03011801A publication Critical patent/MXPA03011801A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

La invencion es concerniente con la elucidacion sistematica e identificacion de secuencias reguladoras. La invencion provee entre otros, metodos de separacion por exclusion y deteccion con los cuales las secuencias reguladoras puede ser identificadas. La invencion ademas provee secuencias reguladoras y el uso de estas en varios campos como son, pero no limitados a produccion de proteina, diagnosticos, plantas y animales transgenicos, y el campo terapeutico.

Description

SECUENCIAS DE ACIDO DESOXIRRIBONUCLEICO (ADN) QUE COMPRENDEN CUALIDADES REGULADORAS DE TRANSCRIPCION DE GENES Y METODOS PARA" DETECCION Y USO DE SECUENCIAS DE ÁCIDO DESOXIRRIBONUCLEICO (ADN) "5" Campo de la Invención La invención está relacionada a los campos de medicina y biología celular. La invención en particular se refiere a medios y métodos para regulación de la transcripción de 0 genes. La invención además se refiere a medios y métodos para determinar si una secuencia de ADN comprende una cualidad de modulación de transcripción de gen y/o una cualidad de represión de transcripción de genes. Antecedentes de la Invención 15 Con el desarrollo de los diversos proyectos de genoma, las secuencias de genomas de organismos completos se han hecho disponibles . La avalancha de datos ha aumentado el interés de muchos investigadores . Uno de los descubrimientos más notables fue la observación de que el genoma humano no 0 codifica significativamente más genes que el genoma de organismos simples como la mosca de la fruta. El foco de muchos investigadores es ahora cambiar de la identif cación de genes a la determinación de expresión de genes y función de genes. Ejemplos _de tales tecnologías son 5 microconfiguraciones de ADN, aplicaciones genómicas REF: 152518 funcionales y proteómicas. Estas tecnologías tienen en común que están centradas alrededor de la función y expresión de secuencias de codificación. Sin embargo, mientras nuestro conocimiento de genes aumenta dramáticamente, la comprensión de cómo la expresión de los genes es regulada está limitando la capacidad para aplicar este conocimiento que se incrementa rápidamente. Esto es, por ejemplo el caso en la generación de plantas y animales transgénicos y en terapia de genes humanos. En estas aplicaciones el ácido nucleico externo es típicamente introducido en las células para obtener expresión de secuencias de codificación. A menudo la integración del ácido nucleico externo en el genoma de la célula es requerido para función prolongada de las secuencias introducidas . Sin embargo, la integración de secuencias en el genoma lleva a impredictibilidad de expresión debido a que el ADN circundante influye la transcripción de las secuencias integradas. Esta impredictibilidad es en parte debida al hecho de que las secuencias introducidas no pueden ser provistas todavía con suficiente información genética para aislar funcionalmente las secuencias integradas de los efectos de influencia de transcripción del ADN circundante. Por otra parte, esto es debido al hecho de que no se conoce suficiente acerca de los efectos de influencia de transcripción del ADN circundante.
Descripción detallada de la Invención La presente invención es concerniente con secuencias de ADN que comprenden una capacidad para influir la transcripción de genes in cis. Típicamente, aunque no necesariamente, las secuencias investigadas no codifican por ellas mismas para una proteína funcional . Han sido identificados varios elementos de secuencia con la capacidad para afectar la transcripción del gen in cis. Estos elementos ordenan desde promotores, mej oradores, y silenciadores a elementos limitadores y regiones adjuntas de matriz. El hecho de que muchos tipos diferentes de secuencias reguladoras han sido descubiertas, da la impresión de que es muy fácil diseñar casetes de expresión efectivos. Sin embargo, completamente lo contrario es verdad. El diseño de casetes de expresión es todavía a menudo conducido por prueba y error. A menudo es completamente posible obtener algún tipo de expresión de un gen externo en una célula objetivo o su progenitora. Sin embargo, muy a menudo es difícil predecir con cualquier tipo de precisión el nivel de expresión o la persistencia de expresión que un cásete de expresión puede exhibir en una célula objetivo. La presente invención provee entre otros medios y métodos para detectar y aislar nuevos elementos reguladores de transcripción. Es provisto un método de detección, y selección opcional, de una secuencia de ADN con una cualidad de modulación de transcripción de gen, que comprende la provisión de un sistema de transcripción con una variedad de unos vectores que comprenden fragmentos, los vectores comprenden i) un elemento con una cualidad de represión de transcripción de gen, y ii) un promotor dirigiendo la transcripción de un gen reportero, el método además que comprende la realización de un paso de selección en el sistema de transcripción con el propósito de identificar la secuencia de ADN con la cualidad de modulación de transcripción del gen. En una modalidad preferida los fragmentos son localizados entre i) el elemento con una cualidad de represión de transcripción del gen, y ii) el promotor dirigiendo la transcripción del gen reportero. La polimerasa de ARN inicia el proceso de transcripción después de enlazar a una secuencia específica, llamada promotor, aquello señala dónde debe iniciar la síntesis de ARN. Una cualidad de modulación puede mejorar la transcripción del promotor in cis, en un tipo de célula dado y/o en un promotor dado. La misma secuencia de ADN puede comprender una cualidad de mejoramiento en un tipo de célula o con un tipo de promotor, considerando que este puede comprender otro o no cualidad de modulación de transcripción de gen en otra célula o con otro tipo de promotor. La transcripción puede ser influenciada a través de un efecto directo del elemento regulador (o la proteína (s) que enlazan a este) en la transcripción de un promotor particular. La transcripción puede sin embargo, también ser influenciada por un efecto indirecto, esto es porque el elemento regulador afecta la función de uno o más de otros elementos reguladores . Una cualidad de modulación de transcripción de gen también puede comprender una cualidad de transcripción de gen estable. Con estable se entiende que el nivel de transcripción observado no es cambiado significativamente sobre por lo menos 30 divisiones de célula. Una cualidad estable es usada en situaciones en las cuales las características de expresión deben ser predecibles sobre muchas divisiones de célula. Ejemplos típicos son líneas de célula transfectadas con genes externos. Otros ejemplos son animales y plantas transgénicos y terapias de gen. Muy a menudo, los casetes de expresión introducidos funcionan diferentemente después de incrementar números de divisiones de célula o generaciones de planta o animal. En una modalidad preferida una cualidad estable comprende una capacidad para mantener la transcripción del gen en generaciones subsecuentes de una planta o animal trasgénico. Por supuesto en caso que la expresión sea provocable, la cualidad comprende la cualidad para mantener provocabilidad de expresión en generaciones subsecuentes de una planta o animal trasgénico. Frecuentemente, los niveles de expresión caen dramáticamente con incremento de números de divisiones de célula. Con un método de la invención es posible detectar y opcionalmente seleccionar una secuencia de ADN que es capaz de, por lo menos en parte, prevenir la caída dramática en los niveles de transcripción con incremente de número de divisiones de célula. Así, en una modalidad preferida la cualidad de modulación de transcripción de gen comprende una cualidad de transcripción de gen estable. Sorprendentemente, los fragmentos que comprende una secuencia de ADN con la cualidad de transcripción de gen estable puede ser detectada y opcionalmente seleccionada con un método de la invención, a pesar del hecho de que el método no necesariamente mide el término de la estabilidad de la transcripción. En una modalidad preferida de la invención la cualidad de modulación de transcripción de gen comprende una transcripción del gen estable mejorando la cualidad. Se ha observado que la incorporación de una secuencia de ADN con una cualidad de modulación de transcripción de gen en un vector de expresión con un gen de interés, resulta en un nivel mayor de transcripción del gen de interés, sobre la integración del vector de expresión en el genoma de una célula y más aún que el nivel de expresión del gen mayor es también más estable que en la ausencia de la secuencia de ADN con un gen de cualidad de modulación de transcripción de gen.
En experimentos diseñados para introducir un gen de interés en el genoma de una célula y obtener la expresión del gen de interés, ha sido observado lo siguiente. Si junto con el gen de interés también una secuencia de ADN con una cualidad de modulación de transcripción de gen fue introducida, más clones pueden ser detectados de que expresaron más que una cierta cantidad de producto de gen del gen de interés, que cuando la secuencia de ADN no fue introducida junto con el gen de interés. Así, la presente invención también provee un método para incrementar el número de células que expresan más que un cierto nivel de un producto de gen de un gen de interés sobre proveer el gen de interés al genoma de las células, que comprende la provisión de la célula con una secuencia de ADN que comprende una cualidad de modulación de transcripción de gen con el gen de interés . Las posibilidades de detección de un fragmento con una cualidad de modulación de transcripción de gen varían con la fuente de la cual los fragmentos son derivados. Típicamente, no hay conocimiento anterior de la presencia o ausencia de fragmentos con la cualidad. En esas situaciones muchos fragmentos no comprenderán una secuencia con una cualidad de modulación de transcripción de gen. En estas situaciones es introducido un paso de selección formal para secuencias de ADN con la calidad. Esto es hecho por vectores de selección que comprenden la secuencia en las bases de una característica de un producto del gen reportero, aquel puede ser seleccionado para o en contra. Por ejemplo, el producto de gen puede inducir fluorescencia o un depósito de color (por ejemplo, proteína fluorescente verde y derivados, luciferasa, o fosfatasa alcalina) o conferir resistencia antibiótica o inducir apoptósis y muerte de células. Un método de la invención es particularmente apropiado para detección y opcionalmente selección de una secuencia de ADN que comprende una cualidad de mejoramiento de transcripción de gen. Ha sido observado que por lo menos alguna de las secuencias de ADN, cuando son incorporadas en un vector de expresión que comprende un gen de interés, pueden incrementar dramáticamente la transcripción del gen del gen de interés en una célula hospedadora aún cuando el vector no comprenda un elemento con una cualidad de represión de transcripción de gen. Esta cualidad de mejoramiento de transcripción de gen es muy usada en líneas de célula transfectadas con genes externos o en animales y plantas transgénicos . El sistema de transcripción puede ser un sistema de transcripción in vitro libre de célula. Con la experiencia actual en automatización los sistemas libres de célula pueden ser precisos y rápidos. Sin embargo, para la presente invención el sistema de transcripción preferiblemente comprende células hospedadoras . Usando células hospedadoras se garantiza que los fragmentos son detectados y opcionalmente seleccionados con actividad en células.
Un elemento con una cualidad de represión de transcripción de gen, en un método de la invención, reprimirá la transcripción de un promotor en el sistema de transcripción usado. La represión no tiene que llevar a niveles de expresión indetectables . Es importante que la diferencia en niveles de expresión en la ausencia o presencia de represión es detectable y opcionalmente seleccionable . En una modalidad preferida la represión de transcripción de gen en los vectores resulta en cromatina de represión de transcripción de gen. En esta modalidad preferida las secuencias de ADN pueden ser detectadas y opcionalmente seleccionadas aquellas que son capaces de por lo menos en parte contrarrestar la formación de cromatina de represión de transcripción de gen. En un aspecto una secuencia de ADN capaz de por lo menos en parte contrarrestar la formación de cromatina de represión de transcripción de gen comprende una cualidad de transcripción de gen estable. En una modalidad preferida la secuencia de ADN involucrada en la represión de transcripción de gen es una secuencia de ADN que es reconocida por un complejo de proteína y en donde el sistema de transcripción comprende el complejo. Preferiblemente el complejo comprende una proteína que enlazan heterocromatina que comprende HP1, una proteína del grupo Polycomb (Pc-G) , una actividad de histona desacetilasa o MeCP2 (proteína que enlazan metil-CpG) . Muchos organismos comprenden una o más de estas proteínas . Estas proteínas frecuentemente exhiben actividad en otra especie también. El complejo puede así también comprender proteínas de dos o más especies . El conjunto mencionado de complejos de proteína asociados con cromatina son capaces de transportar represión de largo rango sobre muchos pares base. Los complejos también están involucrados en transferencia estable del estatus reprimido de genes a células hijas en la división de célula. Las secuencias seleccionadas de esta forma son capaces de llevar anti-represión de largo rango sobre muchos pares base (van der Vlag y colaboradores, 2000) . El vector usado puede ser cualquier vector que es apropiado para clonación de ADN y que puede ser usado en un sistema de transcripción. Cuando las células hospedadoras son usadas es preferible que el vector sea un vector de replicacion por medio de episomas. En esta forma, los efectos debidos a sitios diferentes de integración del vector son evitados . Los elementos de ADN flanqueando el vector en el sitio de integración puede tener efectos en el nivel de transcripción del promotor y de esa manera efectos imitadores de fragmentos que comprende secuencias de ADN con una cualidad de modulación de transcripción de gen. En una modalidad preferida el vector comprende un origen de replicacion del virus Epstein-Barr (VEB) , OriP, y un antígeno nuclear (ANEB-1) Los vectores son capaces de replicar en muchos tipos de células eucarióticas y reunirse en cromatina bajo condiciones apropiadas. En otro aspecto la invención provee una secuencia de ADN que comprende i) una secuencia de ADN aislada de una planta o vertebrado, o derivados de esta, o ii) una secuencia de ADN sintética o una construida por medio de ingeniería genética, la secuencia de ADN es una secuencia de represión-inhibición la cual, por el método de conformidad con la presente invención puede ser detectada, seleccionada y opcionalmente clonada. En otro aspecto la invención provee una secuencia de ADN que comprende i) una secuencia de ADN aislada de una planta o vertebrado, o derivados de estas, o ii) una secuencia de ADN sintética o una construida por medio de ingeniería genética, la secuencia de ADN es detectada, seleccionada y opcionalmente clonada por medio del método de la invención. Preferiblemente la secuencia de ADN comprende una secuencia como se describe en la Tabla 4A o un homólogo funcional de esta. Un homólogo funcional de una secuencia como se describió en la Tabla 4 es una secuencia derivada con la información dad en la Tabla 4 (sea ésta la Tabla 4A o la Tabla 4B) . Por ejemplo, una secuencia que puede ser derivada de una secuencia en la Tabla 4 por eliminación, modificación y/o insertando bases en o de una secuencia listada en la Tabla 4, caracterizada porque la secuencia derivada comprende la misma actividad en tipo, no necesariamente en cantidad, de una secuencia como se describió en la Tabla 4. Un homólogo funcional es además una secuencia que comprende una parte de dos o más secuencias descritas en la Tabla 4. Una secuencia de ADN sintética es una secuencia que no es derivada directamente o indirectamente de una secuencia presente en un organismo. Por ejemplo una secuencia que comprende una secuencia scs o scs' de drosofila no es una secuencia sintética, aún cuando la secuencia scs o scs' fue generada artificialmente . En un aspecto la invención concierne con incremento en el conocimiento de regulación del gen de orden mayor y con medios y métodos para utilización de este conocimiento. Considerando que los elementos, como promotores y mejoradores clásicos, han sido caracterizados que dirigen y regulan la transcripción de genes únicos, elementos reguladores de orden mayor que gobiernan la capacidades de transcripción del gen de regiones de cromosoma completas tienen como ya se recibió atención pequeña. Mucho de nuestro conocimiento referente a los elementos de orden mayor viene del estudio de embriogénesis . Durante la embriogénesis las células se vuelven encomendadas a diferentes caminos de desarrollo. Una vez encomendadas, las células raramente cambian sus destinos, aún después de muchas divisiones de células. Se ha vuelto incrementadamente claro que la transmisión estable de los patrones de transcripción de gen específico de tipo de célula no dependen en el contexto de un promotor, sino que es, en su lugar, mediado por cambios en la estructura de las proteínas de ADN y asociadas, llamado cromatina. La regulación del gen en el nivel de cromosoma involucra modificación de ADN (por ejemplo mutilación) , histonas (por ejemplo actilación y/o mutilación), e interacción de largo rango entre elementos cromosomales distantes . La plantilla de cromatina es un complejo altamente condensado de ADN, histonas, y proteínas no de histona, el cual es capaz de empaquetar el genoma completo en el núcleo y simultáneamente permitir la transcripción apropiada de genes específicos. El cromosoma eucariótico no es una plantilla uniforme para la activación de transcripción de gen. Los tipos diferentes de cromatina y regiones de cromatina pueden ser distinguidos, lo cual afecta diferencialmente la transcripción del gen. Las así llamadas regiones de heterocromatina identifican estructuras de cromatina "cerradas" , mientras que la eucromatina está asociada con una estructura de cromatina más difusa y "abierta". La región de eucromatina puede ser sometida a cambios estructurales, lo que resulta en más o menos estructuras condensadas, referidas como heterocromatina y eucromatina facultativas. La formación de eucromatina o heterocromatina facultativas se cree que representan el mecanismo subyacente de regulación de gen mediado de cromatina, manteniendo genes en un estado activo o reprimido, en un tipo de célula de manera específica. En todas las eucariotas, varios complejos de proteína asociados con cromatina han sido identificados que están involucrados en el mantenimiento de la especificidad del tipo de célula, uno de los cuales es el complejo del grupo Policomb (PcG) . El complejo PcG está involucrado en la represión estable de genes, en la cual los cambios en la estructura de cromatina se cree que juegan un papel importante. Similarmente, una segunda clase de proteínas, llamadas el grupo tritórax (TrG) , se ha identificado que contrarrestan la acción de las proteínas PcG. Las proteínas TrG están involucradas en mantenimiento de transcripción de gen. Basados en sus modos respectivos de acción, las proteínas PcG y TrG, por lo tanto, representan un sistema de memoria celular que es importante para la transmisión hereditaria de patrones de transcripción de gen. Aún no es claro cómo los complejos PcG y TrG están asociados con sus genes objetivos. Estudios genéticos han caracterizado secuencias reguladoras de actuación cis que mantiene estados de inactividad transcripcionalmente de genes. El silenciamiento mediado por estas secuencias reguladores de actuación cis es dependiente de la presencia de proteínas PcG funcionales, y de ahí estas secuencias han sido llamadas elementos de respuesta PcG (ERP) . Se ha identificado en las secuencias que están involucradas en represión mediad PcG de cromatina. Todavía, sin embargo, no han sido encontrados (en ambos, vertebrados o plantas) los ERP completos que comprende toda la información de secuencia requerida para represión mediada de cromatina. En adición, todavía, no ha sido posible estudiar las secuencias con capacidades de represión de largo rango en una forma coherente . Esto es en una gran parte debido a la incapacidad para separar por exclusión sistemáticamente las secuencias de activación de largo rango. En un aspecto, la invención provee los medios y métodos para detectar sistemáticamente las secuencias en el ADM. En una modalidad, la invención provee un método para identificación de una secuencia de ADN con una cualidad de represión de transcripción de gen, que comprende proporcionar una colección de ácidos nucleicos de prueba . generar una colección de vectores de expresión que comprende ácidos nucleicos de prueba y un primer gen reportero bajo control trascripcíonal de un promotor. proporcionar células con la colección de vectores de expresión, seleccionar una célula o progenie que contiene el vector de esta, caracterizada porque la transcripción del primer gen reportero está reprimida, e identificar el ácido nucleico de prueba en la célula. El ácido nucleico de prueba identificado comprende la capacidad para reprimir la función de promotor y así comprende una cualidad de represión de transcripción del gen. Preferiblemente, el ácido nucleico de prueba identificado es también recuperado y clonado. La cualidad comprende por lo menos en parte, la capacidad para reducir el nivel de transcripción del promotor cuando es enlazado físicamente al promotor, comparado al nivel en la ausencia de la secuencia de ADN con la cualidad. En una modalidad preferida la cualidad de represión de transcripción de gen comprende una cualidad de cromatina reprimiendo transcripción de gen. Esto es, en donde la reducción del nivel de transcripción es el resultado de cromatina teniendo una configuración de represión de transcripción de gen. Esta configuración preferiblemente abarca al promotor. Sin embargo, también es posible que la configuración abarque un mej orador, o similar, de esa manera por lo menos en parte inactiva el efecto de mejoramiento de transcripción del mej orador en el promotor. En una modalidad particularmente preferida, la secuencia de ADN con una cualidad de cromatina reprimiendo la transcripción del gen comprende un elemento que responde al grupo similar policomb. Usando el método mencionado arriba es posible recuperar varias secuencias de ácido nucleico que comprende la capacidad para reducir el nivel de transcripción de un promotor y así las secuencias de ácido nucleico que comprende una cualidad de represión de transcripción de gen. Las secuencias con funciones análogas pueden ser comparadas con otra para semejanzas de secuencias tal que una o más secuencias consenso para que puedan ser deducidos los elementos con una cualidad de represión de transcripción de gen como elementos que responden similar al grupo policomb. Más aún considerando que las secuencias completas de genomas de organismos son conocidas y seguirán más brevemente, es posible separar por exclusión estos genomas o partes de estos, y predecir la ocurrencia de estas secuencias en el genoma. El conocimiento de la ocurrencia y localización de secuencias de ADN que comprende cualidades de modulación de transcripción de gen y/o cualidades de represión de transcripción de gen en el genoma incrementará grandemente nuestro conocimiento de mayor regulación de orden de transcripción de gen en el genoma. Un elemento de respuesta del grupo Policomb es un elemento que es capaz de reprimir la transcripción de un promotor en respuesta a la interacción directa y/o indirecta de una o más proteínas del grupo Policomb con el elemento. Un elemento de respuesta similar al grupo policomb es un elemento de respuesta del grupo Policomb, o alternativamente este es un elemento capaz de reprimir la transcripción de un promotor en la interacción directa y/o indirecta de una o más proteínas con el elemento, en donde una o más proteínas no pertenecen al grupo Policomb, pero en donde como un resultado de la interacción se forma la cromatina de represión de transcripción de gen. Los ejemplos de las proteínas son proteínas asociadas con cromatina, tales como proteína 1 heterocromatina (HP1) (Eisenberg y colaboradores, 1990) . Otra proteína asociada a cromatina que reprime la actividad del gen es la proteína que enlaza CpG metilo, MeCP2 (Nan y colaboradores, 1997) . En una modalidad preferida un elemento que responde similar al grupo Policomb de la invención comprende la capacidad de reprimir la transcripción de un promotor sobre distancias grandes, preferiblemente sobre más de 2000 pares base (van der Valg y colaboradores, 2000) . Una colección de ácidos nucleicos de prueba puede ser generada de muchas formas . Usando secuencias artificiales como ácidos nucleicos de prueba es posible obtener una secuencia de consenso para una cualidad de represión de transcripción de gen. Diferentes cualidades pueden comprender diferentes secuencias consenso. Preferiblemente la colección es generada del ADN cromosomal . De esta manera es encontrada una cualidad de represión de transcripción de gen que comprende una secuencia que se presenta naturalmente en el cromosoma. Esto tiene la ventaja de que la localización de estas cualidades en el cromosoma puede ser determinada con lo cual su influencia en la transcripción de gen de orden mayor en la localización puede ser resuelta. Un gen reportero es un gen que codifica un producto de expresión del cual la presencia puede ser detectada directamente o indirectamente en la célula. En métodos para detección de una cualidad de represión de transcripción de gen, la transferencia de un vector de expresión en una célula llevará a expresión del gen reportero. Sin embargo, en caso de que el ácido nucleico comprenda una cualidad de represión de transcripción de gen, tal como un elemento que responde similar al grupo policomb, la expresión será reprimida en la célula de esa manera lo que lleva a una expresión reducida por lo menos en parte del gen reportero. La presencia o ausencia de una ácido nucleico capaz de reprimir la transcripción del promotor puede así ser detectada por detección del producto de expresión en la célula, de esa manera la detección reducida o no detección indica la presencia de una cualidad de represión de transcripción de gen. Un gen reportero puede codificar una proteína reportera fluorescente. La expresión reducida puede entonces ser detectada por medios flourométricos por ejemplo en un citómetro de flujo. Las células desplegando poca o ninguna fluorescencia pueden ser ordenadas usando un ordenador de célula activada fluorescente y el vector de expresión y/o el ácido nucleico aislado, por ejemplo por medio de una reacción de amplificación. Preferiblemente, el primer gen reportero comprende un gen reportero seleccionable, la expresión del cual directa o indirectamente provee la célula con por lo menos una desventaja de crecimiento sobre las células no que expresan o que expresan bajos niveles del primer gen reportero. En casos donde las secuencias de ADN con una cualidad de represión de transcripción de gen son separados por exclusión para, expresión del primer gen reportero es, preferiblemente, directa o indirectamente tóxica a la célula. Ejemplos no limitativos de un producto de expresión tóxica es la ricina o variantes tóxicas de ella. En otro ejemplo, el primer gen reportero codifica una apoptósis induciendo el producto del gen. Preferiblemente la apoptósis induciendo producto de gen comprende adenovirus 13S ElA o un equivalente funcional de este (Breckenridge y Shore, 2000) . En otra modalidad, la apoptósis que induce el producto de gen, comprende apoptina o un equivalente funcional de este (Pietersen y Noteborn, 2000) . Otro ejemplo es un gen que codifica un producto así llamado suicida, tal como la timidina cinasa del virus del herpes simplex (HSV-tk) . La adición de ganciclovir a cultivos de células que expresan HSV-tk, resultará en la formación de una sustancia tóxica en estas células, y por lo tanto mata estas células. En -una modalidad particularmente preferida, el gen suicida comprende citosina desaminasa. La citosina desaminasa convierte la citosina a uracil. Esta actividad de enzima se encuentra en procariotas y eucariotas menores, pero está ausente en eucariotas mayores. El gen es usado como un gen suicida metabólico en combinación con el profármaco 5-fluorocitosina (5-FC) . La citosina desaminasa es capaz de convertir el 5-FC no tóxico en 5-fluoracil, el cual mata células al romper la síntesis de ADN, provocando de esa manera la apoptósis (Mullen y colaboradores, 1992; ei y Huber, 1996) . Un promotor que controla la transcripción del primer gen reportero puede ser cualquier promotor que está activo, o puede ser activado en las células. Al seleccionar un promotor particular, es posible seleccionar una cualidad de represión de transcripción de gen como un elemento que responde similar al grupo policomb capaz de reprimir la transcripción del promotor particular. En esta forma es posible seleccionar cualidades que específicamente repriman la clase de promotores pertenecientes al promotor particular. En una modalidad preferida, el promotor comprende un promotor del cual la actividad puede ser inducida lo que proporciona una célula que comprende el promotor con una señal . El promotor inducible preferiblemente comprende un promotor responsable tetraciclina . La señal aquí siendo tetraciclina, doxiciclina y compuestos equivalentes. Los promotores también pueden ser adaptados para receptividad de tetraciclina en células eucarióticas (Yin y colaboradores, 1996) . Los promotores y moléculas negociadoras están disponibles para que ya sea que induzcan o repriman la expresión de un gen, además de tetraciclina o equivalentes a esta. Las células transfectadas con un vector de expresión de la invención pueden, con una frecuencia típicamente baja y por razones no asociadas con la presencia de una secuencia de ADN con una cualidad de represión de transcripción de gen, no expresar cantidades detectables de producto de expresión del primer gen reportero. Esto puede, por ejemplo, deberse a un evento de recombinación que perturba la secuencia de codificación del primer gen reportero. En una modalidad preferida de la invención, la colección de vectores de expresión además comprende un segundo gen reportero . La expresión del segundo gen reportero está preferiblemente bajo el control de un segundo promotor. Los métodos para la detección de expresión de un producto de expresión del segundo gen reportero pueden ser usados para confirmar la actividad de represión de expresión del ácido nucleico de prueba, de esa manera reduce, por lo menos en parte, el número de células que no expresan falsamente el primer gen reportero. En una modalidad preferida, el segundo gen reportero es usado para selección de células que comprende un cásete de expresión. En esta forma, las células que no comprenden el cásete de expresión pueden fácilmente ser ignoradas. A esta terminación, el producto de expresión del segundo gen reportero preferiblemente comprende un gen reportero seleccionable dominante positivo. Preferiblemente, el gen reportero seleccionable dominante positivo codifica un producto de expresión capaz de conferir resistencia a un compuesto tóxico de otra manera. Los ejemplos no limitantes son resistencia a G418 y resistencia a higromicina. Considerando que una cualidad de represión de la transcripción del gen puede suprimir la transcripción, se prefiere que en esta modalidad un vector de expresión además comprenda por lo menos una secuencia de ADN con una cualidad de modulación de transcripción de gen, capaz de contrarrestar los efectos de represión de transcripción de una secuencia de ADN con una cualidad de represión de transcripción de gen. La colocación del elemento que contrarresta la transcripción en el vector de expresión es preferiblemente de tal manera que interfiera efectivamente con el efecto de reducción de la cualidad de represión de transcripción de gen que podría tener en el nivel de transcripción del segundo gen reportero. En una modalidad preferida, la secuencia de ADN con una cualidad de modulación de transcripción de gen funcionalmente separa los casetes de expresión que comprenden el primero y el segundo gen reporteros. Preferiblemente, el segundo gen reportero (y promotor que controla la transcripción del segundo gen reportero) es flanqueado por secuencias de ADN con una cualidad de modulación de transcripción de gen. Los ejemplos de secuencias de ADN con una cualidad de modulación de transcripción de gen son los así llamados elementos STAR listados en las Tablas 1 y 2. Los métodos de la invención resultan en la clonación e identificación de un número de elementos que comprenden una cualidad de modulación de transcripción de gen y/o una modulación de represión de transcripción de gen. El elemento puede contener ácido nucleico irrelevante que no es instrumental en la realización de la cualidad, por ejemplo no involucrado en la formación de cromatina de represión de transcripción de gen. Las secuencias funcionales en los elementos pueden ser delineadas por varios métodos conocidos en la técnica. En una modalidad, las eliminaciones y/o substituciones son hechas en una secuencia de ADN con una modulación de transcripción de gen o una cualidad de represión de transcripción de gen. El ADN que es modificado en esa manera, es probado para actividad en un método de la invención. Esto puede hacerse usando un ácido nucleico modificado o por generación de una colección de ácidos nucleicos de prueba, que comprenden el ácido nucleico modificado. La elucidación de secuencias funcionales dentro de secuencias de ADN de la invención hace posible la elucidación de secuencias consenso para elementos con una cualidad de modulación de transcripción de gen y/o cualidad de represión de transcripción de gen. Considerando que hay varios complejos similares al grupo policom , que cada uno comprende diferentes funcionalidades y patrones de expresión, se anticipa que más que un tipo de secuencia de consenso se encuentra con un método de la invención. Análogamente se anticipa que más de un tipo de secuencia de consenso se encuentra para un elemento que comprende una cualidad de modulación de transcripción de gen. La invención así además, provee una colección de ácidos nucleicos aislados y/o recombinantes , que comprende cualidades de modulación de transcripción de gen y/o de represión de transcripción de gen como elementos de respuesta similar al grupo prolicomb. En una modalidad, la colección comprende ácidos nucleicos aislados y recombinantes que comprenden la misma secuencia de consenso. En una modalidad preferida, la colección comprende ¦más de un tipo de secuencia de consenso. La colección puede ser usada, por ejemplo, para determinar si una molécula de ADN dada comprende una cualidad de modulación de ADN. En una modalidad preferida, la colección comprende esencialmente todos los elementos con una función de mejoramiento de transcripción de gen, elementos que comprenden una cualidad de transcripción de gen estable y/o elementos con una cualidad de represión de transcripción de gen tales como elementos de respuesta similar al grupo policomb, de un cromosoma. Junto con el conocimiento en la localización de estos elementos en el cromosoma, esto permite a una persona experta en la técnica generar una predicción para regulación de orden mayor de expresión de gen, de genes naturalmente presentes en el cromosoma y para genes (ácido nucleico externo) introducidos en el cromosoma por medios recombinantes . Tal una predicción puede ser usada, por ejemplo, para seleccionar una localización candidata apropiada en el cromosoma para la inserción del ADN externo. Una localización apropiada puede ser una localización esperada a ser expresada específicamente en una célula cierta, tipo de célula y/o tejido. Preferiblemente, el cromosoma comprende cromosoma 21 o cromosoma 22. En una modalidad particularmente preferida, todas las secuencias de ADN que comprenden un modulador de la transcripción del gen o una cualidad que reprime la transcripción del gen en una célula, están en la colección. En esta modalidad el genoma completo puede ser usado para predicción de una localización candidata apropiada. En una modalidad la colección ha sido generada en diferentes líneas de célula de especie al ordenar de plantas a humanos. En diferentes líneas de células y/o especie de proteínas diferentes (o complejos de proteínas) capaces de integración con secuencias de ADN con una cualidad de represión de transcripción de gen, serán expresadas, lo que resulta en diferentes elementos de ADN con una cualidad de represión de transcripción de gen. Similarmente serán expresadas diferentes proteínas que interactúan directa o indirectamente con secuencias de ADN que comprenden una cualidad de modulación de transcripción de gen. Por lo tanto, la recuperación de la colección depdende del tipo de célula y depende de la presencia de las proteínas relevantes. Este es también el caso con elementos de respuesta similar al grupo policomb. Si HP1 es expresado en una célula tipo uno, los elementos que dependen de HP1 serán detectados por el método de la invención. Si HP1 no es expresado en la célula tipo dos, el método de la invención no detectará el elemento que ha sido recuperado de la célula tipo uno. En un aspecto de la invención, la colección comprende por lo menos un elemento capaz de, por lo menos en parte, contrarrestar la formación de cromatina al reprimir la transcripción de gen. Junto con el conocimiento de la localización de secuencias de ADN con una cualidad de represión de transcripción de gen en un cromosoma o genoma, el conocimiento de la localización de los elementos que contrarresta permite una predicción más precisa de regulación de orden mayor de transcripción de gen de genes (insertados) en el cromosoma o genoma. Preferiblemente la colección además comprende otros elementos reguladores de transcripción como mej oradores y silenciadores. Aunque las secuencias tienen influencia limitada en la regulación de gen de orden mayor, la información sobre la localización de otras secuencias además aumenta la precisión de la predicción en localizaciones apropiadas en el genoma para la expresión de secuencias externas introducidas allí dentro.
Preferiblemente, la colección comprende esencialmente todas las secuencias de ADN que comprende una cualidad de modulación de transcripción de gen y/o todas las otras secuencias reguladoras de un cromosoma. Considerando que ya un cromosoma típicamente consiste de varias decenas de millones de bases, se prefiere que la información que la colección pueda dar en regulación del gen de ' orden mayor esté incorporada en un sistema automatizado por lo menos parcialmente. Otro uso de la colección de la invención es la generación de una predicción en la transcripción de genes durante la modificación objetivo de secuencias en un cromosoma, de tal manera que las secuencias reguladoras de "orden mayor" sean mutadas . Por ejemplo, uno o más elementos de respuesta tipo grupo policomb de la invención, y/u otros elementos reguladores en el cromosoma, pueden ser mutados. Se espera cambiar los niveles de transcripción de los genes que están en las inmediaciones de los elementos de respuesta tipo grupo policomb y/u otros elementos de modulación de expresión. Todavía otro uso de una colección o sistema de la invención, es la predicción de expresión de genes, lo que resulta de mutaciones en el genoma. En casos donde una mutación resulta en la transcripción de un gen alterado, la detección de la transcripción de gen alterado puede indicar la presencia de la mutación que se presenta naturalmente . Esta aproximación es usada, por ejemplo, en la limitación del número de secuencias o proteínas a ser evaluadas en un ensayo de diagnóstico. Esto es par icularmente importante en aproximaciones de microconfiguraciones debido a que en estas aproximaciones el número de secuencias expresadas a ser evaluadas, está limitado por el número de secuencias que un arreglo puede mantener máximamente. Con medios y métodos de la invención es posible limitar el número de secuencias a ser evaluadas en aproximaciones de microconfiguraciones . Todavía otro uso de un sistema o colección de la invención es el descubrimiento de fármacos objetivos. Los elementos reguladores, son elementos de "orden mayor" o no, función debida a la proteína (complejos) que pueden enlazarlos a ellos. Un sistema de la invención puede ser usado para determinar si el objetivo de fármacos para interferir con el enlazamiento o función de una proteína particular (complejo) mantiene la promesa para la alteración de expresión de un gen particular. La invención además provee una secuencia de i¾DN que comprende una cualidad de represión de transcripción de gen obtenible por un método de la invención. En una modalidad preferida la secuencia de ADN que comprende una cualidad de represión de transcripción de gen es derivada de un vertebrado o de una planta. Más preferiblemente, la secuencia de ADN que comprende una cualidad de represión de transcripción de gen comprende una secuencia de conformidad con la tabla 4B, o un homólogo funcional de estos. Es posible proveer una construcción de ADN con una secuencia de ADN de la invención, o modificar una secuencia de ADN. En una modalidad preferida, una construcción de ADN es provista, que comprende un promotor operable enlazado con un ácido nucleico de interés. Preferiblemente, la cantidad de actividad de una cualidad de la secuencia de ADN con una cualidad de modulación de transcripción de gen y/o cualidad de represión, depende de la orientación de la secuencia de ADN en la construcción, comparada con el promotor. Preferiblemente la cualidad de modulación y/o represión de transcripción de gen es dependiente de la presencia de una señal. Preferiblemente, la señal comprende una proteina enlazada a ADN. Preferiblemente la señal comprende una proteína TAT de virus de inmunodeficiencia humana. Uno de los usos de una secuencia de ADN que comprende una cualidad de modulación de transcripción de gen o una cualidad de represión de transcripción de gen es, por supuesto, la regulación de transcripción de un gen de interés. La transcripción de un gen de interés puede ser alterado por secuencias alteradas en las inmediaciones del gen, de tal manera que una secuencia de ADN con la cualidad es provista o removida. Pueden ser diseñadas características de expresión específicas por combinación (de partes) de secuencias de ADN con una cualidad de modulación de transcripción de gen y/o de represión de transcripción de gen. Por ejemplo, la duplicación de una secuencia con una cualidad de transcripción de gen estable en un vector de expresión llevará a estabilidad mejorada de expresión en una célula objetivo o progenitora en introducción del vector en la célula objetivo. Mediante combinación de secuencias de ADN con cualidades de modulación de transcripción de gen alteradas pueden ser generadas ya sea en tipo o cantidad o ambas . También es posible diseñar secuencias de ADN con una cualidad de modulación de transcripción de gen y/o de represión de transcripción de gen deseada. Las proteínas que enlazan ADN junto con otras proteínas y secuencias de ADN, determinan cualidades de la secuencia de ADN. Es posible insertar una o más de otras proteínas que enlazan secuencias de ADN en una secuencia de ADN con una cualidad. Al permitir el enlace de la(s) proteína (s) enlazante, es posible interferir con, o directamente, la cualidad, permitiendo así la generación de secuencias de ADN con cualidades diseñadoras. Por supuesto también es posible remover la proteína que enlaza sitios de una secuencia de ADN con una cualidad de modulación de transcripción de gen y/o una de represión de transcripción de gen particular, alterando de esa manera la cualidad de las secuencias de ADN resultantes. También es posible la combinación de adición y remoción. Las cualidades de modulación de transcripción de gen y/o de represión de transcripción de gen particulares pueden ser seleccionadas por métodos de detección de ajuste descritos en la presente invención. Por ejemplo, es posible sintetizar secuencias de ADN con cualidades de modulación de transcripción de gen y/o de represión de transcripción de gen inducibles. Por ejemplo, al incluir elementos TAT de enlazamiento en una secuencia de ADN que comprende una cualidad de represión de transcripción de gen, es posible, por lo menos en parte, inactivar la cualidad de represión de transcripción de gen en una célula que comprende TAT. Similarmente, hay proteínas que enlazan ADN disponibles que solamente enlazan a su secuencia objetivo en la ausencia o presencia de una señal. Sin limitación, los ejemplos de las proteínas son el represor TET y las varias mutaciones de estos, el represor lac, los receptores de hormonas esteroides, el receptor de ácido retinóico, y derivados. Es posible, por ejemplo, diseñar una secuencia de ADN con una cualidad de modulación de transcripción de gen y/o de represión de transcripción de gen específica. Por ejemplo, en caso del ejemplo TAT mencionado arriba. Lo referido para la secuencia de ADN puede ser específico para células infectadas de VIH que expresan TAT. Alternativamente, la secuencia de ADN puede ser hecha específica para un complejo de proteína que es expresado en un modo específico de tipo de célula. Los constructos de expresión que comprenden una secuencia de ADN que comprende una cualidad de modulación de transcripción de gen y/o de represión de transcripción de gen, son apropiados para la obtención de la expresión de la construcción en células, que comprende más de una copia de la construcción de la expresión. También cuando el constructo de expresión está presente en el genoma de la célula y, también cuando el cásete de expresión está presente en más de una copia en la célula. Más aún, trabajan aún cuando están integrados en la misma posición en más de una copia. En una modalidad preferida de la invención, la secuencia de ADN con una cualidad de modulación de transcripción de gen comprende una secuencia llamada STAR (siglas en inglés de Estabilización Anti Represión) . Una secuencia STAR como se usó aquí, se refiere a una secuencia de ADN que comprende una o más de las cualidades de modulación de transcripción de gen mencionadas . En la técnica están disponibles varios métodos para extraer identificadores de secuencia de una familia de secuencias de ADN que comparten una cierta característica común. Los identificadores de secuencia subsecuentemente pueden ser usados para identificar secuencias que comparten uno o más identificadores . Las secuencias que comparten uno o más identificadores probablemente son un miembro de la misma familia de secuencias, esto es, están probablemente para compartir la característica común de la familia. En la solicitud presente, un gran número de secuencias que comprende la actividad STAR (llamadas secuencias STAR) fueron usadas para obtener identificadores de secuencia (patrones) los cuales son caracterxsticas para secuencias que comprenden actividad STAR. Estos patrones pueden ser usados para determinar si una secuencia de prueba es probable para contener la actividad STAR. En un aspecto de la invención, se provee de esta manera un método para detección de la presencia de una secuencia STAR dentro de una secuencia de ácido nucleico de alrededor de 50-5000 pares base, que comprende la determinación de la frecuencia de ocurrencia en la secuencia de por lo menos un patrón de secuencia y determinar que la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de, por lo menos, un patrón de secuencia en, por lo menos, una secuencia que comprende una secuencia STAR. En principio, cualquier método es apropiado para determinar si un patrón de secuencia es representativo de una secuencia STAR. En la técnica están disponibles muchos métodos diferentes. En una modalidad preferida de la invención, el paso de determinar esa ocurrencia es representativo de la frecuencia de ocurrencia de por lo menos un patrón de secuencia en por lo menos una secuencia que comprende una secuencia STAR, que comprende determinar que la frecuencia de ocurrencia de por lo menos un patrón de secuencia difiere significativamente entre por lo menos una secuencia STAR y por lo menos una secuencia de control . En principio cualquier diferencia significante es discriminativa para la presencia de una secuencia STAR. Sin embargo, en una modalidad particularmente preferida, la frecuencia de ocurrencia de por lo menos un patrón de secuencia es significativamente mayor en por lo menos una secuencia que comprende una secuencia STAR, en comparación con por lo menos una secuencia de control . Un número considerable de secuencias que comprenden una secuencia STAR han sido identificado en la presente invención. Es posible usar estas secuencias para evaluar que tan eficiente es un patrón en la discriminación entre una secuencia de control y una secuencia que comprende una secuencia STAR. Usando los llamados análisis discriminantes es posible determinar en las bases de cualquier conjunto de secuencias STAR en una especie, los patrones de secuencias discriminativas más óptimos o combinación de estos. Así, preferiblemente, por lo menos uno de los patrones es seleccionado en las bases de uno deseado, y preferiblemente una discriminación óptima entre por lo menos una secuencia que comprende una secuencia STAR y una secuencia de control. Una discriminación deseada puede ser un cierto factor de significancia asociado con el patrón a través de bioinformática. En una modalidad preferida la frecuencia de ocurrencia de un patrón de secuencia en un ácido nucleico de prueba es comparada con la frecuencia de ocurrencia en una secuencia sabiendo que contiene una secuencia STAR. En este caso, un patrón es considerado representativo para una secuencia que comprende una secuencia STAR si las frecuencias de ocurrencia son similares. En una modalidad preferida se usa otro criterio. La frecuencia de ocurrencia de un patrón en una secuencia que comprende una secuencia STAR es comparada a la frecuencia de ocurrencia del patrón en una secuencia de control . Al comparar las dos frecuencias es posible determinar para cada patrón asi analizado, si la frecuencia en la secuencia que comprende la secuencia STAR es significantemente diferente de la frecuencia en la secuencia de control . En esta modalidad, un patrón de secuencia es considerado para ser representativo de una secuencia comprende una secuencia STAR, si la frecuencia de ocurrencia del patrón en por lo menos una secuencia que comprende una secuencia STAR es significativamente diferente de la frecuencia de ocurrencia del mismo patrón en una secuencia de control. Usando número mayores de secuencias que comprende una secuencia STAR, el número de patrones para el cual una diferencia estadística puede ser establecido incrementa, así alargando el número de patrones para los cuales la frecuencia de ocurrencia es representativa para una secuencia que comprende una secuencia STAR. Preferiblemente la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de por lo menos un patrón de secuencia en por lo menos 2 secuencias que comprenden una secuencia STAR, más preferiblemente en por lo menos 5 secuencias que comprenden una secuencia STAR. Más preferiblemente en por lo menos 10 secuencias que comprende una secuencia STAR. Más preferiblemente, la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de por lo menos un patrón de secuencia en por lo menos 20 secuencias que comprende una secuencia STAR. En una modalidad particularmente preferida la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de por lo menos un patrón de secuencia en por lo menos 50 secuencias que comprenden una secuencia STAR. Los patrones que son indicativos para una secuencia que comprende una secuencia STAR son también dependientes del tipo de ácido nucleico de control usado. El tipo de secuencia de control usada es preferiblemente seleccionada en la base de la secuencia en la cual la presencia de una secuencia STAR es detectada. En una modalidad preferida la secuencia de control comprende una secuencia aleatoria que comprende un contenido de AT/CG similar como por lo menos una secuencia que comprende una secuencia STAR. En otra modalidad preferida, la secuencia de control es derivada de la misma especie como la secuencia que comprende la secuencia STAR. Por ejemplo, si una secuencia de prueba es escrutada por la presencia de una secuencia STAR, la actividad en una célula de planta, entonces preferiblemente la secuencia de control es también derivada de una célula de planta. Similarmente, para probar la actividad STAR en una célula de humano, el ácido nucleico de control es preferiblemente también derivado de un genoma humano. En una modalidad preferida la secuencia de control comprende entre 50% y 150% de las bases de por lo menos una secuencia que comprende una secuencia STAR. En una modalidad particularmente preferida, la secuencia de control comprende entre 90% y 110% de las bases de por lo menos una secuencia que comprende una secuencia STAR. Más preferiblemente, entre 95% y 105%. Un patrón puede comprender cualquier número de bases mayores que dos. Preferiblemente, en por lo menos un patrón de secuencia, comprende por lo menos 5, preferiblemente por lo menos 6 bases . En otra modalidad por lo menos un patrón de secuencia comprende por lo menos 8 bases. En una modalidad preferida en por lo menos un patrón de secuencia comprende un patrón listado en la tabla 9 y/o tabla 10. Un patrón puede consistir de una lista consecutiva de bases. Sin embargo, el patrón puede también comprender bases que son interrumpidas una o más veces por un número de bases que no son o, solo parcialmente discriminativas . Una base parcialmente discriminativa está, por ejemplo, indicada como una purina. Preferiblemente, la presencia de actividad STAR es verificada usando un ensayo funcional. Aquí son presentados varios métodos para determinar si una secuencia comprende actividad STAR. La actividad STAR es confirmada si la secuencia es capaz de realizar por lo menos una de las funciones siguientes: (i) por lo menos en parte inhibir el efecto de la secuencia que comprende un elemento de represión de transcripción de gen de la invención, (ii) por lo menos en parte bloquear la represión asociada a la cromatina, (iii) por lo menos en parte bloquear la actividad de un mejorador, (iv) conferir sobre un ácido nucleico enlazado operablemente que codifica una unidad de transcripción comparada con el mismo ácido nucleico solo, (iv-a) una mayor predictibilidad de transcripción, (iv-b) una transcripción mayor, y/o (iv-c) una estabilidad mayor de transcripción con el tiempo. El gran número de secuencias que comprende la actividad STAR identificada en la presente invención abre una amplia variedad de posibilidades para generar e identificar secuencias que comprenden la misma actividad en tipo, no necesariamente en cantidad. Por ejemplo, está bien dentro del alcance de una persona experta para alterar las secuencias identificadas en la presente invención y evaluar las secuencias alteradas para actividad STAR. Las secuencias alteradas con por lo tanto también parte de la presente invención. La alteración puede incluir eliminación, inserción y mutación de una o más bases en las secuencias . Las secuencias que comprende actividad STAR fueron identificadas en extensiones de 400 bases. Sin embargo, es esperado que no todas estas 400 bases son requeridas para retener la actividad STAR. Son bien conocidos los métodos para delimitar las secuencias que confieren una cierta propiedad a un fragmento de entre 400 y 5000 bases. La longitud de secuencia mínima de un fragmento que comprende actividad STAR es estimada para ser alrededor de 50 bases. La tabla 9 y la tabla 10 listan patrones de 6 bases que han sido encontrados para estar representados en moléculas de ácido nucleico que comprende la actividad STAR. Esta sobrerepresentación es considerada para ser representativa para una secuencia STAR. Las tablas fueron generadas para una familia de 65 secuencias STAR. Tablas similares pueden ser generadas empezando de un conjunto diferente de secuencias STAR, o de un conjunto menor o mayor de secuencias STAR. Un patrón es representativo para una secuencia STAR si ésta es sobre representada en la secuencia STAR comparada a una secuencia no que comprende un elemento STAR. Esta puede ser una secuencia aleatoria. Sin embargo, para excluir una tendencia no relevante, la secuencia que comprende una secuencia STAR es preferiblemente comparada a un genoma o una parte significante de este. Preferiblemente, un genoma de un vertebrado o planta, más preferiblemente un genoma humano. Una parte significante de un genoma es por ejemplo un cromosoma. Preferiblemente la secuencia que comprende una secuencia STAR y la secuencia de control son derivadas del ácido nucleico de la misma especie. Entre más secuencias STAR son usadas para la determinación de la frecuencia de ocurrencia de patrones de secuencia, más representativo para los STAR son los patrones que están sobre o bajo representados. Considerando que muchas de las características funcionales que pueden ser expresadas por ácidos nucleicos, son mediadas por moléculas proteináceas que enlazan a este, se prefiere que el patrón representativo esté sobrerepresentado en las secuencias STAR. El patrón sobrerepresentado puede ser, parte de, un sitio que enlazan para la molécula de proteinácea. Preferiblemente la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de por lo menos un patrón de secuencia en por lo menos 2 secuencias que comprende una secuencia STAR, más preferiblemente en por lo menos 5 secuencias que comprende una secuencia STAR. Más preferiblemente en por lo menos 10 secuencias que comprende una secuencia STAR. Más preferiblemente, la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de por lo menos un patrón de secuencia en por lo menos 20 secuencias que comprende una secuencia STAR. En una modalidad par icularmente preferida la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de por lo menos un patrón de secuencia en por lo menos 50 secuencias que comprende una STAR. Preferiblemente, las secuencias que comprende una secuencia STAR comprende por lo menos una de las secuencias descritas en la figura 26. La actividad STAR es la característica compartida por las secuencias listadas en la figura 26. Sin embargo, esto no significa que ellas deban compartir todas la misma secuencia identificadora . Es muy posible que existan identificadores diferentes. Los identificadores pueden conferir esta característica común en un fragmento que contiene este, a pesar de que este no es necesariamente así . Usando más secuencias que comprende la actividad STAR para determinación de la frecuencia de ocurrencia de un patrón o patrones de secuencia, es posible seleccionar patrones que están presentes o ausentes más a menudo que otros en una secuencia STAR. En esta forma es posible encontrar patrones que están muy frecuentemente sobre o bajo representados en secuencias STAR. Frecuentemente sobre o bajo patrones representados son más posibles de identificar secuencias STAR candidatas en conjuntos de prueba. Otra manera de usar un conjunto de sobre o bajo patrones representados a para determinar cuál patrón o combinación de patrones es mejor apropiado para identificar una STAR en una secuencia. Usando las así llamadas estadísticas discriminativas hemos identificado un conjunto de patrones que se desarrollan mejor en la identificación de una secuencia que comprende un elemento STAR. En una modalidad preferida por lo menos uno de los patrones de secuencia para detección de una secuencia STAR comprende un patrón de secuencia GGACCC, CCCTGC, AAGCCC, CCCCCA y/o AGCACC. En otra modalidad por lo menos uno de los patrones de secuencia para detección de una secuencia STAR comprende un patrón de secuencia CCCN{l6}AGC, GGCNÍ9JGAC, CACNllSj GG, CTGN{4}GCC. Una lista de secuencias STAR también puede ser usada para determinar una o más secuencias de consenso allí dentro. La invención por lo tanto también provee una secuencia de consenso para un elemento STAR. Esta secuencia de consenso puede por supuesto ser usada para identificar elementos STAR candidatos en una secuencia de prueba. Más aún, una vez que una secuencia que comprende un elemento STAR ha sido identificada en un vertebrado, éste puede ser usado por medio de homología de secuencia para identificar secuencias que comprende un elemento STAR en otra especie perteneciente a los vertebrados. Preferiblemente una secuencia STAR de mamífero es usada para separar por exclusión secuencias STAR en otra especie de mamíferos. Similarmente, una vez que una secuencia STAR ha sido identificada en una especie de plantas, ésta puede ser usada para separar por exclusión secuencias homologas con función similar en otra especie de planta. La invención en un aspecto provee una secuencia STAR obtenible por un método de conformidad con la invención. Además es provista una colección de secuencias STAR. Preferiblemente la secuencia STAR es una secuencia STAR de vertebrados o plantas . Más preferiblemente, la secuencia STAR es una secuencia STAR de mamífero o un angiosperma (monocotiledónea, como arroz o dicotiledónea como Arabidopsis) . Más preferiblemente la secuencia STAR es un primate y/o secuencia STAR de humano. Puede ser usada una lista de secuencias que comprende actividad STAR para determinar si una secuencia evaluada comprende un elemento STAR. Hay, como se mencionó arriba, muchos métodos diferentes para usar una lista para este propósito. En una modalidad preferida de la invención se provee un método para determinar si una secuencia de ácido nucleico de alrededor de 50-5000 pares de base comprende una secuencia STAR el método que comprende, generación de una primera tabla de patrones de secuencia que comprende la frecuencia de ocurrencia de los patrones en una colección de secuencias STAR de la invención, generando una segunda tabla de los patrones que comprende la frecuencia de ocurrencia de los patrones en por lo menos una secuencia de referencia, al seleccionar por lo menos un patrón del cual la frecuencia de ocurrencia difiere entre las dos tablas, determinando, dentro la secuencia de ácido nucleico de alrededor de 50-5000 pares base, la frecuencia de ocurrencia de por lo menos uno de los patrones seleccionados, y determinando si la ocurrencia en el ácido nucleico de prueba es representativo de la ocurrencia del patrón seleccionado en la colección de secuencias STAR. Alternativamente, la determinación comprende determinar si la frecuencia de ocurrencias en el ácido nucleico de prueba es representativo de la frecuencia de ocurrencia del patrón seleccionado en la colección de secuencias STAR. Preferiblemente el método además comprende determinar si el STAR candidato comprende una cualidad de modulación de transcripción de gen usando un método de la invención. Preferiblemente, la colección de STARS comprende secuencia como se describió en la figura 26. En otro aspecto la invención provee una secuencia de ácido nucleico aislado y/o recombinante que comprende una secuencia STAR obtenible por un método de la invención. Como se mencionó arriba, una secuencia STAR puede ejercer su actividad en una forma direccional, esto es más a un lado del fragmento que contiene éste en vez del otro. Más aún, la actividad STAR puede ser amplificada en cantidad por multiplicación del número de elementos STAR. Las sugerencias últimas que un elemento STAR puede comprender uno o más elementos que comprende la actividad STAR. Otra forma de identificación de una secuencia capaz de conferir actividad STAR en un fragmento que contiene ésta comprende selección de una secuencia de vertebrado o planta, una secuencia que comprende actividad STAR e identificando si las secuencias que flanquean la secuencia seleccionada están conservadas en otra especie. Las secuencias flanqueantes conservadas son probables para ser secuencias funcionales. En un aspecto la invención, por lo tanto, provee un método para identificación de una secuencia que comprende un elemento STAR que comprende selección de una secuencias de alrededor de 50 a 5000 pares base de una especie vertebrada o de planta que comprende un elemento STAR e identificando si las secuencias flanqueando la secuencia seleccionada en la especie son conservadas en por lo menos un de otra especie. Por lo tanto, la invención además provee un método para detección de la presencia de una secuencia STAR dentro de una secuencia de ácido nucleico de alrededor de 50-5000 pares base, que comprende identificación de una secuencia que comprende una secuencia STAR en una parte de un cromosoma de una célula de una especie y detectando homología significante entre la secuencia y una secuencia de un cromosoma de una especie diferente. Preferiblemente, la especie comprende una especie de planta o vertebrado, preferiblemente una especie de mamífero. La invención también provee un método para detección de la presencia de un elemento STAR dentro de una secuencia de ácido nucleico de alrededor de 50-5000 pares base de una especie de vertebrado o planta, que comprende identificar si una secuencia flanqueando la secuencia de ácido nucleico es conservada en por lo menos una de otra especie . Es importante notar que los métodos de la invención para detección de la presencia de una secuencia que comprende una secuencia STAR usando información bioinformática sean iterativos en naturaleza. Entre más secuencias que comprenden una secuencia STAR son identificadas con un método de la invención, más patrones son encontrados para ser discriminativos entre una secuencia que comprende una secuencia STAR y una secuencia de control . Usando estas novedades encontrando patrones discriminativos pueden ser identificadas más secuencias que comprende una secuencia STAR las cuales a su vez amplían el conjunto de patrones que pueden discriminar y demás. Este aspecto iterativo es un aspecto importante de los métodos provistos en la presente invención. El término cualidad en relación a una secuencia se refiere a una actividad de la secuencia. El término STAR, secuencia STAR o elemento STAR, como se usaron aquí se refieren a una secuencia de ADN que comprende una o más de las cualidades de modulación de transcripción de gen mencionadas. El término SINC o elemento SINC como se enlistó abajo se refiere a una secuencia de ADN que comprende uno o más de las cualidades de represión de transcripción de gen mencionadas. El término "secuencia de ADN" como se usó aquí, salvo que se especifique de otra manera, no se refiere a una lista de ordenación específica de bases sino más bien a un pedazo físico de ADN. Una cualidad de transcripción con referencia a una secuencia de ADN se refiere a un efecto que la secuencia de ADN tiene en la transcripción de un gen de interés . "Cualidad" como se usa aquí se refiere a propiedades o atributos detectables de un ácido nucleico o proteína en un sistema de transcripción.
EJEMPLOS EJEMPLO 1. METODOS PARA AISLAR ELEMENTOS STAR Y SINC.
Materiales y métodos . Plásmidos y cepas . El vector de selección para elementos STAR, pSelect-SV40-zeo ( "pSelect" , Figura 1) es construido como sigue: el vector pREP4 (Invitrogen V004-50) es usado como el soporte plásmido. Este provee el origen Epstein Barr oriP de replicación y en antígeno nuclear EBNA-1 para replicación episomal de alta copia en líneas de célula de primate; el gen de resistencia de higromicina con el promotor de cinasa timidina y el sitio de poliadenilación, para selección en células mamíferas; y el gen de resistencia de ampicilina y el origen colEl de replicación para mantenimiento en Escherichia coli. El vector contiene cuatro sitios operadores LexA consecutivos entre los sitios de restricción Xbal y Nhel (Bunker y Kingston, 1994) . Empotrado entre los operadores LexA. y el sitio Nhel está un polienlazador consistiendo de los siguientes sitios de restricción: HindIII-AscI-BamHI-AscI-HindIII . Entre el sitio Nhel y un sitio Salí está el gen de resistencia de zeocina con el promotor SV40 y el sitio poliadenilación, derivado de pSV40/Zeo (Invitrogen V502-20) ; este es el marcador seleccionable para la separación por exclusión de STAR. El vector pSDH (Figura 2) está construido como sigue: El gen reportero luciferasa de pGL3-control (Promega E1741) es amplificado por PCR e insertado en SacII/BamHI-digerido pUHDlO-3 (Gossen y Bujard, 1992) . Este coloca la luciferasa bajo control del promotor Tet-Off, y en la dirección 5' de la señal de poliadenilación SV40. Los sitios de clonación múltiple son introducidos por PCR, en la corriente 5' del promotor Tet-Off (MCSI, Xhol-Notl-EcoRI-SalI) y en la corriente 3' de la señal de poliadenilación (MCSII, Nhel-BglII-EcoRV-HindlII) . Las colecciones de gen son construidas por digestión de SAu3AI de ADN genómico humano, ya sea purificado de placenta (Clontech 6550-1) o transportado en cromosomas artificiales bacterial/Pl (BAC/PAC) . Los clones BAC/PAC contienen ADN genómico de la región citogenética lql2 (clones RP1154H19 y RP3328R19) o del grupo HOX de genes homeóticos (clones RP1167F23, RP1170019, y RP311387A1) . Los ADN son tamaño fraccionado, y la fracción de tamaño 0.5-2b es ligada en BanHI -digerida vector pSelect, por técnicas estándar (Sambrook y colaboradores, 1989) . La construcción de los cepas hospedadores han sido descritos (van der Valg y colaboradores, 2000) . Brevemente, están basados en la línea de célula de osteosarcoma humano U-2 OS (America Type Culture Collection HTB-96) . La U-2 OS es transfectada establemente con el plásmido pret-Off (Clontech K1620-A) , que codifica una proteína quimera consistiendo del dominio que enlazan ADN represor Tet y el dominio de transactivación VP16. La línea de célula es subsecuentemente transfectada establemente con fusión de genes de proteína que contiene el dominio que enlazan ADN LexA, y las regiones de ya sea HP1 o HPC2 (dos proteínas de grupo Drosofila Policomb que reprimen la expresión del gen cuando son atadas a ADN) .Los genes represores LexA están bajo control del sistema regulador transcripcional Tet-Off (Gossen and Bujard, 1992) .
Separación por exclusión de la Colección y caracterización del elemento STAR. Las colecciones de gen en pSelect son transfectadas en la línea de célula de represor U-2 OS/Tet-Off/LexA por precipitación de fosfato de calcio (Grahara y van der Eb, 1973; igler y colaboradores, 1978) como se recomendó por el proveedor del reactivo de transfección (Life Technologies) . Las células transfectadas son cultivadas bajo selección de higromicina (25 pg/ml) y represión de tetraciclina (doxiciclina, 10ng/ml) por 1 semana (confluencia de 50%) . Cuando la concentración de doxiciclina es reducida a 0.1 ng/ml para inducir los genes represores LexA, y después de 2 días se adiciona zeocin a 250 µg/ml . Las células son cultivadas por unas 4-5 semanas más, hasta que los cultivos de control (transfectados con pSelect vacío) son exterminados por el zeocina. Las colonias resistentes a Zeocina de la transfección de colección son propagadas, y el ADN plásmido es aislado y rescatado en E. coli por técnicas estándar (Sambrook y colaboradores, 1989) . Los elementos STAR candidatos en el ADN rescatado son analizados por mapeo de endonuclenasa de restricción (Sambrook y colaboradores, 1989) , el análisis de la secuencia de ADN (Sanger y colaboradores, 1977) y por actividad de STAR (resistencia a zeocina) después de re-transfección a represor-U-2 OS/Tet-Off/LexA y disminuyendo la concentración de doxiciclina. Los elementos STAR candidatos que tienen secuencia de ADN correspondiendo a secuencia conocida en el genoma humano son identificados por buscadores de BLAST (Altschul y colaboradores, 1990) de la base de datos del genoma humano (htt : //www. ncbi . nlm.nih.gov/genome/seq/HsBlast . html 20 de junio de 2001) . Las localizaciones cromosomales de los elementos son registradas, a lo largo con la proporción del ADN repetitivo y la identidad de genes adyacentes. Aquellos candidatos que muestran actividad STAR en re-transfección son caracterizadas además por subclonación del fragmento STAR en el plásmido pSDH e integración estable en ADN cromosomal U-2 OS. Los plásmidos pSDH son co-transfectados en células U-2 OS con pBASE-puro (Morgenstern y Land, 1990) , y son seleccionados para resistencia de puromicina. Por el elemento STAR, poblaciones de aproximadamente 30 clones individuales son aislados y cultivados. Los clones son periódicamente ensayados para actividad de luciferasa de conformidad con las instrucciones del fabricante (Roche 1669893) .
Resultados . Caracterización funcional del elemento STAR. Las separaciones por exclusión del ADN genómico humano y del HOX y lql2 loci rindieron 17 elementos STAR bona fide. Los criterios son que (1) los elementos exhibiendo actividad STAR en re-transfección de los clones pSelect basados en la línea de osteosarcoma humano U-2 OS hospedadora (indicando que la actividad anti-represor expresada en la separación por exclusión inicial es plásmido-especlfica y no debida a cambios artefactuales en las células hospedadoras) ; (2) los elementos que contiene secuencia de ADN que coinciden secuencia en la base de datos de secuencia de genoma humano (indicando que el clon no contiene secuencia de ADN contaminante, de fuentes como bacterial o de vector) . Los elementos STAR son sub-clonados en el plásmido pSDH e integrados en el genoma de célula hospedadora. La expresión de los genes reporteros es ensayada en poblaciones de transíectantes estables para demostrar la capacidad de los elementos STAR para proteger genes reporteros de silencio después de integración al azar en el genoma. Esto provee información (1) en la proporción de clones que exhiben expresión alta, y (2) en el grado de sobre-exprésion provocada por los elementos STAR. La expresión del gen reportero luciferasa por un clon es considerada significante si está dos pliegues arriba del nivel promedio para los plásmidos que contiene elementos no STAR (el nivel de referencia) . Para todos los plásmidos es observada una distribución en nivel de expresión entre los clones: de no expresión a expresión significantemente arriba del nivel de referencia, y de pocos sobre expresadores a muchos sobre expresadotes . La actividad STAR superior es manifestada por plásmidos que resultan en muchos clones de sobre-expresión, incluyendo algunos clones altamente de sobre expresión.
Resultados de un experimento representativo están mostradas en la Tabla 1, y en las Figuras 3-5: Los resultados indican que los elementos STAR humanos que son evaluados rinden una proporción mucho mayor de clones de sobre-expresión que el gen reportero no protegido, o el gen reportero protegido por el elemento Drosophila SCS (Kellum y Schedl, 1992) . Además, el grado de sobreexpresión por estos plásmidos es mucho mayor del gen reportero protegido STAR que el no protegido o reportero SCS-protegido .
La secuencia del elemento STAR y datos de posición genómica. La Tabla 2 lista las localizaciones cromosomales de cada uno de los elementos 17 STAR, así como la identidad de genes cercanos y el contenido de ADN repetitivo de los elementos. Los elementos STAR son distribuidos sobre un número de cromosomas. Ellos son diversos en su secuencia de ADn actual y contenido de ADN repetitivo, y exhiben varios grados de asociación con genes vecinos .
Separación por exclusión del elemento SINC Materiales y Métodos. El plásmido para la separación por exclusión del SINC, pSINC-Select ("pSS", Figura 6) está construido como sigue: el vector pREP4 (Invitrogen V004-50) es usado como el soporte del plásmido. Este provee el origen Epstein Barr oriP de replicación y el antígeno nuclear EBNA-1 para replicación episomal de alta copia en líneas de célula de primate; el gen de resistencia de higromicina con el portador de cinasa timidina y el sitio de poliadenilación, para selección en células de mamíferos; y el gen de resistencia de ampicilina y el origen ' colEl de replicación para mantenimiento en Escherichia coli. El vector contiene un promotor Tet-Off, consistiendo de tándem Tet Responsive Elements (TRE) de plásmido pUDH10-3 (Gossen y Bujard, 1992), para regulación por el sistema regulador transcripcional Tet-Off. El TRE regula la expresión del gen codA: :upp que codifica una proteína de fusión (citosina de aminasa/uracil fosforibosiltransferasa; Invivogen porf-codaupp) . Este es un llamado "gen suicida"; la actividad de la enzima codA: :upp convierte un pro-fármaco de 5-fluorocitosina (5-FC) a un fármaco tóxico, 5-fluorouracil (5-FU) , causando de esa manera apoptósis y muerte de célula (Mullen y colaboradores, 1992; Tiraby y colaboradores, 1998; Wei y Huber, 1996) . En la corriente 5' del promotor Tet-Off está un sitio de restricción BglII para clonación de ADN genomico digerido Sav3AI para separación por exclusión. El ADN pREP4 es separado del ADN genomico y del gen suicida por elementos STAR con el propósito de prevenir silenciamiento de elementos plásmidos esenciales en el componente pREP4 por elementos SINC clonados. El ADN genomico de una colección de clones BAC que comprende cromosoma humano 22 (Invitrogen/research Genetics 96010-22) es parcialmente diferido con Sav3AI y ligado en Bglll digerido pSS (Sambrook y colaboradores, 1989) . La colección de plásmidos recombinantes es transfectada en ¦ la línea de célula U-2 OS/Tet-Off por precipitación de fosfato de calcio (Graham y van der Eb, 1973; Wigler y colaboradores, 1978) como se recomendó por el proveedor del reactivo de transfección (Life Technologies) . Las células transfectadas son cultivadas bajo selección de higromicina (25 g/ml) y represión de tetraciclina (doxiciclina, 10ng/ml) para 3 semanas. Entonces 5-FC son adicionados a una concentración de 1 g/ml y las células son cultivadas por unas 3 semanas más para seleccionar los elementos SINC. Las colonias que contienen SINC candidatos son cosechados y usados en una reacción en cadena de polimerasa con cebadores PCR1 y PCR2 (Figura 6) ; los productos PCR son digeridos con endonucleasas de restricción HindIII y Xhol y clonados en pBluescript II SK(+) (Stratagene 212207) por técnicas convencionales (Sambrook y colaboradores, 1989). Las secuencias de ADN de los elementos SINC candidatos son determinadas (Sanger y colaboradores, 1977) , y secuencias correspondiendo en el genoma humano son identificadas por buscadores de BLAST (Altschul y colaboradores, 1990) de la base de datos de genoma humano (htt : // ww. ncbi . nlm.nih. gov/genome/seq/HsBlast . html 20 de junio de 2001) . Las localizaciones cromosomales de los elementos son registradas, a lo largo con la proporción del ADN repetitivo y la identidad de genes adyacentes.
Resultados . Al final del periodo de selección es evidente no haber colonias en los cultivos de control (pSS vacío) , y un número de colonias son evidentes en los cultivos que contiene pSS con ADn genómico. Estos clones sobrevivientes contienen elementos SINC candidatos. Los elementos son recuperados por PCR y subclonados en un vector de clonación estándar, pBluescript. Las secuencias de ADN de los elementos son determinados, y comparados con la secuencia de genoma humano (Tabla 3) . En todos los casos, los elementos secuenciados son encontrados en el cromosoma 22, como se esperaba.
EJEMPLO 2. CARACTERÍSTICAS DE EXPRESIÓN DEL TRANSGEN QUE SON DEBIDAS AL STAR, EL SINC, O EL STAR/S NC COMBINADOS. Antecedentes: la recombinación de sitio específico es usada para remover precisamente los ADN heterogéneos de su localización cromosomal. Esto es llevado a cabo rutinariamente por uno de los dos sistemas: la ere recombinasa y el loxP objetivo del bacteriófago Pl (Feng y colaboradores, 1999), o la recombinasa FLP y FRT (recombinasa FLP objetivo) de levadura (Wigley y colaboradores, 1994). En estos sistemas, un región de ADN (usualmente que contiene un gen reportero y/o un marcador seleccionable) es flanqueada en el cromosoma por el loxP o FRT objetivo. La actividad de la recombinasa después cataliza la expresión precisa de la región de ADN del cromosoma. La recombinasa resuelve sus dos secuencias de reconocimiento a un sitio único, eliminando la secuencia entre ellas. Así, una expansión- de ADN debe ser flanqueada por sitios objetivo a ser eliminados subsecuentemente in vivo en introducción o activación de recombinasa (Schwenk y colaboradores, 1995; Dymecki, 1996) . Las recombinasas Cre y Flp catalizan la recombinación entre dos repeticiones invertidas de pares base 13, separadamente por un espaciador con un mínimo de 6 (loxP) u 8 (FRT) pares base (Senecoff y colaboradores, 1985) . La secuencia loxP es ATAACTTCGTATA y la secuencia FRT es GAAGTTCCTATAC . Protocolo: Usando la clonación de ADN convencional (Sambrook y colaboradores, 1989), u gen reportero (que codifica una proteína reportera, por ejemplo proteína fluorescente verde (GFP) (Bierhuizen y colaboradores, 1997) o luciferasa (Himes y Shannon, 2000) es construido aquel que es flanqueado en un plásmido por un par de elementos STAR, por un par de elementos SINC, o por un par de elementos de combinación STAR/SINC. En cada caso, los elementos son flanqueados por ellos mismos por sitios objetivo de recombinasa . En cada caso, los elementos son flanqueados por ellos mismos por sitios objetivo de recombinasa. Un elemento es flanqueado por un par de sitios loxP, y el otro es flanqueado por un par de sitios FRT (Figura 1) . En transfección el plásmido se integra en el cromosoma hospedador en un porcentaje pequeño de células, y los integrantes son seleccionados por resistencia antibiótica. Construcciones similares son hechas para cada uno de los tres elementos de prueba (STAR, SINC, STAR/SINC) . Usando técnicas convencionales, ("SuperFect Transíection Reagent Handbook," Qiagen, Noviembre,, 1997) estos plásmidos son transfectados en la línea de célula de osteosarcoma humana U-2 OS, y seleccionados por resistencia de higromicina. Los aislados por resistencia de Higromicina tienen un plásmido estable integrado en el genoma de la línea de célula. Los aislados individuales son propagados en medio de cultivo de célula, y es ensayada la expresión del gen reportero transgénico, por ejemplo por citometría de flujo (Stull y colaboradores, 2000) . Entonces usando técnicas convencionales (transfección o estimulación de hormona) , los aislados estables de arriba son tratados como para introducir o activar la actividad de recombinasa. Esto es hecho secuencialmente, dado que por ejemplo la actividad de la recombinasa ere cataliza la extirpación de STAR1, y subsecuentemente la actividad de la recombxnasa PLP cataliza la extirpación de STAR2. El nivel de expresión del gen reportero en estas células es ensayado y el valor comparado con el valor de referencia de los padres, aislado que contiene 'STAR.
EJEMPLO 3. ANALISIS DE SECUENCIA DE STAR; DETERMINACION DE SECUENCIA ESENCIAL MINIMA PARA LA FUNCION DEL ELEMENTO; CONSERVACION DE SECUENCIA ENTRE ELEMENTOS; Y PROPIEDADES DE TANDEM Y ELEMENTOS MULTIPLES. Antecedentes : los fragmentos de ADN que contiene elementos STAR o SINC son aislados por selección genética usando los plásmidos pSelect (Figura 1) o pSS (Figura 6) , respectivamente. Esta sección describe la aproximación a caracterizar la secuencia de ADN dentro de aquellos fragmentos que tiene actividad STAR o SINC.
Protocolos : Secuencia ADN: Los oligonucleótidos son diseñados basados en la secuencia de los plásmidos de selección pSelect y pSS para secuenciar los fragmentos de ADN. Los fragmentos son secuenciados usando la técnica de terminación de cadena dideoxi (Sanger y colaboradores, 1977) . Las secuencias de ADN son después localizadas en posición de cromosoma usando la base de datos de secuencia de genoma humano (hrr : //www.ncbi , nlm, nih, gov: 80/cgi-bin/Entrez/hum_srch?chr=hum_chr. infkquiery) . La densidad de genes y gen en las inmediaciones de la secuencia de fragmento son registradas de la anotación de secuencia del genoma. La actividad transcripcional de esos genes es determinada de bases de datos públicas de micro arreglos de ADN (htt : //arreglos . rockefeller . edu/xenopus/links , html) y datos de SAGE (Serial Analysis of Gene Expression; http : //bioinfo . me .uva . nl/HTM-bin/índex. egi) . Una vez que la información posicional en las secuencias STAR y SINC es recopilada, los datos son analizados en términos de secuencias de consenso adyacentes. Las secuencias de consenso o tendencias (entiéndase por esto que son áreas locales ricas en combinaciones de nucleótido particular, por ejemplo ricas en bases C y G) son detectadas usando algoritmos de búsqueda similares como clustalw (Higgins y colaboradores, 1996) y anotación similar de blosum (Altschul y Gish, 1996) . Cualquier consenso subyacente o tendencia entronctrada son entonces usados para identificar otros STAR potenciales en una escala de genoma por realización de búsquedas de BLAST (Altschul y colaboradores, 1990) . Investigación previa ha identificado proteínas reguladoras transcripcionales que enlazan a aisladores conocidos y elementos de límite (Gaszner y colaboradores, 1899; Gerasimove y Corees, 1998) . En los ejemplos descritos, los sitios de enlace de proteína coinciden con sitios de hipersensibilidad DNase I los cuales son esenciales para aisladores o función de límite. La hipótesis de que los elementos STAR son también enlazados por proteínas reguladoras conocidas es examinada por búsqueda de la base de datos TRANSFAC de factores de transcripción (http: //transfac . gbf . de/T A SFAC/) para porciones de secuencia que ocurren en los elementos STAR. Las porciones de secuencia que son comunes entre los miembros de las colecciones STAR o SINC son indicadores de que el factor de transcripción correspondiente enlaza a ese elemento. Secuencia esencial mínima: Usando este conocimiento de secuencia los elementos STAR (o SINC) s.on truncados y evaluados por funcionalidad. Esto es hecho usando la reacción en cadena de polimerasa (PCR) para clonar sub-fragmentos de los fragmentos que contiene STAR o SINC en pSelect o pSS por técnicas estándar ' (Sambrook y colaboradores, 1989) . Los plásmidos que contiene los sub-fragmentos son transfectados en células U-2 OS y evaluadas para funcionalidad por ensayo para resistencia antibiótica (elementos STAR) o resistencia de pro-fármaco (elementos SINC) . Direccionalmente; Los elementos STAR y SINC son evaluados para direccionalidad usando los plásmidos pSelect y pSS, respectivamente. Por ejemplo, la dirección de los elementos STAr aislados por la separación por exclusión de pSelect es referida como orientación 5' 3'. La orientación del elemento es invertida por técnicas de ADN recombinantes convencionales (Sambrook y colaboradores, 1989) . Los plásmidos resultantes son transíectados en la línea de célula U-2 OS y es ensayada la expresión, del gen reportero (Bierhuizen y colaboradores, 1997; Himes y Shannon, 2000) . El nivel de expresión del plásmido con el elemento de orientación invertido es comparado a aquel con la orientación 5'3'. Si el plásmido de orientación inversa tiene niveles de expresión similar, entonces el elemento STRAR no exhibe direccionalmente . Las combinaciones y múltiplos de los elementos: Para determinar si los elementos STAR están disponibles para función en pares mezclados, los elementos diferentes son combinados y evaluados. El análisis es realizado en el plásmido pSDH por inserción de un elemento en MCSI y uno deferente STAR en MCSII por técnicas de ADN recombinante (Sambrook y colaboradores, 1989) . Los plásmidos resultantes son transfectados , y la expresión del gen reportero es ensayada (Bierhuizen y colaboradores, 1997; Himes y Shannon, 2000) ; los resultados son comparados con la expresión de plásmidos que contiene el mismo elemento en MCSI y MCSII; si la expresión es similar para los dos tipos de plásmidos, entonces se concluye que los elementos STAR diferentes no interfieren uno con el otro. La fuerza de los elementos únicos STAR o SINC es comparada con repeticiones tándem de elementos. Esto es hecho por concatamerización de los elementos STAR o SINC de interés con ligasa de ADN e inserción del producto de enlace en los plasmados pSDH o pSS por técnicas de ADN recombinante (Sambrook y colaboradores, 1989) . Los pl smidos resultantes son transfectados en células U-2 OS, y la expresión del gen reportero es ensayada (Bierhuizen y colaboradores, 1997; Himes y Shannon, 2000) ; los resultados son comparados con la expresión de los plásmidos que contiene elementos únicos STAR o SINC.
EJEMPLO 4. DETERMINACION DE LA DISTANCIA SOBRE UNA FUNCION STAR, SINC O UNA COMBINACION DE ESTAS. Antecedentes : los elementos STAR son usados para optimizar la expresión de transgenes únicos y múltiples. Para determinar si un par único de elementos STAR puede proteger transgenes grandes o múltiples de silenciamiento esto es necesario para determinar el rango sobre el cual los elementos STAR actúan. Información similar es determinada para elementos SINC y combinaciones STAR/SINC. Protocolo: los elementos STAR y SINC son evaluados por su funcionalidad sobre distancia usando plásmidos derivados basados en pSelect o pSS respectivamente, como sigue. Una colección de fragmentos de ADN aleatorios de 500bp a lOkb es recogida por técnicas de clonación de ADN estándar (Sambrook y colaboradores, 1989) . Los fragmentos son seleccionados de esta colección que no posee actividad STAR o SINC, por evaluación den los plásmidos pSelect y pSS como se describió arriba. Para elementos STAR y combinaciones STAR/SINC, estos fragmentos son insertados entre el sitio de clonación y el promotor del gen reportero en el plásmido pSelect apropiado (Figura 1) , Este conjunto de plásmidos es transfectado en la línea de célula U-2 OS, y la expresión medida como se describió arriba. La resistencia de la expresión del gene reportero se correlaciona con la longitud del fragmento aleatorio de ADN separando el elemento STAR del promotor. Los elementos SINC se evalúan en una forma análoga: los fragmentos aleatorios de ADN se insertan entre el elemento SINC y el promotor del plásmido adecuado pSS, y se correlaciona el grado de represión del gen reportero con la longitud del fragmento aleatorio de ADN.
EJEMPLO 5. (a) USO DE UN ELEMENTO SINC QUE SE PRESENTA NATURALMENTE EN LA SELECCIÓN GENÉTICA PARA LOS ELEMENTOS STAR. Antecedentes: Las separaciones por exclusión actuales para los elementos STAR utilizan proteínas lexA-PcG quiméricas para suministrar la represión de un marcador de selección en el plásmido de selección. Al repetir la selección usando los elementos SINC, que se' presenta naturalmente, se identifican los elementos STAR que son específicos para la actividad represora debido a estos elementos SINC que se presenta naturalmente. La separación por exclusión del elemento SINC se basa en la capacidad de la selección genética para identificar aleatoriamente fragmentos generados del ADN genómico que pueden silenciar un promotor "tet-off" y bloquear la expresión del gen suicida codA: :upp. Los elementos SINC recuperados de esta selección, representan un muestreo aleatorio de elementos de silenciamiento genómico y se recuperan diferentes clases de elementos. Para este protocolo, estos elementos diversos SINC se usan para recuperar clases diferentes de elementos STAR que aquellos recuperados en la selecciones basadas en lexA-PcG antes mencionadas . Protocolo: Los elementos SINC de la selección actual se caracterizan y clasifican en clases sobre la base de características de secuencia funcional y de ADN (características funcionales incluyen la fuerza de represión; las características de secuencia incluyen porciones conservadas identificables ; ver el Ejemplo 3). Los elementos representa ivos de cada clase se usan para reemplazar los sitios de enlace lexA en el plásmido pSelect por medio de técnicas de clonación de ADN estándar (Sambrook et al., 189). Un banco de genes se hace con cada uno de estos plásmidos y se usa para identificar nuevos elementos STAR específicos de SINC como se describe (van der Vlag et al., 2000) . Esto se hace con el ADN genómico entero y con ADN del clon BAC que también contiene el elemento SINC que se usa.
EJEMPLO 5 (b) DETERMINACIÓN DE LA LONGITUD MÁXIMA DE LOS ELEMENTOS STAR Y SINC Antecedentes : Se clonan los elementos STAR como fragmentos ADN recuperado usando el plásmido pSelect, que se hace con los fragmentos genómicos de ADN de menos de 2 kb. Sin embargo, estos pudieran ser porciones de un elemento STAR más extendido. Se examina la actividad extendida STAR por los siguientes experimentos. Protocolo: Los elementos STAR clonados en pSelect se mapean a la secuencia del genoma humano. Con objeto de determinar si son porciones de un elemento STAR más extendido, se amplifican las regiones de 4 kb que abarcan los clones por PCR y se clonan en el plásmido pSelect y/o pSDH por técnicas recombinantes estándar de ADN (Sambrook et al., 1989). Los plásmidos resultantes se transfectan en células U-2 OS y se ensayan para la expresión del gen reportero como se describe arriba; los plásmidos que contienen el elemento original STAR de 2 kb se incluyen como un control. Se pueden esperar tres resultados posibles: (1) la expresión similar por los aislados STAR extendidos y de control, que demuestra que el elemento STAR está confinado al fragmento original de 2 kb; (2) expresión menor por los aislados extendidos STAR sugiriendo que el elemento STAR está contenido dentro del fragmento 2 kb y no actúa efectivamente sobre una distancia o que el fragmento extendido tiene un elemento SINC; (3) expresión superior por los aislados extendidos STAR sugiriendo que la región extendida contiene un elemento STAR más completo. En el caso de resultar (3), se reitera el ejercicio con un fragmento PCR mayor de 6 kb. Un elemento STAR también puede ser un compuesto de sitios al cual se enlazan diversas proteínas. Por lo tanto, los fragmentos grandes de ADN con actividad STAR se pueden dividir en fragmentos más pequeños con la actividad STAR (ver ejemplo 3) . Los elementos que son mayores a 2 kb se reconocen como elementos STAR si todavía despliegan la actividad STAR después de truncarse a menos de 2 kb (incluyendo por eliminación interna) .
EJEMPLO 6. ESTADOS DE ACETILACION DE HISTONA Y METILACIÓN DE LOS ELEMENTOS STAR, ELEMENTOS SINC 0 COMBINACIONES DE LOS MISMOS Y DE TRANSGENES ADYACENTES. Antecedentes: Las propiedades reguladoras de los elementos STAR y SINC se asocian con la estructura local de cromatina, que se determina por el ADN mismo y por proteínas asociadas al ADN. Los cambios en la estructura de cromatina que se asocian con los cambios en la expresión de genes se producen a menudo por modificaciones secundarias de las macromoléculas , especialmente la metilación del ADN o la acetilación de proteínas de histona. Al identificar las modificaciones secundarias que suceden en los elementos STAR y SINC y en transgenes adyacentes, proporciona hallazgos para estos elementos . Protocolo: metilación de ADN: Los elementos STAR y SINC o elementos de los mismos se clonan en el plásmido pSelect por técnicas estándar (Sambrook et al., 1989) . Las células U-2 OS se transfectan establemente con estos plásmidos , y con pSelect que carece de un elemento STAR o SINC como un control para determinar la metilación basal del ADN en un gen reportero. Se cosechan las células y la cromatina purificada por procedimientos estándar (Thomas, 1998) . El ADN se requiere con las endonucleasas de restricción Rpa.II y MspI reacciones separadas (Sambrook et al., 1989) . Ambas de estas enzimas de restricción pueden contar la secuencia no metilada CCGG. Cuando se metila el C externo, no se pueden desdoblar ambos MspI y Hpall. Sin embargo, a diferencia de Hpall, el MspI se puede desdoblar la secuencia cuando se metila el C interno. El ADN se somete al manchado Southern y el manchado se analiza por etiquetado final indirecto (Pazin y adonaga, 1998). Como un control, el plásmido correspondiente pSelect como un ADN desnudo no metilado, también se corta con las enzimas descritas y se somete al machado Southern. La comparación de los tamaños diferentes de los fragmentos de ADN, revela si el ADN está metilado in vivo o no. Acetilación de histona-. Las mismas líneas celulares transfectadas usadas para el análisis de metilación de ADN se usan para estos experimentos. El método descrito a continuación produce en un mapa de alta resolución del patrón de acetilación de histona en los elementos STAR y SINC y el gen reportero (Litt et al., 2001) . Los productos de digestión de nucleasa de raicrococos de núcleos se fraccionan en gradientes de sacarosa, y los monómeros y dímeros de nucleosoma purificados se enriquecen por histonas acetiladas por inmunoprecipitación con anticuerpos de anti acetil histona. La fracción de nucleosoma y los inmunoprecipitados se someten a análisis por ejemplo por PCR en tiempo real (Jung et al., 2000) usando cebadores y una sonda Taqman que se combina a los pares base del gen reportero o al elemento STAR o SINC para producir productos de 0.2 kb, con una ventana móvil de 0.1 kb . La tasa de incremento de la señal fluorescente de la sonda Taqman durante el PCR (que es proporcional a la abundancia del ADN de plantilla en la muestra) luego se mide. La relación de la abundancia del ADN de plantilla en la fracción de nucleosoma y los inmunoprecipitados proporcionan un mapa fino del patrón de la acetilación de histona para cada 0.1 kb en el gen reportero y el elemento STAR o SINC (o en el gen reportero en ausencia de un elemento) .
EJEMPLO 7; POSICIONAMIENTO DEL NUCLEOSOMA IN VIVO Y SITIOS DE HIPERSENSIBILIDAD ADN I Antecedentes: La cromatina comprende de ADN histonas y proteínas que no son de histonas. Las histonas forman una partícula de núcleo que está envuelta por ~150 de ADN para hacer una nucleosoma. Los nucleosotnas se separan por 50-75 del ADN ligador. Los nucleosotnas establemente posicionados en el ADN cromosomal reprimen la expresión de genes, y los factores que excluyen nucleosomas o de otra manera remodelan la cromatina pueden superar esta regresión. El posicionamiento de los nucleosomas en una región cromosomal se analiza por un ensayo de nucleasa de micrococos (Mnasa) ; cortes de Mnasa de cromatina preferiblemente en el ADN ligador. Similarmente , se exponen constitutivamente algunas aéreas del ADN a las proteínas que no son de histona, y estas son frecuentemente regiones reguladoras, esto es sitios en donde los factores reguladores de la acción en cis se enlazan. Experimentalmente , estos sitios son hipersensibles a la digestión por la enzima DNasa I . Protocolo: Para determinar la decisión de los nucleosomas en el gen reportero y sobre los elementos STAR y SINC se usa MNasa (Saluz y Jost, 1993) . Los núcleos se purifican de células cultivadas U-2 OS y se digieren con Masa como se describe arriba (acetilación de histona) . Para buscar los sitios de hipersensibilidad de DNasa I en los elementos STAR y SINC o el gen reportero, se tratan los núcleos purificados con DNasa I a una concentración adecuada (por ejemplo 100 µg de ADN genómico y 20-100 U/ml de DNasa I), como se describe (Wallrath et al., 1998). El ADN desnudo se digiere con DNasa I como un control . Para ambas técnicas el gen reportero y los elementos STAR o SINC se mapean en fino usando una extensión del cebador o etiquetado final indirecto y manchado Southern como se describe, (Tanaka et al., 1996; van der Vlag et al., 2000) . El ensayo de Mnasa revela una escalera de bandas discretas en un autoradiograma' que corresponde a las posiciones de los nucleosomas en los elementos STAR o SINC o el gen reportero. Los sitios de hipersensibilidad DNasa I se manifiestan como bandas discretas en el autoradiograma resultante que está ausente o menos prominente en el control de ADN desnudo.
EJEMPLO 8. TIPO DE CÉLULAS, DEPENDENCIA DE TEJIDO, Y DEPENDENCIA DEL PROMOTOR DE LOS ELEMENTOS STAR Y SINC. Antecedentes: Se ha reportado que algunos aisladores o elementos de frontera pueden desplegar una especificidad de tejidos (Takada et al., 2000). Los elementos STAR tienen muchas características en común con los aisladores y los elementos de frontera. Ambos elementos STAR y SINC específicos del te ido y promiscuos tienen un valor biotecnológico en aplicaciones transgénicas . El ensayo descrito a continuación se efectúa para evaluar la dependencia del tipo de células. La especificidad del tejido y las células de los elementos se examinan además por el examen de la expresión de genes en la vecindad de los elementos en el genoma humano, usando bases de datos públicas de microconfiguración de ADN (http://arrays.rockefeller.edu/xenopus/links.html) y datos SAGE (Serial Abalysis of Gene Expression; http : //bioinfo . ame . uva . nl/HTM-biñ/index. egi) . Protocolo: Se prueban los elementos STAR en el plásmido pSDH y los elementos SINC en el plásmido pSS . Se transfectan tres líneas celulares usando protocolos estándar: la línea celular del osteosarcoma humano U-2 OS (Heldin et al., 1986), la linea celular Vero del riñon de mono verde Africano (Símizu et al., 1967) y la línea celular CHO del ovario de hámster chino (Kao y Puck, 1968) . Los elementos pueden funcionar en todos los tres tipos celulares que se categorizan como promiscuo. Aquellos que solamente despliegan actividad en una o dos de las líneas celulares se categorizan como se restringe en su funcionalidad de tipo celular. Especificidad del promotor: Los elementos STAR y SINC se seleccionan normalmente y se prueban en el contexto de fusión con dos promotores, el promotor completo del citomegalovirus (CMV) del elemento de respuesta a la tetraciclina y el promotor mínimo CMV (en combinación con el activador de la transcripción tTA) . Para evaluar la especificidad del promotor, se prueba la función STAR y SINC con otros promotores virales comúnmente usados, nominalmente el virus del simio tipo 40 (SV40) promotores tardío y temprano, el E1A adenoviral y promotores principales tardíos, y la repetición de la terminal larga del virus del sarcoma de Rous (RSV) (Dolí et al., 1996; Smith et al., 2000; Weaver and Kadan, 2000; Xu et al., 1995). Cada uno de estos promotores se clona separadamente en los plásmidos pSelect y pSS por técnicas estándar (Sa brook et al., 1989) junto con los elementos STAR o SINC respectivamente. Se transfectan los plásmidos resultantes en la línea celular U-2 OS ensayada para la expresión del gen reportero como se describe arriba. La capacidad de los elementos SINC para silenciar estos promotores o de los elementos STAR para protegerlos contra el silenciamiento , se determina por comparación con plásmidos que carecen de los elementos STAR o SINC.
EJEMPLO 9. MÉTODOS PARA LA MEJORA DE LOS ELEMENTOS STAR Y SINC. Antecedentes: Se desarrollan elementos mejorados STAR y SINC. Las mejoras producen una resistencia creciente de la actividad represora o anti represora, y elementos con actividad específica de tejido o inducible. Estas mejoras se hacen por una combinación de técnicas .
Protocolos Evolución forzada: PCR propensa al error (Cherry et al., 1999; Henke and Bornscheuer, 1999) se usa para introducir un promedio de una a dos mutaciones de punto por elemento. Los elementos mutagenizados se separan por exclusión usando plásmidos pSelect (o pSS) que contienen proteínas de fusión del marcador de selección reportero mediante por ejemplo resistencia a antibióticos y selección de células activadas por fluorescencia (Bennett et al., 1998). Las rondas posteriores de PCR propenso al error y la selección se efectúan para derivar elementos con mejoras adicionales en la actividad. Combinaciones en Tándem y heterólogas : Como se describe arriba, las combinaciones en tándem y heterólogas de los elementos se prueban por actividad en comparación con los elementos sencillos (ejemplo 3) . La dominancia relativa de los elementos STAR y SINC se prueba en un caso por caso. Se usa para probar la fuerza de un elemento; por ejemplo, si un nuevo elemento STAR es dominante para un elemento SINC fuerte conocido, entonces el STAR se clasifica como muy fuerte. También se considera la posibilidad de que, la relación de dominancia entre STAR y un SINC sea específica del tipo de célula, te ido o del promotor (ejemplo 8) . La prueba de dominancia utiliza el plásmido pSelect con los elementos individuales SINC colocados en la dirección ascendente de los elementos individuales STAR por técnicas de ADN recombinante estándar (Sambrook et al., 1989) . Los plásmidos se transfectan a las células U-2 OS y se ensaya la expresión del gen reportero. La dominancia de SINC se manifiesta por una expresión inferior que el plásmido con solamente un elemento STAR, aunque la dominancia STAR se manifiesta por una expresión superior que el plásmido con solamente un elemento SINC. La introducción del sitio de enlace para otras proteínas de enlace de ADN a los elementos STAR y SINC para agregar características novedosas (por ejemplo inducibilidad, especificidad de tejido) . Antecedentes : Los elementos regulables STAR y SINC se crean al combinarlos con sitios de enlace para proteínas de enlace de ADN dependientes de señal. En un ejemplo, esto involucraría la yuxtaposición de una combinación STAR o SINC o STAR/SINC y un elemento de respuesta glucocorticoide (GRE) . En la ausencia de la estimulación de glucocorticoides, el elemento STAR o SINC funcionaría como se describe. Con la estimulación, el receptor glucocorticoide que se presenta naturalmente se enlaza a GRE e interfiere con la función STAR o SINC. Protocolo : Usando clonación convencional de ADN (Sambrook et al., 1989), se introduce un GRE en el vector pSelect o pSS adyacente a los elementos STAR o SINC, respectivamente. El plásmido se transfecta en células U-2 OS como se describe arriba. Las células se dividen en dos cultivos; uno se trata con glucocorticoides (10 µ?) . La expresión del gen reportero se mide y se compara entre los dos cultivos. Las diferencias en expresión demuestran la capacidad para regular la función STAR y SINC por la ación de una proteína de enlace de ADN dependiente de la señal . Elementos promiscuos STAR y SINC: La prueba o intensificación de estas características involucra el cultivo en líneas celulares diferentes, y el cultivo de largo plazo sin selección de antibióticos (ejemplos 8 y 10) .
EJEMPLO 10. LOS ELEMENTOS STAR Y SINC HACEN OBVIA LA NECESIDAD DE UNA SELECCIÓN CONTINUA PARA EL MANTENIMIENTO DEL TRANSGEN. Antecedentes: En la transgenesis , la confianza en los marcadores de selección tiene dos inconvenientes: el agente de selección es usualmente costoso y lleva un costo metabólico para las células, y existen objeciones reguladoras y éticas para incluir marcadores de selección en aplicaciones transgénicas especialmente si el transgen mismo está en el producto (por ejemplo plantas de cosecha, vectores de terapias de genes) . Los elementos STAR y SINC reducen o eliminan la necesidad de mantener la selección después de establecer el aislado transgénico. Consecuentemente, el gen de resistencia se puede retirar del genoma transgénico por recombinación especifica del sitio con una perdida disminuida de la expresión de transgenes . Protocolo: Las líneas celulares de células U-2 OS transíectadas de forma estable que contienen elementos STAR integrados cromosomalmente, flanquean genes reporteros se producen por transfección del plásmido pSDH con un plásmido de resistencia al antibiótico con actividad transversal como se describe arriba. El experimento involucra probar la estabilidad del nivel de expresión del gen reportero en estas líneas celulares durante un cultivo prolongado (3-6 meses) en ausencia de selección. Esto se prueba con elementos STAR que flanquean la luciferasa o los genes reporteros GFP en plásmidos pSDH. El gen de resistencia a antibióticos se separa al construir un plásmido de expresión (con base en pSDH) en el cual el marcador de antibióticos está flanqueado por los sitios de recombinasa objetivo. El marcador de selección se extirpa posteriormente por la actividad de la recombinasa, como se describe arriba (ejemplo 2).
EJEMPLO 11 PREDICCIÓN Y RENDIMIENTO SE MEJORAN POR LA APLICACIÓN DE LOS ELEMENTOS STAR EN SISTEMAS DE EXPRESIÓN. Los elementos STAR funcionan para bloquear el efecto de la represión de la transcripción que tiene influencia en las unidades de expresión de transgenes. Estas influencias de represión se pueden deber a la heterocromatina ("efectos de posición", (Boivin & Dura, 1998)) o a las copias adyacentes "del transgen ( "silenciamiento de genes inducido por la repetición" (Garrick et al., 1998)). Dos de los beneficios de los elementos STAR para la producción de la proteína heteróloga, son la producción aumentada para hallar células hospedadoras recombinantes primarias de alta expresión y un rendimiento aumentado durante los ciclos de producción. Estos beneficios se ilustran en este ejemplo.
Materiales y Métodos La construcción de los vectores pSDH y los derivados que contienen STAR: El vector pSDH se construyó por una amplificación de la reacción en cadena de polimerasa (PCR) de la estructura de lectura abierta de luciferasa del plásmido pREP4-HSF-Luc (van der Vlag et al., 2000) usando los cebadores C67 y C68 (todos los cebadores por PCR y oligonucleótidos mutagénicos se enlistan en la Tabla 5) , y la inserción del fragmento Sall/BamHI en el pUHD10-3 digerido con SacIl/BamHI (Gossen & Bujard, 1992) . La unidad de expresión de luciferasa se volvió a amplificar con los cebadores C65 y C66, y se vuelve a insertar en pUHD10-3 con objeto de flanquearlo con dos sitios de clonación múltiple (MCSI y MCSII) . Luego se introdujo un sitio Acsl en MCSI por digestión con EcoRI y la inserción de un ligador (que comprende los oligonucleótidos combinados en sus pares base D93 y D94) . El promotor CMV se amplificó del plásmido pCMV-Bsd (Invitrogen K510-01) con los cebadores D90 y D91, y se usó para reemplazar el promotor Tet-Off en pSDH-Tet por digestión de SacIl/SacII y ligación para crear el vector pSDH-CMV. La estructura de lectura abierta de luciferasa en este vector se' reemplazó por SEAP (Posfatasa Alcalina Secretada) como sigue: el vector pSDH-CMV se digiere con SacII y BammHI y se hace con las puntas romas; la estructura de lectura abierta SEAP se aisla del pSEAP básico (Clontech 6037-1) por digestión con EcoRI/SalI, se hace en las puntas romas y se liga en pSDH-CMV para crear el vector pSDH-CS. El gen de resistencia a la puromicína bajo control del promotor SV40 se aisla del plásmido pBabe-Puro (Morgenstem & Land, 1990) por PCR usando los cebadores C81 y C82. Esto se liga en el vector pGL3-control (se separa el sitio BamHI) (Promega E1741) digerido con Ncol/Xbal, para crear pGL3-puro. El pGL3-puro se digiere con BglII/SalI para aislar el gen de resistencia SV40-puro, que se hace con las puntas romas y se liga en el Nhel digerido, terminado en puntas romas pSDH-CS. El vector resultante pSDH-CSP, se muestra en la Figura 7. Todas la etapas de clonación se efectúan siguiendo las instrucciones suministradas por los fabricantes de reactivos de acuerdo con métodos conocidos en el arte (Sambrook et al., 1989) . Los elementos STAR se insertaron en MCSI y MCSII en dos etapas, por digestión del elemento STAR y el vector pSDH-CSP con una enzima de restricción adecuada seguida por ligación. La orientación de los elementos STAR en los vectores recombinan es pSDH se determina por mapeo con restricción. La identidad y orientación de los insertos se verifica por análisis de secuencias de ADN. La formación de secuencias se efectúa por el método de didesoxi (Sanger et al., 1977) usando un formador de secuencias de ADN automatizado Beckman CEQ2000 de acuerdo con las instrucciones del fabricante. Brevemente, el ADN se purifica de E. cóli usando kits QIAprep Spin Miniprep and Plasmid Midi (QUIAGEN 27016 y 12145, respectivamente) . La formación de secuencias de ciclo se efectúa usando oligonucleótidos a la medida C85, E25, y E42 (Tabla 5) , en presencia de terminadores colorantes (Kit formador de secuencias de Ciclo Terminador Colorante CEQ, Beckman 608000) . La transfección y cultivo de células con CHO con los plásmidos pSDH: La Línea Celular de Ovario de Hámster Chino CH0-K1 (CTCC CCL-61) se cultivo en un medio HAMS-F12 más suero de becerro fetal al 10% que contiene 2 mM glutamina, 100 U/ral penicilina, y 100 microgramos/ml estreptomicina a 37 C/5% C02. Las células se transfectarón con el vector pSDH-CSP, y sus derivados que contienen STARR o STAR49 en MCSI y MCSII, usando SuperFect (QIAGEN) como se describe por el fabricante. Brevemente, se sembraron las células para cultivar vasos y hacerse crecer durante la noche hasta una confluencia de 70-90%. El reactivo SuperFect se combino con el ADN plásmido (linealizado en este ejemplo por digestión con Pvul) a una relación de 63 microlitros por microgramo (por ejemplo. para una caja Petri 10 cm, 20 microgramos de ADN y 120 microlitros de SuperFect) y se agrega a la célula. Después de la incubación durante la noche, se reemplazó la mezcla de transfección con medio fresco y se incubaron además las células transfectadas . Después del cultivo durante la noche se agregaron 5 microgramos/ml de puromicina. La selección con puromicina fue completa en 2 semanas, después de lo cual los clones CGO/pSDH-CSP resistentes a la puromicina individual se aislaron al azar y se cultivaron además .
Ensayos de fosfatasa alcalina secretada (SEAP) : actividad SEAP (Berge et al., 1988, Henthorn et al., Kain, 1997, Yang et al., 1997) en el medio de cultivo de los clones CHO/pSDH-CSP se determina por el fabricante (Clontech Great EscAPe kit#2041) . Brevemente, se inactiva con calor una alícuota del medio a 65 C, luego se combina con una solución amortiguadora de ensayo y el substrato quimioluminicente CSPD y se incuba a temperatura ambiente por 10 minutos. La velocidad de conversión del substrato luego se determina en un luminómetro (Tuner 20/20TD) . Se determina la densidad celular al contar las células tratadas con tripsina en un contador de células Coulter ACT10. La transfección y el cultivo de las células U-2 OS con plásmidos pSDH: la linea celular U-2 OS de osteosarcoma humano (ATCC #HTB-96) se cultiva en un medio Eagle modificado de Dulbecco + suero de becerro fetal al 10% contiene glutamina, penicilina y estreptomicina (supra) a 37 C/5% C02. Las células se co-transfectaron con el vector pSDH-CMV y sus derivados que contiene STAR6 o STAR8 en MCSI y MCSII (junto con el plásmido pBabe-Puro) usando SuperFect (supra) . La selección de puromicina estuvo completa en 2 semanas tiempo después del cual los clones U-2 OS/pSDH-CMV resistentes a la puromicina individual se aislaron al azar y se cultivaron además . Ensayo de luciferasa: actividad luciferasa (Himes & Shannon, 2000) se ensayo en células resuspendidas de acuerdo con sus instrucciones del fabricante del kit de ensayo (Roche 1669893) , usando un luminómetro (Turner 20/20TD) . Se determinó la concentración total de proteínas celular por el método del ácido bicinconínico de acuerdo con las instrucciones del fabricante (Sigma B-9643) y se usó para normalizar los datos de luciferasa. Resultados Los clones de células CHO recombinantes que contienen el vector pSDH-CSP o los plásmidos pSDH-CSP que contienen STAR6 o STAR49 (tabla 6), se cultivaron por 3 semanas. Luego se determinó la actividad SEAP de los sobrenadantes de cultivo y se expresa sobre la base del número de células (FIG 8) . Como se puede observar, los clones con los elementos STAR en las unidades de expresión se aislaron que expresan una actividad SEAP de 2-3 veces superior que los clones cuyas unidades de expresión no incluyen los elementos STAR. Además, el número de clones que contiene STAR que expresan la actividad SEAP en o arriba de la actividad máxima de los clones menores de STAR es bastante alta: 25% a 40% de las poblaciones de clon STAR superan la expresión superior SEAP. de los clones pSDH-CSP. Los clones de las células U-2 OS recombinantes que contiene el vector pSDH-CMV o los plásmidos pSDH-CMV que contienen STAR6 o STAR8 (tabla 6) se cultivaron por 3 semanas. La actividad de la luciferasa en las células hospedadoras luego se determinó y se expresa como unidades relativas de luciferasa (FIG 9) , normalizadas a la proteína de células totales. Los clones recombinantes U-2 OS con los elementos STAR que flanquean las unidades de expresión, tuvieron rendimiento superiores que los clones con menos STAR: la expresión más alta observada de los clones STAR8 fue de 2-3 veces superior que la expresión de los clones con menos STAR. Los clones STAR6 tuvieron niveles de expresión máximos 5 veces superiores que los clones con menos STAR. Los elementos STAR otorgaro una predicción superior también: para ambos elementos STAR, 15 a 20% de los clones desplegaron expresión de lucxferasa a niveles comparables o superiores al clon con menos STAR con el nivel de expresión más alto. Estos resultados demuestran que cuando se usa con el promotor fuerte CMV, los elementos STAR incrementan el rendimiento de las proteínas heterólogas (luciferasa y SEAP) . Todos los 3 elementos STAR introducidos en este ejemplo suministran rendimientos elevados. La capacidad de predicción creciente otorgada por los elementos STAR se manifiesta por la proporción grande de clones con rendimientos iguales o mayores que los rendimientos más altos desplegados por los clones menos STAR.
EJEMPLO 12 Los elementos STAR mejoran la estabilidad de la expresión de transgenes. Durante el cultivo de células hospedadoras recombinantes , es práctica común mantener la selección de antibióticos. Esto se pretende para evitar el silenciamiento transcripcional del transgen, o la pérdida del transgen del genoraa por procesos tales como la recombinación. Sin embargo, es indeseable para la producción de proteínas heterólogas por diversas razones. Primero los antibióticos que se usan son bastante costosos y contribuyen significativamente al costo unitario del producto. Segundo para el uso biofarmacéutico la proteína debe ser demostrablemente pura sin ningunas trazas del antibiótico en el producto. Una ventaja de los elementos STAR para la producción de proteína heteróloga, es que le otorgan una expresión estable a los transgenes durante el cultivo prolongado, aun en ausencia de la selección de antibióticos, esta propiedad se demuestra en este ejemplo.
Materiales y métodos La línea celular U-2 OS se transfecta con el plásmido pSDH-Tet-STAR6 y se cultiva como se describe en el ejemplo 11. Los clones resistentes a la puromicina individuales se aislan y cultivan además en ausencia de doxiciclina. A intervalos semanales, se transfieren las células a recipientes de cultivo fresco a un dilución de 1-.20. se mide la actividad de luciferasa a intervalos periódicos como se describe en el ejemplo 11. Después de 15 semanas, se dividieron los cultivos en 2 replicados; un replicado continua para recibir la puromicina mientras que el otro replicado no recibe antibiótico por el resto del experimento (25 semanas en total) .
Resultados La tabla 7 presenta los datos en la expresión de luciferasa por una unidad de expresión flanqueada con STAR6 durante el crecimiento prolongado con o sin antibióticos. Como se puede observar, la expresión del transgen reportero, luciferasa, permanece estable en las células hospedadoras U-2 OS por la duración del experimento. Después de que los cultivos se dividieron en 2 tratamientos (más antibiótico y sin antibiótico) la expresión de luciferasa fue esencialmente estable en ausencia de la sección de antibióticos. Esto demuestra la capacidad de los elementos STAR para proteger del silenciamiento a los transgenes o perdida durante un cultivo prolongado. También demuestra que esta propiedad es independiente de las selección de antibióticos. Por lo tanto la producción de proteínas heterólogas es posible sin incurrir en los costos del antibiótico o un procesamiento difícil en la dirección descendente.
Ejemplo 13 Secuencias esenciales mínimas de elementos STAR. Los elementos STAR de la pantalla genética descrita en el ejemplo 1. La pantalla utiliza colecciones construidas con ADN genómico humano que se fracciona por tamaño hasta aproximadamente 0.5 - 2 kilobase (supra) . Los elementos STAR en el rango desde 500 a 2361 pares base (tabla 6) . Es posible que, para muchos de los elementos STAR que se han aislado, la actividad STAR se confiere por un fragmento de ADN más pequeño que el clon aislado inicialmente . Es útil para determinar estos tamaños de fragmento mínimo que son esenciales para la actividad STAR por 2 razones, primero, los elementos STAR funcionales más pequeños serán ventajosos en el diseño de vectores de expresión compactos, ya que los vectores más pequeños transfetan células hospedadores con mayor eficiencia. Segundo, determinan secuencias STAR esenciales mínimas que permiten . la modificación de aquellas secuencias para aumentar la funcionalidad. Dos elementos STAR se han mapeado en fino para determinar sus secuencias esencial mínima.
Materiales y métodos STAR10 (1167 pares base) y STAR27 (1520 pares base) se han mapeado en fino. Se han amplificado por PCR para proporcionar subfragmentos de aproximadamente una longitud de igual (leyenda de la figura 10) . Para el probado inicial, estos se clonaron en el vector pSelect en el sitio BamHI, y se transfectan en células U-2 0S/Tet-0ff/LexA-HPl como se describe en el ejemplo 1. Después de la selección para resistencia a la higroraicina, el LexA-HPl se induce al reducir la concentración de doxiciclina. Las células transfectadas se incuban entonces con zeocina para probar la capacidad de los fragmentos STAR para proteger la unidad de expresión SV40-Zeo de la represión debido al enlace LexA-HPl.
Resultados En este experimento, STARIO y STAR27 confieren buena protección contra el silenciado de gen, como se espera (figura 10) . Esto se manifiesta por un crecimiento robusto en la presencia de zeocina. De los 3 sub-fragmentos STARIO, 10A (-400 pares base) confiere en las células transfectadas vigoroso crecimiento en presencia de zeocina, excediendo el del elemento STAR de longitud completa. Las células transfectadas con constructos pSelect que contienen los otros 2 sub-fragmentos no crecen en presencia de zeocina. Estos resultados identifican el fragmento ~400 de 10A pares base como se abarca la secuencia de ADM en respuesta a la actividad anti-represión de STARIO. STAR27 confiere crecimiento mejorado en zeocina a las células transfectadas en este experimento (figura 10) . Uno de los subfragmentos de este STAR, 27B (~500 pares base) , permite un crecimiento pobre de las células hospedadoras en un medio que contiene zeocina. Esto sugiere que la actividad anti-represión de este STAR se localiza parcialmente en el subfragmento 27B, - pero la actividad completa requiere secuencias desde 27A y/o 27C (cada una ~500 pares base) .
Ejemplo 14 La función de los elementos STAR en diversas cepas de células de mamífero cultivadas. La elección de la línea celular hospedadora para la expresión de proteína heteróloga es un parámetro crítico para la calidad, rendimiento, y costo unitario de la proteína. Las consideraciones tales como modificaciones post-traduccionales, capacidad de trayectoria secretoria, e inmortalidad de la línea celular dictan la línea celular apropiada para un sistema de producción biofarmacéutico particular. Por esta razón, las ventajas proporcionadas por los elementos STAR en términos de rendimiento, predictividad, y estabilidad, deberán obtenerse en diversas líneas celulares. Esto se prueba al comparara la función de STAR6 en la línea de célula U-2 OS humana en la cual se clona originalmente, y la línea célula CHO que es ampliamente aplicada en la biotecnología. Materiales y métodos Los experimentos del ejemplo 11 se refieren. Resultados La expresión del gen reportero SEAP en células CHO se presenta en la figura 8; la expresión del gen reportero de luciferasa en células U-2 OS se presenta en la figura 9. Para comparación de los resultados de estos 2 experimentos, será aparente que el elemento STAR6 es funcional en ambas líneas celulares: la expresión del gen reportero fue más predecible en ambos de ellos, y los clones de cada una de las líneas celular exhiben mayores rendimientos, cuando el gen reportero se protege de los efectos de posición por STAR6. Estas dos líneas celulares se derivan de diferentes especies (humano y hámster) y de diferentes tipos de tejidos (hueso y ovario), reflejando el amplio rango de células hospedadoras en las cuales este elementos STAR puede utilizarse en el mejoramiento de la expresión de proteína heteróloga.
Ejemplo 15 La función de los elementos STAR en el contexto de varios promotores transcripcionales . La transcripción del transgen se realiza al colocar la estructura de lectura abierta del transgen bajo el control de un promotor exógeno. La elección del promotor está influenciada por la naturaleza de la proteína heteróloga y el sistema de producción. En la mayoría de los casos, los promotores constitutivos fuertes se prefieren debido a los altos rendimientos que pueden proporcionar. Algunos promotores virales tienen estas propiedades; el promotor/aumentador del gen temprano inmediato de citomegalovirus ("promotor CMV") se aprecia generalmente como el promotor más fuerte en el uso biotecnológico común (Boshart et al., 1985, Dolí et al., 1996, Foecking & Hofstetter, 1986) . El promotor SV40 de virus de simio también es moderadamente fuerte (Boshart et al . , 1985, Foecking & Hofstetter, 1986) y se usa frecuentemente para la expresión ectopica en vectores de célula de mamífero. El promotor Tet-Off es inducible: el promotor se representa en presencia de tetraciclina o antibióticos relacionados (se usa comúnmente doxiciclina) en líneas de células que expresan el plásmido tTA (Clontech K1620-A) , y la remoción de los resultados antibióticos en la inducción transcripcional (Deuschle. et al., 1995, Gossen & Bujard, 1992, Izumi & gilbert, 1999, Umana et al., 1999). Materiales y Métodos La construcción de los vectores pSDH-Tet y pSDH-CMV se describe en el ejemplo 11. El pSDH-SV40 se construye por amplificación PCR del promotor SV40 (cebadores D41 y D42) del plásmido pSelect-SV40-Zeo (ejemplo 1) , seguido por la digestión del producto PCR con SacII y Salí. El vector pSDH-CMV se digiere con SacII y Salí para remover el promotor CMV y el fragmento SV40 se ligan juntos para crear pSDH-SV40. El STAR6 se clona en MMCSI y MCSII como se describe en el ejemplo 11. Los plásmidos pSDH-Tetm pSDH-Tet-STAR6 , pSDH-Tet-STAR7, pSDH-SV40 y pSDH-SV 0-STAR6 se co-transfectan con pBabe-Puro en U-2 OS usando SuperFect como se describe por el fabricante. El cultivo celular, selección de puromicina, y ensayos de luciferasa se llevan a cabo como se describe en el Ej emplo ' 11.
Resultados Las figuras 9, 11 y 12 comparan la expresión del gen reportero de luciferasa de 3 diferentes promotores: 2 promotores virales fuerte y constitutivo (CMV y SV40) , y el promotor Tet-Off inducible. Los 3 promotores se probaron en contexto del elemento STAR6 en células U-2 OS. Los resultados demuestran que el rendimiento y predictibilidad de los 3 promotores se incrementa por U-2 OS STAR6. Como se describe en los ejemplo 11 y 14, el STAR6 se benéfica en el contexto del promotor CMV (figura 9) . Se observan mejoras similares en el contexto del promotor SV40 (figura 11) : el rendimiento del clon STAR6 altamente expresado es 2-3 veces mayor que los mejores clones pSDH-SV40 y 6 clones STAR (20% de la población) tienen rendimiento mayores que los mejores clones menos STAR. En el contexto del promotor Tet-Off bajo concentraciones de inducción (doxiciclina baja), STAR6 también mejora el rendimiento y predictibilidad de la expresión del transgen (figura 12) : el clon STAR6 altamente expresado tiene un rendimiento 20 veces mayor que el mejor clon pSDH-Tet, y 9 clones STAR6 (35% de la población) tienen rendimientos superiores que el mejor clon menos STAR. Se concluye que este elemento STAR es versátil en sus propiedades protectoras del transgen, ya que funciona en el contexto de varios promotores biotecnológicamente útiles de transcripción .
Ejemplo 16 La función del elemento STAR puede ser direccional . Aunque pueden ser simétricas las secuencias de ácido nucleico cortas (por ejemplo palindrómica) , las secuencias que se presentan naturalmente más largas típicamente son asimétricas. Como resultado, el contenido de información de las secuencias de ácido nucleico es direccional, y las secuencias por sí mismas pueden describirse con respecto a sus extremos 5' y 3'. La direccionalidad de la información de secuencia de ácido nucleico afecta la colocación en la cual las moléculas de ADN recombinantes se ensamblan usando técnicas de clonación estándar conocidas en el arte (Sambrook et al., 1989). Los elementos STAR son secuencias de ADN asimétricas, largas, y tienen una direccionalidad con base en la orientación en la cual se clonan originalmente en el vector pSelect . En los ejemplos dados arriba, usando 2 elementos STAR en vectores pSDH su direccionalidad. se conserva. Esta orientación se describe como la orientación nativa o 5'-3', con relación al gen de resistencia a la zeocina (ver figura 13) . En este ejemplo, la importancia de direccionalidad para la función STAR se prueba en el vector pSDH-tet. Ya que los genes reporteros en los vectores pSDH se flanquean en ambos lados por copias del elemento de interés STAR, la orientación de cada copia STAR deberá considerarse. Este ejemplo compara la orientación nativa con la orientación opuesta (ejemplo 13) .
Materiales y métodos El elemento STAR66 se clona en pSDH-Tet como se describe en el ejemplo 11. Las células U-2 OS se co-trasnfectan con plásmidos pSDH-Tet-STAR66-nativo y pSDH-Tet-STAR66-opuesto, y se cultivan como se describe en el ejemplo 11. Los clones individuales se aislan y se cultivan; el nivel de expresión de luciferasa se determina como se describe (supra) .
Resultados Los resultados para la comparación de la actividad STAR66 en la orientación nativa y en la orientación opuesta se muestran en la figura 14. Cuando el STAR66 está en la orientación opuesta, el rendimiento de solo un clon es razonablemente alto (60 unidades de luciferasa) . En contraste, el rendimiento del clon altamente expresado cuando el STAR66 está en la orientación nativa, es considerablemente mayor (100 unidades de luciferasa) , y la predictibilidad es mucho mayor tanto como 7 clones de la población de orientación nativa (30%) expresan la luciferasa arriba del nivel del clon que la expresa más alto de la población de la orientación opuesta, y 15 de los clones en la población de orientación nativa (60%) expresa la luciferasa arriba de 10 unidades de luciferasa relativa. Por lo tanto, se de muestra que la f nción STAR66 es direccional .
Ejemplo 17 Expresión del transgen en el contexto de elementos STAR es dependiente del número. Las unidades de expresión del transgen para la expresión de proteína heteróloga se integran generalmente en el genoma de la célula hospedadora para asegurar la retención estable durante la división celular. La integración puede resultar en una o múltiples copias de la unidad de expresión a insertarse en el genoma; copias múltiples pueden o no presentarse como configuraciones en tándem. El rendimiento incrementado demostrado para los transgenes protegidos por los elementos STAR (supra) sugiere que los elementos STAR son capaces de permitir las unidades de expresión de transgen que funcionen independientemente de la influencia en la transcripción asociada con el sitio de integración en el genoma (independencia de los efectos de posición (Biovin & Dura, 1998)). Esto sugiere además que los elementos STAR permiten que cada unidad de expresión funcione independientemente de las copias vecinas de la unidad de expresión cuando se integran como una ubicación tándem (independencia del gen que induce la repetición silenciado (Garrick et al., 1998)). La copia dependiente del número se determina de la relación entre niveles de expresión del transgen y número de copia, como se describe en el ejemplo siguiente.
Material y métodos Se co-transfectan células U-2 OS con pSDH-Tet-STAR10 y se cultivan bajo una selección de puromicina como se describe (supra) . Se aislan 8 clones individuales y se cultivan. Se cosechan entonces las células, y una porción se evalúa para actividad de luciferasa como se describe (supra) . Las células restantes se alisan y el ADN genómico se purifica usando el kit de tejido DNeasy (QIAGEN 69504) como se describe por el fabricante. Se cuantifican las muestras de ADN por espectrofotomeria UV. Tres microgramos de cada muestra de ADN genómico se digieren con PvuII. y Xhol durante la noche como se describe por' el fabricante (New England Biolabs) y se resuelve por electroforesis en gel de agarosa. Los fragmentos de ADN se transfecta a una membrana de nylon como se describe (Sambrook et al., 1989) y se hibridizan con una sonda radioactivamente etiquetada al gen de luciferasa (aislado de pSDH-Tet digerido por BamHl/SacII) . La mancha se lava como se describe (Sambrook et al., 1989) y se expone a una pantalla formadora de imágenes de fosforina (Personal F/X, BioRad) . El autoradiograma (figura 15) se analiza por densitometría para determinar la fuerza relativa de las bandas de ADN de luciferasa que representan el número de copia del transgen.
Resultados Las actividades de la enzima y los números de copia (intensidades de la banda de ADN) de luciferasa en los clones de la población de clon pSDH-Tet-STAR10 se muestran en la figura 16. El número de copia de transgen está altamente correlacionado con el nivel de expresión de luciferasa en estos clones pSDH-Tet-STAR10 (r = 0.86). Esto sugiere que STAR10 confiere una copia dependiente del número en las unidad de expresión de transgen. Haciendo la expresión del transgen independiente de otras copias de transgen en ubicaciones tándem, e independientes de las influencia del gen silenciador en el sitio de integración.
E emplo 18 Función de los elementos STAR como bloqueadores intensificados pero no intensificadores . Los promotores del gen se someten a influencias tanto positiva como negativa en su capacidad para iniciar la transcripción. Una clase importante de elementos que externa influencias positivas son intensificadores . Los intensificadores son característicamente capaces de afectar los promotores aun cuando estos se localizan muy a lo lejos (muchos pares de kilobases) del promotor. Las influencias negativas que actúan por la formación de heterocromatina (por ejemplo proteínas del grupo Polycomb) se han descrito arriba, y estas son el objeto de la actividad STAR. La base bioquímica para la función aumentadora y para la formación de heterocromatina es fundamentalmente similar, ya que involucran ambos enlaces de proteínas al ADN. Por lo tanto, es importante determinar si lo elementos STAR son capaces de bloquear las influencias positivas así como influencias negativas, en otras palabras, proteger los transgenes de intensificadores genómicos en la vecindad del sitio de integración. La capacidad de proteger transgenes de la actividad aumentadora asegµra un desempeño estable predecible de transgenes en aplicaciones biotecnológicas . Este ejemplo examina el desempeño de los elementos STAR en un ensayo bloqueador del aumentador. Otra característica de la actividad STAR que es importante a su función, es el rendimiento incrementado que confiere los transgenes (ejemplos 11) . Los STAR se aislan en base a su capacidad para mantener niveles altos de expresión de zeocina cuando las proteínas que forma heterocormatina se enlazan adyacentes a los elementos STAR candidatos. La alta expresión se predice que ocurre debido a que los STAR se anticipan para bloquear la extensión de la heterocromatina en la unidad de expresión de zeocina. Sin embargo, un segundo escenario es que el fragmento de ADN en los clones que resisten a la zeocina contiene intensificadores . Los intensificadores han demostrado que tienen la capacidad de vencer los efectos represivos de las proteínas del grupo Polycomb tales como aquellas usadas en el método de la pantalla STAR (Zink & Paro, 1995) . Los aumentadoras aislados por este fenómeno se consideraran positivos falsos ya que los intensificadores no tienen las propiedades reivindicadas para los STAR. Con objeto de demostrar que los elementos STAR no son intensificadores, se prueba en un ensayo de intensificador . El ensayo que bloquea el intensificador y el ensayo intensificador son metodológicamente y conceptualmente similares. Estos ensayos se muestran esquemáticamente en la figura 17. la capacidad de los elementos STAR para bloquear intensificadores usando el sistema intensificador E47/recuadro E. La proteína E47 es capas de activar la transcripción por promotores cuando se enlazan a una secuencia de ADN recuadro E localizada en la vecindad de estos promotores (Quong et al., 2002). El E47 se involucra normalmente en la regulación de la diferenciación del limfocito B y T (Quong et al., 2002), pero es capas de funcionar en diversos tipos de célula cuando se expresa ectopicamente (Petersson et al., 2002). El recuadro E es una secuencia de ADN palindrómica, CANNTG ( nofler et al., 2002). En el ensayo de bloqueo del intensificador, un recuadro E se coloca en dirección ascendente de un gen reportero de luciferasa (que incluye un promotor mínimo) en un vector de expresión. Un sitio de clonación para elementos STAR se coloca entre el Recuadro E y el promotor. La proteína E47 se codifica en un segundo plásmido. El ensayo se realiza al transfectar tanto el plásmido E47 como el vector de expresión de luciferasa en las células; la proteína E47 se expresa y se enlaza al Recuadro E y el complejo E47/Recuadro E es capaz de actuar como un intensificador . Cuando el vector de expresión de luciferasa no contiene un elemento STAR, el complejo E47/Recuadro E aumenta la expresión de luciferasa (figura 17A, situación 1) . Cuando los elementos STAR se insertan entre el Recuadro E y el promotor, su capacidad para bloquear el intensificador se demuestra al reducir la expresión de actividad de luciferasa (figura 17A, situación 2) ; si los STAR no bloquean los intensificadores , la expresión de luciferasa se activa (figura 17A, situación 3) . La capacidad de los elementos STAR para actuar como intensificadores utiliza el mismo vector de expresión de luciferasa. En ausencia de E 7, el Recuadro E no afecta por sí mismo la transcripción. Al contrario, el comportamiento intensificador por los elementos STAR resulta en la activación de la transcripción de luciferasa. El ensayo se realiza al transfectar el vector de expresión de luciferasa sin el /plásmido E47. Cuando el vector dé expresión no contiene elementos STAR, la expresión de luciferasa es reducida (figura 17B, situación 1) . Si los elementos STAR no tienen propiedades intensificadoras, la expresión de luciferasa es baja cuando un elemento STAR se presenta en el vector (figura 17B, situación 2) . Si los elementos STAR no tiene propiedades intensificadoras , la expresión de luciferasa se activará en los vectores que contienen STAR (figura 17B, situación 3) .
Materiales y métodos . El vector de expresión de luciferasa se construye al insertar el Recuadro E y un promotor mínimo de fosfatasa alcalina humano de plásmido mu-E5+E2x6-cat (X) (Ruezinsky et al., 1991) en dirección ascendente al gen de luciferasa en el plásmido pGL3 -básico (Promega E1751) , para crear la luciferasa pGL3 -Recuadro . E (regalo de W. Romano ) . El plásmido de expresión E47 contiene la estructura de lectura abierta E47 bajo control de un promotor beta-actina en el plásmido pHBAPr-l-neo; el E47 se expresa constitutivamente de este plásmido (regalo de W. Romanow) . Los elementos STAR 1, 2, 3, 6, 10, 11, 18 y 27 se han clonado en el vector de expresión de luciferasa. Los clones que contienen el elemento Drosophila scs y el núcleo HSA-6x beta-globina de pollo ("HS4") se incluyen como controles positivos, y se conocen por ser intensificadores de bloqueo, y por no tener propiedades intensificadoras intrínsecas (Chung et al., 1993, Kellum & Schedl, 1992)), y el vector de expresión de luciferasa vacío se ha incluido como un control negativo. Todos los ensayos se realizaron usando línea de célula U-2 OS. En el ensayo bloqueador del intensificador, el plásmido E47 ¦ se co-transfecta con los vectores de expresión de luciferasa (vector vació, o que contiene STAR o elementos de control positivos) . En el ensayo intensificador el plásmido E47 se cotransfecta con el vector de expresión de luciferasa menos STAR como un control positivo para la actividad intensificadora; todas las otras muestras reciben un plásmido despreciable durante la co-transfección. La células transitoriamente transíectadas se evalúan para actividad luciferasa 48 horas después de la transfección del plásmido (supra) . La actividad luciferasa expresada del plásmido que no contiene elementos Recuadro E o STAR/control se substrae, y las actividades de luciferasa se normalizan, para el contenido de proteína como se describe (supra) .
Resultados La Figura 18 muestra los resultados del ensayo bloqueador del intensificador . En ausencia de elementos STAR (o los elementos bloqueadores del intensificador conocidos scs y HS4) , el complejo intensificador E47/Recuadro E activa la expresión de luciferasa ("vector"); este nivel aumentado de expresión se normaliza hasta 100. La actividad intensificadora se bloquea por todos los elementos STAR probados. La actividad intensificadora también se bloquea por los HS4 y scs, como se espera (Bell et al., 2001, Gerasimova & Corees, 2001). Estos resultados demuestran que además de su capacidad para bloquear la amplitud del silenciado transcripcional (influencias negativas) , los elementos STAR son capaces de bloquear la acción de los intensificadores (influencias positivas) . La Figura 19 muestra los resultados del ensayo intensificador . El nivel de expresión de luciferasa debido al. aumento por el complejo E47/Recuadro E se coloca a 100 ("E47"). Para comparación, ninguno de los elementos STAR se une a alrededor de activación importante de expresión de luciferasa. Como se espera, los elementos scs HS4 tampoco se enlazan alrededor de la activación del gen -reportero. Por lo tanto se concluye que al menos los elementos STAR probados no poseen propiedades intensificadoras .
Ejemplo 19 Caracterización de un Elemento de Cromatina Inducido Silenciador (SINC) Materiales y Métodos Las características generales de la pantalla SINC se han descrito en el Ejemplo 1, y algunos aspectos de ésta se recapitulan aquí. Una .versión del vector pSS que usa los elementos SINC exhibidos en el ADN genómico es pSS-codA: :upp (Figura 20) . Esto consiste de la unidad de expresión de gen suicida, flanqueada por dos elementos STAR6. La unidad de expresión, que consiste del gen suicida codA: :upp bajo control del promotor Tet-Off, está en dirección descendente de un sitio de restricción BglII. Una segunda versión del vector pSS, pSS-hrGFP (Figura 21) , se crea reemplazando un elemento STAR6. con STAR8, y reemplazando el gen suicida con el gen hrGFP, que codifica la proteína fluorescente verde (Stratagene 240059) . El ADN genómico humano del cromosoma 22 (Research Genetics 96010-22) se digiere parcialmente con Sau3AI y se fracciona por tamaño. La fracción de 0.5 - 10 kilobase-par se liga en el sitio BglII de pSS-codA: :up . Esta colección representa ~20,000 de clones independientes con un tamaño de inserto promedio de 1.2 kilobase pares. La colección se amplifica en Escherichia coli. El ADN purificado de la colección amplificada se transfecta en células U-2 ' OS/Tet-Off (van der Vlag et al., 2000) por técnicas estándar (fosfato de calcio; Life Techonologies 18306-019) . Una transfección de control se lleva a cabo usando el ADN de vector pSS-codA: :upp, proporcionando 2400 colonias resistentes a la higromicina. Las células transfectadas se seleccionan para resistencia a la higromicina (25 mg/ml) durante un periodo de 3 semanas con doxiciclina alta (10 ng/ml) , y 1800 colonias resistentes a la higromicina se recuperan de la transfección de colección. Estas colonias se incuban entonces con el profármaco 5-fluorocitosina (5-FC) a 1 mg/ml, con un refuerzo de 5 mg/ml durante 4 días, a una concentración de doxiciclina de 10 ng/ml. Después de 3 semanas todas, excepto 3 colonias de control de crecimiento pobre (transfectadas con pSS-codA: :upp vacío) murieron; 58 de las colonias transfectadas con la colección sobrevivieron. Estas colonias se permite que se recuperen del tratamiento de profármaco, y se cultivan adicionalmente . Se cosechan aislados resistentes a 5-FC, las células se lisan, y una porción del ADN se somete a amplificación PCR usando cebadores D30 y D51 para recuperar los elementos SINC. Los productos PCR de seis colonias resistentes a 5-FC se clonan entre los sitios HindIII y Xhol del plásmido Bluescript II SK(+) (Stratagene 212207) por métodos convencionales (Sambrook et al., 1989) . La secuencia de ADN de los elementos SINC candidatos se determinan como se describen (supra) usando cebadores comercialmente disponibles para el vector pBluescript (Stratagene 300301 y 300302) . Las secuencias de estos elementos SINC se presentan en la Tabla 4B. Los seis elementos SINC candidato se clonan en el plásmido pSS-hrGFP en sus orientaciones nativas, y los plásmidos resultantes se transfectan en células ?-2 OS/Tet-Off. Después de la selección a la resistencia para la higromicina, las poblaciones de transfectantes pSS-hrGFP-SINC se cultivan además a una alta concentración de doxiciclina (10 ng/ml) . El AR celular total se extrae usando edl mini kit R asy (QUIAGEN 74104) como se describe por el fabricante. El análisis de manchado Northern de abundancia de ARNm GFP en estas poblaciones, se evalúa usando técnicas estándar (Sambrook et al., 1989) . La sonda GFP fue ün fragmento BamHI-EcoRI que abarca 590 hasta 1419 pares base en phrGFP-1. Las manchas también se probaron por ARNm de higromicina como un control para el número de copia de plásmido derivado de.PSS-hrGFP, y para beta-actina como un control para la cantidad de ARNm codificado genómicamente . La sonda de higromicina fue un fragmento Sful-Sal extendido desde 8219-10144 en pREP4 (Invitrogen) , y la sonda beta-actina fue de Clontech, #9800-1. Después de la hibridización y lavado, las manchas se exponen a separaciones por exclusión de formadores de imagen de fósforo, y las señales radioactivas se visualizan y cuantifican usando un formador de imágenes de fósforo BioRad Personal F/X.
Resultados Los' elementos SINC clonados adyacentes al gen reportero GFP inducen el silenciamiento de la transcripción del gen reportero, pero no afectan la transcripción de otros genes. Las mediciones exactas de la actividad SINC toman ventaja de este hecho al determinar la expresión del GFP con relación a la expresión de dos genes de referencia, en ves de medir simplemente la expresión GFP absoluta. Un gen de referencia es el gen resistente a la higromicina en el plásmido pSS-hrGFP (fuera del dominio definido por los elementos STAR; Figura 21), y el otro es el gen beta-actina genómico. La actividad SINC se cuantifica por análisis de manchado de AR como una reducción en la relación de la señal' GFP a las señales de higromicina y beta-actina. Entre los elementos SINC candidato que se han caracterizado, algunos exhiben una reducción relativa importante en la transcripción GFP, lo que indica que éstos ADN son capaces de inducir la , formación de cromatina silenciosa. El elemento SINC35 (etiquetado PSIN S35 en la Tabla 4B) tiene la actividad más fuerte de estos candidatos. , Este enlaza alrededor de un 69% de la reducción en la relación GFP/higromicina, y una reducción del 75% en la señal GFP/beta-actin . La fuerza de la actividad SINC en los otros 5 candidatos descritos en la solicitud original, y en un número de otros elementos SINC candidato que se han aislado y caracterizado después para presentar la solicitud, es menor. Por lo tanto, el SINC35 tiene un desempeño superior como un elemento genético potente para la inducción de la cromatina silenciosa en diversas aplicaciones biotecnológicas .
Ejemplo 20 Elementos STAR se conservan entre ratón y humano. El análisis BLAT de la secuencia de ADN STAR contra la base de datos del genoma humano (http://genoma.ucsc.edu/cgi-bin/hgGateway) revela que algunas de estas secuencias tienen una conservación de secuencia alta con otras regiones del genoma humano. Estas regiones duplicadas son elementos STAR candidato; si estos no muestran actividad STAR, entonces se considerarían parálogos de los STAR clonados (dos genes o elementos genéticos son parálogos si se derivan de un evento de duplicación (Li, 1997)). El análisis BLAST de las STAR humanos contra el genoma del ratón (http://www.ensembl.org/Mus_musculus/blastview) también revela regiones de conservación de secuencia alta entre ratón y humano. Esta conservación de secuencia se muestra para los fragmentos de 15 de los 65 elementos STAR humanos. Los rangos de conservación desde 64% hasta 89%, sobre longitudes de 141 pares base hasta 909 pares base (Tabla 8) . Estos grados de conservación de secuencia son remarcables y sugieren que estas secuencias de ADN pueden conferir actividad STAR con el genoma de ratón. Algunas de las secuencias de los genomas de ratón y humano en la Tabla 8 se pueden definir estrictamente como ortólogos (dos genes o elementos genéticos que se dice que son ortólogos si se derivan de un evento de formación de especies (Li, 1997)) . Por ejemplo, STAR6 está entre los genes SLC8A1 y HAAO en los genoraa humano y de ratón. En otros caso, un STAR humano clonado tiene un parálogo dentro del genoma humano, y su ortólogo se a identificado en el genoma de ratón. Por ejemplo, STAR3a es un fragmento de la región 15qll.2 del cromosoma humano 15. Esta región es 96.9% idéntica (paráloga) con un fragmento de ADN a 5q33.3 en el cromosoma humano 5, que está cerca del gen interleucina IL12B. Estos ADN humanos comparten aproximadamente 80% de identidad con un fragmento de la región 11B2 en el cromosoma humano 11. El fragmento 11B2 también está cerca del gen de interleucina IL12B (ratón) . Por lo tanto, STAR3a y el fragmento del ratón 11B2 se pueden definir estrictamente como paralogos. Con objeto de probar la hipótesis de que la actividad STAR se comparte entre las regiones de alta conservación de secuencia en el genoma humano y de ratón, uno de los STAR humanos con una secuencia conservada en el ratón, STAR18, se a analizado con mayor detalle. La conservación de la secuencia en el genoma de ratón detectado con el clon original STAR18 se extiende hacia la izquierda en el cromosoma 2 humano por alrededor de 500 pares base (Figura 22; izquierda y derecha con relación a la descripción estándar de los extremos del cromosoma 2) . En este ejemplo, examinamos si la región de conservación de secuencia define un elemento STAR que se presentan naturalmente en humanos que es más amplio en longitud que el clon original. También se examina si la función STAR de este elemento STAR se conserva entre el ratón y el humano.
Materiales y Métodos, La región de conservación de la secuencia ratón/humano alrededor de STAR 18 se recupera del clon humano BAC RP11-387A1 por amplificación PCR entre tres fragmentos: la región completa (cebadores E93 y E94) , la mitad a la izquierda (cebadores E93 y E92) , y la mitad a la derecha (cebadores E57 y E94) . Los fragmentos correspondientes de la región homologa de ratón se recuperaron del clon BAC RP23-400H17 en la misma forma (cebadores E95 y E98, E95 y E96, y E97 y E98, respectivamente) . Se clonaron todos los fragmentos en el vector pSelect y se transfectaron en una línea celular U-2 OS/Tet-Off/LezA-HPl (supra) . Después de la transfección, . se efectúo la selección de higromicina para seleccionar las células transfectadas . La LexA-HPl se indujo al disminuir la concentración de doxiciclina y la capacidad de las células transfectadas para soportar la zeocina de antibiótico (una medida de la actividad STAR) se evalúo al monitorear el crecimiento celular.
Resultados El clon original STARI8 se aisló del ADN humano digerido con Sau3AI ligado en el vector pSelect sobre la base de su capacidad para evitar el silenciamiento de un gen de resistencia a la zeocina. La alineación del clon humano STAR18 (497 pares base) con el genoma de ratón, reveló una alta similitud de. secuencia (72%) entre las regiones ortólogas de humano y de ratón STAR18. También se descubre una alta similitud (73%) en la región que se extiende para 488 pares base inmediatamente a la izquierda del sitio Sau3AI que define el extremo ' izquierdo de la región clonada (Figura 22) . Fuera de estas . regiones, la similitud de secuencias entre el ADN humano y de ratón cae debajo de 60%. Como se indica en la Figura' 22, los elementos humano y de ratón STAR18 otorgan supervivencia a la zeocina para las células hospedadoras que expresan la proteína represora lexA-HP1. El clon STAR18 original de 497 pares base y su ortólogo de ratón, confieren ? ambos la capacidad para crecer (Figura 22, a y d) . Las regiones adyacentes de 448 pares base de alta similitud de altos genomas también otorgan la capacidad de crecer y de hecho su fenotipo de crecimiento es más vigoroso que aquel del STAR18 original en el clon (Figura 22 b y e) . Cuando la región completa de similitud de secuencia se probó, estos ADN de ratón y de humano otorgan crecimiento, y el fenotipo de crecimiento es más vigoroso que los dos subfragmentos (Figura 22, c y f) . Estos resultados demuestran que la actividad STAR del STAR18 humano se conserva en su ortólogo de ratón. La alta conservación de secuencias entre estas regiones de ortólogos es particularmente notable debido a que no son secuencias codificadoras de proteínas, que conduzcan a la conclusión de que tienen alguna función reguladora que se ha evitado su divergencia evolutiva a través de la mutación. Este análisis demuestra que los elementos clonados STAR identificados por el programa de selección original pueden en algunos casos representar elementos parciales STAR, y que el análisis del ADN genómico en el cual se alojan puede identificar secuencias con una' actividad STAR más fuente.
Ejemplo 21 Los elementos STAR contienen porciones características de una secuencia de ADN. Los elementos STAR se aislan sobre la base de su fenotipo anti-represión con respecto a la expresión de transgenes. Este fenotipo anti-represión refleja procesos bioquímicos subyacentes que regulan la formación de cromatina que se asocia con los elementos . STAR. Estos procesos son típicamente específicos de la secuencia y resultan de un enlace de proteínas o estructura de ADN. Esto sugiere que los elementos STAR compartirán una similitud de secuencia de ADN. La identificación de la similitud de secuencias entre los elementos STAR, proporcionará porciones de secuencias que son características de los elementos que ya han sido identificados por selecciones y pruebas funcionales. Las porciones de secuencia también serán útiles para reconocer y reivindicar nuevos elementos STAR cuyas funciones conformen " a las reivindicaciones de esta patente. Las funciones incluyen un rendimiento mejorado y estabilidad de los transgenes expresados en células hospedadoras eucarióticas . Otros beneficios de la identificación de porciones de secuencias que caracterizan los elementos STAR incluyen: (1) suministro de porciones de búsqueda para la predicción e identificación de nuevos elementos STAR en las bases de datos de genoma, (2) suministro de un racional para la modificación de los elementos, y (3) suministro de información para análisis funcional de la actividad STAR. Con el uso de la bioinformática,. se han identificado similitudes de secuencia entre elementos STAR, se presentan los resultados en este, ej emplo .
Respaldo bioinformático y estadístico. Los elementos de ADN reguladores funcionan típicamente por medio de la interacción con proteínas enlazadas al ADN de secuencia especifica. Los análisis bioinformáticos de elementos de ADN tales como elementos STAR cuyas propiedades reguladoras se han definido, pero cuyas proteínas que interactúan se desconocen, requiere un enfoque estadístico para la interacción de porciones de secuencias. Esto puede realizarse por un método que detecta los patrones de secuencia de ADN corto que se sobre representa en un conjunto de elementos de ADN regulador (por ejemplo, los elementos STAR) en comparación con la secuencia de referencia (por ejemplo el genoma humano completo) . El método determina el número de presentaciones observadas y esperadas de los patrones en cada elemento regulador. El número de presentaciones esperadas se calcula del número de presentaciones observadas de cada patrón en la secuencia de referencia. Los patrones de secuencia de ADN pueden ser oligonucleótidos de una longitud dada, por ejemplo 6 pares base. En el análisis más simple, para un oligonucleótido de 6 pares base (hexámero) compuesto de 4 nucleótidos (A, C, G y T) son 4"6=4096 oligonucleótidos distintos (todos combinaciones de AAAAAA a TTTTTT) . Si las secuencias reguladoras y de referencia son completamente aleatorias y tienen proporciones iguales de los nucleótidos A, C, G y T, entonces la frecuencia esperada de cada hexámero será 1/4096 (~0.00024). Sin embargo, la frecuencia actual de cada hexámero ' en la secuencia de referencia típicamente es diferente a esta debido a las bases en el contenido de pares base G:C, etc. Por lo tanto, la frecuencia de cada oligonucleó ido en la secuencia de referencia se determina empíricamente al contar, para crear una "tabla de frecuencia" para los patrones . La tabla de frecuencia de patrón de la secuencia de referencia se usa entonces para calcular la frecuencia esperada de presentación de cada patrón en el conjunto de elemento regulador. Las frecuencias esperadas se comparan con las frecuencias observadas de la presentación de los patrones. Los patrones que se "sobre-representan" en el conjunto son identificados; por ejemplo si el hexamero ACGTGA se espera que se presente 5 veces en 20 kilobases pares de secuencia, pero se observa que se presenta 15 veces entonces se sobrerepresenta 3 veces. 10 de las 15 presentaciones de tal patrón de secuencia hexamérico no deberían esperarse en los elementos reguladores si los elementos tienen la misma composición de hexámero como el genoma completo. Una vez" que los patrones sobrerepresentados se identifican, se aplica una prueba estadística para determinar si su sobrerepresentación es importante, o puede deberse aun cambio. Para esta prueba, un índice de significancia, "sig", se calcula para cada patrón. El índice de significancia se deriva de la probabilidad de presentación de cada patrón, que se estima por una distribución binominal . La- probabilidad se toma en cuenta el número de posibles patrones (4096 para hexámeros) . Los valores sig más altos corresponden a la mayoría de oligonucleótidos sobre representados (van Helden et al., 1998). En términos prácticos, los oligonucleótidos con sig >= 0 se consideran como sobrerepresentados . Un patrón con sig >= 0 posiblemente se representa debido a un cambio (=10~0) en el conjunto de secuencias de elemento regulador. Sin embargo, a sig >= 1 se espera un patrón para sobre representarse una ves en 10 conjuntos de secuencias (=10?1) , sig >= 2 una vez en 100 (=10?2) conjuntos.de secuencia, etc. Los patrones que se sobre representan importantemente en el conjunto de elemento regulador se usan para desarrollar un modelo para clasificación y predicción de secuencias de elemento regulador. Esto emplea el análisis discriminatorio, también llamado "método supervisado" de clasificación estadística conocido por alguien de experiencia ordinaria en la técnica (Huberty, 1994) . En el análisis discriminatorio, los conjuntos de puntos conocidos o clasificados (por ejemplo, elementos STAR) se usan para "preparar" un modelo para reconocer aquellos puntos en base de variables especificas (por ejemplo, patrones de secuencia tales como hexámero) . El modelo preparado se usa entonces para predecir si otros puntos deberán clasificarse como pertenecientes al conjunto de puntos conocidos (por ejemplo, es una secuencia de ADN un elemento STAR) . En este ejemplo, los puntos conocidos en el conjunto preparado son elementos STAR (conjunto preparado positivo) . Estas contrastan con las secuencias que se seleccionan aleatoriamente del genoma (conjunto preparado negativo) que tienen la misma longitud como los elementos STAR. El análisis discriminatorio establece criterios para discriminar positivos de negativos con base en un conjunto de variables que distinguen los positivos; en este ejemplo, las variables son los patrones sobre representados importantemente (por ejemplo, hexámeros) . Cuando el número de patrones sobrerepresentados es alto en comparación al tamaño del conjunto preparado, el modelo podría volverse prejuiciado debido a la sobrepreparacion. La sobrepreparacion se evita al aplicar una selección en etapas delanteras de variables (Huberty, 1994) . El punto del análisis discriminatorio en etapas es seleccionar el número mínimo de variables que proporcionan la máxima discriminación entre los positivos y negativos. El modelo se preparar al evaluar una a una las variables para su capacidad a clasificar apropiadamente los puntos en los conjuntos preparados positivos y negativo. Esto se da durante la adición de nuevas variables al modelo que no incrementan importantemente el poder predictivo de modelo (esto es, se minimiza hasta la relación de error en la clasificación) . Este modelo optimizado se usa entonces para probar con objeto de predecir se puntos "nuevos" son positivos o negativos (Huberty, 1994) . Esto es inherente en las estadísticas de clasificación que para los puntos complejos tales como las secuencias de ADN, algunos elementos del conjunto preparado positivo clasificaran como negativos (negativos falsos) , y algunos miembros del conjunto preparado negativo clasificarán como positivos (positivos falsos) . Cuando se aplica, un modelo preparado a puntos nuevos de prueba, los mismos tipos de clasificaciones erróneas se espera que se presenten. En el método bioinformá ico descrito aquí, la primera etapa, análisis de frecuencia de patrón, reduce un conjunto grande de patrones de secuencia (por ejemplo, todos los 4096 hexámeros) hasta un conjunto más pequeño de patrones sobre representados de manera importante (por ejemplo, 100 hexámeros) ; en la segunda etapa, el análisis discriminatorio en etapas reduce el conjunto de patrones sobre representados hasta el subconjunto de aquellos patrones que tienen un poder discriminador máximo (por ejemplo, 5-10 hexámeros) .por lo tanto, este enfoque proporciona un criterio simple y robusto para- identificar elementos de ADN regulador tales como elementos STAR. Las proteínas enlazadas al ADN pueden distinguirse con base en el tipo de sitio enlazado que ocupan. Algunos reconocen secuencias contiguas; para este tipo de proteína, patrones que son oligonucleótidos de longitud 6 pares base (hexámeros) son fructíferos para el análisis bioinformático (van Helden et al., 1998) . Otras proteínas enlazadas a diadas de secuencias:' se hace contacto entre pares de trinucleótidos altamente conservados separados por una región no conservada de anchura fijada (van Helden et al., 2000) . Con' objeto de identificar secuencias en los elementos STAR que pueden enlazarse por proteínas ligadas en diada, el análisis de frecuencia también se conduce por este tipo de patrón, donde el espacio entre los 2 trinucleótidos varía desde 0 hasta 20 (esto es, XXXN{0-20}XXC donde las X son nucleótidos específicos que componen los trinucleótidos y las N son nucleótidos aleatorios desde 0 hasta 20 pares base de longitud) . Los resultados del análisis de frecuencia en diada también se usan para el análisis discriminante línea como se describe arriba.
Materiales y métodos Usando la separación por exclusión genética descrita en la solicitud de patente original, 66 elementos STAR se aislan inicialmente del ADN genómico humano y se caracterizan en detalle (tabla 6) . La separación por exclusión se realiza en colecciones de gen construidas por la digestión Sau3AI de ADN genómico humano, ya sea purificado de placenta (Clontehc 6550-1) o portado en cromosomas artificiales bacterial/Pl (BAC/PAC) . Los clones BAC/PAC que contienen ADN genómico de regiones del cromosoma 1 (clones RP1154H19 y RP3328E19) , del racimo HOX de genes homeoticos (clones RP1167F23, RP1170019, y RP11387A1) , o del cromosoma 22 humano (Research Genetics 96010-22) . Los ADN se fraccionan por tamaño, y la fracción de tamaño 0.5 - 2 kb se liga en el vector pSelect digerido en BamHI, por técnicas estándar (Sambrook et al., 1989). Los plásmidos pSelect. que contienen el ADN genómico humano que confiere en resistencia a la zeocina a bajas concentraciones de doxiciclina, se aislan y propagan en Escherichia coli. la separación por exclusión que proporcionan los elementos STAR de la tabla 6, se evalúan aproximadamente 1-2% del genoma humano . Los insertos de ADN genómico humano en estos 66 plásmidos se procesan por secuencia por el método dideoxi (Sanger et al., 1977) usando un secuenciador de ADN automatizado Beckman CEQ2000, usando las instrucciones del fabricante. Brevemente, el ADN se purifica de E.coli usando los kit sQIAprep Spin Miniprep y Plasmid Midi Kits (QIAGEN 27106 y 12145, respectivamente) . El procesado en secuencia de ciclo se lleva a cabo usando oligonucleótidos comunes correspondientes al vector pSelect (cebadores D89 y D95, tabla 5) , en presencia de terminadores de tinte (kit CED Dye terminator Cycle Sequencing, Beckman 608000) . Las secuencias de ADN STAR ensambladas se localizan en el genoma humano (bases de datos construidas en agosto y diciembre del 2001) , usando BLAT (Herramienta de alineación local básica ( ent, 2002) ; http: //genome . ucsc . edu/cgi-bin/hgGeteway : tabla 6) .
Además, las secuencias STAR combinadas comprenden 85.6 kilobase pares, con un promedio de longitud de 1.3 kilobases pares . Las porciones de secuencias que distinguen en los elementos STAR dentro del ADN genómico se identifican por análisis bio-informático usando un procedimiento de 2 etapas, como sigue (ver figura 23 para un diagrama esquemático) . El análisis tiene 2 conjuntos de datos de entrada: (1) La secuencias de ADN . de los elementos STAR (STAR1 - STAR65 se usaron; tabla 6) ; y (2) la secuencia de ADN del genoma humano (excepto para el cromosoma 1, que no es posible de inducir debido a su gran tamaño; para análisis en diada de un sub-conjunto aleatorio de secuencia de ADN genómica humano (~27 Mb) se usa) . Análisis de frecuencia de patrón. La primera etapa en el análisis utiliza el software RSA-Tools (Regulatory Sequence Analysis Tools; htt : //www.ucmb . ulb . ac .be/bioinformatics/rsa- tools/ ; referencias (van Helden et al., 1998, van Helden et al., 2000,- van Helden et al., 2000)) para determinar la siguiente información: (1) la frecuencia de todas las diadas y olinucleótidos hexaméricos en el genoma humano; (2) la frecuencia de los olinucleótidos y las diadas en los 65 elementos STAR; y (3) la importancia indica aquellos olinucleótidos y diadas que se sobre representan en los elementos STAR en comparación con el genoma. Se da un análisis de control con 65 secuencias que se seleccionan aleatoriamente del genoma humano (esto es, de 2689 x 10~3 kilobase pares) que marcan la longitud de los elementos STAR de la tabla 6. Análisis discriminatorio. Los oligonucleótidos sobrerepresentados y las diadas se usan para preparar modelos para la predicción de elementos STAR por análisis discriminante lineal (Huberty, 1994) . Se realiza una preselección de variable al selecciona los 50 patrones con el poder discriminante individual más alto de los oligos o diadas sobre representados de los análisis de frecuencia. Estas variables preseleccionadas se usan entonces para la preparación del modelo en una análisis discriminante lineal en etapas para seleccionar la combinación más discriminante de variables (Huberty, 1994) La selección de variables se basa en minimizar la relación de error de clasificación (porcentaje de clasificaciones negativas falsas). Además, la relación de errores se estima al aplicar el mismo enfoque discriminante al conjunto de control de secuencias aleatorias (minimizar el porcentaje de clasificación positivas falsas).
Los modelos predictivos de la fase de preparación del análisis discriminante se prueban de 2 maneras. Primero, los elementos STAR y las secuencias aleatorias que se usan para generar el modelo (los conjuntos de preparación) se clasifican. Segundo, las secuencias en una colección de 19 elementos STAR candidato (clonados recientemente por selección de zeocina cono se describe arriba) se clasificaron. Estos elementos STAR candidatos se enlistan en la tabla 11 (SEQ ID: 67-84) . - " Resultados El análisis de frecuencia de patrón se realiza con RSA-Tools en 65 elementos STAR, usando el genoma humano como la secuencia de referencia. Ciento sesenta y seis (166) oligonucleótidos hexaméricos se encuentran para sobre-representarse en el conjunto de elementos STAR (sig >= 0) en comparación con el genoma completo (tabla 9) . El oligonucleótido sobre representado de manera importante, CCCCAC, se presenta 107 entre los 65 elementos STAR, pero se espera que se presente solo 49 veces. Esto tiene un coeficiente importante de 8.76; en otras palabras, la probabilidad que esta sobrerepresentacion se deba a un cambio aleatorio es 1/10" 8.76, esto es, menos de uno de 500 millones. Noventa y cinco de los oligonucleótidos tienen un coeficiente importante mayor a l, por. lo tanto se sobre representan altamente en los elementos STAR. Entre los oligonucleótidos sobre representados, se observa y espera presentaciones, respectivamente, en el rango desde 6 y 1 (para 163, CGCGAA, sig = 0.02) hasta 133 y 95 (para oligo 120, CCCAGG, ig = 0.49). las diferencias en presentaciones esperadas reflejan factores tales como el contenido G:C del genoma humano. Por lo tanto, las diferencias entre los oligonucleótidos es un número de presentaciones es menos importante que su sobre representación; por ejemplo, oligo 2 (CAGCGG) es 36/9 = 4 veces sobre representado, lo que tiene una probabilidad de deberse al cambio aleatorio de uno en 50 millones (sig = 7.75). La tabla 9 también representa el número de elementos STAR en los cuales cada oligonucleotido sobre representado se encuentra. Por ejemplo, el oligonucleotido más importante, oligo 1 (CCCCAC) , se presenta 107 veces, pero se encuentra solo en 51 STAR, esto es, un promedio se presenta como 2 copias por STAR, El oligonucleótido menos abundante, número 166 (AATCGC) , se presentan por promedio como una copia sencilla por STAR (13 presentaciones en 11 STAR) ; los oligonucleótidos de copia sencilla se presenta frecuentemente, especialmente para los oligos menos abundantes. En otro extremo, el oligo 4 (CAGCCC) se presenta en un promedio de 3 veces en aquellos STAR en los cuales se encuentra (37 STAR) . El oligonucleótido más ampliamente expandido es el número 120 (CCCAGG) , que se presenta en 58 STAR (en promedio 2 veces por STAR) , y el oligonucleótido menos ampliamente expandido es el número 114 (CGTCGC) , que se presenta en solo 6 STAR (y en un promedio de solo una vez por STAR) . Los resultados del análisis en frecuencia en diada se dan en la tabla 10. Setecientas treinta (730) diadas se encuentra que se sobrerepresentan en el conjunto de elementos STAR (sig >= 0) en comparación con la secuencia de referencia. La diada sobre representada más importantemente, CCCN{2}CGG se presenta 36 veces entre los 65 elementos STAR, pero se espera que se presente solo 7 veces . Esto tiene un coeficiente de importancia de 9.31; en otras palabras, la probabilidad que esta sobrerepresentación se deba a un cambio es 1/10?9.31, esto es, menos de 1 en 2 billones. Trescientas noventa y siete de las diadas tienen un coeficiente de importancia mayor a l, y por lo tanto se sobre representan altamente en los elementos STAR. Entre las diadas sobre representadas, sus presentaciones observadas y esperadas, respectivamente, en el rango desde 9 y 1 (para 5 diadas (números 380, 435, 493, 640 y 665)) hasta 118 y 63 (para los números 30 (AGGN{2}GGG) , sig = 4.44). Los oligonucleótidos y diadas encontradas para sobre representarse en elementos STAR por análisis de frecuencia de patrón se prueban para su poder discriminante del análisis discriminatorio lineal. Los modelos discriminantes se preparan por selección en etapas de la mejor combinación entre los 50 patrones oligonucleótido mas discriminantes (tabla 9) o diada (tabla 10) . Los modelos realizan relaciones de error óptimas después de la incorporación de 4 (diadas) o 5 variables . Las variables discriminantes de análisis oligo son números 11, 30, 94, 122 y 160 (tabla 9) ; aquellos del análisis de diada son números 73, 194, 419 y 497 (tabla 10) . Los modelos discriminantes se usan entonces para clasificar los 66 elementos STAR en el conjunto preparado y sus secuencias aleatorias asociadas. El modelo que utiliza variables de oligonucleotido clasificadas 46 de 65 elementos STAR como elementos STAR (positivos verdaderos) ; el modelo de diada clasifica 49 de los elementos STAR como positivos verdaderos. En combinación, los modelos clasifican 59 de los 65 elementos STAR como elementos STAR (91%, Figura 24) . Las relacionas positivas falsas (secuencias aleatorias que clasifican como STAR) fueron 7 para el modelo de diada, 8 para el modelo de oligonucleotido y 13 para la predicción combinada de los 2 modelos (20%) . Los elementos STAR de la tabla 6 que no clasifican como STAR por LDA son STAR 7, 22, 35, 44, 46 y 65. Estos elementos exhiben actividad anti represora estabilizada en el análisis funcional, de manera de que el echo de que no se clasifican como elementos STAR por LDA sugiere que representan otra clase (o clases) de elementos STAR. Los modelos se usan entonces para clasificar los 19 elementos STAR candidato en el conjunto probado enlistado en la tabla 11. El modelo de diada clasifica 12 de estos STAR candidatos como elementos STAR, y el modelo de oligonucleótido clasifica 14 como STAR. El número combinado de candidatos que se clasifican como elementos es- 15(79%). Esta es una relación más baja de clasificación de la que se obtiene con el conjunto preparado de 65 STAR; esto se espera por 2 razones. Primero, los modelos discriminantes se reparan con los 65 STAR de la tabla 6 y las variables discriminantes se basan en este conjunto de preparación pueden ser menos representadas en el conjunto de pruebas. Segundo, las etapas STAR candidato en el conjunto de prueba no se han caracterizado aun completamente en términos de función in vivo, y pueden incluir elementos con solo propiedades anti-represión débiles. Este análisis de muestra el poder de un enfoque estadístico para la clasificación bioinformática de elementos STAR. Las secuencias STAR contienen un número de patrones de oligonucleótido de diada y hexaméricos que son importantemente sobre representados en comparación con el genoma humano completo. Estos patrones pueden representar sitios de enlace para proteínas que confiere actividad STAR; en cualquier caso, esta forma un conjunto de porciones de secuencias que pueden usarse para reconocer secuencias de elemento STAR. Usando estos patrones para reconocer elementos STAR por análisis discriminante, una alta proporción de los elementos obtenidos por la separación por exclusión genética de la invención son clasificados de hecho como STAR. Esto refleja la secuencia fundamental, y las similitudes funcionales entre estos elementos . Un aspecto importante del método descrito aquí, (análisis de secuencia de patrón seguido por análisis discriminante) es que pueden reiterarse; por ejemplo, al incluir los 19 elementos STAR candidato de la tabla 11 con los 66 elementos STAR de la tabla 6 en un conjunto preparado, puede prepararse un modelo discriminante mejorado. Este modelo mejorado puede entonces usarse para clasificar otros elementos reguladores candidatos como STAR. La separación exclusión in vivo de gran escala de las secuencias genómicas usando el método, de · la invención, combinadas con la reiteración del análisis bioinformático, proporcionarán un medio de elementos STAR discriminantes que reconocen el 100% de los enfoques asintomáticos y la predicción de elementos cuando el genoma se separa por exclusión en su totalidad. Estas predicciones astringentes y comprensivas de la función STAR aseguraran que todos los elementos STAR humanos se reconocen, y están disponibles para usarse en la expresión del transgen mejorada.
Ejemplo 22 Clonación y caracterización de elementos STAR de silenciación del transgen Arabidopsis thaliana presentado en plantas transgénicas en niveles tanto transcripcional como post-transcripcional (Meyer, 2000, Vanee & Vaucheret, 2001) . En ambos casos, el resultado deseado de la expresión del transgen puede comprometerse por el silenciado; la expresión baja e inestabilidad del transgen resulta una expresión de rasgos deseables (por ejemplo, resistencia a la plagas) o bajos rendimientos de proteínas recombinantes . También resulta en una pobre predictibilidad : la proporción de plantas transgénicas que expresan el transgen a niveles bio-tecnológicamente útiles bajos, lo que necesita separación por exclusión laboriosa y cara de individuos transformados para aquellos con características de expresión benéfica. Este ejemplo escriba aislado de elementos STAR del genoma de una planta dicotica Arabidopsis thaliana para usarse el prevención en la prevención del silenciado de transgen transcripcional en plantas transgénicas. La Arabidopsis se elige para este ejemplo debido a que es un organismo de modelo bien estudiado : tiene un genoma compacto, es receptivo a manipulaciones de ADN genética y recombinante y su genoma se ha procesado por secuencias (Bevan et al., 2001, Initiative, 2000, Meinke et al., 1998).
Materiales y métodos El ADN genómico se aisla de Arabidopsis thaliana ecotipo Columbia como se describe (Stam et al., 1998) y se digiere parcialmente con Mbol . El ADN digerido de fracciona en tamaño hasta 0.5 - 2 kilobase pares por electroforesis en gel de agarosa y purificación de gel (QIAquick Gel Extraction Kit, QIAGEn 28706) , seguido por el ligado con el vector pSelect (supra) . La transfección en la línea celular U-2 OS/Tet-Off/LexA-HPl y la selección a la resistencia a la zeocina a una baja concentración de doxiciclina, se realiza como se describe (supra) . Los plásmidos se aislan de colonias resistentes a la zeocina y se retransfectan en la línea celular U-2 OS/Tet-Off/LexA-HPl . El procesado por secuencia de fragmentos de ADN genómico de Arabidopsis que confiere resistencia la zeocina durante la retransfección, se realiza como se describe (supra) . Las secuencias de ADN se comparan con la secuencia del genoma Arabidopsis por el análisis BLAST ( (Altschul et al., 1990); URL ttp: //v7ww.ncbi .nlm.nih.gov/blast/Blast) . Las actividad STAR se prueba además al medir los niveles de ARNm para los genes con resistencia a la higromicina y zeocina en células hospedadoras reco binantes por transcripción inversa PCR (RT-PCR) . Las células de la línea celular U-2 OS/Tet-Off/lexA-HPl se transfectan con plásmidos pSelect que contienen elementos Arabidopsis STAR, el elemento Drosophila scs o no contienen inserto (supra) . Estos se cultivan en higromicina durante 2 semanas a una alta concentración de doxiciclina, luego la concentración de doxiciclina se reduce hasta 0.1 ng/ml para inducir la proteína represora lexA-HPl. Después de 10 días, el ARN total se aisla por el mini kit RNeasy (QIAGEN 74104) como se describe por el fabricante. La síntesis de ADNc de primera hebra se lleva acabo usando el kit de síntesis de ADNc de primera hebra (MBI Fermentas , 1622) usando el cebador oligo (dT) 18 como se describe por el fabricante. Se usa una alícuota del ADNc como la plantilla en una reacción PCR usando los cebadores D58 y D80 (para el marcador de zeocina) , y D70 y D71 (para el marcador de higromicina) , y la polimerasa de ADN Taq (Promega M2661) . Las condiciones de reacción fueron 15-20 ciclos de 94C durante 1 minuto, 54C durante 1 minuto, y 72C durante 90 segundos. Estas condiciones resultan en una relación lineal entre el ADN de entrada y el ADN de producto PCR. Los productos PCR se resuelven por electroforesis en gel de agarosa, y las bandas de zeocina e higromicina se detectan por manchado Southern como se describe (Sambrook et al., 1989), usando productos PCR producidos como arriba con el plásmido pSelect como plantillas. La relación de las señales de zeocina e higromicina correspondientes al nivel de expresión normalizado del gen de zeocina.
Resultados La colección de ADN genómico de Arabidopsis en el vector pSelect comprende 69,000 clones primarios en E. coli, 80% de los cuales portan insertos . El tamaño de inserto promedio fue aproximadamente 1000 pares base; la colección por lo tanto representa aproximadamente el 40% del genoma Arabidopsis. Una porción de esta colección (que representa aproximadamente el 16% del genoma de Arabidopsis) , se transfecta en la línea de célula U-2 OS/Te-Off/LexA-HPl . Se impone la selección de higromicina para aislar los transfectantes , lo que resulta en 27,000 colonias sobrevivientes . Luego se somete a selección de zeocina a una concentración de doxiciclina baja. Los plasmidos que contienen STAR supuestos de 56 colonias resistentes a la zeocina, se rescatan en E. Coli y se retransfectan en células U-2 OS/Tet-Off/LexA-HPl . Cuarenta y cuatro de estos plasmidos (79% de los plásmidos probados) confieren resistencia a la zeocina en las células hospedadoras a concentraciones de doxiciclina bajas, lo que demuestra que los plásmidos portan elementos STAR. Esto indica que la separación por exclusión pSelect en células U-2 OS humanas es altamente eficiente en la detección de elementos STAR de ADN genómico de plantas. Las secuencias de ADN de estos 44 elementos STAR candidatos se determinan. Treinta y cinco de estos se identifican como una ubicación sencilla en la base de datos de la secuencia genómica nuclear de Arabidopsis (Tabla 12: SEQ ID NO: 85-SEQ ID NO: 119) . Se identifican cuatro más como que vienen del genoma de cloroplastos , cuatro son quimeras de fragmentos de ADN de dos ubicaciones, y uno no se encuentra en la base de datos del genoma de Arabidopsis. La resistencia de los elementos STAR de arabidopsis clonado se prueban al evaluar su capacidad para prevenir la represión transcripcional del gen resistente a la zeocina, usando un ensayo RT-PCR. Como un control para la entrada de ARN entre las muestras, los niveles de transcripción del gen resistente a la higromicina para cada transfección STAR' se evalúan. Este análisis se ha realizado para 12 de los elementos STAR de Arabidopsis. Los resultados (Figura 25) demuestran que los elementos STAR de Arabidopsis son superiores al elementos scs de Drosophila (control positivo) y el vector vacío ("SV40"; control negativo) en su capacidad para proteger el gen resistente a la zeocina de la represión transcripcional. En particular, el STAR-A28 y STAR-A30 permiten niveles 2 veces superiores de expresión del gen resistente a la zeocina que el elemento scs (normalizado para el control interno del ARNm del gen resistente a la higromicina) cuando se expresa el represor lexA-HPl. Estos resultados demuestran que el método de la invención puede aplicarse exitosamente para recuperar los elementos STAR de los genomas y otras especies aparte del humano. Su aplicación exitosa a los elementos STAR del genoma de planta es particularmente importante debido a que después el amplio rango taxonómico sobre el cual el método de la invención es aplicable, y debido a que las plantas son un objetivo importante del desarrollo biotecnológico .
Breve Descripción de los Dibujos Figura 1. La familia pSelect de plásmidos para seleccionar y caracterizar los elementos STAR. Un marcador de resistencia ¦ (zeocina o puromicina) o un gen reportero (GFP o luciferasa) bajo control del promotor SV40 promiscuo es adyacente al sitio de clonación BamHI flanqueado por los sitios AscI y HindIII. La dirección ascendente del sitio de clonación son los operadores lexA a los cuales se puede enlazar la proteína lexA. El enlace de las proteínas de grupo lexA-Polycomb quimérico a los operadores provoca la represión del gen marcador o reportero . Los fragmentos de ADN insertados en el sitio de clonación que bloquea la represión se identifican por la expresión persistente del gen marcador o reportero. El plásmido se replica episomalmente en células mamíferas cultivadas debido a la secuencia oriP. Figura 2. La familia pSDH de plásmidos para probar elementos STAR. 2 sitios múltiples de clonación (MCSI y MCSII) flanquean un gen reportero (GFP o luciferasa) cuya expresión se impulsa por un promotor en dirección ascendente (CMV, Tet-off o SV40) . Los elementos STAR a probarse se insertan en MCSI y MCSII. Estos contienen sitio únicos de restricción (MCSI : Xhol, Notl, EcoRI, y Salí; MCSII, HindIII, EcoRV, BglII y Nhel) . El plásmido se replica después de integrase al azar en el genoma de células de mamífero. Figura 3. Proporción de clones que sobreexpresan la luciferasa. Las células de osteosarcoraa humano U-2 OS se transfectaron establemente con plásmidos pSDH (que contiene el gen reportero de luciferasa bajo control del promotor desactivado en tet-off) y los clones transfectados individuales se aislan y cultivan. La expresión de luciferasa se mide enzimáticamente . La expresión promedio de luciferasa por los clones que contiene STARless pSDH ("nivel de referencia") se determina. Los clones a partir de los conjuntos de todos los plásmidos de calificaron como sobreexpresantes si su actividad de luciferasa era de más de 2 veces superior a la del nivel de referencia. El porcentaje de los clones sobre-expresantes en cada conjunto de plásmido se gráfica. Figura 4. Sobreexpresión de pliegues por clones de sobreexpresión . El rango de la sobreexpresión en los plásmidos pSDH que contiene. STAR integrado dentro del ADW genómico, se determina al dividir las actividades de la luciferasa de cada clon por el nivel de referencia. Para aquellos que despliegan una expresión importante (más de 2 veces arriba del nivel de referencia) , se observan los incrementos reales de pliegue; se grafican los valores mínimo y mediano de estos datos para cada plásmido. Figura 5. Sobreexpresión de pliegues por clones de sobreexpresión. El ¦ rango de la sobreexpresión en los plásmidos pSDH que contiene STAR integrado dentro del ADN genómico, se determina al dividir las actividades de la luciferasa de cada clon por el nivel de referencia. Para aquellos que despliegan una expresión importante (más de 2 veces arriba del nivel de referencia) , se observan los incrementos reales de pliegue; se grafican los valores mínimo y mediano de estos datos para cada plásmido. Figura 6. El plásmido pSS (SINC-Select) para seleccionar y caracterizar los elementos SINC. El gen suicida codA: :upp codifica una proteína que convierte el profármaco de 5-fluorocitosina al fármaco tóxico 5-fluorouracil . Con la inducción por la concentración disminuida de tetraciclina, las células hospedadoras se vuelven sensibles al profármaco. Los fragmentos de ADN genómicos insertados en el sitio de clonación (BglII-Xhol) que tienen actividad silenciadora evitaran la expresión del gen suicida y permitirá la formación de colonias resistentes al profármaco. Los elementos STAR flanquean la selección de componentes para evitar la distribución de una cromatina silenciada a los componentes funcionales del plásmido. El plásmido se replica episomalmente en células de mamífero cultivadas debido a la secuencia oriP .
Figura 7. El plásmido pSDH-CSP usado para probar la actividad STAR. El gen reportero de fosfatasa alcalina secretado (SEAP) está bajo control del promotor CMV y el marcador de selección de resistencia de puromicina (puro) está bajo el control del promotor SV40. El flanqueo de estos dos genes son sitios múltiples de clonación dentro de los cuales se pueden clonar los elementos STAR. El plásmido también tiene un origen de replicación (ori) y un gen de resistencia la ampicilina (ampR) para la propagación en Escherichia coli. Figura 8. STAR6 y STAR 9 mejora la predicción y rendimiento de la expresión de transgenes. La expresión de SEAP del promotor CMV por células CHO transfectadas con pSDH-CSP, pSDH-CSP-STAR6,, o pSDH-CSP-STAR49 se determinó. Los constructos que contienen STAR le otorgan una mayor predicción y un rendimiento elevado con relación al constructo pSDH-CSP solamente. Figura 9. STAR6 y STAR8 mejora la predicción y rendimiento de la expresión de transgenes. La expresión de- la luciferasa del promotor CMV por las células U-2 OS transfectadas con pSDH-CMV, pSDH-CMV-STAR6, o pSDH-CMV-STAR8 se determina. Los constructos que contiene STAR le otorgan una mayor predicción y un rendimiento elevado con relación al constructo pSDH-CMV solamente. Figura 10. Secuencias esenciales mínimas de STAR10 y STAR27. Se amplificaron las porciones de los elementos STAR por PCR: STAR10 se amplificó con cebadores E23 y E12 para producir el fragmento 10A, E13 y E14, para producir el fragmento 10B y E15 y E16 para producir el fragmento 10C. Se amplificó el STAR27 con los cebadores E17 y E18 para producir el fragmento 27A, E19 y E20 para producir el fragmento 27B, y E21 y E22 para producir el fragmento 27C. Estos sub-fragmentos se clonaron en el vector pSelect . Después de la transfección dentro de la célula U-2 Os/Tet-Off/LexA-HPl , se observo el crecimiento de los cultivos en presencia de zeocina. Las tasas de crecimiento varían de vigorosas (+++) a pobres {+/-), aunque algunos cultivos fallaron de la supervivencia la tratamiento con zeocina (-) debido a la ausencia de la actividad STAR en el fragmento de ADN probado. Figura 11. Función del elemento STAR en el contexto del promotor SV40. pSDH-SV40 y pSDH-SV40-STAR6 se transíectaron en una línea celular de osteosarcoma humano U-2 OS, y se ensayó la expresión de la luciferasa con o sin la protección del silenciamiento de gen por STAR6 en clones resistentes a la puromicina. Figura 12. Función del elementos STAR en el contexto del promotor Tet-Off. Se transfectaron pSDH-tet y pSDH-Tet-STAR6 dentro de la línea celular de osterosarcoma humano U-2 OS, y se ensayo la expresión de luciferasa con o sin la protección del silenciamiento por STAR6 en clones resistentes a la puromicina . Figuras 13A-13C. Diagramas esquemáticos de la orientación de los elementos STAR cuando se clonan en el vector pSelect (Fig. 13A) , cuando se clonan en los vectores pSDH para conservar su orientación nativa (Fig. 13B y cuando se clonan en el vector pSDH en la orientación opuesta (Fig. 13C) . Figura 14. Dirección de la función STAR66. El elemento STAR66 se clonó en pSDH-Tet en una orientación nativa (STAR66 nativa) o en una orientación opuesta (STAR66 opuesto), y se transfecta en células U-2 OS. Se ensayó la actividad de la luciferasa en clones resistentes a la puromicina. Figura 15. Dependencia del número de copias de la función STAR. Manchado Southern de las unidades de expresión de luciferasa pSDH-tet-STAR10 integrada en el ADN genómico U-2 OS. Se usó la sonda de ADN de luciferasa radioactiva para detectar la cantidad del ADN de transgen en el genoma de cada clon, que luego se cuantificó con un formador de imágenes de fósforo . Figura 16. Dependencia del número de copias de la función STAR. El número de copias de las unidades de expresión pSDH-Tet-STAR10 en cada clon se determinó por formación de imágenes de fósforo, y se comparó con la actividad de la enzima de reportero de luciferasa expresada por cada clon. Figuras 17A-17B. Ensayos de intensificador y de bloqueo del intensificador . Los vectores de expresión de luciferasa usados para probar STAR para la actividad del intensificador y de bloqueo del identificador se muestran esquematicaniente. El sitio de enlace del recuadro E para la proteína del intensificador E47 está en dirección ascendente del sitio de clonación para los elementos STAR. En la dirección descendente del sitio de clonación STAR está el gen de luciferasa bajo el control de un promotor mínimo de la fosfatasa alcalina humana (mp) . Los histogramas indican los resultados esperados para las 3 situaciones experimentales posibles (ver texto) . Fig.l7A: ensayo de bloqueo del intensificador . Fig 17B: ensayo del intensificador . Figura 18. Ensayo de bloque del intensificador . La expresión de luciferasa a partir de un promotor mínimo se activa por el intensificador del recuadro E47/E en el vector vacío (vector) . La inserción de los bloqueadores intensificadores (scs, HS4) o elementos STAR (elementos STAR 1, 2, 3, 6, 10, 11, 18, y 27) bloquean la activación de luciferasa por el intensificador del recuadro E47/e. Figura 19. Ensayo del intensificador . La expresión de luciferasa a partir de un promotor mínimo sé activa por el intensificador del recuadro - E47/e del vector vació (E47) . La inserción de los elementos scs y HS4 o diversos elementos STAR (STAR 1, 2, 3, 6, 10, 11, 18 y 27) no activan la transcripción del gen reportero.
Figura 20. El vector pSS-codA: :upp usado para el aislamiento de elementos SINC. El gen suicida codA: :upp codifica una proteína que convierte al profármaco 5- fluorocitosina al fármaco tóxico 5-fluorouracilo . Con la inducción por una concentración disminuida de doxiciclina, las células hospedadoras se vuelven sensibles al profármaco. Los fragmentos de ADN genómicos insertados en el sit'io de clonación BglII que tienen actividad silenciadora evitaran la expresión del gen suicida y permiten la formación de colonias resistentes al profármaco. Los elementos STAR flanquean los componentes de selección para evitar la distribución de cromatina silenciada a los componentes funcionales del plásmido. El plásmido se selecciona después de la transfección en células mamíferas. con el gen resistente a la higromicina y después de la transformación en E. coli con el gen resistente a- la ampicilina. Se replica episomalmente en células mamíferas cultivadas debido a la secuencias oriP y EBNA-1 y en E. coli debido a la secuencia ori . Figura 21. El plásmido pSS-hrGFP es idéntico al plásmido pSS-codA: :upp excepto por el reemplazo del gen suicida con hrGFP (proteína fluorescente verde codificadora) y de STAR6 con STAR8 en la dirección descendente del gen reportero GFP.
Figura '22. Conservación de la secuencia STAR18 entre ¦ ratón y humano la región del genoma humano que contiene 497 pares base de STAR18 se muestran (recuadros negros) ; el elemento se presenta entre los genes de la homeocaja H0XD8 y H0XD4 en el cromosoma humano 2. se alinea con una región en el cromosoma de ratón 2 que comparte un 72% de identidad de secuencia. La región del cromosoma humano 2 inmediatamente a la izquierda de STA 18 también está altamente conservada con el cromosoma 2 de ratón (73% de identidad; recuadros grises) ; más allá de esta región, la identidad cae debajo de 60%. La capacidad de estas regiones de humano y de ratón, separadamente o en combinación para otorgar crecimiento a la zeocina como se indica: -, sin crecimiento; +, crecimiento moderado; ++, crecimiento vigoroso; +++, crecimiento rápido.
Figura 23. Diagrama esquemático del flujo de trabajo de análisis de bio-informatica . Para detalles ver el texto. Figura 24. Resultados del análisis discriminante en la clasificación del conjunto de entrenamiento de 65 elementos STAR. Los elementos STAR que son correctamente clasificados como STAR por un análisis discriminante lineal por etapas (LDA) se muestran en un diagrama Ven. Las variables- para LDA se seleccionaron del análisis de frecuencia en sus resultados para los oligonucleótidos examericos ("oligos") y para diadas. El diagrama indica la concordancia de 2 conjuntos de variables en clasificar correctamente STAR. Figura 25. Las células U-2 OS/Tet-Off/lexA-HP2 se transfectan con los elementos STAR candidatos de Arabidopsis y se cultivan a concentraciones bajas de doxiciclina. El ARN total se aisla y se somete a TR-PCR; las bandas corresponden a los ARNra de resistencia a la zeocina e higromicina se detectaron por manchado Southern y se cuantificaron con un-formador de imágenes de fósforo. Las relaciones de zeocina a higromicina se muestran para los transfectantes que contiene unidades de expresión de zeocina flanqueada por 12 diferentes elementos STAR de Arabidopsis, el elementos scs de drosofila y ningún elemento de flanqueo. Figura 26. Secuencias que comprenden: STAR1 - STAR 65 (SEQ ID: 1-65), Secuencias que comprenden: STAR66 y el conjunto de prueba (SEQ ID: 66-84), Secuencias que comprenden: STAR Al-A35 (SEQ ID-.85-119).
Referencias Altschul, S.F. and Gish, W. (1996) Local alignment statistics. Methods Enzymol, 266, 460-480. Altschul, S.F-., Gish, W. , iller, ., Myers, E.W. and Lipman, D.J. (1990) Basic local alignment search tool. J Mol Biol, 215, 403-410. Bell, AC, West, AG, and Felsenfeld, G. (2001) Insulators and boundaries: versatile regulatory elements in the eukaryotic genome Science 291, 447-50., Bennett, R.P., Cox, C.A. and Hoeffler, J.P. (1998) Fusión of green fluorescent protein with the Zeocin-resistance marker allows visual screening and drug selection of transfected eukaryotic cells. Biotechnigues , 24, 478-482. .
Berger, J, Hauber, J, Hauber, R, Geiger, R, and Culien, BR. (1988) Secreted placental alkaline phosphatase : a po erful ne quantitative indicator of gene expression in eukaryotic cells Gene 66,1-10. Bevan, M, Mayer, K, White, O, Eisen, JA, Preuss, D, Bureau, T, Salzberg, SL, and Me es, HW. (2001) Sequence and analysis of the Arabidopsis genome Curr Opin Plant Biol 4, 105-10. Bierhuizen, .P., Westerman, Y., Visser, T.P., ognum, A.W. and Wagemaker, .G. (1997) Green fluorescent protein variants as markers of retroviral-mediated gene transíer in primary hematopoietic cells and cell lines. Biochem Biophys Res Commun, 234, 371-375. Boivin, A, and Dura, JM. (1998) In vivo chromatin accessibility correlates with gene silencing in Drosophila Genetics 150, 1539-49. - Boshart, M, Weber, F, Jahn, G, Dorsch-Hasler, K, Fleckenstein, B, and Schaffaer, W. (1985) A very strong enhancer is located upstream of an immediate early gene of human cytomegalovirus Cell 41, 521-30. Breckenridge, D.G. and Shore, G.C. (2000) Regulation of apoptosis by E1A and Myc oncoproteins . Crit Rev Eukaryot Gene Expr 10, 273-280. Bunker, C.A. and Kingston, R.E. (1994) Transcriptional repression by Drosophila and mammalian Polycomb group proteins in transfect.ed mammalian cells. Mol Cell Biol , 14, 1721-1732. Cherry, J.R., Lamsa, M.H., Schneider, P., Vind, J. , Svendsen, A. , Jones, A. and Pedersen, A.H. (1999) Directed evolution of a fungal peroxidase. Nat Biotechnol, 17, 379-384. Chung, JH, Whiteley, M, and Felsenfeld, G. (1993) A 5' element of the chicken beta-globin domain serves as an insulator in human erythroid cells and protects against position effect in Drosophila Cell -74, 506-14. Deuschle, U, Meyer, WK, and Thiesen, HJ. (1995) Tetracycline-reversible silencing of eukaryotic promoters Mol Cell Biol 15, 1907-14. Dolí, R.F., Crandall, J.E., Dyer, C.A., Aucoin, J.M. and Smith, F.I. (1996) Comparison of promoter strengths on gene delivery into mammalian brain cells using AAV vectors . Gene Ther, 3, 437-447. Eissenberg, J.C, James T.C, Foster-Hartnett D.M., Hartnett T, Ngan V., and Elgin S.C.R. (1990) Mutation in a heterochromatin-specific chromosomal protein is associated with suppression of position-effect variegation in Drosophila melanogaster . Proc Nati Acad Sci (USA) 87: 9923-9927. Feng, Y.Q, Seibler, J. , Alami, R. , Eisen, A., Westerman, .A. , Leboulch, P.r Fiering, S. and Bouhassira, E.E. (1999) Site-specific chromosomal integration in mammalian cells: highly efficient CRE recombinase-mediated cassette exchange . J Mol Biol, 292, 779-785. Foecking, MK, and Hofstetter, H. (198S) Powerful and versatile enhancer-promoter unit for mammalian expression vectors. Gene 45, 101-5. Garrick, D, Fiering, S, Martin, DI, and hitelaw, E. (1998) Repeat-induced gene silencing in mammals Nat Genet 18, 56-9. Gaszner, M. , Vázquez, J. and Schedl, P. (1999) The Zw5 protein, a component of the scs chromatin domain boundary, is able to block enhancer-promoter interaction. Genes Dev, 13, 2098-2107. Gerasimova, T.I. and Corees, V.G. (1998) Polycomb and trithorax group proteins medíate the function of achromatin insulator. Cell, 92, 511-521. Gerasimova, TI, and Corees, VG. (2001) Chromatin insulators and boundaries : effeets on transcription and nuclear organization Annu Rev Genet 35, 193-208. Gossen, M. and Bujard, H. (1992) Tight control of gene expression in mammalian cells by tetracyeline-responsive promoters. Proc Nati Acad Sci U S A, 89, 5547-5551. Graham, F.L. and van der Eb, A.J. (1973) Transformation of rat cells by DNA of human adenovirus 5. Virology, 54, 536- 539.
Heldin, C.H. , Johnsson, A., Wennergren, S., Wernstedt, C, Bets oltz, C. and Westermark, B. (1986) A .human osteosarcoma cell line secretes a growth factor structurally related to a homodimer of PDGF A-chains. Nature, 319, 511-514. Henke, E. and Bornscheuer, U.T. (1999) Directed evolution of an esterase from Pseudomonas fluorescens. Random mutagenesis ' by error-prone PCR or a rautator strain and identification of mutants showing enhanced enantioselectivity by a resorufin-based fluorescence assay. Biol Chem, 380, 1029-1033. Henthorn, P, Zervos, P, Raducha, M, Harris, H, and Kadesch, T. (1988) Expression of a human placental alkaline phosphatase gene " in transfected cells-. use as a repórter for studies of gene expression Proc Nati Acad Sci U S A 85, 6342-6. Higgins, D.G., Thompson, J.D. and Gibson, T.J. (1996) Using CLUSTAL for múltiple sequence alignments . Methods Enzymol, 266, 383-402. Himes, S.R. and Shannon, M.F. (2000) Assays for transcriptional activity based on the luciferase repórter gene. Methods Mol Biol, 130, 165-174. Huberty, CJ (1994) Applied discriminant analysis, Wiley and Sons, New York. Initiative, AG. (2000) Analysis of the genome sequence of the flowering plant Arabidopsis thaliana Nature 408, 796-815. Izumi, M, and Gilbert, DM. (1999) Hotnogeneous tetracycline-regulatable gene expression in mammalian fibroblasts J Cell Biochem 76, 280-9. Jung, R., Soondrum, K. and Neumaier, M. (2000) Quantitative PCR. Clin Chem Lab Mod, 38, 833-836. Kain, SR. (1997) Use of secreted alkaline phosphatase as a repórter of gene expression in mammalian cells Methods Mol Biol 63, 49-60. Kao, F.T. and Puck, T.T. (1968) Genetics of somatic mammalian cells, VII. Induction and isolation of nutritional mutants in Chínese hámster cells. Proc Nati Acad Sci U S A, 60, 1275-81. Kellum, R. and Schedl, P. (1992) A group of scs elements function as domain boundaries in an enhancer-blocking assay. Mol Cell Biol, 12, 2424-2431. ent, WJ. (2002) BLAT-the BLAST-like alignment tool Genome Res 12, 656-64. Knofler, M, Meinhardt, G, Bauer, S, Loregger, T, Vasicek, R, Bloor, DJ, Kimber, SJ, and Husslein, P. (2002) Human Handl basic helix-loop-helix (bHLH) protein: extra-embryonic expression pattern, interaction partners and identification of its transcriptional represser domains Biochem J 361, 641-61.
Li, W-H (1997) Molecular Evolution, Sinauer Associates, Sunderland MA. , Meinke, DW, Cherry, JM, Dean, C, ounsley, SD, and oomneef; M. (1998) Arabidopsis thaliana: a model plant for genome analysis Science 282. 662, 679-82. Litt, M.D., Simpson, M. , Recillas-Targa, F . , Prioleau, M.N. and Felsenfeld, G. (2001) Transitions in histona acetyla ion reveal boundaries of three separately regulated neighboring loci. EMBO J, 20, 2224-2235. Meyer, P. (2000) Transcriptional ,transgene silencing and chromatin components Plant Mol Biol 43, 221-34. Morgenstern, J.P. and Land, H. (1990) Advanced mamraalian gene transfer-. high titre retroviral vectors ith múltiple drug selection markers and a complementary helper-free packaging cell line. Nucleic Acids Res, 18, 3587-3596. Mullen,. C.A., Kilstrup, M. and Blaese, R.M. (1992) Transfer of the bacterial gene for cytosine deaminase to mammalian cells confers lethal sensitivity to 5-fluorocytosine : a negative selection system. Proc Nati Acad Sci U S , 89, 33-37. Nan, X., Javier Campoy, F., and Bird A. (1997) MeCP2 is a transcriptional represser with abundant binding sites in genomic chromatin. Cell 88, 471-481. Petersson, K, Ivars, F, and Sigvardsson, M. (2002) The pT alpha promoter and enhancer are direct targets for transactivation by E box-binding proteins Eur J Immunol 32, 911-20. Pazin, M.J. and Kadonaga, J.T. (1998) Transcriptional and structural analysis of c romatin assembled in vitro. In Gould, H. (ed.) Chromatin: A Practical Approach. Oxford University Press, Oxford, pp. 172-194. Pietersen, A. and H.M. Noteborn. (2000) Apoptin. Adv Exp Med Biol 466, 153-161. Quong, MW, Romanow, WJ, and Murre, C. (2002) E protein function in lymphocyte development Annu Rev Immunol 20, 3 Ol22. Ruezinsky, D, Beckmann, H, and Kadesch, T. (1991) Modulation of the IgH enhancer's cell type specificity through a genetic switch Genes Dev 5, 29-37. Saluz, H.P. and Joat, J.P. (1993) Approaches to characterize protein-DNA interactions in vivo. Crit Rev Eukaryot Gene Expr, 3, 1-29. Sambrook, J. , Fritsch, E.F. and Maniatis, T. (1989) Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Plainview NY. Sanger, P. , Nicklen, S. and Coulson, A.R. (1977) DNA sequencing with chain-terminating inhibitors. Proc Nati Acad Sci U S A, 74, 5463-5467. Simizu, B., Rhim, J.S. and Wiebenga, N.H. (1967) Characterization of the Tacaribe group of arboviruses. I. Propagation and plaque assay of Tacaribe virus in a line of ( African green monkey kidney cells (Vero) . Proc Soc Exp Biol. Med, 125, 119-123. Smith, R.L., Traul, D.L., Schaack, J. , Clayton, G.H., Staley, K.J. and Wilcox, C.L. (2000) Characterization of promoter function and cell-type-specific expression from viral vectors in the nervous system. J Virol, 74, 11254-11261. Stara, M, Viterbo, A, Mol, JN, and Kooter, JM. (1998) Position-dependent methylation and transcriptional silencing of transgenes in inverted T-DNA repeats: implications for posttranscriptional silencing of homologous host genes in plants Mol Cell Biol 18, 6165-77. Stull, R.A., Hyun, W.C. and Pallavicini, M.G. (2000) Simultaneólas flo cytometric analyses of enhanced green and yello fluorescent proteins and cell surface antigens in doubly transduced immature hematopoietic cell populations . Cytometry, 40, 126-134. Takada, T. , lida, K. , Akasaka, K. , Yasue, H., Torii, R. , Tsujimoto, G. , Taira, M. and Kimura, H. (2000) Evaluation of heterologous insulator function with regard to chromosomal position effect in the mouse blastocyst and fetus. Mol Reprod Dev, 57, 232-237. Tanaka, S., Livingstone-Zatchej , M . and Thoma, F. (1996) Chromatin structure of the yeast URA3 gene at high resolution provides insight into structure and positioning of nucleosomes iri the enromosoroal context . J Mol Biol, 257, 919-934. Thomas, J.O. (1998) Isolation and fractionation of chromatin and linker histonas . In Gould, H. (ed.) Chromatin: A Practical Approach. Oxford University Press, Oxford, pp . 1-34. Tiraby, M. , Cazaux, C, Barón, M., Droco rt, D., Reynes, J.P. and Tiraby, G. (1998) Concomitant expression of E. coli cytosine deaminase and uracil phosphoribosyltransferase improves the cytotoxicity of 5-fluorocytosine . FEMS Microbiol Lett, 167, 41-49. Umana, P, Jean-Mairet, J, and Bailey, JE. (1999) Tetracycline-regulated overexpression of glycosyltransferases in Chínese hámster ovary cells Biotechnol Bioeng 65, 542-9. van der Vlag, J. , den Blaa wen, J.L., Sewalt, R.G. , van Dríel, R. and Otte, A.P. (2000) Transcriptional repression mediated by polycomb group proteins and other chromatin-associated repressors is selectively blocked by insulators. J Biol Chem, 275, 697-704. van Helden, J, Andre, B, and Collado-Vides, J. (1998) Extracting regulatory sites from the upstream región of yeast genes by computational analysis of oligonucleotide frequencies J Mol Biol 281, 827-42. van Helden, J, Andre, B, and Collado-Vides, J. (2000) A web site for the computational analysis of yeast regulatory sequences Yeast 16,177-87. van Helden, J, Ríos, AF, and Collado-Vides, J. (2000) Discovering regulatory elements in non-coding sequences by analysis of spaced dyads Nucleic Acids Res 28, 1808-18. Vanee, V, and Vaucheret, H. (2001) RNA silencing in plants-defense and counterdefense Science 292, 2277-80. Wallrath, L.L., Swede, M.J. and Elgin, S.C.R. (1998) Mapping chromatin structure in Drosophila. In Gould, H. (ed.) Chromatin: A Practical Approach. Oxford University Press, Oxford, pp. 59-77. Weaver, L.S. and Kadan, M.J. (2000) Evaluation of adenoviral vectors by flow cytometry. Methods , 21, 297-312. ei, K. and Huber, B.E. (1996) Cytosine deaminase gene as a positive selection marker. J Biol Chem 271, 3812-3816. Wigler, M, Pellicer, A. ,( Silverstein, S. and Axel, R. (1978) . Biochemical transfer of single-copy eukaryotic genes using total cellular DNA as donor. Cell 14, 725-731. Wigley, P., Becker, C, Beltrame, J. , Blake, T., Crocker, L., Harriaon, S., Lyons, I., McKenzie, Z., Tearle, R. , Crawford, R. and et al. (1994) Site-specific transgene insertion: an approach. Reprod Fértil Dev, 6, 585-588. Xu, Z.Z., Krougliak, V., Prevec, L. , Graham, F.L. and Both, G.W. (1995) Investigation of promoter function in human and animal cells infected with human recombinant adenovirus expressing rotavirus antigen VP7sc. J Gen Virol , 76, 1971-1980. Yang, TT, Sinai, P, itts, PA, and Kain, SR. (1997) Quantification of gene expressíon with a secreted alkaline phosphatase repórter system Biotechniques 23, 1110-4. Yin, D.X., Z u, L . , and Schimke R.T.. (1996) Tetracyclin-controlled gene expreasion system achieves high-level and quantitative control of gene expression. Analyt Biochem 235, 195-201. Zink, D, and Paro, R. (1995) Drosop ila Polycomb-group regulated chromatin inhibits the accessibility of a trans-activator to its target DMA Embo J 14, 5660-71.
Tabla 1. elementos STAR que mejoran la expresión del transgen Plásmido Clones sobre- Veces de Número de expresados, % sobre- clones expresión (rango) Vacío 12 3-11 25 SCS (control 24 3-160 21 positivo) STAR-6 62 2-200 26 STAR-3 39 5-820 23 STAR-8 63 7-315 19 STAR-4 31 25-1500 13 STAR-1 57 5-80 23 La expresión, del gen reportero de luciferasa se mide en las líneas celulares que contienen los plásmido pSDH integrados, sin ("vacío", el control negativo) o que contienen elementos STAR (que incluye el elemento de control positivo, SCS de Drosophila.) . El nivel de expresión medio del control negativo se define como el nivel de referencia, y los clones se consideran que se sobre-expresan su su nivel de expresión es de >2 veces arriba del nivel de referencia. El porcentaje de clones sobre-expresados para cada plásmido y las veces de sobre-exprésion se reportan, junto con el número de clones analizados para cada plásmido.
Tabla 2 : Elemento STAR clonado Clon Ubicación Genes adyacentes2 Secuencia de cro osomal1 repetición STAR-1 N.d. STAR-2 N.d. STAR-3 For 5q33.3 La parte Chr 10 e n Rev 10q22.2 histona. Gen de acetiltransferasa STAR-4 For lp31.1 Sin genes dentro del 83% de repetitiva Rev 14q24.1 intron de 10 kb o LI1\IE2 & LTR regulador de la ERV_Clase I señalización de la proteína G Clon Ubicación Genes adyacentes2 Secuencia de cromosomal1 repetición STAR- 12 5q35.3 Familia de Comple idad baja 3% metaloproteinasa TS2 ???? desconocida R 15 kb STAR- 13 Ver STAR4 y 9 STAR- 14 F N.d. R 20ql3 .33 STAR- 15 lp36.36 Subunidad del canal de 14% LTR (MaLRs) potasio con conpuerta al voltaje L 6 kb R 4 kb desconocido STAR- 16 F 8p23 .1 Sin repetición sobre R 8p22 etc . las partes formadas en secuencia STAR17 2q31.1 Factor de transcripción 10% de complejidad L 6 kb simple y baja R 40 kb H RNP ¦"¦Ubicación cromosómal ' se determina por una búsqueda BLAST de los datos de la secuencia de ADN a partir de los clones STAR contra la base de datos del genoma humano . La ubicación seda de acuerdo con la nomenclatura estándar que se ref iere al ideograma citogenético de cada cromosoma ; por ej emplo lp2 . 3 es la tercera banda citogenética de la segunda banda citogenética del extremo corto del cromosoma 1 (htt : //www. cbi . nlm. ih . gov/ Class/MLAcourse/Genetics / chrombn ding-html) . F, resultado de la reacción de secuencia delantera; R, resultado de la reacción de secuencia reversa; N.d., todavía no determinado. 2Con base en la construcción de la vista de mapa de genoma humano 22 (htt : //www. ncbi . nlm.nih.gov/cig-bin/Entrez/hum arch?chr=hum chr . inf&query Abril 2001) . L, izquierdo, R. derecho. *Posición ambigua, diversos aciertos.
Tabla 3. Elementos SINC recuperados del cromosoma humano 22 por selección en el vector pSS SINC Longitud Ubicación Comentarios (nt) cromosomal Psinks 9 700 22qll.21 Contiene LTR; el gen más cercano ZNF 74, una proteína de enlace de ARN. El LTR muy receptivo Psinks 12 750 22ql2.3 Localizado en intrón de la proteína del tipo de acetilglucosaminil- transferasa (664 kb) implicada en la formación de tumor Psinksl9 600 22ql3.1 Localizado en el intrón del canal de. calcio, casi exclusivamente expresado en el cerebro Psinks28 950 22ql3.31 Localizado en el intrón de la proteína del riñon de función desconocida. Contiene el elemento SIME. Psinks30 700 22ql3.33 Contiene parte de SINE Psinks35 650 22qll.21 Cubre el exon para el portador de soluto (Gen nuclear para la mitocondria) 1 La ubicación cromosomal se determina por la búsqueda BLAST de lós datos de la secuencia de ADM de los clones STAR contra la base de datos del genoma humano. La ubicación se da según la nomenclatura estándar que se refiere al ideograma citogenético de cada cromosoma; por ejemplo, lp2.3 es la tercera sub-banda citogenética de la segunda banda citogenética del extremo corto del cromosoma 1 (ht : / /www . ncbi .nlm.nih. gov/Cías s /MLACourse/Genetics /chrmbnading . html ) .
Tabla 4 A: Secuencia de elementos diversos STAR en una hebra (delantera) o la hebra opuesta (reversa) STAR3 Delantero ACGTNCTAAGNAAACCATTATTATCATGACATTAACCTATAAAAATAGGC GTATCACGAGGCCCTTTCGTCTTCACTCGAGCGGCCAGCTTGGATCTCGA GTACTGAAATAGGAGTAAATCTGAAGAGCAAATAAGATGAGCCAGAAAAC CATGAAAAGAACAGGGACTACCAGTTGATTCCACAAGGACATTCCCAAGG TGAGAAGGCCATATACCTCCACTACCTGAACCAATTCTCTGTATGCAGATT TAGCAAGGTTATAAGGTAGCAAAAGATTAGACCCAAGAAAATAGAGAACT TCCAATCCAGTAAAAATCATAGCAAATTTATTGATGATAACAATTGTCTCC AAAGGAACCAGGCAGAGTCGTGCTAGCAGAGGAAGCACGTGAGCTGAAA ACAGCCAAATCTGCTTTGTTTTCATGACACAGGAGCATAAAGTACACACCA CCAACTGACCTATTAAGGCTGTGGTAAACCGATTCATAGAGAGAGGTTCT AAATACATTGGTCCCTCATAGGCAAACCGCAGTTCACTCCGAACGTAGTC CCTGGAAATTTGATGTCCAGNATAGAAAAGCANAGCAGMCNITOOT^ A ATMMGNTGA CCA ATGNT NCTGMTC STAR3 Inverso GAGCTAGCGGCGCGCCAAGCTTGGATCCCGCCCCGCCCCCTCCGCCCTCG AGCCCCGCCCCTTGCCCTAGAGGCCCTGCCGAGGGGCGGGGCCTGTCCC TCCTCCCCTTTCCCCCGCCCCCTACCGTCACGCTCAGGGGCAGCCTGACC CCGAGCGGCCCCGCGGTGACCCTCGCGCAGAGGCCTGTGGGAGGGGCGT CGCAAGCCCCTGAATCCCCCCCCGTCTGTTCCCCCCTCCCGCCCAGTCTC CTCCCCCTGGGAACGCGCGGGGTGGGTGACAGACCTGGCTGCGCGCCAC CGCCACCGCGCCTGCCGGGGGCGCTGCCGCTGCCTGAGAAACTGCGGCT GCCGCCTGGAGGAGGTGCCGTCGCCTCCGCCACCGCTGCCGCCGCCGCC AGGGGTAGGAGCTAAGCCGCCGCCATTTTGTGTCCCCCTGTTGTTGTCGT TGACATGAATCCGACATGACACTGATTACAGCCCAATGGAGTCTCATTAA ACCCGAGTCGCGGTCCCGCCCCGCCGCTGCTCCATTGGAGGAGACCAAAG ACACTTAAGGCCACCCGTTGGCCTACGGGTCTGTCTGTCACCCACTCACT AACCACTCTGCAGCCCATTGGGGCAGGTTCCTGCCGGTCATNTCGCTTCC AATAAACACACCCCTTCGACCCCATNATTCCCCCCCTTCGGGAACCACCC CCGGGGGAGGGGTCCACTGGNGAATACCAATTWAAAGAACCGCTNGGG TCCGCCTNTTTMCGGGCNCCCTATTGGGTT STAR 4 Delantero GGGGAGGATTCTTTTGGCTGCTGAGTTGAGATTAGGTTGAGGGTAGTGAA GGTAAAGGCAGTGAGACCACGTAGGGGTCATTGCAGTAATCCAGGCTGG AGATGATGGTGGTTCAGTTGGAATAGCAGTGCATGTGCTGTAACAACCTC AGCTGGGAAGCAGTATATGTGGCGTTATGACCTCAGCTGGAACAGCAATG CATGTGGTGGTGTAATGACCCCAGCTGGGTAGGGTGCATGTGATGGAACA ACCTCAGCTGGGTAGCAGTGTACTTGATAAAATGTTGGCATACTCTACATT TGTTATGAGGGTAGTGCCATTAAATTTCTCCACAAATTGGTTGTCACGTAT GAGTGAAAAGAGGAAGTGATGGAAGACTTCAGTGCTTTTGGCCTGAATAA ATAGAAGACGTCATTTTCAGTAATGGAGACAGGGAAGACTAA GNAGGGT GGATTCAGTAGAGCAGGTGTTCAGTTTTGAATATGATGAACTCTGAGAGA GGAAAAACTTTTTCTACCTCTTAGTTTTTGNGNCTGGACTTAANATTAAAG GACATA GACNGAGA CAGACCAAATNTGCGA GTTTTTATATTTTACTT GCNGAGGGAATTTNCAAGAAAAAGAAGACCCANANCCATTGGTCAAAA CTATNTGCCTTTTAANAAAAAGAMAATTACAATGGANAANAAGTGTTGN CTNGGCAAAAATTGGG STAR 4 Inverso GGATTNGAGCTAGCGGCGCGCCAAGCTTGGATCTTAGAAGGACAGAGTG GGGCATGGAAATGCACCACCAGGGCAGTGCAGCTTGGTCACTGCCAGCT CNCTCATGGGCAGAGGGCTGGCCTCTTGCAGCCGACCAGGCACTGAGCG CCATCCCAGGGCCCTCGCCAGCCCTCAGCAGGGCCAGGACACACAAGCCT TTGACTTCCTCCTGTCACTGCTGCTGCCATTCCTGTTTTGTGGTCATCACT CCTTCCCTGTCCTCAGACTGCCCAGCACTCAAGGATGTCCTGTGGTGGCA TCAGACCATATGCCCCTGAANAGGAGTGAGTTGGTGTTTTTGCCGCGCC CA AGAGCTGCTGTCCCCTGAAAGATGCAAGTGGGAATGATGATGNTCAC CATCNTCTGACACCAAGCCCTTTGGATAGAGGCCCCAACAGTGAGGATGG GGCTGCACTGCATTGCCAAGGCAACTCTGTNNTGACTGCTACAWGACANT CCCAGGACCTGNGAAGK CTATA ATNTGATGCNAGGCACCT STAR 6 Delantero CCACCACAGACATCCCCTCTGGCCTCCTGAGTGGTTTCTTCAGCACAGCTT CCAGAGCCAAATTAAACGTTCACTCTATGTCTATAGACAAAAAGGGTTTTG ACTAAACTCTGTGTTTTAGAGAGGGAGTTAAATGCTGTTAACTTTTTAGGG GTGGGCGAGAGGAATGACAAATAACAACTTGTCTGAATGTTTACATTTC TCCCCACTGCCTCAAGAAGGTTCACAACGAGGTCATCCATGATAAGGAGT AAGACCTCCCAGCCGGACTGTCCCTCGGCCCCAGAGGACACTCCACAGA GATATGCTAACTGGACTTGGAGACTGGCTCACACTCCAGAGAAAAGCATG GAGCACGAGCGCACAGAGCANGGGCCAAGGTCCCAGGGACNGAATGTCT AGGAGGGAGATTGGGGTGAGGGTA TCTGATGCAATTACTGNGCAGCTC AACATTCAAGGGAGGGGAAGAAAGAAACNGTCCCTGTAAGTAAGTTGTNC A CAGAGATGGTAAGCTCCAAATTTNAACTTTGGCTGCTGGAAAGTTT ' GGGCCNAANAAWAAACA AAANATTTGAGGTTTA ACCCACTAACCCN TATNANTANTTATTAATACCCCTAATTA ACCTTGGATA CCTTAAAATAT CNTNTNAAACGGAACCCTCNTTCCCNTTT1MAAATNNNAAAGGCCATT NGIOTCNAGTAAAAATCTNNOT CNAGACACNTTTTTTNTCCNGGNATTTNTAATTTATTTCTAAWCC STAR 6 Inverso ATCGTGTCCTTTCCAGGGACATGGATGAAGCTGGAAGCCATCATCCTCAG CAAACTAACACAGGAACAGAAAACCAAATACCACATGTTCTCACTCATAAG TGGGAGCTGAACAGTGAGAACACATGGACACAGGGAGGGGAACATCACA CACCAAGGCCTGTCTGGTGTGGGGAGGGGAGGGAGAGCATCAGGACAAA TAGCTAATGCATGTGGGGCTTAAACCTAGATGACGGGTTGATAGGTGCAG CAATCCACTAGGACACATATACCTATGTAACAACCCNACCTTNTTGACAT GTATCCCAGAACTTAAAGGAAAATAAAAATTAAAAAAAATTMCCCTGGAA TAAAAAAGAGTGTGGACTTTGGTGAGATN STAR 8 Delantero GGATCACCTCGAAGAGAGTCTAACGTCCGTAGGAACGCTCTCGGGTTACA AAGGATTGACCGAACCCCAGGATACGTCGCTCTCCATCTGAGGCTTGNTC CAAATGGCCCTCCACTATTCCAGGCACGTGGGTGTCTCCCCTAACTCTCC CTGCTCTCCTGAGCCCATGCTGCCTATCACCCATCGGTGCAGGTCCTTTCT GAANAGCTCGGGTGGATTCTCTCCATCCCACTTCCTTTCCCAAGAAAGAA GCCACCGTTCCAAGACACCCAATGGGACATTCCCNTTCCACCTCCTTNTC NAAAGTTNGCCCAGGTGTTCNTAACAGGTTAGGGAGAGAA CCCCCAGG TTTNAGTTNCAAGGCATAGGACGCTGGCTTGAACACACACACACNCTC STAR 8 Inverso GGATCCCGACTCTGCACCGCAAACTCTACGGCGCCCTGCAGGACGGCGGC CTCCTGCCGCTTGGACGCCAGNCAGGAGCTCCCCGGCAGCAGCAGAGCA GAAAGAAGGATGGCCCCGCCCCACTTCGCCTCCCGGCGGTCTCCCTCCCG CCGGCTCACGGACATAGATGGCTGCCTAGCTCCGGAAGCCTAGCTCTTGT TCCGGGCATCCTAAGGAAGACACGGTTTTTCCTCCCGGGGCCTCACCACA TCTGGGACTTTCACGACTCGGACCTCTCTCCATTGAATGGTTGCGCGTTC TCTGGGAAAG STAR 18 Delantero TGGATCCTGCCGCTCGCGTGTAAGTGTTTCTCCCTCAAGACTTTCCTTCTG TTTTGTTGTCTTGTGCAGTATTTTACAGCCCCTCTTGTGTTTTTCTTTATTT CTCGTACACACACGCAGTTTTAAGGGTGATGTGTGTATAATTAAAAGGAC CCTTGGCCCATACTTTCCTAATTCTTTAGGGACTGGGATTGGGTTTGACTG AAATATGTTTTGGTGGGGATGGGACGGTGGACTTCCATTCTCCCTAAACT GGAGTTTTGGTCGGTAATCAAAACTAAAAGAAACCTCTGGGAGACTGGAA ACCTGATTGGAGCACTGACCAACAAGGGAATGAAAAGGCAGACTCTCTGA ACGTTTGATGAAATGGACTCTTGTGAAAATTAACAGTGAATATTCACTGTT GCACTGTACGAAGTCTCTGAAATGTAATTAAAAGTTTTTATTGAGCCGCCG AGCTTTGGCTTGCGCGTATTTTCCGGTCGCGGACATCCCACCGCGCAGA GCCTCGCCTCCCCGCTGNCCTCAGTCCGATGACTTCCCCGCCCCCGCCC TGCTCGGTGACAGACGTTCTACTGCTTCCAATCGGAGGCACCCTTCGCGG STAR 18 Inverso TGGATCCTGCCGCTCGCGTCTTAGTGTTTCTCCCTCAAGACTTTCCTTCTG TTTGTTGTCTTGTGCAGTATTTTACAGCCCCTCTTGTGTTTTTCTTTATTT CTCGTACACACACGCAGTTTTAAGGGTGATGTGTGTATAATTAAAAGGAC CCATACTTTCCTAATTCTTTAGGGACTGGGATTGGGATTGGGTTTGACTG AAATATGTTTTGGTGGGGATGGGACGGTGGACTTCCATTCTCCCTAAACT GGAGTTTTGGTCGGTAATCAAAACTAAAAGAAACCTCTGGGAGACTGGAA ACCTGATTGGAGCACTGAGGAACAAGGGAATGAAAAGGCAGACTCTCTGA ACGTTTGATGAAATGGACTCTTGTGAAAATTAACAGTGAATATTCACTGTT GCACTGTACGAAGTCTCTGAAATGTAATTAAAAGTTTTTATTGAGCCCCCG AGCTTTGGC Tabla 4 B : la secuencia de diversos elementos SINC PSINKS 9 GATCAGGA TAATAAGTAC GCTGGGAAGA CAACAAAATG ATTTAAATCT TAGACAAGTC ATTCTAGGTGG TCTCCACTGT TTCAGTTCTT GCATTCATTC TTGTGGTATC TTTTCCCTTT ACCAATAAA AAACGTCCCT GACATGAGAT TGTGGCAGTC CCCATGGTTT GCCGCAGTTA CTGCGGGACT GAACGAAGGA GGACGAATGA AGAAATGAAA ACCAAGGAAA AAAGGAGCTG TTTAAAGAAG GGTCCAGGGA AGAAGAAGAG GGCTCCCAGC TTCTAGTGAG CAAGGGCAGC AGCCCTGAGC TTCTACAGCC CTTCATATTT ATTGAGTGA AAGAGCAGGG AGCAGGAGGT AATGATTGGT CAGCTTCTCA ATTGATCACA GGTTCACATT ATTGCTAACA GATTTCACAT GTGCCTAATC TCAAGAAACG CCGCGCCTGG GGCATGACTG CCCTCAGCAT TCCCTCTGGG TGGCAGACGC AGTTTGCCAA CATTCTGCAT TCATGAGAAC AGTTTACTGT TTACTCATAT AACCTCCAGT GGTACACCGA GTTGATC PSINKS 12 GATCTAA TTTCTCTGTA TTTAATTCCC ATGTCTATTT TGTCTATTTT CAAGATTGAT TTACATTGCA GGTTCCGATG CAACCACTGA CTTACATTGC AGGTTCTAAT GTAACCACTG TCCTAACGA GTACATAGAT TTGTTTTCCTT CTCTCCAGGA GCATGAGATT TGTTGCCTCC AGGAAAGGCA ACAAATCTAC TATTCCTTA AGGACAGTGG TTCTCAAAGG ATTGTCCTGG GAACAGCAGC ATCACCTACA CAGTAGTTAG AAATGCACAT TCTGAGGCCT CCCAAGACCT GCTAACTCAG ACACTTGGGG AGAAGAAGGG GTTCCAACAA GCCTTCTAGG TCATTCTGAT GCATGCTGGA GTTTGAGAAT CGATGCTCTA GGAAAAACAC CAGTACTAT CTACCATCAA CTTGACCACT CAAGTGTCAC CATTCACTGA AGTTTAACTA CAATGTCCAG AGAATTAATT GTGTACCAGG CACTATGCGG AAGGCTGAAT GCTGCCTCAC AATCCAAGT GGTATGTGTG TAAATGACTA AATAAAATGC AAAATGGGAT GACATG PSINKS 19 G ATCCTCCATC TGCTCCACCC ACTTCCATCT AAGTGATCCT GGGCTGATCA CTTCCTCTCT CTAGACTTCG TTTCTTTTTT TTCTTTTTTA GACCGAGTCT CACTCTGTCA CCCAGGCTGG AGTGCAGTGG TGAGATCTTG GCTCACTGCA ACCTCCACCT CCTGGGTTCA AGCAATTCTC CTGTCTCAGC CTCCTGAGTA GATAGGACTA TAGGTGCACA CCACCATACC TAGCTAATTT ' TTGTTTTTTT AGTAGAGATG GGGTTTCACC ATATTGGTCA GCCTGTTCTC AAACTCCTGA CCTCAGGTGA TCCACCCACC TCAGCCTCCC AAAGTGCTGG GATTACAGGT GTGAGCCACC GAGCCGGGCT GCCCTTCTCT GGACTTTGAT TTCCTCATCT ATAAAACAGA CAACAATCCC TACTATGACC ATCCAGAAGG GTTATCTAT GCTTCATTGC AATCCTAATC AAAAATCCCA ACATTTTGGC CGTGGAGCCT GCCCAGATGG TTCTAGGATT TATTTGGATG GGAAAATAGT CAAGACAAGC TT PSINKS 28 GAT CATGGAGGGA GAGAACAACC AACCACACAC TGACTGGTCA CCCCTGAAGT TCACAGCCAC TACCCTGTAG AGGCCCCGAG GTTGCCGGCA AGCCCAGTAT ACTTCCATCT AAACTCCCCT TGCACCTGCT CCTCCTGTTC CAGACAATGA GCTGTAACAC GCACATCCAC ACCACACATC ACCCACAGCA GGGGCAGGAG GCAGCTAAGC ATGGGCTTCA GAGTCCTCCC ACCAGCAGCG CCTACCAGCT ACAAGCCTGA CGTCTCTGTG TGTGTGTGTA AATTTCACTA AATATTTCTT CCTTTGTTTT TTAAAAATTT ACATGAAATG CACATTTTTG CTGTGACAGA AGCATGTAAC TGTGATCCTA ACACACCTAC TCCTCCGCCT TTTACTGCCG TCTGCTTCCC TCTCTTCTCC ACGCCCACTC GACTGCAGTA TCGATGCCAA CAACATGATG TGTGTCCTTC CATGTTTCCC TGCTCATGCA TTCGCATGTA AGCCACCGCA CATGTCACTG TATGTACACA CAGGGGATTC TGAGGCCAAT GTTTTACAAG GATTACGTTA TACACCCTTT TCTGCAGTGA GTTTTTCCCA GGCAACCTCC CAGGCCCCAT GGTGTAGCTC TGGGTCAATC CTTTTTTTTT TTTTTGGAGA CAGAGTCTCA CTCTGTCGCC CAGGCTGGAG TGCAGTGGTG CAATTTGGGC TCACTGCAAC CTCCGCCTCC CGGGTTCAAG CGATTCTCCT GCCTCAGCCT CCTGAGTAGC TGACATTACA AGCGCGCACT ACCACACCCG GCTAATTTTT GTATTTTTAG TAGAGATACA GTTTCACCAT GTTGGTCAGG CTGGTCTTGA ACTCCTGAGC TCGTGATC PSINKS 30 GATCC ACCCGCCTCG GACTCCCAAA GTGCTGGGAT TACAGGTGTG AGCCACTGTG CTTGGCCCGA ATCAGGAATA ATTCTGATGG CTAAGGAAGA CAGCTTCCGA GAGAGTAGGA GAAAGGGCAC AGGATTCCAG GCAGAAGGCC CATCTAGGGC AAAGGCGAAG GTGTGGCTCA GCCTGCCTCC TTTTGGGGAAT GGCGAGTGTG TTCTGGGCTC AGGGTTCTTG GTAAGGGACA GAGAAGACTC GGGAAAGATC AGTTGAGCTG GAATGTGCAG GCTCTTGAGT ACCCTGCTCA GGAGCTGGAG GTGGGCTACC CTGCAAACTC CAGGCCATGA AGCCCAGGAA GATGTCAGGC TGGTCTTCCC ATGCCCTTGT GTATCTGAGA CCAACTGTCA CTAAATGTTT CCTTTACGCC CTGGACACAC AGCTAGACTC TACTTCTCAG ATTCTCTTGA AATACAAGTC TTTAGCCAGA GGGTGTGGAG GGAAATGCTG TGTATCACTT TGAGGTTGAG GCCATCAAAG CCTCCCACAG GTGGCCCCCT CTTTCTCTCC CCACGTACTT ATGATGTTGA TGCCCAAGGC AGCTTGAGTA CTACCTGCTG AAGGCAGGGC CTCTGTCACC ATGATC PSINKS 35 GATCCAC CTGCCTCGGC CTCCCAAAGT GCTGGGATTA CAGGCATGAG CCACCATGCC TGGCCAAAAA CTTCTACCTG CTTGGAAAGT TGACTGGTCA CACAGCCTAG CAAATGAGGT TGGGATGTGG GATGTCCTG GTTCCA TCC CAGCCCTTTA CTGTTCCCAT AGGAGGTGGG GACAGGCCTC ACCCAGGCGT CCAGCATCCT GCAGCTGAAT CTTGAGCATT TCCATGGGAC AGGTCACCAC GACCTGGCAC ATCCCAGCCC CACACCCGGC AAGCATCTCC ATCTTCAGGT TCCGCTGCAT CCTATGGGAA CAGGCGTCAG GCTCCTTCAG CCGCAGGCCA CAGGCCTGCC CTGGTGCAGC TGCCCTCTTG TGAGAGGGGG ACTTTCCCTG GATGGCACCC GTGGCTGCCA CTCACCCAGC TGGTCAAGTC ATCAGCTAGC CCTTAGGTGT GGTCTCTGTA CGGACAGGGG ACTAAGTTTA AAACAAAGCC TGCTAGGGAG GTAGCACCGC ATGGAAGCTG AAACAGTGAC AGAGAAAACT ACCCAGACCA GGCGTTGTCC TTGATC Tabla 5. Oligonucleótidos usados para reacciones de cadena de polimerasa (cebadores PCR) o mutagénesis de ADN Número Secuencia C65 AACAAGCTTGATATCAGATCTGCTAGCTTGGTCGAGCTGATCATTCCC C66 AAACTCGAGCGGCCGCGAATTCGTCGACTTTACCACTCCCCTATCAGTGATA GAG C67 AAACCGCGGCATGGAAGACGCCAAAAACATAAAGAAAGG C68 TATGGATCCTAGAATTACACGGCGATCTTTTCC C81 AAACCATGGCCGAGTAGAAGCCCACGGTGCGCC C82 AAATCTAGATCAGGCACCGGCTTGCGGGTCATGC C85 CATTTCCCCGAAAAGTGCCACC D30 TCACTGCTAGCGAGTGGTAAACTC D41 GAAGTCGACGAGGCAGGCAGAAGTATGC D 2 GAGCCGCGGTTTAGTTGGTCACCTTGTCG D51 TCTGGAAGCTTTGCTGAAGAAAC D89 GGGCAAGATGTCGTAGTCAGG D90 AGGCCCATGGTCACCTCCATCGCTACTGTG D91 CTAATCACTACACTGTGTAAT D93 AATTACAGGCGCGCC D94 AATTGGCGCGCCTGT D95 TGCTTTGCATACTTCTGCCTGCCTC E12 TAGGGGGGATCCAAATGTTC E13 CCTAAAAGAAGATCTTTAGC Número Secuencia E14 AAGTGTTGGATCCATTTGG E15 TTTGAAGATCTACCAAATGG E16 GTTCGGGATCCACCTGGCCG E17 TAGGCAAGATGTTGGCCCTC E18 CCTCTCTAGGGATCCGACCC E19 CTAGAGAGATCTTCCAGTAT E20 AGAGTTCCGGATCCGCCTGG E21 CCAGGCAGACTCGGAACTCT E22 TGGTGAAACCGGATCCCTAC E23 AGGTCAGGAGATCTAGACCA E25 CCATTTTCGCTTCCTTAGCTCC E42 CGATGTAACCCACTCGTGCACC · E57 AGAGATCTAGGATAATTTCG E92 AGGCGCTAGCACGCGTTCTACTCTTTTCCTACTCTG E93 GATCAAGCTTACGCGTCTAAAGGCATTTTATATTAG E94 AGGCGCTAGCACGCGTTCAGAGTTAGTGATCCAGG E95 GATCAAGCTTACGCGTCAGTAAAGGTTTCGTATGG E96 AGGCGCTAGCACGCGTTCTACTCTTTCATTACTCTG E97 CGAGGAAGCTGGAGAAGGAGAAGCTG E98 CAAGGGCCGCAGCTTACACATGTTC D58 CCAAGTTGACCAGTGCC D80 GTTCGTGGACACGACCTCCG D70 TACAAGCCAAGGACGGCCT D71 CGGAAGTGCTTGACATTGGG Tabla 6. Elementos STAR de la invención, que incluye ubicación y longitud genómica STAR Ubicación1 Longitud2 44 22qll .1 1591 45 22qll.21 1991 46 22qll.23 1871 47 22qll.21 1082 48 22qll.22 1242 49 Chr 12 random clon, y 1015 3q26.32 50 6p21.31 2361 51 5q21.3 2289 52 7pl5.2 1200 53 Xpll.3 1431 54 4q21.1 981 55 15ql3.1 501 56 Incluidos 3p25.3 741 57 4q35.2 1371 58 21qll.217 random clon 104 59 4pl6.1 y 6q27 872 60 7pl4.3 y llq25 2068 61 14q24.3 1482 62 22ql3.3 1011 63 17qll.27q21.11=28.420ql3.33 1421 y 6ql4.1 64 1414 65 1310 66 -2800 xLa ubicación cromosomal se determina por una búsqueda BLAST de los datos de la secuencia de ADN a partir de los elementos STAR contra la base de datos del genoraa humano. La ubicación se da de acuerdo con la nomenclatura estándar que se refiere al hideograma citogenético de cada cromosoma; por ejemplo lp2.3 es la tercera banda citogenética de la segunda banda citogenética del extremo · corto del cromosoma 1 (htt : //www. ncbi . nkm. ih.gov/Class/MLACCourse/Genetics/chromb anding.html) . En los casos en donde los ADN identificados de reacción formadora de secuencias delantera e inversa de diferentes lugares genómicos, se muestran ambos lugares. 2Se determinan las longitudes precisas por análisis de secuencias de ADN; se determinan las longitudes aproximadas por mapeo de restricción. Secuencia y ubicación de STAR3 se a refinado desde el ensamble de las Tablas 2 y 4. 4Los STAR con estos números en la Tabla 2 y 4 se han colocado por un lado (de aquí en adelante referido como "oldSTAR5" etc . ) y sus números se asignan a los elementos STAR que se muestran en el apéndice del ADN. En el caso de oldSTAR5, oldSTAR14, y oldSTAR16, los ADN clonados fueron quimeras de más de dos ubicaciones cromosomales; en el caso de oldSTAR9 y oldSTAR13, los ADN clonados fueron idénticos a STAR4. 5Idéntico a la Tabla 4 "STAR18" .
Tabla 7. Los elementos STAR otorgan estabilidad con el tiempo sobre la expresión de transgenes. Divisiones de Expresión de Células2 Luciferasa3 STAR6 más 42 18, 000 puromicina 60 23,000 84 20, 000 108 16, 000 STAR6 sin 84 12 , 000 puromicina 108 15, 000 144 12, 000 plásmido pSDH-Tet-STAR6 se transfectó en células OS y se aislaron y cultivaron los clones en un medio libre de doxiciclina como se describe en Ejemplo 1. Se transfirieron las células a bases de cultivo fresco semanalmente a una dilusión de 1:20. 2E1 número de divisiones de células se basa- en la estimación de que en una semana el cultivo alcanza a confluencia de células que representa divisiones de alrededor de ~6 células. 3Se ensayó la luciferasa como se describe en el Ejemplo 4Después de 60 divisiones de células se transfirieron las células a dos vasos de cultivo; uno se suministro con medio de cultivo que contiene puromicina en cuanto a las primeras 60 divisiones de células, y el segundo se suministro con un medio de cultivo que carece de antibiótico.
Tabla 8 Elementos STAR humanos y sus ortólogos y paralógos de ratón supuestos SEQ: ID INICIO Humano1 Ratón 2 Similitud3 1 1 2q31.1 2D 600bp 69% 2 2 7pl5.2 6B3 909 bp 89% 3 3a 5q33.3 11B2 248 bp 83% 4 3b 10q22.2 14B 1.363 bp 89% 2.163 bp 86% 5 6 2p21 17E4 437 bp 78% 6 12 5q35.3 llbl.3 796 bp 66% 7 13 9q34.3 2A3 753 bp 77% 8 18 ' 2q31.3 2E1 497 bp 72% 9 36 21q22.2 16C4 166 bp 79% 10 40 22qll.l 6F1 1.270 bp 75% 2.309 bp 70% 11 50 6p21.31 17B1 1.451 bp 72% 2.188 bp 80% 3.142 bp 64% SEQ: ID INICIO Huamano1 Ratón 2 Similitud3 12 52 7pl5.2 6B3 1.846 bp 74% 2.195 bp 71% 13 53 Xpll .3 XA2 364 bp 64% 14 54 4q21.1 5E3 1.174 bp 80% 2.240 bp 73% 3.141 bp 67% 4.144 bp 68% 15 61a 7pl .3 6B3 188 bp 68% """Ubicación citogénica del elemento STAR en el . genoma humano. 2Ubicación citogénica del elemento STAR ortólogo en el genoma de ratón. 3longitud de las regiones que exhiben una alta similitud de secuencia, y una similitud de porcentaje. En algunos casos más de un bloque de alta similitud se presenta; en aquellos casos, cada bloque se describe de manera separada. La similitud de <60% no se considera importante.
Tabla 9. Patrones de oligonucleótido (6 pares base) sobre-representados en los elementos STAR. Los patrones se ubican de conformidad con el coeficiente de importancia. Estos se determinan usando herramientas RSA con la secuencia del genoma humano como referencia. Los patrones que comprenden las variables más discriminant el Análisis Discriminante Lineal se indican con un asterisco.
Numero Secuencia de Presentación Presentación Coeficiente Numero de oligo- observada esperada de coinciden nucleótido iirportancia cías STAR 1 CCCCAC 107 49 8.76 51 2 CAGCGG 36 9 7.75 23 3 GGCCCC 74 31 7.21 34 4 CAGCCC 103 50 7.18 37 5 GCCCCC 70 29 6.97 34 6 CGGGGC 40 12 6.95 18 7 CCCCGC 43 13 6.79 22 8 CGGCAG 35 9 6.64 18 9 AGCCCC 83 38 6.54 40 10 CCAGGG 107 54 6.52 43 11 GGACCC * 58 23 6.04 ' 35 12 GCGGAC 20 3 5.94 14 13 CCAGCG 34 10 5.9 24 14 GCAGCC 92 45 5.84 43 15 CCGGCA 28 7 5.61 16 16 AGCGGC 27 7 5.45 17 17 CAGGGG 86 43 509 43 18 CCGCCC 43 15 502 18 19 CCCCCG 35 11 4.91 20 Numero Secuencia de Presentación Presentación Coeficiente Numero de oligo- observada esperada de coinciden nucleótido importancia cias STAR 20 GCCGCC 34 10 4.88 18 21 GCCGGC 22 5 4.7 16 22 CGGACC 19 4 4.68 14 23 CGCCCC 35 11 4.64 19 24 CGCCAG 28 8 4.31 19 25 CGCAGC 29 8 4.29 20 26 CAGCCG 32 10 4 24 27 CCCACG 33 11 3.97 26 28 GCTGCC 78 10 3.9 43 29 CCCTCC 106 60 3.87 48 30 CCTGC * 92 50 3.83 42 31 CACCCC 77 40 3.75 40 32 GCGCCA 30 10 3.58 23 33 AGGGGC 70 35 3.55 34 34 GAGGGC 66 32 3.5 40 35 GCGAAC 14 2 3.37 13 36 CCGGCG 17 4 3.33 12 37 AGCCGG 34 12 3.29 25 38 GGAGCC 67 34 3.27 40 39 CCCCAG 103 60 3.23 51 40 CCGCTC 24 7 3.19 19 Número Secuencia de Presentación Presentación Coeficiente Número de j oligo- observada esperada de coincidenci nucleótido importancia as STAR 41 CCCCTC 81 44 3.19 43 42 CACCGC 33 12 3.14 22 43 CTGCCC 96 55 3.01 42 44 GGGCCA 68 35 2.99 39 45 CGCTGC 28 9 2.88 22 46 CAGCGC 25 8 2.77 19 47 CGGCCC 28 10 2.73 19 48 CCGCCG 19 5 2.56 9 49 CCCCGG 30 11 2.41 17 50 AGCCGC 23 7 2.34 17 51 GCACCC 55 27 2.31 38 52 AGGACC 54 27 2.22 33 53 AGGGCG 24 8 2.2 18 54 CAGGGC 81 47 2.18 42 55 CCCGCC 45 21 2.15 20 56 GCCAGC 66 36 2.09 39 57 AGCGCC 21 6 2.09 18 58 AGGCCC 64 34 2.08 32 59 CCCACC 101 62 2.05 54 60 CGCTCA 21 6 2.03 17 61 AACGCG 9 1 1.96 9 Número Secuencia de Presentación Presentación Coeficiente Numero de oligo- observada esperada de coinciden nucleótido importancia cías STAR 62 GCGGCA 21 7 1.92 14 63 AGGTCC 49 24 1.87 36 64 CCGTCA 19 6 1.78 14 65 CAGAGG 107 68 1.77 47 66 CCCGAG 33 14 1.77 22 67 CCGAGG 36 16 1.76 25 68 CGCGGA 11 2 1.75 8 69 CCACCC 87 53 1.71 45 70 CCTCGC 23 8 1.71 20 71 CAAGCC 59 32 1.69 40 72 TCCGCA 18 5 1.68 17 73 CGCCGC 18 5 1.67 9 74 GGGAAC 55 29 1.63 39 75 CCAGAG 93 58 1.57 49 76 CGTTCC 19 6 1.53 16 77 CGAGGA 23 8 1.5 19 78 GGGACC " 48 24 1.48 31 79 CCGCGA 10 2 1.48 8 80 CCTGCG 24 9 1.45 17 81 CTGCGC 23 8 1.32 14 82 GACCCC 47 24 1.31 33 Numero Secuencia de Presentación Presentación Coeficiente Número del oligo- observada esperada de coinciden nucleótido importancia cias STAR 83 GCTCCA 66 38 1.25 39 84 CGCCAC 33 15 1.19 21 85 GCGGGA 23 9 1.17 18 86 CTGCGA 18 6 1.15 15 87 CTGCTC 80 49 1.14 50 88 CAGACG 23 9 1.13 19 89 CGAGAG 21 8 1.09 17 90 CGGTGC 18 6 106 16 91 CTCCCC 84 53 1.05 47 92 GCGGCC 22 8 1.04 14 93 CGGCGC 14 4 1.04 13 94 AAGCCC * 60 34 1.03 42 95 CCGCAG 24 9 1.03 17 96 GCCCAC 59 34 0.95 35 97 CACCCA 92 60 0.93 49 98 GCGCCC 27 11 0.93 18 99 ACCGGC 15 4 0.92 13 100 CTCGCA 16 5 0.89 14 101 ACGCTC 16 5 0.88 12 102 CTGGAC 58 33 0.88 32 103 GCCCCA 67 40 0.87 38 Número Secuencia de Presentación Presentación Coeficiente Numero de oligo- observada esperada de coincidenc nucleótido iitportancia ias STAR 104 ACCGTC 15 4 0.86 11 105 CCCTCG 21 8 0.8 18 106 AGCCCG 22 8 0.79 14 107 ACCCGA 16 5 0.78 13 108 AGCAGC 79 50 0.75 41 109 ACCGCG 14 4 0.69 7 110 CGAGGC 29 13 0.69 24 111 AGCTGC 70 43 0.64 36 112 GGGGAC 49 27 0.64 34 113 CCGCAA 16 5 0.64 12 114 CGTCGC 8 1 0.62 6 115 CGTGAC 17 6 0.57 15 116 CGCCCA 33 16 0.56 22 117 CTCTGC 97 65 0.54 47 118 AGCGGG 21 8 0.52 17 119 ACCGCT 15 5 0.5 11 120 CCCAGG 133 95 0.49 58 121 CCCTCA 71 46 0.49 39 122 CGCCCA * 77 49 0.49 42 123 GGCGAA 16 5 0.48 14 124 CGGCTC 29 13 0.47 19 Numero Secuencia de Presentación Presentación Coeficiente Número de oligo- observada esperada de coinciden nucleótido ircportancia cías STAR 125 CTCGCC 20 8 0.46 17 126 CGGAGA 20 8 0.45 14 127 TCCCCA 95 64 0.43 52 128 GACACC 44 24 0.42 33 129 CTCCGA 17 6 0.42 13 130 CTCGTC 17 6 0.42 14 131 CGACCA 13 4 0.39 11 132 ATGACG 17 6 0.37 12 133 CCATGG 17 6 0.37 13 134 AGGGGA 78 51 0.36 44 135 GCTGCA 77 50 0.35 43 136 ACCCCA 76 49 0.33 40 137 CGGAGC 21 9 0.33 16 138 CCTCCG 28 13 0.32 19 139 CGGGAC 16 6 0.3 10 140 CCTGGA 88 59 0.3 45 141. AGGCGA 18 7 0.29 17 142 ACCCCT 54 32 0.28 36 143 GCTCCC 56 34 0.27 36 144 CGTCAC 16 6 0.27 15 145 AGCGCA 16 6 0.26 11 1 Número Secuencia de Presentación Presentación Coeficiente Número de oligo- observada esperada de coinciden nucleótido importancia cias STAR 146 GAAGCC 62 38 0.25 39 147 GAGGCC 79 52 0.22 42 148 ACCCTC 54 32 0.22 33 149 CCCGGC 37 20 0.21 21 150 CGAGAA 20 8 0.2 17 151 CCACCG 29 14 0.18 20 152 ACTTCG 16 6 0.17 14 153 GATGAC 48 28 0.17 35 154 ACGAGG 23 10 0.16 18 155 CCGGAG 20 8 0.15 18 156 ACCCAC 60 37 0.12 41 157 CTGGGC 105 74 0.11 50 158 CCACGG 23 10 o :o9 19 159 CGGTCC 13 4 0.09 12 160 AGCACG * 54 33 0.09 40 161 ACACCC 53 32 0.08 38 162 AGGGCC 54 33 0.08 30 163 CGCGAA 6 1 0.02 6 164 GAGCCC 58 36 0.02 36 165 CTGAGC 71 46 0.02 45 166 AATCGG 13 4 0.02 11 Tabla 10. Patrones de diadas sobre-representados en elementos STAR. Los patrones se ubican de conformidad con el coeficiente de importancia. Estos se determinan usando herramientas RSA con la secuencia aleatoria del genoma humano como referencia. Los patrones que comprenden las variables más discriminantes en el Análisis Discriminante Lineal se indican con un asterisco.
Número Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 104 CTCN{6}CGC 28 8 3.04 105 CGCN{4}GAG 21 5 3.03 106 GCGN{5}GGA 24 6 3.03 107 CCGN{I}CAG 27 7 3.01 108 CGCN{II}CCG 18 3 2.99 109 GCGN{19}CCC 26 7 2.98 110 CGCN{18}GAA 21 5 2.98 111 GGGN{19}GGA 78 39 2.95 112 CCA {I}CGG 24 6 2.94 113 CCCN{7}GCG 25 6 2.94 114 AGGN{IO}CCC 84 43 2.92 115 CCAN{O}GGG 97 52 2.88 116 CAGN{IO}CCC 82 41 2.87 117 CCGN{18}CCG 19 4 2.86 118 CCGN{18}GGC 26 7 2.85 119 CCCN{2}GCG 24 6 2.84 120 CGCN{I}GGC 25 7 2.83 121 CCGW{5)GAC 19 4 2.81 122 GGAN{O}CCC 52 22 2.8 123 CCCN{I}CCG 29 9 2.78 124 CCCN{15}ACG 23 6 2.75 125 AGCN{8}CCC 66 31 2.73 Número Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 148 CGCN{ll}ACA 23 6 2.51 149 CGGN{O}ACC 17 3 2.5 150 GCGN{IO}GCC 24 6 2.49 151 GCGN{8}GAC 17 3 2.49 152 CCCN{l5}GGG 84 32 2.44 153 CGGN{l6}GGC 27 8 2.44 154 CGCN{16}CCA 23 6 2.42 155 GCCN{3 }CCC 73 36 2.4 156 CAGN{4}GGG 94 51 2.4 157 CCCN{6}GCG 23 6 2.38 158 CCGN{l6}CGC 17 3 2.38 159 CCCN{l7}GCA 61 28 2.37 160 CGCN{13}TCC 24 6 2.37 161 GCCN{I}CGC 29 9 2.36 162 CCGN{19}GAG 26 7 2.35 163 GGGN{IO}GGA 89 48 2.35 164 CAGN{5}CCG 32 11 2.35 165 CGCN{3}AGA 19 4 2.32 166 GCCN{O}GCC 29 9 2.32 167 CCCN{8}GGC 61 28 2.31 168 CCTN{6}GCG 22 6 2.29 169 GACN{6}CCC 48 20 2.29 Número Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 170 CGCN{I}CCC 26 8 2.27 171 CCCN{15}CCG 30 10 2.27 172 CAGN{9}CCC 84 44 2.26 173 CGGN{10}GGC 27 8 2.26 174 CGA {IO}ACG 10 1 2.26 175 GCGN{3}TCC 21 5 2.26 176 CCCN{3 }GCC 75 38 2.24 177 GCGN{I}ACC 17 3 2.24 178 CCGN{9}AGG 27 8 2.23 179 CGCN{16}CAG 26 8 2.23 180 GGCN{O}CCC 62 29 2.22 181 AGGN{l2}CCG 26 8 2.19 182 CCGN{O}GCG 16 3 2.19 183 CCGN{2}GCC 30 10 2.18 184 CCGN{II}GTC 19 4 2.17 185 CAGN{O}CCC 88 47 2.17 186 CCCN{5}CCG 32 11 2.17 187 GCCN{20}CCC 66 32 2.15 188 GACN{2}CGC 18 4 2.14 189 CGCN{6}CAC 23 6 2.13 190 AGGN{14}GCG 25 7 2.1 191 GACN{5}CGC ¦17 3 2.1 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 214 CAGN{6}CCG 29 9 1.92 215 CGTN{12}CGC 11 1 1.92 216 CTCN{7}GCC 69 35 1.92 217 CGCN{19}TCC 22 6 1.92 218 CCCN{7}GCC 67 33 1.91 219 CAGN{l3}CGG . 30 10 1.9 220 CGCN{I}GCC 27 8 1.9 221 CGCN{17}CCG 17 4 1.89 222 AGGN{4}CCC 63 31 1.89 223 AGCN{IO}CGC 21 5 1.89 224 CCCN{II}CGG 30 10 1.88 225 CCCN{8}GCC 75 39 1.86 226 CCGN{I}CGG 22 3 1.86 227 CCCN{I}ACC 71 36 1.85 228 CGCN{O}CAG 25 7 1.85 229 CCGN{l9}TGC 23 6 1.82 230 GCGN{4}CGA 12 2 1.82 231 CCGN{19}GCC 30 10 1.82 232 CCA {IO}CCC 85 46 1.81 233 CAGN{l3}GGG 91 51 1.81 234 AGCN{18} 23 6 1.81 235 CGA {8}CGC 11 1 1.81 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 236 AGCN{4}CCC 63 31 1.8 237 GGA {6}CCC 51 30 1.8 238 CGGN{ 13 }AAG 23 6 1.8 239 ACCN{ll}CGC 19 5 1.79 240 CCGN{12}CAG 28 9 1.78 241 CCCN{l2}GGG 76 29 1.77 242 CACN{l7}ACG 22 6 1.76 243 CAGN{18}CCC 82 44 1.76 244 CGTN{IO}GTC 19 5 1.75 245 CCCN{13}GCG · 23 6 1.75 246 GCA {l}CGC 20 5 1.73 247 AGA {4}CCG 24 7 1.73 248 GCGN{10}AGC 22 6 1.72 249 CGCN{O}GGA 12 2 1.72 250 CGGN{4}GAC 17 4 1.69 251 CCCN{l2}CGC 26 8 1.68 252 GCCN{15}CCC 65 33 1.68 253 GCGN{6}TCC 20 5 1.66 254 CGGN{3}CAG 33 12 1.65 255 CCCN{3}CCA 88 49 1.65 256 AGCN{3}CCC 59 28 1.65 257 GGGN{l6}GCA 65 33 1.65 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 258 AGGN{8}CCG 28 9 1.64 259 CCCN{O}CCG 29 10 1.64 260 GCGN{5}GAC 16 3 1.64 261 CCCN{9}ACC 60 29 1.64 262 CTGN{5}CGC 25 8 1.64 263 CGCN{l4}CTC 23 7 1.64 264 CGCN{l4}GCA 23 7 1.63 265 CCGN{8 }GCC 26 8 1.62 266 CCGN{ }CAC 23 7 1.62 267 AGCN{8}GCG 21 6 1.61 268 CGGN{l6}GGA 29 10 1.61 269 CCAN{l2}CCG 26 8 1.61 270 CGGN{2}CCC 26 8 1.6 271 CCAW{13}GGG 71 37 1.6 272 CGGN{15}GCA 21 6 1.6 273 CGCN{9}GCA 20 5 1.58 274 CGGN{19}CCA 26 8 1.58 275 GGGN{15} CGA 20 5 1.57 276 CCCN{IO}CGC 26 8 1.57 277 CTCN{14}CGC 26 8 1.55 278 CACN{ll}GCG 20 5 1.55 279 CCGN{2}GGC 24 7 1.55 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 302 CCA {9}CCG 27 9 1.48 303 CCCN{19}CCA 78 42 1.48 304 CAGN{O}GGG 77 41 1.48 305 AGCN{I}CCC 58 28 1.47 306 GCGN{7}TCC 27 9 1.46 307 ACGN{18}CCA 25 8 1.46 308 GCTN{14}CCC 61 30 1.46 309 GCGN{14}CCC 23 7 1.46 310 GCGN{19}AGC 20 5 1.45 311 CCGN{8}CAG 29 10 1.45 312 GCGN{6}GCC 22 6 1.45 313 GCGN{IO}GCA 20 5 1.44 314 CCTN{7}GCC 69 36 1.44 315 GCCN{13}GCC 54 26 1.42 316 CCCN{14}GCC 63 32 1.42 317 CCCN{15}CGG 26 8 1.42 318 CCAN{13}CGC 23 7 1.42 319 AGCN{11}GGG 67 35 1.41 320 GGAN{O}GCC 64 32 1.4 321 GCCN{3}TCC 61 30 1.4 322 CCTN{5}GCC 69 36 1.39 323 CGGW{18}CCC 25 8 1.39 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 368 GAGN{5}CCC 60 30 1.16 369 CCTN{16}TCG 20 6 1.16 370 CCCN{2}GGC 62 32 1.15 371 GCGN{13}GGA 24 8 1.15 372 GCCN{l7}GGC 66 35 1.15 373 CCCN{14}GGC 58 29 1.14 374 AGGN{3}CCG 31 12 1.14 375 CACN{0}CGC 32 12 1.14 376 CGGN{18}CAG 28 10 1.14 377 AGCN{l}GCC 57 28 1.13 378 CGCN{l8}GGC 23 7 1.13 379 CCCN{5}AGG 64 33 1.11 380 AACN{0}GCG 9 1 1.11 381 CCCN{10}CCA 88 50 , 1.09 382 CGCN{13}GAG 20 6 1.09 383 CGCN{7}GCC 25 8 1.08 384 CCCN{9}CCG 28 10 1.07 385 CGCN{16}CCC 24 8 1.05 386 GAA {13}CGC 18 5 1.05 387 GGCN{3}CCC 49 23 1.03 388 TCCN{II}CCA 87 50 1.03 389 CACN{O}CCC 70 38 1.02 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada ircportancia 390 CGCN{16}CCG 15 3 1.02 391 CGGN{l5}AGC 21 6 1.02 392 CCCN{12}GCG 21 6 1.02 393 CCCN{9}GAG 59 30 1.01 394 CCGN{20}TCC 24 8 1.01 395 CGCN{O}CGC 17 4 1.01 396 ATGN{7}CGG 20 6 1 397 GGGN{20}GCA 59 30 1 398 CGGM{4}GGC 26 9 0.99 399 CGGN{l6}AGC 22 7 0.99 400 CGGN{5}GGC 25 8 0.99 401 GCGN{.O}GGA 25 8 0.98 402 GGCN{20}CAC 52 25 0.98 403 CCCN{9}CCC 97 58 0.97 404 ACCN{17}GGC 44 20 0.97 405 CCCN{6}CGA 18 5 0.96 406 AAGN{IO}CGG 26 9 0.96 407 CGCN{17}CAC 21 6 0.95 408 CCCN{l6}CGG 25 8 0.94 409 GACN{l8}GGC 39 17 0.94 410 GGGN{l5}GAC 47 22 0.92 411 GCCN{4}TCC 66 35 0.92 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 412 GGCN{15}CCC 56 28 0.92 413 CAGN{12}CGC 24 8 0.92 414 CCAN{3}GCG 22 7 0.91 415 CCGN{16}GAG 22 7 0.9 416 AGCN{2}CGC 24 8 0.89 417 GAGN{4}CCC 54 27 0.89 418 AGGN{3}CGC 23 7 0.88 419 CACN{13}AGG * 67 36 0.88 420 CCCN{4}CAG 88 51 0.88 421 CCCN{2}GAA 63 33 0.87 422 CGCN{l9}GAG 21 6 0.87 423 ACG ÍlSjGGG 21 6 0.87 424 CCCN{4}GGC 62 32 0.87 425 CGGN{9}GAG 28 10 0.86 426 CCCN{3}GGG 66 26 0.86 427 GAGN{4}GGC 66 35 0.85 428 CGCN{5}GAG 18 5 0.84 429 CCGN{20}AGG 24 8 0.84 430 CCCM{15}CCC 88 51 0.83 431 AGGN{l7}CCG 25 8 0.82 432 AGGN{6}GGG 89 52 0.82 433 GGCN{20}CCC 57 29 0.82 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 434 GCAN{17}CGC 19 5 0.82 435 CGA {II}ACG 9 1 0.81 436 CGCM{2}GGA 19 5 0.81 437 CTGN{5}CCC ¦ 79 45 0.8 438 TCCN{20}CCA 77 43 0.8 439 CCAN{20}GGG 59 30 0.8 ¿-4-4-9· CCGN{15}GCG 14 3 0.8 441 CCA {5}GGG 69 38 0.79 442 CGGM{I}TGC 24 8 0.79 443 CCCN{l4}GCG 21 6 0.79 444 CAGN{O}CCG 27 10 0.79 445 GCCN{9}TCC 60 31 0.78 446 AGGM{20}CGC 22 7 0.78 447 CCCN{6}GAC 42 19 0.77 448 CGGN{II}CCA 23 7 0.76 449 GGGN{l4}CAC 57 29 0.76 450 GCAN{l5}CGC 19 5 0.74 451 CGCN{2}ACA 20 6 0.74 452 ACCN{9}CCC 57 29 0.73 453 GCGN{9}CGC 20 3 0.73 454 CAGN{15}GCG 23 7 0.73 455 CCCM{18}GTC 45 21 0.72 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 500 GCCN{4}CCC 67 37 0.58 501 CGGN{IO}GCC 22 7 0.58 502 GCCN{5}GGA 54 27 0.57 503 ACCN{7}GCG 15 4 0.57 504 CCCN{8}CGC 24 8 0.57 505 CAGN{5}CCC 77 44 0.56 506 CACN{14}GGA 63 34 0.56 507 CCCN{1}GCC 94 57 0.56 508 CCCN{5}AGC 67 37 0.55 509 GGCN{5}GGA 59 31 0.55 510 CGAN{l7}GAG 19 6 0.55 511 CGCN{7}ACA 18 5 0.54 512 CCAN{13}CCC 87 52 0.54 513 CGGN{20}GGC 24 8 0.54 514 CCCN{17}GCC 58 30 0.53 515 CCTN{IO}CCG 30 12 0.53 516 CCCN{8}CCG 27 10 0.53 517 CGCN{3}GAG 18 5 0.52 518 CGCN{7}AAG 17 5 0.51 519 CGGN{II}GGA 23 8 0.51 520 CCGN{15}CCG 15 4 0.51 521 CCCM{3}GCA 57 30 0.51 Número Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 522 CGGN{2}CAG 24 8 0.5 523 AGGN{2}CCG 24 8 0.5 524 CCCN{4}CAC 69 38 0.5 525 GGA {19}CCC 56 29 0.49 526 CCCN{8}CAC 68 38 0.49 527 ACCN{6}CCG 18 5 0.49 528 CCCN{6}GGC 54 28 0.49 529 CCCN{6}CCG 29 11 0.48 530 CGCN{14}GCC. 26 9 0.47 531 CCGN{5}TCC 25 9 0.46 532 GCCN{6}GCC 55 28 0.46 533 CGGN{7}GGA 24 8 0.45 534 GGGN{6}GGA 87 52 0.44 535 GCCN{12}TCC 60 32 0.44 536 AGTN{16}CCG 17 5 0.44 537 GGCN{19}GCC 68 29 0.44 538 CCGN{3}CCG 22 7 0.44 539 CCCN{8}ACC 58 31 0.44 540 CAGN{15}GCC 77 44 0.44 541 CCCN{17}CGG 24 8 0.44 542 GCGN{I}CCA 22 7 0.44 543 CCCN{14}CAG 79 46 0.44 Número Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 566 CACN{20}CCG 21 7 0.37 567 ACGN{17}CAG 24 8 0.37 568 AGGN{I}CCC 60 32 0.37 569 CGTN{l2}CAC 20 6 0.37 570 CGGN{9}GGC 23 8 0.37 571 CGCN{IO}GCG 18 3 0.37 572 CCCN{6}CTC 80 .47 0.36 573 CCGN{IO}AGG 23 8 0.36 574 CCCN{18}CAG 79 46 0.36 575 AGCN{l7}CGG 21 7 0.36 576 AGCN{9}GCG 18 5 0.36 577 CCAN{3}GGC 62 34 0.36 578 CCCN{ll}GGC 57 30 0.35 579 ACGN{5}GCA 23 8 0.35 580 CCCN{14}CGG 23 8 0.35 581 CCCN{5}CCA 91 55 0.35 582 CCGN{l}AGG 22 7 0.34 583 GGGN{IO}GAC 45 22 0.34 584 CGC {15}CCA 20 6 0.34 585 CCTN{l9}CGC 22 7 0.34 586 CGTN{3}CGC 10 2 0.33 587 AGCN{14}CCG 21 7 0.33 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 632 GCGN{O}GCA 20 6 0.21 633 AGA {7}CCC 61 33 0.21 634 CGGN{2}CCA 21 7 0.21 635 CCCN{7}CCC 89 54 0.21 636 ACCN{4}GCG 15 4 0.2 637 CCTN{l5}CGC 20 6 0.2 638 AGCN{9}GTC 44 21 0.2 639 CCCN{18}CTC 74 43 0.2 640 CGCN{l8}CGA 9 1 0.19 641 CCCN{l5'}GCC 62 34 0.18 642 ACCN{II}GGC 45 22 0.18 643 AGGN{15}CGC 29 12 0.18 644 GCGM{O}CCA 27 10 0.18 645 GCGN{9}AGC 18 5 0.17 646 GGGN{18}GCA 59 32 0.17 647 CCCN{17}CAG 77 45 0.17 648 CCAM{8}CGG 22 8 0.16 649 CCGN{IO}GGC 21 7 0.16 650 GCA {O}GCC 76 44 0.16 651 CAGN{2}CGC 20 6 0.16 652 CGCN{8}GGC 19 6 0.16 653 CTGN{17}GGC 65 36 0.16 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 698 GCCN{13}CGC 22 8 0.06 699 GCGN{7}GGA 19 6 0.06 700 CAGN{14}CCA 94 58 0.06 701 CCGN{4}GTC 16 4 0.06 702 CCCN{l3}CGC 22 8 0.06 703 GCGN{l4}ACC 15 4 0.05 704 CAGN{20}GGG 81 49 0.05 705 CCGN{4}CCC 27 11 0.05 706 CGCN{5}GGC 18 6 0.05 707 CCTN{6}GGC 57 31 0.05 708 AGGN{3}GGC 67 38 0.05 709 CGGN{II}CGC 14 4 0.05 710 CTGN{18}GGA 77 46 0.04 711 CACN{l7}CCA 74 43 0.04 712 CGGN{3}GAG 22 8 0.04 713 CCCN{9}CCA 82 49 0.03 714 CCCN{I}ACG 18 6 0.03 715 CAGN{l}GCC 72 42 0.03 716 AGGN{6}CCG 23 8 0.03 717 AGCN{9}GGG 57 31 0.03 718 CCCN{7}GGC 54 29 0.02 719 CCTN{13}CCC 88 54 0.02 Numero Secuencia Presentación Presentación Coeficiente de observada Esperada importancia 720 CCG {19}TTC 20 7 0.02 721 CCCN{7}CCG 27 11 0.02 722 CGAN{6}GGC 17 5 0.01 723 CGGM{ }CTC 21 7 0.01 724 CGGN{O}CGC 13 3 0.01 725 CCTN{l3}ACG 19 6 0.01 726 GGGN{6}CAC 53 28 0.01 727 CCCN{16}CGC 21 7 0.01 728 CCCW{IO}CTC 76 45 0 729 CCCN{O}CAG 92 57 0 730 GCCN{5}CCC 65 37 0 Tabla 11. Elementos STAR candidatos probados por Análisis Discriminatorio Lineal Candidato STAR Ubicación1 Longitud T7 22gl2.3 -1200 T9 F 21q22.2 -1600 T9 R 22qll.22 ~1600 TIO F 7q22.2 -1300 TIO R 6ql4.1 -1300 Til F 17q23.3 -2000 Til R 16q23.1 -2000 T12 4pl5.1 -2100 T13 F 20pl3 -1700 T13 R lpl3.3 -1700 T14 R llq25 -1500 T17 , 2q31.3 WD T18 2q31.1 ND ^-La ubicación cromosomal se determina por búsqueda BLAT de los datos de secuencia de ADN de los elementos STAR contra la base de datos del genoma humano. La ubicación se da de conformidad con la nomemclatura estándar con referencia a el ideográma citogené ico de cada cromosoma; por ejemplo lp2.3 es la tercera sub-banda citogenética de la segunda banda citogenética de la extremidad corta del , cromosoma 1 (httpj //www. ncbi . nlm. nih . gov/Class/ LACourse/Genetics/chromba nding . html) . F, resultado de reacción de secuencia delantera; , resultado de reacción de secuencia inversa. Cuando los resultados de secuencia delanteros e inversos se raapean a diferentes ubicaciones genómícas, cada secuencia se extiende hasta la longitud completa del clon original (como se determina por el mapeo de restricción) con base en la información de secuencia de la base de datos del genoma humano . 2ND: No Determinado.
Tabla -12. Elementos STAR de arabidopsis de la invención, que incluye la ubicación y longitud del cromosoma. STAR Cromosoma Longitud, Kb Al I 1.2 A2 I 0.9 A3 I 0.9 A4 I 0.8 A5 I 1.3 A6 I 1.4 A7 II 1.2 A8 II 0.8 A9 II 0.9 A10 II 1.7 All II 1.9 A12 II 1.4 STAR Cromosoma Longitud, Kb Al3 II 1.2 A14 II 2.1 Al5 II 1.4 Al6 II 0.7 Al7 II 1.5 Al8 III 1.5 A19 III 0.7 A20 III 2.0 A21 IV 1.8 A22 IV 0.8 A23 IV 0.6 A24 IV 0.5 A25 V 0.9 A26 V 1.9 A27 V 1.1 A28 V 1.6 A29 V 0.9 A30 V 2.0 A31 V 2.0 A32 V 1.3 A33 V 0.9 A34 I 0.9 A35 II 1.1 Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (1)

  1. Reivindicaciones Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones . 1. Un método para seleccionar una secuencia de ADN con una cualidad moduladora de la transcripción de genes, caracterizado porque comprende suministrar un sistema de transcripción con una diversidad de vectores que comprenden fragmentos, los vectores comprenden además i) un elemento con una cualidad represora de la transcripción de genes y ii) un promotor que dirige la transcripción de un gen reportero, el método comprende además efectuar una etapa de selección en el sistema de transcripción, con objeto de identificar un fragmento que comprenda la secuencia de ADN con la cualidad moduladora de la transcripción de genes. 2. El método de conformidad con la reivindicación 1, caracterizado porque la secuencia de ADN comprende una cualidad moduladora de la transcripción de genes estables. 3. El método de conformidad con la reivindicación 1 o reivindicación 2, caracterizado porque la secuencia de ADN comprende una cualidad mej oradora de la transcripción de genes . 4. El método de conformidad con cualesquiera de las reivindicaciones 1-3, caracterizado porque el sistema de transcripción comprende células hospedadoras . 5. El método de conformidad con cualesquiera de las reivindicaciones 1-4, caracterizado porque el promotor puede estar activo en el sistema de transcripción, pero en donde la represión de la transcripción de genes en los vectores resulta en una cromatina represora de la transcripción de genes . 6. El método de conformidad con cualesquiera de las reivindicaciones anteriores, caracterizado porque la secuencia de ADN involucrada en la represión de la transcripción de genes, es una secuencia de ADN que se reconoce por un complejo de proteínas y en donde el sistema de transcripción comprende un complejo. 7. El método de conformidad con la reivindicación 5, caracterizado porque el complejo comprende un HPl de proteína de enlace a la heterocromatina, una proteína del grupo Policomb (Pc-G) , una actividad de desacetilasa histona o proteína de enlace de MeCP2 (metil-CpG) . 8. Un método de conformidad con cualesquiera de las reivindicaciones anteriores, caracterizado porque el vector es un vector que se replica e isomalmente . 9. El método de conformidad con cualesquiera de las reivindicaciones anteriores, caracterizado porque el vector comprende un origen de replicación del virus Epstein-Barr (EBV) , OriP, y un antígeno nuclear (????-1) . 10. Una secuencia de ADN que comprende i) una secuencia de ADN aislada de una planta o vertebrado o derivados del mismo, o ii) una secuencia de ADN sintética o una construida por medio de ingeniería genética, cuya secuencia de ADN es una secuencia inhibidora de la represión la cual por medio de un método de conformidad con cualesquiera de las reivindicaciones 1-9, se puede detectar, seleccionar y clonar opcionalmente . 11. Una secuencia de ADN caracterizada porque comprende i) una secuencia de ADN aislada de una planta o vertebrado o derivado del mismo, o ii) una secuencia sintética de ADN o una construida por medio de ingeniería genética, cuya secuencia de ADN se detecta, selecciona y clona opcionalmente por medio del método de conformidad de cualesquiera de las reivindicaciones 1 a 9. 12. Un método para identificar una secuencia de ADN con una cualidad represora de la transcripción de genes caracterizado porque comprende, suministrar una colección de ácidos nucleicos de prueba, generar una colección de vectores de expresión que comprende un ácido nucleico de prueba, y un primer gen reportero bajo el control transcripcional de un promotor, suministrar células con la colección de los vectores de expresión, seleccionar una célula o vector que contiene la progenie del mismo, en donde la transcripción del primer gen reportero se reprime, e identificar una ácido nucleico de prueba en la célula. 13. El método de conformidad con la reivindicación 12, caracterizado porque la secuencia de ADN comprende una cualidad de cromatina represora de la transcripción de genes. 14. El método de conformidad con la reivindicación 12 o reivindicación 13, caracterizado porque la secuencia de ADN comprende un elemento de respuesta del tipo del grupo de polycom . 15. El método de conformidad con cualesquiera de las reivindicaciones 12-14, caracterizado porque los vectores comprenden además un segundo gen reportero. 16. El método de conformidad con la reivindicación de cualesquiera de 12-15, caracterizado porque el sistema de transcripción comprende células. 17. El método de conformidad con la reivindicación 16 , caracterizado porque el gen reportero segundo se usa para seleccionar células que contienen vectores. 18. El método de conformidad con cualesquiera de las reivindicaciones 12-17, caracterizado porque los vectores comprenden además una secuencia de ADN con una cualidad moduladora de la transcripción de genes. 19. El método de conformidad con la reivindicación 18, caracterizado porque la secuencia de ADN comprende una cualidad moduladora de la transcripción estable de genes. 20. El método de conformidad con la reivindicación 18 o reivindicación 19, caracterizado porque la secuencia de ADN comprende una secuencia de conformidad con la reivindicación 10 o reivindicación 11. 21. El método de conformidad con cualesquiera de las reivindicaciones 18-20, caracterizado porque la secuencia de ADN al menos bloquea en parte la distribución de un efecto de represión de la transcripción de una secuencia de ADN con una cualidad represora de la transcripción de genes, presente en un lado de la secuencia de ADN en el vector. 22. El método de conformidad con la reivindicación 21, caracterizado porque la secuencia de ADN al menos en parte, inhibe una transcripción de genes reprimiendo el efecto de la transcripción del segundo gen reportero. 23. El método de conformidad con cualesquiera de las reivindicaciones 12-22, caracterizado porque el primer gen reportero comprende un gen suicida. 2 . El método de conformidad con cualesquiera de las reivindicaciones 12-23, caracterizado porque el segundo gen reportero comprende un gen reportero de selección dominante. 25. El método de conformidad con cualesquiera de las reivindicaciones 1-9 o 12-24, caracterizado porque el promotor comprende un promotor inducible. 26. Una secuencia de ADN caracterizada porque comprende una cualidad de represión de la transcripción de genes que se obtienen por un método de conformidad con cualesquiera de las reivindicaciones 12-25. 27. Una secuencia de ADN de conformidad con la reivindicación 26, caracterizada porque comprende una secuencia de acuerdo con la Tabla 4B, o un homólogo funcional del mismo. 28. El método de conformidad con cualesquiera de las reivindicaciones 1-9, caracterizado porque la secuencia de ADN con una cualidad represora de la transcripción de genes comprende una secuencia de ADN que se obtiene por un método de conformidad con cualesquiera de las reivindicaciones 12-25. 29. Un método para detectar la presencia de una secuencia de STAR dentro de una secuencia de ácido nucleico de alrededor de 50-5000 pares base, caracterizado porque comprende determinar la secuencia de ocurrencia en la secuencia de al menos un patrón de secuencias, y determinar que la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de al menos un patrón de secuencias en al menos una secuencia que comprende una secuencia STAR. 30. El método de conformidad con la reivindicación 29, caracterizado porque la etapa de determinar que la frecuencia de ocurrencia es representativa de la frecuencia de ocurrencia de al menos un patrón de secuencias en al menos una secuencia que comprende una secuencia STAR, comprende determinar que la frecuencia de ocurrencia de al menos un patrón de secuencias, difiere significati amente entre al menos una secuencia STAR y al menos una secuencia de control. 31. El método de conformidad con la reivindicación 30, caracterizado porque la frecuencia de ocurrencia de al menos un patrón de secuencia es significativamente superior en al menos una secuencia que comprende una secuencia STAR comparada con al menos una secuencia de control . 32. El método de conformidad con cualesquiera de las reivindicaciones 29-31, caracterizado porque al menos uno de los patrones se selecciona con base en una discriminación deseada y preferiblemente óptima entre al menos una secuencia que comprende una secuencia STAR y una secuencia de control . 33. El método de conformidad con cualesquiera de las reivindicaciones 30-32, caracterizado porque la secuencia de control comprende una secuencia aleatoria que comprende un contenido similar AT/CG como al menos una secuencia que comprende una secuencia STAR. 34. El método de conformidad con cualesquiera de las reivindicaciones 29-33, caracterizado porque al menos un patrón de secuencia comprende al menos 5 bases. 35. El método de conformidad con la reivindicación 34, caracterizado porque al menos un patrón de secuencia comprende al menos 6 bases . 36. El método de conformidad con cualesquiera de las reivindicaciones 29-35, caracterizado porque al menos un patrón de secuencia comprende un patrón- enlistado en la Tabla 9 y/o la Tabla 10. 37. El método de conformidad con cualesquiera de las reivindicaciones 29-36, caracterizado porque el patrón comprende al menos 8 bases . 38. El método de conformidad con cualesquiera de las reivindicaciones 29-37, caracterizado porque la ocurrencia es representativa de la frecuencia de ocurrencia de al menos un patrón de secuencias en al menos 2 secuencias que comprenden una secuencia STAR. 39. El método de conformidad con la reivindicación 38, caracterizado porque la ocurrencia es representativa de la frecuencia de ocurrencia de al menos un patrón de secuencias en al menos 5 secuencias que comprenden una secuencia STAR. 40. El método de conformidad con la reivindicación 39, caracterizado porque la ocurrencia es representativa de la frecuencia de ocurrencia de al menos un patrón de secuencias en al menos 10 secuencias que comprenden una secuencia STAR. 41. El método de conformidad con cualesquiera de las reivindicaciones 29-40, caracterizado porque la ocurrencia es representativa de la presencia de ocurrencia de al menos un patrón de secuencias en al menos 50 secuencias que comprenden un STAR. 42. El método de conformidad con cualesquiera de las reivindicaciones 29-41, caracterizado porque la secuencia comprenden una secuencia STAR que comprende al menos una de las secuencias detalladas en la figura 26. 43. El método de conformidad con la reivindicación 42, caracterizado porque las secuencias comprenden una secuencia STAR que comprende las secuencias detalladas en la figura 26. 44. El método de conformidad con cualesquiera de las reivindicaciones 29-43, caracterizado porque al menos un patrón de secuencias comprende un patrón de secuencias GGACCC, CCCTGC, AAGCCC, CCCCCA y/o AGCACC . 45. El método de conformidad con cualesquiera de las reivindicaciones 29-44, caracterizado porque al menos un patrón de secuencias comprende un patrón de secuencias CCC {16}AGC, GGCN{9}GAC, CACN{l3}AGG y/o CTGN{4 }GCC . 46. El método para detectar la presencia de una secuencia STAR dentro de una secuencia de ácido nucleico de alrededor de 50-5000 pares base, caracterizado porque comprende identificar una secuencia que comprende una secuencia STAR en una parte de un cromosoma de una célula de una especie y detectar una homología importante entre la secuencia y una secuencia de un cromosoma de especie diferente . 47. El método de conformidad con la reivindicación 46, caracterizado porque la especie comprende una especie de planta o de vertebrado, preferiblemente una especie de mamífero. 48. Un método para detectar la presencia de un elemento STAR dentro de una secuencia de ácido nucleico de alrededor de.50-5000 pares base de una especie vertebrada o de plantas, caracterizado" porque comprende identificar si uña secuencia de flanqueo de la secuencia de ácido nucleico se conserva en al menos otra especie. 49. Una secuencia STAR caracterizada porque se obtiene por un método de conformidad de cualesquiera de las reivindicaciones 1-9, 29-48. 50. Un método de conformidad con cualesquiera de las reivindicaciones 29-48, caracterizado porque al menos una secuencia que comprende una secuencia STAR es una secuencia STAR de conformidad con la reivindicación 49. 51. Una colección de secuencias STAR de conformidad con la reivindicación 49. 52. Un método para determinar si una secuencia de ácido nucleico de alrededor de 50-5000 pares base comprende una secuencia STAR, caracterizado porque comprende generar una primera tabla de patrones de secuencia que comprende la frecuencia de ocurrencia de los patrones en una colección de secuencias STAR de conformidad con la reivindicación 51, generar una segunda tabla de patrones que comprende la frecuencia . d§_ ocurrencia de los patrones en al menos una secuencia de referencia, seleccionar al menos un patrón del cual la frecuencia de ocurrencia difiere entre las dos tablas, determinar, dentro de la secuencia de ácido nucleico alrededor de 50-5000 pares base, la frecuencia de ocurrencia de al menos uno de los patrones seleccionados, y determinar si la frecuencia de ocurrencia en el ácido nucleico de prueba es representativa de la frecuencia de ocurrencia del patrón seleccionado en la colección de secuencias STAR. 53. El método de conformidad con cualesquiera de las reivindicaciones 29-48, 50 y 52, caracterizado porque comprende además determinar si la secuencia de ácido nucleico de alrededor de 50-5000 bases, comprende una cualidad moduladora de la transcripción de genes. 54. El método de conformidad con la reivindicación 53, caracterizado porque la cualidad moduladora de la transcripción de genes se determina usando un método de conformidad con cualesquiera de las reivindicaciones 1-9. 55. El método de conformidad con la reivindicación 52 o reivindicación 53, caracterizado porque la colección de STAR comprende la secuencia como se detalla en la figura 26. 56. Una secuencia aislada y/o recombinante de ácido nucleico caracterizado porque comprende una secuencia STAR que se obtiene por un método de conformidad con cualesquiera de las reivindicaciones 52-55. 57. Un constructo de ADN caracterizado porque se suministra con una secuencia de ADN de conformidad con la reivindicación 10, 11, 26, 27, 49 ó 56. 58. Un constructo de ADN caracterizado porque una secuencia de ADN de conformidad con la reivindicación 10, 11, 26, 27, 49 ó 56 ha sido modificada. 59. Un constructo de ADN de conformidad con la reivindicación 57 o reivindicación 58, caracterizado porque comprende un promotor ligado operativamente con un ácido nucleico de interés . 60. Un constructo de ADN de conformidad con la reivindicación 59, caracterizado porque la cantidad de actividad de una cualidad de la secuencia de ADN con una cualidad moduladora y/o represora de la transcripción de genes depende de la orientación de la secuencia de ADN del constrücto en comparación con el promotor. 61. Un constructo de ADN de conformidad con cualesquiera de las reivindicaciones 57-60 o una secuencia de ADN de conformidad con la reivindicación 10, 11, 26, 27, 49, o 56, caracterizado porque una cualidad represora y/o moduladora de la transcripción de genes depende de la presencia de una señal . 62. Un constructo o secuencia de ADN de conformidad con la reivindicación 61, caracterizado porque la señal comprende una proteína de enlace de ADN. 63. Un constructo o secuencia de ADN de conformidad con la reivindicación 61 o reivindicación 62, caracterizado porque la señal comprende una proteína TAT del virus de inmunodeficiencia humana. 64. El uso de un constructo o secuencia de ADN de conformidad con cualesquiera de las reivindicaciones 10, 11, 26, 27, 49, 56-63 para regular la transcripción de un ácido nucleico de interés . 65. Un método para la producción de un producto de genes en una célula que comprende generar un cásete de expresión que comprende un gen de interés y una secuencia de ADN o constructo de ADN de conformidad con cualesquiera de las reivindicaciones 10, 11, 26, 27, 49, 56-63, y que permite la transcripción del cásete de expresión en una célula. 66. El método de conformidad con la reivindicación 65, caracterizado porque la producción del producto de genes se induce . 67. Una colección de ácidos nucleicos aislados y/o recombinantes caracterizado porque comprende una cualidad moduladora de la transcripción de genes y/o una cualidad represora de la transcripción de genes. 68. Una colección de conformidad con la reivindicación 67, caracterizado porque los ácidos nucleicos comprenden la misma secuencia de consenso. 69. Una colección de conformidad con la reivindicación 67 o reivindicación 68, caracterizada porque la cualidad represora de la transcripción de genes comprende una cualidad para inducir la formación de la cromatina represora de la transcripción de genes. 70. Una colección de conformidad con cualesquiera de las reivindicaciones .67-69, caracterizado porque la cualidad moduladora de la transcripción de genes comprende una cualidad de transcripción estable. 71. Una colección de conformidad con la reivindicación 70, caracterizada porque la cualidad moduladora de la transcripción de genes comprende una cualidad para contrarrestar la formación de cromatina represora de la transcripción de genes . 72. Una colección de conformidad con cualesquiera de las reivindicaciones 67-71, caracterizada porque la cualidad moduladora de la transcripción de genes comprende una cualidad mejoradora de la transcripción. 73. Una colección de conformidad con cualesquiera de las reivindicaciones 67-72, caracterizada porque comprende esencialmente todas las secuencias de ADN con una cualidad moduladora de la transcripción dé genes de un cromosoma. 74. Una colección de conformidad con la reivindicación 73, caracterizada porque el cromosoma comprende un cromosoma de mamíferos o de plantas. 75. Una colección de conformidad con la reivindicación 74, caracterizada porque el cromosoma comprende un cromosoma humano . 76. Una colección de conformidad con cualesquiera de las reivindicaciones 73-75, caracterizada porque comprende esencialmente todas las secuencias de ADN con una cualidad moduladora de la transcripción de genes del ADN nuclear de una célula. 77. Un método para seleccionar una secuencia de ADN con una cualidad de modulación de la transcripción de genes caracterizado porque comprende suministrar un sistema de transcripción con una diversidad de vectores que comprenden un fragmento, los vectores comprenden i) un elemento con una cualidad moduladora de la transcripción de genes, e ii) una transcripción dirigida por el promotor de un gen reportero, el método comprende además efectuar una etapa de selección en el sistema de transcripción con objeto de identificar un fragmento que comprende una secuencia de ADN con la cualidad moduladora de la transcripción de genes.
MXPA03011801A 2001-07-04 2002-06-14 Secuencias de acido desoxirribonucleico (adn) que comprenden cualidades reguladoras de transcripcion de genes y metodos para deteccion y uso de secuencias de acido desoxirribonucleico (adn). MXPA03011801A (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP01202581A EP1273666A1 (en) 2001-07-04 2001-07-04 Method of selecting a DNA sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
US30319901P 2001-07-05 2001-07-05
PCT/NL2002/000390 WO2003004704A2 (en) 2001-07-04 2002-06-14 Method of selecting dna sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
US10/190,312 US7192741B2 (en) 2001-07-04 2002-07-05 DNA sequences comprising gene transcription regulatory qualities and methods for detecting and using such DNA sequences

Publications (1)

Publication Number Publication Date
MXPA03011801A true MXPA03011801A (es) 2005-03-07

Family

ID=47915807

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA03011801A MXPA03011801A (es) 2001-07-04 2002-06-14 Secuencias de acido desoxirribonucleico (adn) que comprenden cualidades reguladoras de transcripcion de genes y metodos para deteccion y uso de secuencias de acido desoxirribonucleico (adn).

Country Status (22)

Country Link
US (9) US7192741B2 (es)
EP (8) EP1806407B1 (es)
JP (3) JP4500044B2 (es)
KR (2) KR100942117B1 (es)
CN (1) CN1266282C (es)
AT (8) ATE466941T1 (es)
AU (3) AU2002314629B2 (es)
BR (1) BRPI0210771B8 (es)
CA (2) CA2812799C (es)
CY (1) CY1107678T1 (es)
DE (8) DE60236379D1 (es)
DK (8) DK1845162T3 (es)
ES (8) ES2285630T3 (es)
HK (1) HK1068652A1 (es)
IL (4) IL159674A0 (es)
MX (1) MXPA03011801A (es)
NO (1) NO338477B1 (es)
NZ (1) NZ530218A (es)
PT (1) PT1600510E (es)
SG (1) SG143066A1 (es)
WO (1) WO2003004704A2 (es)
ZA (1) ZA200309599B (es)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE466941T1 (de) 2001-07-04 2010-05-15 Chromagenics Bv Dns-sequenzen mit anti-repressor-aktivität
ATE500331T1 (de) 2002-06-14 2011-03-15 Chromagenics Bv Verfahren zur gleichzeitigen herstellung von multiplen proteinen; vektoren und zellen, die hierfür verwendung finden
WO2003106674A2 (en) * 2002-06-14 2003-12-24 Chromagenics B.V. Means and methods for regulating gene expression
USRE47770E1 (en) 2002-07-18 2019-12-17 Merus N.V. Recombinant production of mixtures of antibodies
JP4836451B2 (ja) 2002-07-18 2011-12-14 メルス ベー ヴェー 抗体混合物の組換え生産
DK1573058T3 (da) 2002-12-18 2012-01-16 Chromagenics Bv Fremgangsmåde til forbedring af proteinproduktion
WO2004056986A2 (en) 2002-12-20 2004-07-08 Chromagenics B.V. Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors
WO2004106375A1 (en) 2003-05-30 2004-12-09 Merus Biopharmaceuticals B.V. I.O. Fab library for the preparation of anti vegf and anti rabies virus fabs
US20100069614A1 (en) 2008-06-27 2010-03-18 Merus B.V. Antibody producing non-human mammals
DK1670925T3 (da) 2003-10-02 2013-07-08 Crucell Holland Bv Pakningsceller til rekombinat adenovirus
WO2005059149A2 (en) * 2003-12-12 2005-06-30 Chromagenics B.V. Improved protein production
AU2005205412B2 (en) 2004-01-20 2011-08-11 Merus N.V. Mixtures of binding proteins
NZ551510A (en) * 2004-07-08 2009-10-30 Chromagenics Bv Anti-repressor sequences for improving expression of nucleic acid
EP1786908B1 (en) * 2004-08-18 2010-03-03 Bayer CropScience AG Plants with increased plastidic activity of r3 starch-phosphorylating enzyme
US20060195935A1 (en) 2004-11-08 2006-08-31 Chromagenics B.V. Selection of host cells expressing protein at high levels
US20060172382A1 (en) 2004-11-08 2006-08-03 Chromagenics B.V. Selection of host cells expressing protein at high levels
US8039230B2 (en) 2004-11-08 2011-10-18 Chromagenics B.V. Selection of host cells expressing protein at high levels
MX2007004595A (es) * 2004-11-08 2007-08-15 Chromagenics Bv Seleccion de celulas hospederas que expresan proteinas en altas concentraciones.
US20100136616A1 (en) * 2004-11-08 2010-06-03 Chromagenics B.V. Selection of Host Cells Expressing Protein at High Levels
US8999667B2 (en) 2004-11-08 2015-04-07 Chromagenics B.V. Selection of host cells expressing protein at high levels
JP5098014B2 (ja) * 2004-11-18 2012-12-12 国立大学法人広島大学 遺伝子増幅により形成された反復配列から、発現抑制されているタンパク質を発現させる方法、キット、および形質転換体
US7968700B2 (en) 2006-03-20 2011-06-28 Chromagenics B.V. Expression augmenting DNA fragments, use thereof, and methods for finding thereof
US20080124760A1 (en) 2006-07-26 2008-05-29 Barbara Enenkel Regulatory Nucleic Acid Elements
US20090142805A1 (en) * 2007-01-08 2009-06-04 Millipore Corporation High expression cell line that eliminates gene amplification
US9284563B2 (en) 2009-06-15 2016-03-15 Cellagenics B.V. Stringent selectable markers
US8566596B2 (en) 2010-08-24 2013-10-22 Cisco Technology, Inc. Pre-association mechanism to provide detailed description of wireless services
WO2012030218A1 (en) 2010-09-01 2012-03-08 Cellagenics B.V. Nucleic acid fragments from a ribosomal protein promoter for enhancing gene expression
PT2838917T (pt) 2012-04-20 2019-09-12 Merus Nv Métodos e meios para a produção de moléculas similares a ig heterodiméricas
EP2869845B1 (en) 2012-07-06 2019-08-28 Genmab B.V. Dimeric protein with triple mutations
DK2900694T3 (en) 2012-09-27 2018-11-19 Merus Nv BISPECIFIC IGG ANTIBODIES AS T-CELL ACTIVATORS
US10417380B1 (en) 2013-12-31 2019-09-17 Mckesson Corporation Systems and methods for determining and communicating a prescription benefit coverage denial to a prescriber
US10489552B2 (en) 2014-02-14 2019-11-26 Mckesson Corporation Systems and methods for determining and communicating patient incentive information to a prescriber
WO2015130173A1 (en) 2014-02-28 2015-09-03 Merus B.V. Antibody that binds erbb-2 and erbb-3
NZ724013A (en) 2014-02-28 2019-11-29 Merus Nv Antibodies that bind egfr and erbb3
US10157262B1 (en) 2015-03-10 2018-12-18 Mckesson Corporation Systems and methods for determining patient financial responsibility for multiple prescription products
AU2016293942B2 (en) 2015-07-10 2022-06-16 Merus N.V. Human CD3 binding antibody
KR20180100305A (ko) 2015-10-23 2018-09-10 메뤼스 엔.페. 암 성장을 억제하는 결합 분자
US11514137B1 (en) 2016-03-30 2022-11-29 Mckesson Corporation Alternative therapy identification system
US10999224B1 (en) 2017-02-01 2021-05-04 Mckesson Corporation Method and apparatus for parsing an electronic message and constructing multiple differently prioritized messages therefrom
CA3058343A1 (en) 2017-03-31 2018-10-04 Merus N.V. Erbb-2 and erbb-3 binding bispecific antibodies for use in the treatment of cells that have an nrg1 fusion gene
BR112020002695A2 (pt) 2017-08-09 2020-08-25 Merus N.V. anticorpos que se ligam à egfr e cmet
US10862832B1 (en) 2018-07-24 2020-12-08 Mckesson Corporation Computing system and method for automatically reversing an action indicated by an electronic message
US11043437B2 (en) 2019-01-07 2021-06-22 Applied Materials, Inc. Transparent substrate with light blocking edge exclusion zone
US11636548B1 (en) 2019-06-26 2023-04-25 Mckesson Corporation Method, apparatus, and computer program product for providing estimated prescription costs
US11562437B1 (en) 2019-06-26 2023-01-24 Mckesson Corporation Method, apparatus, and computer program product for providing estimated prescription costs
EP3772518A1 (en) 2019-08-07 2021-02-10 Merus N.V. Modified human variable domains
WO2021155369A1 (en) * 2020-01-31 2021-08-05 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods to identify genetic silencers and applications thereof
US11610240B1 (en) 2020-02-17 2023-03-21 Mckesson Corporation Method, apparatus, and computer program product for partitioning prescription transaction costs in an electronic prescription transaction
CN116462766A (zh) 2020-05-21 2023-07-21 美勒斯公司 用于生产ig样分子的方法和手段
US11587657B2 (en) 2020-09-04 2023-02-21 Mckesson Corporation Method, apparatus, and computer program product for performing an alternative evaluation procedure in response to an electronic message
CN113539357B (zh) * 2021-06-10 2024-04-30 阿里巴巴达摩院(杭州)科技有限公司 基因检测方法、模型训练方法、装置、设备及系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US719271A (en) * 1902-01-13 1903-01-27 Solomon P Smith Furnace.
US5610053A (en) 1993-04-07 1997-03-11 The United States Of America As Represented By The Department Of Health And Human Services DNA sequence which acts as a chromatin insulator element to protect expressed genes from cis-acting regulatory sequences in mammalian cells
US5972605A (en) * 1994-07-07 1999-10-26 Geron Corporation Assays for regulators of mammalian telomerase expression
WO1996030522A1 (fr) * 1995-03-24 1996-10-03 Shionogi & Co., Ltd. Molecule d'adn relative a la suppression d'une expression genique et nouvelle proteine
DE19539493A1 (de) * 1995-10-24 1997-04-30 Thomae Gmbh Dr K Starker homologer Promotor aus Hamster
US5773695A (en) 1996-01-26 1998-06-30 North Carolina State University Plant nuclear scaffold attachment region and method for increasing gene expression in transgenic cells
US6037525A (en) * 1996-08-01 2000-03-14 North Carolina State University Method for reducing expression variability of transgenes in plant cells
US5888809A (en) 1997-05-01 1999-03-30 Icos Corporation Hamster EF-1α transcriptional regulatory DNA
WO2000005393A2 (en) 1998-07-21 2000-02-03 Cobra Therapeutics Limited A polynucleotide comprising a ubiquitous chromatin opening element (ucoe)
DK1104490T3 (da) 1998-08-14 2008-01-02 Chromagenics Bv Fremgangsmåde til påvisning af en DNA-sekvens, DNA-sekvens, fremgangsmåde til fremstilling af en DNA-konstruktion samt anvendelse deraf
US6800457B2 (en) 1998-09-22 2004-10-05 Bristol-Myers Squibb Company Expression vectors containing hot spot for increased recombinant protein expression in transfected cells
US6521419B1 (en) 1998-09-22 2003-02-18 Kanakaraju Koduri Expression vectors containing hot spot for increased recombinant protein expression in transfected cells
US6395549B1 (en) 1998-10-22 2002-05-28 Medical College Of Georgia Research Institute, Inc. Long terminal repeat, enhancer, and insulator sequences for use in recombinant vectors
AU784506B2 (en) * 1999-08-25 2006-04-13 Immunex Corporation Compositions and methods for improved cell culture
EP1263950A2 (en) 2000-02-11 2002-12-11 Millennium Pharmaceuticals, Inc. Seven-transmembrane proteins/g-protein coupled receptors
US6586205B1 (en) 2000-02-11 2003-07-01 Millennium Pharmaceuticals, Inc. 43239 a novel GPCR-like molecule and uses thereof
AU9006701A (en) 2000-09-20 2002-04-02 Cobra Therapeutics Ltd Polynucleotide
ATE466941T1 (de) 2001-07-04 2010-05-15 Chromagenics Bv Dns-sequenzen mit anti-repressor-aktivität
EP1273666A1 (en) 2001-07-04 2003-01-08 Chromagenics B.V. Method of selecting a DNA sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
WO2003106674A2 (en) * 2002-06-14 2003-12-24 Chromagenics B.V. Means and methods for regulating gene expression
ATE500331T1 (de) * 2002-06-14 2011-03-15 Chromagenics Bv Verfahren zur gleichzeitigen herstellung von multiplen proteinen; vektoren und zellen, die hierfür verwendung finden
DK1573058T3 (da) 2002-12-18 2012-01-16 Chromagenics Bv Fremgangsmåde til forbedring af proteinproduktion
WO2004056986A2 (en) 2002-12-20 2004-07-08 Chromagenics B.V. Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors

Also Published As

Publication number Publication date
ES2274045T3 (es) 2007-05-16
US20070037256A1 (en) 2007-02-15
DE60236332D1 (de) 2010-06-17
ATE358183T1 (de) 2007-04-15
KR100942117B1 (ko) 2010-02-12
AU2007234619A1 (en) 2007-12-13
ES2344073T3 (es) 2010-08-17
ES2344070T3 (es) 2010-08-17
EP1404872B1 (en) 2006-10-18
BRPI0210771B1 (pt) 2015-12-22
US7736870B2 (en) 2010-06-15
US20070128717A1 (en) 2007-06-07
US7736868B2 (en) 2010-06-15
NO20040011L (no) 2004-03-03
NZ530218A (en) 2005-09-30
DE60236333D1 (de) 2010-06-17
IL193373A (en) 2010-12-30
ATE474053T1 (de) 2010-07-15
JP2004533262A (ja) 2004-11-04
IL193374A (en) 2010-12-30
DK1829971T3 (da) 2010-08-16
PT1600510E (pt) 2007-06-25
CY1107678T1 (el) 2013-04-18
DE60215502T2 (de) 2007-08-30
ES2348174T3 (es) 2010-11-30
DK1600510T3 (da) 2007-06-25
EP1808488A3 (en) 2007-11-14
US7951586B2 (en) 2011-05-31
SG143066A1 (en) 2008-06-27
IL159674A0 (en) 2004-06-20
CA2812799C (en) 2016-01-26
JP5014444B2 (ja) 2012-08-29
CN1266282C (zh) 2006-07-26
EP1829972A2 (en) 2007-09-05
EP1829971A1 (en) 2007-09-05
KR100942116B1 (ko) 2010-02-12
EP1806407B1 (en) 2010-05-05
DK1806407T3 (da) 2010-08-16
ES2344072T3 (es) 2010-08-17
US20070031934A1 (en) 2007-02-08
DE60219221D1 (de) 2007-05-10
EP1829972B1 (en) 2010-05-12
US7655441B2 (en) 2010-02-02
DE60236334D1 (de) 2010-06-17
EP1845162A1 (en) 2007-10-17
DK1842919T3 (da) 2010-08-16
DE60236379D1 (de) 2010-06-24
EP1842919A1 (en) 2007-10-10
EP1842919B1 (en) 2010-05-05
WO2003004704A3 (en) 2003-10-16
AU2011202193B2 (en) 2011-09-29
US20070031936A1 (en) 2007-02-08
CA2450020A1 (en) 2003-01-16
US7749733B2 (en) 2010-07-06
KR20090037485A (ko) 2009-04-15
BRPI0210771B8 (pt) 2021-05-25
US20070031933A1 (en) 2007-02-08
US20030199468A1 (en) 2003-10-23
DE60219221T2 (de) 2008-01-03
ATE343004T1 (de) 2006-11-15
ATE466941T1 (de) 2010-05-15
EP1845162B1 (en) 2010-05-05
US20070031935A1 (en) 2007-02-08
ATE466942T1 (de) 2010-05-15
ATE466943T1 (de) 2010-05-15
BR0210771A (pt) 2004-07-13
EP1808488B1 (en) 2010-07-14
ES2344071T3 (es) 2010-08-17
DK1829972T3 (da) 2010-09-13
ZA200309599B (en) 2006-05-31
US7192741B2 (en) 2007-03-20
IL159674A (en) 2009-02-11
DE60215502D1 (de) 2006-11-30
EP1404872A2 (en) 2004-04-07
JP2010131024A (ja) 2010-06-17
JP5014443B2 (ja) 2012-08-29
AU2011202193A1 (en) 2011-06-02
EP1806407A2 (en) 2007-07-11
ATE467682T1 (de) 2010-05-15
US20070026499A1 (en) 2007-02-01
DE60237048D1 (de) 2010-08-26
CA2812799A1 (en) 2003-01-16
WO2003004704A2 (en) 2003-01-16
US7736869B2 (en) 2010-06-15
CA2450020C (en) 2013-08-13
DK1845162T3 (da) 2010-08-16
US20070026498A1 (en) 2007-02-01
EP1829972A3 (en) 2007-10-24
ATE466944T1 (de) 2010-05-15
KR20090037960A (ko) 2009-04-16
US7659094B2 (en) 2010-02-09
EP1808488A2 (en) 2007-07-18
DK1808488T3 (da) 2010-10-18
EP1600510A2 (en) 2005-11-30
ES2285630T3 (es) 2007-11-16
CN1524128A (zh) 2004-08-25
EP1600510A3 (en) 2006-02-22
EP1829971B1 (en) 2010-05-05
EP1600510B1 (en) 2007-03-28
JP4500044B2 (ja) 2010-07-14
JP2010131025A (ja) 2010-06-17
HK1068652A1 (en) 2005-04-29
DE60236331D1 (de) 2010-06-17
ES2344074T3 (es) 2010-08-17
NO338477B1 (no) 2016-08-22
EP1829971A3 (en) 2008-06-04
US7662591B2 (en) 2010-02-16
EP1806407A3 (en) 2008-06-04
DK1404872T3 (da) 2007-02-19
AU2007234619B2 (en) 2011-06-02
AU2002314629B2 (en) 2007-08-30

Similar Documents

Publication Publication Date Title
US7192741B2 (en) DNA sequences comprising gene transcription regulatory qualities and methods for detecting and using such DNA sequences
AU2002314629A1 (en) Method of selecting DNA sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
JP2004533262A5 (es)
CA2812821C (en) Dna sequences comprising gene transcription regulatory qualities and methods for detecting and using such dna sequences

Legal Events

Date Code Title Description
FG Grant or registration