ES2383006T3 - Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz - Google Patents

Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz Download PDF

Info

Publication number
ES2383006T3
ES2383006T3 ES08153753T ES08153753T ES2383006T3 ES 2383006 T3 ES2383006 T3 ES 2383006T3 ES 08153753 T ES08153753 T ES 08153753T ES 08153753 T ES08153753 T ES 08153753T ES 2383006 T3 ES2383006 T3 ES 2383006T3
Authority
ES
Spain
Prior art keywords
mar
dna
chromosome
sequence
genomic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08153753T
Other languages
English (en)
Inventor
Nicolas Mermod
Pierre Alain Girod
Philipp Bucher
Duc-Quang Nguyen
David Calabrese
Damien Saugy
Stefania Puttini
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Selexis SA
Original Assignee
Selexis SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Selexis SA filed Critical Selexis SA
Application granted granted Critical
Publication of ES2383006T3 publication Critical patent/ES2383006T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Una secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas, caracterizada porque dicha secuencia de DNA comprende: a) al menos un elemento de DNA curvado, en donde el elemento de DNA curvado contiene al menos 33% del dinucleótido TA y/o al menos 33% del dinucleótido AT en un tramo de 100 pares de bases contiguos, b) al menos un sitio de unión para una proteína de unión a DNA, y porque es una secuencia de nucleótidos de MAR que tiene la secuencia SEQ ID No 25, o una de sus secuencias complementarias, o una secuencia que tiene una identidad de al menos 90% con dicha secuencia SEQ ID No 25.

Description

Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz.
CAMPO DE LA INVENCIÓN
La presente invención se refiere a secuencias de DNA aisladas y purificadas que tienen una actividad que aumenta la producción de proteínas y más específicamente al uso de regiones de fijación a la matriz (abreviadamente en lo sucesivo MAR1 por la expresión inglesa Matrix Attachment Regions) para aumentar la actividad de producción de proteínas en una célula eucariótica. También se describe un método para la identificación de dichas regiones activas, en particular secuencias de nucleótidos de MAR y el uso de estas secuencias de MAR activas caracterizadas en un nuevo método de transfección múltiple.
ANTECEDENTES DE LA INVENCIÓN
Actualmente, el modelo de organización de dominios en bucle de cromosomas eucarióticos está muy aceptado (Boulikas T, "Nature of DNA sequences at the attachment regions of genes to the nuclear matrix", J. Cell Biochem.,
52: 14-22, 1993). De acuerdo con este modelo la cromatina se organiza en bucles que abarcan 50-100 kb fijados a la matriz nuclear, un retículo proteínico constituido por ribonucleoproteínas (RNP) y otras proteínas no histónicas (Bode J, Stengert-Iber M, Kay V, Schalke T and Dietz-Pfeilstetter A, Crit. Rev. Euk. Gene Exp., 6:115-138, 1996).
Las regiones de DNA fijadas a la matriz nuclear se denominan SAR (por la expresión inglesa Scaffold Attachment Region) o MAR, para regiones de fijación al armazón (durante la metafase) o a la matriz (interfase), respectivamente (Hart C and Laemmli U.(1998), "Facilitation of chromatin dynamics by SARs", Curr. Opin. Genet. Dev. 8, 519-525.)
En este sentido, dichas regiones pueden definir los límites de los dominios de cromatina independientes, de tal modo que sólo los elementos cis-reguladores envolventes controlan la expresión de los genes en el dominio.
Sin embargo, su capacidad para proteger completamente un locus cromosómico de elementos de cromatina cercanos y por consiguiente conferirles una expresión génica independiente de la posición, no ha sido observada en las células establemente transfectadas (Poljak L, Seum C, Mattioni T and Laemmli U. (1994) "SARs stimulate but do not confer position independent gene expression", Nucleic Acids Res 22, 4386-4394). Por otro lado, se ha demostrado que las secuencias de MAR (o S/MAR) interaccionan con potenciadores para aumentar la accesibilidad a la cromatina local (Jenuwein T, Forrester W, Fernandez-Herrero L, Laible G, Dull M, and Grosschedl R. (1997) "Extension of chromatin accessibility by nuclear matrix attachment regions", Nature, 385, 269-272). Específicamente, los elementos de MAR pueden potenciar la expresión de genes heterólogos en líneas de cultivos celulares (Kalos M and Fournier R (1995) "Position-independent transgene expression mediated by boundary elements from the apolipoprotein B chromatin domain", Mol. Cell Biol., 15,198-207), ratones transgénicos (Castilla J, Pintado B, Sola I, Sánchez-Morgado J, and Enjuanes L(1998) "Engineering passive immunity in transgenic mice secreting virus-neutralizing antibodies in milk", Nat. Biotechnol., 16, 349-354) y vegetales (Allen G, Hall GJ, Michalowski S, Newman W, Spiker S, Weissinger A, and Thompson W (1996), "High-level transgene expression in plant cells: effects of a strong scaffold attachment region from tobacco", Plant Cell 8, 899-913). Se reconoce también la utilidad de las secuencias de MAR para desarrollar vectores mejorados para terapia génica (Agarwal M, Austin T, Morel F, Chen J, Bohnlein E, and Plavec I (1998), "Scaffold attachment region-mediated enhancement of retroviral vector expression in primary T cells", J. Virol 72, 3720-3728).
Recientemente, se ha demostrado que las secuencias modificadoras de la estructura de la cromatina que incluyen las MAR, como ha sido ilustrado por la MAR en el extremo 5’ de lisozima de pollo, son capaces de potenciar significativamente la expresión de genes indicadores en mezclas de células de ovario de hámster chino (abreviadamente CHO, por la expresión inglesa Chinese Hamster Ovary) (Zahn-Zabal M, et al., "Development of stable cell lines for production or regulated expression using matrix attachment regions", J. Biotechnol, 2001, 87(1): p. 29-42). Esta propiedad se utilizó para aumentar la proporción de clones de alta producción, reduciendo así el número de clones que necesitan ser cribados. Estos beneficios se han observado tanto en construcciones con las MAR que flanquean la casete de expresión transgénica, como cuando las construcciones son co-transfectadas con las MAR en un plásmido separado. Sin embargo, los niveles de expresión en la co-transfección conjunta con las MAR no eran tan elevados como los observados para una construcción en la que dos MAR delimitan la unidad de expresión transgénica. Se mostró un tercer proceso preferido que era la transfección de transgenes con las MAR tanto unidas al transgén como en un plásmido separado (Girod et al., pendiente de publicación). Sin embargo, una limitación persistente de esta técnica es la cantidad de DNA que puede ser transfectada por célula. Se han desarrollado muchos protocolos de transfecciones múltiples con el fin de conseguir una alta eficacia de transfección para caracterizar la función de los genes de interés. El protocolo aplicado por Yamamoto et al., 1999 ("High efficiency gene transfer by multiple transfection protocol", Histochem. J. 31 (4), 241-243) conduce a una eficacia de transfección de aproximadamente 80% después de 5 eventos de transfección, mientras que el protocolo de transfección convencional sólo consiguió una tasa <40%. Aunque esta técnica puede ser útil si se desea aumentar la proporción de células que se expresan, no conduce a células con una mayor productividad intrínseca. Por consiguiente, no se puede emplear para generar líneas de células monoclonales altamente productoras. Por lo tanto, la técnica anteriormente descrita tiene dos in
Las abreviaturas empleadas en este texto se refieren tanto al singular como al plural, por ejemplo MAR significa tanto región como regiones de fijación a la matriz. En español el plural es inequívoco debido al artículo y/o adjetivo que precede o sigue a las abreviaturas (N. del T.)
convenientes principales:
i) esta técnica no genera una población homogénea de células transfectadas, puesto que no puede favorecer la
integración de más copias de genes ni dirigir los transgenes a loci cromosómicos favorables, ii) el uso del mismo marcador seleccionable en múltiples eventos de transfección no permite la selección de células
doble o triplemente transfectadas.
En la solicitud de patente WO02/074969, también se ha demostrado la utilidad de las MAR para el desarrollo de líneas de células eucarióticas estables. Sin embargo, esta solicitud no describe ni la homología conservada del elemento DNA de la MAR ni ninguna técnica para predecir la capacidad de una secuencia de DNA para ser una secuencia de MAR.
En efecto, no se ha encontrado ninguna secuencia de consenso neta de MAR (Boulikas T, "Nature of DNA sequences at the attachment regions of genes to the nuclear matrix", J. Cell Biochem., 52:14-22, 1993) sino que por evolución, parece que la estructura de estas secuencias se conserva funcionalmente en genomas eucarióticos, puesto que las MAR de animales se pueden unir a los armazones nucleares de vegetales y viceversa (Mielke C, Kohwi Y, Kohwi-Shigematsu T and Bode J, "Hierarchical binding of DNA fragments derived from scaffold-attached regions: correlation of properties in vitro and function in vivo", Biochemistry, 29:7475-7485, 1990).
La identificación de las MAR por estudios bioquímicos es un proceso largo e impredecible; se pueden obtener diferentes resultados dependiendo del ensayo (Razin SV, "Functional architecture of chromosomal DNA domains", Crit. Rev. Eukaryot. Gene Expr., 6:247-269, 1996). Considerando el enorme número esperado de MAR en un genoma eucariótico y la cantidad de secuencias obtenidas de los proyectos del genoma, sería de gran utilidad una herramienta capaz de filtrar las MAR potenciales con el fin de realizar experimentos específicos.
Actualmente, están disponibles en Internet dos herramientas diferentes de predicción para las MAR. La primera, el programa informático MAR-Finder (http: //futuresoflorg/MarFinder; Singh GB, Kramer JA and Krawetz SA, "Mathematical model to predict regions of chromatin attachment to the nuclear matrix". Nucleic Acid Research, 25:1419-1425, 1997) se basa en un conjunto identificado de patrones en las diversas MAR y un análisis estadístico de la coexistencia de estos patrones. Las predicciones por el programa MAR-Finder dependen del contexto de la secuencia, lo que significa que las MAR predichas dependen del contexto de la secuencia analizada. El otro programa informático de predicción, el programa SMARTest, (hftp://www. genomatix.de; Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold/matrix attachment regions in large genomic sequences", Genome Research, 12:349-354, 2001), usa matrices ponderadas derivadas de las MAR identificadas experimentalmente. Se dice que el programa SMARTest es adecuado para realizar análisis a gran escala. Pero realmente, además de su especificidad relativamente baja, la cantidad de MAR hipotéticas aumenta enormemente cuando se realiza con él un análisis a gran escala y no habiendo modo de aumentar su especificidad para restringir el número de MAR hipotéticas, el programa SMARTest es casi inútil para cribar potentes MAR a partir de secuencias grandes de DNA.
También existen algunos otros programas informáticos, no disponibles en Internet; se basan también en la frecuencia de restos de MAR (MRS criterion; Van Drunen CM et al., "A bipartite sequence element associated with matrix/scaffold attachment regions", Nucleic Acids Res, 27: 2924-2930, 1999), (ChrClass; Glazko GV et al., "Comparative study and prediction of DNA fragments associated with various elements of the nuclear matrix", Biochim. Biophys. Acta, 1517:351-356, 2001) o se basan en la identificación de sitios de dúplex de DNA inducidos por estrés (abreviadamente SIDD por la expresión inglesa Stress-Induced DNA Duplex); Benham C and al., "Stress-induced duplex DNA destabilization in scaffold/matrix attachment regions", J. Mol. Biol., 274:181-196, 1997). Sin embargo, no se conoce su idoneidad para analizar secuencias completas del genoma y no se ha informado sobre si estas herramientas pueden permitir la identificación de secuencias que aumenten la producción de proteínas.
Además, debido a la especificidad relativamente baja de estos programas informáticos (Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold/matrix attachment regions in large genomic sequences", Genome Research, 12: 349-354, 2001), la cantidad de MAR hipotéticas identificadas en genomas las hace rápidamente inmanejables cuando se realizan análisis a gran escala, especialmente si la mayoría de ellas tienen poca o ninguna actividad en la práctica. Por tanto, no teniendo modo de aumentar la especificidad de predicción para restringir el número de MAR hipotéticas, muchos de los programas disponibles son prácticamente inútiles para identificar elementos genéticos potentes en vista del aumento eficaz de la producción de proteínas recombinantes.
Puesto que todos los métodos de predicción disponibles anteriores tienen algunos inconvenientes que impiden el análisis a gran escala de genomas para identificar con certeza nuevas y potentes MAR, el objeto de esta descripción es: 1) comprender las características funcionales de las MAR que permitan mejorar la expresión de proteínas recombinantes; 2) conseguir un nueva herramienta bioinformática que compile las características estructurales de las MAR como predicción de su función, con el fin de 3) realizar análisis a gran escala de genomas para identificar nuevas y más potentes MAR y, finalmente 4) demostrar mejor eficacia para aumentar la producción de proteínas recombinantes a partir de células u organismos eucarióticos cuando se utilizan las secuencias de MAR recientemente identificadas.
SUMARIO DE LA INVENCIÓN
Un objeto de la invención es aumentar la producción de proteínas recombinantes a partir de células u organismos eucarióticos utilizando una secuencia de DNA que tenga una actividad que aumente la producción de proteínas.
Otro objeto de la invención es proporcionar un método de transfecciones múltiples para aumentar la producción de proteínas recombinantes en células eucarióticas.
Estos objetos se consiguen por una secuencia de DNA aislada y purificada, por el uso de dicha secuencia de DNA aislada y purificada, por un método para transfectar una célula hospedante eucariótica, por un proceso para la producción de una proteína, por una célula hospedante eucariótica transfectada, por una mezcla o kit para transfección celular y por un organismo transgénico no humano, de acuerdo con las reivindicaciones independientes.
BREVE DESCRIPCIÓN DE LAS FIGURAS
La Fig. 1 muestra gráficas de distribución de las secuencias de MAR y que no son MAR. Los histogramas son gráficas de densidad (frecuencia relativa dividida por la anchura del rectángulo) con relación a la puntuación del parámetro observado. El histograma de densidad de las MAR humanas en la base de datos SMARt DB se muestra en negro, mientras que el histograma de densidad del cromosoma 22 humano está en gris.
La Fig. 2 muestra diagramas de dispersión de los cuatro criterios diferentes usados por el programa SMAR Scan® y el contenido de AT con las MAR humanas de la SMARt DB.
La Fig. 3 muestra las gráficas de distribución de las secuencias de las MAR por organismo. Las secuencias de las MAR de la SMARt DB de otros organismos fueron recuperadas y analizadas. Se representan conjuntamente las distribuciones de densidad de las secuencias de las MAR en ratón, pollo, sorgo bicolor y ser humano.
La Fig. 4 muestra las predicciones por el programa SMAR Scan® del cromosoma 22 humano y del cromosoma 22 barajado. Gráfica superior: número medio de coincidencias2 obtenidas por el programa SMAR Scan® con cinco cromosomas: “rubbled”, “scrambled”3, barajados en ventanas no solapantes de 10 pb, modelo de cadenas de Markov de orden 1 y con el cromosoma 22 natural. Gráfica inferior: número medio de MAR predichas por el programa SMAR Scan® en cinco cromosomas: “rubbled”, “scrambled”, barajados en ventanas no solapantes de 10 pb, modelo de cadenas de Markov de orden 1 y con el cromosoma 22 natural.
La Fig. 5 muestra la disección de la capacidad del gen de la lisozima de pollo 5’-MAR para estimular la expresión transgénica en células CHO-DG44. Los fragmentos B, K y F muestran la mayor capacidad para estimular la expresión transgénica. La resistencia relativa indicada de los elementos se basó en el número de células de alta actividad de expresión.
La Fig. 6 muestra el efecto de las deleciones en serie del extremo 5’ (parte superior) y del extremo 3’ (parte inferior) de la 5’- MAR sobre la pérdida de capacidad para estimular la expresión transgénica. La transición desde el aumento de actividad hasta la disminución de actividad coincide con los fragmentos B, K y F.
La Fig. 7 muestra qué porciones del fragmento F estimulan significativamente la expresión transgénica. Las regiones del fragmento F indicadas por la flecha gris clara fueron multimerizadas, insertadas en pGEGFP Control y transfectadas en células de CHO. El elemento que exhibe la mayor actividad está situado en la parte central del elemento y corresponde al fragmento FIll (MAR mínima indicada por la barra negra). Además, una actividad potenciadora se localiza en la parte flanqueante 3’ del fragmento FIll (potenciador de MAR indicado por la barra gris oscura).
La Fig. 8 muestra un mapa de localizaciones de diversos restos de secuencias de DNA en cLysMAR. La Fig. 8 (B) representa un mapa de localizaciones de diversos restos de secuencias de DNA en cLysMAR. Las líneas verticales representan la posición de los sitios o restos de secuencias predichos por ordenador a lo largo de los 3034 pares de bases de cLysMAR y sus regiones activas, representadas en la Fig. 5. Los supuestos sitios del factor de transcripción (MEF2 05, Oct-1, USF-02, GATA, NFAT) para los activadores y (CDP, SATB1, CTCF, ARBP/MeCP2) para los represores de la transcripción, fueron identificados usando el programa Matinspector (Genomatix), y las islas CpG fueron identificadas con el programa CPGPLOT. Los restos a los que se han asociado previamente elementos de MAR están indicados en negro e incluyen el dinucleótido CpG y la isla CpG, restos de desenrollamiento (AATATATT y AATATT), poly As y Ts, poly Gs y Cs, sitios de unión para la topoisomerasa II de Drosophila (GTNWAYATTNATT-NATNNR) que tenían la misma identidad que el núcleo de 6 pb y sitios de unión a las proteínas del grupo I de alta movilidad (HMG-I/Y). Otros restos estructurales incluyen sitios para la unión al nucleosoma y desfavorables para la unión al nucleosoma y un resto destinado a liberar la cadena superhelicoidal del DNA. La Fig. 8(A) representa la comparación de la capacidad de porciones de cLysMAR para activar la transcripción con perfiles de puntuación de la predicción con el programa MAR-Finder. El diagrama superior muestra la actividad de fragmentos de MAR como en la Fig. 5, mientras que las curvas del centro e inferior muestran el potencial predicho por el programa MAR-Finder para la actividad de MAR y para las estructuras curvadas de DNA, respectivamente.
La Fig. 9 muestra la correlación entre las propiedades fisicoquímicas del DNA y la actividad de MAR. La Fig. 9(A), representa los perfiles de la temperatura de fusión, la curvatura de la doble hélice, la profundidad de la ranura mayor y la anchura de la ranura menor del DNA de 5’-MAR que se determinaron usando los algoritmos de Levitsky et al., (Levitsky VG, Ponomarenko MP, Ponomarenko JV, Frolov AS, Kolchanov NA, "Nucleosomal DNA property database", Bioinformatics, 15; 582-592, 1999). Los fragmentos B, K y F más activos representados en la parte superior son
2 En la presente memoria se emplea el término español “coincidencia” como traducción del inglés “hit”. 3 El significado de los términos “rubbling” y “scrambling” se explica en el Ejemplo 3.
los mostrados en la Figura 1. La Fig. 9(B) representa la ampliación de los datos presentados en el panel A que representan el mapa del fragmento F alineado con el trazado correspondiente a la temperatura de fusión (curva superior) y curvatura del DNA (curva inferior). Están indicados la posición del fragmento FIB más activo y el sitio de unión a la proteína para factores de transcripción específicos.
La Fig. 10 muestra la distribución de los sitios de unión al supuesto factor de transcripción en 5’-cLysMAR. Las flechas grandes indican la posición de los elementos de desenrollamiento del núcleo (abreviadamente CUE, por la expresión inglesa Core Unwinding Elements) identificados con el programa SMAR Scan®.
La Fig. 11 muestra el esquema de ensamblaje de diversas porciones de la MAR. Las porciones indicadas de cLys-MAR se amplificaron por PCR, introduciendo elementos conectores Bglll-BamHl en cada extremo, y se ensamblaron para generar los elementos compuestos representados. Por ejemplo, la construcción superior consiste en el ensamblaje de todas las secuencias flanqueantes y de CUE en su posición original excepto que las secuencias conectoras BgII-BamHII separan cada elemento.
La Fig. 12 representa los mapas de plásmidos.
La Fig. 13 muestra el efecto de re-transfectar transfectantes primarios en la expresión de la proteína verde fluorescente (abreviadamente en lo sucesivo GFP, por la expresión inglesa Green Fluorescent Protein). Las células (CHO-DG44) se co-transfectaron con pSV40EGFP (tubo izquierdo) o pMAR-SV40EGFP (tubo central) y pSVneo como plásmido de resistencia. Las células transfectadas con pMAR-SV40EGFP fueron transfectadas de nuevo 24 horas más tarde con el mismo plásmido y un plásmido seleccionado diferente, pSVpuro (tubo derecho). Después de una selección de dos semanas, el fenotipo de la población celular establemente transfectada fue analizado por FACS.
La Fig. 14 muestra el efecto de la carga múltiple de plásmido que contiene MAR. Se utilizaron los transfectantes secundarios pMAR-SV40EGFP/pMAR-SV40EGFP en un tercer ciclo de transfección al final del proceso de selección. La transfección terciaria se realizó con pMAR o pMAR-SV40EGFP para obtener los transfectantes terciarios. Después de 24 horas, las células se transfectaron de nuevo con cada plásmido, dando como resultado los transfectantes cuaternarios (véase la Tabla 4).
La Fig. 15 muestra la acción comparativa de los algoritmos de predicción de SMAR ilustrados por la región WP18A10A7. (A) El análisis por el programa SMAR Scan@ se realizó con los ajustes predeterminados. (B) El análisis del SIDD (curva superior y escala lateral a mano izquierda) y la fijación de diversos fragmentos de DNA a la matriz nuclear in vitro (gráfica de barras, escala lateral a mano derecha) se tomaron de Goetze et al., (Goetze S, Gluch A, Benham C, Bode J, "Computational and in vitro analysis of destabilized DNA regions In the interferon gene cluster: potential of predicting functional gene domains." Biochemistry, 42: 154-166, 2003).
La Fig. 16 representa los resultados de un protocolo similar a la terapia génica que utiliza las MAR. El grupo de ratones inyectados con MAR-Network, inducido desde el comienzo del experimento, presenta una mejor inducción del hematocrito en comparación con los ratones inyectados con el sistema Network original sin MAR. Después de 2 meses, el hematocrito en el "grupo que contiene MAR" tiene valores superiores (65%) a los niveles de hematocrito normales (45-55%).
La Fig. 17 representa el diagrama de dispersión para las 1757 secuencias de S/MAR de los porcentajes de dinucleótidos AT (superior) y TA (inferior) frente a la curvatura de DNA predicha calculada por el programa SMAR Scan®.
La Fig. 18 representa las gráficas de distribución de los porcentajes de dinucleótidos en las 1757 secuencias que no son S/MAR.
La Fig.19 presenta el efecto de varios elementos de S/MAR sobre la producción de la proteína verde fluorescente (GFP) recombinante. Las poblaciones de células de CHO transfectadas con un vector de expresión de la GFP que contenía un elemento de MAR, como se indica, se analizaron por un clasificador de células activadas por fluorescencia (FACS®) y se muestran los perfiles típicos. Los perfiles presentan el número de células en función de los niveles de fluorescencia de la GFP.
La Fig. 20 representa el efecto de la inducción de hematocrito en ratones inyectados con MAR-Network.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
La presente invención se refiere a una secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas, caracterizada porque dicha secuencia de DNA comprende: a) al menos un elemento de DNA curvado y b) al menos un sitio de unión para una proteína que se une al DNA.
Se sabe que ciertas secuencias de DNA forman una "curva relativamente estática", en la que el DNA sigue una trayectoria tridimensional particular. Por tanto, en lugar de tener la conformación B-DNA normal ("lineal"), el segmento de DNA puede formar una curva plana definido también como DNA curvado (Marini, et al., 1982 "Bent helical structure in kinetoplast DNA", Proc. Natl. Acad. Sci. USA, 79: 7664-7664).
Sorprendentemente, los inventores han mostrado que el elemento de DNA curvado de una secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas contiene generalmente al menos 10% del dinucleótido TA y/o al menos 12% del dinucleótido AT en un tramo de 100 pares de bases contiguas. El elemento de DNA curvado de una secuencia de DNA de acuerdo con la invención contiene al menos 33% del dinucleótido TA y/o al menos 33% del dinucleótido AT en un tramo de 100 pares de bases contiguas. Estos datos han sido obtenidos por el método descrito más adelante.
La secuencia de DNA aislada y purificada de acuerdo con la invención comprende una secuencia de nucleótidos de MAR que contiene la secuencia SEQ ID No 25.
También están abarcadas por la presente invención secuencias complementarias de la secuencia SEQ ID No 25 antes mencionada, que pueden producirse utilizando PCR o cualquier otro medio.
También están incluidas en la presente invención secuencias que comparten al menos una longitud de nucleótidos del 90% de la secuencia SEQ ID No. 25 respectiva. Estas secuencias se pueden utilizar siempre que presenten las mismas propiedades que la secuencia natural de la que proceden.
La presente descripción incluye también variantes de las secuencias SEQ ID No 1 a 27 antes mencionadas y el elemento o fragmento de cLysMAR, es decir secuencias de nucleótidos que varían con relación a la secuencia de referencia por las sustituciones conservadoras de nucleótidos, en las que uno o más nucleótidos están sustituidos por otros de las mismas características.
Las secuencias SEQ ID No 1 a 23 mostradas en esta descripción han sido identificadas por escaneo de los cromosomas 1 y 2 humanos usando el programa SMAR Scan@, que demuestra que es posible la identificación de nuevas secuencias de MAR usando las herramientas descritas más adelante, mientras que las secuencias SEQ ID No 24 a 27 han sido identificadas por escaneo del genoma humano completo, utilizando el método combinado SMAR Scan@.
En una primera etapa, se cribaron los cromosomas 1 y 2 completos para identificar el elemento de DNA curvado como la región correspondiente a la curvatura, profundidad de la ranura mayor, anchura de la ranura menor máximas y la mínima temperatura de fusión, como se muestra en la Figura 3. En una segunda etapa, se escaneó esta colección de secuencias para determinar los sitios de unión de las proteínas reguladoras, tales como SATB1, GATA, etc., como se muestra en la Figura 8B, obteniéndose las secuencias SEQ ID 1-23. Además, se mostró que las secuencias 21-23 estaban situadas próximas a un gen conocido de la base de datos del genoma humano.
Las secuencias SEQ ID No 24 a 27 fueron obtenidas escaneando el genoma humano de acuerdo con el método combinado y se seleccionaron como ejemplos entre los 1757 elementos de MAR así detectados.
Las quimeras moleculares de las secuencias de MAR forman también parte de la presente descripción. Por quimera molecular se entiende una secuencia de nucleótidos que puede incluir una porción funcional de un elemento de MAR y que será obtenida por los métodos de biología molecular conocidos por los expertos en la técnica.
Combinaciones particulares de elementos o fragmentos de MAR o sus subporciones forman también parte de la presente descripción. Estos fragmentos se pueden preparar por una variedad de métodos conocidos en la técnica. Estos métodos incluyen, aunque sin limitación, digestión con enzimas de restricción y recuperación de los fragmentos, síntesis química o reacciones en cadena de la polimerasa (PCR).
Por consiguiente, combinaciones particulares de elementos o fragmentos de las secuencias SEQ ID No 1 a 27 y elementos o fragmentos de cLysMAR son también parte de la presente descripción, dependiendo de los resultados funcionales que se obtengan. Elementos de cLysMAR son por ejemplo las regiones B, K y F descritas en el documento WO 02/074969. Los elementos preferidos de cLysMAR usados en la presente descripción son las regiones B, K y F. Solo podría usarse un elemento o múltiples copias del mismo o podrían usarse elementos distintos (elementos multimerizados) (véase la Fig. 8 A).
Se entiende por fragmento una porción de la secuencia de nucleótidos respectiva. Los fragmentos de una secuencia de nucleótidos de MAR pueden retener la actividad biológica y por consiguiente unirse a matrices nucleares purificadas y/o alterar los patrones de expresión de las secuencias codificadoras unidas operativamente a un promotor. Los fragmentos de una secuencia de nucleótidos de MAR pueden variar entre nucleótidos de al menos aproximadamente 100 a 1000 pb, preferiblemente de aproximadamente 200 a 700 pb, más preferiblemente de aproximadamente 300 a 500 pb. También parte de la presente descripción incluye combinaciones de fragmentos, que tienen el mismo número de nucleótidos presentes en una secuencia de MAR sintética que consiste en elementos y/o fragmentos de MAR naturales. Los fragmentos son ensamblados preferiblemente por secuencias conectoras. El conector preferido es BgIll-BamHl.
Un "elemento" es una secuencia de nucleótidos conservada que tiene propiedades funcionales (es decir, sitios de unión para factores de transcripción) o características estructurales (es decir, secuencia de DNA curvado) comunes.
La "actividad que aumenta la producción de proteínas" se refiere a una actividad de la secuencia de DNA aislada y purificada definida como sigue: después de haber sido introducida en condiciones adecuadas en una célula hospedante eucariótica, la secuencia es capaz de aumentar los niveles de producción de proteínas en un cultivo celular en comparación con un cultivo de células transfectadas sin dicha secuencia de DNA. Generalmente, el aumento es de 1,5 a 10 veces, preferiblemente de 4 a 10 veces. Esto corresponde a una tasa de producción o productividad celular específica de al menos 10 pg por célula y por día (véanse el Ejemplo 11 y la Fig. 13).
Como se usan en la presente memoria, se proporcionan las siguientes definiciones con el fin de facilitar la compresión de esta invención.
"Cromatina" es el material proteínico y de ácidos nucleicos que constituye los cromosomas de una célula eucariótica, y se refiere a DNA, RNA y proteínas asociadas.
Un "elemento de cromatina" significa una secuencia de ácido nucleico en un cromosoma que tiene la propiedad de modificar la estructura de la cromatina cuando está integrada en dicho cromosoma.
"Cis" se refiere a la colocación de dos o más elementos (tales como elementos de cromatina) en la misma molécula de ácido nucleico (tal como el mismo vector, plásmido o cromosoma).
"Trans" se refiere a la colocación de dos o más elementos (tales como elementos de cromatina) en dos o más moléculas de ácido nucleico diferentes (tales como en dos vectores o dos cromosomas).
Los elementos modificadores de la cromatina que son potencialmente capaces de superar los efectos de posición y por consiguiente son de interés para el desarrollo de líneas celulares estables, incluyen elementos de borde (abreviadamente BE, por la expresión inglesa Boundary Elements), regiones de fijación a la matriz (MAR), regiones de control de locus (abreviadamente LCR, por la expresión inglesa Locus Control Regions) y elementos ubicuos que abren la cromatina (abreviadamente UCOE, por la expresión inglesa Universal/Ubiquitously Chromatin Opening Elements).
Los elementos de borde ("BE") o elementos aisladores, definen en muchos casos los límites en la cromatina (Bell A and Felsenfeld G. 1999; "Stopped at the border: boundaries and insulators", Curr. Opin. Genet. Dev., 9, 191-198) y pueden jugar un papel en la definición de un dominio transcripcional in vivo. Los BE carecen de la actividad promotora/potenciadora intrínseca, pero se cree que en su lugar protegen los genes de la influencia transcripcional de los elementos reguladores en la cromatina circundante. Generalmente, se usa el análisis por bloqueo del potenciador para identificar los elementos aisladores. En este ensayo, el elemento de la cromatina se coloca entre un potenciador y un promotor y se mide la transcripción activada por el potenciador. Los elementos aisladores han demostrado ser capaces de proteger los genes indicadores establemente transfectados frente a los efectos de posición en células de Drosophila, de levadura y de mamíferos. Han mostrado también que aumentan la proporción de ratones transgénicos con expresión inducible de transgenes.
Las regiones de control de locus ("LCR") son elementos cis-reguladores requeridos para la activación inicial de la cromatina de locus y posterior transcripción génica en sus posiciones naturales (Grosveld, F. 1999, "Activation by locus control regions?" Curr. Opin. Genet. Dev., 9, 152-157). La función activadora de las LCR permite también la expresión de un transgén acoplado en el tejido apropiado en ratones transgénicos, independientemente del sitio de integración en el genoma hospedante. Aunque las LCR confieren generalmente niveles de expresión específicos de los tejidos en los genes a los que se unen, se ha descrito una expresión eficaz en casi todos los tejidos en ratones transgénicos para una LCR receptora truncada de linfocitos T humanos y una LCR de la proteína activante del hígado (abreviadamente LAP por la expresión inglesa Liver Activating Protein) de rata. La LCR más ampliamente caracterizada es la del locus de las globinas. Actualmente se está evaluando su utilización en vectores para terapia génica de enfermedades de células falciformes y �-talasemias.
Las "MAR", de acuerdo con un modelo muy aceptado, pueden mediar el anclaje de una secuencia específica de DNA en la matriz nuclear, generando dominios en bucle de cromatina que se extienden hacia fuera de los núcleos de la heterocromatina. Aunque las MAR no contienen ninguna secuencia de consenso ni reconocible evidente, parece que sus características más consistentes son un alto contenido global de A/T y bases C predominantes en una cadena (Bode J, Schlake T, Ríos Ramírez M, Mielke C, Stengart M, Kay V and KlehrWirth D, "Scaffold/matrixattached regions: structural properties creating transcriptionally active loci", Structural and Functional Organization of the Nuclear Matrix: International Review of Citology, 162A:389-453, 1995). Estas regiones tienen propensión a formar estructuras secundarias curvadas que pueden estar predispuestas a la separación de las cadenas. Con frecuencia se denominan regiones de desapareamiento de bases (abreviadamente BUR, por la expresión inglesa Base-Unpairing Regions) y contienen un elemento de desenrollamiento del núcleo (CUE) que podría representar el punto de nucleación de la separación de las cadenas (Benham C and al., "Stress induced duplex DNA destabilization in scaffold/matrix attachment regions", J. Mol. Biol., 274:181-196, 1997). Con frecuencia se han encontrado diversos restos de secuencias ricas en AT simples en las secuencias de MAR, pero en la mayor parte de los casos, su importancia funcional y su modo potencial de acción no están claros. Estos restos incluyen la caja A (AATAAA-YAAA), la caja T (TTWTWTTWTT), restos del desenrollamiento de DNA (AATATATT, AATATT), sitios de unión a SATB1 (caja H, A/T/C26) y sitios de consenso de la topoisomerasa II para vertebrados (RNYNNCNNG-YNGKTNYNY) o Drosophila (GTNWAYATTNATNNR).
Los elementos de apertura de la cromatina universales ("UCOE", también conocidos como "elementos ubicuos que abren la cromatina") han sido descritos en el documento WO 00/05393.
Un "potenciador" es una secuencia de nucleótidos que actúa para potenciar la transcripción de genes independientemente de la identidad del gen, la posición de la secuencia en relación con el gen o la orientación de la secuencia. Los vectores de la presente invención incluyen opcionalmente potenciadores.
Un "gen" es una secuencia de desoxirribonucleótidos (DNA) que codifica una proteína madura dada. Como se usa en la presente memoria, el término "gen" no debe incluir regiones flanqueantes no traducidas, tales como las señales de iniciación de la transcripción del RNA, sitios de adición de poliadenilación, promotores o potenciadores.
Un "gen producto" es un gen que codifica un producto proteínico que tiene características deseables, tales como utilidad en diagnóstico o en terapia. Un gen producto incluye, por ejemplo, genes estructurales y genes reguladores.
Un "gen estructural" se refiere a un gen que codifica una proteína estructural. Ejemplos de genes estructurales incluyen, aunque sin limitación, proteínas citoesqueléticas, proteínas de la matriz extracelular, enzimas, proteínas de los poros nucleares y proteínas del armazón nuclear, canales y transportadores, proteínas contráctiles y chaperonas. Los genes estructurales preferidos codifican anticuerpos o fragmentos de anticuerpos.
Un "gen regulador" se refiere a un gen que codifica una proteína reguladora. Ejemplos de proteínas reguladoras incluyen, aunque sin limitación, factores de transcripción, hormonas, factores del crecimiento, citoquinas, moléculas de transducción de señales, oncogenes, proto-oncogenes, receptores transmembránicos y proteínas quinasas.
"Orientación" se refiere al orden de los nucleótidos en una secuencia de DNA dada. Por ejemplo, una orientación invertida de una secuencia de DNA es aquella en la que está invertido el orden de la secuencia 5’ a 3’ con relación a otra secuencia en comparación con un punto de referencia en el DNA a partir del que se obtuvo la secuencia. Dichos puntos de referencia pueden incluir la dirección de la transcripción de otras secuencias especificadas de DNA en el DNA fuente y/o el origen de replicación de vectores replicables que contienen la secuencia.
"Célula eucariótica" se refiere a cualquier célula de mamífero o no mamífero procedente de un organismo eucariótico. Como ejemplo no limitativo, estaría incluida en esta invención cualquier célula eucariótica que sea capaz de mantenerse en las condiciones del cultivo celular y ser transfectada posteriormente. Los tipos de células especialmente preferidos incluyen, por ejemplo, células madre, células madre embrionarias, células de ovario de hámster chino (CHO), COS, BHK21, NIH3T3, HeLa, C2C12, células cancerígenas y células primarias diferenciadas o no diferenciadas. Otras células hospedantes adecuadas son conocidas por los expertos en la técnica.
Las expresiones "célula hospedante" y "célula hospedante recombinante" se usan intercambiablemente en la presente memoria para indicar una célula eucariótica en la que han sido introducidos uno o más vectores de la invención. Ha de entenderse que dichas expresiones se refieren no sólo a la célula objeto particular, sino también a la progenie o progenie potencial de dicha célula. Debido a que pueden producirse ciertas modificaciones en las generaciones subsiguientes a causa de mutaciones o influencias medioambientales, dicha progenie puede, en efecto, no ser idéntica a la célula parental, pero también está incluida en el alcance de las expresiones utilizadas en la presente memoria.
Las expresiones "introducir un DNA purificado en una célula hospedante eucariótica" o "transfección" significan cualquier proceso en el que un DNA extracelular, con o sin material acompañante, entra en una célula hospedante. La expresión "célula transfectada" significa la célula en la que se ha introducido el DNA extracelular y por tanto alberga el DNA extracelular. El DNA podría ser introducido en la célula de modo que el ácido nucleico sea replicable como un integrante cromosómico o como un elemento extracromosómico.
"Promotor" como se usa en la presente memoria se refiere a una secuencia de ácido nucleico que regula la expresión de un gen.
"Co-transfección" significa el proceso de transfectar una célula eucariótica con más de un gen o vector o plásmido exógeno, extraño a la célula, uno de los cuales puede conferir a la célula un fenotipo seleccionable.
La secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas comprende también, además de uno o más elementos de DNA curvado, al menos un sitio de unión para una proteína que se une al DNA.
Generalmente la proteína que se une al DNA es un factor de transcripción. Ejemplos de factores de transcripción son el grupo que consiste en las proteínas con el dominio polyQpolyP. Otro ejemplo de un factor de transcripción es un factor de transcripción seleccionado del grupo que comprende SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C/EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2, Pit1, TTF1, XFD1, AR, C/EBPgamma, Cdc5, FOXD3, HFH3, HNF3beta, MRF2, Oct1, POU6F1, SRF, V$MTATA_ B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL, HP1, Myc, PBX, Pax3, TEF, VBP, XFD3, Bm2, COMP1, Evil, FOXP3, GA-TA4, HFN1, Lhx3, NKX3A, POU1F1, Pax6, TFIIA o una combinación de dos o más de estos factores de transcripción. Las más preferidas son las proteínas con los dominios SATB1, NMP4, MEF2 y polyQpolyP.
Se sabe, por ejemplo, que SATB1, NMP4 y MEF2, regulan el desarrollo y/o la expresión de genes específicos de tejidos en los mamíferos. Estos factores de transcripción tienen la capacidad de alterar la geometría del DNA y recíprocamente la unión al DNA como un ligando alostérico modifica su estructura. Recientemente, se encontró que SATB1 forma una estructura similar a una jaula que circunscribe la heterocromatina (Cai S, Han HJ, and Kohwi-Shigematsu T, "Tissue-specific nuclear architecture and gene expression regulated by SATB1" Nat. Genet., 2003. 34(1): p. 42-51).
Otra parte de la presente descripción es un elemento y/o fragmento de cLysMAR aislado y purificado, una de sus secuencias complementarias, una de sus partes que comparte una longitud de nucleótidos de al menos el 70%, una de sus quimeras moleculares y una de sus combinaciones y variantes.
El elemento y/o fragmento de cLysMAR puede consistir en al menos una secuencia de nucleótidos seleccionada de las regiones B, K y F.
Una parte adicional de la presente descripción es una secuencia de MAR sintética que comprende elementos y/o fragmentos de MAR natural ensamblados entre secuencias conectoras.
La secuencia de MAR sintética puede comprender un elemento y/o fragmento de cLysMAR de una de sus secuencias complementarias, una de sus partes que comparte al menos una longitud de nucleótidos del 70%, una de sus quimeras moleculares y una de sus combinaciones y variantes. También preferiblemente, las secuencias conectoras son el conector Bglll-BamHl.
Otro aspecto de la descripción es proporcionar un método para identificar una secuencia de MAR usando una herramienta bioinformática que comprende el cálculo de valores de una o más características de las secuencias de DNA correspondientes a la curvatura de DNA, la profundidad de la ranura mayor y la anchura de la ranura menor potenciales y a la temperatura de fusión. Preferiblemente, la identificación de una o más características de la secuencias de DNA comprende además una característica más de las secuencias de DNA correspondiente a los sitios de unión para las proteínas que se unen al DNA, que también se calcula con este método.
Preferiblemente, los perfiles o las matrices ponderadas de dicha herramienta bioinformática se basan en el reconocimiento de dinucleótidos.
La herramienta bioinformática usada para el presente método es preferiblemente, el programa SMAR Scan@, que contiene algoritmos desarrollados por Gene Express ((http://srs6.bionet.nsc.ru/srs6bin/cgi-bin/wgetz?-e+[FEATURES-SiteID:’nR’]) y se basa en el trabajo de Levitsky et al., 1999. Estos algoritmos reconocen perfiles, basados en matrices ponderadas de dinucleótidos, para calcular los valores teóricos de las propiedades conformacionales y fisicoquímicas del DNA.
Preferiblemente, el programa SMAR Scan@ usa los cuatro criterios teóricos designados también como características de las secuencias de DNA correspondientes a la curvatura del DNA, la profundidad de la ranura mayor y la anchura de la ranura menor potenciales y a la temperatura de fusión en todas las combinaciones posibles, usando ventanas de escaneo de tamaño variable (véase la Fig. 3). Para cada función usada, debe ajustarse un valor de exclusión. El programa presenta una coincidencia cada vez que la puntuación calculada de una región dada está por encima del valor de exclusión ajustado para todos los criterios elegidos. Se dispone de dos modos de salida de datos para manejar las coincidencias, el primero (denominado "similar a perfil") presenta simplemente todas las posiciones de las coincidencias en la secuencia de consulta y sus valores correspondientes para los diferentes criterios elegidos. El segundo modo (denominado "coincidencias contiguas") solo produce las posiciones de diversas coincidencias contiguas y sus secuencias correspondientes. Para este modo, el número mínimo de coincidencias contiguas es otro valor de exclusión que puede ser fijado, de nuevo con un tamaño de ventana ajustable. Este segundo modo es el modo predeterminado del programa SMAR Scan®. Realmente, desde un punto de vista semántico, una coincidencia es considerada un elemento de desenrollamiento del núcleo (CUE) y una agrupación de CUE acompañada por agrupaciones de sitios de unión para las proteínas correspondientes es considerada una MAR. Por tanto, el programa SMAR Scan@ solo considera diversas coincidencias contiguas como una MAR potencial.
Para afinar los valores de exclusión predeterminados para los cuatro criterios estructurales teóricos, se utilizaron las MAR validadas experimentalmente de la SMARt DB (http://transfac.gbf.de/-SMARt DB). Los inventores recuperaron y analizaron todas las secuencias de MAR humanas procedentes de la base de datos con el programa SMAR Scan® usando el modo "similar a perfil" con los cuatro criterios y sin ajustar el valor de exclusión. Esto permitió el ajuste de cada función para cada posición de las secuencias. De acuerdo con estos datos se calculó entonces la distribución de cada criterio (véanse las Fig. 1 y 3).
Los valores de exclusión predeterminados del programa SMAR Scan® para la curvatura, la profundidad de la ranura mayor y la anchura de la ranura menor se ajustaron a la media del cuantil 75 y a la mediana. Para la temperatura de fusión, el valor de exclusión predeterminado debe ajustarse al cuantil 75. La longitud mínima para el modo de "coincidencias contiguas" debe ajustarse a 300 debido a que se supone que es la longitud mínima de una MAR (véanse las Fig. 8 y 9). Sin embargo, un experto en la técnica podría determinar los valores de exclusión de los criterios antes citados para un organismo dado con una experimentación mínima.
Preferiblemente, los valores de curvatura del DNA están comprendidos entre 3 y 5° (grado radial). Más preferiblemente están situados entre 3,8 y 4,4°, correspondiente al pico menor de la Fig. 1.
Preferiblemente, los valores de la profundidad de la ranura mayor están comprendidos entre 8,9 y 9,3 Å (Angstrom) y los valores de la anchura de la ranura menor entre 5,2 y 5,8 Å. Más preferiblemente, los valores de la profundidad dela ranura mayor están comprendidos entre 9,0 y 9,2 Å y los valores de la anchura de la ranura menor entre 5,4 y 5,7Å.
Preferiblemente, la temperatura de fusión está comprendida entre 55 y 75°C (grados Celsius). Más preferiblemente, la temperatura de fusión está comprendida entre 55 y 62°C.
La proteína que se une al DNA cuyos valores pueden ser calculados por el método es generalmente un factor de transcripción, preferiblemente un dominio polyQpolyP o un factor de transcripción seleccionado del grupo que comprende SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C/EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2; Pit1, TTF1, XFD1, AR, C/EBPgamma, Cdc5, FOXD3, HFH3, HNF3beta, MRF2, Oct1, POU6F1, V$MTATA_B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL, HP1, Myc, PBX, Pax3, TEF, VBP, XFD3, Bm2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1 F1, Pax6, TFIIA o una combinación de dos o más de estos factores de transcripción.
Sin embargo, un experto en la técnica podría determinar otras clases de factores de transcripción con el fin de realizar el método de acuerdo con la presente invención.
En el caso en el que se aplique el programa SMAR Scan® para realizar, por ejemplo, análisis a gran escala, entonces, preferiblemente, el método antes citado comprende además al menos un filtro que prediga los sitios de unión al DNA para los factores de transcripción del DNA con el fin de reducir los cálculos.
El principio de este método combina el programa SMAR Scan® para calcular las características estructurales como se ha descrito antes y un filtro, tal como, por ejemplo, el programa pfsearch, (a partir del paquete pftools descrito por Bucher P, Karplus K, Moeri N, and Hofmann K, "A flexible search technique based on generalized profiles", Computers and Chemistry, 20:324, 1996) para predecir la unión de algunos factores de transcripción.
Ejemplos de filtros comprenden, aunque sin limitación, los programas pfsearch, MatInspector, RMatch Professional y TRANSFAC Professional.
Este método combinado usa las características estructurales del programa SMAR Scan® y la unión predicha de factores de transcripción específicos del filtro que se pueden aplicar secuencialmente en cualquier orden para seleccionar las MAR, por consiguiente, dependiendo del filtro se aplica al comienzo o al final del método.
El primer nivel selecciona secuencias de la secuencia de entrada primaria y el segundo nivel, que consiste en el filtro, se puede usar para restringir entre las secuencias seleccionadas aquellas que satisfacen los criterios usados por el filtro.
En este método combinado el filtro detecta agrupaciones de sitios de unión al DNA usando perfiles o matrices ponderadas de, por ejemplo, el programa MatInspector (Quandt K, Frech K, Karas H, Wingender E, Werner T, "MatInd and MatInspector New fast and versatile tools for detection of consensus matches in nucleotide sequence data", Nucleic Acids Research, 23, 4878-4884, 1995). El filtro puede detectar también las densidades de agrupaciones de sitios de unión al DNA.
El método combinado es realmente un "envoltorio4" escrito en Perl para el programa SMAR Scan@ y, en el caso en el que se use el programa pfsearch como filtro, a partir del paquete pftools. El método combinado realiza un tratamiento a dos niveles usando en cada nivel una de estas herramientas (el programa SMAR Scan@ o filtro) como "filtro" potencial, siendo cada filtro opcional y pudiendo ser usado para calcular las características predichas sin realizar ninguna filtración.
Si se usa el programa SMAR Scan® en el primer nivel para filtrar subsecuencias, ha de usarse con el modo de "todas las coincidencias contiguas" con el fin de que aparezcan las secuencias. Si se usa el programa pfsearch en el primer nivel como primer filtro, ha de usarse sólo con un perfil y debe proporcionarse una distancia de nucleótidos. Esta distancia se usa para agrupar las coincidencias del programa pfsearch que están situadas a una distancia inferior a la distancia proporcionada para que aparezcan las secuencias. El método combinado inicia el programa pfsearch, analiza su salida y aparecen las secuencias correspondientes a las coincidencias del programa pfsearch que son agrupados de acuerdo con la distancia proporcionada. A continuación, cualquiera que sea la herramienta usada en el primer nivel, la longitud de las subsecuencias así seleccionadas puede ser sistemáticamente ampliada por ambos extremos de acuerdo con un parámetro denominado "ampliación de resultados".
El nivel segundo y opcional se puede usar para separar por filtración las secuencias (secuencias ya filtradas o secuencias de entrada no filtradas) u obtener los resultados por los programas SMAR Scan® y/o pfsearch sin realizar ninguna filtración de estas secuencias. Si se usa para filtrar el segundo nivel del método combinado, para cada criterio es necesario proporcionar los valores de exclusión considerados (resultado por nucleótido) para separar por filtración dichas secuencias (véase la Fig. 20).
Otro objeto de la presente descripción es proporcionar también un método para identificar una secuencia de MAR que comprende al menos un filtro que detecte agrupaciones de sitios de unión de DNA usando perfiles o matrices ponderadas. Preferiblemente, este método comprende dos niveles de filtros y en este caso, el programa SMAR Scan® está totalmente ausente de dicho método. Generalmente, los dos niveles usan el programa pfsearch.
También está incluida en la presente descripción una secuencia de DNA de MAR aislada y purificada identificable de acuerdo con el método para identificar una secuencia de MAR usando la herramienta bioinformática descrita, el método combinado o el método que comprende al menos un filtro.
El análisis por el método combinado del genoma humano completo proporcionó un total de 1757 MAR supuestas que representan un total de 1.065.305 pares de bases. Con el fin de reducir el número de resultados, se realizó un análisis de dinucleótidos en estas 1757 MAR, calculando cada uno de los 16 posibles porcentajes de dinucleótidos para cada secuencia considerando ambas cadenas en la dirección 5’ a 3’.
Sorprendentemente, los inventores han mostrado que todas las "super" MAR detectadas con el método combinado
4 El termino español “envoltorio” corresponde al inglés “wrapper”.
contienen al menos 10% del dinucleótido TA en un tramo de 100 pares de bases contiguos. Preferiblemente, estas secuencias contienen al menos 33% del dinucleótido TA en un tramo de 100 pares de bases.
Los inventores también han demostrado que estas mismas secuencias contienen además al menos 12% del dinucleótido AT en un tramo de 100 pares de bases contiguos. Preferiblemente, contienen al menos 33% del dinucleótido AT en un tramo de 100 pares de bases contiguos. Otro aspecto de la descripción es proporcionar una secuencia de DNA de MAR aislada y purificada de cualquiera de las MAR anteriormente descritas, que comprende una secuencia seleccionada de las secuencias SEQ ID No 1 a 27, una de sus secuencias complementarias, una de sus partes que comparte al menos una longitud de nucleótidos del 70%, una de sus quimeras moleculares y una de sus combinaciones y variantes.
Preferiblemente, dicha secuencia de DNA de MAR aislada y purificada comprende una secuencia seleccionada de las secuencias SEQ ID No 24 a 27, una de sus secuencias complementarias, una de sus partes que comparte al menos una longitud de nucleótidos del 70%, una de sus quimeras moleculares y una de sus combinaciones y variantes. Estas secuencias 24 a 27 corresponden a las detectadas por el método combinado y muestran una mayor actividad que aumenta la producción de proteínas que las secuencias 1 a 23.
La presente descripción comprende también el uso de una secuencia de DNA aislada y purificada que comprende una primera secuencia de nucleótidos aislada de una región de fijación a la matriz (MAR) que es una secuencia de nucleótidos de MAR seleccionada del grupo que comprende
-
una secuencia de DNA aislada y purificada de acuerdo con la invención,
-
la secuencia SEQ ID No 25, o una de sus secuencias complementarias, para aumentar la actividad de producción de proteínas en una célula hospedante eucariótica.
Dicha secuencia de DNA aislada y purificada comprende además generalmente una o más secuencias reguladoras, conocidas en la técnica, por ejemplo, un promotor y/o un potenciador, sitios de poliadenilación y uniones por empalme, empleadas generalmente para la expresión de la proteína o pueden codificar opcionalmente un marcador seleccionable. Preferiblemente, dicha secuencia de DNA aislada y purificada comprende un promotor que está unido operativamente a un gen de interés.
Las secuencias de DNA de esta invención se pueden aislar de acuerdo con protocolos estándares de PCR y métodos muy conocidos en la técnica.
Los promotores que se pueden usar, siempre que sean compatibles con la célula hospedante, son, por ejemplo, promotores obtenidos de los genomas de virus tales como poliomavirus, adenovirus (tal como Adenovirus 2), papilomavirus (tal como el papilomavirus bovino), virus del sarcoma aviar, citomegalovirus (tal como el promotor temprano inmediato del citomegalovirus humano o de múridos), un retrovirus, virus de la hepatitis B y virus 40 de simios (tales como los promotores temprano y tardío del SV 40) o promotores obtenidos de promotores heterólogos de mamíferos, tal como el promotor de actina o un promotor de inmunoglobulina o promotores de choque térmico. Dichas secuencias reguladoras dirigen la expresión constitutiva.
Además, la secuencia de DNA aislada y purificada podría comprender secuencias reguladoras que fueran capaces de dirigir la expresión de los ácidos nucleicos preferiblemente en un tipo de célula particular (por ejemplo, se usan elementos reguladores específicos de los tejidos para expresar el ácido nucleico). Los elementos reguladores específicos de los tejidos son conocidos en la técnica. Ejemplos adecuados no limitativos de promotores específicos de los tejidos incluyen el promotor de albúmina (específico del hígado; Pinkert,et al., 1987. Genes Dev. 1: 268-277), promotores específicos del tejido linfático (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), en particular promotores de receptores de linfocitos T (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) e inmunoglobulinas (Banerji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), promotores específicos de las neuronas (por ejemplo, el promotor de neurofilamentos; Byrne and Ruddle, 1989. Proc.Natl. Acad. Sci. USA 86: 54735477), promotores específicos del páncreas (Edlund, et al., 1985. Science 230: 912-916) y promotores específicos de las glándulas mamarias (por ejemplo, promotor del suero de la leche; patente de EE.UU. Nº 4.873.316 y Solicitud de patente europea Nº 264.166).
También están incluidos los promotores regulados por el desarrollo. Ejemplos de dichos promotores incluyen, por ejemplo, los promotores de los genes homeóticos de múridos (Kessel and Gruss, 1990. Science 249: 374-379) y promotor de alfa-fetoproteína (Campes and Tilghman, 1989. Genes Dev. 3: 537-546).
Los promotores de la expresión de genes regulables son muy conocidos en la técnica e incluyen, como ejemplo no limitativo, cualquier promotor que module la expresión de un gen que codifica una proteína deseada uniendo una molécula exógena, tal como el sistema CRE/LOX, el sistema TET, el sistema de doxiciclina, el sistema NFkappaB/luz UV, el sistema Leu3p/isopropilmalato y el sistema GLVPc/GAL4 (véase por ejemplo, Sauer, 1998, Methods 14 (4): 381-92; Lewandoski, 2001, Nat. Rev. Genet 2 (10): 743-55; Legrand-Poels et al., 1998, J. Photochem. Photobiol. B. 45: 18; Guo et al., 1996, FEBS Lett. 390 (2): 191-5; Wang et al., PNAS USA, 1999, 96 (15): 84838). Sin embargo, un experto en la técnica podría determinar otras clases de promotores que sean adecuados para la realización de la presente invención.
Pueden incluirse opcionalmente en la secuencia de DNA purificada de la invención potenciadores que entonces pertenecerán a la secuencia reguladora, por ejemplo al promotor.
El "gen de interés" o "transgén” codifica preferiblemente una proteína (proteína estructural o reguladora). Como se usa en la presente memoria "proteína" se refiere generalmente a péptidos y polipéptidos que tienen más de aproximadamente diez aminoácidos. Las proteínas pueden ser "homólogas" al hospedante (es decir, endógenas de la célula hospedante que se va a utilizar) o "heterólogas" (es decir, extrañas a la célula hospedante que se va a utilizar), tal como una proteína humana producida por levadura. La proteína puede producirse como un agregado insoluble o como una proteína soluble en el espacio periplásmico o citoplasma de la célula o en el medio extracelular. Ejemplos de proteínas incluyen hormonas, tal como la hormona del crecimiento o eritropoyetina (EPO), factores de crecimiento, tal como el factor del crecimiento epidérmico, sustancias analgésicas como encefalinas, enzimas como quimiotripsina, receptores de hormonas o factores de crecimiento, anticuerpos e incluyen también proteínas usadas generalmente como un marcador visualizador, por ejemplo la proteína verde fluorescente.
Preferiblemente, la secuencia de DNA purificada comprende además al menos una segunda secuencia de nucleótidos de una región de fijación a la matriz (MAR) aislada seleccionada del grupo que comprende:
-
una secuencia de DNA aislada y purificada de acuerdo con la invención,
-
la secuencia SEQ ID Nº 25, o una de sus secuencias complementarias,
para aumentar la actividad de producción de proteínas en una célula hospedante eucariótica.
Las secuencias de nucleótidos de la región de fijación a la matriz (MAR) aisladas podrían ser idénticas o diferentes. Alternativamente, se usan una primera y una segunda secuencia de nucleótidos de MAR idénticas.
Preferiblemente, las secuencias de nucleótidos de MAR están situadas tanto en el extremo 5’ como en el 3’ de la secuencia que contiene el promotor y el gen de interés. Pero la invención también prevé el hecho de que dichas primera y/o al menos segunda secuencias de nucleótidos de MAR estén situadas en una secuencia distinta de la que contiene el promotor y el gen de interés.
Incluida en el alcance de la presente descripción se encuentra también la secuencia de DNA aislada y purificada que comprende una primera secuencia de nucleótidos de la región de fijación a la matriz (MAR) aislada que es una secuencia de nucleótidos de MAR seleccionada del grupo que comprende:
-
una secuencia de DNA aislada y purificada que tiene actividad que aumenta la producción de proteínas,
-
una secuencia de DNA de MAR aislada y purificada identificable de acuerdo con el método para identificar una secuencia de MAR que usa la herramienta bioinformática descrita, el método combinado o el método que comprende al menos un filtro descritos,
-
las secuencias SEQ ID No 1 a 27,
-
un elemento y/o fragmento de cLysMAR aislado y purificado,
-
una secuencia de MAR sintética que comprende elementos y/o fragmentos de MAR naturales ensamblados entre secuencias conectoras,
una de sus secuencias complementarias, una de sus partes que comparten una longitud de nucleótidos de al menos el 70%, una de sus quimeras moleculares, una de sus combinaciones y variantes que se pueden usar para aumentar la actividad de producción de proteínas en una célula hospedante eucariótica introduciendo la secuencia de DNA aislada y purificada en una célula hospedante eucariótica de acuerdo con protocolos muy conocidos. Los métodos generalmente aplicados para introducir DNA en células hospedantes eucarióticas son, por ejemplo, introducción directa de DNA clonado por microinyección o bombardeo de micropartículas; electrotransferencia; uso de vectores virales; encapsulación en un sistema portador; y uso de reactivos de transfección, tales como fosfato de calcio, dietilaminoetilo (DEAE)-dextrano o sistemas de transfección comerciales como Lipofect-AMINE 2000 (Invitrogen). Preferiblemente, el método de transfección usado para introducir la secuencia de DNA purificada en una célula hospedante eucariótica es el método para transfectar una célula eucariótica como se describe a continuación.
La secuencia de DNA aislada y purificada se puede usar en forma de un vector circular. Preferiblemente, la secuencia de DNA aislada y purificada se usa en forma de una secuencia de DNA lineal como vector.
Como se usa en la presente memoria, "plásmido" y "vector" son intercambiables, aunque plásmido es la forma de vector más comúnmente usada. Sin embargo, se entiende que la invención incluye otras formas de vectores de expresión, como por ejemplo, aunque sin limitación, vectores virales (por ejemplo, retrovirus defectuosos en la replicación, adenovirus y virus adeno-asociados), que realizan funciones equivalentes.
La presente invención incluye además un método para la transfección de una célula hospedante eucariótica, comprendiendo dicho método:
a) introducir en dicha célula hospedante eucariótica al menos una secuencia de DNA purificada que comprende al
menos una secuencia de DNA que consiste en una secuencia de MAR de acuerdo con la invención, b) someter en un tiempo definido dicha célula hospedante eucariótica a al menos una etapa de transfección adicio
nal con al menos una secuencia de DNA purificada que comprende al menos una secuencia de DNA de interés
y/o con al menos una secuencia de DNA aislada y purificada que comprende una secuencia de nucleótidos de
MAR u otros elementos modificadores de la cromatina y c) seleccionar dicha célula hospedante eucariótica.
Preferiblemente, en la etapa b) se aplican al menos dos a cuatro etapas de transfección.
Con el fin de seleccionar las células transfectadas con éxito, se introduce generalmente un gen que codifica un marcador seleccionable (por ejemplo, resistencia a antibióticos) en las células hospedantes junto con el gen de interés. El gen que codifica un marcador seleccionable podría estar situado en la secuencia de DNA purificada que comprende al menos una secuencia de DNA de interés y/o al menos una secuencia de DNA aislada y purificada que consiste en una secuencia de nucleótidos de MAR u otros elementos modificadores de la cromatina u opcionalmente podría ser introducido conjuntamente en forma separada, por ejemplo en un plásmido. Varios marcadores seleccionables incluyen los que confieren resistencia a fármacos, tales como G418, higromicina y metotrexato. La cantidad de fármaco se puede adaptar según se desee, con el fin de aumentar la productividad.
Generalmente, se usan uno o más marcadores seleccionables. Preferiblemente, los marcadores seleccionables usados en cada etapa de transfección distinta son diferentes. Esto permite seleccionar las células transformadas que son "multi-transformadas" usando, por ejemplo, dos selecciones de antibióticos diferentes.
Cualquier célula hospedante eucariótica capaz de producción de proteínas y que carezca de pared celular puede ser usada en los métodos de esta invención. Ejemplos de líneas de células hospedantes de mamíferos útiles incluyen células humanas, tales como la línea de células renales embrionarias humanas, células 293 o células 293 subclonadas para cultivo en suspensión, Graham et al., J. Gen Virol. 36, 59 (1977)), células de carcinoma cervical humano, tales como (HELA, ATCC CCL 2), células de pulmón humano (W138, ATCC CCL 75), células hepáticas humanas (Hep G2, HB 8065); células de roedores, tales como células de riñón de crías de hámster (BHK, ATCC CCL 10), células de ovario de hámster chino/-DHFR (CHO, Urlaub and Chasin, Proc. Nad. Acad. Sci. USA, 77, 4216 (1980)), células de tipo Sertoli de ratón (TM4, Mather, Biol. Reprod., 23, 243-251 (1980)), células de tumor mamario de ratón (MMT 060562, ATCC CCL 51); y células de otros mamíferos, tales como la línea CV1 de riñón de mono transformada por SV40 (COS-7, ATCC CRL 1651); células de riñón de mono (CV1, ATCC CCL 70); células de riñón de mono verde africano (VERO-76, ATCC CRL-1587); células de riñón canino (MDCK, ATCC CCL 34); células hepáticas de la rata búfalo (BRL 3A, ATCC CRL 1442); y células de mieloma (por ejemplo, NS0)/hibridoma.
Preferiblemente, las células hospedantes eucarióticas transformadas seleccionadas son células altamente productoras de proteínas con una tasa de producción de al menos 10 pg por célula y por día.
Las más preferidas para uso humano en la presente invención son las células de CHO.
La secuencia de DNA de interés de la secuencia de DNA aislada y purificada es usualmente un gen de interés que codifica preferiblemente una proteína unida operativamente a un promotor tal como se ha descrito antes. La secuencia de DNA aislada y purificada que comprende al menos una secuencia de DNA de interés podría comprender adicionalmente la secuencia de DNA de interés de la secuencia de nucleótidos de MAR u otros elementos modificadores de la cromatina.
La secuencia de DNA aislada y purificada que comprende una secuencia de nucleótidos de MAR se selecciona, por ejemplo, del grupo que comprende las secuencias SEQ ID No 1 a 27 y/o elementos particulares de cLysMAR, por ejemplo, las regiones B, K y F, así como fragmentos y elementos y sus combinaciones, como se ha descrito antes. Otros elementos modificadores de la cromatina son, por ejemplo, elementos de borde (BE), regiones de control de locus (LCR) y elementos ubicuos que abren la cromatina (UCOE) (véase Zahn-Zabal et al., ya citados). Un ejemplo de transfecciones múltiples de células hospedantes se muestra en el Ejemplo 12 (Tabla 3). La primera etapa transfectante (transfección primaria) se lleva a cabo con el gen de interés (SV40EGFP) solo, con una secuencia de nucleótidos de MAR sola o con el gen de interés y una secuencia de nucleótidos de MAR (MARSV40EGFP). La segunda etapa transfectante (transfección secundaria) se lleva a cabo con el gen de interés (SV40EGFP) solo, con una secuencia de nucleótidos de MAR sola o con el gen de interés y una secuencia de nucleótidos de MAR (MAR-SV40EGFP), en todas las combinaciones posibles resultantes de la primera etapa transfectante.
Preferiblemente, la célula hospedante eucariótica es transfectada:
a) introduciendo una secuencia de DNA purificada que comprende una secuencia de DNA de interés y adicional
mente una secuencia de nucleótidos de MAR, y b) sometiendo en un tiempo definido dicha célula hospedante eucariótica transfectada a al menos una etapa de
transfección adicional con la misma secuencia de DNA purificada que comprende una secuencia de DNA de in
terés y adicionalmente una secuencia de nucleótidos de MAR de la etapa a).
También preferiblemente, la secuencia de nucleótidos de MAR de la secuencia de DNA aislada y purificada se selecciona del grupo que comprende:
-
una secuencia de DNA aislada y purificada que tiene actividad que aumenta la producción de proteínas,
-
una secuencia de DNA aislada y purificada de MAR identificable de acuerdo con el método de identificar una secuencia de MAR usando la herramienta bioinformática descrita, el método combinado o el método que comprende al menos un filtro,
-
las secuencias SEQ ID No 1 a 27,
-
un elemento y/o fragmento de cLysMAR aislado y purificado,
-
una secuencia de MAR sintética que comprende un elemento de MAR natural y/o fragmentos ensamblados entre secuencias conectoras,
una de sus secuencias complementarias, una de sus partes que comparte al menos una longitud de nucleótidos del 70%, una de sus quimeras moleculares, una de sus combinaciones y variantes.
Sorprendentemente, se ha observado una sinergia entre la primera y la segunda transfección. Se ha observado una sinergia particular cuando los elementos de las MAR están presentes en una o en ambas etapas de transfección. Se han llevado a cabo transfecciones múltiples de las células con pMAR sola o en combinación con diversos plásmidos de expresión, usando el método descrito antes. Por ejemplo, la Tabla 3 muestra que transfectar las células dos veces con el plásmido pMAR-SV40EGFP dio la mayor expresión de la GFP y el mayor grado de potenciación de todas las condiciones (4,3 veces). En contraste, transfectar dos veces el vector sin la MAR dio poca o ninguna potenciación, 2,8 veces, en lugar del aumento doble esperado. Esto demuestra que la presencia de los elementos de MAR en cada etapa de transfección es de particular interés para conseguir la máxima síntesis de proteínas.
Como ejemplo particular del método de transfección dicha secuencia de DNA purificada que comprende al menos una secuencia de DNA de interés puede ser introducida en la forma de múltiples plásmidos no enlazados, que comprende un gen de interés unido operativamente a un promotor, un gen marcador seleccionable y/o elementos que aumentan la producción de proteínas, tales como secuencias de MAR.
La relación entre la primera y las secuencias subsiguientes de DNA puede ser adaptada según se requiera para el uso de los tipos de células específicas y los expertos en la técnica la pueden obtener por experimentación habitual.
El tiempo definido para las transformaciones adicionales de las células transformadas primarias depende estrechamente del ciclo celular y de su duración. Usualmente, el tiempo definido corresponde a intervalos relacionados con el ciclo de división celular.
Por lo tanto, este tiempo preciso puede ser adaptado según se requiera para el uso de tipos de células específicas, y los expertos en la técnica lo pueden obtener por experimentación habitual.
Preferiblemente, el tiempo definido es el momento en el que la célula hospedante acaba de entrar en la misma fase de un segundo o posterior ciclo de división celular, preferiblemente el segundo ciclo.
Este tiempo está comprendido usualmente entre 6 horas y 48 horas, preferiblemente entre 20 horas y 24 horas después del evento de transfección previo.
También esta abarcado por la presente invención un método para transfecfar una célula hospedante eucariótica, comprendiendo dicho método co-transfectar en dicha célula hospedante eucariótica al menos una primera secuencia de DNA aislada y purificada que comprende al menos una secuencia de DNA de interés y una segunda secuencia de DNA aislada y purificada que comprende al menos una secuencia de nucleótidos de MAR seleccionada del grupo que comprende: una secuencia de DNA aislada y purificada de acuerdo con la invención, la secuencia SEQ ID No 25 o una de sus secuencias complementarias.
También está previsto un proceso para la producción de una proteína en donde una célula hospedante eucariótica es transfectada de acuerdo con los métodos de transfección definidos en la presente invención y se cultiva en un medio de cultivo en condiciones adecuadas para la expresión de la proteína. Dicha proteína se recupera finalmente de acuerdo con cualquier proceso de recuperación conocido por los expertos en la técnica.
Como ejemplo se podría usar el siguiente proceso para la producción de proteínas. La célula hospedante eucariótica transfectada por el método de transfección de la presente invención se usa en un proceso para la producción de una proteína cultivando dicha célula en condiciones adecuadas para la expresión de dicha proteína y recuperando dicha proteína. Las condiciones de cultivo adecuadas son las comúnmente usadas para el cultivo in vitro de células eucarióticas como se ha descrito, por ejemplo, en el documento WO 96/39488. La proteína puede ser aislada del cultivo celular por técnicas de separación convencionales, tales como, por ejemplo, fraccionamiento en columnas de inmunoafinidad o de cambio iónico; precipitación; HPLC en fase inversa; cromatografía; cromatoenfoque; SDS-PAGE; filtración por gel. Un experto en la técnica apreciará que los métodos de purificación adecuados para el polipéptido de interés pueden requerir modificaciones para tener en cuenta los cambios en las características del polipéptido en la expresión en el cultivo de células recombinantes.
La funcionalidad de las proteínas que se producen de acuerdo con esta invención se puede analizar por una variedad de métodos. Por ejemplo, la presencia de epítopos antigénicos y la capacidad de las proteínas para unir ligandos pueden determinarse por ensayos de transferencia Western, ensayos de clasificación de células fluorescentes, inmunoprecipitación, ensayos inmunoquímicos y/o ensayos de unión competitiva, así como cualquier otro ensayo que mida la actividad de unión específica.
Las proteínas de esta invención se pueden usar en cierto número de aplicaciones prácticas que incluyen, pero sin limitación:
1.
Inmunización con antígeno de proteína hospedante recombinante como antagonista de virus/agentes patógenos.
2.
Producción de proteínas de membrana para ensayos de diagnóstico o de cribado.
3.
Producción de proteínas de membrana para estudios bioquímicos.
4.
Producción de proteínas de membrana para estudios estructurales.
5.
Producción de antígenos para la generación de anticuerpos para cartografiado inmuno-histoquímico, incluyendo cartografiado de receptores huérfanos y canales iónicos.
La presente invención también proporciona una célula eucariótica hospedante transfectada de acuerdo con los métodos de transfección precedentes. Preferiblemente, la célula eucariótica hospedante es una línea celular hospedante no humana.
Como ya se ha descrito, los ejemplos de líneas celulares eucarióticas hospedantes de mamíferos útiles incluyen células humanas, tales como línea de células renales embrionarias humanas (células 293 o células 293 subclonadas para cultivo en suspensión, Graham et al., J. Gen Virol. 36, 59 (1977)), células de carcinoma cervical humano, tales como (HELA, ATCC CCL 2), células de pulmón humano (W138, ATCC CCL 75), células hepáticas humanas (Hep G2, HB 8065); células de roedores, tales como células de riñón de cría de hámster (BHK, ATCC CCL 10), células de ovario de hámster chino/-DHFR (CHO, Urlaub and Chasin, Proc. Nad. Acad. Sci. USA, 77, 4216 (1980)), células de tipo Sertoli de ratón (TM4, Mather, Biol. Reprod., 23, 243-251 (1980)), células de tumor mamario de ratón (MMT 060562, ATCC CCL 51); y células de otros mamíferos, tales como la línea CV1 de riñón de mono transformada por SV40 (COS-7, ATCC CRL 1651); células de riñón de mono (CV1 ATCC CCL 70); células de riñón de mono verde africano (VERO-76, ATCC CRL-1587); células de riñón canino (MDCK, ATCC CCL 34); células hepáticas de la rata búfalo (BRL 3A, ATCC CRL 1442); y células de mieloma (por ejemplo, NS0)/hibridoma.
Las más preferidas para usos en la presente invención son las células de ovario de hámster chino (CHO).
La presente invención también proporciona una mezcla o kit para transfección de células que comprende al menos una secuencia aislada y purificada de DNA de acuerdo con la invención.
La invención comprende además un organismo no humano transgénico caracterizado porque al menos algunas de sus células han incorporado establemente al menos una secuencia de DNA de acuerdo con la invención.
Preferiblemente, algunas de las células de estos organismos transgénicos han sido transfectadas de acuerdo con los métodos descritos en la presente memoria.
También se considera en la presente invención un organismo transgénico no humano caracterizado porque su genoma ha incorporado establemente al menos una secuencia de DNA de acuerdo con la invención.
Los organismos eucarióticos transgénicos que pueden ser útiles para la presente invención se seleccionan por ejemplo del grupo que comprende mamíferos (mono, ratón, etc.) y en particular animales de laboratorio, tales como roedores en general, insectos (Drosophila, etc.), peces (pez cebra, etc.), anfibios (rana, tritón, etc.) y otros organismos más sencillos, tales como el gusano C. elegans, levadura, etc....
Es incluso otro objeto de la presente descripción proporcionar un medio legible por ordenador que comprende instrucciones ejecutables en ordenador para realizar el método de identificación de una secuencia de MAR como se ha descrito en la presente descripción.
La descripción anterior se comprenderá más completamente con referencia a los siguientes Ejemplos. Sin embargo, dichos Ejemplos son ilustrativos de métodos de llevar a la práctica la presente invención y no están destinados a limitar su alcance.
EJEMPLOS
Ejemplo 1: Programa SMAR Scan® y secuencias de MAR
Se realizó una primera evaluación aproximada con el programa informático SMAR Scan® analizando las MAR humanas experimentalmente definidas de MAR y las secuencias que no son de MAR. Como secuencias de MAR, se usaron los resultados previos del análisis de MAR humanas procedentes de la SMARt DB para representar gráficamente un histograma de densidades para cada criterio, como se muestra en la Fig. 1. Similarmente, también se analizaron y representaron gráficamente las secuencias que no son de MAR. Como secuencias que no son de MAR se usaron todos los cóntigos (clones contiguos) de RefSeq procedentes del cromosoma 22, considerando que este último era suficientemente grande para contener una parte despreciable de secuencias de MAR respecto a la parte de secuencias que no son de MAR.
Las distribuciones de densidades mostradas en la Fig. 1 están todas sesgadas con una cola larga. Para la máxima curvatura, la máxima profundidad de la ranura mayor y la máxima anchura de la ranura menor, las distribuciones están sesgadas hacia la derecha. Para la mínima temperatura de fusión, las distribuciones están sesgadas hacia la izquierda lo que es natural dada la correspondencia inversa de este criterio respecto a los otros tres. Para las secuencias de MAR son realmente evidentes distribuciones bifásicas con un segundo pico débil. Y entre las distribuciones de secuencias de MAR y de secuencias que no son de MAR, es también visible en cada gráfica un claro desplazamiento.
Entre todas las secuencias de MAR humanas usadas, por término medio solo aproximadamente 70% de ellas tiene un valor mayor que el cuantil 75 de distribución de las MAR humanas, y esto para los cuatro diferentes criterios. Similarmente, en relación con el segundo pico débil de cada distribución de MAR humanas, solamente el 15% de las secuencias de MAR humanas son responsables de estos valores periféricos. Entre este 15% de secuencias de MAR humanas, la mayoría son secuencias de MAR muy bien documentadas, usadas para aislar un transgén de los efectos de posición, tales como la MAR del locus de interferón, la MAR del locus de beta-globina (Ramezani A, Hawley TS, Hawley RG, "Performance-and safety-enhanced lentiviral vectors containing the human interferon-beta scaffold attachment region and the chicken beta-globin insulator", Blood, 101: 4717-4724, 2003), o la MAR de apolipoproteína
(Namciu, S, Blochinger KB, Foumier REK, "Human matrix attachment regions insulate transgene expression from chromosomal position effects in Drosophila melanogaster", Mol. Cell Biol., 18:2382-2391, 1998).
Siempre con los mismos datos, las secuencias de MAR humanas también se usaron para determinar la asociación entre las cuatro propiedades estructurales teóricas calculadas y el contenido de AT. La Fig. 2 representa el diagrama de dispersión y el coeficiente de correlación correspondiente r para cada par de criterios.
Ejemplo 2: Gráficas de distribución de secuencias de MAR por organismo
Como se ha explicado previamente también se recuperaron y analizaron similarmente secuencias de MAR de la SMARt DB de otros organismos. Las distribuciones de densidades de secuencias de MAR para el ratón, el pollo, el sorgo bicolor y el hombre se representan gráfica y conjuntamente en la Fig. 3.
Ejemplo 3: Predicción de las MAR del cromosoma 22 completo
Todos los cóntigos de RefSeq del cromosoma 22 fueron analizados por el programa SMAR Scan® usando esta vez los ajustes predeterminados. El resultado es que el programa SMAR Scan® predijo un total de 803 MAR, siendo su longitud media 446 pb, lo que significa una media de una MAR predicha por 42.777 pb. La longitud total de las MAR predichas corresponde al 1% de la longitud del cromosoma 22. El contenido de AT de las regiones predichas variaba desde 65,1% a 93,3%; siendo el contenido medio de AT de todas estas regiones 73,5%. Por tanto, las MAR predichas eran ricas en AT, mientras que el cromosoma 22 no es rico en AT (52,1% de AT).
Se usó también el programa SMARTest para analizar el cromosoma 22 completo y se obtuvieron 1387 candidatas de MAR, siendo su longitud media 494 pb, lo que representa una media de una MAR predicha por 4.765 pb. La longitud total de las MAR predichas corresponde al 2% del cromosoma 22. Entre todas las MAR predichas por los dos programas informáticos, fueron encontradas por ambos programas 154 MAR predichas, lo que representa respectivamente 19% y 11% de las MAR predichas por los programas SMAR Scan® y SMARTest. Dada la longitud media de las MAR predichas por los programas SMAR Scan® y SMARTest, la probabilidad de tener por azar un solapamiento entre las predicciones de los programas SMAR Scan® y SMARTest es 0,0027% por predicción.
Para evaluar la especificidad de las predicciones por el programa SMAR Scan®, se realizaron análisis por el programa SMAR Scan® en secuencias barajadas al azar del cromosoma 22 (Fig. 4). Las secuencias barajadas fueron generadas usando 4 métodos diferentes: por una segmentación del cromosoma 22 en ventanas no solapantes de 10 pb y barajando separadamente los nucleótidos de cada ventana; por "scrambling" que significa una permutación de todos los nucleótidos del cromosoma; por "rubbling" que significa una segmentación del cromosoma en fragmentos de 10 pb y un ensamblaje aleatorio de estos fragmentos, y finalmente por cadenas de Markov de orden 1, siendo los diferentes estados la totalidad de los diferentes dinucleótidos de DNA y basándose basadas las probabilidades de transición entre estos estados en el escaneo del cromosoma 22. Para cada método de barajamiento, fueron generados y analizados por el programa SMAR Scan®, usando los ajustes predeterminados, cinco cromosomas 22 barajados. En relación con el número de coincidencias se encontró una media de 3.519.170 coincidencias (desviación típica: 18.353) para el cromosoma 22 permutado dentro de las ventanas no solapantes de 10 pb, 171.936,4 coincidencias (desviación típica: 2.859,04) para las secuencias sometidas a “scambling” y 24.708,2 coincidencias (desviación típica: 1.191,59) para el cromosoma 22 sometido a “rubbling” y 2.282 coincidencias de media (desviación típica: 334,7) para los cromosomas generados de acuerdo con los modelos de cadenas de Markov de orden 1 del cromosoma 22, lo cual representa respectivamente 185% (desviación típica: 0,5% de la media), 9% (desviación típica: 1,5%), 1% (desviación típica: 5%) y 0,1% (desviación típica: 15%) del número de coincidencias encontrado con el cromosoma 22 natural. Para el número de MAR predichas, que por tanto significa coincidencias contiguas de longitud mayor que 300 pb, fueron predichas 1.997 MAR con el cromosoma 22 barajado dentro de las ventanas de 10 pb (desviación típica: 31.,2), y se encontraron solamente 2,4 MAR candidatas en secuencias sometidas a “scrambling” (desviación típica: 0,96) y ninguna para las secuencias sometidas a “rubbling” y para las secuencias generadas de acuerdo con el modelo de cadenas de Markov, que representa respectivamente 249% y menos de 0,3% del número de MAR predichas encontradas con el cromosoma 22 natural. Estos datos proporcionan indicaciones de que el programa SMAR Scan@ detecta elementos de DNA específicos cuya organización se pierde cuando se barajan las secuencias de DNA.
Ejemplo 4: Análisis de regiones conocidas de fijación a la matriz en el locus del interferón con el programa SMAR Scan®
Se investigó la relevancia de la predicción de las MAR por el programa SMAR Scan® analizando las MAR recientemente publicadas del agrupación de genes del interferón humano en el brazo corto del cromosoma 9 (9p22). Goetze et al., (ya citados) describieron un análisis exhaustivo del locus WP18A10A7 para analizar la correlación sospechada entre las BUR (denominadas en este caso desestabilización de dúplex inducida por estrés o SIDD) y la unión in vitro a la matriz nuclear (Fig. 9, parte inferior). Tres de los picos de SIDD estaban de acuerdo con el ensayo de unión in vitro, mientras que otros no coincidían con los sitios de unión a la matriz. La inspección del locus del interferón con el programa SMAR Scan® (Fig. 9, parte superior) indicó que tres picos principales acompañados por agrupaciones de sitios de unión a los reguladores SATB1, NMP4 y MEF2 estaban bien correlacionados con las MAR activas. Por tanto, los inventores llegaron a la conclusión de que la existencia de los CUE predichos y de los sitios de unión para estos factores de transcripción no está restringida a las cLysMAR, sino que puede ser una propiedad general de todas las MAR. Estos resultados también implican que el programa SMAR Scan® detecta eficientemente elementos de MAR procedentes de secuencias genómicas.
Ejemplo 5: Precisión de la predicción por el programa SMAR Scan® y comparación con otras herramientas de predicción
Se evaluó la precisión del programa SMAR Scan® usando seis secuencias genómicas para las cuales se habían cartografiado unas MAR experimentalmente determinadas. Con el fin de realizar una comparación con otras herra5 mientas de predicción, las secuencias analizadas son las mismas que las secuencias usadas previamente para comparar los programas MAR-Finder y SMARTest. Estas secuencias genómicas son tres secuencias de vegetales y tres secuencias humanas (Tabla 1) que totalizan 310.151 pb y 37 MAR experimentalmente definidas. Los resultados de los programas SMARTest y MAR-Finder de la Tabla 1 proceden de una comparación previa (Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold/matrix attachment regions in large
10 genomic sequences", Genome Research, 12:349-354, 2001). El programa MAR-Finder se ha usado con los parámetros predeterminados excepto para el valor umbral que se ha fijado en 0,4 y para el análisis del locus de protamina, ha sido excluida la regla de la riqueza en AT (para detectar las MAR no ricas en AT como se hizo para el locus de la protamina).
Tabla 1: Evaluación de la precisión del programa SMAR Scan®
Descripción y referencia de las secuencias
Longitud (kb) Posiciones de MAR experimentalmente definidas (kb) Posiciones predichas por SMARTest (kb) Posiciones predichas por MAR-Finder (kb) Posiciones predichas por SMAR Scan (kb)
Gen SH2 supuesto de la sub-unidad
30,034 0,0-1,2 - - -
de ADP-glusosapirofosforilasa y gen supuesto de reductasa A1 dependiente de
5,4-7,4 6,5-7,0 152-15,7 162-16,6 -15,7-15,9 - -15,6-16 -
NADPH de Oryza Sativa
17,3-18,5 17,6-18,3 17,5-18,4 17,6-18,2
(U700541) [4]
20,0-23,1 19,6-20,1 20,1-21,3 23,6-23,9 26,0-25,4 27,5-27,9 19,8-20,4 21,3-21,5 23,9-24,2 24,7-25,1 - 21,6-22 -23,4-23,8 --
Genes SH2 de la subunidad de ADP-
42,446 0,0-1,6 - - -
glucosapirofosforilasa y de reductasa A1-b dependiente
7,1-9,7 -21,3-21,9 -- 7,4-7,7 21,5-21,8
de NADPH del sorgo bicolor (AF010283) [4]
22,4-24,7 22,9-24,0 -27,3-27,6 23,2-24,2 -26,9-27,6 22,9-23,2 23,6-24,0 27,3-27,6
32,5-33,7
- - 33,4-33,9
41,6-42,3
- - -
Clon 110K5 del
78,195 ~0,9 - - -
BAC del
sorgo bicolor
~5,8 - - -
(AF124045) [37]
~6,3 - - -
~9,3
- - -
~15,0
15,1-15,8 - -
~18,5
- - -
~21,9
29,7-22,0 - 21,4-21,9
~23,3
- - -
~25,6
- - -
~29,1
- - 29,2-29,5
~34,6
- - -
Tabla 1 (Continuación)
Descripción y referencia de las secuencias
Longitud (kb) Posiciones de MAR experimentalmente definidas (kb) Posiciones predichas por SMARTest (kb) Posiciones predichas por MAR-Finder (kb) Posiciones predichas por SMAR Scan (kb)
-
-
39,0-40,0
~44,1
44,1-44,5 -
~48,5
47,9-49,5 - 47,9-49,4 - 48,1-48,6 48,8-49,3
~57,9
- - -
~62,9
63,1-63,7 - -
~67,1
- - -
~69,3
- - -
~73,7
74,3-74,7 - 74,3-74,6
Región intergénica de alfa-1-antitripsina
30,461 2,6-6,3 5,5-6,0 3,0-3,2 5,4-5,8
humana y globulina de unión a corticoste
- 5,1-6,0 -
roides
22,0-30,4 26,7-2,2 24,9-25,3 25,8-26,4
(AF156545), [35]
27,5-27,8 25,5-25,8
-
26,2-26,4
-
-
27,5-29,2
-
Locus de la protamina
53,060 8,8-9,7 - 8,0-8,9 -
humana
(U15422) [24]
32,6-33,6 - 33,9-34,8* -
37,2-39,4
- 33,9-34,8* -
51,8-53,0
- -* -
Locus de la betaglobina humana
75,955 1,5-3,0 - - 2,3-2,6
(U01317), [21]
15,6-19,0 18,0-18,4 -34,4-34,9 15,5-16,0 18,0-18,4 - 15,3-15,6 --
44,7-52,7
- 50,6-50,8 -
60,0-70,0
55,6-57,1 59,8-60,3 65,6-66,0 67,6-67,9 68,8-69,1 56,5-57,2 58,1-58,5 63,0-63,6 69,7-69,3 - -62,5-63,1 -66,3-66,7 -
Suma (kb)
310,151 al menos 56,1 14,5 13,8 9,5
Números totales:
37 28 25 22
Kb media/MAR predichas
11,076 12,406 14,097
Positivas verdaderas [número de MAR experimentalmente definidas encontradas]
19[14] 20[12] 17[14]
positivas falsas
9 5 5
negativas falsas
23 25 23
Especificidad
19/28 = 68% 20/25 = 80% 17/22= 77%
Sensibilidad
14/37 = 38% 12/37 = 32% 14/37 = 38%
Se analizaron con los programas MAR-Finder, SMARTest y SMAR Scan® seis secuencias genómicas diferentes, tres secuencias de vegetales y tres humanas, para las cuales se conocen MAR experimentalmente definidas. Las 5 coincidencias positivas verdaderas aparecen en la tabla anterior en números en negrita, el signo menos (-) indica coincidencias negativas falsas. Algunas de las MAR experimentalmente definidas más largas contenían más de una predicción in silico (es decir, realizada por el programa), cada una de ellas fue contada como coincidencia positiva verdadera. Por tanto, el número de predicciones verdaderas in silico es superior al número encontrado de MAR experimentalmente definidas. La especificidad se define como la relación entre las predicciones positivas verdaderas 10 y el número total, mientras que la sensibilidad se define como la relación entre las MAR experimentalmente definidas
encontradas y el número total. *La regla de riqueza en AT excluyó el uso del programa MAR-Finder.
El programa SMARTest predijo 28 regiones como MAR, 19 (positivas verdaderas) de estas están correlacionadas con las MAR experimentalmente definidas (especificidad: 68%), mientras que 9 (32%) están localizadas en regiones que no son MAR (positivas falsas). Como algunas de las MAR experimentalmente determinadas más largas contienen más de una predicción in silico, las 19 positivas verdaderas corresponden realmente a 14 MAR experimentalmente definidas diferentes (sensibilidad: 38%). El programa MARFinder predijo 25 regiones como MAR, 20 (especificidad: 80%) de estas están correlacionadas con las MAR experimentalmente definidas correspondientes a 12 MAR experimentalmente definidas diferentes (sensibilidad: 32%). El programa SMAR Scan@ predijo 22 regiones, siendo 17 positivas verdaderas (especificidad: 77%) que coinciden con 14 MAR experimentalmente definidas diferentes (sensibilidad: 38%).
Como otro ejemplo, se ha aplicado el mismo análisis a los cromosomas humanos 1 y 2 y condujo a la determinación de 23 secuencias de MAR (SEQ ID No 1 a 23). Estas secuencias están recogidas en el Anexo 1 en formato ST25.
Ejemplo 6: Análisis del genoma completo usando el método combinado (SMAR Scan®-pfsearch)
Con el fin de analizar la correlación potencial entre las características estructurales analizadas por el programa SMAR Scan@ y la actividad funcional de las S/MAR, ha sido analizado el genoma humano completo con el método combinado con parámetros muy restrictivos, con el fin de obtener secuencias con los valores más altos para las características estructurales teóricas analizadas por ordenador, que en lo sucesivo son las llamadas "super" S/MAR. Esto se hizo con la esperanza de obtener elementos de MAR predichos con un alto potencial de aumentar la expresión de transgenes y la producción de proteína recombinante. Las supuestas S/MAR así obtenidas fueron analizadas primeramente desde la perspectiva de la bioinformática en un intento de caracterizarlas y clasificarlas.
6.1 S/MAR predichas por el análisis del genoma humano completo
Como secuencia del genoma humano completo, se usaron todos los cóntigos humanos de RefSeq (National Center for Biotechnology Information, The NCBI Handbook [Internet]. Bethesda (MD): National Library of Medicine (US), Oct. Chapter 17, The Reference Sequence (RefSeq) Project, 2002 (Disponible en http://www.ncbi.nih.gov/entrez /query.fcgi?db=Books) (publicación 5) y se analizaron con el método combinado, usando el programa SMAR Scan® como filtro en el procesamiento del primer nivel, empleando los ajustes predeterminados excepto para el valor máximo de exclusión de curvatura, mientras que se ha usado un umbral restringido de 4,0 grados (en lugar de 3,202 grados) para el criterio de curvatura del DNA.
En el procesamiento del segundo nivel, se han buscado los sitios de unión a los factores de transcripción en las secuencias seleccionadas de la etapa previa sin realizar ningún filtrado de estas secuencias.
Los análisis por el método combinado del genoma humano completo dieron un total de 1757 supuestas "super" S/MAR que representan un total de 1.065.305 pb (0,35% del genoma humano completo). La Tabla 2 muestra para cada cromosoma: su tamaño, su número de genes, su número de S/MAR predichas, su densidad de S/MAR por cada gen y sus kb por S/MAR. Esta Tabla muestra que hay densidades de genes muy diversos por cada S/MAR predicha para los diferentes cromosomas (la deviación típica representa más del 50% de la media de la densidad de genes por S/MAR predicha y la diferencia entre la densidad de genes mayor y menor por S/MAR es 6,5 veces). La Tabla 2 también muestra que las kb por S/MAR varían menos que la densidad de genes por S/MAR (la deviación típica representa 25% de la media de kb por S/MAR y la diferencia entre los kb mayores y los menores por S/MAR es 3,2 veces).
Tabla 2: Número de S/MAR predichas por cromosoma. El número de genes por cromosoma corresponde a estadísticas del genoma humano de NCBI (Build 34, Versión 3)
Cromosoma
Número de genes por cromosoma Tamaño del cromosoma (millones de pb) Número de S/MAR predichas Densidad de genes por S/MAR Kb por S/MAR
1
2544 230 85 29,9 2705
2
1772 241 143 12,3 1685
3
1406 198 101 13,9 1960
4
1036 190 118 8,7 1610
5
1233 180 116 10,6 1551
6
1247 170 94 13,2 1808
7
1383 160 179 7,7 1754
8
942 145 77 12,2 1883
9
1100 119 48 22,9 2479
10
1003 133 71 14,1 1873
11
1692 132 67 25,2 1970
12
1278 131 78 16,3 1679
13
506 97 70 7,2 1385
14
1168 88 36 32,4 2444
15
895 83 35 25,5 2371
16
1107 81 41 27 1975
17
1421 80 37 38,4 2162
18
396 75 31 7,7 1470
19
1621 56 36 45,02 1555
20
724 60 28 25,8 2142
21
355 34 18 19,7 1888
22
707 34 28 25,2 1214
X
1168 154 170 6,8 905
Y
251 25 30 83 833
Suma Media Desviación típica
26.955 1.123 510 3.050 127 72,8 1.757 73 45 457 19 10 43.312 1.804 462
Los datos del National Center for Biotechnology Information, The NCBI Handbook [Internet]. Bethesda (MD): National
5 Library of Medicine (US), Oct. Chapter 17, The Reference Sequence (RefSeq) Project, 2002 (Disponible en http: //www.ncbi.nih.gov/entrez/query.fcgi?db=Books) se basan en anotaciones del GenBank. Los tamaños de los cromosomas son la suma de las correspondientes longitudes de cóntigos humanos de RefSeq (National Center for Biotechnology Information, The NCBI handbook [Internet]. Bethesda (MD): National Library of Medicine (US), Oct. Chapter 17, The Reference Sequence (RefSeq) Project, 2002 (Disponible en http: //www.ncbi.nih.gov/entrez
10 /query.fcgi?db=Books) (publicación 5).
6.2 Análisis bioinformático de las "super" MAR para sitios de unión a factores de transcripción.
Luego se analizaron los potenciales sitios de unión a los factores de transcripción de las 1757 secuencias "super" S/MAR predichas obtenidas previamente por el programa SMAR Scan@. Esto se ha conseguido usando el programa RMatch™ Professional (Kel AE, Gossling E, Reuter I, Cheremushkin E, KelMargoulis OV, Wingender E, MATCH: 15 "A tool for searching transcription factor binding sites in DNA sequences", Nucleic Acids Res. 31(13):35769, 2003), una herramienta basada en una matriz ponderada, basada a su vez en el programa TRANSFAC (Wingender E, Chen X, Fricke E, Geffers R, Hehl R, Liebich I, Krull M, Matys V, Michael H, Ohnhauser R, Pruss M, Schacherer F, Thiele S, Urbach S, "The TRANSFAC system on gene expression regulation", Nucleic Acids Research, 29(1):2813, 2001). Se ha usado el programa Match 2.0 Professional con la mayoría de los ajustes predeterminados. El análisis
20 por el programa Match estaba basado en el programa TRANSFAC Professional, versión 8.2 (20040630). Las sumas de todas las predicciones de los sitios de unión a los factores de transcripción en las 1757 secuencias analizadas de acuerdo con el programa Match se recogen en la Tabla 3. En base a esta Tabla, solamente los factores de transcripción que totalizan al menos 20 coincidencias en las 1757 secuencias analizadas fueron considerados para análisis posterior.
25 A continuación se dan algunos de los factores de transcripción humanos que son los más frecuentemente predichos para unirse a las 1757 supuestas secuencias de S/MAR y su descripción por el programa Match: Cdc5 (proteína 5 del control de la división celular) un regulador/represor transcripcional, Nkx3A una proteína de homeodominio regulada por andrógeno, POU1F1 (factor 1 de transcripción positiva específica de la pituitaria) que es específico de la pituitaria y estimula la proliferación celular. Por tanto, en la actividad de las MAR, además de SATB1, NMP4 y MEF2,
30 pueden participar otros factores de transcripción.
La Tabla 3 es un resumen de todas las predicciones de sitios de unión a los factores de transcripción (totalizando 20 coincidencias o más) en las 1757 secuencias analizadas.
AP1
1 AR 2 Bach2 1 Brn2 1
C/EBP
20 C/ 5 CDP CR3 1 COMP1 2
EBPgamma
CREBP1
34 Cdc5 858 Cdx2 35 Evil 472
FOX
78 FOXD3 79 FOXJ2 244 FOXP3 29
Freac7
272 GATA1 2 GATA3 142 GATA4 125
HFH1
12 HFH3 1 HLF 275 HNF1 337
HNF3alfa
23 HNF3beta 71 HP1 2 Lhx3 22
MEF2
114 MRF2 57 Myc 18 NKX3A 849
Nkx25
2 Oct1 191 PBX 5 POU1F1 483
POU3F2
11 POU6F1 29 Pax3 3 Pax6 20
Pit1
505 SRF 8 TEF 2852 TFIIA 14
TTF1
1 V$MTATA_B 4 VBP 53 Vmw65 1
XFD1
65 XFD2 418 XFD3 2
5 6.3 Análisis bioinformático de las "super" MAR para determinar las frecuencias de nucleótidos.
Se realizaron diversos análisis por ordenador con el fin de identificar fácilmente secuencias de "super" S/MAR usando un criterio explícito que pudiera ser identificado sin empleo de ordenador. Entre estos, se realizó un análisis de dinucleótidos en las 1757 super MAR, calculando cada uno de los 16 posibles porcentajes de dinucleótidos para cada secuencia considerando ambas cadenas en la dirección 5’ > 3’.
10 Un resumen (mínimo, máximo, mediana, media, percentil 25 y percentil 75), así como los histogramas de cada porcentaje de dinucleótido en las 1757 secuencias de S/MAR se representan respectivamente en la Tabla 4. Se realizó un análisis similar en secuencias seleccionadas al azar a partir del genoma humano, que representan aleatoriamente las secuencias seleccionadas que no son de S/MAR (que, sin embargo, podrían contener algunas MAR). La Tabla 5 representa respectivamente un resumen del análisis del contenido de dinucleótidos de estas secuencias.
15 Tabla 4: Porcentajes de dinucleótidos en 1757 secuencias de S/MAR Considerando los resultados de los elementos de S/MAR predichos y de las secuencias que no son de S/MAR en las tablas de resumen, pueden apreciarse diferencias notables en los contenidos de los dinucleótidos AT y TA entre estos dos grupos de secuencias. AT y TA representan respectivamente al menos 18,5% y 28,6% del contenido de dinucleótidos de las secuencias de S/MAR predichas, mientras que los porcentajes mínimos de los mismos dinucleó
AA%
AC% AG% AT%
Mínimo
0,000 0,0000 0,0000 18,50
Percentil 25
4,234 0,9372 0,1408 32,11
Mediana
7,843 2,2408 0,4777 34,68
Media
7,184 3,2117 1,0865 34,32
Percentil 75
10,110 4,7718 1,5096 36,94
Máximo
17,290 12,9479 8,1230 50,00
CA%
CC% CG% CT%
Mínimo
0,0000 0,00000 0,0000 0,0000
Percentil 25
0,9695 0,00000 0,0000 0,1408
Mediana
1,9776 0,00000 0,0000 0,4777
Media
2,6977 0,14123 0,2709 1,0865
Percentil 75
3,7543 0,09422 0,1256 1,5096
Máximo
10,4061 4,24837 7,4410 8,1230
GA%
GC% GG% GT%
Mínimo
0,00000 0,0000 0,00000 0,0000
Percentil 25
0,08696 0,0000 0,00000 0,9372
Mediana
0,32616 0,0000 0,00000 2,2408
Media
0,63347 0,2104 0,14123 3,2117
Percentil 75
0,83333 0,1914 0,09422 4,7718
Máximo
5,77889 9,8795 4,24837 12,9479
TA%
TC% TG% TT%
Mínimo
28,63 0,00000 0,0000 0,000
Percentil 25
33,48 0,08696 0,9695 4,234
Mediana
35,22 0,32616 1,9776 7,843
Media
35,29 0,63347 2,6977 7,184
Percentil 75
37,14 0,83333 3,7543 10,110
Máximo
50,00 5,77889 10,406 17,290
5 tidos en secuencias que no son S/MAR son respectivamente 0,3% y 0%. Similarmente, el máximo contenido de CC y GG en secuencias de S/MAR es 4,2%, mientras que en secuencias que no son de S/MAR los porcentajes de estos dos dinucleótidos pueden ascender hasta 20,8 %.
La correlación entre los porcentajes de los dinucleótidos AT y TA y la máxima curvatura de DNA calculada por el programa SMAR Scan@ se representa en la Fig. 17 para las secuencias de S/MAR predichas y en la Fig. 18 para
10 las secuencias que no son de S/MAR. Los diferentes diagramas de dispersión de estas figuras muestran que el porcentaje de TA está bien correlacionado con la curvatura de DNA predicha por el programa SMAR Scan®.
Tabla 5: Resumen de los porcentajes de dinucleótidos en 1757 secuencias que no son de S/MAR
AA%
AC% AG% AT%
Mínimo
0,000 1,735 1,512 0,3257
Percentil 25
7,096 4,586 6,466 5,1033
Mediana
9,106 5,016 7,279 6,8695
Media
8,976 5,054 7,184 7,0108
Percentil 75
10,939 5,494 7,969 8,7913
Máximo
17,922 13,816 12,232 23,1788
CA%
CC% CG% CT%
Mínimo
3,571 0,8278 0,0000 1,512
Percentil 25
6,765 4,1077 0,4727 6,466
Mediana
7,410 5,5556 0,8439 7,279
Media
7,411 5,9088 1,2707 7,184
Percentil 75
8,010 7,2460 1,5760 7,969
Máximo
15,714 20,8415 12,6074 12,232
GA%
GC% GG% GT%
Mínimo
1,319 0,4967 0,8278 1,735
Percentil 25
5,495 3,2615 4,1077 4,586
Mediana
6,032 4,4092 5,5556 5,016
Media
6,065 4,7468 5,9088 5,054
Percentil 75
6,602 5,8824 7,2460 5,494
Máximo
10,423 16,0000 20,8415 13,816
TA %
TC % TG% TT%
Mínimo
0,000 1,319 3,571 0,000
Percentil 25
3,876 5,495 6,765 7,096
Mediana
5,625 6,032 7,410 9,106
Media
5,774 6,065 7,411 8,976
Percentil 75
7,464 6,602 8,010 10,939
Máximo
24,338 10,423 15,714 17,922
Se escogieron al azar cuatro de las nuevas super MAR, se analizó el contenido de los dinucleótidos AT y TA y se 15 comparó con las lysMAR de pollo previamente conocidas, considerando ventanas de 100 pares de bases (Tabla 6).
Sorprendentemente, los inventores han encontrado que la totalidad de las super MAR tienen frecuencias del dinucleótido AT mayores del 12%, y frecuencias del dinucleótido TA mayores del 10% de los dinucleótidos totales analizados en una ventana de 100 pares de bases del DNA. Las MAR más eficientes presentan valores de alrededor de 34% de los dos pares de dinucleótidos.
20 Tabla 6. Resumen de las frecuencias en % de los dinucleótidos AT y TA de las MAR experimentalmente verificadas
cLysMAR (media de los CUE)
AT%: 12,03 TA% : 10,29 SEQ ID No
P1 68
AT%: 33,78 TA% : 33,93 SEQ ID No
P1 6
AT%: 34,67 TA% : 34,38 SEQ ID No
P1 42
AT%: 35,65 TA%: 35,52 SEQ ID No
Valor medio para todas las "super" MAR humanas
AT%: 34,32 TA% : 35,29
Valor medio para todas las que no son "super" MAR humanas
AT%: 7,01 TA% : 5,77
6.4 Análisis de regiones intergénicas ortólogas de los genomas del ser humano y del ratón.
Con el fin de obtener una comprensión de la evolución de las S/MAR se han analizado con el programa SMAR Scan® regiones intergénicas ortólogas de genomas del ser humano y del ratón. El conjunto de datos usados está compuesto de 87 pares de regiones intergénicas ortólogas completas de los genomas del ser humano y del ratón (Shabalina SA, Ogurtsov AY, Kondrashov VA, Kondrashov AS, "Selective constraint in intergenic regions of human and mouse genomes", Trends Genet., 17(7):3736, 2001) (longitud media -12.000 pb) localizadas en los cromosomas 12 humano y 12 de ratón. La sintonía de estas secuencias se confirmó por alineamiento de secuencias por pares de bases y la consideración de las anotaciones de los genes flanqueantes (experimental o predicha).
El análisis de las 87 secuencias intergénicas ortólogas humanas y de ratón ha sido realizado con el programa SMAR Scan® usando sus ajustes predeterminados. El análisis de las secuencias humanas proporcionó un total de 12 S/MAR predichas (lo que representa una longitud total de 4.750 pb), localizadas en 5 secuencias intergénicas diferentes.
Entre las tres secuencias intergénicas humanas para las que se predice que contienen una "super" S/MAR usando los ajustes restrictivos del programa SMARScan@, también se predice una secuencia intergénica ortóloga de ratón correspondiente que contienen una S/MAR (EMBL ID humana: Z96050, posiciones 28.010 a 76.951 ortólogas al EMBL ID de ratón: AC015932, posiciones 59.884 a 89.963). Cuando se realiza un alineamiento local de estas dos secuencias intergénicas ortólogas, el mejor alineamiento local de estas dos grandes regiones corresponde a las regiones que el programa SMAR Scan® predice que es el elemento S/MAR. Usando el programa Ensembl Genome Browser (hftp://ensembl.org) se realizó una búsqueda manual de las secuencias ortólogas de ratón de las otras dos secuencias intergénicas humanas de las que se predijo que contenían una "super" S/MAR. Las secuencias intergénicas ortólogas de ratón de estas dos secuencias humanas se recuperaron usando predicciones ortólogas por el programa Ensembl (basadas en nombres de genes), buscando los genes de ratón ortólogos para los pares de genes humanos que flanquean estas regiones intergénicas.
Debido a que el programa SMAR Scan® ha sido afinado para secuencias humanas y en consecuencia proporciona pocas "super" MAR con secuencias genómicas de ratón, sus valores de exclusión predeterminados estaban relativamente relajados para el tamaño mínimo de las coincidencias contiguas que son consideradas S/MAR (usando 200 pb en lugar de 300 pb). El análisis por el programa SMAR Scan@ de estas secuencias de ratón predijo varias S/MAR que tienen altos valores para las diferentes características estructurales calculadas. Este hallazgo sugiere que los elementos de las MAR humanas se conservan a través de las especies.
Ejemplo 7: Disección de la 5’- MAR del gen de la lisozima de pollo
La 5’-MAR de 3000 pares de bases se diseccionó en fragmentos más pequeños que fueron monitorizados para efectuar la expresión de transgenes en células de ovario de hámster chino (CHO). Para hacerlo así, se generaron siete fragmentos de ~400 pb por reacción en cadena de la polimerasa (PCR). Estos fragmentos amplificados por PCR eran contiguos y cubren la secuencia de MAR completa cuando se colocan extremo-con-extremo. Se ligaron cuatro copias de cada uno de estos fragmentos en orientación cabeza-a-cola, para obtener una longitud correspondiente a aproximadamente la mitad de la MAR natural. Los tetrámeros fueron insertados hacia el extremo 5' del promotor de SV 40 en pGEGFP Control, una versión modificada del vector pGL3 Control (Promega). El plásmido pGEGFP Control fue creado cambiando el gen de la luciferasa de pGL3 Control por el gen EGFP de pEGFP-N1 (Clontech). Los plásmidos que contenían el fragmento 5'-MAR así creados fueron co-transfectados con el plásmido de resistencia pSVneo en células de CHO-DG44 usando LipofectAmine 2000 (Invitrogen) como reactivo de transfección, como se realizó previamente (Zahn-Zabal, M., et al., "Development of stable cell lines for production or regulated expression using matrix attachment regions", J. Biotechnol., 2001. 87(1): p. 29-42.). Después de la selección de células (G-418) resistentes a antibióticos, se analizaron por un FACS poblaciones de células policlonales por fluorescencia de EGFP.
La expresión de transgenes se expresó como el percentil de células de alta expresión, definidas como las células cuyos niveles de fluorescencia son al menos 4 órdenes de magnitud más alto que la fluorescencia media de células transfectadas con el vector pGEGFP Control sin MAR. La Fig. 5 muestra que los fragmentos multimerizados B, K y F aumentan la expresión de transgenes, a pesar de su tamaño más corto en comparación con la secuencia de MAR original. En contraste, otros fragmentos son escasamente activos o completamente inactivos.
Ejemplo 8: Especificidad de las regiones B, K y F en el contexto de las MAR
La 5'-MAR fue sometida a deleción en serie desde el extremo 5' (Fig. 6, parte superior) o desde el extremo 3' (Fig. 6, parte inferior), respectivamente. El efecto de los elementos truncados fue monitorizado en un ensayo similar al descrito en el apartado previo. La Figura 6 muestra que la pérdida de capacidad para estimular la expresión de transgenes en células de CHO no estaba uniformemente distribuida.
En este estudio de deleción, la pérdida de actividad de MAR coincidía con regiones discretas de transición que se solapan con los fragmentos B, K y F de 5’-MAR, respectivamente. En deleciones en el extremo 5', la actividad fue perdida mayoritariamente cuando fueron eliminados los fragmentos K y F. Las deleciones en el extremo 3' que eliminaban los elementos F y B tenían los efectos más pronunciados. En contraste, las regiones flanqueantes A, D, E y G tenían poca o ninguna capacidad para estimular la expresión de transgenes por sí mismas (Fig. 5), y en consecuencia no contribuyeron a la actividad de MAR en los estudios de deleción en los extremos 5’ y 3’ (Fig. 6).
Ejemplo 9: Estructura del elemento F.
El fragmento F de 465 pb fue diseccionado adicionalmente en sub-fragmentos más pequeños de 234, 243, 213 pb y de 122, 125 y 121 pb, respectivamente. Los fragmentos del primer grupo fueron octamerizados (8 copias) en una orientación cabeza-a-cola, mientras que los del segundo grupo fueron similarmente hexadecamerizados (16 copias), para mantener una longitud constante de la secuencia de MAR. Estos elementos se clonaron en el vector pGEGFP Control y sus efectos se analizaron en células de CHO como se ha descrito previamente. Curiosamente, el fragmento FIII retuvo la mayor parte de la actividad del fragmento F de longitud completa, mientras que el fragmento FII que contenía la parte lateral derecha del fragmento FIII, perdió toda la capacidad de estimular la expresión de transgenes (Fig. 7). Esto sugiere que la región activa comprendía entre 132 nucleótidos y 221 nucleótidos en el fragmento FIB. Consecuentemente, las múltiples copias de los fragmentos FI y FIB, que abarcan esta región, exhibían una actividad similar. FIIA por sí mismo no tiene actividad. Sin embargo, cuando se añade a FIB, dando como resultado FIII, potencia la actividad del primero. Por lo tanto, FIIA parece contener una secuencia auxiliar que tiene poca actividad por sí misma, pero que refuerza la actividad del dominio mínimo localizado en FIB.
En la Fig. 8A se muestra el análisis de la distribución de restos individuales dentro de la 5’-MAR del gen de la lisozima, junto con algunos restos adicionales que los inventores añadieron al análisis. Se encontró que la mayoría de estos restos estaban dispersos en todo el elemento de MAR, y no estaban específicamente asociados con las porciones activas. Por ejemplo, los sitios de unión de los factores de transcripción y otros restos que han estado asociados con las MAR no fueron preferentemente localizados en las regiones activas. También se ha propuesto que las secuencias de MAR activas pueden consistir en una combinación de restos distintos. Se han descrito varios programas informáticos (MAR Finder, SMARTest, SIDD duplex stability) para identificar las MAR como regiones de DNA que se asocian a la matriz de DNA. Dichos programas se basan usualmente en algoritmos que utilizan una serie predefinida de modelos específicos de secuencias que se ha sugerido previamente que contienen actividad de MAR, como lo ilustro el programa MAR Finder, actualmente conocido como el programa MAR Wiz. Los resultados obtenidos con estos programas no se correlacionan bien con las porciones transcripcionalmente activas de cLys-MAR. Por ejemplo, los picos de actividad obtenidos con el programa MAR Finder no coincidían claramente con las sub-porciones de MAR activas, como por ejemplo el fragmento B es bastante activo in vivo, pero da un puntuación negativa con el programa MAR Finder (Fig. 8B, compárense los paneles superior y central). Las estructuras de DNA curvado, como las predichas por este programa, no se correlacionaban bien con la actividad (Fig. 8B, compárense los paneles superior e inferior). Se obtuvieron resultados similares con los otros programas disponibles (datos no mostrados).
Por tanto, es improbable que los restos identificados por los métodos informáticos disponibles de predicción de las MAR sean los determinantes principales de la capacidad de las cLysMAR de aumentar la expresión de genes. Por consiguiente, se analizaron cierto número de otras herramientas informáticas. Sorprendentemente, se encontró que las secuencias de unión al nucleosoma predichas y las secuencias que no favorecen la unión al nucleosoma estaban dispuestas en agrupaciones intercaladas repetitivamente en las MAR, con los sitios que favorecen la unión al nucleosoma que se solapan con las regiones B, K y F activas. Se propusieron secuencias de posicionamiento del nucleosoma que consistían en tramos de DNA que pueden envolver fácilmente a las histonas del nucleosoma, y las cuales no han sido asociadas previamente con las secuencias de las MAR.
Las secuencias que favorecen la unión al nucleosoma pueden ser modeladas mediante un conjunto de características del DNA que incluyen secuencias moderadamente repetidas y otros parámetros físico-químicos que pueden permitir la sincronización y la orientación correctas del DNA sobre la superficie curvada de las histonas. La identificación de muchas de estas propiedades del DNA puede ser analizada por ordenador, y se han usado hasta 38 de estas diferentes propiedades para predecir posiciones potenciales del nucleosoma. Por consiguiente, los inventores decidieron determinar si los componentes específicos de los programas de predicción del nucleosoma podrían estar correlacionados con la actividad de las MAR, con el objetivo de construir una herramienta que permita la identificación de nuevas, y posiblemente más potentes, MAR a partir de secuencias genómicas.
Para determinar si algunos aspectos de la secuencia primaria del DNA podrían distinguir las regiones B, K y F activas de la secuencia de MAR circundante, los inventores analizaron las 5’-MAR con el programa MAR Scan®. De las 38 herramientas de predicción de la disposición del nucleosoma se encontraron tres que estaban correlacionadas con la localización de los sub-dominios activos de MAR (Fig. 9A). La localización de las regiones B, K y F en las MAR coincide con los valores máximos de curvatura del DNA, la profundidad de la ranura mayor y la anchura de la ranura menor. También se observó una correlación más débil con los valores mínimos de la temperatura de fusión del DNA, determinada por su contenido de GC. La cartografía afinada del fragmento F de las MAR indicó que el valle de la temperatura de fusión y la cima de la curvatura del DNA se corresponden realmente con el sub-fragmento FIB que contiene el dominio mínimo de las MAR (Fig. 9B). Por tanto, las porciones activas de las MAR pueden corresponder a las regiones predichas por este programa como regiones de DNA curvadas, y en el texto siguiente se hará referencia a estas regiones como CUE-B, CUE-K y CUE-F. No obstante, se desconoce si estas regiones corresponden al DNA curvado real y a las regiones de desenrollamiento de pares de bases (BUR), puesto que no corresponden al DNA curvado predicho por el programa MAR Wiz (Fig. 9B).
Ejemplo 10: Huellas de otros elementos reguladores en el fragmento F
Las características de posicionamiento del nucleosoma pueden ser consideradas como uno de los muchos códigos específicos de la cromatina contenidos en el DNA genómico. Aunque este código particular puede contribuir a la actividad de la región F, es improbable determinar la actividad de las MAR solas, puesto que la parte 3' de la región F potenciaba la actividad del dominio mínimo de MAR contenido en la porción FIB. Usando el programa MatInspector (Genomatix), los inventores buscaron los sitios de unión al factor de transcripción con puntuaciones superiores a 0,92 y encontraron secuencias de unión a DNA para las proteínas NMP4 y MEF2 en la parte 3' del fragmento F (Fig. 8B). Para determinar si algunos de estos sitios de unión a factores de transcripción podría estar localizado próximo a las regiones B y K activas, se analizó la secuencia completa de 5'-MAR para determinar la unión por NMP4, MEF2 y las proteínas que se descrito que se unen a la forma monocatenaria o bicatenaria de las BUR. Entre estas, SATB1 (proteína 1 de unión especial rica en AT) pertenece a una clase factor de transcripción que se une a DNA que puede activar o reprimir la expresión de genes cercanos. Este estudio indicó que proteínas específicas, tales como SATB1, NMP4 (proteína 4 de la matriz nuclear) y MEF2 (factor potenciador miogénico 2) tienen una distribución específica y forman un armazón alrededor de los dominios mínimos de MAR de cLysMAR (Fig. 10). La presencia de varios de estos sitios de unión a NMP4 y SATB1 ha sido confirmada experimentalmente por análisis EMSA de proteínas recombinantes purificadas (datos no mostrados).
Ejemplo 11: Construcción de MAR artificiales por combinación de elementos genéticos definidos
Para determinar además los papeles relativos de los diversos componentes de MAR, se suprimió cLysMAR de las tres regiones de CUE (Fig. 11, parte central), lo cual dio como resultado la pérdida de parte de su actividad cuando se compara con la secuencia de MAR completa ensamblada similarmente a partir de todos sus componentes como control (Fig. 11, parte superior). Consecuentemente, una copia de cada CUE sola, o una copia de los tres CUE ensamblados cabeza-a-cola, tenía poca actividad en ausencia de las secuencias flanqueantes. Estos resultados refuerzan la conclusión de que la actividad transcripcional óptima requiere la combinación de los CUE con las secuencias flanqueantes. Curiosamente, la secuencia de MAR completa generada a partir de cada uno de sus componentes, pero que también contiene las secuencias del conector Bglll-BamHl (AGATCC) usadas para ensamblar cada fragmento de DNA, exhibió alta actividad transcripcional (activación de 6 veces) en comparación con las 4,8 veces observadas para el elemento de MAR original en esta serie de ensayos (véase la Fig. 5).
Los inventores investigaron si las regiones de DNA potencialmente curvadas también pueden ser activas en un ambiente diferente del encontrado en su contexto de MAR natural. Por tanto, decidieron intercambiar los elementos CUE-F, CUE-B y CUE-K, manteniendo inalteradas las secuencias flanqueantes. Las secuencias que flanquean el elemento CUE-F fueron amplificadas por PCR y ensambladas para abarcar los diversos CUE, manteniendo su orientación y distancia originales, o sin un CUE. Se analizó luego la capacidad de estas MAR de ~1,8 kb modificadas por ingeniería genética para aumentar la expresión de transgenes como antes. Los tres CUE fueron activos en este contexto, y por lo tanto la acción no está restringida a un conjunto dado de secuencias flanqueantes. Curiosamente, el elemento CUE-K fue incluso más activo que el CUE-F cuando se insertó entre las secuencias flanqueantes del CUE-F, y la primera construcción compuesta exhibió una actividad tan alta como la observada para la MAR natural completa (activación de 4,8 veces). Lo que distingue al elemento CUE-K del CUE-F y CUE-B es la presencia de sitios de unión solapantes para las proteínas MEF-2 y SatB1, además de su característica de CUE. Por lo tanto, fusionar CUE-B con el dominio flanqueante de CUE-F da como resultado una mayor densidad de los tres sitios de unión, lo cual es probablemente la explicación del aumento de actividad. Estos resultados indican que los ensamblajes de los CUE con secuencias que contienen sitios de unión para proteínas tales como proteínas NMP4, MEF-2, SatB1 y/o polyPpolyQ constituyen potentes secuencias de MAR artificiales.
Ejemplo 12: Vectores de expresión
En la Figura 12 se representan tres vectores de expresión de acuerdo con la presente invención.
El plásmido pPAG01 es un derivado de pUC19 de 5640 pb. Contiene un fragmento de DNA de pollo de 2960 pb clonado en los sitios de restricción BamH1 y XbaI. Este inserto procede del borde del extremo 5' del locus de lisozima de pollo y tiene un alto contenido de A/T.
El plásmido pGEGFP (también denominado pSV40EGFP) control es un derivado del vector del pGL3-control (Promega) en el cual la secuencia del gen de luciferasa ha sido reemplazada por la forma de la secuencia del gen EGFP del vector pEGFP-N1 (Clontech). El tamaño del plásmido pGEGFP es 4334 pb.
El plásmido pUbCEGFP control es un derivado de pGL3 con un promotor de ubiquitina.
El plásmido pPAG01GFP (también denominado pMAR-SV40EGFP) es un derivado de pGEGFP con el elemento 5'-LysMAR clonado en el sitio de clonación múltiple (abreviadamente MCS por la expresión inglesa Multiple Clonation Site) situado justo hacia el extremo 5' del promotor de SV40. El tamaño del plásmido pPAG01EGF es 7285 pb.
Ejemplo 13: Efecto de la transfección adicional de células transfectantes primarias sobre la expresión de transgenes
Un día antes de la transfección, se cultivaron células de CHO-DG44 en una placa de 24 pocillos, en un medio de crecimiento a una densidad de 1,35 x 105 células/pocillo. 16 horas después del inóculo, las células se transfectaron cuando habían alcanzado 30-40% de confluencia, usando Lipofect-AMINE 2000 (en lo sucesivo LF2000), de acuerdo con las instrucciones del fabricante (Invitrogen). Veintisiete microlitros de medio exento de suero (Opti-MEM; Invitrogen) que contenían 1,4 μl de LF2000 se mezclaron con 27 μl de Opti-MEM que contenían 830 ng de DNA lineal de plásmido. El plásmido para selección de antibióticos (pSVneo) ascendió a una décima parte del plásmido
indicador que lleva el transgén de la GFP. La mezcla se incubó a temperatura ambiente durante 20 minutos, para permitir la formación de los complejos DNA-LF2000. La mezcla se diluyó con 300 μl de Opti-MEM y se vertió en pocillos previamente vaciados que contenían células. Después de 3 horas de incubación de las células con la mezcla de DNA a 37ºC en una incubadora con CO2, se añadió a cada pocillo un medio basado en DMEM. Las células 5 fueron incubadas adicionalmente durante 24 horas en una incubadora con CO2 a 37ºC. Las células se transfectaron luego una segunda vez de acuerdo con el método descrito antes, excepto que el plásmido de resistencia llevaba otro gen de resistencia (pSVpuro). Veinticuatro horas después de la segunda transfección, las células se sometieron a pases y se expandieron en un matraz T-75 que contenía medio de selección suplementado con 500 μg/ml de G-418 y 5 μg/ml de puromicina. Después de un periodo de selección de dos semanas, las células establemente transfecta
10 das se cultivaron en placas de 6 pocillos. Alternativamente, la población celular se transfectó de nuevo usando el mismo método, pero con pTKhygro (Clontech) y pSVdhfr como plásmidos de resistencia. La expresión de GFP se analizó con el clasificador de células activadas por fluorescencia (FACS) y con un aparato Fluoroscan.
La Fig.13 muestra que el fenotipo de las células transfectadas dos veces (en lo sucesivo denominadas transfectantes secundarias) no sólo estaba fuertemente coloreado, de tal modo que no se requirió una bombilla especial ni un 15 filtro para visualizar el color verde de la proteína GFP, sino que también contenía una mayoría de células productoras (histograma por FACS en la parte inferior izquierda) en comparación con la población parental (histograma central). Este nivel de fluorescencia corresponde a productividades celulares específicas de al menos 10 pg por célula y por día. Realmente, las células transfectadas solamente una vez (transfectantes primarias) que no expresaron la proteína marcadora estaban casi totalmente ausentes de la población celular después de la re-transfección. Las
20 barras por debajo de 101 unidades de la fluorescencia de la GFP ascendían a 30% en el histograma central y a menos de 5% en el histograma de la derecha. Esto sugirió que células adicionales habían sido transfectadas y expresada satisfactoriamente la GFP.
Sorprendentemente, la cantidad de fluorescencia exhibida por las células re-transfectadas sugirió que la subpoblación de células que tenían incorporado DNA dos veces expresaron mucha más GFP que el aumento doble espera25 do. Realmente los resultados mostrados en la Tabla 2 indican que las transfectantes secundarias exhibían, por término medio, un aumento de más del doble de la GFP esperada si dos conjuntos de secuencias, uno en cada transfección sucesiva, hubieran estado integrados independientemente y con eficiencias similares. Curiosamente, esto no dependía de la secuencia del promotor que activa al gen indicador, puesto que tanto los vectores que contenían el promotor viral como el celular dieron un aumento similar de la GFP (compárese las pistas 1 y 2). Sin em
30 bargo, el efecto fue particularmente marcado para el vector que contenía la MAR en comparación con los plásmidos sin la MAR (pista 3), en donde las dos transfecciones consecutivas dieron como resultado aumentos de la expresión de 5,3 y 4,6 veces, en dos experimentos distintos.
Tabla 7. Efecto de re-transfectar transfectantes primarias en intervalos de 24 horas en la expresión de GFP
Tipo de plásmidos
Transfección primaria Transfección secundaria Aumento de la fluorescencia de PGFP (veces)
pUbCEGFP
4’992 14’334 2,8
pSV40EGFP
4’324 12’237 2,8
pMAR-SV40EGFP
6’996 36’748 5,3
pUbCEGFP
6’452 15’794 2,5
pSV40EGFP
4’433 11’735 2,6
pMAR-SV40EGFP
8’116 37’475 4,6
Se muestran dos experimentos independientes. El plásmido de resistencia pSVneo fue co-transfectado con diversos
35 vectores de expresión de la GFP. Un día después de la transfección, las células fueron re-transfectadas con los mismos plásmidos con la diferencia de que el plásmido de resistencia fue cambiado por pSVpuro. Las células que llevaban ambos genes de resistencia se seleccionaron en 500 μg/ml de G-418 y 5 μg/ml de puromicina y se cuantificó por Fluoroscan la expresión del marcador gen indicador. El número de veces de aumentos corresponde a la relación entre la fluorescencia obtenida de dos transfecciones consecutivas y la suma de la fluorescencia obtenida
40 de las transfecciones independientes correspondientes. En número de veces de aumento que fue considerado significativamente más alto se muestra en negrita y corresponde a los valores de fluorescencia que son consecuentemente más de 2 veces mayores que la suma de los obtenidos de las transfecciones independientes.
Según el conocimiento actual no se esperaba el aumento en el nivel de expresión de la GFP en células múltiplemente transfectadas, y este efecto no se había observado previamente.
45 Tomados conjuntamente, los datos presentados en la presente memoria apoyan la idea de que las secuencias de plásmidos que se integran principalmente en el genoma hospedante facilitarían la integración de otros plásmidos por recombinación homóloga con el segundo conjunto entrante de moléculas de plásmido. Los eventos de recombinación de plásmidos ocurren en un intervalo de 1 hora después de que el DNA del plásmido haya alcanzado el núcleo y la frecuencia de recombinación homóloga entre las moléculas de plásmido co-inyectadas en las células de
50 mamíferos cultivadas haya demostrado ser extremadamente alta, aproximándose a la unidad [Folger, K.R., K. Thomas, and M.R. Capecchi, "Non reciprocal exchanges of information between DNA duplexes coinjected into mammalian cell nuclei". Mol. Cell Biol.,1985. 5(1): p. 59-69], lo que explica la integración de múltiples copias de plásmido. Sin embargo, la recombinación homóloga entre DNA recientemente introducido y su homólogo cromosómico normalmente ocurre raras veces, a una frecuencia de como máximo 1 en 103 células que reciben el DNA [Thomas, K.R.,
K.R. Folger, and M.R. Capecchi, "High frequency targeting of genes to specific sites in the mammalian genome", Cell, 1986. 44 (3): p. 419-28]. Por tanto, los resultados podrían indicar que el elemento de MAR actúa sorprenden
5 temente para promover dichos eventos de recombinación. Las MAR no solamente modificarían la organización de genes in vivo, y posiblemente permitirían también la replicación del DNA junto con las secuencias de DNA viral, sino que también podrían actuar como señales de recombinación de DNA.
Ejemplo 14: Las MAR median los niveles de expresión inesperadamente altos en células múltiplemente transfectadas
10 Si los eventos de recombinación activados por las MAR fueran a ocurrir en métodos de transfecciones múltiples, los inventores esperarían que la sinergia entre el DNA plasmídico primario y secundario estaría afectada por la presencia de los elementos de MAR en una o en ambas de las etapas de transfección. Los inventores examinaron esta posibilidad por transfecciones múltiples de las células con pMAR solo o en combinación con varios plásmidos de expresión, usando el método descrito previamente. La Tabla 8 muestra que transfectar las células dos veces con el
15 plásmido pMAR-SV40EGFP dio la mayor expresión de la GFP y el mayor grado de mejora de todas las condiciones (4,3 veces). En contraste, transfectar dos veces el vector sin MAR dio poco o ninguna mejora, 2,8 veces, en lugar del aumento doble esperado. Los inventores llegaron a la conclusión de que la presencia de elementos de MAR en cada etapa de transfección es necesaria para conseguir la máxima síntesis de proteína.
Tabla 8
Transfección primaria
Transfección secundaria
Tipo de plásmido
Fluorescencia de EGFP Tipo de plásmido Fluorescencia de EGFP Aumento (veces)
pMAR
0 pMAR pSV40EGFP pMAR-SV40EGFP 0 15’437 30’488 0 2,3-2,5 2,6-2,7
pMAR-SV40EGFP
11’278 pMAR-SV40EGFP pMAR 47’027 12’319 4,3-5,3 1,0-1,1
pSV40EGFP
6’114 pSV40EGFP pMAR 17’200 11’169 2,8 1,8-2,3
Curiosamente, cuando las células fueron transfectadas primeramente con pMAR solo, y luego re-transfectadas con pSV40EGFP o pMAR-SV40EGFP, los niveles de la GFP fueron más del doble en comparación con los que resultan de una sola transfección de los plásmidos posteriores (2,5 y 2,7 veces respectivamente, en lugar de la 1 vez esperada). Esto indica que la transfección previa de las MAR puede aumentar la expresión del plásmido usado en dicho 25 segundo método de transfección. Debido a que las MAR solo actúan localmente sobre la estructura de la cromatina y la expresión de genes, esto implica que los dos tipos de DNA pueden haberse integrado en un locus cromosómico similar. En contraste, transfectar los vectores de expresión de la GFP solos, seguido por el elemento de MAR en la segunda etapa, proporcionó poca o ninguna mejora en los niveles de la GFP. Esto indica que es importante el orden de transfección de los plásmidos, y que el evento de la primera transfección debe contener un elemento de MAR
30 que permita niveles significativamente mayores de expresión de transgenes.
Si los elementos MAR favorecieran la recombinación homóloga de los plásmidos que permanecen en formas episomales desde el primer y el segundo métodos de transfección, seguido por su co-integración en un locus cromosómico, se esperaría que el orden de transfección de plásmidos no afectara a los niveles de la GFP. Sin embargo, los hallazgos anteriores indican que es más favorable transfectar el elemento de MAR en el primer evento de transfec
35 ción en lugar de en el segundo. Esto sugiere el siguiente mecanismo molecular: durante el primer método de transfección, los elementos de MAR pueden concatemerizarse e integrarse, al menos en parte, en el cromosoma celular. Este DNA de las MAR puede a su vez favorecer la posterior integración de más plásmidos, durante el segundo método de transfección, en el mismo locus cromosómico o en uno cercano.
Ejemplo 15: Las MAR como agentes que facilitan de la transferencia a largo plazo de DNA
40 Si las MAR integradas mediaran una estructura cromosómica permisiva con la recombinación persistente, se esperarían altos niveles de expresión incluso si la segunda transfección se realizara mucho tiempo después de la primera, en un momento en el que hubiera sido eliminada la mayoría del DNA episómico transitoriamente introducido. Para abordar esta posibilidad, las células de la Tabla 9, seleccionadas por su resistencia a antibióticos durante tres semanas, fueron transfectadas de nuevo una o dos veces y seleccionadas por la incorporación de marcadores de
45 resistencia de DNA adicionales. Los ciclos de transfección terciaria, o terciaria y cuaternaria, se realizaron con combinaciones de pMAR o pMAR-SV40EGFP, y se analizaron para determinar la expresión de GFP como antes.
Tabla 9. Las MAR actúan como agentes que facilitan la integración del DNA
Transfección terciaria
Transfección cuaternaria
Tipo de plásmidos
Fluorescencia de EGFP Aumento de veces Tipo de plásmidos Fluorescencia de EGFP Aumento de veces
pMAR
18368 2,2 pMAR pMAR-SV40EGFP 43’186 140’000 2,4 7,6
pMAR-SV40EGFI
16544 2,0 pMAR- SV40EGFP pMAR 91’000 33’814 5,5 2,0
Los transfectantes secundarios pMAR-SV40EGFP/pMAR-SV40EGFP se usaron en un tercer ciclo de transfección al final del proceso de selección. La transfección terciaria se realizó con pMAR o pMAR-SV40EGFP y pTKhygro como 5 plásmido de selección, para dar transfectantes terciarios. Después de 24 horas, las células se transfectaron de nuevo con cada cualquiera de los plásmidos y pSVdhfr, dando como resultado los transfectantes cuaternarios que se seleccionaron en un medio de crecimiento que contenía 500 μg/ml de G-418, 5 μg/ml de puromicina, 300 μg/ml de higromicina B y metotrexato 5 μM. Los transfectantes secundarios exhibían inicialmente una fluorescencia de la GFP de 8300. El número de veces de aumentos corresponde a la relación entre la fluorescencia obtenida de dos trans
10 fecciones consecutivas y la suma de la fluorescencia obtenida de las transfecciones independientes correspondientes. El número de veces de aumentos que se consideró significativamente superior se muestran en negrita, y corresponde a los valores de fluorescencia que son dos veces superiores a la suma de los obtenidos de las transfecciones independientes.
Estos resultados muestran que cargar más copias de pMAR o pMAR-SV40EGFP dio como resultado aumentos
15 dobles similares de fluorescencia total de las células. Cargar incluso más MAR en la transfección cuaternaria aumentó esta actividad en otras 2,4 veces. Esto concuerda con la hipótesis de los inventores de que las secuencias de MAR recientemente introducidas pueden integrarse en el locus del transgén cromosómico por recombinación homóloga y por lo tanto aumentan adicionalmente la expresión de transgenes.
Cuando las células fueron transfectadas una tercera y cuarta vez con el plásmido pMAR-SV40EGFP, la actividad de
20 la GFP aumentó más, de nuevo a los niveles no esperados de la suma de los niveles de fluorescencia obtenidos de transfecciones independientes. La expresión de la GFP alcanzó niveles que dieron como resultado células que brillaban visiblemente con color verde a la luz diurna (Fig.14). Estos resultados indican además que la eficiencia de la transfección cuaternaria fue mucho mayor que la esperada de la eficacia de la tercera transfección de DNA, lo que indica que un tiempo apropiado entre las transfecciones es crucial para obtener el aumento óptimo de la expresión
25 génica, prefiriéndose un día a un periodo de tres semanas.
Los inventores creen que los elementos de MAR favorecen los eventos de integración secundaria aumentando la frecuencia de recombinación en su sitio de integración cromosómica relajando la estructura cerrada de la cromatina, puesto que median un aumento local de la acetilación de histonas (Yasui, D., et al., "SATB1 targets chromatin remodelling to regulate genes over long distances", Nature, 2002. 419(6907): p. 641-5.]. Alternativamente, o simultánea
30 mente, las MAR recolocan potencialmente los genes cercanos en localizaciones sub-nucleares ideadas para estar enriquecidas en factores de acción trans, incluyendo proteínas que pueden participar en los eventos de recombinación, tales como las topoisomerasas. Esto puede dar como resultado un locus en el cual las secuencias de MAR puedan abarcar las repeticiones de pSV40EGFP protegiendo eficientemente los transgenes de los efectos de silenciamiento mediados por la cromatina.
35 Ejemplo 16: Uso de las MAR identificadas con el programa SMAR Scan® II para aumentar la expresión de una proteína recombinante.
Cuatro elementos de MAR fueron seleccionados al azar de las secuencias obtenidas por el análisis de la secuencia completa del genoma humano con el programa SMAR Scan® o el método combinado. Estas MAR se denominan 1_6, 1_42, 1_68, (en donde el primer número representa el cromosoma del cual se origina la secuencia y el segun40 do número es específico de la MAR predicha a lo largo de este cromosoma) y X_S29, una "super" MAR identificada en el cromosoma X. Estas MAR predichas se insertaron en el vector pGEGFP Control hacia el extremo 5' del promotor y potenciador de SV40 que activa la expresión de la proteína verde fluorescente y estos plásmidos se transfectaron en células de CHO cultivadas, como se ha descrito previamente (Zahn-Zabal, M., et al.; "Development of stable cell lines for production or regulated expression using matrix attachment regions", J. Biotechnol., 2001. 87(1): p. 29
45 42). La expresión del transgén se analizó luego en la población total de células establemente transfectadas usando un clasificador de células activadas por fluorescencia (FACS). Como puede verse en la Fig. 19, todas estas MAR recientemente identificadas aumentaron la expresión del transgén significativamente por encima de la expresión activada por la Mar de lisozima de pollo, siendo la "super" MAR X_S29 la más potente de todas las MAR recientemente identificadas.
50 Ejemplo 17: Efecto sobre el hematocrito de la expresión in vivo de mEPO por electrotransferencia del sistema Network con y sin MAR humana (1-68).
El gen terapéutico codifica EPO (eritropoyetina), una hormona usada para el tratamiento de la anemia. El gen de la EPO está colocado bajo el control de un promotor inducible por doxiciclina, en un sistema de intercambio de genes descrito previamente denominado el sistema Network (Imhof, M. O., Chatellard, P., and Mermod, N. (2000). "A regulatory network for efficient control of transgene expression", J. Gene. Med. 2, 107-116.). Los genes reguladores y de la EPO se inyectan luego en el músculo de ratones usando el método de electroporación in vivo denominado electrotransferencia, de modo que los genes son transferidos a los núcleos de las células de las fibras musculares. Cuando el antibiótico doxiciclina se añade al agua de beber de los ratones, se espera que dicho compuesto induzca la expresión de la EPO, que conducirá a la elevación del nivel de hematocrito, debido al aumento del número de glóbulos rojos mediado por el alto nivel de la EPO circulante. Por tanto, si la MAR mejoraba la expresión de EPO se esperarían mayores niveles de hematocrito.
Se llevaron a cabo experimentos in vivo en ratones hembra C57BL6 de 5 semanas (Iffa Credo-Charles River, Francia). Se administraron 30 μg de DNA de plásmido en solución salina normal mediante inyecciones transcutáneas en el músculo anterior de la tibia. Todas las inyecciones se realizaron bajo anestesia con ketaminol (75 mg/kg) y narcoxil (10 mg/kg). Después de la inyección intramuscular de DNA, se aplicó al músculo un campo eléctrico. Se aplicó un voltaje de 200 V/cm en impulsos de 8 milisegundos a 1 Hz (Bettan M, Darteil R, Caillaud JM, Soubrier F, Delaere P, Branelec D, Mahfoudi A, Duverger N, Scherman D. 2000 "High-level protein secretion into blood circulation after electric pulse-mediated gene transfer into skeletal muscle". Mol. Ther. 2: 204-10).
Se inyectó a 16 ratones el sistema Network que expresa la EPO sin la MAR 1_68 y a otros 16 ratones se les inyectó el sistema Network que incorpora la MAR en el extremo 5' de las secuencias de promotor/potenciador que activan la expresión de los genes del activador y de la EPO. En cada grupo, a la mitad de los ratones se administró doxiciclina en el agua de beber a partir del comienzo del experimento (día 0 – el día de la electrotransferencia) y a la otra mitad, la doxiciclina se puso en el agua de beber a partir del día 21.
Se recogieron muestras de sangre usando capilares heparinizados por punción retro-orbital a diferentes tiempos después de la inyección de plásmidos. Los capilares se centrifugaron 10 minutos a 5000 rpm a temperatura ambiente y se determinó la fracción volumétrica de los glóbulos rojos en comparación con el volumen de sangre total y se expresó como percentil, determinando el nivel de hematocrito.
Como se puede deducir de la Fig. 16 el grupo de ratones inyectados por MAR-Network inducido desde el comienzo del experimento, presentaban una mejor inducción del hematocrito en comparación con los ratones inyectados con el sistema Network original sin la MAR. Después de 2 meses, los hematocritos en "grupos que contenían MAR" estaban todavía en valores superiores (65%) a los niveles normales del hematocrito (45-55%).
Lo que es más importante, la inducción tardía (día 21) es posible solamente en presencia de MAR pero en ratones a los que fue inyectado el sistema Network sin la MAR. Por tanto, la MAR protege probablemente a los transgenes del silenciamiento y permite la inducción de su expresión incluso después de un periodo prolongado en condiciones no inductoras.
Globalmente, el elemento MAR es capaz de aumentar la expresión del gen terapéutico, como se detecta por el aumento de su efecto fisiológico en el hematocrito.
LISTA DE SECUENCIAS
<110> Selexis S.A.
5 <120> TRANSFERENCIA Y EXPRESIÓN DE GENES DE ALTA EFICACIA EN CÉLULAS DE MAMÍFEROS POR UN MÉTODO DE TRANSFECCIÓN MÚLTIPLE DE SECUENCIAS DE REGIONES DE FIJACIÓN A LA MA-TRIZ (MAR)
<130> SEL PCT 012 10
<150> US 60/513,574
<151> 2003-10-24
<150> EP 04 002 722.9 15 <151> 2004-02-06
<160> 241
<170> PatentIn versión 3.1 20
<210> 1
<211> 320
<212> DNA
<213> Homo sapiens 25
<220>
<221> unión_misc
<222> (1)..(320)
<223> MAR de cromosoma humano 1, nt desde 36686 hasta 37008 30 <220>
<221> unión_misc
<222> (1)..(320)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 36686 hasta 37008
35 <400> 1
<210> 2
<211> 709
<212> DNA 40 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(709) 45 <223> MAR de cromosoma humano 1, nt desde 142276 hasta 142984
<220>
<221> unión_misc
<222> (1)..(709)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 142276 hasta 142984 50 <400> 2
<210> 3
<211> 409
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(409)
<223> MAR de cromosoma humano 1, nt desde 1368659 hasta 1369067
<220>
<221> unión_misc
<222> (1)..(409) 15 <223> MAR de cromosoma humano 1, cóntigos genómicos; 1368659 hasta 1369067
<400> 3
<210>
4 20 <211> 394
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(394)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 2839089 hasta 2839482
<400> 4
<210>
5 10 <211> 832
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(832)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 1452269 hasta 1453100
<400> 5
<210> 6
<211> 350
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(350)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 831495 hasta 831844
<400> 6
<210> 7
<211> 386
<212> DNA 15 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(386) 20 <223> MAR de cromosoma humano 1, cóntigos genómicos; 1447225 hasta 1447610
<400> 7
<210> 8 25 <211> 585
<212> DNA
<213> Homo sapiens
<220> 30 <221> unión_misc
<222> (1)..(585)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 4955365 hasta 4955949 <400> 8
<210> 9
<211> 772 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(772)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 5971862 hasta 5972633
<400> 9
15 <210> 10
<211> 304
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(304)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 6221897 hasta 6222200
<400> 10
<210> 11
<211> 311
<212> DNA
<213> Homo sapiens 15
<220>
<221> unión_misc
<222> (1)..(311)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 9418531 hasta 9418841 20
<400> 11
<210> 12
<211> 302 25 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 30 <222> (1)..(302)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 15088789 hasta 15089090
<400> 12
<210> 13
<211> 461
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(461) 10 <223> MAR de cromosoma humano 1, cóntigos genómicos; 6791827 hasta 6792287
<400> 13
<210> 14 15 <211> 572
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(572)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 163530 hasta 164101
<400> 14 <210> 15
<211> 357 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(357)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 1842332 hasta 1842688
<400> 15
15 <210> 16
<211> 399
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(399)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 2309560 hasta 23099588
25 <400> 16 <210> 17
<211> 394
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(394) 10 <223> MAR de cromosoma humano 1, cóntigos genómicos; 2231759 hasta 2232152
<400> 17
<210> 18 15 <211> 387
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(387)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 7406524 hasta 7406910
<400> 18 <210> 19
<211> 370 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(370)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 9399572 hasta 9399941
<400> 19
15 <210> 20
<211> 377
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(377)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 12417411 hasta 12417787
25 <400> 20 <210> 21
<211> 1524
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(1524) 10 <223> MAR de cromosoma humano 1, cóntigos genómicos; 1643307 hasta 1644830
<400> 21 <210> 22
<211> 664 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(664)
<223> MAR de cromosoma humano 1, cóntigos genómicos; 1398763 hasta 1399426
<400> 22
<210> 23
<211> 1428
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(1428) 10 <223> MAR de cromosoma humano 2, cóntigos genómicos; 17840365 hasta 17841792
<400> 23 <210> 24
<211> 4624 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(4624)
<223> MAR 1_6 de cromosoma 1
<400> 24
<210> 25
<211> 3616
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(3616) 10 <223> MAR 1_68 de cromosoma 1
<400> 25
<210> 26
<211> 4660
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(4660) 10 <223> MAR 1_42 de cromosoma 1
<400> 26
<210> 27
<211> 3354
<212> DNA
<213> Homo sapiens 5
<220>
<221> unión_misc
<222> (1)..(3354)
<223> MAR X_S29 de cromosoma X 10
<400> 27
<210> 28
<211> 677
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(677) 10 <223> MAR de cromosoma 1 cóntigo genómico; 12803267..12803943
<400> 28
<210> 29
<211> 332
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(332) 10 <223> MAR de cromosoma 1 cóntigo genómico; 13079684..13080015
<400> 29
<210> 30 15 <211> 479
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(479)
<223> MAR de cromosoma 1 cóntigo genómico; 15682296..15682774
<400> 30
<210> 31
<211> 531
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(531) 10 <223> MAR de cromosoma 1 cóntigo genómico; 15694611..15695141
<400> 31
15 <210> 32
<211> 378
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(378)
<223> MAR de cromosoma 1 cóntigo genómico; 886276..886653
25 <400> 32 <210> 33
<211> 595
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(595) 10 <223> MAR de cromosoma 1 cóntigo genómico; 3326732..3327326
<400> 33
<210> 34 15 <211> 738
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(738)
<223> MAR de cromosoma 1 cóntigo genómico; 4485716..4486453
<400> 34
<210> 35
<211> 386
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(386) 10 <223> MAR de cromosoma 1 cóntigo genómico; 5423067..5423452
<400> 35
<210> 36 15 <211> 584
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(584)
<223> MAR de cromosoma 1 cóntigo genómico; 5805559..5806142
<400> 36
<210> 37
<211> 345 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(345)
<223> MAR de cromosoma 1 cóntigo genómico; 10802644..10802988
<400> 37
15 <210> 38
<211> 474
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(474)
<223> MAR de cromosoma 1 cóntigo genómico; 13496468..13496941
25 <400> 38 <210> 39
<211> 483
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(483) 10 <223> MAR de cromosoma 1 cóntigo genómico; 2509163..2509645
<400> 39
<210> 40 15 <211> 641
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(641)
<223> MAR de cromosoma 1 cóntigo genómico; 2776349..2776989
<400> 40 <210> 41
<211> 745 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(745)
<223> MAR de cromosoma 1 cóntigo genómico; 2858703..2859447
<400> 41
<210> 42
<211> 307
<212> DNA
<213> Homo sapiens 5
<220>
<221> unión_misc
<222> (1)..(307)
<223> MAR de cromosoma 1 cóntigo genómico; 945522..945828 10
<400> 42
<210> 43
<211> 357 15 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 20 <222> (1)..(357)
<223> MAR de cromosoma 1 cóntigo genómico; 3402743..3403099
<400> 43
25 <210> 44
<211> 323
<212> DNA
<213> Homo sapiens
30 <220>
<221> unión_misc
<222> (1)..(323)
<223> MAR de cromosoma 1 cóntigo genómico; 3485830..3486152
35 <400> 44 <210> 45
<211> 498
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(498) 10 <223> MAR de cromosoma 1 cóntigo genómico; 3548336..3548833
<400> 45
15 <210> 46
<211> 400
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(400)
<223> MAR de cromosoma 1 cóntigo genómico; 4595109..4595508
25 <400> 46 <210> 47
<211> 403
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(403) 10 <223> MAR de cromosoma 1 cóntigo genómico; 7205509..7205911
<400> 47
<210> 48 15 <211> 309
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(309)
<223> MAR de cromosoma 1 cóntigo genómico; 7507280..7507588
<400> 48
<210> 49
<211> 516
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(516) 10 <223> MAR de cromosoma 1 cóntigo genómico; 3581085..3581600
<400> 49
15 <210> 50
<211> 534
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(534)
<223> MAR de cromosoma 1 cóntigo genómico; 3084851..3085384
25 <400> 50 <210> 51
<211> 583
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(583) 10 <223> MAR de cromosoma 1 cóntigo genómico; 160087..160669
<400> 51
<210> 52 15 <211> 314
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(314)
<223> MAR de cromosoma 1 cóntigo genómico; 4350424..4350737
<400> 52
<210> 53
<211> 828
<212> DNA 5 <213> Homo sapiens
<220>
<221 > unión_misc
<222> (1)..(828) 10 <223> MAR de cromosoma 1 cóntigo genómico; 8443267..8444094
<400> 53
15 <210> 54
<211> 573
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(573)
<223> MAR de cromosoma 1 cóntigo genómico; 8703190..8703762 <400> 54
<210> 55 5 <211> 597
<212> DNA
<213> Homo sapiens
<220> 10 <221> unión_misc
<222> (1)..(597)
<223> MAR de cromosoma 1 cóntigo genómico; 8819076..8819672
<400> 55
<210> 56
<211> 646
<212> DNA 20 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(646)
25 <223> MAR de cromosoma 1 cóntigo genómico; 759619..760264 <400> 56
<210> 57
<211> 752 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(752)
<223> MAR de cromosoma 1 cóntigo genómico; 1226710..1227461
<400> 57
<210> 58
<211> 300
<212> DNA
<213> Homo sapiens 5
<220>
<221> unión_misc
<222> (1)..(300)
<223> MAR de cromosoma 1 cóntigo genómico; 1119049..1119348 10
<400> 58
<210> 59
<211> 617 15 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 20 <222> (1)..(617)
<223> MAR de cromosoma 1 cóntigo genómico; 3603613..3604229
<400> 59
<210> 60
<211> 674
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(674)
<223> MAR de cromosoma 1 cóntigo genómico; 2592460..2593133
<400> 60
<210> 61 5 <211>
<212> DNA
<213> Homo sapiens
<220> 10 <221> unión_misc
<222> (1)..(1694)
<223> MAR de cromosoma 1 cóntigo genómico; 2891680..2893373
<400> 61
<210> 62
<211> 587
<212> DNA
<213> Homo sapiens <220>
<221> unión_misc
<222> (1)..(587)
<223> MAR de cromosoma 1 cóntigo genómico; 3432560..3433146
<400> 62
<210> 63 10 <211> 313
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(313)
<223> MAR de cromosoma 1 cóntigo genómico; 3805392..3805704
<400> 63
<210> 64
<211> 349
<212> DNA
<213> Homo sapiens 25 <220>
<221> unión_misc
<222> (1)..(349)
<223> MAR de cromosoma 1 cóntigo genómico; 4521378..4521726
30 <400> 64 <210> 65
<211> 500 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(500)
<223> MAR de cromosoma 1 cóntigo genómico; 3240166..3240665
<400> 65
15 <210> 66
<211> 866
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(866)
<223> MAR de cromosoma 1 cóntigo genómico; 409429..410294
25 <400> 66 <210> 67
<211> 335
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(335) 10 <223> MAR de cromosoma 1 cóntigo genómico; 614754..615088
<400> 67
<210> 68 15 <211> 455
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(455)
<223> MAR de cromosoma 1 cóntigo genómico; 1299520..1299974
<400> 68 <210> 69
<211> 404
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(404) 10 <223> MAR de cromosoma 1 cóntigo genómico; 1970778..1971181
<400> 69
15 <210> 70
<211> 605
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(605)
<223> MAR de cromosoma 1 cóntigo genómico; 3562918..3563522
25 <400> 70 <210> 71
<211> 317
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(317) 10 <223> MAR de cromosoma 1 cóntigo genómico; 189743..190059
<400> 71
<210> 72 15 <211> 522
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(522)
<223> MAR de cromosoma 1 cóntigo genómico; 229111..229632
<400> 72
<210> 73
<211> 1110
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(1110)
<223> MAR de cromosoma 1 cóntigo genómico; 1138030..1139139 10
<400> 73
<210> 74
<211> 521
<212> DNA
<213> Homo sapiens 5
<220>
<221> unión_misc
<222> (1)..(521)
<223> MAR de cromosoma 1 cóntigo genómico; 2863407..2863927 10
<400> 74
<210> 75
<211> 560 15 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 20 <222> (1)..(560)
<223> MAR de cromosoma 1 cóntigo genómico; 5712303..5712869
<400> 75
<210> 76
<211> 479
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(479)
<223> MAR de cromosoma 1 cóntigo genómico; 8578812..8579290
<400> 76
10 <210> 77
<211> 477
<212> DNA
<213> Homo sapiens
15 <220>
<221> unión_misc
<222> (1)..(477)
<223> MAR de cromosoma 1 cóntigo genómico; 8579294..8579770
20 <400> 77
<210> 78
<211> 331
<212> DNA 25 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(331) 30 <223> MAR de cromosoma 1 cóntigo genómico; 8580024..8580354
<400> 78
<210> 79
<211> 410
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(410) 10 <223> MAR de cromosoma 1 cóntigo genómico; 8580705..8581114
<400> 79
15 <210> 80
<211> 433
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(433)
<223> MAR de cromosoma 1 cóntigo genómico; 12979167..12979599
25 <400> 80 <210> 81
<211> 385
<212> DNA
<213> Homo sapiens 5
<220>
<221> unión_misc
<222> (1)..(385)
<223> MAR de cromosoma 1 cóntigo genómico; 16336644..16337028 10
<400> 81
<210> 82
<211> 363 15 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 20 <222> (1)..(363)
<223> MAR de cromosoma 1 cóntigo genómico; 20624448..2062481
<400> 82
25 <210> 83
<211> 310
<212> DNA
<213> Homo sapiens
30 <220>
<221> unión_misc
<222> (1)..(310)
<223> MAR de cromosoma 1 cóntigo genómico; 566025..566334 35 <400> 83
<210> 84
<211> 1236 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(1236)
<223> MAR de cromosoma 1 cóntigo genómico; 1171429..1172664
<400> 84 <210> 85
<211> 309 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(309)
<223> MAR de cromosoma 1 cóntigo genómico; 1925173..1925481
<400> 85 <210> 86
<211> 312 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(312)
<223> MAR de cromosoma 1 cóntigo genómico; 4396756..4397067
<400> 86
15 <210> 87
<211> 398
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(398)
<223> MAR de cromosoma 1 cóntigo genómico; 56057..56454
25 <400> 87
<210> 88
<211> 391
<212> DNA 30 <213> Homo sapiens <220>
<221> unión_misc
<222> (1)..(391)
<223> MAR de cromosoma 1 cóntigo genómico; 56984..57374
<400> 88
<210> 89 10 <211> 309
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(309)
<223> MAR de cromosoma 1 cóntigo genómico; 469547..469855
<400> 89
<210> 90
<211> 441
<212> DNA
<213> Homo sapiens 25
<220>
<221> unión_misc
<222> (1)..(441)
<223> MAR de cromosoma 1 cóntigo genómico; 546190..546630 30
<400> 90
<210> 91
<211> 1367
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(1367) 10 <223> MAR de cromosoma 1 cóntigo genómico; 124643..126009
<400> 91
<210> 92
<211> 458
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(458) 10 <223> MAR de cromosoma 1 cóntigo genómico; 58908..59365
<400> 92
<210> 93
<211> 330
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(330) 10 <223> MAR de cromosoma 1 cóntigo genómico; 306867..307196
<400> 93
<210> 94 15 <211> 353
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(353)
<223> MAR de cromosoma 1 cóntigo genómico; 636899..637251
<400> 94 <210> 95
<211> 345 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(345)
<223> MAR de cromosoma 1 cóntigo genómico; 1435510..1435854
<400> 95
15 <210> 96
<211> 521
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(521)
<223> MAR de cromosoma 1 cóntigo genómico; 39695..40215
25 <400> 96 <210> 97
<211> 484
<212> DNA
<213> Homo sapiens 5
<220>
<221> unión_misc
<222> (1)..(484)
<223> MAR de cromosoma 1 cóntigo genómico; 1286007..1286490 10
<400> 97
<210> 98
<211> 244 15 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 20 <222> (1)..(244)
<223> MAR de cromosoma 1 cóntigo genómico; 73556..73879
<400> 98
<210> 99
<211> 463
<212> DNA
<213> Homo sapiens 30
<220>
<221> unión_misc
<222> (1)..(463)
<223> MAR de cromosoma 1 cóntigo genómico; 179038..179500 35
<400> 99
<210> 100
<211> 390
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(390) 10 <223> MAR de cromosoma 1 cóntigo genómico; 55617..56006
<400> 100
<210> 101 15 <211> 582
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(582)
<223> MAR de cromosoma 2 cóntigos genómicos; 1157405..1157986
<400> 101 <210> 102
<211> 322 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(322)
<223> MAR de cromosoma 2 cóntigos genómicos; 1858638..1858959
<400> 102
<210> 103
<211> 914
<212> DNA
<213> Homo sapiens 20
<220>
<221> unión_misc
<222> (1)..(914)
<223> MAR de cromosoma 2 cóntigos genómicos; 5712196..5713109 25
<400> 103 <210> 104
<211> 370 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(370)
<223> MAR de cromosoma 2 cóntigos genómicos; 5713613..5713982
<400> 104
<210> 105
<211> 442
<212> DNA
<213> Homo sapiens 5
<220>
<221> unión_misc
<222> (1)..(442)
<223> MAR de cromosoma 2 cóntigos genómicos; 7481647..7482088 10
<400> 105
<210> 106
<211> 338 15 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 20 <222> (1)..(338)
<223> MAR de cromosoma 2 cóntigos genómicos; 9594557..9594894
<400> 106
25 <210> 107
<211> 364
<212> DNA
<213> Homo sapiens
30 <220>
<221> unión_misc
<222> (1)..(364)
<223> MAR de cromosoma 2 cóntigos genómicos; 10519720..10520083
35 <400> 107 <210> 108
<211> 342
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(342) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 11481943..11482284
<400> 108
<210> 109 15 <211> 415
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(415)
<223> MAR de cromosoma 2 cóntigos genómicos; 13499598..13500012
<400> 109
25 <210> 110
<211> 330
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(330)
<223> MAR de cromosoma 2 cóntigos genómicos; 16370976..16371305
<400> 110
<210> 111 10 <211 > 702
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(702)
<223> MAR de cromosoma 2 cóntigos genómicos; 626641..627342
<400> 111
<210> 112
<211> 679
<212> DNA
<213> Homo sapiens 25
<220>
<221> unión_misc
<222> (1)..(679)
<223> MAR de cromosoma 2 cóntigos genómicos; 3196047..3196725 30
<400> 112
<210> 113
<211> 728
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(728) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 3196778..3197505
<400> 113
<210>
114 15 <211> 413
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(413)
<223> MAR de cromosoma 2 cóntigos genómicos; 2560638..2561050
<400> 114
<210>
115 10 <211> 361
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(361)
<223> MAR de cromosoma 2 cóntigos genómicos; 4965309..4965669
<400> 115
<210> 116
<211> 325
<212> DNA
<213> Homo sapiens 25
<220>
<221> unión_misc
<222> (1)..(325)
<223> MAR de cromosoma 2 cóntigos genómicos; 5258150..5258474 30
<400> 116
<210> 117
<211> 1508
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(1508) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 6057499..6059006
<400> 117
<210> 118
<211> 415
<212> DNA
<213> Homo sapiens <220>
<221> unión_misc
<222> (1)..(415)
<223> MAR de cromosoma 2 cóntigos genómicos; 7996866..7997280
<400> 118
<210> 119 10 <211> 526
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(526)
<223> MAR de cromosoma 2 cóntigos genómicos; 8300930..8301455
<400> 119
<210> 120
<211> 402
<212> DNA
<213> Homo sapiens 25
<220>
<221> unión_misc
<222> (1)..(402)
<223> MAR de cromosoma 2 cóntigos genómicos; 8576553..8576954
<400> 120 <210> 121
<211> 477
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(477) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 8785649..8786125
<400> 121
<210> 122 15 <211> 773
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(773)
<223> MAR de cromosoma 2 cóntigos genómicos; 10064737..10065509
<400> 122 <210> 123
<211> 1554 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(1554)
<223> MAR de cromosoma 2 cóntigos genómicos; 1039775..1041328
<400> 123 <210> 124
<211> 650 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(650)
<223> MAR de cromosoma 2 cóntigos genómicos; 3944813..3945462
<400> 124
<210> 125 5 <211> 441
<212> DNA
<213> Homo sapiens
<220> 10 <221> unión_misc
<222> (1)..(441)
<223> MAR de cromosoma 2 cóntigos genómicos; 5314265..5314705
<400> 125
<210> 126
<211> 1169
<212> DNA
<213> Homo sapiens 20
<220>
<221> unión_misc
<222> (1)..(1169)
<223> MAR de cromosoma 2 cóntigos genómicos; 5953971..5955139 25
<400> 126
<210> 127
<211> 653
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(653) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 6427669..6428321
<400> 127
<210> 128
<211> 414
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(414) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 10890453..10890866
<400> 128
<210> 129 15 <211> 496
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(496)
<223> MAR de cromosoma 2 cóntigos genómicos; 13952568..13953063
<400> 129 <210> 130
<211> 317 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(317)
<223> MAR de cromosoma 2 cóntigos genómicos; 16942865..16943181
<400> 130
15 <210> 131
<211> 464
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(464)
<223> MAR de cromosoma 2 cóntigos genómicos; 17217049..17217512
25 <400> 131 <210> 132
<211> 430
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(430) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 19647266..19647695
<400> 132
<210> 133 15 <211> 2131
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(2131)
<223> MAR de cromosoma 2 cóntigos genómicos; 20481223..20483353
<400> 133
<210> 134
<211> 842
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(842) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 20483478..20484319
<400> 134
15 <210> 135
<211> 645
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(645)
<223> MAR de cromosoma 2 cóntigos genómicos; 20897566..20898210 <400> 135
<210> 136 5 <211> 722
<212> DNA
<213> Homo sapiens
<220> 10 <221> unión_misc
<222> (1)..(722)
<223> MAR de cromosoma 2 cóntigos genómicos; 21664541..21665262
<400> 136
<210> 137
<211> 305
<212> DNA 20 <213> Homo sapiens <220>
<221> unión_misc
<222> (1)..(305)
<223> MAR de cromosoma 2 cóntigos genómicos; 22834991..22835295
<400> 137
<210> 138 10 <211> 352
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(352)
<223> MAR de cromosoma 2 cóntigos genómicos; 25277762..25278113
<400> 138
<210> 139
<211> 342
<212> DNA
<213> Homo sapiens 25
<220>
<221> unión_misc
<222> (1)..(342)
<223> MAR de cromosoma 2 cóntigos genómicos; 25378452..25378793 30
<400> 139 <210> 140
<211> 663 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(663)
<223> MAR de cromosoma 2 cóntigos genómicos; 30209437..30210099
<400> 140
<210> 141
<211> 1200
<212> DNA
<213> Homo sapiens 20
<220>
<221> unión_misc
<222> (1)..(1200)
<223> MAR de cromosoma 2 cóntigos genómicos; 31725089..31726288 25
<400> 141 <210> 142
<211> 325 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(325)
<223> MAR de cromosoma 2 cóntigos genómicos; 32147252..32147576
<400> 142
<210> 143
<211> 507
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(507)
<223> MAR de cromosoma 2 cóntigos genómicos; 32312662..32313168
<400> 143
<210> 144
<211> 339
<212> DNA
<213> Homo sapiens 15
<220>
<221> unión_misc
<222> (1)..(339)
<223> MAR de cromosoma 2 cóntigos genómicos; 33651118..33651456 20
<400> 144
<210> 145
<211> 461 25 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 30 <222> (1)..(461)
<223> MAR de cromosoma 2 cóntigos genómicos; 45073053..45073513
<400> 145 <210> 146
<211> 1162 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(1162)
<223> MAR de cromosoma 2 cóntigos genómicos; 45487691..45488852
<400> 146 <210> 147
<211> 562 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(562)
<223> MAR de cromosoma 2 cóntigos genómicos; 45516233..45516794
<400> 147 <210> 148
<211> 801 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(801)
<223> MAR de cromosoma 2 cóntigos genómicos; 45727251..45728051
<400> 148
<210> 149
<211> 346
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(346)
<223> MAR de cromosoma 2 cóntigos genómicos; 50937238..50937583
<400> 149
<210> 150 10 <211> 462
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(462)
<223> MAR de cromosoma 2 cóntigos genómicos; 55672627.. 55673088
<400> 150
<210> 151
<211> 401
<212> DNA
<213> Homo sapiens 25
<220>
<221> unión_misc
<222> (1)..(401)
<223> MAR de cromosoma 2 cóntigos genómicos; 56081352..56081752 30
<400> 151
<210> 152
<211> 765
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(765) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 56404208..56404972
<400> 152
15 <210> 153
<211> 443
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(443)
<223> MAR de cromosoma 2 cóntigos genómicos; 61953416..61953858
25 <400> 153 <210> 154
<211> 372 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(372)
<223> MAR de cromosoma 2 cóntigos genómicos; 62076211..62076582
<400> 154
<210> 155 15 <211> 484
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(484)
<223> MAR de cromosoma 2 cóntigos genómicos; 62158581..62159064
<400> 155
<210> 156
<211> 644
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(644) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 68145036..68145679
<400> 156
<210> 157 15 <211> 530
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(530)
<223> MAR de cromosoma 2 cóntigos genómicos; 71257289..71257818
<400> 157
<210> 158
<211> 337
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(337) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 73413615..73413951
<400> 158
15 <210> 159
<211> 1340
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(1340)
<223> MAR de cromosoma 2 cóntigos genómicos; 77011049..77012388
25 <400> 159 <210> 160
<211> 937 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(937)
<223> MAR de cromosoma 2 cóntigos genómicos; 78226855..78227791
<400> 160 <210> 161
<211> 1350 . 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(1350)
<223> MAR de cromosoma 2 cóntigos genómicos; 79287748..79289097
<400> 161
<210> 162
<211> 332
<212> DNA 5 <213> Homo sapiens
<220>
<221> misc_difference
<222> (1)..(332) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 81142998..81143329
<400> 162
<210> 163
<211> 327
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(327) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 84019536..84019862
<400> 163
<210> 164 15 <211> 407
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(407)
<223> MAR de cromosoma 2 cóntigos genómicos; 1448030..1448436
<400> 164
<210> 165
<211> 1959
<212> DNA
<213> Homo sapiens 30
<220>
<221> unión_misc
<222> (1)..(1959)
<223> MAR de cromosoma 2 cóntigos genómicos; 2117630..2119588
<400> 165
<210> 166
<211> 520
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(520) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 2119984..2120503
<400> 166
<210> 167
<211> 954
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(954) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 2578285..2579238
<400> 167
<210> 168 15 <211> 452
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(452)
<223> MAR de cromosoma 2 cóntigos genómicos; 3836217..3836668
<400> 168
<210> 169
<211> 417
<212> DNA
<213> Homo sapiens 15
<220>
<221> unión_misc
<222> (1)..(417)
<223> MAR de cromosoma 2 cóntigos genómicos; 3837666..3838082 20
<400> 169
<210> 170 25 <211> 1197
<212> DNA
<213> Homo sapiens
<220> 30 <221> unión_misc
<222> (1)..(1197)
<223> MAR de cromosoma 2 cóntigos genómicos; 6294846..6296042
<400> 170 <210> 171
<211> 362 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(362)
<223> MAR de cromosoma 2 cóntigos genómicos; 6506971..6507332
<400> 171
<210> 172
<211> 2578
<212> DNA
<213> Homo sapiens 5
<220>
<221> unión_misc
<222> (1)..(2578)
<223> MAR de cromosoma 2 cóntigos genómicos; 6507395..6509972 10
<400> 172
<210> 173
<211> 598 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(598)
<223> MAR de cromosoma 2 cóntigos genómicos; 7770400..7770997
<400> 173
<210> 174
<211> 1048
<212> DNA 15 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(1048) 20 <223> MAR de cromosoma 2 cóntigos genómicos; 8332422..8333469
<400> 174 <210> 175
<211> 375 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(375)
<223> MAR de cromosoma 2 cóntigos genómicos; 8909678..8910052
<400> 175
15 <210> 176
<211> 563
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(563)
<223> MAR de cromosoma 2 cóntigos genómicos; 10572503..10573065
<400> 176
<210> 177
<211> 595
<212> DNA
<213> Homo sapiens 15
<220>
<221> unión_misc
<222> (1)..(595)
<223> MAR de cromosoma 2 cóntigos genómicos; 11609694..11610288 20
<400> 177
<210> 178
<211> 662
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(662) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 12699804..12700465
<400> 178
<210> 179 15 <211> 649
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(649)
<223> MAR de cromosoma 2 cóntigos genómicos; 12821904..12822552
<400> 179
<210> 180
<211> 3191
<212> DNA
<213> Homo sapiens 15
<220>
<221> unión_misc
<222> (1)..(3191)
<223> MAR de cromosoma 2 cóntigos genómicos; 15356889..15360079 20
<400> 180
<210> 181
<211> 314
<212> DNA
<213> Homo sapiens <220>
<221> unión_misc
<222> (1)..(314)
<223> MAR de cromosoma 2 cóntigos genómicos; 728676..728989
<400> 181
<210> 182 10 <211> 423
<212> DNA
<213> Homo sapiens
<220> 15 <221> unión_misc
<222> (1)..(423)
<223> MAR de cromosoma 2 cóntigos genómicos; 737493..737915
<400> 182
<210> 183
<211> 724
<212> DNA
<213> Homo sapiens 25
<220>
<221> unión_misc
<222> (1)..(724)
<223> MAR de cromosoma 2 cóntigos genómicos; 1069556..1070279 30
<400> 183 <210> 184
<211> 383 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(383)
<223> MAR de cromosoma 2 cóntigos genómicos; 2719918..2720300
<400> 184
<210> 185
<211> 309
<212> DNA
<213> Homo sapiens 20
<220>
<221> unión_misc
<222> (1)..(309)
<223> MAR de cromosoma 2 cóntigos genómicos; 4994249..4994557 25
<400> 185
<210> 186
<211> 740
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(740) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 5034916..5035655
<400> 186
<210> 187 15 <211> 847
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(847)
<223> MAR de cromosoma 2 cóntigos genómicos; 6074678..6075524
<400> 187
<210> 188
<211> 784
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(784) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 6108986..6109769
<400> 188
<210> 189
<211> 381
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(381) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 10389032..10389412
<400> 189
<210> 190
<211> 507 15 <212> DNA
<213> Homo sapiens
<220>
<221> misc_difference 20 <222> (1)..(507)
<223> MAR de cromosoma 2 cóntigos genómicos; 11097807..11098313
<400> 190 <210> 191
<211> 329
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(329) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 11234628..11234956
<400> 191
<210> 192 15 <211> 584
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(584)
<223> MAR de cromosoma 2 cóntigos genómicos; 797844..798427
<400> 192
<210> 193
<211> 363
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(363) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 1093824..1094186
<400> 193
<210> 194
<211> 545 15 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 20 <222> (1)..(545)
<223> MAR de cromosoma 2 cóntigos genómicos; 3456187..3456731
<400> 194
<210> 195
<211> 356
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(356) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 5001567..5001922
<400> 195
<210> 196 15 <211> 321
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(321)
<223> MAR de cromosoma 2 cóntigos genómicos; 5457330..5457650
<400> 196
<210> 197
<211> 361
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(361) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 8124469..8124829
<400> 197
<210> 198
<211> 418 15 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 20 <222> (1)..(418)
<223> MAR de cromosoma 2 cóntigos genómicos; 11151485..11151902
<400> 198
25 <210> 199
<211> 394
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(394)
<223> MAR de cromosoma 2 cóntigos genómicos; 13591477..13591870
<400> 199
<210> 200
<211> 1194 10 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 15 <222> (1)..(1194)
<223> MAR de cromosoma 2 cóntigos genómicos; 14996824..14998017
<400> 200 <210> 201
<211> 487 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(487)
<223> MAR de cromosoma 2 cóntigos genómicos; 14998429..14998915
<400> 201
<210> 202
<211> 421
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(421) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 16562490..16562910
<400> 202
<210> 203 15 <211> 479
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(479)
<223> MAR de cromosoma 2 cóntigos genómicos; 21592301...21592779
<400> 203
<210> 204
<211> 870
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(870) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 22557584..22558453
<400> 204
15 <210> 205
<211> 1086
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(1086)
<223> MAR de cromosoma 2 cóntigos genómicos; 30591960..30593045
<400> 205
<210> 206
<211> 406 10 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 15 <222> (1)..(406)
<223> MAR de cromosoma 2 cóntigos genómicos; 36233909..36234314
<400> 206
<210> 207
<211> 797
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(797) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 36271745..36272541
<400> 207
15 <210> 208
<211> 423
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(423)
<223> MAR de cromosoma 2 cóntigos genómicos; 36498521..36498943 25 <400> 208
<210> 209
<211> 304 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(304)
<223> MAR de cromosoma 2 cóntigos genómicos; 37179891..37180194
<400> 209
15 <210> 210
<211> 693
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(693)
<223> MAR de cromosoma 2 cóntigos genómicos; 38440448..38441140
25 <400> 210 <210> 211
<211> 471
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(471) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 38887582..38888052
<400> 211
<210> 212 15 <211> 1221
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(1221)
<223> MAR de cromosoma 2 cóntigos genómicos; 43885944..43887164
<400> 212
<210> 213
<211> 543
<212> DNA 5 >213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(543) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 45818200..45818742
<400> 213
<210> 214
<211> 463
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(463) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 47055478..47055940
<400> 214
<210> 215 15 <211> 2482
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(2482)
<223> MAR de cromosoma 2 cóntigos genómicos; 47492696..47495177
<400> 215
<210> 216
<211> 539
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(539) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 47561069..47561607
<400> 216
<210> 217 15 <211> 336
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(336)
<223> MAR de cromosoma 2 cóntigos genómicos; 52853648..52853983
<400> 217
<210> 218
<211> 406
<212> DNA 15 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(406) 20 <223> MAR de cromosoma 2 cóntigos genómicos; 54866263..54866668
<400> 218
<210> 219 25 <211> 1452
<212> DNA
<213> Homo sapiens
<220> 30 <221> unión_misc
<222> (1)..(1452)
<223> MAR de cromosoma 2 cóntigos genómicos; 55113305..55114756
<400> 219 <210> 220
<211> 502 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(502)
<223> MAR de cromosoma 2 cóntigos genómicos; 56350637..56351138
<400> 220 <210> 221
<211> 794 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(794)
<223> MAR de cromosoma 2 cóntigos genómicos; 57051633..57052426
<400> 221
<210> 222
<211> 300
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(300)
<223> MAR de cromosoma 2 genomic contig: 57069272..57069571
<400> 222
<210> 223
<211> 370
<212> DNA
<213> Homo sapiens 10
<220>
<221> unión_misc
<222> (1)..(370)
<223> MAR de cromosoma 2 cóntigos genómicos; 57235143..57235512 15
<400> 223
<210> 224
<211> 306 20 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 25 <222> (1)..(306)
<223> MAR de cromosoma 2 cóntigos genómicos; 57693125..57693430
<400> 224
<210> 225
<211> 500
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(500)
<223> MAR de cromosoma 2 cóntigos genómicos; 59810331..59810830
<400> 225
<210> 226
<211> 565
<212> DNA
<213> Homo sapiens 15
<220>
<221> unión_misc
<222> (1)..(565)
<223> MAR de cromosoma 2 cóntigos genómicos; 59974589..59975153 20
<400> 226
<210> 227
<211> 427 25 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(427)
<223> MAR de cromosoma 2 cóntigos genómicos; 60605573..60605999
<400> 227
<210> 228
<211> 1199
<212> DNA
<213> Homo sapiens 10
<220>
<221> unión_misc
<222> (1)..(1199)
<223> MAR de cromosoma 2 cóntigos genómicos; 61229949..61231147 15
<400> 228 <210> 229
<211> 454 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(454)
<223> MAR de cromosoma 2 cóntigos genómicos; 62181058..62181511
<400> 229
<210> 230
<211> 658
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(658) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 62190919..62191576
<400> 230
15 <210> 231
<211> 1486
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(1486)
<223> MAR de cromosoma 2 cóntigos genómicos; 62384127..62385612 <400> 231
<210> 232 5 <211> 333
<212> DNA
<213> Homo sapiens
<220> 10 <221> unión_misc
<222> (1)..(333)
<223> MAR de cromosoma 2 cóntigos genómicos; 62538649..62538981
<400> 232
<210> 233
<211> 480
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(480) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 63240325..63240804
<400> 233
15 <210> 234
<211> 302
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(302)
<223> MAR de cromosoma 2 cóntigos genómicos; 63935480..63935781
25 <400> 234
<210> 235
<211> 407
<212> DNA
<213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(407)
<223> MAR de cromosoma 2 cóntigos genómicos; 63935888..63936294
<400> 235
<210> 236
<211> 302
<212> DNA
<213> Homo sapiens 15
<220>
<221> unión_misc
<222> (1)..(302)
<223> MAR de cromosoma 2 cóntigos genómicos; 66958350..66958651 20
<400> 236
<210> 237
<211> 651 25 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 30 <222> (1)..(651)
<223> MAR de cromosoma 2 cóntigos genómicos; 68307125..68307775
<400> 237 <210> 238
<211> 367 5 <212> DNA
<213> Homo sapiens
<220>
<221> unión_misc 10 <222> (1)..(367)
<223> MAR de cromosoma 2 cóntigos genómicos; 68308243..68308609
<400> 238
15 <210> 239
<211> 499
<212> DNA
<213> Homo sapiens
20 <220>
<221> unión_misc
<222> (1)..(499)
<223> MAR de cromosoma 2 cóntigos genómicos; 410241..410739
25 <400> 239 <210> 240
<211> 402
<212> DNA 5 <213> Homo sapiens
<220>
<221> unión_misc
<222> (1)..(402) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 31531..31932
<400> 240
<210> 241 15 <211> 421
<212> DNA
<213> Homo sapiens
<220> 20 <221> unión_misc
<222> (1)..(421)
<223> MAR de cromosoma 2 cóntigos genómicos; 32415..32835
<400> 241

Claims (25)

  1. REIVINDICACIONES
    1.
    Una secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas, caracterizada porque dicha secuencia de DNA comprende: a) al menos un elemento de DNA curvado, en donde el elemento de DNA curvado contiene al menos 33% del dinucleótido TA y/o al menos 33% del dinucleótido AT en un tramo de 100 pares de bases contiguos, b) al menos un sitio de unión para una proteína de unión a DNA, y porque es una secuencia de nucleótidos de MAR que tiene la secuencia SEQ ID No 25, o una de sus secuencias complementarias, o una secuencia que tiene una identidad de al menos 90% con dicha secuencia SEQ ID No 25.
  2. 2.
    La secuencia aislada y purificada de acuerdo con la reivindicación 1, caracterizada porque dicha proteína de unión al DNA es un factor de transcripción.
  3. 3.
    La secuencia aislada y purificada de acuerdo con la reivindicación 2, caracterizada porque el factor de transcripción se selecciona del grupo que comprende proteínas del dominio polyQpolyP.
  4. 4.
    La secuencia aislada y purificada de acuerdo con la reivindicación 2, caracterizada porque el factor de transcripción se selecciona del grupo que comprende SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C/EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2, Pit1, TTF1, XFD1, AR, C/EBPgamma, Cdc5, FOXD3, HFH3, HNF3 beta, MRF2, Oct1, POU6F1, SRF, V$MTATA_B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL HP1, Myc, PBX, Pax3, TEF, VBP, XFD3, Brn2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1F1, Pax6, TFIIA y Vmw65 o una combinación de dos o más de estos factores de transcripción.
  5. 5.
    El uso de una secuencia de DNA aislada y purificada que comprende una primera secuencia de nucleótidos aislada de la región de fijación a la matriz (MAR) que es una secuencia de nucleótidos de MAR seleccionada del grupo que comprende:
    -
    una secuencia de DNA aislada y purificada de acuerdo con cualquiera de las reivindicaciones 1 a 4,
    -
    la secuencia SEQ ID No 25, o una de sus secuencias complementarias, para aumentar la actividad de producción de proteínas en una célula hospedante eucariótica.
  6. 6.
    El uso de la secuencia de DNA aislada y purificada de acuerdo con la reivindicación 5, caracterizado porque dicha secuencia de DNA aislada y purificada comprende además un promotor unido operativamente a un gen de interés.
  7. 7.
    El uso de la secuencia de DNA aislada y purificada de acuerdo con la reivindicación 5 o 6, caracterizado porque dicha secuencia de DNA aislada y purificada comprende además al menos una segunda secuencia de nucleótidos aislada de una región de fijación a la matriz (MAR) que es una secuencia de nucleótidos de MAR seleccionada del grupo que comprende:
    -
    una secuencia de DNA aislada y purificada de acuerdo con cualquiera de las reivindicaciones 1 a 4,
    -
    la secuencia SEQ ID No 25, o una de sus secuencias complementarias, para aumentar la actividad de producción de proteínas en una célula hospedante eucariótica.
  8. 8.
    El uso de la secuencia de DNA aislada y purificada de acuerdo con la reivindicación 7, caracterizado porque dicha primera y al menos segunda secuencias de MAR están localizadas en ambos extremos 5’ y 3’ de la secuencia que contiene el promotor y el gen de interés.
  9. 9.
    El uso de la secuencia de DNA aislada y purificada de acuerdo con la reivindicación 7, caracterizado porque dicha primera y al menos segunda secuencias de MAR están localizadas en una secuencia distinta de la que contiene el promotor y el gen de interés.
  10. 10.
    El uso de la secuencia de DNA aislada y purificada de acuerdo con cualquiera de las reivindicaciones 6 a 9, caracterizado porque dicha secuencia de DNA aislada y purificada está en forma de una secuencia de DNA lineal como vector.
  11. 11.
    Un método de transfección in vitro de una célula hospedante eucariótica, comprendiendo dicho método: a) introducir en dicha célula hospedante eucariótica al menos una secuencia de DNA purificada que comprende al menos una secuencia de DNA aislada y purificada que consiste en una secuencia de nucleótidos de MAR de acuerdo con cualquiera de las reivindicaciones 1 a 4, b) someter en un tiempo definido dicha célula hospedante eucariótica transfectada a al menos una etapa adicional de transfección con al menos una secuencia de DNA purificada que comprende al menos una secuencia de DNA de interés y/o con al menos una secuencia de DNA aislada y purificada que consiste en una secuencia de nucleótidos de MAR u otros elementos modificadores de la cromatina, y c) seleccionar dicha célula hospedante eucariótica transfectada.
  12. 12.
    El método de acuerdo con la reivindicación 11, caracterizado porque dicha secuencia de DNA de interés es un gen de interés que codifica una proteína unida operativamente a un promotor.
  13. 13.
    El método de acuerdo con la reivindicación 11 o 12, caracterizado porque las células hospedantes eucarióticas transfectadas seleccionadas son células altamente productoras de proteínas con una tasa de producción de al menos 10 pg por célula y por día.
  14. 14.
    El método de acuerdo con cualquiera de las reivindicaciones 11 a 13, caracterizado porque la secuencia de nucleótidos de MAR se selecciona del grupo que comprende:
    -
    una secuencia de DNA aislada y purificada de acuerdo con cualquiera de las reivindicaciones 1 a 4,
    -
    la secuencia SEQ ID No 25, o una de sus secuencias complementarias.
  15. 15.
    El método de acuerdo con cualquiera de las reivindicaciones 11 a 14, caracterizado porque la secuencia de nucleótidos de MAR es una secuencia aislada y purificada de acuerdo con cualquiera de las reivindicaciones 1 a 4, o una de sus secuencias complementarias.
  16. 16.
    El método de acuerdo con cualquiera de las reivindicaciones 11 a 15, caracterizado porque el tiempo definido corresponde a intervalos relacionados con el ciclo de división celular.
  17. 17.
    El método de acuerdo con la reivindicación 16, caracterizado porque el tiempo definido es el momento en que la célula hospedante acaba de entrar en el segundo ciclo de división celular.
  18. 18.
    Un método de transfección de una célula hospedante eucariótica, comprendiendo dicho método co-transfectar en dicha célula hospedante eucariótica al menos una primera secuencia de DNA aislada y purificada, que comprende al menos una secuencia de DNA de interés, y una segunda secuencia de DNA aislada y purificada que comprende al menos una secuencia de nucleótidos de MAR seleccionada del grupo que comprende:
    -
    una secuencia de DNA aislada y purificada de acuerdo con cualquiera de las reivindicaciones 1 a 4,
    -
    la secuencia SEQ ID No 25 o una de sus secuencias complementarias.
  19. 19.
    Un proceso para la producción de una proteína, en donde: a) una célula hospedante eucariótica transfectada de acuerdo con cualquiera de las reivindicaciones 11 a 18 se cultiva en un medio de cultivo en condiciones adecuadas para la expresión de dicha proteína y b) se recupera dicha proteína.
  20. 20.
    Una célula hospedante eucariótica transfectada de acuerdo con una cualquiera de las reivindicaciones 11 a 18.
  21. 21.
    Una mezcla o un kit de transfección celular que comprende al menos una secuencia de DNA de acuerdo con cualquiera de las reivindicaciones 1 a 4.
  22. 22.
    Un organismo transgénico no humano, caracterizado porque al menos algunas de sus células tienen incorporada establemente al menos una secuencia de DNA de acuerdo con cualquiera de las reivindicaciones 1 a 4.
  23. 23.
    Un organismo transgénico no humano, caracterizado porque su genoma tiene establemente incorporada al menos una secuencia de DNA de acuerdo con cualquiera de las reivindicaciones 1 a 4.
  24. 24.
    El organismo transgénico no humano de acuerdo con la reivindicación 22 o 23, caracterizado porque algunas de sus células han sido transfectadas según el método de acuerdo con cualquiera de las reivindicaciones 11 a 18.
  25. 25.
    Una célula hospedante eucariótica transfectada con al menos una secuencia de DNA de acuerdo con cualquiera de las reivindicaciones 1 a 4.
ES08153753T 2003-10-24 2004-10-22 Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz Active ES2383006T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US51357403P 2003-10-24 2003-10-24
US513574P 2003-10-24
EP04002722 2004-02-06
EP04002722 2004-02-06

Publications (1)

Publication Number Publication Date
ES2383006T3 true ES2383006T3 (es) 2012-06-15

Family

ID=46149058

Family Applications (4)

Application Number Title Priority Date Filing Date
ES10178873T Active ES2400296T3 (es) 2003-10-24 2004-10-22 Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz
ES08153753T Active ES2383006T3 (es) 2003-10-24 2004-10-22 Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz
ES10178871T Active ES2399878T3 (es) 2003-10-24 2004-10-22 Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz
ES10178866T Active ES2399877T3 (es) 2003-10-24 2004-10-22 Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES10178873T Active ES2400296T3 (es) 2003-10-24 2004-10-22 Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES10178871T Active ES2399878T3 (es) 2003-10-24 2004-10-22 Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz
ES10178866T Active ES2399877T3 (es) 2003-10-24 2004-10-22 Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz

Country Status (7)

Country Link
KR (1) KR20120069776A (es)
CA (3) CA2884687C (es)
DK (4) DK1959011T3 (es)
ES (4) ES2400296T3 (es)
PT (4) PT2287302E (es)
SG (3) SG10201500657PA (es)
SI (4) SI2287302T1 (es)

Also Published As

Publication number Publication date
SG10201500657PA (en) 2015-04-29
DK2287302T3 (da) 2013-04-08
SI1959011T1 (sl) 2012-06-29
CA2826733C (en) 2016-07-12
DK1959011T3 (da) 2012-07-02
PT2287302E (pt) 2013-03-11
ES2399877T3 (es) 2013-04-04
CA2884687A1 (en) 2005-05-06
SI2287302T1 (sl) 2013-04-30
SI2298898T1 (sl) 2013-04-30
SG10201500656RA (en) 2015-04-29
PT1959011E (pt) 2012-05-25
DK2298898T3 (da) 2013-04-08
PT2298898E (pt) 2013-03-11
SG195562A1 (en) 2013-12-30
DK2292754T3 (da) 2013-04-08
ES2399878T3 (es) 2013-04-04
KR20120069776A (ko) 2012-06-28
CA2884685A1 (en) 2005-05-06
PT2292754E (pt) 2013-03-11
CA2884685C (en) 2016-12-20
CA2826733A1 (en) 2005-05-06
SI2292754T1 (sl) 2013-04-30
ES2400296T3 (es) 2013-04-08
CA2884687C (en) 2016-08-23

Similar Documents

Publication Publication Date Title
US10669562B2 (en) High efficiency gene transfer and expression in mammalian cells by a multiple transfection procedure of MAR sequences
AU2007287327B2 (en) Matrix attachment regions (MARs) for increasing transcription and uses thereof
ES2383006T3 (es) Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz