ES2400296T3

ES2400296T3 - Transfer and expression of highly efficient genes in mammalian cells by a multiple transfection method of sequences of regions of fixation to the matrix

Info

Publication number: ES2400296T3
Application number: ES10178873T
Authority: ES
Inventors: Nicolas Mermod; Pierre Alain Girod; Philipp Bucher; David Calabrese; Duc-Quang Nguyen; Damien Saugy; Stefania Puttini
Original assignee: Selexis SA
Current assignee: Selexis SA
Priority date: 2003-10-24
Filing date: 2004-10-22
Publication date: 2013-04-08
Anticipated expiration: 2024-10-22
Also published as: SG10201500656RA; KR20120069776A; DK2298898T3; PT1959011E; ES2399878T3; CA2884687C; CA2826733A1; SI2298898T1; CA2826733C; PT2298898E; CA2884685A1; DK1959011T3; SI2287302T1; SG195562A1; DK2292754T3; SG10201500657PA; SI1959011T1; CA2884687A1; ES2399877T3; SI2292754T1

Abstract

Una secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas,caracterizada por que dicha secuencia de DNA comprende a) al menos un elemento de DNA curvado, en donde elelemento de DNA curvado contiene al menos 33% del dinucleótido TA y/o al menos 33% del dinucleótido AT en untramo de 100 pares de bases contiguos, b) al menos un sitio de unión para una proteína de unión a DNA, y porquees una secuencia de nucleótidos de MAR que tiene la secuencia SEQ ID No 27, o una de sus secuenciascomplementarias, o una secuencia que tiene una identidad de al menos 90% con dicha secuencia SEQ ID No 27.An isolated and purified DNA sequence that has an activity that increases protein production, characterized in that said DNA sequence comprises a) at least one curved DNA element, where the curved DNA element contains at least 33% of TA dinucleotide and / or at least 33% of the AT dinucleotide in a contiguous 100 base pair span, b) at least one binding site for a DNA binding protein, and because it is a MAR nucleotide sequence having the sequence SEQ ID No 27, or one of its complementary sequences, or a sequence that has an identity of at least 90% with said sequence SEQ ID No 27.

Description

Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz. Transfer and expression of highly efficient genes in mammalian cells by a method of multiple transfection of sequences from regions of fixation to the matrix.

FIELD OF THE INVENTION

La presente invención se refiere a secuencias de DNA aisladas y purificadas que tienen una actividad que aumenta la producción de proteínas y más específicamente al uso de regiones de fijación a la matriz (abreviadamente en lo sucesivo MAR por la expresión inglesa Matrix Attachment Regions) para aumentar la actividad de producción de proteínas en una célula eucariótica. También se describe un método para la identificación de dichas regiones activas, en particular secuencias de nucleótidos de MAR y el uso de estas secuencias de MAR activas caracterizadas en un nuevo método de transfección múltiple. The present invention relates to isolated and purified DNA sequences having activity that increases protein production and more specifically to the use of matrix-binding regions (hereinafter abbreviated MAR by the English expression Matrix Attachment Regions) to increase protein production activity in a eukaryotic cell. Also described is a method for identifying such active regions, in particular MAR nucleotide sequences and the use of these characterized active MAR sequences in a novel multiple transfection method.

BACKGROUND OF THE INVENTION

Actualmente, el modelo de organización de dominios en bucle de cromosomas eucarióticos está muy aceptado (Boulikas T, "Nature of DNA sequences at the attachment regions of genes to the nuclear matrix", J. Cell Biochem., Currently, the model of organization of looped domains of eukaryotic chromosomes is widely accepted (Boulikas T, "Nature of DNA sequences at the attachment regions of genes to the nuclear matrix", J. Cell Biochem.,

52: 14-22, 1993). De acuerdo con este modelo la cromatina se organiza en bucles que abarcan 50-100 kb fijados a la matriz nuclear, un retículo proteínico constituido por ribonucleoproteínas (RNP) y otras proteínas no histónicas (Bode J, Stengert-Iber M, Kay V, Schalke T and Dietz-Pfeilstetter A, Crit. Rev. Euk. Gene Exp., 6:115-138, 1996). 52: 14-22, 1993). According to this model, chromatin is organized in loops that span 50-100 kb fixed to the nuclear matrix, a protein lattice made up of ribonucleoproteins (RNP) and other non-histonic proteins (Bode J, Stengert-Iber M, Kay V, Schalke T and Dietz-Pfeilstetter A, Crit. Rev. Euk. Gene Exp., 6: 115-138, 1996).

Las regiones de DNA fijadas a la matriz nuclear se denominan SAR (por la expresión inglesa Scaffold Attachment Region) o MAR, para regiones de fijación al armazón (durante la metafase) o a la matriz (interfase), respectivamente (Hart C and Laemmli U.(1998), "Facilitation of chromatin dynamics by SARs", Curr. Opin. Genet. Dev. 8, 519-525.) The DNA regions attached to the nuclear matrix are called SAR (for the Scaffold Attachment Region) or MAR, for regions of fixation to the framework (during the metaphase) or to the matrix (interface), respectively (Hart C and Laemmli U. (1998), "Facilitation of chromatin dynamics by SARs", Curr. Opin. Genet. Dev. 8, 519-525.)

En este sentido, dichas regiones pueden definir los límites de los dominios de cromatina independientes, de tal modo que sólo los elementos cis-reguladores envolventes controlan la expresión de los genes en el dominio. In this sense, these regions can define the boundaries of the independent chromatin domains, in such a way that only the enveloping cis-regulatory elements control the expression of the genes in the domain.

Sin embargo, su capacidad para proteger completamente un locus cromosómico de elementos de cromatina cercanos y por consiguiente conferirles una expresión génica independiente de la posición, no ha sido observada en las células establemente transfectadas (Poljak L, Seum C, Mattioni T and Laemmli U. (1994) "SARs stimulate but do not confer position independent gene expression", Nucleic Acids Res 22, 4386-4394). Por otro lado, se ha demostrado que las secuencias de MAR (o S/MAR) interaccionan con potenciadores para aumentar la accesibilidad a la cromatina local (Jenuwein T, Forrester W, Fernandez-Herrero L, Laible G, Dull M, and Grosschedl R. (1997) "Extension of chromatin accessibility by nuclear matrix attachment regions", Nature, 385, 269-272). Específicamente, los elementos de MAR pueden potenciar la expresión de genes heterólogos en líneas de cultivos celulares (Kalos M and Fournier R (1995) "Position-independent transgene expression mediated by boundary elements from the apolipoprotein B chromatin domain", Mol. Cell Biol., 15,198-207), ratones transgénicos (Castilla J, Pintado B, Sola I, Sánchez-Morgado J, and Enjuanes L(1998) "Engineering passive immunity in transgenic mice secreting virusneutralizing antibodies in milk", Nat. Biotechnol., 16, 349-354) y vegetales (Allen G, Hall GJ, Michalowski S, Newman W, Spiker S, Weissinger A, and Thompson W (1996), "High-level transgene expression in plant cells: effects of a strong scaffold attachment region from tobacco", Plant Cell 8, 899-913). Se reconoce también la utilidad de las secuencias de MAR para desarrollar vectores mejorados para terapia génica (Agarwal M, Austin T, Morel F, Chen J, Bohnlein E, and Plavec I (1998), "Scaffold attachment region-mediated enhancement of retroviral vector expression in primary T cells", J. Virol 72, 3720-3728). However, its ability to fully protect a chromosomal locus from nearby chromatin elements and thereby confer position-independent gene expression on them, has not been observed in stably transfected cells (Poljak L, Seum C, Mattioni T and Laemmli U. (1994) "SARs stimulate but do not confer position independent gene expression", Nucleic Acids Res 22, 4386-4394). On the other hand, MAR (or S / MAR) sequences have been shown to interact with enhancers to increase accessibility to local chromatin (Jenuwein T, Forrester W, Fernandez-Herrero L, Laible G, Dull M, and Grosschedl R . (1997) "Extension of chromatin accessibility by nuclear matrix attachment regions", Nature, 385, 269-272). Specifically, MAR elements can enhance heterologous gene expression in cell culture lines (Kalos M and Fournier R (1995) "Position-independent transgene expression mediated by boundary elements from the apolipoprotein B chromatin domain", Mol. Cell Biol. , 15,198-207), transgenic mice (Castilla J, Pintado B, Sola I, Sánchez-Morgado J, and Enjuanes L (1998) "Engineering passive immunity in transgenic mice secreting virus neutralizing antibodies in milk", Nat. Biotechnol., 16, 349-354) and vegetables (Allen G, Hall GJ, Michalowski S, Newman W, Spiker S, Weissinger A, and Thompson W (1996), "High-level transgene expression in plant cells: effects of a strong scaffold attachment region from tobacco ", Plant Cell 8, 899-913). The usefulness of MAR sequences for developing improved vectors for gene therapy is also recognized (Agarwal M, Austin T, Morel F, Chen J, Bohnlein E, and Plavec I (1998), "Scaffold attachment region-mediated enhancement of retroviral vector expression in primary T cells ", J. Virol 72, 3720-3728).

Recientemente, se ha demostrado que las secuencias modificadoras de la estructura de la cromatina que incluyen las MAR, como ha sido ilustrado por la MAR en el extremo 5’ de lisozima de pollo, son capaces de potenciar significativamente la expresión de genes indicadores en mezclas de células de ovario de hámster chino (abreviadamente CHO, por la expresión inglesa Chinese Hamster Ovary) (Zahn-Zabal M, et al., "Development of stable cell lines for production or regulated expression using matrix attachment regions", J. Biotechnol, 2001, 87(1): Recently, chromatin structure modifying sequences including MARs have been shown, as illustrated by MAR at the 5 'end of chicken lysozyme, to be able to significantly enhance expression of reporter genes in mixtures of Chinese Hamster Ovary Cells (abbreviated CHO for Chinese Hamster Ovary) (Zahn-Zabal M, et al., "Development of stable cell lines for production or regulated expression using matrix attachment regions", J. Biotechnol, 2001 , 87 (1):

p. 29-42). Esta propiedad se utilizó para aumentar la proporción de clones de alta producción, reduciendo así el número de clones que necesitan ser cribados. Estos beneficios se han observado tanto en construcciones con las MAR que flanquean la casete de expresión transgénica, como cuando las construcciones son co-transfectadas con las MAR en un plásmido separado. Sin embargo, los niveles de expresión en la co-transfección conjunta con las MAR no eran tan elevados como los observados para una construcción en la que dos MAR delimitan la unidad de expresión transgénica. Se mostró un tercer proceso preferido que era la transfección de transgenes con las MAR tanto unidas al transgén como en un plásmido separado (Girod et al., pendiente de publicación). Sin embargo, una limitación persistente de esta técnica es la cantidad de DNA que puede ser transfectada por célula. Se han desarrollado muchos protocolos de transfecciones múltiples con el fin de conseguir una alta eficacia de transfección para caracterizar la función de los genes de interés. El protocolo aplicado por Yamamoto et al., 1999 ("High efficiency gene transfer by multiple transfection protocol", Histochem. J. 31 (4), 241-243) conduce a una eficacia de transfección de aproximadamente 80% después de 5 eventos de transfección, mientras que el protocolo de transfección convencional sólo consiguió una tasa <40%. Aunque esta técnica puede ser útil si se desea aumentar la proporción de células que se expresan, no conduce a células con una mayor productividad intrínseca. Por consiguiente, no se puede emplear para generar líneas de células monoclonales altamente productoras. Por lo tanto, la técnica anteriormente descrita tiene dos inconvenientes principales: p. 29-42). This property was used to increase the proportion of high production clones, thus reducing the number of clones that need to be screened. These benefits have been observed both in constructs with MARs flanking the transgenic expression cassette, and when constructs are co-transfected with MARs into a separate plasmid. However, the expression levels in co-transfection together with the MARs were not as high as those observed for a construct in which two MARs delimit the transgene expression unit. A third preferred process was shown which was transfection of transgenes with MARs both bound to the transgene and into a separate plasmid (Girod et al., Pending publication). However, a persistent limitation of this technique is the amount of DNA that can be transfected per cell. Many multiple transfection protocols have been developed in order to achieve high transfection efficiency to characterize the function of the genes of interest. The protocol applied by Yamamoto et al., 1999 ("High efficiency gene transfer by multiple transfection protocol", Histochem. J. 31 (4), 241-243) leads to a transfection efficiency of approximately 80% after 5 events of transfection, whereas the conventional transfection protocol only achieved a rate <40%. Although this technique may be useful if you want to increase the proportion of cells that are expressed, it does not lead to cells with higher intrinsic productivity. Consequently, it cannot be used to generate highly productive monoclonal cell lines. Therefore, the technique described above has two main drawbacks:

i) esta técnica no genera una población homogénea de células transfectadas, puesto que no puede favorecer la integración de más copias de genes ni dirigir los transgenes a loci cromosómicos favorables, i) this technique does not generate a homogeneous population of transfected cells, since it cannot favor the integration of more gene copies or direct the transgenes to favorable chromosomal loci,

ii) el uso del mismo marcador seleccionable en múltiples eventos de transfección no permite la selección de células doble o triplemente transfectadas. ii) the use of the same selectable marker in multiple transfection events does not allow the selection of double or triple transfected cells.

En la solicitud de patente WO02/074969, también se ha demostrado la utilidad de las MAR para el desarrollo de líneas de células eucarióticas estables. Sin embargo, esta solicitud no describe ni la homología conservada del elemento DNA de la MAR ni ninguna técnica para predecir la capacidad de una secuencia de DNA para ser una secuencia de MAR. In patent application WO02 / 074969, the utility of MARs for the development of stable eukaryotic cell lines has also been demonstrated. However, this application describes neither the conserved homology of the MAR DNA element nor any technique to predict the ability of a DNA sequence to be a MAR sequence.

En efecto, no se ha encontrado ninguna secuencia de consenso neta de MAR (Boulikas T, "Nature of DNA sequences at the attachment regions of genes to the nuclear matrix", J. Cell Biochem., 52:14-22, 1993) sino que por evolución, parece que la estructura de estas secuencias se conserva funcionalmente en genomas eucarióticos, puesto que las MAR de animales se pueden unir a los armazones nucleares de vegetales y viceversa (Mielke C, Kohwi Y, Kohwi-Shigematsu T and Bode J, "Hierarchical binding of DNA fragments derived from scaffold-attached regions: correlation of properties in vitro and function in vivo", Biochemistry, 29:7475-7485, 1990). Indeed, no net MAR consensus sequence has been found (Boulikas T, "Nature of DNA sequences at the attachment regions of genes to the nuclear matrix", J. Cell Biochem., 52: 14-22, 1993) but that by evolution, it seems that the structure of these sequences is functionally conserved in eukaryotic genomes, since the MAR of animals can bind to the nuclear frameworks of plants and vice versa (Mielke C, Kohwi Y, Kohwi-Shigematsu T and Bode J, "Hierarchical binding of DNA fragments derived from scaffold-attached regions: correlation of properties in vitro and function in vivo", Biochemistry, 29: 7475-7485, 1990).

La identificación de las MAR por estudios bioquímicos es un proceso largo e impredecible; se pueden obtener diferentes resultados dependiendo del ensayo (Razin SV, "Functional architecture of chromosomal DNA domains", Crit. Rev. Eukaryot. Gene Expr., 6:247-269, 1996). Considerando el enorme número esperado de MAR en un genoma eucariótico y la cantidad de secuencias obtenidas de los proyectos del genoma, sería de gran utilidad una herramienta capaz de filtrar las MAR potenciales con el fin de realizar experimentos específicos. The identification of MARs by biochemical studies is a long and unpredictable process; Different results may be obtained depending on the assay (Razin SV, "Functional architecture of chromosomal DNA domains", Crit. Rev. Eukaryot. Gene Expr., 6: 247-269, 1996). Considering the enormous number of MARs expected in a eukaryotic genome and the number of sequences obtained from genome projects, a tool capable of filtering potential MARs in order to carry out specific experiments would be very useful.

Actualmente, están disponibles en Internet dos herramientas diferentes de predicción para las MAR. La primera, el programa informático MAR-Finder (http: //futuresoflorg/MarFinder; Singh GB, Kramer JA and Krawetz SA, "Mathematical model to predict regions of chromatin attachment to the nuclear matrix". Nucleic Acid Research, 25:1419-1425, 1997) se basa en un conjunto identificado de patrones en las diversas MAR y un análisis estadístico de la coexistencia de estos patrones. Las predicciones por el programa MAR-Finder dependen del contexto de la secuencia, lo que significa que las MAR predichas dependen del contexto de la secuencia analizada. El otro programa informático de predicción, el programa SMARTest, (hftp://www. genomatix.de; Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold/matrix attachment regions in large genomic sequences", Genome Research, 12:349-354, 2001), usa matrices ponderadas derivadas de las MAR identificadas experimentalmente. Se dice que el programa SMARTest es adecuado para realizar análisis a gran escala. Pero realmente, además de su especificidad relativamente baja, la cantidad de MAR hipotéticas aumenta enormemente cuando se realiza con él un análisis a gran escala y no habiendo modo de aumentar su especificidad para restringir el número de MAR hipotéticas, el programa SMARTest es casi inútil para cribar potentes MAR a partir de secuencias grandes de DNA. Currently, two different predictive tools for MAR are available online. The first is the MAR-Finder software (http: // futuresoflorg / MarFinder; Singh GB, Kramer JA and Krawetz SA, "Mathematical model to predict regions of chromatin attachment to the nuclear matrix". Nucleic Acid Research, 25: 1419- 1425, 1997) is based on an identified set of patterns in the various MARs and a statistical analysis of the coexistence of these patterns. The predictions by the MAR-Finder program depend on the context of the sequence, which means that the predicted MARs depend on the context of the analyzed sequence. The other prediction software, the SMARTest program, (hftp: //www.genomatix.de; Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold / matrix attachment regions in large genomic sequences ", Genome Research, 12: 349-354, 2001), uses weighted matrices derived from experimentally identified MARs. The SMARTest program is said to be suitable for large-scale analysis. But really, in addition to its relatively low specificity, the amount of hypothetical MARs is greatly increased when a large-scale analysis is performed with it and there being no way to increase its specificity to restrict the number of hypothetical MARs, the SMARTest program is almost useless for Screen powerful MARs from large DNA sequences.

También existen algunos otros programas informáticos, no disponibles en Internet; se basan también en la frecuencia de restos de MAR (MRS criterion; Van Drunen CM et al., "A bipartite sequence element associated with matrix/scaffold attachment regions", Nucleic Acids Res, 27: 2924-2930, 1999), (ChrClass; Glazko GV et al., "Comparative study and prediction of DNA fragments associated with various elements of the nuclear matrix", Biochim. Biophys. Acta, 1517:351-356, 2001) o se basan en la identificación de sitios de dúplex de DNA inducidos por estrés (abreviadamente SIDD por la expresión inglesa Stress-Induced DNA Duplex); Benham C and al., "Stressinduced duplex DNA destabilization in scaffold/matrix attachment regions", J. Mol. Biol., 274:181-196, 1997). Sin embargo, no se conoce su idoneidad para analizar secuencias completas del genoma y no se ha informado sobre si estas herramientas pueden permitir la identificación de secuencias que aumenten la producción de proteínas. There are also some other computer programs, not available on the Internet; they are also based on the frequency of MAR residues (MRS criterion; Van Drunen CM et al., "A bipartite sequence element associated with matrix / scaffold attachment regions", Nucleic Acids Res, 27: 2924-2930, 1999), (ChrClass ; Glazko GV et al., "Comparative study and prediction of DNA fragments associated with various elements of the nuclear matrix", Biochim. Biophys. Acta, 1517: 351-356, 2001) or are based on the identification of duplex sites of Stress-induced DNA (abbreviated SIDD by the English expression Stress-Induced DNA Duplex); Benham C and al., "Stressinduced duplex DNA destabilization in scaffold / matrix attachment regions", J. Mol. Biol., 274: 181-196, 1997). However, their suitability for analyzing entire genome sequences is unknown, and it has not been reported whether these tools can allow the identification of sequences that increase protein production.

Además, debido a la especificidad relativamente baja de estos programas informáticos (Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold/matrix attachment regions in large genomic sequences", Genome Research, 12: 349-354, 2001), la cantidad de MAR hipotéticas identificadas en genomas las hace rápidamente inmanejables cuando se realizan análisis a gran escala, especialmente si la mayoría de ellas tienen poca o ninguna actividad en la práctica. Por tanto, no teniendo modo de aumentar la especificidad de predicción para restringir el número de MAR hipotéticas, muchos de los programas disponibles son prácticamente inútiles para identificar elementos genéticos potentes en vista del aumento eficaz de la producción de proteínas recombinantes. Furthermore, due to the relatively low specificity of these computer programs (Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold / matrix attachment regions in large genomic sequences", Genome Research, 12: 349-354, 2001), the amount of hypothetical MAR identified in genomes makes them rapidly unmanageable when performing large-scale analyzes, especially if most of them have little or no activity in practice. Therefore, having no way of increasing the prediction specificity to restrict the number of hypothetical MARs, many of the available programs are practically useless to identify powerful genetic elements in view of the effective increase in the production of recombinant proteins.

Puesto que todos los métodos de predicción disponibles anteriores tienen algunos inconvenientes que impiden el análisis a gran escala de genomas para identificar con certeza nuevas y potentes MAR, el objeto de esta descripción es: 1) comprender las características funcionales de las MAR que permitan mejorar la expresión de proteínas recombinantes; 2) conseguir un nueva herramienta bioinformática que compile las características estructurales de las MAR como predicción de su función, con el fin de 3) realizar análisis a gran escala de genomas para identificar nuevas y más potentes MAR y, finalmente 4) demostrar mejor eficacia para aumentar la producción de proteínas recombinantes a partir de células u organismos eucarióticos cuando se utilizan las secuencias de MAR recientemente identificadas. Since all the previous available prediction methods have some drawbacks that prevent large-scale analysis of genomes to identify with certainty new and powerful MAR, the purpose of this description is: 1) to understand the functional characteristics of MAR that allow to improve the recombinant protein expression; 2) get a new bioinformatics tool that compiles the structural characteristics of MARs as a prediction of their function, in order to 3) carry out large-scale analyzes of genomes to identify new and more powerful MARs and, finally 4) demonstrate better efficacy for increase the production of recombinant proteins from eukaryotic cells or organisms when recently identified MAR sequences are used.

SUMMARY OF THE INVENTION

Un objeto de la invención es aumentar la producción de proteínas recombinantes a partir de células u organismos eucarióticos utilizando una secuencia de DNA que tenga una actividad que aumente la producción de proteínas. An object of the invention is to increase the production of recombinant proteins from eukaryotic cells or organisms using a DNA sequence that has an activity that increases protein production.

Otro objeto de la invención es proporcionar un método de transfecciones múltiples para aumentar la producción de proteínas recombinantes en células eucarióticas. Another object of the invention is to provide a multiple transfection method to increase the production of recombinant proteins in eukaryotic cells.

Estos objetos se consiguen por una secuencia de DNA aislada y purificada, por el uso de dicha secuencia de DNA aislada y purificada, por un método para transfectar una célula hospedante eucariótica, por un proceso para la producción de una proteína, por una célula hospedante eucariótica transfectada, por una mezcla o kit para transfección celular y por un organismo transgénico no humano, de acuerdo con las reivindicaciones independientes. These objects are achieved by an isolated and purified DNA sequence, by the use of said isolated and purified DNA sequence, by a method to transfect a eukaryotic host cell, by a process for the production of a protein, by a eukaryotic host cell. transfected, by a mixture or kit for cellular transfection and by a non-human transgenic organism, according to the independent claims.

BRIEF DESCRIPTION OF THE FIGURES

La Fig. 1 muestra gráficas de distribución de las secuencias de MAR y que no son MAR. Los histogramas son gráficas de densidad (frecuencia relativa dividida por la anchura del rectángulo) con relación a la puntuación del parámetro observado. El histograma de densidad de las MAR humanas en la base de datos SMARt DB se muestra en negro, mientras que el histograma de densidad del cromosoma 22 humano está en gris. Fig. 1 shows distribution graphs of the MAR and non-MAR sequences. Histograms are graphs of density (relative frequency divided by the width of the rectangle) relative to the score of the observed parameter. The density histogram of human MARs in the SMARt DB database is shown in black, while the density histogram of human chromosome 22 is gray.

La Fig. 2 muestra diagramas de dispersión de los cuatro criterios diferentes usados por el programa SMAR Scan® y el contenido de AT con las MAR humanas de la SMARt DB. Fig. 2 shows scatter diagrams of the four different criteria used by the SMAR Scan® program and the AT content with human MARs of the SMARt DB.

La Fig. 3 muestra las gráficas de distribución de las secuencias de las MAR por organismo. Las secuencias de las MAR de la SMARt DB de otros organismos fueron recuperadas y analizadas. Se representan conjuntamente las distribuciones de densidad de las secuencias de las MAR en ratón, pollo, sorgo bicolor y ser humano. Fig. 3 shows the distribution graphs of the MAR sequences by organism. The sequences of the MARs of the SMARt DB from other organisms were recovered and analyzed. The density distributions of the MAR sequences in mice, chicken, sorghum bicolor and humans are jointly represented.

La Fig. 4 muestra las predicciones por el programa SMAR Scan® del cromosoma 22 humano y del cromosoma 22 barajado. Gráfica superior: número medio de coincidencias obtenidas por el programa SMAR Scan® con cinco cromosomas: “rubbled”, “scrambled”, barajados en ventanas no solapantes de 10 pb, modelo de cadenas de Markov de orden 1 y con el cromosoma 22 natural. Gráfica inferior: número medio de MAR predichas por el programa SMAR Scan® en cinco cromosomas: “rubbled”, “scrambled”, barajados en ventanas no solapantes de 10 pb, modelo de cadenas de Markov de orden 1 y con el cromosoma 22 natural. Fig. 4 shows the SMAR Scan® predictions of human chromosome 22 and shuffled chromosome 22. Upper graph: average number of coincidences obtained by the SMAR Scan® program with five chromosomes: “rubbled”, “scrambled”, shuffled in non-overlapping windows of 10 bp, model of Markov chains of order 1 and with natural chromosome 22. Lower graph: average number of MAR predicted by the SMAR Scan® program on five chromosomes: “rubbled”, “scrambled”, shuffled in non-overlapping windows of 10 bp, model of Markov chains of order 1 and with natural chromosome 22.

La Fig. 5 muestra la disección de la capacidad del gen de la lisozima de pollo 5’-MAR para estimular la expresión transgénica en células CHO-DG44. Los fragmentos B, K y F muestran la mayor capacidad para estimular la expresión transgénica. La resistencia relativa indicada de los elementos se basó en el número de células de alta actividad de expresión. Fig. 5 shows the dissection of the ability of the chicken 5'-MAR lysozyme gene to stimulate transgene expression in CHO-DG44 cells. Fragments B, K and F show the highest capacity to stimulate transgene expression. The indicated relative resistance of the elements was based on the number of cells with high expression activity.

La Fig. 6 muestra el efecto de las deleciones en serie del extremo 5’ (parte superior) y del extremo 3’ (parte inferior) de la 5’- MAR sobre la pérdida de capacidad para estimular la expresión transgénica. La transición desde el aumento de actividad hasta la disminución de actividad coincide con los fragmentos B, K y F. Fig. 6 shows the effect of serial deletions at the 5 'end (top) and at the 3' end (bottom) of 5'-MAR on loss of ability to stimulate transgene expression. The transition from increased activity to decreased activity coincides with fragments B, K and F.

La Fig. 7 muestra qué porciones del fragmento F estimulan significativamente la expresión transgénica. Las regiones del fragmento F indicadas por la flecha gris clara fueron multimerizadas, insertadas en pGEGFP Control y transfectadas en células de CHO. El elemento que exhibe la mayor actividad está situado en la parte central del elemento y corresponde al fragmento FIll (MAR mínima indicada por la barra negra). Además, una actividad potenciadora se localiza en la parte flanqueante 3’ del fragmento FIll (potenciador de MAR indicado por la barra gris oscura). Fig. 7 shows which portions of fragment F significantly stimulate transgene expression. The F fragment regions indicated by the light gray arrow were multimerized, inserted into pGEGFP Control and transfected into CHO cells. The element that exhibits the most activity is located in the central part of the element and corresponds to the fragment FIll (minimum MAR indicated by the black bar). Furthermore, an enhancing activity is located in the 3 ′ flanking part of the FIll fragment (MAR enhancer indicated by the dark gray bar).

La Fig. 8 muestra un mapa de localizaciones de diversos restos de secuencias de DNA en cLysMAR. La Fig. 8 (B) representa un mapa de localizaciones de diversos restos de secuencias de DNA en cLysMAR. Las líneas verticales representan la posición de los sitios o restos de secuencias predichos por ordenador a lo largo de los 3034 pares de bases de cLysMAR y sus regiones activas, representadas en la Fig. 5. Los supuestos sitios del factor de transcripción (MEF2 05, Oct-1, USF-02, GATA, NFAT) para los activadores y (CDP, SATB1, CTCF, ARBP/MeCP2) para los represores de la transcripción, fueron identificados usando el programa Matinspector (Genomatix), y las islas CpG fueron identificadas con el programa CPGPLOT. Los restos a los que se han asociado previamente elementos de MAR están indicados en negro e incluyen el dinucleótido CpG y la isla CpG, restos de desenrollamiento (AATATATT y AATATT), poly As y Ts, poly Gs y Cs, sitios de unión para la topoisomerasa II de Drosophila (GTNWAYATTNATTNATNNR) que tenían la misma identidad que el núcleo de 6 pb y sitios de unión a las proteínas del grupo I de alta movilidad (HMG-I/Y). Otros restos estructurales incluyen sitios para la unión al nucleosoma y desfavorables para la unión al nucleosoma y un resto destinado a liberar la cadena superhelicoidal del DNA. La Fig. 8(A) representa la comparación de la capacidad de porciones de cLysMAR para activar la transcripción con perfiles de puntuación de la predicción con el programa MAR-Finder. El diagrama superior muestra la actividad de fragmentos de MAR como en la Fig. 5, mientras que las curvas del centro e inferior muestran el potencial predicho por el programa MAR-Finder para la actividad de MAR y para las estructuras curvadas de DNA, respectivamente. Fig. 8 shows a location map of various DNA sequence residues in cLysMAR. Fig. 8 (B) represents a location map of various DNA sequence residues in cLysMAR. The vertical lines represent the position of the computer predicted sites or sequence residues along the 3034 base pairs of cLysMAR and their active regions, represented in Fig. 5. The putative transcription factor sites (MEF2 05, Oct-1, USF-02, GATA, NFAT) for activators and (CDP, SATB1, CTCF, ARBP / MeCP2) for transcriptional repressors, were identified using the Matinspector program (Genomatix), and the CpG islands were identified with the CPGPLOT program. Residues to which MAR elements have previously been associated are indicated in black and include CpG dinucleotide and CpG island, unwinding residues (AATATATT and AATATT), poly As and Ts, poly Gs and Cs, binding sites for Drosophila topoisomerase II (GTNWAYATTNATTNATNNR) that had the same identity as the 6 bp nucleus and binding sites for high mobility group I (HMG-I / Y) proteins. Other structural residues include sites for nucleosome binding and unfavorable for nucleosome binding and a residue intended to release the superhelical chain of DNA. Fig. 8 (A) represents the comparison of the ability of portions of cLysMAR to activate transcription with prediction scoring profiles with the MAR-Finder program. The top diagram shows the activity of MAR fragments as in Fig. 5, while the center and bottom curves show the potential predicted by the MAR-Finder program for MAR activity and for curved DNA structures, respectively.

La Fig. 9 muestra la correlación entre las propiedades fisicoquímicas del DNA y la actividad de MAR. La Fig. 9(A), representa los perfiles de la temperatura de fusión, la curvatura de la doble hélice, la profundidad de la ranura mayor y la anchura de la ranura menor del DNA de 5’-MAR que se determinaron usando los algoritmos de Levitsky et al., (Levitsky VG, Ponomarenko MP, Ponomarenko JV, Frolov AS, Kolchanov NA, "Nucleosomal DNA property database", Bioinformatics, 15; 582-592, 1999). Los fragmentos B, K y F más activos representados en la parte superior son los mostrados en la Figura 1. La Fig. 9(B) representa la ampliación de los datos presentados en el panel A que representan el mapa del fragmento F alineado con el trazado correspondiente a la temperatura de fusión (curva superior) y curvatura del DNA (curva inferior). Están indicados la posición del fragmento FIB más activo y el sitio de unión a la proteína para factores de transcripción específicos. Fig. 9 shows the correlation between the physicochemical properties of DNA and the activity of MAR. Fig. 9 (A) depicts the profiles of the melting temperature, the double helix curvature, the depth of the major groove and the width of the minor groove of the 5'-MAR DNA that were determined using the algorithms de Levitsky et al., (Levitsky VG, Ponomarenko MP, Ponomarenko JV, Frolov AS, Kolchanov NA, "Nucleosomal DNA property database", Bioinformatics, 15; 582-592, 1999). The most active fragments B, K and F represented at the top are those shown in Figure 1. Fig. 9 (B) represents the magnification of the data presented in panel A that represents the map of fragment F aligned with the trace corresponding to the melting temperature (upper curve) and DNA curvature (lower curve). The position of the most active FIB fragment and the protein binding site for specific transcription factors are indicated.

La Fig. 10 muestra la distribución de los sitios de unión al supuesto factor de transcripción en 5’-cLysMAR. Las flechas grandes indican la posición de los elementos de desenrollamiento del núcleo (abreviadamente CUE, por la expresión inglesa Core Unwinding Elements) identificados con el programa SMAR Scan®. Fig. 10 shows the distribution of the sites of binding to the putative transcription factor in 5'-cLysMAR. The large arrows indicate the position of the core unwinding elements (abbreviated CUE, for the English expression Core Unwinding Elements) identified with the SMAR Scan® program.

La Fig. 11 muestra el esquema de ensamblaje de diversas porciones de la MAR. Las porciones indicadas de cLysMAR se amplificaron por PCR, introduciendo elementos conectores Bglll-BamHl en cada extremo, y se ensamblaron para generar los elementos compuestos representados. Por ejemplo, la construcción superior consiste en el ensamblaje de todas las secuencias flanqueantes y de CUE en su posición original excepto que las secuencias conectoras BgII-BamHII separan cada elemento. Fig. 11 shows the assembly scheme of various portions of the MAR. The indicated portions of cLysMAR were amplified by PCR, inserting Bglll-BamHl linker elements at each end, and assembled to generate the depicted composite elements. For example, the top construct consists of the assembly of all flanking and CUE sequences in their original position except that the BgII-BamHII connecting sequences separate each element.

La Fig. 12 representa los mapas de plásmidos. Fig. 12 depicts the plasmid maps.

La Fig. 13 muestra el efecto de re-transfectar transfectantes primarios en la expresión de la proteína verde fluorescente (abreviadamente en lo sucesivo GFP, por la expresión inglesa Green Fluorescent Protein). Las células (CHO-DG44) se co-transfectaron con pSV40EGFP (tubo izquierdo) o pMAR-SV40EGFP (tubo central) y pSVneo como plásmido de resistencia. Las células transfectadas con pMAR-SV40EGFP fueron transfectadas de nuevo 24 horas más tarde con el mismo plásmido y un plásmido seleccionado diferente, pSVpuro (tubo derecho). Después de una selección de dos semanas, el fenotipo de la población celular establemente transfectada fue analizado por FACS. Fig. 13 shows the effect of re-transfecting primary transfectants on the expression of the green fluorescent protein (abbreviated hereafter GFP, for the English expression Green Fluorescent Protein). Cells (CHO-DG44) were co-transfected with pSV40EGFP (left tube) or pMAR-SV40EGFP (center tube) and pSVneo as resistance plasmid. Cells transfected with pMAR-SV40EGFP were transfected 24 hours later with the same plasmid and a different selected plasmid, pSVpuro (right tube). After a two-week selection, the phenotype of the stably transfected cell population was analyzed by FACS.

La Fig. 14 muestra el efecto de la carga múltiple de plásmido que contiene MAR. Se utilizaron los transfectantes secundarios pMAR-SV40EGFP/pMAR-SV40EGFP en un tercer ciclo de transfección al final del proceso de selección. La transfección terciaria se realizó con pMAR o pMAR-SV40EGFP para obtener los transfectantes terciarios. Después de 24 horas, las células se transfectaron de nuevo con cada plásmido, dando como resultado los transfectantes cuaternarios (véase la Tabla 4). Fig. 14 shows the effect of multiple loading of plasmid containing MAR. Secondary transfectants pMAR-SV40EGFP / pMAR-SV40EGFP were used in a third cycle of transfection at the end of the selection process. Tertiary transfection was performed with pMAR or pMAR-SV40EGFP to obtain tertiary transfectants. After 24 hours, cells were re-transfected with each plasmid, resulting in quaternary transfectants (see Table 4).

La Fig. 15 muestra la acción comparativa de los algoritmos de predicción de SMAR ilustrados por la región WP18A10A7. (A) El análisis por el programa SMAR Scan@ se realizó con los ajustes predeterminados. (B) El análisis del SIDD (curva superior y escala lateral a mano izquierda) y la fijación de diversos fragmentos de DNA a la matriz nuclear in vitro (gráfica de barras, escala lateral a mano derecha) se tomaron de Goetze et al., (Goetze S, Gluch A, Benham C, Bode J, "Computational and in vitro analysis of destabilized DNA regions In the interferon gene cluster: potential of predicting functional gene domains." Biochemistry, 42: 154-166, 2003). Fig. 15 shows the comparative action of the SMAR prediction algorithms illustrated by the WP18A10A7 region. (A) Analysis by the SMAR Scan @ program was performed with the default settings. (B) The analysis of the SIDD (upper curve and lateral scale on the left hand) and the fixation of various DNA fragments to the nuclear matrix in vitro (bar graph, lateral scale on the right hand) were taken from Goetze et al., (Goetze S, Gluch A, Benham C, Bode J, "Computational and in vitro analysis of destabilized DNA regions In the interferon gene cluster: potential of predicting functional gene domains." Biochemistry, 42: 154-166, 2003).

La Fig. 16 representa los resultados de un protocolo similar a la terapia génica que utiliza las MAR. El grupo de ratones inyectados con MAR-Network, inducido desde el comienzo del experimento, presenta una mejor inducción del hematocrito en comparación con los ratones inyectados con el sistema Network original sin MAR. Después de 2 meses, el hematocrito en el "grupo que contiene MAR" tiene valores superiores (65%) a los niveles de hematocrito normales (45-55%). Fig. 16 represents the results of a protocol similar to gene therapy using MARs. The group of mice injected with MAR-Network, induced since the beginning of the experiment, presents a better induction of the hematocrit compared to the mice injected with the original Network system without MAR. After 2 months, hematocrit in the "MAR containing group" has higher values (65%) than normal hematocrit levels (45-55%).

La Fig. 17 representa el diagrama de dispersión para las 1757 secuencias de S/MAR de los porcentajes de dinucleótidos AT (superior) y TA (inferior) frente a la curvatura de DNA predicha calculada por el programa SMAR Scan®. Fig. 17 represents the scatterplot for the 1757 S / MAR sequences of the percentages of AT (upper) and TA (lower) dinucleotides versus the predicted DNA curvature calculated by the SMAR Scan® program.

La Fig. 18 representa las gráficas de distribución de los porcentajes de dinucleótidos en las 1757 secuencias que no son S/MAR. Fig. 18 represents the distribution graphs of the percentages of dinucleotides in the 1757 non-S / MAR sequences.

La Fig.19 presenta el efecto de varios elementos de S/MAR sobre la producción de la proteína verde fluorescente (GFP) recombinante. Las poblaciones de células de CHO transfectadas con un vector de expresión de la GFP que contenía un elemento de MAR, como se indica, se analizaron por un clasificador de células activadas por fluorescencia (FACS®) y se muestran los perfiles típicos. Los perfiles presentan el número de células en función de los niveles de fluorescencia de la GFP. Fig. 19 presents the effect of various elements of S / MAR on the production of the recombinant green fluorescent protein (GFP). Populations of CHO cells transfected with a GFP expression vector containing a MAR element, as indicated, were analyzed by a fluorescence activated cell sorter (FACS®) and typical profiles are shown. The profiles present the number of cells as a function of the GFP fluorescence levels.

La Fig. 20 representa el efecto de la inducción de hematocrito en ratones inyectados con MAR-Network. Fig. 20 represents the effect of hematocrit induction in mice injected with MAR-Network.

DETAILED DESCRIPTION OF THE INVENTION

La presente invención se refiere a una secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas, caracterizada porque dicha secuencia de DNA comprende: a) al menos un elemento de DNA curvado y b) al menos un sitio de unión para una proteína que se une al DNA. The present invention relates to an isolated and purified DNA sequence having an activity that increases protein production, characterized in that said DNA sequence comprises: a) at least one curved DNA element and b) at least one binding site for a protein that binds to DNA.

Se sabe que ciertas secuencias de DNA forman una "curva relativamente estática", en la que el DNA sigue una trayectoria tridimensional particular. Por tanto, en lugar de tener la conformación B-DNA normal ("lineal"), el segmento de DNA puede formar una curva plana definido también como DNA curvado (Marini, et al., 1982 "Bent helical structure in kinetoplast DNA", Proc. Natl. Acad. Sci. USA, 79: 7664-7664). Certain DNA sequences are known to form a "relatively static curve", in which DNA follows a particular three-dimensional path. Therefore, instead of having the normal ("linear") B-DNA conformation, the DNA segment can form a flat curve also defined as curved DNA (Marini, et al., 1982 "Bent helical structure in kinetoplast DNA", Proc. Natl. Acad. Sci. USA, 79: 7664-7664).

Sorprendentemente, los inventores han mostrado que el elemento de DNA curvado de una secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas contiene generalmente al menos 10% del dinucleótido TA y/o al menos 12% del dinucleótido AT en un tramo de 100 pares de bases contiguas. El elemento de DNA curvado de una secuencia de DNA de acuerdo con la invención contiene al menos 33% del dinucleótido TA y/o al menos 33% del dinucleótido AT en un tramo de 100 pares de bases contiguas. Estos datos han sido obtenidos por el método descrito más adelante. Surprisingly, the inventors have shown that the curved DNA element of an isolated and purified DNA sequence having an activity that increases protein production generally contains at least 10% of the TA dinucleotide and / or at least 12% of the AT dinucleotide in a span of 100 contiguous base pairs. The curved DNA element of a DNA sequence according to the invention contains at least 33% of the TA dinucleotide and / or at least 33% of the AT dinucleotide over a span of 100 contiguous base pairs. These data have been obtained by the method described below.

La secuencia de DNA aislada y purificada de acuerdo con la invención comprende una secuencia de nucleótidos de MAR que contiene la secuencia SEQ ID No 27. The isolated and purified DNA sequence according to the invention comprises a MAR nucleotide sequence containing the sequence SEQ ID No. 27.

También están abarcadas por la presente invención secuencias complementarias de la secuencia SEQ ID No 27 antes mencionada, que pueden producirse utilizando PCR o cualquier otro medio. Sequences complementary to the aforementioned SEQ ID No. 27 sequence, which can be produced using PCR or any other means, are also encompassed by the present invention.

También están incluidas en la presente invención secuencias que comparten al menos una longitud de nucleótidos del 90% de la secuencia SEQ ID No. 27 respectiva. Estas secuencias se pueden utilizar siempre que presenten las mismas propiedades que la secuencia natural de la que proceden. Also included in the present invention are sequences that share at least a nucleotide length of 90% of the respective SEQ ID No. 27 sequence. These sequences can be used as long as they have the same properties as the natural sequence from which they come.

La presente descripción incluye también variantes de las secuencias SEQ ID No 1 a 27 antes mencionadas y el elemento o fragmento de cLysMAR, es decir secuencias de nucleótidos que varían con relación a la secuencia de referencia por las sustituciones conservadoras de nucleótidos, en las que uno o más nucleótidos están sustituidos por otros de las mismas características. The present description also includes variants of the aforementioned SEQ ID No. 1 to 27 sequences and the cLysMAR element or fragment, i.e. nucleotide sequences that vary relative to the reference sequence by conservative nucleotide substitutions, wherein one or more nucleotides are replaced by others with the same characteristics.

Las secuencias SEQ ID No 1 a 23 mostradas en esta descripción han sido identificadas por escaneo de los cromosomas 1 y 2 humanos usando el programa SMAR Scan@, que demuestra que es posible la identificación de nuevas secuencias de MAR usando las herramientas descritas más adelante, mientras que las secuencias SEQ ID No 24 a 27 han sido identificadas por escaneo del genoma humano completo, utilizando el método combinado SMAR Scan@. The sequences SEQ ID No 1 to 23 shown in this description have been identified by scanning human chromosomes 1 and 2 using the SMAR Scan @ program, which shows that it is possible to identify new MAR sequences using the tools described below, while sequences SEQ ID No 24 to 27 have been identified by scanning the entire human genome, using the combined SMAR Scan @ method.

En una primera etapa, se cribaron los cromosomas 1 y 2 completos para identificar el elemento de DNA curvado como la región correspondiente a la curvatura, profundidad de la ranura mayor, anchura de la ranura menor máximas y la mínima temperatura de fusión, como se muestra en la Figura 3. En una segunda etapa, se escaneó esta colección de secuencias para determinar los sitios de unión de las proteínas reguladoras, tales como SATB1, GATA, etc., como se muestra en la Figura 8B, obteniéndose las secuencias SEQ ID 1-23. Además, se mostró que las secuencias 21-23 estaban situadas próximas a un gen conocido de la base de datos del genoma humano. In a first stage, complete chromosomes 1 and 2 were screened to identify the curved DNA element as the region corresponding to curvature, depth of major groove, width of maximum minor groove, and minimum melting temperature, as shown in Figure 3. In a second step, this collection of sequences was scanned to determine the binding sites of regulatory proteins, such as SATB1, GATA, etc., as shown in Figure 8B, obtaining the sequences SEQ ID 1 -2. 3. Furthermore, sequences 21-23 were shown to be located close to a known gene from the human genome database.

Las secuencias SEQ ID No 24 a 27 fueron obtenidas escaneando el genoma humano de acuerdo con el método combinado y se seleccionaron como ejemplos entre los 1757 elementos de MAR así detectados. The sequences SEQ ID No 24 to 27 were obtained by scanning the human genome according to the combined method and were selected as examples among the 1757 elements of MAR thus detected.

Las quimeras moleculares de las secuencias de MAR forman también parte de la presente descripción. Por quimera molecular se entiende una secuencia de nucleótidos que puede incluir una porción funcional de un elemento de MAR y que será obtenida por los métodos de biología molecular conocidos por los expertos en la técnica. The molecular chimeras of the MAR sequences are also part of the present description. By molecular chimera is meant a nucleotide sequence that can include a functional portion of an MAR element and that will be obtained by molecular biology methods known to those skilled in the art.

Combinaciones particulares de elementos o fragmentos de MAR o sus subporciones forman también parte de la presente descripción. Estos fragmentos se pueden preparar por una variedad de métodos conocidos en la técnica. Estos métodos incluyen, aunque sin limitación, digestión con enzimas de restricción y recuperación de los fragmentos, síntesis química o reacciones en cadena de la polimerasa (PCR). Particular combinations of elements or fragments of MAR or its sub-portions are also part of the present description. These fragments can be prepared by a variety of methods known in the art. These methods include, but are not limited to, restriction enzyme digestion and fragment recovery, chemical synthesis, or polymerase chain reactions (PCR).

Por consiguiente, combinaciones particulares de elementos o fragmentos de las secuencias SEQ ID No 1 a 27 y elementos o fragmentos de cLysMAR son también parte de la presente descripción, dependiendo de los resultados funcionales que se obtengan. Elementos de cLysMAR son por ejemplo las regiones B, K y F descritas en el documento WO 02/074969. Los elementos preferidos de cLysMAR usados en la presente descripción son las regiones B, K y F. Solo podría usarse un elemento o múltiples copias del mismo o podrían usarse elementos distintos (elementos multimerizados) (véase la Fig. 8 A). Accordingly, particular combinations of elements or fragments of sequences SEQ ID No. 1 to 27 and elements or fragments of cLysMAR are also part of the present description, depending on the functional results that are obtained. Elements of cLysMAR are for example the B, K and F regions described in WO 02/074969. Preferred cLysMAR elements used in the present disclosure are regions B, K and F. Only one element or multiple copies thereof could be used or different elements (multimerized elements) could be used (see Fig. 8 A).

Se entiende por fragmento una porción de la secuencia de nucleótidos respectiva. Los fragmentos de una secuencia de nucleótidos de MAR pueden retener la actividad biológica y por consiguiente unirse a matrices nucleares purificadas y/o alterar los patrones de expresión de las secuencias codificadoras unidas operativamente a un promotor. Los fragmentos de una secuencia de nucleótidos de MAR pueden variar entre nucleótidos de al menos aproximadamente 100 a 1000 pb, preferiblemente de aproximadamente 200 a 700 pb, más preferiblemente de aproximadamente 300 a 500 pb. También parte de la presente descripción incluye combinaciones de fragmentos, que tienen el mismo número de nucleótidos presentes en una secuencia de MAR sintética que consiste en elementos y/o fragmentos de MAR naturales. Los fragmentos son ensamblados preferiblemente por secuencias conectoras. El conector preferido es BgIll-BamHl. Fragment is understood to mean a portion of the respective nucleotide sequence. Fragments of a MAR nucleotide sequence can retain biological activity and therefore bind to purified nuclear matrices and / or alter the expression patterns of coding sequences operably linked to a promoter. Fragments of a MAR nucleotide sequence can vary between nucleotides of at least about 100 to 1000 bp, preferably from about 200 to 700 bp, more preferably from about 300 to 500 bp. Also part of the present disclosure includes combinations of fragments, having the same number of nucleotides present in a synthetic MAR sequence consisting of natural MAR elements and / or fragments. The fragments are preferably assembled by connecting sequences. The preferred linker is BgIll-BamHl.

Un "elemento" es una secuencia de nucleótidos conservada que tiene propiedades funcionales (es decir, sitios de unión para factores de transcripción) o características estructurales (es decir, secuencia de DNA curvado) comunes. An "element" is a conserved nucleotide sequence that has common functional properties (ie, binding sites for transcription factors) or structural features (ie, curved DNA sequence).

La "actividad que aumenta la producción de proteínas" se refiere a una actividad de la secuencia de DNA aislada y purificada definida como sigue: después de haber sido introducida en condiciones adecuadas en una célula hospedante eucariótica, la secuencia es capaz de aumentar los niveles de producción de proteínas en un cultivo celular en comparación con un cultivo de células transfectadas sin dicha secuencia de DNA. Generalmente, el aumento es de 1,5 a 10 veces, preferiblemente de 4 a 10 veces. Esto corresponde a una tasa de producción o productividad celular específica de al menos 10 pg por célula y por día (véanse el Ejemplo 11 y la Fig. 13). "Protein production enhancing activity" refers to an activity of the isolated, purified DNA sequence defined as follows: after it has been introduced under suitable conditions into a eukaryotic host cell, the sequence is capable of increasing levels of protein production in a cell culture compared to a culture of transfected cells without such a DNA sequence. Generally, the increase is 1.5 to 10 times, preferably 4 to 10 times. This corresponds to a specific cell production or productivity rate of at least 10 pg per cell per day (see Example 11 and Fig. 13).

Como se usan en la presente memoria, se proporcionan las siguientes definiciones con el fin de facilitar la compresión de esta invención. As used herein, the following definitions are provided in order to facilitate understanding of this invention.

"Cromatina" es el material proteínico y de ácidos nucleicos que constituye los cromosomas de una célula eucariótica, y se refiere a DNA, RNA y proteínas asociadas. "Chromatin" is the protein and nucleic acid material that makes up the chromosomes of a eukaryotic cell, and refers to DNA, RNA, and associated proteins.

Un "elemento de cromatina" significa una secuencia de ácido nucleico en un cromosoma que tiene la propiedad de modificar la estructura de la cromatina cuando está integrada en dicho cromosoma. A "chromatin element" means a nucleic acid sequence on a chromosome that has the property of modifying the structure of chromatin when it is integrated into said chromosome.

"Cis" se refiere a la colocación de dos o más elementos (tales como elementos de cromatina) en la misma molécula de ácido nucleico (tal como el mismo vector, plásmido o cromosoma). "Cis" refers to the placement of two or more elements (such as chromatin elements) on the same nucleic acid molecule (such as the same vector, plasmid, or chromosome).

"Trans" se refiere a la colocación de dos o más elementos (tales como elementos de cromatina) en dos o más moléculas de ácido nucleico diferentes (tales como en dos vectores o dos cromosomas). "Trans" refers to the placement of two or more elements (such as chromatin elements) on two or more different nucleic acid molecules (such as on two vectors or two chromosomes).

Los elementos modificadores de la cromatina que son potencialmente capaces de superar los efectos de posición y por consiguiente son de interés para el desarrollo de líneas celulares estables, incluyen elementos de borde (abreviadamente BE, por la expresión inglesa Boundary Elements), regiones de fijación a la matriz (MAR), regiones de control de locus (abreviadamente LCR, por la expresión inglesa Locus Control Regions) y elementos ubicuos que abren la cromatina (abreviadamente UCOE, por la expresión inglesa Universal/Ubiquitously Chromatin Opening Elements). Chromatin modifying elements that are potentially capable of overcoming position effects and are therefore of interest for the development of stable cell lines include border elements (abbreviated BE, for Boundary Elements), regions of fixation to the matrix (MAR), locus control regions (abbreviated LCR, for the English expression Locus Control Regions) and ubiquitous elements that open chromatin (abbreviated UCOE, for the English expression Universal / Ubiquitously Chromatin Opening Elements).

Los elementos de borde ("BE") o elementos aisladores, definen en muchos casos los límites en la cromatina (Bell A and Felsenfeld G. 1999; "Stopped at the border: boundaries and insulators", Curr. Opin. Genet. Dev., 9, 191-198) y pueden jugar un papel en la definición de un dominio transcripcional in vivo. Los BE carecen de la actividad promotora/potenciadora intrínseca, pero se cree que en su lugar protegen los genes de la influencia transcripcional de los elementos reguladores en la cromatina circundante. Generalmente, se usa el análisis por bloqueo del potenciador para identificar los elementos aisladores. En este ensayo, el elemento de la cromatina se coloca entre un potenciador y un promotor y se mide la transcripción activada por el potenciador. Los elementos aisladores han demostrado ser capaces de proteger los genes indicadores establemente transfectados frente a los efectos de posición en células de Drosophila, de levadura y de mamíferos. Han mostrado también que aumentan la proporción de ratones transgénicos con expresión inducible de transgenes. Edge elements ("BE") or insulating elements, in many cases define limits on chromatin (Bell A and Felsenfeld G. 1999; "Stopped at the border: boundaries and insulators", Curr. Opin. Genet. Dev. , 9, 191-198) and may play a role in defining a transcriptional domain in vivo. BEs lack intrinsic promoter / enhancer activity, but are instead believed to protect genes from the transcriptional influence of regulatory elements on the surrounding chromatin. Generally, enhancer blocking analysis is used to identify the insulating elements. In this assay, the chromatin element is placed between an enhancer and a promoter and enhancer-activated transcription is measured. Isolator elements have been shown to be able to protect stably transfected reporter genes against positional effects in Drosophila, yeast, and mammalian cells. They have also shown to increase the proportion of transgenic mice with inducible expression of transgenes.

Las regiones de control de locus ("LCR") son elementos cis-reguladores requeridos para la activación inicial de la cromatina de locus y posterior transcripción génica en sus posiciones naturales (Grosveld, F. 1999, "Activation by locus control regions?" Curr. Opin. Genet. Dev., 9, 152-157). La función activadora de las LCR permite también la expresión de un transgén acoplado en el tejido apropiado en ratones transgénicos, independientemente del sitio de integración en el genoma hospedante. Aunque las LCR confieren generalmente niveles de expresión específicos de los tejidos en los genes a los que se unen, se ha descrito una expresión eficaz en casi todos los tejidos en ratones transgénicos para una LCR receptora truncada de linfocitos T humanos y una LCR de la proteína activante del hígado (abreviadamente LAP por la expresión inglesa Liver Activating Protein) de rata. La LCR más ampliamente caracterizada es la del locus de las globinas. Actualmente se está evaluando su utilización en vectores para terapia génica de enfermedades de células falciformes y �-talasemias. Locus control regions ("CSF") are cis-regulatory elements required for initial activation of locus chromatin and subsequent gene transcription in their natural positions (Grosveld, F. 1999, "Activation by locus control regions?" Curr . Opin. Genet. Dev., 9, 152-157). The activating function of CSFs also allows the expression of a coupled transgene in the appropriate tissue in transgenic mice, regardless of the site of integration in the host genome. Although CSFs generally confer tissue-specific levels of expression in the genes to which they bind, effective expression has been reported in almost all tissues in mice transgenic for a truncated receptor CSF from human T lymphocytes and a CSF from the protein rat liver activator (abbreviated LAP for the English expression Liver Activating Protein). The most widely characterized CSF is that of the globin locus. Its use in vectors for gene therapy of sickle cell diseases and �-thalassemias is currently being evaluated.

Las "MAR", de acuerdo con un modelo muy aceptado, pueden mediar el anclaje de una secuencia específica de DNA en la matriz nuclear, generando dominios en bucle de cromatina que se extienden hacia fuera de los núcleos de la heterocromatina. Aunque las MAR no contienen ninguna secuencia de consenso ni reconocible evidente, parece que sus características más consistentes son un alto contenido global de A/T y bases C predominantes en una cadena (Bode J, Schlake T, Ríos Ramírez M, Mielke C, Stengart M, Kay V and KlehrWirth D, "Scaffold/matrixattached regions: structural properties creating transcriptionally active loci", Structural and Functional Organization of the Nuclear Matrix: International Review of Citology, 162A:389-453, 1995). Estas regiones tienen propensión a formar estructuras secundarias curvadas que pueden estar predispuestas a la separación de las cadenas. Con frecuencia se denominan regiones de desapareamiento de bases (abreviadamente BUR, por la expresión inglesa Base-Unpairing Regions) y contienen un elemento de desenrollamiento del núcleo (CUE) que podría representar el punto de nucleación de la separación de las cadenas (Benham C and al., "Stress induced duplex DNA destabilization in scaffold/matrix attachment regions", J. Mol. Biol., 274:181-196, 1997). Con frecuencia se han encontrado diversos restos de secuencias ricas en AT simples en las secuencias de MAR, pero en la mayor parte de los casos, su importancia funcional y su modo potencial de acción no están claros. Estos restos incluyen la caja A (AATAAAYAAA), la caja T (TTWTWTTWTT), restos del desenrollamiento de DNA (AATATATT, AATATT), sitios de unión a SATB1 (caja H, A/T/C26) y sitios de consenso de la topoisomerasa II para vertebrados (RNYNNCNNG-YNGKTNYNY) o Drosophila (GTNWAYATTNATNNR). "MARs", according to a widely accepted model, can mediate the anchoring of a specific DNA sequence in the nuclear matrix, generating chromatin loop domains that extend out of the heterochromatin nuclei. Although the MARs do not contain any obvious consensus or recognizable sequence, it seems that their most consistent characteristics are a high global content of A / T and predominant C bases in a chain (Bode J, Schlake T, Ríos Ramírez M, Mielke C, Stengart M, Kay V and KlehrWirth D, "Scaffold / matrixattached regions: structural properties creating transcriptionally active loci", Structural and Functional Organization of the Nuclear Matrix: International Review of Citology, 162A: 389-453, 1995). These regions have a propensity to form curved secondary structures that may be predisposed to chain separation. They are often referred to as base mismatch regions (BUR for short), and contain a core unwinding element (CUE) that could represent the nucleation point of chain separation (Benham C and al., "Stress induced duplex DNA destabilization in scaffold / matrix attachment regions", J. Mol. Biol., 274: 181-196, 1997). Various residues of simple AT-rich sequences have frequently been found in MAR sequences, but in most cases their functional importance and potential mode of action are unclear. These residues include box A (AATAAAYAAA), box T (TTWTWTTWTT), DNA unwinding residues (AATATATT, AATATT), SATB1 binding sites (box H, A / T / C26) and consensus sites of topoisomerase II for vertebrates (RNYNNCNNG-YNGKTNYNY) or Drosophila (GTNWAYATTNATNNR).

Los elementos de apertura de la cromatina universales ("UCOE", también conocidos como "elementos ubicuos que abren la cromatina") han sido descritos en el documento WO 00/05393. Universal chromatin opening elements ("UCOE", also known as "ubiquitous chromatin opening elements") have been described in WO 00/05393.

Un "potenciador" es una secuencia de nucleótidos que actúa para potenciar la transcripción de genes independientemente de la identidad del gen, la posición de la secuencia en relación con el gen o la orientación de la secuencia. Los vectores de la presente invención incluyen opcionalmente potenciadores. An "enhancer" is a nucleotide sequence that acts to enhance gene transcription regardless of the identity of the gene, the position of the sequence relative to the gene, or the orientation of the sequence. The vectors of the present invention optionally include enhancers.

Un "gen" es una secuencia de desoxirribonucleótidos (DNA) que codifica una proteína madura dada. Como se usa en la presente memoria, el término "gen" no debe incluir regiones flanqueantes no traducidas, tales como las señales de iniciación de la transcripción del RNA, sitios de adición de poliadenilación, promotores o potenciadores. A "gene" is a sequence of deoxyribonucleotides (DNA) that encodes a given mature protein. As used herein, the term "gene" should not include untranslated flanking regions, such as RNA transcription initiation signals, polyadenylation addition sites, promoters, or enhancers.

Un "gen producto" es un gen que codifica un producto proteínico que tiene características deseables, tales como utilidad en diagnóstico o en terapia. Un gen producto incluye, por ejemplo, genes estructurales y genes reguladores. A "product gene" is a gene that encodes a protein product that has desirable characteristics, such as utility in diagnosis or therapy. A product gene includes, for example, structural genes and regulatory genes.

Un "gen estructural" se refiere a un gen que codifica una proteína estructural. Ejemplos de genes estructurales incluyen, aunque sin limitación, proteínas citoesqueléticas, proteínas de la matriz extracelular, enzimas, proteínas de los poros nucleares y proteínas del armazón nuclear, canales y transportadores, proteínas contráctiles y chaperonas. Los genes estructurales preferidos codifican anticuerpos o fragmentos de anticuerpos. A "structural gene" refers to a gene that encodes a structural protein. Examples of structural genes include, but are not limited to, cytoskeletal proteins, extracellular matrix proteins, enzymes, nuclear pore proteins, and nuclear framework proteins, channels and transporters, contractile proteins, and chaperones. Preferred structural genes encode antibodies or antibody fragments.

Un "gen regulador" se refiere a un gen que codifica una proteína reguladora. Ejemplos de proteínas reguladoras incluyen, aunque sin limitación, factores de transcripción, hormonas, factores del crecimiento, citoquinas, moléculas de transducción de señales, oncogenes, proto-oncogenes, receptores transmembránicos y proteínas quinasas. A "regulatory gene" refers to a gene that encodes a regulatory protein. Examples of regulatory proteins include, but are not limited to, transcription factors, hormones, growth factors, cytokines, signal transduction molecules, oncogenes, proto-oncogenes, transmembrane receptors, and protein kinases.

"Orientación" se refiere al orden de los nucleótidos en una secuencia de DNA dada. Por ejemplo, una orientación invertida de una secuencia de DNA es aquella en la que está invertido el orden de la secuencia 5’ a 3’ con relación a otra secuencia en comparación con un punto de referencia en el DNA a partir del que se obtuvo la secuencia. Dichos puntos de referencia pueden incluir la dirección de la transcripción de otras secuencias especificadas de DNA en el DNA fuente y/o el origen de replicación de vectores replicables que contienen la secuencia. "Orientation" refers to the order of nucleotides in a given DNA sequence. For example, an inverted orientation of a DNA sequence is one in which the order of the sequence is reversed 5 'to 3' relative to another sequence compared to a reference point in the DNA from which the sequence. Such reference points may include the direction of transcription of other specified DNA sequences in the source DNA and / or the origin of replication of replicable vectors containing the sequence.

"Célula eucariótica" se refiere a cualquier célula de mamífero o no mamífero procedente de un organismo eucariótico. Como ejemplo no limitativo, estaría incluida en esta invención cualquier célula eucariótica que sea capaz de mantenerse en las condiciones del cultivo celular y ser transfectada posteriormente. Los tipos de células especialmente preferidos incluyen, por ejemplo, células madre, células madre embrionarias, células de ovario de hámster chino (CHO), COS, BHK21, NIH3T3, HeLa, C2C12, células cancerígenas y células primarias diferenciadas "Eukaryotic cell" refers to any mammalian or non-mammalian cell derived from a eukaryotic organism. As a non-limiting example, any eukaryotic cell that is capable of maintaining itself under the conditions of cell culture and subsequently transfected would be included in this invention. Especially preferred cell types include, for example, stem cells, embryonic stem cells, Chinese hamster ovary (CHO) cells, COS, BHK21, NIH3T3, HeLa, C2C12, cancer cells, and differentiated primary cells.

o no diferenciadas. Otras células hospedantes adecuadas son conocidas por los expertos en la técnica. or undifferentiated. Other suitable host cells are known to those skilled in the art.

Las expresiones "célula hospedante" y "célula hospedante recombinante" se usan intercambiablemente en la presente memoria para indicar una célula eucariótica en la que han sido introducidos uno o más vectores de la invención. Ha de entenderse que dichas expresiones se refieren no sólo a la célula objeto particular, sino también a la progenie o progenie potencial de dicha célula. Debido a que pueden producirse ciertas modificaciones en las generaciones subsiguientes a causa de mutaciones o influencias medioambientales, dicha progenie puede, en efecto, no ser idéntica a la célula parental, pero también está incluida en el alcance de las expresiones utilizadas en la presente memoria. The terms "host cell" and "recombinant host cell" are used interchangeably herein to indicate a eukaryotic cell into which one or more vectors of the invention have been introduced. It is to be understood that said expressions refer not only to the particular object cell, but also to the progeny or potential progeny of said cell. Because certain modifications may occur in subsequent generations due to mutations or environmental influences, such progeny may, in effect, not be identical to the parent cell, but is also included within the scope of the expressions used herein.

Las expresiones "introducir un DNA purificado en una célula hospedante eucariótica" o "transfección" significan cualquier proceso en el que un DNA extracelular, con o sin material acompañante, entra en una célula hospedante. La expresión "célula transfectada" significa la célula en la que se ha introducido el DNA extracelular y por tanto alberga el DNA extracelular. El DNA podría ser introducido en la célula de modo que el ácido nucleico sea replicable como un integrante cromosómico o como un elemento extracromosómico. The terms "introducing purified DNA into a eukaryotic host cell" or "transfection" mean any process in which extracellular DNA, with or without accompanying material, enters a host cell. The term "transfected cell" means the cell into which the extracellular DNA has been introduced and therefore houses the extracellular DNA. DNA could be introduced into the cell so that the nucleic acid is replicable as a chromosomal component or as an extrachromosomal element.

"Promotor" como se usa en la presente memoria se refiere a una secuencia de ácido nucleico que regula la expresión de un gen. "Promoter" as used herein refers to a nucleic acid sequence that regulates the expression of a gene.

"Co-transfección" significa el proceso de transfectar una célula eucariótica con más de un gen o vector o plásmido exógeno, extraño a la célula, uno de los cuales puede conferir a la célula un fenotipo seleccionable. "Co-transfection" means the process of transfecting a eukaryotic cell with more than one exogenous gene or vector or plasmid, foreign to the cell, one of which may confer on the cell a selectable phenotype.

La secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas comprende también, además de uno o más elementos de DNA curvado, al menos un sitio de unión para una proteína que se une al DNA. The isolated and purified DNA sequence having activity that increases protein production also comprises, in addition to one or more elements of curved DNA, at least one binding site for a protein that binds to DNA.

Generalmente la proteína que se une al DNA es un factor de transcripción. Ejemplos de factores de transcripción son el grupo que consiste en las proteínas con el dominio polyQpolyP. Otro ejemplo de un factor de transcripción es un factor de transcripción seleccionado del grupo que comprende SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C/EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2, Pit1, TTF1, XFD1, AR, C/EBPgamma, Cdc5, FOXD3, HFH3, HNF3beta, MRF2, Oct1, POU6F1, SRF, V$MTATA_ B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL, HP1, Myc, PBX, Pax3, TEF, VBP, XFD3, Bm2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1F1, Pax6, TFIIA o una combinación de dos o más de estos factores de transcripción. Las más preferidas son las proteínas con los dominios SATB1, NMP4, MEF2 y polyQpolyP. Generally the protein that binds to DNA is a transcription factor. Examples of transcription factors are the group consisting of proteins with the polyQpolyP domain. Another example of a transcription factor is a transcription factor selected from the group comprising SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C / EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2, Pit1, TTF1, XFD1, AR, C / EBPgamma, Cdc5, FOXD3, HFH3, HNF3beta, MRF2, Oct1, POU6F1, SRF, V $ MTD2, B CR3, Cdx2, FOXJ2, HFL, HP1, Myc, PBX, Pax3, TEF, VBP, XFD3, Bm2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1F1, Pax6, TFIIA or a combination of two or more of these transcription factors. Most preferred are proteins with the SATB1, NMP4, MEF2 and polyQpolyP domains.

Se sabe, por ejemplo, que SATB1, NMP4 y MEF2, regulan el desarrollo y/o la expresión de genes específicos de tejidos en los mamíferos. Estos factores de transcripción tienen la capacidad de alterar la geometría del DNA y recíprocamente la unión al DNA como un ligando alostérico modifica su estructura. Recientemente, se encontró que SATB1 forma una estructura similar a una jaula que circunscribe la heterocromatina (Cai S, Han HJ, and Kohwi-Shigematsu T, "Tissue-specific nuclear architecture and gene expression regulated by SATB1" Nat. Genet., 2003. 34(1): p. 42-51). For example, SATB1, NMP4 and MEF2 are known to regulate the development and / or expression of tissue-specific genes in mammals. These transcription factors have the ability to alter the geometry of DNA and, conversely, binding to DNA as an allosteric ligand modifies its structure. Recently, SATB1 was found to form a cage-like structure that circumscribes heterochromatin (Cai S, Han HJ, and Kohwi-Shigematsu T, "Tissue-specific nuclear architecture and gene expression regulated by SATB1" Nat. Genet., 2003. 34 (1): p. 42-51).

Otra parte de la presente descripción es un elemento y/o fragmento de cLysMAR aislado y purificado, una de sus secuencias complementarias, una de sus partes que comparte una longitud de nucleótidos de al menos el 70%, una de sus quimeras moleculares y una de sus combinaciones y variantes. Another part of the present description is an isolated and purified cLysMAR element and / or fragment, one of its complementary sequences, one of its parts that shares a nucleotide length of at least 70%, one of its molecular chimeras and one of their combinations and variants.

El elemento y/o fragmento de cLysMAR puede consistir en al menos una secuencia de nucleótidos seleccionada de las regiones B, K y F. The cLysMAR element and / or fragment may consist of at least one nucleotide sequence selected from regions B, K, and F.

Una parte adicional de la presente descripción es una secuencia de MAR sintética que comprende elementos y/o fragmentos de MAR natural ensamblados entre secuencias conectoras. An additional part of the present description is a synthetic MAR sequence comprising elements and / or fragments of natural MAR assembled between connecting sequences.

La secuencia de MAR sintética puede comprender un elemento y/o fragmento de cLysMAR de una de sus secuencias complementarias, una de sus partes que comparte al menos una longitud de nucleótidos del 70%, una de sus quimeras moleculares y una de sus combinaciones y variantes. También preferiblemente, las secuencias conectoras son el conector Bglll-BamHl. The synthetic MAR sequence can comprise an element and / or fragment of cLysMAR from one of its complementary sequences, one of its parts that shares at least a nucleotide length of 70%, one of its molecular chimeras and one of its combinations and variants . Also preferably, the linker sequences are the Bglll-BamHl linker.

Otro aspecto de la descripción es proporcionar un método para identificar una secuencia de MAR usando una herramienta bioinformática que comprende el cálculo de valores de una o más características de las secuencias de DNA correspondientes a la curvatura de DNA, la profundidad de la ranura mayor y la anchura de la ranura menor potenciales y a la temperatura de fusión. Preferiblemente, la identificación de una o más características de la secuencias de DNA comprende además una característica más de las secuencias de DNA correspondiente a los sitios de unión para las proteínas que se unen al DNA, que también se calcula con este método. Another aspect of the disclosure is to provide a method for identifying a MAR sequence using a bioinformatics tool that comprises calculating values of one or more characteristics of DNA sequences corresponding to DNA curvature, major groove depth, and Potential minor groove width and melting temperature. Preferably, the identification of one or more characteristics of the DNA sequences further comprises one more characteristic of the DNA sequences corresponding to the binding sites for the DNA-binding proteins, which is also calculated by this method.

Preferiblemente, los perfiles o las matrices ponderadas de dicha herramienta bioinformática se basan en el reconocimiento de dinucleótidos. Preferably, the profiles or the weighted matrices of said bioinformatics tool are based on the recognition of dinucleotides.

La herramienta bioinformática usada para el presente método es preferiblemente, el programa SMAR Scan@, que contiene algoritmos desarrollados por Gene Express ((http://srs6.bionet.nsc.ru/srs6bin/cgi-bin/wgetz?-e+[FEATURES-SiteID:’nR’]) y se basa en el trabajo de Levitsky et al., 1999. Estos algoritmos reconocen perfiles, basados en matrices ponderadas de dinucleótidos, para calcular los valores teóricos de las propiedades conformacionales y fisicoquímicas del DNA. The bioinformatics tool used for the present method is preferably the SMAR Scan @ program, which contains algorithms developed by Gene Express ((http://srs6.bionet.nsc.ru/srs6bin/cgi-bin/wgetz?-e++ FEATURES -SiteID: 'nR']) and is based on the work of Levitsky et al., 1999. These algorithms recognize profiles, based on weighted dinucleotide matrices, to calculate the theoretical values of the conformational and physicochemical properties of DNA.

Preferiblemente, el programa SMAR Scan@ usa los cuatro criterios teóricos designados también como características de las secuencias de DNA correspondientes a la curvatura del DNA, la profundidad de la ranura mayor y la anchura de la ranura menor potenciales y a la temperatura de fusión en todas las combinaciones posibles, usando ventanas de escaneo de tamaño variable (véase la Fig. 3). Para cada función usada, debe ajustarse un valor de exclusión. El programa presenta una coincidencia cada vez que la puntuación calculada de una región dada está por encima del valor de exclusión ajustado para todos los criterios elegidos. Se dispone de dos modos de salida de datos para manejar las coincidencias, el primero (denominado "similar a perfil") presenta simplemente todas las posiciones de las coincidencias en la secuencia de consulta y sus valores correspondientes para los diferentes criterios elegidos. El segundo modo (denominado "coincidencias contiguas") solo produce las posiciones de diversas coincidencias contiguas y sus secuencias correspondientes. Para este modo, el número mínimo de coincidencias contiguas es otro valor de exclusión que puede ser fijado, de nuevo con un tamaño de ventana ajustable. Este segundo modo es el modo predeterminado del programa SMAR Scan®. Realmente, desde un punto de vista semántico, una coincidencia es considerada un elemento de desenrollamiento del núcleo (CUE) y una agrupación de CUE acompañada por agrupaciones de sitios de unión para las proteínas correspondientes es considerada una MAR. Por tanto, el programa SMAR Scan@ solo considera diversas coincidencias contiguas como una MAR potencial. Preferably, the SMAR Scan @ program uses the four theoretical criteria also designated as characteristics of the DNA sequences corresponding to the curvature of the DNA, the depth of the largest groove and the width of the smallest potential groove and the melting temperature in all possible combinations, using variable size scan windows (see Fig. 3). For each function used, an exclusion value must be set. The program matches each time the calculated score for a given region is above the adjusted exclusion value for all chosen criteria. Two data output modes are available to handle matches, the first (called "profile-like") simply presents all the positions of the matches in the query sequence and their corresponding values for the different criteria chosen. The second mode (called "contiguous matches") only produces the positions of various contiguous matches and their corresponding sequences. For this mode, the minimum number of contiguous matches is another exclusion value that can be set, again with an adjustable window size. This second mode is the default mode of the SMAR Scan® program. Actually, from a semantic point of view, a coincidence is considered a nucleus unwinding element (CUE) and a grouping of CUE accompanied by groupings of binding sites for the corresponding proteins is considered a MAR. Therefore, the SMAR Scan @ program only considers multiple contiguous matches as a potential MAR.

Para afinar los valores de exclusión predeterminados para los cuatro criterios estructurales teóricos, se utilizaron las MAR validadas experimentalmente de la SMARt DB (http://transfac.gbf.de/-SMARt DB). Los inventores recuperaron y analizaron todas las secuencias de MAR humanas procedentes de la base de datos con el programa SMAR Scan® usando el modo "similar a perfil" con los cuatro criterios y sin ajustar el valor de exclusión. Esto permitió el ajuste de cada función para cada posición de las secuencias. De acuerdo con estos datos se calculó entonces la distribución de cada criterio (véanse las Fig. 1 y 3). To fine-tune the default exclusion values for the four theoretical structural criteria, experimentally validated MARs from the SMARt DB (http://transfac.gbf.de/-SMARt DB) were used. The inventors retrieved and analyzed all human MAR sequences from the database with the SMAR Scan® program using the "profile-like" mode with all four criteria and without adjusting the exclusion value. This allowed the adjustment of each function for each position of the sequences. Based on these data, the distribution of each criterion was then calculated (see Figs. 1 and 3).

Los valores de exclusión predeterminados del programa SMAR Scan® para la curvatura, la profundidad de la ranura mayor y la anchura de la ranura menor se ajustaron a la media del cuantil 75 y a la mediana. Para la temperatura de fusión, el valor de exclusión predeterminado debe ajustarse al cuantil 75. La longitud mínima para el modo de "coincidencias contiguas" debe ajustarse a 300 debido a que se supone que es la longitud mínima de una MAR (véanse las Fig. 8 y 9). Sin embargo, un experto en la técnica podría determinar los valores de exclusión de los criterios antes citados para un organismo dado con una experimentación mínima. The default SMAR Scan® program exclusion values for curvature, depth of major groove, and width of minor groove were adjusted to the 75th quantile mean and median. For the melting temperature, the default exclusion value should be set to the 75th quantile. The minimum length for the "contiguous matches" mode should be set to 300 because it is assumed to be the minimum length of a MAR (see Fig. 8 and 9). However, one skilled in the art could determine the exclusion values of the above criteria for a given organism with minimal experimentation.

Preferiblemente, los valores de curvatura del DNA están comprendidos entre 3 y 5° (grado radial). Más preferiblemente están situados entre 3,8 y 4,4°, correspondiente al pico menor de la Fig. 1. Preferably, the DNA curvature values are between 3 and 5 ° (radial degree). More preferably they are located between 3.8 and 4.4 °, corresponding to the minor peak in Fig. 1.

Preferiblemente, los valores de la profundidad de la ranura mayor están comprendidos entre 8,9 y 9,3 Å (Angstrom) y los valores de la anchura de la ranura menor entre 5,2 y 5,8 Å. Más preferiblemente, los valores de la profundidad dela ranura mayor están comprendidos entre 9,0 y 9,2 Å y los valores de la anchura de la ranura menor entre 5,4 y 5,7Å. Preferably, the values of the depth of the largest groove are between 8.9 and 9.3 Å (Angstrom) and the values of the width of the smallest groove are between 5.2 and 5.8 Å. More preferably, the values of the depth of the largest groove are between 9.0 and 9.2 Å and the values of the width of the smallest groove are between 5.4 and 5.7Å.

Preferiblemente, la temperatura de fusión está comprendida entre 55 y 75°C (grados Celsius). Más preferiblemente, la temperatura de fusión está comprendida entre 55 y 62°C. Preferably, the melting temperature is between 55 and 75 ° C (degrees Celsius). More preferably, the melting temperature is between 55 and 62 ° C.

La proteína que se une al DNA cuyos valores pueden ser calculados por el método es generalmente un factor de transcripción, preferiblemente un dominio polyQpolyP o un factor de transcripción seleccionado del grupo que comprende SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C/EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2; Pit1, TTF1, XFD1, AR, C/EBPgamma, Cdc5, FOXD3, HFH3, HNF3beta, MRF2, Oct1, POU6F1, V$MTATA_B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL, HP1, Myc, PBX, Pax3, TEF, VBP, XFD3, Bm2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1 F1, Pax6, TFIIA o una combinación de dos o más de estos factores de transcripción. The DNA-binding protein whose values can be calculated by the method is generally a transcription factor, preferably a polyQpolyP domain or a transcription factor selected from the group consisting of SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C / EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2; Pit1, TTF1, XFD1, AR, C / EBPgamma, Cdc5, FOXD3, HFH3, HNF3beta, MRF2, Oct1, POU6F1, V $ MTATA_B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL, HP1, Myc, Myc, PB , TEF, VBP, XFD3, Bm2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1 F1, Pax6, TFIIA or a combination of two or more of these transcription factors.

Sin embargo, un experto en la técnica podría determinar otras clases de factores de transcripción con el fin de realizar el método de acuerdo con la presente invención. However, one of skill in the art could determine other classes of transcription factors in order to carry out the method according to the present invention.

En el caso en el que se aplique el programa SMAR Scan® para realizar, por ejemplo, análisis a gran escala, entonces, preferiblemente, el método antes citado comprende además al menos un filtro que prediga los sitios de unión al DNA para los factores de transcripción del DNA con el fin de reducir los cálculos. In the case where the SMAR Scan® program is applied to perform, for example, large-scale analysis, then, preferably, the aforementioned method further comprises at least one filter that predicts DNA binding sites for the factors of DNA transcription in order to reduce stones.

El principio de este método combina el programa SMAR Scan® para calcular las características estructurales como se ha descrito antes y un filtro, tal como, por ejemplo, el programa pfsearch, (a partir del paquete pftools descrito por Bucher P, Karplus K, Moeri N, and Hofmann K, "A flexible search technique based on generalized profiles", Computers and Chemistry, 20:324, 1996) para predecir la unión de algunos factores de transcripción. The principle of this method combines the SMAR Scan® program to calculate the structural characteristics as described before and a filter, such as, for example, the pfsearch program, (from the pftools package described by Bucher P, Karplus K, Moeri N, and Hofmann K, "A flexible search technique based on generalized profiles", Computers and Chemistry, 20: 324, 1996) to predict the binding of some transcription factors.

Ejemplos de filtros comprenden, aunque sin limitación, los programas pfsearch, MatInspector, RMatch Professional y TRANSFAC Professional. Examples of filters include, but are not limited to, the pfsearch, MatInspector, RMatch Professional, and TRANSFAC Professional programs.

Este método combinado usa las características estructurales del programa SMAR Scan® y la unión predicha de factores de transcripción específicos del filtro que se pueden aplicar secuencialmente en cualquier orden para seleccionar las MAR, por consiguiente, dependiendo del filtro se aplica al comienzo o al final del método. This combined method uses the structural features of the SMAR Scan® program and the predicted binding of filter-specific transcription factors that can be applied sequentially in any order to select MARs, therefore, depending on the filter, is applied at the beginning or end of the method.

El primer nivel selecciona secuencias de la secuencia de entrada primaria y el segundo nivel, que consiste en el filtro, se puede usar para restringir entre las secuencias seleccionadas aquellas que satisfacen los criterios usados por el filtro. The first level selects sequences from the primary input sequence, and the second level, which consists of the filter, can be used to restrict among the selected sequences those that meet the criteria used by the filter.

En este método combinado el filtro detecta agrupaciones de sitios de unión al DNA usando perfiles o matrices ponderadas de, por ejemplo, el programa MatInspector (Quandt K, Frech K, Karas H, Wingender E, Werner T, "MatInd and MatInspector New fast and versatile tools for detection of consensus matches in nucleotide sequence data", Nucleic Acids Research, 23, 4878-4884, 1995). El filtro puede detectar también las densidades de agrupaciones de sitios de unión al DNA. In this combined method the filter detects clusters of DNA binding sites using profiles or weighted matrices from, for example, the MatInspector program (Quandt K, Frech K, Karas H, Wingender E, Werner T, "MatInd and MatInspector New fast and versatile tools for detection of consensus matches in nucleotide sequence data ", Nucleic Acids Research, 23, 4878-4884, 1995). The filter can also detect densities of clusters of DNA binding sites.

El método combinado es realmente un "envoltorio" escrito en Perl para el programa SMAR Scan@ y, en el caso en el que se use el programa pfsearch como filtro, a partir del paquete pftools. El método combinado realiza un tratamiento a dos niveles usando en cada nivel una de estas herramientas (el programa SMAR Scan@ o filtro) como "filtro" potencial, siendo cada filtro opcional y pudiendo ser usado para calcular las características predichas sin realizar ninguna filtración. The combined method is actually a "wrapper" written in Perl for the SMAR Scan @ program and, in the case where the pfsearch program is used as a filter, starting with the pftools package. The combined method performs a two-level treatment using one of these tools (the SMAR Scan @ program or filter) as a potential "filter" at each level, each filter being optional and can be used to calculate the predicted characteristics without filtering.

Si se usa el programa SMAR Scan® en el primer nivel para filtrar subsecuencias, ha de usarse con el modo de "todas las coincidencias contiguas" con el fin de que aparezcan las secuencias. Si se usa el programa pfsearch en el primer nivel como primer filtro, ha de usarse sólo con un perfil y debe proporcionarse una distancia de nucleótidos. Esta distancia se usa para agrupar las coincidencias del programa pfsearch que están situadas a una distancia inferior a la distancia proporcionada para que aparezcan las secuencias. El método combinado inicia el programa pfsearch, analiza su salida y aparecen las secuencias correspondientes a las coincidencias del programa pfsearch que son agrupados de acuerdo con la distancia proporcionada. A continuación, cualquiera que sea la herramienta usada en el primer nivel, la longitud de las subsecuencias así seleccionadas puede ser sistemáticamente ampliada por ambos extremos de acuerdo con un parámetro denominado "ampliación de resultados". If the SMAR Scan® program at the first level is used to filter sub-sequences, it must be used with the "all contiguous matches" mode in order for the sequences to appear. If the pfsearch program is used at the first level as the first filter, it must be used only with one profile and a nucleotide distance must be provided. This distance is used to group the matches of the pfsearch program that are located at a distance less than the distance provided for the sequences to appear. The combined method starts the pfsearch program, parses its output and the sequences corresponding to the matches of the pfsearch program appear, which are grouped according to the distance provided. Then, whatever the tool used in the first level, the length of the subsequences thus selected can be systematically extended at both ends according to a parameter called "result extension".

El nivel segundo y opcional se puede usar para separar por filtración las secuencias (secuencias ya filtradas o secuencias de entrada no filtradas) u obtener los resultados por los programas SMAR Scan® y/o pfsearch sin realizar ninguna filtración de estas secuencias. Si se usa para filtrar el segundo nivel del método combinado, para cada criterio es necesario proporcionar los valores de exclusión considerados (resultado por nucleótido) para separar por filtración dichas secuencias (véase la Fig. 20). The second and optional level can be used to filter out the sequences (already filtered sequences or unfiltered input sequences) or obtain the results by the SMAR Scan® and / or pfsearch programs without filtering these sequences. If used to filter the second level of the combined method, for each criterion it is necessary to provide the considered exclusion values (result per nucleotide) to filter-separate those sequences (see Fig. 20).

Otro objeto de la presente descripción es proporcionar también un método para identificar una secuencia de MAR que comprende al menos un filtro que detecte agrupaciones de sitios de unión de DNA usando perfiles o matrices ponderadas. Preferiblemente, este método comprende dos niveles de filtros y en este caso, el programa SMAR Scan® está totalmente ausente de dicho método. Generalmente, los dos niveles usan el programa pfsearch. Another object of the present disclosure is also to provide a method for identifying a MAR sequence comprising at least one filter that detects clusters of DNA binding sites using weighted profiles or matrices. Preferably, this method comprises two levels of filters and in this case, the SMAR Scan® program is totally absent from said method. Generally, both levels use the pfsearch program.

También está incluida en la presente descripción una secuencia de DNA de MAR aislada y purificada identificable de acuerdo con el método para identificar una secuencia de MAR usando la herramienta bioinformática descrita, el método combinado o el método que comprende al menos un filtro. Also included in the present disclosure is an identifiable isolated and purified MAR DNA sequence according to the method for identifying a MAR sequence using the disclosed bioinformatics tool, the combined method, or the method comprising at least one filter.

El análisis por el método combinado del genoma humano completo proporcionó un total de 1757 MAR supuestas que representan un total de 1.065.305 pares de bases. Con el fin de reducir el número de resultados, se realizó un análisis de dinucleótidos en estas 1757 MAR, calculando cada uno de los 16 posibles porcentajes de dinucleótidos para cada secuencia considerando ambas cadenas en la dirección 5’ a 3’. Analysis by the combined method of the entire human genome provided a total of 1,757 putative MARs representing a total of 1,065,305 base pairs. In order to reduce the number of results, a dinucleotide analysis was performed in these 1757 MAR, calculating each of the 16 possible percentages of dinucleotides for each sequence, considering both chains in the 5 'to 3' direction.

Sorprendentemente, los inventores han mostrado que todas las "super" MAR detectadas con el método combinado contienen al menos 10% del dinucleótido TA en un tramo de 100 pares de bases contiguos. Preferiblemente, estas secuencias contienen al menos 33% del dinucleótido TA en un tramo de 100 pares de bases. Surprisingly, the inventors have shown that all "super" MARs detected by the combined method contain at least 10% of the TA dinucleotide in a contiguous 100 base pair span. Preferably these sequences contain at least 33% of the TA dinucleotide over a 100 base pair span.

Los inventores también han demostrado que estas mismas secuencias contienen además al menos 12% del dinucleótido AT en un tramo de 100 pares de bases contiguos. Preferiblemente, contienen al menos 33% del dinucleótido AT en un tramo de 100 pares de bases contiguos. The inventors have also shown that these same sequences further contain at least 12% of the AT dinucleotide in a contiguous 100 base pair span. Preferably they contain at least 33% of the AT dinucleotide in a contiguous 100 base pair span.

Otro aspecto de la descripción es proporcionar una secuencia de DNA de MAR aislada y purificada de cualquiera de las MAR anteriormente descritas, que comprende una secuencia seleccionada de las secuencias SEQ ID No 1 a 27, una de sus secuencias complementarias, una de sus partes que comparte al menos una longitud de nucleótidos del 70%, una de sus quimeras moleculares y una de sus combinaciones y variantes. Another aspect of the description is to provide a purified and isolated MAR DNA sequence from any of the MAR described above, comprising a sequence selected from sequences SEQ ID No. 1 to 27, one of its complementary sequences, one of its parts that it shares at least a 70% nucleotide length, one of its molecular chimeras, and one of its combinations and variants.

Preferiblemente, dicha secuencia de DNA de MAR aislada y purificada comprende una secuencia seleccionada de las secuencias SEQ ID No 24 a 27, una de sus secuencias complementarias, una de sus partes que comparte al menos una longitud de nucleótidos del 70%, una de sus quimeras moleculares y una de sus combinaciones y variantes. Estas secuencias 24 a 27 corresponden a las detectadas por el método combinado y muestran una mayor actividad que aumenta la producción de proteínas que las secuencias 1 a 23. Preferably, said isolated and purified MAR DNA sequence comprises a sequence selected from sequences SEQ ID No. 24 to 27, one of its complementary sequences, one of its parts that shares at least a nucleotide length of 70%, one of its molecular chimeras and one of its combinations and variants. These sequences 24 to 27 correspond to those detected by the combined method and show a higher activity that increases protein production than sequences 1 to 23.

La presente descripción comprende también el uso de una secuencia de DNA aislada y purificada que comprende una primera secuencia de nucleótidos aislada de una región de fijación a la matriz (MAR) que es una secuencia de nucleótidos de MAR seleccionada del grupo que comprende The present disclosure also encompasses the use of an isolated and purified DNA sequence comprising a first nucleotide sequence isolated from a matrix-binding region (MAR) which is a MAR nucleotide sequence selected from the group comprising

--: una secuencia de DNA aislada y purificada de acuerdo con la invención, an isolated and purified DNA sequence according to the invention,

--: la secuencia SEQ ID No 27, o una de sus secuencias complementarias, the sequence SEQ ID No 27, or one of its complementary sequences,

para aumentar la actividad de producción de proteínas en una célula hospedante eucariótica. to increase protein production activity in a eukaryotic host cell.

Dicha secuencia de DNA aislada y purificada comprende además generalmente una o más secuencias reguladoras, conocidas en la técnica, por ejemplo, un promotor y/o un potenciador, sitios de poliadenilación y uniones por empalme, empleadas generalmente para la expresión de la proteína o pueden codificar opcionalmente un marcador seleccionable. Preferiblemente, dicha secuencia de DNA aislada y purificada comprende un promotor que está unido operativamente a un gen de interés. Said isolated and purified DNA sequence generally further comprises one or more regulatory sequences, known in the art, for example a promoter and / or an enhancer, polyadenylation sites and splice junctions, generally employed for the expression of the protein or may optionally encode a selectable marker. Preferably, said isolated and purified DNA sequence comprises a promoter that is operably linked to a gene of interest.

Las secuencias de DNA de esta invención se pueden aislar de acuerdo con protocolos estándares de PCR y métodos muy conocidos en la técnica. The DNA sequences of this invention can be isolated according to standard PCR protocols and methods well known in the art.

Los promotores que se pueden usar, siempre que sean compatibles con la célula hospedante, son, por ejemplo, promotores obtenidos de los genomas de virus tales como poliomavirus, adenovirus (tal como Adenovirus 2), papilomavirus (tal como el papilomavirus bovino), virus del sarcoma aviar, citomegalovirus (tal como el promotor temprano inmediato del citomegalovirus humano o de múridos), un retrovirus, virus de la hepatitis B y virus 40 de simios (tales como los promotores temprano y tardío del SV 40) o promotores obtenidos de promotores heterólogos de mamíferos, tal como el promotor de actina o un promotor de inmunoglobulina o promotores de choque térmico. Dichas secuencias reguladoras dirigen la expresión constitutiva. Promoters that can be used, provided that they are compatible with the host cell, are, for example, promoters obtained from the genomes of viruses such as polyomaviruses, adenoviruses (such as Adenovirus 2), papillomaviruses (such as bovine papillomaviruses), viruses from avian sarcoma, cytomegalovirus (such as the immediate early promoter of human or murine cytomegalovirus), a retrovirus, hepatitis B virus and simian virus 40 (such as early and late promoters of SV 40) or promoters obtained from promoters mammalian heterologists, such as the actin promoter or an immunoglobulin promoter or heat shock promoters. Such regulatory sequences direct constitutive expression.

Además, la secuencia de DNA aislada y purificada podría comprender secuencias reguladoras que fueran capaces de dirigir la expresión de los ácidos nucleicos preferiblemente en un tipo de célula particular (por ejemplo, se usan elementos reguladores específicos de los tejidos para expresar el ácido nucleico). Los elementos reguladores específicos de los tejidos son conocidos en la técnica. Ejemplos adecuados no limitativos de promotores específicos de los tejidos incluyen el promotor de albúmina (específico del hígado; Pinkert,et al., 1987. Genes Dev. 1: 268-277), promotores específicos del tejido linfático (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), en particular promotores de receptores de linfocitos T (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) e inmunoglobulinas (Banerji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), promotores específicos de las neuronas (por ejemplo, el promotor de neurofilamentos; Byrne and Ruddle, 1989. Proc.Natl. Acad. Sci. USA 86: 5473-5477), promotores específicos del páncreas (Edlund, et al., 1985. Science 230: 912-916) y promotores específicos de las glándulas mamarias (por ejemplo, promotor del suero de la leche; patente de EE.UU. Nº Furthermore, the isolated and purified DNA sequence could comprise regulatory sequences that are capable of directing the expression of nucleic acids preferably in a particular cell type (eg, tissue-specific regulatory elements are used to express nucleic acid). Tissue specific regulatory elements are known in the art. Suitable non-limiting examples of tissue specific promoters include the albumin promoter (liver specific; Pinkert, et al., 1987. Genes Dev. 1: 268-277), lymph tissue specific promoters (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), in particular T cell receptor promoters (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) and immunoglobulins (Banerji, et al., 1983. Cell 33: 729 -740; Queen and Baltimore, 1983. Cell 33: 741-748), neuron-specific promoters (eg, the neurofilament promoter; Byrne and Ruddle, 1989. Proc.Natl. Acad. Sci. USA 86: 5473- 5477), pancreas-specific promoters (Edlund, et al., 1985. Science 230: 912-916) and mammary gland-specific promoters (eg, milk serum promoter; US Patent No.

4,873,316 and European Patent Application No. 264,166).

También están incluidos los promotores regulados por el desarrollo. Ejemplos de dichos promotores incluyen, por ejemplo, los promotores de los genes homeóticos de múridos (Kessel and Gruss, 1990. Science 249: 374-379) y promotor de alfa-fetoproteína (Campes and Tilghman, 1989. Genes Dev. 3: 537-546). Development-regulated promoters are also included. Examples of such promoters include, for example, promoters of murine homeotic genes (Kessel and Gruss, 1990. Science 249: 374-379) and alpha-fetoprotein promoter (Campes and Tilghman, 1989. Genes Dev. 3: 537. -546).

Los promotores de la expresión de genes regulables son muy conocidos en la técnica e incluyen, como ejemplo no limitativo, cualquier promotor que module la expresión de un gen que codifica una proteína deseada uniendo una molécula exógena, tal como el sistema CRE/LOX, el sistema TET, el sistema de doxiciclina, el sistema NFkappaB/luz UV, el sistema Leu3p/isopropilmalato y el sistema GLVPc/GAL4 (véase por ejemplo, Sauer, 1998, Methods 14 (4): 381-92; Lewandoski, 2001, Nat. Rev. Genet 2 (10): 743-55; Legrand-Poels et al., 1998, J. Photochem. Photobiol. B. 45: 18; Guo et al., 1996, FEBS Lett. 390 (2): 191-5; Wang et al., PNAS USA, 1999, 96 (15): 84838). Sin embargo, un experto en la técnica podría determinar otras clases de promotores que sean adecuados para la realización de la presente invención. Regulable gene expression promoters are well known in the art and include, as a non-limiting example, any promoter that modulates the expression of a gene encoding a desired protein by binding an exogenous molecule, such as the CRE / LOX system, the TET system, doxycycline system, NFkappaB / UV light system, Leu3p / isopropyl malate system and GLVPc / GAL4 system (see for example, Sauer, 1998, Methods 14 (4): 381-92; Lewandoski, 2001, Nat Rev. Genet 2 (10): 743-55; Legrand-Poels et al., 1998, J. Photochem. Photobiol. B. 45:18; Guo et al., 1996, FEBS Lett. 390 (2): 191 -5; Wang et al., PNAS USA, 1999, 96 (15): 84838). However, one of skill in the art could determine other classes of promoters that are suitable for carrying out the present invention.

Pueden incluirse opcionalmente en la secuencia de DNA purificada de la invención potenciadores que entonces pertenecerán a la secuencia reguladora, por ejemplo al promotor. Enhancers may then be optionally included in the purified DNA sequence of the invention which will then belong to the regulatory sequence, for example the promoter.

El "gen de interés" o "transgén” codifica preferiblemente una proteína (proteína estructural o reguladora). Como se usa en la presente memoria "proteína" se refiere generalmente a péptidos y polipéptidos que tienen más de aproximadamente diez aminoácidos. Las proteínas pueden ser "homólogas" al hospedante (es decir, endógenas de la célula hospedante que se va a utilizar) o "heterólogas" (es decir, extrañas a la célula hospedante que se va a utilizar), tal como una proteína humana producida por levadura. La proteína puede producirse como un agregado insoluble o como una proteína soluble en el espacio periplásmico o citoplasma de la célula o en el medio extracelular. Ejemplos de proteínas incluyen hormonas, tal como la hormona del crecimiento o eritropoyetina (EPO), factores de crecimiento, tal como el factor del crecimiento epidérmico, sustancias analgésicas como encefalinas, enzimas como quimiotripsina, receptores de hormonas o factores de crecimiento, anticuerpos e incluyen también proteínas usadas generalmente como un marcador visualizador, por ejemplo la proteína verde fluorescente. The "gene of interest" or "transgene" preferably encodes a protein (structural or regulatory protein). As used herein "protein" generally refers to peptides and polypeptides that have more than about ten amino acids. Proteins can be "homologous" to the host (ie, endogenous to the host cell to be used) or "heterologous" (ie, foreign to the host cell to be used), such as a human protein produced by yeast. Protein can be produced as an insoluble aggregate or as a soluble protein in the periplasmic space or cytoplasm of the cell or in the extracellular medium.Examples of proteins include hormones, such as growth hormone or erythropoietin (EPO), growth factors, such such as epidermal growth factor, analgesic substances such as enkephalins, enzymes such as chymotrypsin, hormone receptors or growth factors, antibodies and also include pr Oteins generally used as a display marker, for example the green fluorescent protein.

Preferiblemente, la secuencia de DNA purificada comprende además al menos una segunda secuencia de nucleótidos de una región de fijación a la matriz (MAR) aislada seleccionada del grupo que comprende: Preferably, the purified DNA sequence further comprises at least a second nucleotide sequence of an isolated matrix binding region (MAR) selected from the group comprising:

--: la secuencia SEQ ID Nº 27, o una de sus secuencias complementarias, sequence SEQ ID No. 27, or one of its complementary sequences,

Las secuencias de nucleótidos de la región de fijación a la matriz (MAR) aisladas podrían ser idénticas o diferentes. Alternativamente, se usan una primera y una segunda secuencia de nucleótidos de MAR idénticas. The isolated matrix-binding region (MAR) nucleotide sequences could be identical or different. Alternatively, a first and a second identical MAR nucleotide sequence are used.

Preferiblemente, las secuencias de nucleótidos de MAR están situadas tanto en el extremo 5’ como en el 3’ de la secuencia que contiene el promotor y el gen de interés. Pero la invención también prevé el hecho de que dichas primera y/o al menos segunda secuencias de nucleótidos de MAR estén situadas en una secuencia distinta de la que contiene el promotor y el gen de interés. Preferably, the MAR nucleotide sequences are located at both the 5 'and 3' ends of the sequence containing the promoter and the gene of interest. But the invention also provides for the fact that said first and / or at least second MAR nucleotide sequences are located in a different sequence from that containing the promoter and the gene of interest.

Incluida en el alcance de la presente descripción se encuentra también la secuencia de DNA aislada y purificada que comprende una primera secuencia de nucleótidos de la región de fijación a la matriz (MAR) aislada que es una secuencia de nucleótidos de MAR seleccionada del grupo que comprende: Also included within the scope of this disclosure is the isolated and purified DNA sequence comprising a first isolated matrix binding region (MAR) nucleotide sequence which is a MAR nucleotide sequence selected from the group comprising :

- -: una secuencia de DNA aislada y purificada que tiene actividad que aumenta la producción de proteínas, an isolated and purified DNA sequence that has activity that increases protein production,

- -: una secuencia de DNA de MAR aislada y purificada identificable de acuerdo con el método para identificar una secuencia de MAR que usa la herramienta bioinformática descrita, el método combinado o el método que comprende al menos un filtro descritos, an identifiable isolated and purified MAR DNA sequence according to the method for identifying a MAR sequence using the described bioinformatics tool, the combined method or the method comprising at least one described filter,

--: las secuencias SEQ ID No 1 a 27, sequences SEQ ID No. 1 to 27,

--: un elemento y/o fragmento de cLysMAR aislado y purificado, an isolated and purified cLysMAR element and / or fragment,

--: una secuencia de MAR sintética que comprende elementos y/o fragmentos de MAR naturales ensamblados entre secuencias conectoras, a synthetic MAR sequence comprising elements and / or fragments of natural MAR assembled between connecting sequences,

una de sus secuencias complementarias, una de sus partes que comparten una longitud de nucleótidos de al menos el 70%, una de sus quimeras moleculares, una de sus combinaciones y variantes que se pueden usar para aumentar la actividad de producción de proteínas en una célula hospedante eucariótica introduciendo la secuencia de DNA aislada y purificada en una célula hospedante eucariótica de acuerdo con protocolos muy conocidos. Los métodos generalmente aplicados para introducir DNA en células hospedantes eucarióticas son, por ejemplo, introducción directa de DNA clonado por microinyección o bombardeo de micropartículas; electrotransferencia; uso de vectores virales; encapsulación en un sistema portador; y uso de reactivos de transfección, tales como fosfato de calcio, dietilaminoetilo (DEAE)-dextrano o sistemas de transfección comerciales como Lipofect-AMINE 2000 (Invitrogen). Preferiblemente, el método de transfección usado para introducir la secuencia de DNA purificada en una célula hospedante eucariótica es el método para transfectar una célula eucariótica como se describe a continuación. one of its complementary sequences, one of its parts that share a nucleotide length of at least 70%, one of its molecular chimeras, one of its combinations and variants that can be used to increase protein production activity in a cell eukaryotic host by introducing the isolated and purified DNA sequence into a eukaryotic host cell according to well-known protocols. The generally applied methods of introducing DNA into eukaryotic host cells are, for example, direct introduction of cloned DNA by microinjection or microparticle bombardment; electrotransfer; use of viral vectors; encapsulation in a carrier system; and use of transfection reagents, such as calcium phosphate, diethylaminoethyl (DEAE) -dextran, or commercial transfection systems such as Lipofect-AMINE 2000 (Invitrogen). Preferably, the transfection method used to introduce the purified DNA sequence into a eukaryotic host cell is the method of transfecting a eukaryotic cell as described below.

La secuencia de DNA aislada y purificada se puede usar en forma de un vector circular. Preferiblemente, la secuencia de DNA aislada y purificada se usa en forma de una secuencia de DNA lineal como vector. The isolated and purified DNA sequence can be used in the form of a circular vector. Preferably, the isolated and purified DNA sequence is used in the form of a linear DNA sequence as a vector.

Como se usa en la presente memoria, "plásmido" y "vector" son intercambiables, aunque plásmido es la forma de vector más comúnmente usada. Sin embargo, se entiende que la invención incluye otras formas de vectores de expresión, como por ejemplo, aunque sin limitación, vectores virales (por ejemplo, retrovirus defectuosos en la replicación, adenovirus y virus adeno-asociados), que realizan funciones equivalentes. As used herein, "plasmid" and "vector" are interchangeable, although plasmid is the most commonly used form of vector. However, the invention is understood to include other forms of expression vectors, such as, but not limited to, viral vectors (eg, replication-defective retroviruses, adenoviruses, and adeno-associated viruses), which perform equivalent functions.

La presente invención incluye además un método para la transfección de una célula hospedante eucariótica, comprendiendo dicho método: The present invention further includes a method for transfection of a eukaryotic host cell, said method comprising:

a) introducir en dicha célula hospedante eucariótica al menos una secuencia de DNA purificada que comprende al menos una secuencia de DNA que consiste en una secuencia de MAR de acuerdo con la invención, a) introducing into said eukaryotic host cell at least one purified DNA sequence comprising at least one DNA sequence consisting of a MAR sequence according to the invention,

b) someter en un tiempo definido dicha célula hospedante eucariótica a al menos una etapa de transfección adicional con al menos una secuencia de DNA purificada que comprende al menos una secuencia de DNA de interés y/o con al menos una secuencia de DNA aislada y purificada que comprende una secuencia de nucleótidos de MAR u otros elementos modificadores de la cromatina y b) subjecting in a defined time said eukaryotic host cell to at least one additional transfection step with at least one purified DNA sequence comprising at least one DNA sequence of interest and / or with at least one isolated and purified DNA sequence comprising a nucleotide sequence of MAR or other chromatin modifying elements and

c) seleccionar dicha célula hospedante eucariótica. c) selecting said eukaryotic host cell.

Preferiblemente, en la etapa b) se aplican al menos dos a cuatro etapas de transfección. Preferably, in step b) at least two to four transfection steps are applied.

Con el fin de seleccionar las células transfectadas con éxito, se introduce generalmente un gen que codifica un marcador seleccionable (por ejemplo, resistencia a antibióticos) en las células hospedantes junto con el gen de interés. El gen que codifica un marcador seleccionable podría estar situado en la secuencia de DNA purificada que comprende al menos una secuencia de DNA de interés y/o al menos una secuencia de DNA aislada y purificada que consiste en una secuencia de nucleótidos de MAR u otros elementos modificadores de la cromatina u opcionalmente podría ser introducido conjuntamente en forma separada, por ejemplo en un plásmido. Varios marcadores seleccionables incluyen los que confieren resistencia a fármacos, tales como G418, higromicina y metotrexato. La cantidad de fármaco se puede adaptar según se desee, con el fin de aumentar la productividad. In order to select successfully transfected cells, a gene encoding a selectable marker (eg, antibiotic resistance) is generally introduced into the host cells along with the gene of interest. The gene encoding a selectable marker could be located in the purified DNA sequence comprising at least one DNA sequence of interest and / or at least one isolated and purified DNA sequence consisting of a MAR nucleotide sequence or other elements Chromatin modifiers or optionally could be co-introduced separately, eg into a plasmid. Several selectable markers include those that confer drug resistance, such as G418, hygromycin, and methotrexate. The amount of drug can be adapted as desired, in order to increase productivity.

Generalmente, se usan uno o más marcadores seleccionables. Preferiblemente, los marcadores seleccionables usados en cada etapa de transfección distinta son diferentes. Esto permite seleccionar las células transformadas que son "multi-transformadas" usando, por ejemplo, dos selecciones de antibióticos diferentes. Generally, one or more selectable markers are used. Preferably, the selectable markers used in each different transfection step are different. This allows transformed cells to be selected that are "multi-transformed" using, for example, two different antibiotic selections.

Cualquier célula hospedante eucariótica capaz de producción de proteínas y que carezca de pared celular puede ser usada en los métodos de esta invención. Ejemplos de líneas de células hospedantes de mamíferos útiles incluyen células humanas, tales como la línea de células renales embrionarias humanas, células 293 o células 293 sub-clonadas para cultivo en suspensión, Graham et al., J. Gen Virol. 36, 59 (1977)), células de carcinoma cervical humano, tales como (HELA, ATCC CCL 2), células de pulmón humano (W138, ATCC CCL 75), células hepáticas humanas (Hep G2, HB 8065); células de roedores, tales como células de riñón de crías de hámster (BHK, ATCC CCL 10), células de ovario de hámster chino/-DHFR (CHO, Urlaub and Chasin, Proc. Nad. Acad. Sci. USA, 77, 4216 (1980)), células de tipo Sertoli de ratón (TM4, Mather, Biol. Reprod., 23, 243-251 (1980)), células de tumor mamario de ratón (MMT 060562, ATCC CCL 51); y células de otros mamíferos, tales como la línea CV1 de riñón de mono transformada por SV40 (COS-7, ATCC CRL 1651); células de riñón de mono (CV1, ATCC CCL 70); células de riñón de mono verde africano (VERO-76, ATCC CRL-1587); células de riñón canino (MDCK, ATCC CCL 34); células hepáticas de la rata búfalo (BRL 3A, ATCC CRL 1442); y células de mieloma (por ejemplo, NS0)/hibridoma. Any eukaryotic host cell capable of protein production and lacking a cell wall can be used in the methods of this invention. Examples of useful mammalian host cell lines include human cells, such as the human embryonic renal cell line, 293 cells, or 293 cells sub-cloned for suspension culture, Graham et al., J. Gen Virol. 36, 59 (1977)), human cervical carcinoma cells, such as (HELA, ATCC CCL 2), human lung cells (W138, ATCC CCL 75), human liver cells (Hep G2, HB 8065); rodent cells, such as hamster pup kidney cells (BHK, ATCC CCL 10), Chinese hamster / -DHFR ovary cells (CHO, Urlaub and Chasin, Proc. Nad. Acad. Sci. USA, 77, 4216 (1980)), mouse Sertoli type cells (TM4, Mather, Biol. Reprod., 23, 243-251 (1980)), mouse mammary tumor cells (MMT 060562, ATCC CCL 51); and cells from other mammals, such as the monkey kidney CV1 line transformed by SV40 (COS-7, ATCC CRL 1651); monkey kidney cells (CV1, ATCC CCL 70); African green monkey kidney cells (VERO-76, ATCC CRL-1587); canine kidney cells (MDCK, ATCC CCL 34); buffalo rat liver cells (BRL 3A, ATCC CRL 1442); and myeloma cells (eg, NS0) / hybridoma.

Preferiblemente, las células hospedantes eucarióticas transformadas seleccionadas son células altamente productoras de proteínas con una tasa de producción de al menos 10 pg por célula y por día. Preferably, the selected transformed eukaryotic host cells are highly protein-producing cells with a production rate of at least 10 pg per cell per day.

Las más preferidas para uso humano en la presente invención son las células de CHO. Most preferred for human use in the present invention are CHO cells.

La secuencia de DNA de interés de la secuencia de DNA aislada y purificada es usualmente un gen de interés que codifica preferiblemente una proteína unida operativamente a un promotor tal como se ha descrito antes. La secuencia de DNA aislada y purificada que comprende al menos una secuencia de DNA de interés podría comprender adicionalmente la secuencia de DNA de interés de la secuencia de nucleótidos de MAR u otros elementos modificadores de la cromatina. The DNA sequence of interest from the isolated and purified DNA sequence is usually a gene of interest that preferably encodes a protein operably linked to a promoter as described above. The isolated and purified DNA sequence comprising at least one DNA sequence of interest could further comprise the DNA sequence of interest of the MAR nucleotide sequence or other chromatin modifying elements.

La secuencia de DNA aislada y purificada que comprende una secuencia de nucleótidos de MAR se selecciona, por ejemplo, del grupo que comprende las secuencias SEQ ID No 1 a 27 y/o elementos particulares de cLysMAR, por ejemplo, las regiones B, K y F, así como fragmentos y elementos y sus combinaciones, como se ha descrito antes. Otros elementos modificadores de la cromatina son, por ejemplo, elementos de borde (BE), regiones de control de locus (LCR) y elementos ubicuos que abren la cromatina (UCOE) (véase Zahn-Zabal et al., ya citados). Un ejemplo de transfecciones múltiples de células hospedantes se muestra en el Ejemplo 12 (Tabla 3). La primera etapa transfectante (transfección primaria) se lleva a cabo con el gen de interés (SV40EGFP) solo, con una secuencia de nucleótidos de MAR sola o con el gen de interés y una secuencia de nucleótidos de MAR (MARSV40EGFP). La segunda etapa transfectante (transfección secundaria) se lleva a cabo con el gen de interés (SV40EGFP) solo, con una secuencia de nucleótidos de MAR sola o con el gen de interés y una secuencia de nucleótidos de MAR (MAR-SV40EGFP), en todas las combinaciones posibles resultantes de la primera etapa transfectante. The isolated and purified DNA sequence comprising a MAR nucleotide sequence is selected, for example, from the group comprising sequences SEQ ID No. 1 to 27 and / or particular elements of cLysMAR, for example, regions B, K and F, as well as fragments and elements and their combinations, as described above. Other chromatin modifying elements are, for example, border elements (BE), locus control regions (CSF), and ubiquitous chromatin-opening elements (UCOE) (see Zahn-Zabal et al., Already cited). An example of multiple host cell transfections is shown in Example 12 (Table 3). The first transfecting step (primary transfection) is performed with the gene of interest (SV40EGFP) alone, with a MAR nucleotide sequence alone, or with the gene of interest and a MAR nucleotide sequence (MARSV40EGFP). The second transfecting step (secondary transfection) is carried out with the gene of interest (SV40EGFP) alone, with a nucleotide sequence of MAR alone or with the gene of interest and a nucleotide sequence of MAR (MAR-SV40EGFP), in all possible combinations resulting from the first transfectant stage.

Preferiblemente, la célula hospedante eucariótica es transfectada: Preferably, the eukaryotic host cell is transfected:

a) introduciendo una secuencia de DNA purificada que comprende una secuencia de DNA de interés y adicionalmente una secuencia de nucleótidos de MAR, y a) introducing a purified DNA sequence comprising a DNA sequence of interest and additionally a MAR nucleotide sequence, and

b) sometiendo en un tiempo definido dicha célula hospedante eucariótica transfectada a al menos una etapa de b) subjecting in a defined time said transfected eukaryotic host cell to at least one step of

transfección adicional con la misma secuencia de DNA purificada que comprende una secuencia de DNA de further transfection with the same purified DNA sequence comprising a DNA sequence from

interés y adicionalmente una secuencia de nucleótidos de MAR de la etapa a). of interest and additionally a MAR nucleotide sequence from step a).

También preferiblemente, la secuencia de nucleótidos de MAR de la secuencia de DNA aislada y purificada se selecciona del grupo que comprende: Also preferably, the MAR nucleotide sequence of the isolated and purified DNA sequence is selected from the group comprising:

- -: una secuencia de DNA aislada y purificada de MAR identificable de acuerdo con el método de identificar una secuencia de MAR usando la herramienta bioinformática descrita, el método combinado o el método que comprende al menos un filtro, an isolated and purified DNA sequence identifiable from MAR according to the method of identifying a MAR sequence using the described bioinformatics tool, the combined method or the method comprising at least one filter,

--: las secuencias SEQ ID No 1 a 27, sequences SEQ ID No. 1 to 27,

--: una secuencia de MAR sintética que comprende un elemento de MAR natural y/o fragmentos ensamblados entre secuencias conectoras, a synthetic MAR sequence comprising a natural MAR element and / or fragments assembled between connecting sequences,

una de sus secuencias complementarias, una de sus partes que comparte al menos una longitud de nucleótidos del 70%, una de sus quimeras moleculares, una de sus combinaciones y variantes. one of its complementary sequences, one of its parts that shares at least a nucleotide length of 70%, one of its molecular chimeras, one of its combinations and variants.

Sorprendentemente, se ha observado una sinergia entre la primera y la segunda transfección. Se ha observado una sinergia particular cuando los elementos de las MAR están presentes en una o en ambas etapas de transfección. Se han llevado a cabo transfecciones múltiples de las células con pMAR sola o en combinación con diversos plásmidos de expresión, usando el método descrito antes. Por ejemplo, la Tabla 3 muestra que transfectar las células dos veces con el plásmido pMAR-SV40EGFP dio la mayor expresión de la GFP y el mayor grado de potenciación de todas las condiciones (4,3 veces). En contraste, transfectar dos veces el vector sin la MAR dio poca o ninguna potenciación, 2,8 veces, en lugar del aumento doble esperado. Esto demuestra que la presencia de los elementos de MAR en cada etapa de transfección es de particular interés para conseguir la máxima síntesis de proteínas. Surprisingly, a synergy has been observed between the first and second transfection. A particular synergy has been observed when the elements of the MAR are present in one or both stages of transfection. Multiple transfections of cells have been carried out with pMAR alone or in combination with various expression plasmids, using the method described above. For example, Table 3 shows that transfecting cells twice with the plasmid pMAR-SV40EGFP gave the highest expression of GFP and the highest degree of potentiation of all conditions (4.3 times). In contrast, transfecting the vector twice without the MAR gave little or no enhancement, 2.8 times, rather than the expected double increase. This demonstrates that the presence of the MAR elements at each transfection stage is of particular interest to achieve maximum protein synthesis.

Como ejemplo particular del método de transfección dicha secuencia de DNA purificada que comprende al menos una secuencia de DNA de interés puede ser introducida en la forma de múltiples plásmidos no enlazados, que comprende un gen de interés unido operativamente a un promotor, un gen marcador seleccionable y/o elementos que aumentan la producción de proteínas, tales como secuencias de MAR. As a particular example of the transfection method, said purified DNA sequence comprising at least one DNA sequence of interest can be introduced in the form of multiple unbound plasmids, comprising a gene of interest operably linked to a promoter, a selectable marker gene and / or elements that increase protein production, such as MAR sequences.

La relación entre la primera y las secuencias subsiguientes de DNA puede ser adaptada según se requiera para el uso de los tipos de células específicas y los expertos en la técnica la pueden obtener por experimentación habitual. The relationship between the former and subsequent DNA sequences can be tailored as required for the use of specific cell types and can be obtained by those skilled in the art by routine experimentation.

El tiempo definido para las transformaciones adicionales de las células transformadas primarias depende estrechamente del ciclo celular y de su duración. Usualmente, el tiempo definido corresponde a intervalos relacionados con el ciclo de división celular. The time defined for further transformations of the transformed primary cells closely depends on the cell cycle and its duration. Usually, the defined time corresponds to intervals related to the cell division cycle.

Por lo tanto, este tiempo preciso puede ser adaptado según se requiera para el uso de tipos de células específicas, y los expertos en la técnica lo pueden obtener por experimentación habitual. Therefore, this precise time can be adapted as required for the use of specific cell types, and can be obtained by those skilled in the art by routine experimentation.

Preferiblemente, el tiempo definido es el momento en el que la célula hospedante acaba de entrar en la misma fase de un segundo o posterior ciclo de división celular, preferiblemente el segundo ciclo. Preferably, the defined time is the time at which the host cell has just entered the same phase of a second or subsequent cycle of cell division, preferably the second cycle.

Este tiempo está comprendido usualmente entre 6 horas y 48 horas, preferiblemente entre 20 horas y 24 horas después del evento de transfección previo. This time is usually between 6 hours and 48 hours, preferably between 20 hours and 24 hours after the previous transfection event.

También esta abarcado por la presente invención un método para transfecfar una célula hospedante eucariótica, comprendiendo dicho método co-transfectar en dicha célula hospedante eucariótica al menos una primera secuencia de DNA aislada y purificada que comprende al menos una secuencia de DNA de interés y una segunda secuencia de DNA aislada y purificada que comprende al menos una secuencia de nucleótidos de MAR seleccionada del grupo que comprende: una secuencia de DNA aislada y purificada de acuerdo con la invención, la secuencia SEQ ID No 27 o una de sus secuencias complementarias. Also encompassed by the present invention is a method of transfecting a eukaryotic host cell, said method comprising co-transfecting into said eukaryotic host cell at least a first isolated and purified DNA sequence comprising at least one DNA sequence of interest and a second isolated and purified DNA sequence comprising at least one MAR nucleotide sequence selected from the group comprising: an isolated and purified DNA sequence according to the invention, the sequence SEQ ID No. 27 or one of its complementary sequences.

También está previsto un proceso para la producción de una proteína en donde una célula hospedante eucariótica es transfectada de acuerdo con los métodos de transfección definidos en la presente invención y se cultiva en un medio de cultivo en condiciones adecuadas para la expresión de la proteína. Dicha proteína se recupera finalmente de acuerdo con cualquier proceso de recuperación conocido por los expertos en la técnica. A process for the production of a protein is also provided where a eukaryotic host cell is transfected according to the transfection methods defined in the present invention and grown in a culture medium under conditions suitable for the expression of the protein. Said protein is finally recovered according to any recovery process known to those skilled in the art.

Como ejemplo se podría usar el siguiente proceso para la producción de proteínas. La célula hospedante eucariótica transfectada por el método de transfección de la presente invención se usa en un proceso para la producción de una proteína cultivando dicha célula en condiciones adecuadas para la expresión de dicha proteína y recuperando dicha proteína. Las condiciones de cultivo adecuadas son las comúnmente usadas para el cultivo in vitro de células eucarióticas como se ha descrito, por ejemplo, en el documento WO 96/39488. La proteína puede ser aislada del cultivo celular por técnicas de separación convencionales, tales como, por ejemplo, fraccionamiento en columnas de inmunoafinidad o de cambio iónico; precipitación; HPLC en fase inversa; cromatografía; cromatoenfoque; SDS-PAGE; filtración por gel. Un experto en la técnica apreciará que los métodos de purificación adecuados para el polipéptido de interés pueden requerir modificaciones para tener en cuenta los cambios en las características del polipéptido en la expresión en el cultivo de células recombinantes. As an example the following process could be used for protein production. The eukaryotic host cell transfected by the transfection method of the present invention is used in a process for the production of a protein by culturing said cell under conditions suitable for the expression of said protein and recovering said protein. Suitable culture conditions are those commonly used for in vitro culture of eukaryotic cells as described, for example, in WO 96/39488. The protein can be isolated from cell culture by conventional separation techniques, such as, for example, fractionation on immunoaffinity or ion exchange columns; precipitation; Reverse phase HPLC; chromatography; chromato focus; SDS-PAGE; gel filtration. One of skill in the art will appreciate that suitable purification methods for the polypeptide of interest may require modifications to account for changes in polypeptide characteristics in expression in recombinant cell culture.

La funcionalidad de las proteínas que se producen de acuerdo con esta invención se puede analizar por una variedad de métodos. Por ejemplo, la presencia de epítopos antigénicos y la capacidad de las proteínas para unir ligandos pueden determinarse por ensayos de transferencia Western, ensayos de clasificación de células fluorescentes, inmunoprecipitación, ensayos inmunoquímicos y/o ensayos de unión competitiva, así como cualquier otro ensayo que mida la actividad de unión específica. The functionality of the proteins that are produced according to this invention can be analyzed by a variety of methods. For example, the presence of antigenic epitopes and the ability of proteins to bind ligands can be determined by Western blot assays, fluorescent cell sorting assays, immunoprecipitation, immunochemical assays, and / or competitive binding assays, as well as any other assay that measure specific binding activity.

Las proteínas de esta invención se pueden usar en cierto número de aplicaciones prácticas que incluyen, pero sin limitación: The proteins of this invention can be used in a number of practical applications including, but not limited to:

1. one.: Inmunización con antígeno de proteína hospedante recombinante como antagonista de virus/agentes patógenos. Immunization with recombinant host protein antigen as a virus / pathogen antagonist.

2. 2.: Producción de proteínas de membrana para ensayos de diagnóstico o de cribado. Production of membrane proteins for diagnostic or screening tests.

3. 3.: Producción de proteínas de membrana para estudios bioquímicos. Membrane protein production for biochemical studies.

4. Four.: Producción de proteínas de membrana para estudios estructurales. Production of membrane proteins for structural studies.

5. 5.: Producción de antígenos para la generación de anticuerpos para cartografiado inmuno-histoquímico, incluyendo cartografiado de receptores huérfanos y canales iónicos. Antigen production for the generation of antibodies for immuno-histochemical mapping, including mapping of orphan receptors and ion channels.

La presente invención también proporciona una célula eucariótica hospedante transfectada de acuerdo con los métodos de transfección precedentes. Preferiblemente, la célula eucariótica hospedante es una línea celular hospedante no humana. The present invention also provides a host eukaryotic cell transfected according to the preceding transfection methods. Preferably, the host eukaryotic cell is a non-human host cell line.

Como ya se ha descrito, los ejemplos de líneas celulares eucarióticas hospedantes de mamíferos útiles incluyen células humanas, tales como línea de células renales embrionarias humanas (células 293 o células 293 subclonadas para cultivo en suspensión, Graham et al., J. Gen Virol. 36, 59 (1977)), células de carcinoma cervical humano, tales como (HELA, ATCC CCL 2), células de pulmón humano (W138, ATCC CCL 75), células hepáticas humanas (Hep G2, HB 8065); células de roedores, tales como células de riñón de cría de hámster (BHK, ATCC CCL 10), células de ovario de hámster chino/-DHFR (CHO, Urlaub and Chasin, Proc. Nad. Acad. Sci. USA, 77, 4216 (1980)), células de tipo Sertoli de ratón (TM4, Mather, Biol. Reprod., 23, 243-251 (1980)), células de tumor mamario de ratón (MMT 060562, ATCC CCL 51); y células de otros mamíferos, tales como la línea CV1 de riñón de mono transformada por SV40 (COS-7, ATCC CRL 1651); células de riñón de mono (CV1 ATCC CCL 70); células de riñón de mono verde africano (VERO-76, ATCC CRL-1587); células de riñón canino (MDCK, ATCC CCL 34); células hepáticas de la rata búfalo (BRL 3A, ATCC CRL 1442); y células de mieloma (por ejemplo, NS0)/hibridoma. As already described, examples of useful mammalian host eukaryotic cell lines include human cells, such as human embryonic renal cell line (293 cells or 293 cells subcloned for suspension culture, Graham et al., J. Gen Virol. 36, 59 (1977)), human cervical carcinoma cells, such as (HELA, ATCC CCL 2), human lung cells (W138, ATCC CCL 75), human liver cells (Hep G2, HB 8065); rodent cells, such as baby hamster kidney cells (BHK, ATCC CCL 10), Chinese hamster / -DHFR ovary cells (CHO, Urlaub and Chasin, Proc. Nad. Acad. Sci. USA, 77, 4216 (1980)), mouse Sertoli type cells (TM4, Mather, Biol. Reprod., 23, 243-251 (1980)), mouse mammary tumor cells (MMT 060562, ATCC CCL 51); and cells from other mammals, such as the monkey kidney CV1 line transformed by SV40 (COS-7, ATCC CRL 1651); monkey kidney cells (CV1 ATCC CCL 70); African green monkey kidney cells (VERO-76, ATCC CRL-1587); canine kidney cells (MDCK, ATCC CCL 34); buffalo rat liver cells (BRL 3A, ATCC CRL 1442); and myeloma cells (eg, NS0) / hybridoma.

Las más preferidas para usos en la presente invención son las células de ovario de hámster chino (CHO). Most preferred for uses in the present invention are Chinese Hamster Ovary (CHO) cells.

La presente invención también proporciona una mezcla o kit para transfección de células que comprende al menos una secuencia aislada y purificada de DNA de acuerdo con la invención. The present invention also provides a mixture or kit for cell transfection comprising at least one isolated and purified DNA sequence according to the invention.

La invención comprende además un organismo no humano transgénico caracterizado porque al menos algunas de sus células han incorporado establemente al menos una secuencia de DNA de acuerdo con la invención. The invention further comprises a transgenic non-human organism characterized in that at least some of its cells have stably incorporated at least one DNA sequence according to the invention.

Preferiblemente, algunas de las células de estos organismos transgénicos han sido transfectadas de acuerdo con los métodos descritos en la presente memoria. Preferably some of the cells of these transgenic organisms have been transfected according to the methods described herein.

También se considera en la presente invención un organismo transgénico no humano caracterizado porque su genoma ha incorporado establemente al menos una secuencia de DNA de acuerdo con la invención. A transgenic non-human organism characterized in that its genome has stably incorporated at least one DNA sequence according to the invention is also considered in the present invention.

Los organismos eucarióticos transgénicos que pueden ser útiles para la presente invención se seleccionan por ejemplo del grupo que comprende mamíferos (mono, ratón, etc.) y en particular animales de laboratorio, tales como roedores en general, insectos (Drosophila, etc.), peces (pez cebra, etc.), anfibios (rana, tritón, etc.) y otros organismos más sencillos, tales como el gusano C. elegans, levadura, etc.... Transgenic eukaryotic organisms that may be useful for the present invention are selected for example from the group comprising mammals (monkey, mouse, etc.) and in particular laboratory animals, such as rodents in general, insects (Drosophila, etc.), fish (zebrafish, etc.), amphibians (frog, newt, etc.) and other simpler organisms, such as the C. elegans worm, yeast, etc ...

Es incluso otro objeto de la presente descripción proporcionar un medio legible por ordenador que comprende instrucciones ejecutables en ordenador para realizar el método de identificación de una secuencia de MAR como se ha descrito en la presente descripción. It is still another object of the present disclosure to provide a computer readable medium comprising computer executable instructions for performing the method of identifying a MAR sequence as described in the present disclosure.

La descripción anterior se comprenderá más completamente con referencia a los siguientes Ejemplos. Sin embargo, dichos Ejemplos son ilustrativos de métodos de llevar a la práctica la presente invención y no están destinados a limitar su alcance. The foregoing description will be more fully understood with reference to the following Examples. However, such Examples are illustrative of methods of practicing the present invention and are not intended to limit its scope.

EJEMPLOS EXAMPLES

Example 1: SMAR Scan® program and MAR sequences

Se realizó una primera evaluación aproximada con el programa informático SMAR Scan® analizando las MAR humanas experimentalmente definidas de MAR y las secuencias que no son de MAR. Como secuencias de MAR, se usaron los resultados previos del análisis de MAR humanas procedentes de la SMARt DB para representar gráficamente un histograma de densidades para cada criterio, como se muestra en la Fig. 1. Similarmente, también se analizaron y representaron gráficamente las secuencias que no son de MAR. Como secuencias que no son de MAR se usaron todos los cóntigos (clones contiguos) de RefSeq procedentes del cromosoma 22, considerando que este último era suficientemente grande para contener una parte despreciable de secuencias de MAR respecto a la parte de secuencias que no son de MAR. A first rough evaluation was performed with the SMAR Scan® software, analyzing experimentally defined human MARs of MAR and non-MAR sequences. As MAR sequences, the previous results of the analysis of human MAR from the SMARt DB were used to graphically represent a histogram of densities for each criterion, as shown in Fig. 1. Similarly, the sequences were also analyzed and graphically represented. that are not from MAR. As non-MAR sequences, all RefSeq contigs (contiguous clones) from chromosome 22 were used, considering that the latter was large enough to contain a negligible part of MAR sequences compared to the part of non-MAR sequences .

Las distribuciones de densidades mostradas en la Fig. 1 están todas sesgadas con una cola larga. Para la máxima curvatura, la máxima profundidad de la ranura mayor y la máxima anchura de la ranura menor, las distribuciones están sesgadas hacia la derecha. Para la mínima temperatura de fusión, las distribuciones están sesgadas hacia la izquierda lo que es natural dada la correspondencia inversa de este criterio respecto a los otros tres. Para las secuencias de MAR son realmente evidentes distribuciones bifásicas con un segundo pico débil. Y entre las distribuciones de secuencias de MAR y de secuencias que no son de MAR, es también visible en cada gráfica un claro desplazamiento. The density distributions shown in Fig. 1 are all skewed with a long tail. For maximum curvature, maximum depth of major groove, and maximum width of minor groove, distributions are skewed to the right. For the minimum melting temperature, the distributions are skewed to the left, which is natural given the inverse correspondence of this criterion with the other three. For MAR sequences, biphasic distributions with a second weak peak are really evident. And between the distributions of MAR sequences and non-MAR sequences, a clear shift is also visible on each graph.

Entre todas las secuencias de MAR humanas usadas, por término medio solo aproximadamente 70% de ellas tiene un valor mayor que el cuantil 75 de distribución de las MAR humanas, y esto para los cuatro diferentes criterios. Similarmente, en relación con el segundo pico débil de cada distribución de MAR humanas, solamente el 15% de las secuencias de MAR humanas son responsables de estos valores periféricos. Entre este 15% de secuencias de MAR humanas, la mayoría son secuencias de MAR muy bien documentadas, usadas para aislar un transgén de los efectos de posición, tales como la MAR del locus de interferón, la MAR del locus de beta-globina (Ramezani A, Hawley TS, Hawley RG, "Performance-and safety-enhanced lentiviral vectors containing the human interferon-beta scaffold attachment region and the chicken beta-globin insulator", Blood, 101: 4717-4724, 2003), o la MAR de apolipoproteína (Namciu, S, Blochinger KB, Foumier REK, "Human matrix attachment regions insulate transgene expression from chromosomal position effects in Drosophila melanogaster", Mol. Cell Biol., 18:2382-2391, 1998). Among all the human MAR sequences used, on average only about 70% of them have a higher value than the 75th quantile of distribution of human MARs, and this for the four different criteria. Similarly, relative to the second weak peak of each human MAR distribution, only 15% of human MAR sequences are responsible for these peripheral values. Among this 15% of human MAR sequences, the majority are very well documented MAR sequences, used to isolate a transgene from positional effects, such as MAR of the interferon locus, MAR of the beta-globin locus (Ramezani A, Hawley TS, Hawley RG, "Performance-and safety-enhanced lentiviral vectors containing the human interferon-beta scaffold attachment region and the chicken beta-globin insulator", Blood, 101: 4717-4724, 2003), or the MAR of apolipoprotein (Namciu, S, Blochinger KB, Foumier REK, "Human matrix attachment regions insulate transgene expression from chromosomal position effects in Drosophila melanogaster", Mol. Cell Biol., 18: 2382-2391, 1998).

Siempre con los mismos datos, las secuencias de MAR humanas también se usaron para determinar la asociación entre las cuatro propiedades estructurales teóricas calculadas y el contenido de AT. La Fig. 2 representa el diagrama de dispersión y el coeficiente de correlación correspondiente r para cada par de criterios. Always with the same data, human MAR sequences were also used to determine the association between the four calculated theoretical structural properties and the AT content. Fig. 2 represents the scatterplot and the corresponding correlation coefficient r for each pair of criteria.

Ejemplo 2: Gráficas de distribución de secuencias de MAR por organismo Example 2: MAR Sequence Distribution Charts by Organism

Como se ha explicado previamente también se recuperaron y analizaron similarmente secuencias de MAR de la SMARt DB de otros organismos. Las distribuciones de densidades de secuencias de MAR para el ratón, el pollo, el sorgo bicolor y el hombre se representan gráfica y conjuntamente en la Fig. 3. As previously explained, MAR sequences from the SMARt DB from other organisms were also recovered and similarly analyzed. The MAR sequence density distributions for mouse, chicken, bicolor sorghum and man are plotted and plotted in Fig. 3.

Ejemplo 3: Predicción de las MAR del cromosoma 22 completo Example 3: Prediction of the MAR of the complete chromosome 22

Todos los cóntigos de RefSeq del cromosoma 22 fueron analizados por el programa SMAR Scan® usando esta vez los ajustes predeterminados. El resultado es que el programa SMAR Scan® predijo un total de 803 MAR, siendo su longitud media 446 pb, lo que significa una media de una MAR predicha por 42.777 pb. La longitud total de las MAR predichas corresponde al 1% de la longitud del cromosoma 22. El contenido de AT de las regiones predichas variaba desde 65,1% a 93,3%; siendo el contenido medio de AT de todas estas regiones 73,5%. Por tanto, las MAR predichas eran ricas en AT, mientras que el cromosoma 22 no es rico en AT (52,1% de AT). All RefSeq contigs on chromosome 22 were analyzed by the SMAR Scan® program this time using the default settings. The result is that the SMAR Scan® program predicted a total of 803 MAR, with an average length of 446 bp, which means an average of a predicted MAR of 42,777 bp. The total length of the predicted MARs corresponds to 1% of the length of chromosome 22. The AT content of the predicted regions ranged from 65.1% to 93.3%; the mean AT content of all these regions being 73.5%. Therefore, the predicted MARs were rich in AT, while chromosome 22 is not rich in AT (52.1% AT).

Se usó también el programa SMARTest para analizar el cromosoma 22 completo y se obtuvieron 1387 candidatas de MAR, siendo su longitud media 494 pb, lo que representa una media de una MAR predicha por 4.765 pb. La longitud total de las MAR predichas corresponde al 2% del cromosoma 22. Entre todas las MAR predichas por los dos programas informáticos, fueron encontradas por ambos programas 154 MAR predichas, lo que representa respectivamente 19% y 11% de las MAR predichas por los programas SMAR Scan® y SMARTest. Dada la longitud media de las MAR predichas por los programas SMAR Scan® y SMARTest, la probabilidad de tener por azar un solapamiento entre las predicciones de los programas SMAR Scan® y SMARTest es 0,0027% por predicción. The SMARTest program was also used to analyze the complete chromosome 22 and 1387 candidates for MAR were obtained, with an average length of 494 bp, which represents an average of a MAR predicted by 4,765 bp. The total length of the predicted MARs corresponds to 2% of chromosome 22. Among all the MARs predicted by the two computer programs, 154 predicted MARs were found by both programs, representing respectively 19% and 11% of the MARs predicted by the SMAR Scan® and SMARTest programs. Given the mean length of the MARs predicted by the SMAR Scan® and SMARTest programs, the probability of having an overlap by chance between the predictions of the SMAR Scan® and SMARTest programs is 0.0027% per prediction.

Para evaluar la especificidad de las predicciones por el programa SMAR Scan®, se realizaron análisis por el programa SMAR Scan® en secuencias barajadas al azar del cromosoma 22 (Fig. 4). Las secuencias barajadas fueron generadas usando 4 métodos diferentes: por una segmentación del cromosoma 22 en ventanas no solapantes de 10 pb y barajando separadamente los nucleótidos de cada ventana; por "scrambling" que significa una permutación de todos los nucleótidos del cromosoma; por "rubbling" que significa una segmentación del cromosoma en fragmentos de 10 pb y un ensamblaje aleatorio de estos fragmentos, y finalmente por cadenas de Markov de orden 1, siendo los diferentes estados la totalidad de los diferentes dinucleótidos de DNA y basándose basadas las probabilidades de transición entre estos estados en el escaneo del cromosoma 22. Para cada método de barajamiento, fueron generados y analizados por el programa SMAR Scan®, usando los ajustes predeterminados, cinco cromosomas 22 barajados. En relación con el número de coincidencias se encontró una media de 3.519.170 coincidencias (desviación típica: 18.353) para el cromosoma 22 permutado dentro de las ventanas no solapantes de 10 pb, 171.936,4 coincidencias (desviación típica: 2.859,04) para las secuencias sometidas a “scambling” y 24.708,2 coincidencias (desviación típica: 1.191,59) para el cromosoma 22 sometido a “rubbling” y 2.282 coincidencias de media (desviación típica: 334,7) para los cromosomas generados de acuerdo con los modelos de cadenas de Markov de orden 1 del cromosoma 22, lo cual representa respectivamente 185% (desviación típica: 0,5% de la media), 9% (desviación típica: 1,5%), 1% (desviación típica: 5%) y 0,1% (desviación típica: 15%) del número de coincidencias encontrado con el cromosoma 22 natural. Para el número de MAR predichas, que por tanto significa coincidencias contiguas de longitud mayor que 300 pb, fueron predichas 1.997 MAR con el cromosoma 22 barajado dentro de las ventanas de 10 pb (desviación típica: 31.,2), y se encontraron solamente 2,4 MAR candidatas en secuencias sometidas a “scrambling” (desviación típica: 0,96) y ninguna para las secuencias sometidas a “rubbling” y para las secuencias generadas de acuerdo con el modelo de cadenas de Markov, que representa respectivamente 249% y menos de 0,3% del número de MAR predichas encontradas con el cromosoma 22 natural. Estos datos proporcionan indicaciones de que el programa SMAR Scan@ detecta elementos de DNA específicos cuya organización se pierde cuando se barajan las secuencias de DNA. To assess the specificity of the predictions by the SMAR Scan® program, analyzes were performed by the SMAR Scan® program on randomly shuffled sequences of chromosome 22 (Fig. 4). Shuffled sequences were generated using 4 different methods: by cleavage of chromosome 22 into 10 bp non-overlapping windows and shuffling the nucleotides in each window separately; for "scrambling" which means a permutation of all nucleotides on the chromosome; by "rubbling" which means a segmentation of the chromosome into fragments of 10 bp and a random assembly of these fragments, and finally by Markov chains of order 1, the different states being the totality of the different DNA dinucleotides and based on probabilities Transition between these states on chromosome 22 scanning. For each shuffling method, five shuffled 22 chromosomes were generated and analyzed by the SMAR Scan® program. Regarding the number of matches, an average of 3,519,170 matches (standard deviation: 18,353) were found for chromosome 22 permuted within the non-overlapping windows of 10 bp, 171,936.4 matches (standard deviation: 2,859.04) for the sequences subjected to scambling and 24,708.2 matches (standard deviation: 1,191.59) for chromosome 22 subjected to rubbling and 2,282 mean matches (standard deviation: 334.7) for the chromosomes generated according to the Markov chain models of order 1 of chromosome 22, which represents respectively 185% (standard deviation: 0.5% of the mean), 9% (standard deviation: 1.5%), 1% (standard deviation: 5 %) and 0.1% (standard deviation: 15%) of the number of matches found with natural chromosome 22. For the number of predicted MARs, which therefore means contiguous coincidences of length greater than 300 bp, 1,997 MARs with chromosome 22 shuffled within the 10 bp windows were predicted (standard deviation: 31., 2), and were found only 2.4 MAR candidates in sequences subjected to scrambling (standard deviation: 0.96) and none for sequences subjected to rubbling and for sequences generated according to the Markov chain model, which represents respectively 249% and less than 0.3% of the number of predicted MARs found with the natural chromosome 22. These data provide indications that the SMAR Scan @ program detects specific DNA elements whose organization is lost when shuffling DNA sequences.

Ejemplo 4: Análisis de regiones conocidas de fijación a la matriz en el locus del interferón con el programa SMAR Scan® Example 4: Analysis of known matrix binding regions at the interferon locus with the SMAR Scan® program

Se investigó la relevancia de la predicción de las MAR por el programa SMAR Scan® analizando las MAR recientemente publicadas del agrupación de genes del interferón humano en el brazo corto del cromosoma 9 (9p22). Goetze et al., (ya citados) describieron un análisis exhaustivo del locus WP18A10A7 para analizar la correlación sospechada entre las BUR (denominadas en este caso desestabilización de dúplex inducida por estrés o SIDD) y la unión in vitro a la matriz nuclear (Fig. 9, parte inferior). Tres de los picos de SIDD estaban de acuerdo con el ensayo de unión in vitro, mientras que otros no coincidían con los sitios de unión a la matriz. La inspección del locus del interferón con el programa SMAR Scan® (Fig. 9, parte superior) indicó que tres picos principales acompañados por agrupaciones de sitios de unión a los reguladores SATB1, NMP4 y MEF2 estaban bien correlacionados con las MAR activas. Por tanto, los inventores llegaron a la conclusión de que la existencia de los CUE predichos y de los sitios de unión para estos factores de transcripción no está restringida a las cLysMAR, sino que puede ser una propiedad general de todas las MAR. Estos resultados también implican que el programa SMAR Scan® detecta eficientemente elementos de MAR procedentes de secuencias genómicas. The relevance of MAR prediction by the SMAR Scan® program was investigated by analyzing recently published MARs from the human interferon gene cluster on the short arm of chromosome 9 (9p22). Goetze et al. (Already cited) described a comprehensive analysis of the WP18A10A7 locus to analyze the suspected correlation between BURs (referred to in this case as stress-induced duplex destabilization or SIDD) and in vitro binding to the nuclear matrix (Fig. 9, bottom). Three of the SIDD peaks were in agreement with the in vitro binding assay, while others did not match the matrix binding sites. Inspection of the interferon locus with the SMAR Scan® program (Fig. 9, top) indicated that three major peaks accompanied by clusters of regulatory binding sites SATB1, NMP4 and MEF2 were well correlated with active MARs. Therefore, the inventors concluded that the existence of predicted CUEs and binding sites for these transcription factors is not restricted to cLysMARs, but may be a general property of all MARs. These results also imply that the SMAR Scan® program efficiently detects MAR elements from genomic sequences.

Ejemplo 5: Precisión de la predicción por el programa SMAR Scan® y comparación con otras herramientas de predicción Example 5: Prediction accuracy by SMAR Scan® program and comparison with other prediction tools

Se evaluó la precisión del programa SMAR Scan® usando seis secuencias genómicas para las cuales se habían cartografiado unas MAR experimentalmente determinadas. Con el fin de realizar una comparación con otras 5 herramientas de predicción, las secuencias analizadas son las mismas que las secuencias usadas previamente para comparar los programas MAR-Finder y SMARTest. Estas secuencias genómicas son tres secuencias de vegetales y tres secuencias humanas (Tabla 1) que totalizan 310.151 pb y 37 MAR experimentalmente definidas. Los resultados de los programas SMARTest y MAR-Finder de la Tabla 1 proceden de una comparación previa (Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold/matrix attachment regions in large The accuracy of the SMAR Scan® program was evaluated using six genomic sequences for which experimentally determined MARs had been mapped. In order to make a comparison with 5 other prediction tools, the sequences analyzed are the same as the sequences previously used to compare the MAR-Finder and SMARTest programs. These genomic sequences are three plant sequences and three human sequences (Table 1) totaling 310,151 bp and 37 MAR experimentally defined. The results of the SMARTest and MAR-Finder programs in Table 1 come from a previous comparison (Frisch M, Frech K, Klingenhoff A, Cartharius K, Liebich I and Werner T, "In silico prediction of scaffold / matrix attachment regions in large

10 genomic sequences", Genome Research, 12:349-354, 2001). El programa MAR-Finder se ha usado con los parámetros predeterminados excepto para el valor umbral que se ha fijado en 0,4 y para el análisis del locus de protamina, ha sido excluida la regla de la riqueza en AT (para detectar las MAR no ricas en AT como se hizo para el locus de la protamina). 10 genomic sequences ", Genome Research, 12: 349-354, 2001). The MAR-Finder program has been used with the default parameters except for the threshold value that is set at 0.4 and for the protamine locus analysis , the rule of AT richness has been excluded (to detect MARs not rich in AT as was done for the protamine locus).

Tabla 1: Evaluación de la precisión del programa SMAR Scan® Table 1: SMAR Scan® Program Accuracy Assessment

Descripción y referencia de las secuencias Description and reference of the sequences: Longitud (kb) Posiciones de MAR experimentalmente definidas (kb) Posiciones predichas por SMARTest (kb) Posiciones predichas por MAR-Finder (kb) Posiciones predichas por SMAR Scan (kb) Length (kb) Experimentally defined MAR positions (kb) SMARTest Predicted Positions (kb) MAR-Finder Predicted Positions (kb) SMAR Scan Predicted Positions (kb)

Gen SH2 supuesto de la sub-unidad de SH2 gene assumption of the sub-unit: 30,034 0,0-1,2 - - - 30,034 0.0-1.2 - - -

ADP-glusosapirofosforilasa y gen supuesto de reductasa A1 dependiente de ADP-glusosapirofosphorylase and putative A1 reductase dependent gene: 5,4-7,4 6,5-7,0 152-15,7 162-16,6 -15,7-15,9 - -15,6-16 - 5.4-7.4 6.5-7.0 152-15.7 162-16.6 -15.7-15.9 - -15.6-16 -

NADPH de Oryza Sativa NADPH by Oryza Sativa: 17,3-18,5 17,6-18,3 17,5-18,4 17,6-18,2 17.3-18.5 17.6-18.3 17.5-18.4 17.6-18.2

(U700541) [4] (U700541) [4]: 20,0-23,1 19,6-20,1 20,1-21,3 23,6-23,9 26,0-25,4 27,5-27,9 19,8-20,4 21,3-21,5 23,9-24,2 24,7-25,1 - 21,6-22 -23,4-23,8 -- 20.0-23.1 19.6-20.1 20.1-21.3 23.6-23.9 26.0-25.4 27.5-27.9 19.8-20.4 21.3-21.5 23.9-24.2 24.7-25.1 - 21.6-22 -23.4-23.8 -

Genes SH2 de la subunidad de ADPADP Subunit SH2 Genes: 42,446 0,0-1,6 - - - 42,446 0.0-1.6 - - -

glucosapirofosforilasa y de reductasa A1-b dependiente glucosapirofosforilasa and reductasa dependent A1-b: 7,1-9,7 -21,3-21,9 -- 7,4-7,7 21,5-21,8 7.1-9.7 -21.3-21.9 - 7.4-7.7 21.5-21.8

de NADPH del sorgo bicolor (AF010283) [4] NADPH of sorghum bicolor (AF010283) [4]: 22,4-24,7 22,9-24,0 -27,3-27,6 23,2-24,2 -26,9-27,6 22,9-23,2 23,6-24,0 27,3-27,6 22.4-24.7 22.9-24.0 -27.3-27.6 23.2-24.2 -26.9-27.6 22.9-23.2 23.6-24.0 27.3-27.6

32,5-33,7 32.5-33.7: - - 33,4-33,9 - - 33.4-33.9

41,6-42,3 41.6-42.3: - - - - - -

Clon 110K5 del Clone 110K5: 78,195 ~0,9 - - - 78,195 ~ 0.9 - - -

BAC del BAC of

sorgo bicolorbicolor sorghum: ~5,8 - - - ~ 5.8 - - -

(AF124045) [37] (AF124045) [37]: ~6,3 - - - ~ 6.3 - - -

~9,3 ~ 9.3: - - - - - -

~15,0 ~ 15.0: 15,1-15,8 - - 15.1-15.8 - -

~18,5 ~ 18.5: - - - - - -

~21,9 ~ 21.9: 29,7-22,0 - 21,4-21,9 29.7-22.0 - 21.4-21.9

~23,3 ~ 23.3: - - - - - -

~25,6 ~ 25.6: - - - - - -

~29,1 ~ 29.1: - - 29,2-29,5 - - 29.2-29.5

~34,6 ~ 34.6: - - - - - -

Tabla 1 (Continuación) Table 1 (Continuation)

--
--: 39,0-40,0 39.0-40.0

~44,1 ~ 44.1: 44,1-44,5 - 44.1-44.5 -

~48,5 ~ 48.5: 47,9-49,5 - 47,9-49,4 - 48,1-48,6 48,8-49,3 47.9-49.5 - 47.9-49.4 - 48.1-48.6 48.8-49.3

~57,9 ~ 57.9: - - - - - -

~62,9 ~ 62.9: 63,1-63,7 - - 63.1-63.7 - -

~67,1 ~ 67.1: - - - - - -

~69,3 ~ 69.3: - - - - - -

~73,7 ~ 73.7: 74,3-74,7 - 74,3-74,6 74.3-74.7 - 74.3-74.6

Región intergénica de alfa-1-antitripsina Alpha-1-antitrypsin intergenic region: 30,461 2,6-6,3 5,5-6,0 3,0-3,2 5,4-5,8 30,461 2.6-6.3 5.5-6.0 3.0-3.2 5.4-5.8

humana y globulina de unión a human and globulin binding to: - 5,1-6,0 - - 5.1-6.0 -

corticosteroides corticosteroids: 22,0-30,4 26,7-2,2 24,9-25,3 25,8-26,4 22.0-30.4 26.7-2.2 24.9-25.3 25.8-26.4

(AF156545), [35] (AF156545), [35]: 27,5-27,8 25,5-25,8 27.5-27.8 25.5-25.8

--: 26,2-26,4 26.2-26.4
--

--: 27,5-29,2 27.5-29.2
--

Locus de la protamina Protamine locus: 53,060 8,8-9,7 - 8,0-8,9 - 53,060 8.8-9.7 - 8.0-8.9 -

humana human

(U15422) [24] (U15422) [24]: 32,6-33,6 - 33,9-34,8* - 32.6-33.6 - 33.9-34.8 * -

37,2-39,4 37.2-39.4: - 33,9-34,8* - - 33.9-34.8 * -

51,8-53,0 51.8-53.0: - -* - - - * -

Locus de la beta-globina humana Human beta-globin locus: 75,955 1,5-3,0 - - 2,3-2,6 75,955 1.5-3.0 - - 2.3-2.6

(U01317), [21] (U01317), [21]: 15,6-19,0 18,0-18,4 -34,4-34,9 15,5-16,0 18,0-18,4 - 15,3-15,6 -- 15.6-19.0 18.0-18.4 -34.4-34.9 15.5-16.0 18.0-18.4 - 15.3-15.6 -

44,7-52,7 44.7-52.7: - 50,6-50,8 - - 50.6-50.8 -

60,0-70,0 60.0-70.0: 55,6-57,1 59,8-60,3 65,6-66,0 67,6-67,9 68,8-69,1 56,5-57,2 58,1-58,5 63,0-63,6 69,7-69,3 - -62,5-63,1 -66,3-66,7 - 55.6-57.1 59.8-60.3 65.6-66.0 67.6-67.9 68.8-69.1 56.5-57.2 58.1-58.5 63.0-63.6 69.7-69.3 - -62.5-63.1 -66.3-66.7 -

Suma (kb) Sum (kb): 310,151 al menos 56,1 14,5 13,8 9,5 310,151 at least 56.1 14.5 13.8 9.5

Números totales: Total numbers:: 37 28 25 22 37 28 25 22

Kb media/MAR predichas Average kb / MAR predicted: 11,076 12,406 14,097 11,076 12,406 14,097

Positivas verdaderas [número de MAR experimentalmente definidas encontradas] True positives [number of experimentally defined MARs found]: 19[14] 20[12] 17[14] 19 [14] 20 [12] 17 [14]

positivas falsas false positives: 9 5 5 9 5 5

negativas falsas false negatives: 23 25 23 2. 3 25 2. 3

Especificidad Specificity: 19/28 = 68% 20/25 = 80% 17/22= 77% 19/28 = 68% 20/25 = 80% 17/22 = 77%

SensibilidadSensitivity: 14/37 = 38% 12/37 = 32% 14/37 = 38% 14/37 = 38% 12/37 = 32% 14/37 = 38%

Se analizaron con los programas MAR-Finder, SMARTest y SMAR Scan® seis secuencias genómicas diferentes, tres secuencias de vegetales y tres humanas, para las cuales se conocen MAR experimentalmente definidas. Las coincidencias positivas verdaderas aparecen en la tabla anterior en números en negrita, el signo menos (-) indica 5 coincidencias negativas falsas. Algunas de las MAR experimentalmente definidas más largas contenían más de una predicción in silico (es decir, realizada por el programa), cada una de ellas fue contada como coincidencia positiva verdadera. Por tanto, el número de predicciones verdaderas in silico es superior al número encontrado de MAR experimentalmente definidas. La especificidad se define como la relación entre las predicciones positivas verdaderas y el número total, mientras que la sensibilidad se define como la relación entre las MAR experimentalmente definidas Six different genomic sequences, three vegetable and three human sequences, for which experimentally defined MARs are known, were analyzed with the MAR-Finder, SMARTest and SMAR Scan® programs. True positive matches appear in the table above in bold numbers, the minus sign (-) indicates 5 false negative matches. Some of the longest experimentally defined MARs contained more than one in silico prediction (that is, made by the program), each of which was counted as a true positive match. Therefore, the number of true predictions in silico is greater than the number of experimentally defined MARs found. Specificity is defined as the ratio of true positive predictions to total number, while sensitivity is defined as the ratio of experimentally defined ADRs.

10 encontradas y el número total. *La regla de riqueza en AT excluyó el uso del programa MAR-Finder. 10 found and the total number. * The wealth rule in AT excluded the use of the MAR-Finder program.

El programa SMARTest predijo 28 regiones como MAR, 19 (positivas verdaderas) de estas están correlacionadas con las MAR experimentalmente definidas (especificidad: 68%), mientras que 9 (32%) están localizadas en regiones que no son MAR (positivas falsas). Como algunas de las MAR experimentalmente determinadas más largas contienen más de una predicción in silico, las 19 positivas verdaderas corresponden realmente a 14 MAR experimentalmente definidas diferentes (sensibilidad: 38%). El programa MARFinder predijo 25 regiones como MAR, 20 (especificidad: 80%) de estas están correlacionadas con las MAR experimentalmente definidas correspondientes a 12 MAR experimentalmente definidas diferentes (sensibilidad: 32%). El programa SMAR Scan@ predijo 22 regiones, siendo 17 positivas verdaderas (especificidad: 77%) que coinciden con 14 MAR experimentalmente definidas diferentes (sensibilidad: 38%). The SMARTest program predicted 28 regions as MAR, 19 (true positive) of these are correlated with experimentally defined MAR (specificity: 68%), while 9 (32%) are located in non-MAR (false positive) regions. Since some of the longest experimentally determined MARs contain more than one in silico prediction, the 19 true positives actually correspond to 14 different experimentally defined MARs (sensitivity: 38%). The MARFinder program predicted 25 regions as MAR, 20 (specificity: 80%) of these are correlated with experimentally defined MARs corresponding to 12 different experimentally defined MARs (sensitivity: 32%). The SMAR Scan @ program predicted 22 regions, with 17 true positives (specificity: 77%) that coincide with 14 different experimentally defined MARs (sensitivity: 38%).

Como otro ejemplo, se ha aplicado el mismo análisis a los cromosomas humanos 1 y 2 y condujo a la determinación de 23 secuencias de MAR (SEQ ID No 1 a 23). Estas secuencias están recogidas en el Anexo 1 en formato ST25. As another example, the same analysis has been applied to human chromosomes 1 and 2 and led to the determination of 23 MAR sequences (SEQ ID No. 1 to 23). These sequences are included in Annex 1 in ST25 format.

Ejemplo 6: Análisis del genoma completo usando el método combinado (SMAR Scan®-pfsearch) Example 6: Analysis of the entire genome using the combined method (SMAR Scan®-pfsearch)

Con el fin de analizar la correlación potencial entre las características estructurales analizadas por el programa SMAR Scan@ y la actividad funcional de las S/MAR, ha sido analizado el genoma humano completo con el método combinado con parámetros muy restrictivos, con el fin de obtener secuencias con los valores más altos para las características estructurales teóricas analizadas por ordenador, que en lo sucesivo son las llamadas "super" S/MAR. Esto se hizo con la esperanza de obtener elementos de MAR predichos con un alto potencial de aumentar la expresión de transgenes y la producción de proteína recombinante. Las supuestas S/MAR así obtenidas fueron analizadas primeramente desde la perspectiva de la bioinformática en un intento de caracterizarlas y clasificarlas. In order to analyze the potential correlation between the structural characteristics analyzed by the SMAR Scan @ program and the functional activity of the S / MAR, the complete human genome has been analyzed with the combined method with very restrictive parameters, in order to obtain sequences with the highest values for the theoretical structural characteristics analyzed by computer, which hereafter are called "super" S / MAR. This was done in the hope of obtaining predicted MAR elements with a high potential to increase transgene expression and recombinant protein production. The supposed S / MAR thus obtained were first analyzed from the perspective of bioinformatics in an attempt to characterize and classify them.

6.1 S / MAR predicted by analysis of the complete human genome

Como secuencia del genoma humano completo, se usaron todos los cóntigos humanos de RefSeq (National Center for Biotechnology Information, The NCBI Handbook [Internet]. Bethesda (MD): National Library of Medicine (US), Oct. Chapter 17, The Reference Sequence (RefSeq) Project, 2002 (Disponible en http://www.ncbi.nih.gov/entrez /query.fcgi?db=Books) (publicación 5) y se analizaron con el método combinado, usando el programa SMAR Scan® como filtro en el procesamiento del primer nivel, empleando los ajustes predeterminados excepto para el valor máximo de exclusión de curvatura, mientras que se ha usado un umbral restringido de 4,0 grados (en lugar de 3,202 grados) para el criterio de curvatura del DNA. As a complete human genome sequence, all human contigs from RefSeq (National Center for Biotechnology Information, The NCBI Handbook [Internet]. Bethesda (MD): National Library of Medicine (US), Oct. Chapter 17, The Reference Sequence) were used. (RefSeq) Project, 2002 (Available at http://www.ncbi.nih.gov/entrez /query.fcgi?db=Books) (publication 5) and analyzed with the combined method, using the SMAR Scan® program as filter in the first level processing, using the default settings except for the maximum curvature exclusion value, while a restricted threshold of 4.0 degrees (instead of 3.202 degrees) has been used for the DNA curvature criterion.

En el procesamiento del segundo nivel, se han buscado los sitios de unión a los factores de transcripción en las secuencias seleccionadas de la etapa previa sin realizar ningún filtrado de estas secuencias. In the second level processing, the transcription factor binding sites in the selected sequences of the previous step were searched without filtering these sequences.

Los análisis por el método combinado del genoma humano completo dieron un total de 1757 supuestas "super" S/MAR que representan un total de 1.065.305 pb (0,35% del genoma humano completo). La Tabla 2 muestra para cada cromosoma: su tamaño, su número de genes, su número de S/MAR predichas, su densidad de S/MAR por cada gen y sus kb por S/MAR. Esta Tabla muestra que hay densidades de genes muy diversos por cada S/MAR predicha para los diferentes cromosomas (la deviación típica representa más del 50% de la media de la densidad de genes por S/MAR predicha y la diferencia entre la densidad de genes mayor y menor por S/MAR es 6,5 veces). La Tabla 2 también muestra que las kb por S/MAR varían menos que la densidad de genes por S/MAR (la deviación típica representa 25% de la media de kb por S/MAR y la diferencia entre los kb mayores y los menores por S/MAR es 3,2 veces). Analysis by the combined method of the complete human genome gave a total of 1,757 putative "super" S / MARs representing a total of 1,065,305 bp (0.35% of the complete human genome). Table 2 shows for each chromosome: its size, its number of genes, its number of predicted S / MAR, its density of S / MAR for each gene and its kb per S / MAR. This Table shows that there are very different gene densities for each predicted S / MAR for the different chromosomes (the standard deviation represents more than 50% of the mean predicted S / MAR gene density and the difference between the gene density higher and lower by S / MAR is 6.5 times). Table 2 also shows that the kb by S / MAR varies less than the gene density by S / MAR (the standard deviation represents 25% of the mean kb by S / MAR and the difference between the largest and smallest kb by S / MAR is 3.2 times).

Tabla 2: Número de S/MAR predichas por cromosoma. El número de genes por cromosoma corresponde a estadísticas del genoma humano de NCBI (Build 34, Versión 3) Table 2: Number of predicted S / MAR by chromosome. The number of genes per chromosome corresponds to NCBI human genome statistics (Build 34, Version 3)

CromosomaChromosome: Número de genes por cromosoma Tamaño del cromosoma (millones de pb) Número de S/MAR predichas Densidad de genes por S/MAR Kb por S/MAR Number of genes per chromosome Chromosome size (million bp) Predicted S / MAR number S / MAR gene density Kb by S / MAR

1 one: 2544 230 85 29,9 2705 2544 230 85 29.9 2705

2 2: 1772 241 143 12,3 1685 1772 241 143 12.3 1685

3 3: 1406 198 101 13,9 1960 1406 198 101 13.9 1960

4 4: 1036 190 118 8,7 1610 1036 190 118 8.7 1610

5 5: 1233 180 116 10,6 1551 1233 180 116 10.6 1551

6 6: 1247 170 94 13,2 1808 1247 170 94 13.2 1808

7 7: 1383 160 179 7,7 1754 1383 160 179 7.7 1754

8 8: 942 145 77 12,2 1883 942 145 77 12.2 1883

9 9: 1100 119 48 22,9 2479 1100 119 48 22.9 2479

10 10: 1003 133 71 14,1 1873 1003 133 71 14.1 1873

11 eleven: 1692 132 67 25,2 1970 1692 132 67 25.2 1970

12 12: 1278 131 78 16,3 1679 1278 131 78 16.3 1679

13 13: 506 97 70 7,2 1385 506 97 70 7.2 1385

14 14: 1168 88 36 32,4 2444 1168 88 36 32.4 2444

15 fifteen: 895 83 35 25,5 2371 895 83 35 25.5 2371

16 16: 1107 81 41 27 1975 1107 81 41 27 1975

17 17: 1421 80 37 38,4 2162 1421 80 37 38.4 2162

18 18: 396 75 31 7,7 1470 396 75 31 7.7 1470

19 19: 1621 56 36 45,02 1555 1621 56 36 45.02 1555

20 twenty: 724 60 28 25,8 2142 724 60 28 25.8 2142

21 twenty-one: 355 34 18 19,7 1888 355 3. 4 18 19.7 1888

22 22: 707 34 28 25,2 1214 707 3. 4 28 25.2 1214

X X: 1168 154 170 6,8 905 1168 154 170 6.8 905

Y AND: 251 25 30 83 833 251 25 30 83 833

Suma Media Desviación típica Sum Mean Standard Deviation: 26.955 1.123 510 3.050 127 72,8 1.757 73 45 457 19 10 43.312 1.804 462 26,955 1,123 510 3,050 127 72.8 1,757 73 45 457 19 10 43,312 1,804 462

Los datos del National Center for Biotechnology Information, The NCBI Handbook [Internet]. Bethesda (MD): National Library of Medicine (US), Oct. Chapter 17, The Reference Sequence (RefSeq) Project, 2002 (Disponible en http: Data from the National Center for Biotechnology Information, The NCBI Handbook [Internet]. Bethesda (MD): National Library of Medicine (US), Oct. Chapter 17, The Reference Sequence (RefSeq) Project, 2002 (Available at http:

5 //www.ncbi.nih.gov/entrez/query.fcgi?db=Books) se basan en anotaciones del GenBank. Los tamaños de los cromosomas son la suma de las correspondientes longitudes de cóntigos humanos de RefSeq (National Center for Biotechnology Information, The NCBI handbook [Internet]. Bethesda (MD): National Library of Medicine (US), Oct. Chapter 17, The Reference Sequence (RefSeq) Project, 2002 (Disponible en http: //www.ncbi.nih.gov/entrez /query.fcgi?db=Books) (publicación 5). 5 //www.ncbi.nih.gov/entrez/query.fcgi?db=Books) are based on GenBank annotations. Chromosome sizes are the sum of the corresponding lengths of human contigs from RefSeq (National Center for Biotechnology Information, The NCBI handbook [Internet]. Bethesda (MD): National Library of Medicine (US), Oct. Chapter 17, The Reference Sequence (RefSeq) Project, 2002 (Available at http: //www.ncbi.nih.gov/entrez /query.fcgi?db=Books) (publication 5).

10 6.2 Análisis bioinformático de las "super" MAR para sitios de unión a factores de transcripción. 10 6.2 Bioinformatic analysis of the "super" MAR for transcription factor binding sites.

Luego se analizaron los potenciales sitios de unión a los factores de transcripción de las 1757 secuencias "super" S/MAR predichas obtenidas previamente por el programa SMAR Scan@. Esto se ha conseguido usando el programa RMatch™ Professional (Kel AE, Gossling E, Reuter I, Cheremushkin E, KelMargoulis OV, Wingender E, MATCH: "A tool for searching transcription factor binding sites in DNA sequences", Nucleic Acids Res. 31(13):35769, 15 2003), una herramienta basada en una matriz ponderada, basada a su vez en el programa TRANSFAC (Wingender E, Chen X, Fricke E, Geffers R, Hehl R, Liebich I, Krull M, Matys V, Michael H, Ohnhauser R, Pruss M, Schacherer F, Thiele S, Urbach S, "The TRANSFAC system on gene expression regulation", Nucleic Acids Research, 29(1):2813, 2001). Se ha usado el programa Match 2.0 Professional con la mayoría de los ajustes predeterminados. El análisis por el programa Match estaba basado en el programa TRANSFAC Professional, versión 8.2 (20040630). Las sumas The potential sites for transcription factor binding of the 1,757 predicted "super" S / MAR sequences previously obtained by the SMAR Scan @ program were then analyzed. This has been achieved using the RMatch ™ Professional program (Kel AE, Gossling E, Reuter I, Cheremushkin E, KelMargoulis OV, Wingender E, MATCH: "A tool for searching transcription factor binding sites in DNA sequences", Nucleic Acids Res. 31 (13): 35769, 15 2003), a tool based on a weighted matrix, based in turn on the TRANSFAC program (Wingender E, Chen X, Fricke E, Geffers R, Hehl R, Liebich I, Krull M, Matys V , Michael H, Ohnhauser R, Pruss M, Schacherer F, Thiele S, Urbach S, "The TRANSFAC system on gene expression regulation", Nucleic Acids Research, 29 (1): 2813, 2001). The Match 2.0 Professional program has been used with most of the default settings. Analysis by the Match program was based on the TRANSFAC Professional program, version 8.2 (20040630). Sums

20 de todas las predicciones de los sitios de unión a los factores de transcripción en las 1757 secuencias analizadas de acuerdo con el programa Match se recogen en la Tabla 3. En base a esta Tabla, solamente los factores de transcripción que totalizan al menos 20 coincidencias en las 1757 secuencias analizadas fueron considerados para análisis posterior. 20 of all predictions of transcription factor binding sites in the 1757 sequences analyzed according to the Match program are shown in Table 3. Based on this Table, only transcription factors totaling at least 20 matches in the 1757 analyzed sequences they were considered for further analysis.

A continuación se dan algunos de los factores de transcripción humanos que son los más frecuentemente predichos Given below are some of the human transcription factors that are most frequently predicted

25 para unirse a las 1757 supuestas secuencias de S/MAR y su descripción por el programa Match: Cdc5 (proteína 5 del control de la división celular) un regulador/represor transcripcional, Nkx3A una proteína de homeodominio regulada por andrógeno, POU1F1 (factor 1 de transcripción positiva específica de la pituitaria) que es específico de la pituitaria y estimula la proliferación celular. Por tanto, en la actividad de las MAR, además de SATB1, NMP4 y MEF2, pueden participar otros factores de transcripción. 25 to bind to the 1,757 putative S / MAR sequences and their description by the Match program: Cdc5 (protein 5 of cell division control) a transcriptional regulator / repressor, Nkx3A an androgen-regulated homeodomain protein, POU1F1 (factor 1 pituitary-specific positive transcription) that is pituitary-specific and stimulates cell proliferation. Therefore, in the activity of MARs, in addition to SATB1, NMP4 and MEF2, other transcription factors may participate.

30 La Tabla 3 es un resumen de todas las predicciones de sitios de unión a los factores de transcripción (totalizando 20 coincidencias o más) en las 1757 secuencias analizadas. Table 3 is a summary of all predictions of transcription factor binding sites (totaling 20 matches or more) in the 1,757 sequences analyzed.

AP1 AP1: 1 AR 2 Bach2 1 Brn2 1 one AR 2 Bach2 one Brn2 one

C/EBP C / EBP: 20 C/ EBPgamma 5 CDP CR3 1 COMP1 2 twenty C / EBPgamma 5 CDP CR3 one COMP1 2

CREBP1 CREBP1: 34 Cdc5 858 Cdx2 35 Evil 472 3. 4 Cdc5 858 Cdx2 35 Evil 472

FOX FOX: 78 FOXD3 79 FOXJ2 244 FOXP3 29 78 FOXD3 79 FOXJ2 244 FOXP3 29

Freac7 Freac7: 272 GATA1 2 GATA3 142 GATA4 125 272 GATA1 2 GATA3 142 GATA4 125

HFH1 HFH1: 12 HFH3 1 HLF 275 HNF1 337 12 HFH3 one HLF 275 HNF1 337

HNF3alfa HNF3alpha: 23 HNF3beta 71 HP1 2 Lhx3 22 2. 3 HNF3beta 71 HP1 2 Lhx3 22

MEF2 MEF2: 114 MRF2 57 Myc 18 NKX3A 849 114 MRF2 57 Myc 18 NKX3A 849

Nkx25 Nkx25: 2 Oct1 191 PBX 5 POU1F1 483 2 Oct1 191 PBX 5 POU1F1 483

POU3F2 POU3F2: 11 POU6F1 29 Pax3 3 Pax6 20 eleven POU6F1 29 Pax3 3 Pax6 twenty

Pit1 Pit1: 505 SRF 8 TEF 2852 TFIIA 14 505 SRF 8 TEF 2852 TFIIA 14

TTF1 TTF1: 1 V$MTATA_B 4 VBP 53 Vmw65 1 one V $ MTATA_B 4 VBP 53 Vmw65 one

XFD1 XFD1: 65 XFD2 418 XFD3 2 65 XFD2 418 XFD3 2

6.3 Bioinformatic analysis of the "super" MARs to determine nucleotide frequencies.

Se realizaron diversos análisis por ordenador con el fin de identificar fácilmente secuencias de "super" S/MAR Various computer analyzes were performed in order to easily identify "super" S / MAR sequences

5 usando un criterio explícito que pudiera ser identificado sin empleo de ordenador. Entre estos, se realizó un análisis de dinucleótidos en las 1757 super MAR, calculando cada uno de los 16 posibles porcentajes de dinucleótidos para cada secuencia considerando ambas cadenas en la dirección 5’ > 3’. 5 using an explicit criterion that could be identified without the use of a computer. Among these, a dinucleotide analysis was performed in the 1757 super MAR, calculating each of the 16 possible percentages of dinucleotides for each sequence considering both chains in the 5 '> 3' direction.

Un resumen (mínimo, máximo, mediana, media, percentil 25 y percentil 75), así como los histogramas de cada porcentaje de dinucleótido en las 1757 secuencias de S/MAR se representan respectivamente en la Tabla 4. Se A summary (minimum, maximum, median, mean, 25th percentile and 75th percentile), as well as the histograms of each percentage of dinucleotide in the 1757 S / MAR sequences, are respectively represented in Table 4.

10 realizó un análisis similar en secuencias seleccionadas al azar a partir del genoma humano, que representan aleatoriamente las secuencias seleccionadas que no son de S/MAR (que, sin embargo, podrían contener algunas MAR). La Tabla 5 representa respectivamente un resumen del análisis del contenido de dinucleótidos de estas secuencias. 10 performed a similar analysis on randomly selected sequences from the human genome, randomly representing the selected non-S / MAR sequences (which, however, might contain some MARs). Table 5 represents respectively a summary of the analysis of the dinucleotide content of these sequences.

Tabla 4: Porcentajes de dinucleótidos en 1757 secuencias de S/MAR Table 4: Percentages of dinucleotides in 1757 S / MAR sequences

AA% AA%: AC% AG% AT% AC% AG% AT%

Mínimo Minimum: 0,000 0,0000 0,0000 18,50 0.000 0.0000 0.0000 18.50

Percentil 25 25th percentile: 4,234 0,9372 0,1408 32,11 4,234 0.9372 0.1408 32.11

Mediana Median: 7,843 2,2408 0,4777 34,68 7,843 2,2408 0.4777 34.68

Media Half: 7,184 3,2117 1,0865 34,32 7,184 3.2117 1.0865 34.32

Percentil 75 75th percentile: 10,110 4,7718 1,5096 36,94 10,110 4.7718 1,5096 36.94

Máximo Maximum: 17,290 12,9479 8,1230 50,00 17,290 12.9479 8.1230 50.00

CA% AC%: CC% CG% CT% DC% CG% CT%

Mínimo Minimum: 0,0000 0,00000 0,0000 0,0000 0.0000 0.00000 0.0000 0.0000

Percentil 25 25th percentile: 0,9695 0,00000 0,0000 0,1408 0.9695 0.00000 0.0000 0.1408

Mediana Median: 1,9776 0,00000 0,0000 0,4777 1,9776 0.00000 0.0000 0.4777

Media Half: 2,6977 0,14123 0,2709 1,0865 2.6977 0.14123 0.2709 1.0865

Percentil 75 75th percentile: 3,7543 0,09422 0,1256 1,5096 3.7543 0.09422 0.1256 1,5096

Máximo Maximum: 10,4061 4,24837 7,4410 8,1230 10.4061 4.24837 7.4410 8.1230

GA% GA%: GC% GG% GT% GC% GG% GT%

Mínimo Minimum: 0,00000 0,0000 0,00000 0,0000 0.00000 0.0000 0.00000 0.0000

Percentil 25 25th percentile: 0,08696 0,0000 0,00000 0,9372 0.08696 0.0000 0.00000 0.9372

Mediana Median: 0,32616 0,0000 0,00000 2,2408 0.32616 0.0000 0.00000 2,2408

Media Half: 0,63347 0,2104 0,14123 3,2117 0.63347 0.2104 0.14123 3.2117

Percentil 75 75th percentile: 0,83333 0,1914 0,09422 4,7718 0.83333 0.1914 0.09422 4.7718

Máximo Maximum: 5,77889 9,8795 4,24837 12,9479 5.77889 9.8795 4.24837 12.9479

TA%TA%: TC% TG% TT% TC% TG% TT%

Mínimo Minimum: 28,63 0,00000 0,0000 0,000 28.63 0.00000 0.0000 0.000

Percentil 25 25th percentile: 33,48 0,08696 0,9695 4,234 33.48 0.08696 0.9695 4,234

Mediana Median: 35,22 0,32616 1,9776 7,843 35.22 0.32616 1,9776 7,843

Media Half: 35,29 0,63347 2,6977 7,184 35.29 0.63347 2.6977 7,184

Percentil 75 75th percentile: 37,14 0,83333 3,7543 10,110 37.14 0.83333 3.7543 10,110

Máximo Maximum: 50,00 5,77889 10,406 17,290 50.00 5.77889 10,406 17,290

15 Considerando los resultados de los elementos de S/MAR predichos y de las secuencias que no son de S/MAR en las tablas de resumen, pueden apreciarse diferencias notables en los contenidos de los dinucleótidos AT y TA entre estos dos grupos de secuencias. AT y TA representan respectivamente al menos 18,5% y 28,6% del contenido de dinucleótidos de las secuencias de S/MAR predichas, mientras que los porcentajes mínimos de los mismos dinucleótidos en secuencias que no son S/MAR son respectivamente 0,3% y 0%. Similarmente, el máximo contenido de CC y GG en secuencias de S/MAR es 4,2%, mientras que en secuencias que no son de S/MAR los porcentajes Considering the results of the predicted S / MAR elements and the non-S / MAR sequences in the summary tables, notable differences can be seen in the AT and TA dinucleotide contents between these two groups of sequences. AT and TA respectively represent at least 18.5% and 28.6% of the dinucleotide content of the predicted S / MAR sequences, while the minimum percentages of the same dinucleotides in non-S / MAR sequences are respectively 0, 3% and 0%. Similarly, the maximum content of CC and GG in S / MAR sequences is 4.2%, while in non-S / MAR sequences the percentages

5 de estos dos dinucleótidos pueden ascender hasta 20,8 %. 5 of these two dinucleotides can be up to 20.8%.

La correlación entre los porcentajes de los dinucleótidos AT y TA y la máxima curvatura de DNA calculada por el programa SMAR Scan@ se representa en la Fig. 17 para las secuencias de S/MAR predichas y en la Fig. 18 para las secuencias que no son de S/MAR. Los diferentes diagramas de dispersión de estas figuras muestran que el porcentaje de TA está bien correlacionado con la curvatura de DNA predicha por el programa SMAR Scan®. The correlation between the percentages of the AT and TA dinucleotides and the maximum DNA curvature calculated by the SMAR Scan @ program is represented in Fig. 17 for the predicted S / MAR sequences and in Fig. 18 for the sequences that were not are from S / MAR. The different scatterplots in these figures show that the TA percentage is well correlated with the DNA curvature predicted by the SMAR Scan® program.

10 Tabla 5: Resumen de los porcentajes de dinucleótidos en 1757 secuencias que no son de S/MAR 10 Table 5: Summary of the percentages of dinucleotides in 1757 non-S / MAR sequences

AA% AA%: AC% AG% AT% AC% AG% AT%

Mínimo Minimum: 0,000 1,735 1,512 0,3257 0.000 1,735 1,512 0.3257

Percentil 25 25th percentile: 7,096 4,586 6,466 5,1033 7,096 4,586 6,466 5,1033

Mediana Median: 9,106 5,016 7,279 6,8695 9,106 5,016 7,279 6.8695

Media Half: 8,976 5,054 7,184 7,0108 8,976 5,054 7,184 7.0108

Percentil 75 75th percentile: 10,939 5,494 7,969 8,7913 10,939 5,494 7,969 8.7913

Máximo Maximum: 17,922 13,816 12,232 23,1788 17,922 13,816 12,232 23.1788

CA% AC%: CC% CG% CT% DC% CG% CT%

Mínimo Minimum: 3,571 0,8278 0,0000 1,512 3,571 0.8278 0.0000 1,512

Percentil 25 25th percentile: 6,765 4,1077 0,4727 6,466 6,765 4,1077 0.4727 6,466

Mediana Median: 7,410 5,5556 0,8439 7,279 7,410 5.5556 0.8439 7,279

Media Half: 7,411 5,9088 1,2707 7,184 7,411 5.9088 1,2707 7,184

Percentil 75 75th percentile: 8,010 7,2460 1,5760 7,969 8,010 7.2460 1.5760 7,969

Máximo Maximum: 15,714 20,8415 12,6074 12,232 15,714 20.8415 12.6074 12,232

GA% GA%: GC% GG% GT% GC% GG% GT%

Mínimo Minimum: 1,319 0,4967 0,8278 1,735 1,319 0.4967 0.8278 1,735

Percentil 25 25th percentile: 5,495 3,2615 4,1077 4,586 5,495 3.2615 4,1077 4,586

Mediana Median: 6,032 4,4092 5,5556 5,016 6,032 4,4092 5.5556 5,016

Media Half: 6,065 4,7468 5,9088 5,054 6,065 4.7468 5.9088 5,054

Percentil 75 75th percentile: 6,602 5,8824 7,2460 5,494 6,602 5.8824 7.2460 5,494

Máximo Maximum: 10,423 16,0000 20,8415 13,816 10,423 16,0000 20.8415 13,816

TA % TA%: TC % TG% TT% TC% TG% TT%

Mínimo Minimum: 0,000 1,319 3,571 0,000 0.000 1,319 3,571 0.000

Percentil 25 25th percentile: 3,876 5,495 6,765 7,096 3,876 5,495 6,765 7,096

Mediana Median: 5,625 6,032 7,410 9,106 5,625 6,032 7,410 9,106

Media Half: 5,774 6,065 7,411 8,976 5,774 6,065 7,411 8,976

Percentil 75 75th percentile: 7,464 6,602 8,010 10,939 7,464 6,602 8,010 10,939

Máximo Maximum: 24,338 10,423 15,714 17,922 24,338 10,423 15,714 17,922

Se escogieron al azar cuatro de las nuevas super MAR, se analizó el contenido de los dinucleótidos AT y TA y se comparó con las lysMAR de pollo previamente conocidas, considerando ventanas de 100 pares de bases (Tabla 6). Four of the new super MARs were chosen at random, the content of AT and TA dinucleotides was analyzed and compared with previously known chicken lysMARs, considering windows of 100 base pairs (Table 6).

Sorprendentemente, los inventores han encontrado que la totalidad de las super MAR tienen frecuencias del dinucleótido AT mayores del 12%, y frecuencias del dinucleótido TA mayores del 10% de los dinucleótidos totales Surprisingly, the inventors have found that all super MARs have AT dinucleotide frequencies greater than 12%, and TA dinucleotide frequencies greater than 10% of total dinucleotides.

15 analizados en una ventana de 100 pares de bases del DNA. Las MAR más eficientes presentan valores de alrededor de 34% de los dos pares de dinucleótidos. 15 analyzed in a 100 base pair DNA window. The most efficient MARs have values of around 34% of the two pairs of dinucleotides.

Tabla 6. Resumen de las frecuencias en % de los dinucleótidos AT y TA de las MAR experimentalmente verificadas Table 6. Summary of frequencies in% of AT and TA dinucleotides of experimentally verified MAR

cLysMAR (media de los CUE) cLysMAR (mean of the CUE): AT%: 12,03 TA% : 10,29 SEQ ID No AT%: 12.03 TA%: 10.29 SEQ ID No

P1 68 P1 68: AT%: 33,78 TA% : 33,93 SEQ ID No AT%: 33.78 TA%: 33.93 SEQ ID No

P1 6 P1 6: AT%: 34,67 TA% : 34,38 SEQ ID No AT%: 34.67 TA%: 34.38 SEQ ID No

P1 42 P1 42: AT%: 35,65 TA%: 35,52 SEQ ID No AT%: 35.65 TA%: 35.52 SEQ ID No

Valor medio para todas las "super" MAR humanas Average value for all human "super" MARs: AT%: 34,32 TA% : 35,29 AT%: 34.32 TA%: 35.29

Valor medio para todas las que no son "super" MAR humanas Average value for all those that are not "super" human MAR: AT%: 7,01 TA% : 5,77 AT%: 7.01 TA%: 5.77

6.4 Analysis of orthologous intergenic regions of the human and mouse genomes.

Con el fin de obtener una comprensión de la evolución de las S/MAR se han analizado con el programa SMAR Scan® regiones intergénicas ortólogas de genomas del ser humano y del ratón. El conjunto de datos usados está compuesto de 87 pares de regiones intergénicas ortólogas completas de los genomas del ser humano y del ratón (Shabalina SA, Ogurtsov AY, Kondrashov VA, Kondrashov AS, "Selective constraint in intergenic regions of human and mouse genomes", Trends Genet., 17(7):3736, 2001) (longitud media -12.000 pb) localizadas en los cromosomas 12 humano y 12 de ratón. La sintonía de estas secuencias se confirmó por alineamiento de secuencias por pares de bases y la consideración de las anotaciones de los genes flanqueantes (experimental o predicha). In order to obtain an understanding of the evolution of S / MAR, orthologous intergenic regions of human and mouse genomes have been analyzed with the SMAR Scan® program. The data set used is composed of 87 pairs of complete orthologous intergenic regions of the human and mouse genomes (Shabalina SA, Ogurtsov AY, Kondrashov VA, Kondrashov AS, "Selective constraint in intergenic regions of human and mouse genomes", Trends Genet., 17 (7): 3736, 2001) (mean length -12,000 bp) located on chromosomes human 12 and mouse 12. Tuning of these sequences was confirmed by base pair sequence alignment and consideration of flanking gene annotations (experimental or predicted).

El análisis de las 87 secuencias intergénicas ortólogas humanas y de ratón ha sido realizado con el programa SMAR Scan® usando sus ajustes predeterminados. El análisis de las secuencias humanas proporcionó un total de 12 S/MAR predichas (lo que representa una longitud total de 4.750 pb), localizadas en 5 secuencias intergénicas diferentes. The analysis of the 87 human and mouse orthologous intergenic sequences has been carried out with the SMAR Scan® program using their default settings. Analysis of human sequences yielded a total of 12 predicted S / MARs (representing a total length of 4,750 bp), located in 5 different intergenic sequences.

Entre las tres secuencias intergénicas humanas para las que se predice que contienen una "super" S/MAR usando los ajustes restrictivos del programa SMARScan@, también se predice una secuencia intergénica ortóloga de ratón correspondiente que contienen una S/MAR (EMBL ID humana: Z96050, posiciones 28.010 a 76.951 ortólogas al EMBL ID de ratón: AC015932, posiciones 59.884 a 89.963). Cuando se realiza un alineamiento local de estas dos secuencias intergénicas ortólogas, el mejor alineamiento local de estas dos grandes regiones corresponde a las regiones que el programa SMAR Scan® predice que es el elemento S/MAR. Usando el programa Ensembl Genome Browser (hftp://ensembl.org) se realizó una búsqueda manual de las secuencias ortólogas de ratón de las otras dos secuencias intergénicas humanas de las que se predijo que contenían una "super" S/MAR. Las secuencias intergénicas ortólogas de ratón de estas dos secuencias humanas se recuperaron usando predicciones ortólogas por el programa Ensembl (basadas en nombres de genes), buscando los genes de ratón ortólogos para los pares de genes humanos que flanquean estas regiones intergénicas. Among the three human intergenic sequences for which they are predicted to contain a "super" S / MAR using the restrictive settings of the SMARScan @ program, a corresponding orthologous mouse intergenic sequence containing a S / MAR is also predicted (human EMBL ID: Z96050, positions 28,010 to 76,951 orthologous to the mouse EMBL ID: AC015932, positions 59,884 to 89,963). When performing a local alignment of these two orthologous intergenic sequences, the best local alignment of these two large regions corresponds to the regions that the SMAR Scan® program predicts to be the S / MAR element. Using the Ensembl Genome Browser program (hftp: //ensembl.org), a manual search was performed for the mouse orthologous sequences of the other two human intergenic sequences that were predicted to contain a "super" S / MAR. The mouse orthologous intergenic sequences of these two human sequences were retrieved using orthologous predictions by the Ensembl program (based on gene names), searching for orthologous mouse genes for the human gene pairs flanking these intergenic regions.

Debido a que el programa SMAR Scan® ha sido afinado para secuencias humanas y en consecuencia proporciona pocas "super" MAR con secuencias genómicas de ratón, sus valores de exclusión predeterminados estaban relativamente relajados para el tamaño mínimo de las coincidencias contiguas que son consideradas S/MAR (usando 200 pb en lugar de 300 pb). El análisis por el programa SMAR Scan@ de estas secuencias de ratón predijo varias S/MAR que tienen altos valores para las diferentes características estructurales calculadas. Este hallazgo sugiere que los elementos de las MAR humanas se conservan a través de las especies. Because the SMAR Scan® program has been fine-tuned for human sequences and consequently provides few "super" MARs with mouse genomic sequences, its default exclusion values were relatively relaxed for the minimum size of contiguous matches that are considered S / SEA (using 200 bp instead of 300 bp). Analysis by the SMAR Scan @ program of these mouse sequences predicted several S / MARs that have high values for the different calculated structural features. This finding suggests that elements of human MAR are conserved across species.

Ejemplo 7: Disección de la 5’- MAR del gen de la lisozima de pollo Example 7: Dissection of the 5'-MAR from the chicken lysozyme gene

La 5’-MAR de 3000 pares de bases se diseccionó en fragmentos más pequeños que fueron monitorizados para efectuar la expresión de transgenes en células de ovario de hámster chino (CHO). Para hacerlo así, se generaron siete fragmentos de ~400 pb por reacción en cadena de la polimerasa (PCR). Estos fragmentos amplificados por PCR eran contiguos y cubren la secuencia de MAR completa cuando se colocan extremo-con-extremo. Se ligaron cuatro copias de cada uno de estos fragmentos en orientación cabeza-a-cola, para obtener una longitud correspondiente a aproximadamente la mitad de la MAR natural. Los tetrámeros fueron insertados hacia el extremo 5' del promotor de SV 40 en pGEGFP Control, una versión modificada del vector pGL3 Control (Promega). El plásmido pGEGFP Control fue creado cambiando el gen de la luciferasa de pGL3 Control por el gen EGFP de pEGFP-N1 (Clontech). Los plásmidos que contenían el fragmento 5'-MAR así creados fueron co-transfectados con el plásmido de resistencia pSVneo en células de CHO-DG44 usando LipofectAmine 2000 (Invitrogen) como reactivo de transfección, como se realizó previamente (Zahn-Zabal, M., et al., "Development of stable cell lines for production or regulated expression using matrix attachment regions", J. Biotechnol., 2001. 87(1): p. 29-42.). Después de la selección de células (G-418) resistentes a antibióticos, se analizaron por un FACS poblaciones de células policlonales por fluorescencia de EGFP. The 3000 base pair 5'-MAR was dissected into smaller fragments that were monitored to effect transgene expression in Chinese hamster ovary (CHO) cells. To do so, seven ~ 400 bp fragments were generated by polymerase chain reaction (PCR). These PCR amplified fragments were contiguous and covered the entire MAR sequence when placed end-to-end. Four copies of each of these fragments were ligated in head-to-tail orientation, to obtain a length corresponding to approximately half of the natural MAR. The tetramers were inserted towards the 5 'end of the SV 40 promoter in pGEGFP Control, a modified version of the pGL3 Control vector (Promega). The plasmid pGEGFP Control was created by swapping the luciferase gene from pGL3 Control for the EGFP gene from pEGFP-N1 (Clontech). Plasmids containing the 5'-MAR fragment thus created were co-transfected with the resistance plasmid pSVneo in CHO-DG44 cells using LipofectAmine 2000 (Invitrogen) as a transfection reagent, as previously performed (Zahn-Zabal, M. , et al., "Development of stable cell lines for production or regulated expression using matrix attachment regions", J. Biotechnol., 2001. 87 (1): p. 29-42.). After selection of antibiotic resistant (G-418) cells, polyclonal cell populations were analyzed by FACS for EGFP fluorescence.

La expresión de transgenes se expresó como el percentil de células de alta expresión, definidas como las células cuyos niveles de fluorescencia son al menos 4 órdenes de magnitud más alto que la fluorescencia media de células transfectadas con el vector pGEGFP Control sin MAR. La Fig. 5 muestra que los fragmentos multimerizados B, K y F aumentan la expresión de transgenes, a pesar de su tamaño más corto en comparación con la secuencia de MAR original. En contraste, otros fragmentos son escasamente activos o completamente inactivos. Transgene expression was expressed as the percentile of high-expression cells, defined as cells whose fluorescence levels are at least 4 orders of magnitude higher than the average fluorescence of cells transfected with the pGEGFP Control vector without MAR. Fig. 5 shows that multimerized fragments B, K and F increase the expression of transgenes, despite their shorter size compared to the original MAR sequence. In contrast, other fragments are either poorly active or completely inactive.

Ejemplo 8: Especificidad de las regiones B, K y F en el contexto de las MAR Example 8: Specificity of regions B, K and F in the MAR context

La 5'-MAR fue sometida a deleción en serie desde el extremo 5' (Fig. 6, parte superior) o desde el extremo 3' (Fig. 6, parte inferior), respectivamente. El efecto de los elementos truncados fue monitorizado en un ensayo similar al descrito en el apartado previo. La Figura 6 muestra que la pérdida de capacidad para estimular la expresión de transgenes en células de CHO no estaba uniformemente distribuida. 5'-MAR was serially deleted from the 5 'end (Fig. 6, top) or from the 3' end (Fig. 6, bottom), respectively. The effect of the truncated elements was monitored in a test similar to that described in the previous section. Figure 6 shows that the loss of ability to stimulate transgene expression in CHO cells was not uniformly distributed.

En este estudio de deleción, la pérdida de actividad de MAR coincidía con regiones discretas de transición que se solapan con los fragmentos B, K y F de 5’-MAR, respectivamente. En deleciones en el extremo 5', la actividad fue perdida mayoritariamente cuando fueron eliminados los fragmentos K y F. Las deleciones en el extremo 3' que eliminaban los elementos F y B tenían los efectos más pronunciados. En contraste, las regiones flanqueantes A, D, E y G tenían poca o ninguna capacidad para estimular la expresión de transgenes por sí mismas (Fig. 5), y en consecuencia no contribuyeron a la actividad de MAR en los estudios de deleción en los extremos 5’ y 3’ (Fig. 6). In this deletion study, the loss of MAR activity coincided with discrete transition regions that overlap with the 5'-MAR fragments B, K and F, respectively. In deletions at the 5 'end, activity was mostly lost when fragments K and F were removed. Deletions at the 3' end that removed elements F and B had the most pronounced effects. In contrast, flanking regions A, D, E and G had little or no ability to stimulate transgene expression by themselves (Fig. 5), and consequently did not contribute to MAR activity in deletion studies in the 5 'and 3' ends (Fig. 6).

Ejemplo 9: Estructura del elemento F. Example 9: Structure of element F.

El fragmento F de 465 pb fue diseccionado adicionalmente en sub-fragmentos más pequeños de 234, 243, 213 pb y de 122, 125 y 121 pb, respectivamente. Los fragmentos del primer grupo fueron octamerizados (8 copias) en una orientación cabeza-a-cola, mientras que los del segundo grupo fueron similarmente hexadecamerizados (16 copias), para mantener una longitud constante de la secuencia de MAR. Estos elementos se clonaron en el vector pGEGFP Control y sus efectos se analizaron en células de CHO como se ha descrito previamente. Curiosamente, el fragmento FIII retuvo la mayor parte de la actividad del fragmento F de longitud completa, mientras que el fragmento FII que contenía la parte lateral derecha del fragmento FIII, perdió toda la capacidad de estimular la expresión de transgenes (Fig. 7). Esto sugiere que la región activa comprendía entre 132 nucleótidos y 221 nucleótidos en el fragmento FIB. Consecuentemente, las múltiples copias de los fragmentos FI y FIB, que abarcan esta región, exhibían una actividad similar. FIIA por sí mismo no tiene actividad. Sin embargo, cuando se añade a FIB, dando como resultado FIII, potencia la actividad del primero. Por lo tanto, FIIA parece contener una secuencia auxiliar que tiene poca actividad por sí misma, pero que refuerza la actividad del dominio mínimo localizado en FIB. The 465 bp F fragment was further dissected into smaller 234, 243, 213 bp and 122, 125 and 121 bp sub-fragments, respectively. Fragments from the first group were octamerized (8 copies) in a head-to-tail orientation, while those from the second group were similarly hexadecamerized (16 copies), to maintain a constant length of the MAR sequence. These elements were cloned into the pGEGFP Control vector and their effects were analyzed in CHO cells as previously described. Interestingly, the FIII fragment retained most of the activity of the full-length F fragment, while the FII fragment containing the right side of the FIII fragment lost all ability to stimulate transgene expression (Fig. 7). This suggests that the active region comprised between 132 nucleotides and 221 nucleotides in the FIB fragment. Consequently, multiple copies of the FI and FIB fragments, spanning this region, exhibited similar activity. FIIA by itself has no activity. However, when added to FIB, resulting in FIII, it enhances the activity of the former. Therefore, FIIA appears to contain an ancillary sequence that has little activity by itself, but that reinforces the activity of the minimal domain located in FIB.

En la Fig. 8A se muestra el análisis de la distribución de restos individuales dentro de la 5’-MAR del gen de la lisozima, junto con algunos restos adicionales que los inventores añadieron al análisis. Se encontró que la mayoría de estos restos estaban dispersos en todo el elemento de MAR, y no estaban específicamente asociados con las porciones activas. Por ejemplo, los sitios de unión de los factores de transcripción y otros restos que han estado asociados con las MAR no fueron preferentemente localizados en las regiones activas. También se ha propuesto que las secuencias de MAR activas pueden consistir en una combinación de restos distintos. Se han descrito varios programas informáticos (MAR Finder, SMARTest, SIDD duplex stability) para identificar las MAR como regiones de DNA que se asocian a la matriz de DNA. Dichos programas se basan usualmente en algoritmos que utilizan una serie predefinida de modelos específicos de secuencias que se ha sugerido previamente que contienen actividad de MAR, como lo ilustro el programa MAR Finder, actualmente conocido como el programa MAR Wiz. Los resultados obtenidos con estos programas no se correlacionan bien con las porciones transcripcionalmente activas de cLysMAR. Por ejemplo, los picos de actividad obtenidos con el programa MAR Finder no coincidían claramente con las sub-porciones de MAR activas, como por ejemplo el fragmento B es bastante activo in vivo, pero da un puntuación negativa con el programa MAR Finder (Fig. 8B, compárense los paneles superior y central). Las estructuras de DNA curvado, como las predichas por este programa, no se correlacionaban bien con la actividad (Fig. 8B, compárense los paneles superior e inferior). Se obtuvieron resultados similares con los otros programas disponibles (datos no mostrados). Analysis of the distribution of individual residues within the 5'-MAR of the lysozyme gene is shown in Fig. 8A, along with some additional residues that the inventors added to the analysis. Most of these remains were found to be scattered throughout the MAR element, and were not specifically associated with the active portions. For example, the sites of transcription factor binding and other residues that have been associated with MARs were not preferentially located in the active regions. It has also been proposed that active MAR sequences may consist of a combination of different residues. Various computer programs (MAR Finder, SMARTest, SIDD duplex stability) have been described to identify MARs as regions of DNA that associate with the DNA matrix. Such programs are usually based on algorithms that use a predefined series of sequence-specific models previously suggested to contain MAR activity, as illustrated by the MAR Finder program, currently known as the MAR Wiz program. The results obtained with these programs do not correlate well with the transcriptionally active portions of cLysMAR. For example, the activity peaks obtained with the MAR Finder program did not clearly coincide with the active MAR sub-portions, such as fragment B is quite active in vivo, but gives a negative score with the MAR Finder program (Fig. 8B, compare top and center panels). Curved DNA structures, as predicted by this program, did not correlate well with activity (Fig. 8B, compare top and bottom panels). Similar results were obtained with the other available programs (data not shown).

Por tanto, es improbable que los restos identificados por los métodos informáticos disponibles de predicción de las MAR sean los determinantes principales de la capacidad de las cLysMAR de aumentar la expresión de genes. Por consiguiente, se analizaron cierto número de otras herramientas informáticas. Sorprendentemente, se encontró que las secuencias de unión al nucleosoma predichas y las secuencias que no favorecen la unión al nucleosoma estaban dispuestas en agrupaciones intercaladas repetitivamente en las MAR, con los sitios que favorecen la unión al nucleosoma que se solapan con las regiones B, K y F activas. Se propusieron secuencias de posicionamiento del nucleosoma que consistían en tramos de DNA que pueden envolver fácilmente a las histonas del nucleosoma, y las cuales no han sido asociadas previamente con las secuencias de las MAR. Therefore, it is unlikely that the residues identified by the available MAR prediction methods are the main determinants of the ability of cLysMARs to increase gene expression. Therefore, a number of other computer tools were analyzed. Surprisingly, it was found that the predicted nucleosome binding sequences and sequences that do not promote nucleosome binding were arranged in clusters interleaved repetitively in MARs, with sites that promote nucleosome binding overlapping with B, K regions. and F active. Nucleosome positioning sequences were proposed consisting of stretches of DNA that can easily envelop nucleosome histones, and which have not been previously associated with MAR sequences.

Las secuencias que favorecen la unión al nucleosoma pueden ser modeladas mediante un conjunto de características del DNA que incluyen secuencias moderadamente repetidas y otros parámetros físico-químicos que pueden permitir la sincronización y la orientación correctas del DNA sobre la superficie curvada de las histonas. La identificación de muchas de estas propiedades del DNA puede ser analizada por ordenador, y se han usado hasta 38 de estas diferentes propiedades para predecir posiciones potenciales del nucleosoma. Por consiguiente, los inventores decidieron determinar si los componentes específicos de los programas de predicción del nucleosoma podrían estar correlacionados con la actividad de las MAR, con el objetivo de construir una herramienta que permita la identificación de nuevas, y posiblemente más potentes, MAR a partir de secuencias genómicas. Sequences that promote nucleosome binding can be modeled using a set of DNA features that include moderately repeated sequences and other physico-chemical parameters that can allow the correct synchronization and orientation of DNA on the curved surface of histones. The identification of many of these DNA properties can be analyzed by computer, and up to 38 of these different properties have been used to predict potential nucleosome positions. Therefore, the inventors decided to determine if the specific components of nucleosome prediction programs could be correlated with the activity of MAR, with the aim of building a tool that allows the identification of new, and possibly more powerful, MAR from of genomic sequences.

Para determinar si algunos aspectos de la secuencia primaria del DNA podrían distinguir las regiones B, K y F activas de la secuencia de MAR circundante, los inventores analizaron las 5’-MAR con el programa MAR Scan®. De las 38 herramientas de predicción de la disposición del nucleosoma se encontraron tres que estaban correlacionadas con la localización de los sub-dominios activos de MAR (Fig. 9A). La localización de las regiones B, K y F en las MAR coincide con los valores máximos de curvatura del DNA, la profundidad de la ranura mayor y la anchura de la ranura menor. También se observó una correlación más débil con los valores mínimos de la temperatura de fusión del DNA, determinada por su contenido de GC. La cartografía afinada del fragmento F de las MAR indicó que el valle de la temperatura de fusión y la cima de la curvatura del DNA se corresponden realmente con el sub-fragmento FIB que contiene el dominio mínimo de las MAR (Fig. 9B). Por tanto, las porciones activas de las MAR pueden corresponder a las regiones predichas por este programa como regiones de DNA curvadas, y en el texto siguiente se hará referencia a estas regiones como CUE-B, CUE-K y CUE-F. No obstante, se desconoce si estas regiones corresponden al DNA curvado real y a las regiones de desenrollamiento de pares de bases (BUR), puesto que no corresponden al DNA curvado predicho por el programa MAR Wiz (Fig. 9B). To determine if some aspects of the primary DNA sequence could distinguish active B, K, and F regions from the surrounding MAR sequence, the inventors analyzed 5'-MARs with the MAR Scan® program. Of the 38 nucleosome disposition prediction tools, three were found that were correlated with the location of the active sub-domains of MAR (Fig. 9A). The location of the B, K and F regions in the MARs coincide with the maximum values of DNA curvature, the depth of the major groove and the width of the minor groove. A weaker correlation was also observed with the minimum values of the DNA fusion temperature, determined by its GC content. Fine-tuned mapping of the MAR fragment F indicated that the melting temperature valley and the top of the DNA curvature actually correspond to the FIB sub-fragment containing the MAR minimum domain (Fig. 9B). Therefore, the active portions of the MARs may correspond to the regions predicted by this program as curved DNA regions, and in the following text these regions will be referred to as CUE-B, CUE-K, and CUE-F. However, it is unknown whether these regions correspond to actual curved DNA and to base pair unwinding regions (BUR), since they do not correspond to curved DNA predicted by the MAR Wiz program (Fig. 9B).

Ejemplo 10: Huellas de otros elementos reguladores en el fragmento F Example 10: Traces of other regulatory elements in fragment F

Las características de posicionamiento del nucleosoma pueden ser consideradas como uno de los muchos códigos específicos de la cromatina contenidos en el DNA genómico. Aunque este código particular puede contribuir a la actividad de la región F, es improbable determinar la actividad de las MAR solas, puesto que la parte 3' de la región F potenciaba la actividad del dominio mínimo de MAR contenido en la porción FIB. Usando el programa MatInspector (Genomatix), los inventores buscaron los sitios de unión al factor de transcripción con puntuaciones superiores a 0,92 y encontraron secuencias de unión a DNA para las proteínas NMP4 y MEF2 en la parte 3' del fragmento F (Fig. 8B). Para determinar si algunos de estos sitios de unión a factores de transcripción podría estar localizado próximo a las regiones B y K activas, se analizó la secuencia completa de 5'-MAR para determinar la unión por NMP4, MEF2 y las proteínas que se descrito que se unen a la forma monocatenaria o bicatenaria de las BUR. Entre estas, SATB1 (proteína 1 de unión especial rica en AT) pertenece a una clase factor de transcripción que se une a DNA que puede activar o reprimir la expresión de genes cercanos. Este estudio indicó que proteínas específicas, tales como SATB1, NMP4 (proteína 4 de la matriz nuclear) y MEF2 (factor potenciador miogénico 2) tienen una distribución específica y forman un armazón alrededor de los dominios mínimos de MAR de cLysMAR (Fig. 10). La presencia de varios de estos sitios de unión a NMP4 y SATB1 ha sido confirmada experimentalmente por análisis EMSA de proteínas recombinantes purificadas (datos no mostrados). The positioning characteristics of the nucleosome can be considered as one of the many chromatin-specific codes contained in genomic DNA. Although this particular code may contribute to the activity of the F region, it is unlikely to determine the activity of the MAR alone, since the 3 'part of the F region enhanced the activity of the MAR minimal domain contained in the FIB portion. Using the MatInspector program (Genomatix), the inventors searched for transcription factor binding sites with scores greater than 0.92 and found DNA binding sequences for the NMP4 and MEF2 proteins in the 3 'part of fragment F (Fig. 8B). To determine if some of these transcription factor binding sites might be located proximate to the active B and K regions, the complete sequence of 5'-MAR was analyzed to determine binding by NMP4, MEF2 and the proteins described to be bind to the single-chain or double-chain form of the BUR. Among these, SATB1 (AT-rich special binding protein 1) belongs to a class of DNA-binding transcription factor that can activate or suppress the expression of nearby genes. This study indicated that specific proteins such as SATB1, NMP4 (nuclear matrix protein 4) and MEF2 (myogenic enhancer factor 2) have a specific distribution and form a framework around the MAR minimal domains of cLysMAR (Fig. 10) . The presence of several of these NMP4 and SATB1 binding sites has been experimentally confirmed by EMSA analysis of purified recombinant proteins (data not shown).

Ejemplo 11: Construcción de MAR artificiales por combinación de elementos genéticos definidos Example 11: Construction of artificial MARs by combination of defined genetic elements

Para determinar además los papeles relativos de los diversos componentes de MAR, se suprimió cLysMAR de las tres regiones de CUE (Fig. 11, parte central), lo cual dio como resultado la pérdida de parte de su actividad cuando se compara con la secuencia de MAR completa ensamblada similarmente a partir de todos sus componentes como control (Fig. 11, parte superior). Consecuentemente, una copia de cada CUE sola, o una copia de los tres CUE ensamblados cabeza-a-cola, tenía poca actividad en ausencia de las secuencias flanqueantes. Estos resultados refuerzan la conclusión de que la actividad transcripcional óptima requiere la combinación de los CUE con las secuencias flanqueantes. Curiosamente, la secuencia de MAR completa generada a partir de cada uno de sus componentes, pero que también contiene las secuencias del conector Bglll-BamHl (AGATCC) usadas para ensamblar cada fragmento de DNA, exhibió alta actividad transcripcional (activación de 6 veces) en comparación con las 4,8 veces observadas para el elemento de MAR original en esta serie de ensayos (véase la Fig. 5). To further determine the relative roles of the various components of MAR, cLysMAR was deleted from all three CUE regions (Fig. 11, center part), resulting in the loss of part of its activity when compared to the sequence of Complete MAR similarly assembled from all its components as a control (Fig. 11, top). Consequently, one copy of each CUE alone, or one copy of the three head-to-tail assembled CUEs, had little activity in the absence of the flanking sequences. These results reinforce the conclusion that optimal transcriptional activity requires the combination of CUEs with flanking sequences. Interestingly, the entire MAR sequence generated from each of its components, but which also contains the Bglll-BamHl linker sequences (AGATCC) used to assemble each DNA fragment, exhibited high transcriptional activity (6-fold activation) in Comparison with the 4.8 times observed for the original MAR element in this series of tests (see Fig. 5).

Los inventores investigaron si las regiones de DNA potencialmente curvadas también pueden ser activas en un ambiente diferente del encontrado en su contexto de MAR natural. Por tanto, decidieron intercambiar los elementos CUE-F, CUE-B y CUE-K, manteniendo inalteradas las secuencias flanqueantes. Las secuencias que flanquean el elemento CUE-F fueron amplificadas por PCR y ensambladas para abarcar los diversos CUE, manteniendo su orientación y distancia originales, o sin un CUE. Se analizó luego la capacidad de estas MAR de ~1,8 kb modificadas por ingeniería genética para aumentar la expresión de transgenes como antes. Los tres CUE fueron activos en este contexto, y por lo tanto la acción no está restringida a un conjunto dado de secuencias flanqueantes. Curiosamente, el elemento CUE-K fue incluso más activo que el CUE-F cuando se insertó entre las secuencias flanqueantes del CUE-F, y la primera construcción compuesta exhibió una actividad tan alta como la observada para la MAR natural completa (activación de 4,8 veces). Lo que distingue al elemento CUE-K del CUE-F y CUE-B es la presencia de sitios de unión solapantes para las proteínas MEF-2 y SatB1, además de su característica de CUE. Por lo tanto, fusionar CUE-B con el dominio flanqueante de CUE-F da como resultado una mayor densidad de los tres sitios de unión, lo cual es probablemente la explicación del aumento de actividad. Estos resultados indican que los ensamblajes de los CUE con secuencias que contienen sitios de unión para proteínas tales como proteínas NMP4, MEF-2, SatB1 y/o polyPpolyQ constituyen potentes secuencias de MAR artificiales. The inventors investigated whether potentially curved DNA regions can also be active in a different environment than that found in their natural MAR context. Therefore, they decided to exchange the CUE-F, CUE-B and CUE-K elements, keeping the flanking sequences unchanged. The sequences flanking the CUE-F element were amplified by PCR and assembled to span the various CUEs, maintaining their original orientation and distance, or without a CUE. The ability of these genetically engineered ~ 1.8 kb MARs to increase transgene expression was then analyzed as above. All three CUEs were active in this context, and therefore action is not restricted to a given set of flanking sequences. Interestingly, the CUE-K element was even more active than CUE-F when inserted between the flanking sequences of CUE-F, and the first composite construct exhibited activity as high as that observed for full natural MAR (activation of 4 , 8 times). What distinguishes the CUE-K element from CUE-F and CUE-B is the presence of overlapping binding sites for the MEF-2 and SatB1 proteins, in addition to their CUE characteristic. Therefore, fusing CUE-B with the flanking domain of CUE-F results in a higher density of all three binding sites, which is probably the explanation for the increased activity. These results indicate that CUE assemblies with sequences containing binding sites for proteins such as NMP4, MEF-2, SatB1 and / or polyPpolyQ proteins constitute potent artificial MAR sequences.

Ejemplo 12: Vectores de expresión Example 12: Expression Vectors

En la Figura 12 se representan tres vectores de expresión de acuerdo con la presente invención. Three expression vectors according to the present invention are depicted in Figure 12.

El plásmido pPAG01 es un derivado de pUC19 de 5640 pb. Contiene un fragmento de DNA de pollo de 2960 pb clonado en los sitios de restricción BamH1 y XbaI. Este inserto procede del borde del extremo 5' del locus de lisozima de pollo y tiene un alto contenido de A/T. Plasmid pPAG01 is a 5640 bp derivative of pUC19. It contains a 2960 bp chicken DNA fragment cloned into the BamH1 and XbaI restriction sites. This insert comes from the edge of the 5 'end of the chicken lysozyme locus and is high in A / T.

El plásmido pGEGFP (también denominado pSV40EGFP) control es un derivado del vector del pGL3-control (Promega) en el cual la secuencia del gen de luciferasa ha sido reemplazada por la forma de la secuencia del gen EGFP del vector pEGFP-N1 (Clontech). El tamaño del plásmido pGEGFP es 4334 pb. The control plasmid pGEGFP (also called pSV40EGFP) is a derivative of the pGL3-control vector (Promega) in which the luciferase gene sequence has been replaced by the form of the EGFP gene sequence from the pEGFP-N1 vector (Clontech) . The size of the plasmid pGEGFP is 4334 bp.

El plásmido pUbCEGFP control es un derivado de pGL3 con un promotor de ubiquitina. The control pUbCEGFP plasmid is a derivative of pGL3 with an ubiquitin promoter.

El plásmido pPAG01GFP (también denominado pMAR-SV40EGFP) es un derivado de pGEGFP con el elemento 5'-LysMAR clonado en el sitio de clonación múltiple (abreviadamente MCS por la expresión inglesa Multiple Clonation Site) situado justo hacia el extremo 5' del promotor de SV40. El tamaño del plásmido pPAG01EGF es 7285 pb. The plasmid pPAG01GFP (also called pMAR-SV40EGFP) is a derivative of pGEGFP with the 5'-LysMAR element cloned at the multiple cloning site (abbreviated MCS by the English expression Multiple Clonation Site) located just towards the 5 'end of the promoter of SV40. The size of the plasmid pPAG01EGF is 7285 bp.

Ejemplo 13: Efecto de la transfección adicional de células transfectantes primarias sobre la expresión de transgenes Example 13: Effect of additional transfection of primary transfecting cells on expression of transgenes

Un día antes de la transfección, se cultivaron células de CHO-DG44 en una placa de 24 pocillos, en un medio de crecimiento a una densidad de 1,35 x 105 células/pocillo. 16 horas después del inóculo, las células se transfectaron cuando habían alcanzado 30-40% de confluencia, usando Lipofect-AMINE 2000 (en lo sucesivo LF2000), de 5 acuerdo con las instrucciones del fabricante (Invitrogen). Veintisiete microlitros de medio exento de suero (Opti-MEM; Invitrogen) que contenían 1,4 μl de LF2000 se mezclaron con 27 μl de Opti-MEM que contenían 830 ng de DNA lineal de plásmido. El plásmido para selección de antibióticos (pSVneo) ascendió a una décima parte del plásmido indicador que lleva el transgén de la GFP. La mezcla se incubó a temperatura ambiente durante 20 minutos, para permitir la formación de los complejos DNA-LF2000. La mezcla se diluyó con 300 μl de Opti-MEM y se 10 vertió en pocillos previamente vaciados que contenían células. Después de 3 horas de incubación de las células con la mezcla de DNA a 37ºC en una incubadora con CO2, se añadió a cada pocillo un medio basado en DMEM. Las células fueron incubadas adicionalmente durante 24 horas en una incubadora con CO2 a 37ºC. Las células se transfectaron luego una segunda vez de acuerdo con el método descrito antes, excepto que el plásmido de resistencia llevaba otro gen de resistencia (pSVpuro). Veinticuatro horas después de la segunda transfección, las 15 células se sometieron a pases y se expandieron en un matraz T-75 que contenía medio de selección suplementado con 500 μg/ml de G-418 y 5 μg/ml de puromicina. Después de un periodo de selección de dos semanas, las células establemente transfectadas se cultivaron en placas de 6 pocillos. Alternativamente, la población celular se transfectó de nuevo usando el mismo método, pero con pTKhygro (Clontech) y pSVdhfr como plásmidos de resistencia. La expresión de GFP se analizó con el clasificador de células activadas por fluorescencia (FACS) y con un aparato One day before transfection, CHO-DG44 cells were grown in a 24-well plate, in growth medium at a density of 1.35 x 105 cells / well. 16 hours after the inoculum, the cells were transfected when they had reached 30-40% confluence, using Lipofect-AMINE 2000 (hereinafter LF2000), according to the manufacturer's instructions (Invitrogen). Twenty-seven microliters of serum-free medium (Opti-MEM; Invitrogen) containing 1.4 µl of LF2000 was mixed with 27 µl of Opti-MEM containing 830 ng of linear plasmid DNA. The antibiotic selection plasmid (pSVneo) amounted to one tenth of the reporter plasmid carrying the GFP transgene. The mixture was incubated at room temperature for 20 minutes, to allow the formation of the DNA-LF2000 complexes. The mixture was diluted with 300 µl of Opti-MEM and poured into previously emptied wells containing cells. After 3 hours incubation of the cells with the DNA mixture at 37 ° C in a CO2 incubator, a medium based on DMEM was added to each well. The cells were further incubated for 24 hours in a CO2 incubator at 37 ° C. The cells were then transfected a second time according to the method described above, except that the resistance plasmid carried another resistance gene (pSVpuro). Twenty-four hours after the second transfection, the 15 cells were passaged and expanded in a T-75 flask containing selection medium supplemented with 500 µg / ml G-418 and 5 µg / ml puromycin. After a two week selection period, the stably transfected cells were grown in 6-well plates. Alternatively, the cell population was transfected again using the same method, but with pTKhygro (Clontech) and pSVdhfr as resistance plasmids. GFP expression was analyzed with the Fluorescence Activated Cell Sorter (FACS) and with an apparatus

20 Fluoroscan. 20 Fluoroscan.

La Fig.13 muestra que el fenotipo de las células transfectadas dos veces (en lo sucesivo denominadas transfectantes secundarias) no sólo estaba fuertemente coloreado, de tal modo que no se requirió una bombilla especial ni un filtro para visualizar el color verde de la proteína GFP, sino que también contenía una mayoría de células productoras (histograma por FACS en la parte inferior izquierda) en comparación con la población parental 25 (histograma central). Este nivel de fluorescencia corresponde a productividades celulares específicas de al menos 10 pg por célula y por día. Realmente, las células transfectadas solamente una vez (transfectantes primarias) que no expresaron la proteína marcadora estaban casi totalmente ausentes de la población celular después de la retransfección. Las barras por debajo de 101 unidades de la fluorescencia de la GFP ascendían a 30% en el histograma central y a menos de 5% en el histograma de la derecha. Esto sugirió que células adicionales habían Fig. 13 shows that the phenotype of the twice transfected cells (hereinafter referred to as secondary transfectants) was not only strongly colored, so that a special bulb and filter was not required to visualize the green color of the GFP protein , but also contained a majority of producer cells (FACS histogram in the lower left) compared to the parent population 25 (central histogram). This level of fluorescence corresponds to specific cell productivity of at least 10 pg per cell per day. Indeed, cells transfected only once (primary transfectants) that did not express the marker protein were almost entirely absent from the cell population after retransfection. Bars below 101 units of GFP fluorescence were 30% on the central histogram and less than 5% on the right histogram. This suggested that additional cells had

30 sido transfectadas y expresada satisfactoriamente la GFP. 30 have been transfected and successfully expressed the GFP.

Sorprendentemente, la cantidad de fluorescencia exhibida por las células re-transfectadas sugirió que la subpoblación de células que tenían incorporado DNA dos veces expresaron mucha más GFP que el aumento doble esperado. Realmente los resultados mostrados en la Tabla 2 indican que las transfectantes secundarias exhibían, por término medio, un aumento de más del doble de la GFP esperada si dos conjuntos de secuencias, uno en cada 35 transfección sucesiva, hubieran estado integrados independientemente y con eficiencias similares. Curiosamente, esto no dependía de la secuencia del promotor que activa al gen indicador, puesto que tanto los vectores que contenían el promotor viral como el celular dieron un aumento similar de la GFP (compárese las pistas 1 y 2). Sin embargo, el efecto fue particularmente marcado para el vector que contenía la MAR en comparación con los plásmidos sin la MAR (pista 3), en donde las dos transfecciones consecutivas dieron como resultado aumentos de la Surprisingly, the amount of fluorescence exhibited by the re-transfected cells suggested that the subpopulation of cells that had DNA incorporated twice expressed much more GFP than the expected double increase. Indeed the results shown in Table 2 indicate that the secondary transfectants exhibited, on average, an increase of more than twice the expected GFP if two sets of sequences, one in every 35 successive transfection, had been independently integrated and with similar efficiencies . Interestingly, this did not depend on the promoter sequence that activates the reporter gene, since both the viral and cellular promoter-containing vectors gave a similar increase in GFP (compare lanes 1 and 2). However, the effect was particularly marked for the vector containing the MAR compared to the plasmids without the MAR (lane 3), where the two consecutive transfections resulted in increases in the

40 expresión de 5,3 y 4,6 veces, en dos experimentos distintos. Expression of 5.3 and 4.6 times, in two different experiments.

Tabla 7. Efecto de re-transfectar transfectantes primarias en intervalos de 24 horas en la expresión de GFP Table 7. Effect of re-transfecting primary transfectants at 24-hour intervals on GFP expression.

Tipo de plásmidos Plasmid type: Transfección primaria Transfección secundaria Aumento de la fluorescencia de PGFP (veces) Primary transfection Secondary transfection Increased PGFP fluorescence (times)

pUbCEGFP pUbCEGFP: 4’992 14’334 2,8 4’992 14’334 2.8

pSV40EGFPpSV40EGFP: 4’324 12’237 2,8 4'324 12’237 2.8

pMAR-SV40EGFP pMAR-SV40EGFP: 6’996 36’748 5,3 6’996 36’748 5.3

pUbCEGFP pUbCEGFP: 6’452 15’794 2,5 6’452 15’794 2.5

pSV40EGFPpSV40EGFP: 4’433 11’735 2,6 4’433 11’735 2.6

pMAR-SV40EGFP pMAR-SV40EGFP: 8’116 37’475 4,6 8’116 37’475 4.6

Se muestran dos experimentos independientes. El plásmido de resistencia pSVneo fue co-transfectado con diversos vectores de expresión de la GFP. Un día después de la transfección, las células fueron re-transfectadas con los mismos plásmidos con la diferencia de que el plásmido de resistencia fue cambiado por pSVpuro. Las células que 45 llevaban ambos genes de resistencia se seleccionaron en 500 μg/ml de G-418 y 5 μg/ml de puromicina y se cuantificó por Fluoroscan la expresión del marcador gen indicador. El número de veces de aumentos corresponde a la relación entre la fluorescencia obtenida de dos transfecciones consecutivas y la suma de la fluorescencia obtenida de las transfecciones independientes correspondientes. En número de veces de aumento que fue considerado significativamente más alto se muestra en negrita y corresponde a los valores de fluorescencia que son Two independent experiments are shown. The resistance plasmid pSVneo was co-transfected with various GFP expression vectors. One day after transfection, the cells were re-transfected with the same plasmids with the difference that the resistance plasmid was changed by pSVpuro. Cells bearing both resistance genes were selected in 500 µg / ml G-418 and 5 µg / ml puromycin and expression of the reporter gene marker was quantified by Fluoroscan. The number of times of magnification corresponds to the ratio between the fluorescence obtained from two consecutive transfections and the sum of the fluorescence obtained from the corresponding independent transfections. The number of times of increase that was considered significantly higher is shown in bold and corresponds to the fluorescence values that are

50 consecuentemente más de 2 veces mayores que la suma de los obtenidos de las transfecciones independientes. Consequently more than 2 times greater than the sum of those obtained from the independent transfections.

Según el conocimiento actual no se esperaba el aumento en el nivel de expresión de la GFP en células múltiplemente transfectadas, y este efecto no se había observado previamente. According to current knowledge, the increase in the level of GFP expression in multiple transfected cells was not expected, and this effect had not been previously observed.

Tomados conjuntamente, los datos presentados en la presente memoria apoyan la idea de que las secuencias de plásmidos que se integran principalmente en el genoma hospedante facilitarían la integración de otros plásmidos 5 por recombinación homóloga con el segundo conjunto entrante de moléculas de plásmido. Los eventos de recombinación de plásmidos ocurren en un intervalo de 1 hora después de que el DNA del plásmido haya alcanzado el núcleo y la frecuencia de recombinación homóloga entre las moléculas de plásmido co-inyectadas en las células de mamíferos cultivadas haya demostrado ser extremadamente alta, aproximándose a la unidad [Folger, K.R., K. Thomas, and M.R. Capecchi, "Non reciprocal exchanges of information between DNA duplexes coinjected into 10 mammalian cell nuclei". Mol. Cell Biol.,1985. 5(1): p. 59-69], lo que explica la integración de múltiples copias de plásmido. Sin embargo, la recombinación homóloga entre DNA recientemente introducido y su homólogo cromosómico normalmente ocurre raras veces, a una frecuencia de como máximo 1 en 103 células que reciben el DNA [Thomas, K.R., K.R. Folger, and M.R. Capecchi, "High frequency targeting of genes to specific sites in the mammalian genome", Cell, 1986. 44 (3): p. 419-28]. Por tanto, los resultados podrían indicar que el elemento de Taken together, the data presented herein supports the idea that plasmid sequences that integrate primarily into the host genome would facilitate integration of other plasmids 5 by homologous recombination with the second incoming set of plasmid molecules. Plasmid recombination events occur within 1 hour after plasmid DNA has reached the nucleus and the frequency of homologous recombination between plasmid molecules co-injected into cultured mammalian cells has been shown to be extremely high, approaching unity [Folger, KR, K. Thomas, and MR Capecchi, "Non reciprocal exchanges of information between DNA duplexes coinjected into 10 mammalian cell nuclei". Mol. Cell Biol., 1985. 5 (1): p. 59-69], which explains the integration of multiple plasmid copies. However, homologous recombination between recently introduced DNA and its chromosomal counterpart normally occurs rarely, at a frequency of at most 1 in 103 cells receiving the DNA [Thomas, K.R., K.R. Folger, and M.R. Capecchi, "High frequency targeting of genes to specific sites in the mammalian genome", Cell, 1986. 44 (3): p. 419-28]. Therefore, the results could indicate that the element of

15 MAR actúa sorprendentemente para promover dichos eventos de recombinación. Las MAR no solamente modificarían la organización de genes in vivo, y posiblemente permitirían también la replicación del DNA junto con las secuencias de DNA viral, sino que también podrían actuar como señales de recombinación de DNA. MAR works surprisingly to promote such recombination events. MARs would not only modify gene organization in vivo, and possibly also allow DNA replication along with viral DNA sequences, but could also act as DNA recombination signals.

Ejemplo 14: Las MAR median los niveles de expresión inesperadamente altos en células múltiplemente transfectadas Example 14: MARs mediate unexpectedly high expression levels in multiple transfected cells

20 Si los eventos de recombinación activados por las MAR fueran a ocurrir en métodos de transfecciones múltiples, los inventores esperarían que la sinergia entre el DNA plasmídico primario y secundario estaría afectada por la presencia de los elementos de MAR en una o en ambas de las etapas de transfección. Los inventores examinaron esta posibilidad por transfecciones múltiples de las células con pMAR solo o en combinación con varios plásmidos de expresión, usando el método descrito previamente. La Tabla 8 muestra que transfectar las células dos veces con 20 If MAR-activated recombination events were to occur in multiple transfection methods, the inventors would expect that the synergy between the primary and secondary plasmid DNA would be affected by the presence of the MAR elements in one or both of the stages of transfection. The inventors examined this possibility by multiple transfections of the cells with pMAR alone or in combination with various expression plasmids, using the method previously described. Table 8 shows that transfecting cells twice with

25 el plásmido pMAR-SV40EGFP dio la mayor expresión de la GFP y el mayor grado de mejora de todas las condiciones (4,3 veces). En contraste, transfectar dos veces el vector sin MAR dio poco o ninguna mejora, 2,8 veces, en lugar del aumento doble esperado. Los inventores llegaron a la conclusión de que la presencia de elementos de MAR en cada etapa de transfección es necesaria para conseguir la máxima síntesis de proteína. The plasmid pMAR-SV40EGFP gave the highest expression of GFP and the highest degree of improvement under all conditions (4.3 fold). In contrast, transfecting the MAR-free vector twice gave little or no improvement, 2.8 fold, rather than the expected double increase. The inventors concluded that the presence of MAR elements at each transfection stage is necessary to achieve maximum protein synthesis.

Tabla 8 Table 8

Transfección primaria Primary transfection: Transfección secundaria Secondary transfection

Tipo de plásmido Plasmid type: Fluorescencia de EGFP Tipo de plásmido Fluorescencia de EGFP Aumento (veces) EGFP fluorescence Plasmid type EGFP fluorescence Increase (times)

pMAR pMAR: 0 pMAR pSV40EGFP pMAR-SV40EGFP 0 15’437 30’488 0 2,3-2,5 2,6-2,7 0 pMAR pSV40EGFP pMAR-SV40EGFP 0 15’437 30’488 0 2.3-2.5 2.6-2.7

pMAR-SV40EGFPpMAR-SV40EGFP: 11’278 pMAR-SV40EGFP pMAR 47’027 12’319 4,3-5,3 1,0-1,1 11’278 pMAR-SV40EGFP pMAR 47’027 12’319 4.3-5.3 1.0-1.1

pSV40EGFPpSV40EGFP: 6’114 pSV40EGFP pMAR 17’200 11’169 2,8 1,8-2,3 6’114 pSV40EGFP pMAR 17’200 11’169 2.8 1.8-2.3

30 Curiosamente, cuando las células fueron transfectadas primeramente con pMAR solo, y luego re-transfectadas con pSV40EGFP o pMAR-SV40EGFP, los niveles de la GFP fueron más del doble en comparación con los que resultan de una sola transfección de los plásmidos posteriores (2,5 y 2,7 veces respectivamente, en lugar de la 1 vez esperada). Esto indica que la transfección previa de las MAR puede aumentar la expresión del plásmido usado en dicho segundo método de transfección. Debido a que las MAR solo actúan localmente sobre la estructura de la 30 Interestingly, when cells were first transfected with pMAR alone, and then re-transfected with pSV40EGFP or pMAR-SV40EGFP, GFP levels were more than double compared to those resulting from a single transfection of subsequent plasmids (2 , 5 and 2.7 times respectively, instead of the expected 1 time). This indicates that previous transfection of MARs can increase the expression of the plasmid used in said second transfection method. Because MARs only act locally on the structure of the

35 cromatina y la expresión de genes, esto implica que los dos tipos de DNA pueden haberse integrado en un locus cromosómico similar. En contraste, transfectar los vectores de expresión de la GFP solos, seguido por el elemento de MAR en la segunda etapa, proporcionó poca o ninguna mejora en los niveles de la GFP. Esto indica que es importante el orden de transfección de los plásmidos, y que el evento de la primera transfección debe contener un elemento de MAR que permita niveles significativamente mayores de expresión de transgenes. For chromatin and gene expression, this implies that the two types of DNA may have been integrated into a similar chromosomal locus. In contrast, transfecting GFP expression vectors alone, followed by the MAR element in the second step, provided little or no improvement in GFP levels. This indicates that the order of transfection of the plasmids is important, and that the event of the first transfection must contain a MAR element that allows significantly higher levels of transgene expression.

40 Si los elementos MAR favorecieran la recombinación homóloga de los plásmidos que permanecen en formas episomales desde el primer y el segundo métodos de transfección, seguido por su co-integración en un locus cromosómico, se esperaría que el orden de transfección de plásmidos no afectara a los niveles de la GFP. Sin embargo, los hallazgos anteriores indican que es más favorable transfectar el elemento de MAR en el primer evento de transfección en lugar de en el segundo. Esto sugiere el siguiente mecanismo molecular: durante el primer método If MAR elements favored homologous recombination of plasmids that remain in episomal forms from the first and second transfection methods, followed by their co-integration at a chromosomal locus, it would be expected that the order of plasmid transfection would not affect GFP levels. However, the above findings indicate that it is more favorable to transfect the MAR element in the first transfection event rather than in the second. This suggests the following molecular mechanism: during the first method

45 de transfección, los elementos de MAR pueden concatemerizarse e integrarse, al menos en parte, en el cromosoma celular. Este DNA de las MAR puede a su vez favorecer la posterior integración de más plásmidos, durante el segundo método de transfección, en el mismo locus cromosómico o en uno cercano. For transfection, the MAR elements can concatenate and integrate, at least in part, into the cell chromosome. This MAR DNA can in turn favor the subsequent integration of more plasmids, during the second transfection method, in the same chromosomal locus or in a nearby one.

Ejemplo 15: Las MAR como agentes que facilitan de la transferencia a largo plazo de DNA Example 15: MARs as Agents Facilitating Long-Term DNA Transfer

Si las MAR integradas mediaran una estructura cromosómica permisiva con la recombinación persistente, se esperarían altos niveles de expresión incluso si la segunda transfección se realizara mucho tiempo después de la primera, en un momento en el que hubiera sido eliminada la mayoría del DNA episómico transitoriamente introducido. Para abordar esta posibilidad, las células de la Tabla 9, seleccionadas por su resistencia a antibióticos durante tres semanas, fueron transfectadas de nuevo una o dos veces y seleccionadas por la incorporación de marcadores de resistencia de DNA adicionales. Los ciclos de transfección terciaria, o terciaria y cuaternaria, se realizaron con combinaciones de pMAR o pMAR-SV40EGFP, y se analizaron para determinar la expresión de GFP como antes. If integrated MARs mediated a permissive chromosomal structure with persistent recombination, high levels of expression would be expected even if the second transfection was performed long after the first, at a time when most of the transiently introduced episomal DNA would have been removed . To address this possibility, the cells in Table 9, selected for their resistance to antibiotics for three weeks, were re-transfected once or twice and selected for the incorporation of additional DNA resistance markers. Cycles of tertiary, or tertiary and quaternary transfection, were performed with combinations of pMAR or pMAR-SV40EGFP, and analyzed for GFP expression as above.

Table 9. The MARs act as agents that facilitate the integration of DNA.

Transfección terciaria Tertiary transfection: Transfección cuaternaria Quaternary transfection

Tipo de plásmidos Plasmid type: Fluorescencia de EGFP Aumento de veces Tipo de plásmidos Fluorescencia de EGFP Aumento de veces EGFP fluorescence Times increase Plasmid type EGFP fluorescence Times increase

pMARpMAR: 18368 2,2 pMAR pMAR-SV40EGFP 43’186 140’000 2,4 7,6 18368 2.2 pMAR pMAR-SV40EGFP 43’186 140’000 2.4 7.6

pMAR-SV40EGFI pMAR-SV40EGFI: 16544 2,0 pMAR- SV40EGFP pMAR 91’000 33’814 5,5 2,0 16544 2.0 pMAR- SV40EGFP pMAR 91’000 33’814 5.5 2.0

10 Los transfectantes secundarios pMAR-SV40EGFP/pMAR-SV40EGFP se usaron en un tercer ciclo de transfección al final del proceso de selección. La transfección terciaria se realizó con pMAR o pMAR-SV40EGFP y pTKhygro como plásmido de selección, para dar transfectantes terciarios. Después de 24 horas, las células se transfectaron de nuevo con cada cualquiera de los plásmidos y pSVdhfr, dando como resultado los transfectantes cuaternarios que se seleccionaron en un medio de crecimiento que contenía 500 μg/ml de G-418, 5 μg/ml de puromicina, 300 μg/ml Secondary pMAR-SV40EGFP / pMAR-SV40EGFP transfectants were used in a third cycle of transfection at the end of the selection process. Tertiary transfection was performed with pMAR or pMAR-SV40EGFP and pTKhygro as the selection plasmid, to give tertiary transfectants. After 24 hours, the cells were transfected again with each of the plasmids and pSVdhfr, resulting in the quaternary transfectants that were selected in a growth medium containing 500 µg / ml of G-418, 5 µg / ml of puromycin, 300 μg / ml

15 de higromicina B y metotrexato 5 μM. Los transfectantes secundarios exhibían inicialmente una fluorescencia de la GFP de 8300. El número de veces de aumentos corresponde a la relación entre la fluorescencia obtenida de dos transfecciones consecutivas y la suma de la fluorescencia obtenida de las transfecciones independientes correspondientes. El número de veces de aumentos que se consideró significativamente superior se muestran en negrita, y corresponde a los valores de fluorescencia que son dos veces superiores a la suma de los obtenidos de 15 of hygromycin B and 5 μM methotrexate. Secondary transfectants initially exhibited a GFP fluorescence of 8300. The number of times of increases corresponds to the ratio between the fluorescence obtained from two consecutive transfections and the sum of the fluorescence obtained from the corresponding independent transfections. The number of times of magnification that was considered significantly higher is shown in bold, and corresponds to the fluorescence values that are twice higher than the sum of those obtained from

20 las transfecciones independientes. 20 independent transfections.

Estos resultados muestran que cargar más copias de pMAR o pMAR-SV40EGFP dio como resultado aumentos dobles similares de fluorescencia total de las células. Cargar incluso más MAR en la transfección cuaternaria aumentó esta actividad en otras 2,4 veces. Esto concuerda con la hipótesis de los inventores de que las secuencias de MAR recientemente introducidas pueden integrarse en el locus del transgén cromosómico por recombinación These results show that loading more copies of pMAR or pMAR-SV40EGFP resulted in similar double increases in total fluorescence of the cells. Loading even more MAR into the quaternary transfection increased this activity by another 2.4 fold. This is consistent with the inventors' hypothesis that recently introduced MAR sequences can be integrated into the chromosomal transgene locus by recombination.

25 homóloga y por lo tanto aumentan adicionalmente la expresión de transgenes. They are homologous and therefore further increase the expression of transgenes.

Cuando las células fueron transfectadas una tercera y cuarta vez con el plásmido pMAR-SV40EGFP, la actividad de la GFP aumentó más, de nuevo a los niveles no esperados de la suma de los niveles de fluorescencia obtenidos de transfecciones independientes. La expresión de la GFP alcanzó niveles que dieron como resultado células que brillaban visiblemente con color verde a la luz diurna (Fig.14). Estos resultados indican además que la eficiencia de When cells were transfected a third and fourth time with plasmid pMAR-SV40EGFP, GFP activity increased further, again at unexpected levels of the sum of fluorescence levels obtained from independent transfections. GFP expression reached levels that resulted in cells that visibly glowed green in daylight (Fig. 14). These results also indicate that the efficiency of

30 la transfección cuaternaria fue mucho mayor que la esperada de la eficacia de la tercera transfección de DNA, lo que indica que un tiempo apropiado entre las transfecciones es crucial para obtener el aumento óptimo de la expresión génica, prefiriéndose un día a un periodo de tres semanas. 30 quaternary transfection was much greater than expected for the efficacy of the third DNA transfection, indicating that an appropriate time between transfections is crucial to obtain the optimal increase in gene expression, with one day being preferred to a period of three weeks.

Los inventores creen que los elementos de MAR favorecen los eventos de integración secundaria aumentando la frecuencia de recombinación en su sitio de integración cromosómica relajando la estructura cerrada de la cromatina, 35 puesto que median un aumento local de la acetilación de histonas (Yasui, D., et al., "SATB1 targets chromatin remodelling to regulate genes over long distances", Nature, 2002. 419(6907): p. 641-5.]. Alternativamente, o simultáneamente, las MAR recolocan potencialmente los genes cercanos en localizaciones sub-nucleares ideadas para estar enriquecidas en factores de acción trans, incluyendo proteínas que pueden participar en los eventos de recombinación, tales como las topoisomerasas. Esto puede dar como resultado un locus en el cual las secuencias The inventors believe that MAR elements favor secondary integration events by increasing the recombination frequency at their chromosomal integration site by relaxing the closed structure of chromatin, 35 since they mediate a local increase in histone acetylation (Yasui, D. , et al., "SATB1 targets chromatin remodeling to regulate genes over long distances", Nature, 2002. 419 (6907): p. 641-5.] Alternatively, or simultaneously, MARs potentially reposition nearby genes at sub locations -nuclear cells designed to be enriched in trans action factors, including proteins that can participate in recombination events, such as topoisomerases This can result in a locus at which sequences

40 de MAR puedan abarcar las repeticiones de pSV40EGFP protegiendo eficientemente los transgenes de los efectos de silenciamiento mediados por la cromatina. MAR 40 can span the repeats of pSV40EGFP by efficiently protecting transgenes from chromatin mediated silencing effects.

Ejemplo 16: Uso de las MAR identificadas con el programa SMAR Scan® II para aumentar la expresión de una proteína recombinante. Example 16: Use of MAR identified with the SMAR Scan® II program to increase the expression of a recombinant protein.

Cuatro elementos de MAR fueron seleccionados al azar de las secuencias obtenidas por el análisis de la secuencia Four elements of MAR were randomly selected from the sequences obtained by sequence analysis

45 completa del genoma humano con el programa SMAR Scan® o el método combinado. Estas MAR se denominan 1_6, 1_42, 1_68, (en donde el primer número representa el cromosoma del cual se origina la secuencia y el segundo número es específico de la MAR predicha a lo largo de este cromosoma) y X_S29, una "super" MAR identificada en el cromosoma X. Estas MAR predichas se insertaron en el vector pGEGFP Control hacia el extremo 5' del promotor y potenciador de SV40 que activa la expresión de la proteína verde fluorescente y estos plásmidos Complete the human genome with the SMAR Scan® program or the combined method. These MARs are called 1_6, 1_42, 1_68, (where the first number represents the chromosome from which the sequence originates and the second number is specific to the MAR predicted along this chromosome) and X_S29, a "super" MAR identified on the X chromosome. These predicted MARs were inserted into the pGEGFP Control vector towards the 5 'end of the SV40 promoter and enhancer that activates the expression of the green fluorescent protein and these plasmids.

50 se transfectaron en células de CHO cultivadas, como se ha descrito previamente (Zahn-Zabal, M., et al.; "Development of stable cell lines for production or regulated expression using matrix attachment regions", J. 50 were transfected into cultured CHO cells, as previously described (Zahn-Zabal, M., et al .; "Development of stable cell lines for production or regulated expression using matrix attachment regions", J.

Biotechnol., 2001. 87(1): p. 29-42). La expresión del transgén se analizó luego en la población total de células establemente transfectadas usando un clasificador de células activadas por fluorescencia (FACS). Como puede verse en la Fig. 19, todas estas MAR recientemente identificadas aumentaron la expresión del transgén significativamente por encima de la expresión activada por la Mar de lisozima de pollo, siendo la "super" MAR X_S29 la más potente de todas las MAR recientemente identificadas. Biotechnol., 2001. 87 (1): p. 29-42). Expression of the transgene was then analyzed in the total population of stably transfected cells using a fluorescence activated cell sorter (FACS). As can be seen in Fig. 19, all these recently identified MARs increased the expression of the transgene significantly above the expression activated by the chicken lysozyme Sea, the "super" MAR X_S29 being the most powerful of all the recently identified MARs .

Ejemplo 17: Efecto sobre el hematocrito de la expresión in vivo de mEPO por electrotransferencia del sistema Network con y sin MAR humana (1-68). Example 17: Effect on hematocrit of in vivo expression of mEPO by electrotransfer from the Network system with and without human MAR (1-68).

El gen terapéutico codifica EPO (eritropoyetina), una hormona usada para el tratamiento de la anemia. El gen de la EPO está colocado bajo el control de un promotor inducible por doxiciclina, en un sistema de intercambio de genes descrito previamente denominado el sistema Network (Imhof, M. O., Chatellard, P., and Mermod, N. (2000). "A regulatory network for efficient control of transgene expression", J. Gene. Med. 2, 107-116.). Los genes reguladores y de la EPO se inyectan luego en el músculo de ratones usando el método de electroporación in vivo denominado electrotransferencia, de modo que los genes son transferidos a los núcleos de las células de las fibras musculares. Cuando el antibiótico doxiciclina se añade al agua de beber de los ratones, se espera que dicho compuesto induzca la expresión de la EPO, que conducirá a la elevación del nivel de hematocrito, debido al aumento del número de glóbulos rojos mediado por el alto nivel de la EPO circulante. Por tanto, si la MAR mejoraba la expresión de EPO se esperarían mayores niveles de hematocrito. The therapeutic gene encodes EPO (erythropoietin), a hormone used to treat anemia. The EPO gene is placed under the control of a doxycycline inducible promoter, in a previously described gene exchange system called the Network system (Imhof, MO, Chatellard, P., and Mermod, N. (2000). " A regulatory network for efficient control of transgene expression ", J. Gene. Med. 2, 107-116.). The regulatory and EPO genes are then injected into the muscle of mice using the in vivo electroporation method called electrotransfer, so that the genes are transferred to the nuclei of the cells of the muscle fibers. When the antibiotic doxycycline is added to the drinking water of the mice, this compound is expected to induce the expression of EPO, which will lead to the elevation of the hematocrit level, due to the increase in the number of red blood cells mediated by the high level of circulating EPO. Therefore, if MAR improved EPO expression, higher hematocrit levels would be expected.

Se llevaron a cabo experimentos in vivo en ratones hembra C57BL6 de 5 semanas (Iffa Credo-Charles River, Francia). Se administraron 30 μg de DNA de plásmido en solución salina normal mediante inyecciones transcutáneas en el músculo anterior de la tibia. Todas las inyecciones se realizaron bajo anestesia con ketaminol (75 mg/kg) y narcoxil (10 mg/kg). Después de la inyección intramuscular de DNA, se aplicó al músculo un campo eléctrico. Se aplicó un voltaje de 200 V/cm en impulsos de 8 milisegundos a 1 Hz (Bettan M, Darteil R, Caillaud JM, Soubrier F, Delaere P, Branelec D, Mahfoudi A, Duverger N, Scherman D. 2000 "High-level protein secretion into blood circulation after electric pulse-mediated gene transfer into skeletal muscle". Mol. Ther. 2: 204-10). In vivo experiments were carried out on 5 week old C57BL6 female mice (Iffa Credo-Charles River, France). 30 µg of plasmid DNA was administered in normal saline by transcutaneous injections into the anterior muscle of the tibia. All injections were performed under anesthesia with ketaminol (75 mg / kg) and narcoxil (10 mg / kg). After intramuscular injection of DNA, an electric field was applied to the muscle. A voltage of 200 V / cm was applied in pulses of 8 milliseconds at 1 Hz (Bettan M, Darteil R, Caillaud JM, Soubrier F, Delaere P, Branelec D, Mahfoudi A, Duverger N, Scherman D. 2000 "High-level protein secretion into blood circulation after electric pulse-mediated gene transfer into skeletal muscle. "Mol. Ther. 2: 204-10).

Se inyectó a 16 ratones el sistema Network que expresa la EPO sin la MAR 1_68 y a otros 16 ratones se les inyectó el sistema Network que incorpora la MAR en el extremo 5' de las secuencias de promotor/potenciador que activan la expresión de los genes del activador y de la EPO. En cada grupo, a la mitad de los ratones se administró doxiciclina en el agua de beber a partir del comienzo del experimento (día 0 – el día de la electrotransferencia) y a la otra mitad, la doxiciclina se puso en el agua de beber a partir del día 21. Sixteen mice were injected with the Network system that expresses EPO without MAR 1_68 and another 16 mice were injected with the Network system that incorporates MAR at the 5 'end of the promoter / enhancer sequences that activate the expression of the genes of the activator and EPO. In each group, half of the mice were administered doxycycline in the drinking water from the beginning of the experiment (day 0 - the day of the electrotransfer) and the other half, the doxycycline was put into the drinking water from on the 21st.

Se recogieron muestras de sangre usando capilares heparinizados por punción retro-orbital a diferentes tiempos después de la inyección de plásmidos. Los capilares se centrifugaron 10 minutos a 5000 rpm a temperatura ambiente y se determinó la fracción volumétrica de los glóbulos rojos en comparación con el volumen de sangre total y se expresó como percentil, determinando el nivel de hematocrito. Blood samples were collected using heparinized capillaries by retro-orbital puncture at different times after injection of plasmids. The capillaries were centrifuged for 10 minutes at 5000 rpm at room temperature and the volume fraction of the red blood cells compared to the total blood volume was determined and expressed as a percentile, determining the hematocrit level.

Como se puede deducir de la Fig. 16 el grupo de ratones inyectados por MAR-Network inducido desde el comienzo del experimento, presentaban una mejor inducción del hematocrito en comparación con los ratones inyectados con el sistema Network original sin la MAR. Después de 2 meses, los hematocritos en "grupos que contenían MAR" estaban todavía en valores superiores (65%) a los niveles normales del hematocrito (45-55%). As it can be deduced from Fig. 16 the group of mice injected by MAR-Network induced from the beginning of the experiment, presented a better induction of hematocrit compared to the mice injected with the original Network system without MAR. After 2 months, hematocrits in "groups containing MAR" were still higher (65%) than normal hematocrit levels (45-55%).

Lo que es más importante, la inducción tardía (día 21) es posible solamente en presencia de MAR pero en ratones a los que fue inyectado el sistema Network sin la MAR. Por tanto, la MAR protege probablemente a los transgenes del silenciamiento y permite la inducción de su expresión incluso después de un periodo prolongado en condiciones no inductoras. Most importantly, late induction (day 21) is possible only in the presence of MAR but in mice that were injected with the Network system without MAR. Thus, MAR probably protects transgenes from silencing and allows induction of their expression even after a prolonged period under non-inductive conditions.

Globalmente, el elemento MAR es capaz de aumentar la expresión del gen terapéutico, como se detecta por el aumento de su efecto fisiológico en el hematocrito. Globally, the MAR element is capable of increasing the expression of the therapeutic gene, as detected by the increase in its physiological effect on the hematocrit.

SEQUENCE LIST

SEQUENCE LISTING SEQUENCE LISTING

5 <110> Selexis S.A. 5 <110> Selexis S.A.

<120> Transferencia y expresión de genes de alta eficacia en células de mamíferos por un método de transfección múltiple de secuencias de regiones de fijación a la matriz <120> High-efficiency gene transfer and expression in mammalian cells by a multiple transfection method of matrix-binding region sequences

10 <130> P2560EP04

<150> US 60/513.574 <150> US 60 / 513,574

<151> <151>

15 <150> EP 08153753.2

<151> <151>

<150> EP 04002722.9 <150> EP 04002722.9

<151> 20 <151> 20

<150> EP 04790766.2 <150> EP 04790766.2

<151> <151>

<160> 241 25 <160> 241 25

<170> PatentIn versión 3.5 <170> PatentIn version 3.5

<210> 1 <210> 1

<211> 320 30 <212> DNA <211> 320 30 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 35 <222> (1)..(320) union_misc 35 <222> (1) .. (320)

<223> MAR de cromosoma humano 1, nt desde 36686 a 37008 <223> MAR of human chromosome 1, nt from 36686 to 37008

<220> <220>

<221> <221>: unión_misc 40 <222> (1)..(320) union_misc 40 <222> (1) .. (320)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 36686 a 37008 <223> MAR of human chromosome 1, genomic contigs; 36686 to 37008

<400> 1 <400> 1

<210> 2 <210> 2

<211> 709 <211> 709

<212> DNA 50 <213> Homo sapiens <212> DNA 50 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(709) 55 <223> MAR de cromosoma humano 1, nt desde 142276 a 142984 <222> (1) .. (709) 55 <223> MAR of human chromosome 1, nt from 142276 to 142984

<220> <221> unión_misc <220> <221> union_misc

<222> (1)..(709) <222> (1) .. (709)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 142276 a 142984 <223> MAR of human chromosome 1, genomic contigs; 142276 to 142984

<400> 2 <400> 2

<210> 3 10 <211> 409 <210> 3 10 <211> 409

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>: 15 <221> unión_misc 15 <221> union_misc

<222> (1)..(409) <222> (1) .. (409)

<223> MAR de cromosoma humano 1, nt desde 1368659 a 1369067 <223> MAR of human chromosome 1, nt from 1368659 to 1369067

<220> <220>: 20 <221> unión_misc 20 <221> union_misc

<222> (1)..(409) <222> (1) .. (409)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 1368659 a 1369067 <223> MAR of human chromosome 1, genomic contigs; 1368659 to 1369067

<400> 3 25 <400> 3 25

<210> 4 <210> 4

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 35 <222> (1)..(394) <221> union_misc 35 <222> (1) .. (394)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 2839089 a 2839482 <223> MAR of human chromosome 1, genomic contigs; 2839089 to 2839482

<400> 4 <400> 4

5 <210> 5 5 <210> 5

<211> 832 <211> 832

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

10 <220> 10 <220>

<221> unión_misc <221> union_misc

<222> (1)..(832) <222> (1) .. (832)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 1452269 a 1453100 <223> MAR of human chromosome 1, genomic contigs; 1452269 to 1453100

15 <400> 5 15 <400> 5

<210> 6 20 <211> 350 <210> 6 20 <211> 350

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(350) <222> (1) .. (350)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 831495 a 831844 <223> MAR of human chromosome 1, genomic contigs; 831495 to 831844

<400> 6 30 <210> 7 <400> 6 30 <210> 7

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(386) <221> union_misc 10 <222> (1) .. (386)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 1447225 a 1447610 <223> MAR of human chromosome 1, genomic contigs; 1447225 to 1447610

<400> 7 <400> 7

<210> 8 <210> 8

<211> 585 <211> 585

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(585) 25 <223> MAR de cromosoma humano 1, cóntigos genómicos; 4955365 a 4955949 <222> (1) .. (585) 25 <223> MAR of human chromosome 1, genomic contigs; 4955365 to 4955949

<400> 8 <400> 8

<210> 9 <210> 9

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 5 <221> unión_misc <220> 5 <221> union_misc

<222> (1)..(772) <222> (1) .. (772)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 5971862 a 5972633 <223> MAR of human chromosome 1, genomic contigs; 5971862 to 5972633

<400> 9 10 <400> 9 10

<210> 10 <210> 10

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 20 <222> (1)..(304) <221> union_misc 20 <222> (1) .. (304)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 6221897 a 6222200 <223> MAR of human chromosome 1, genomic contigs; 6221897 to 6222200

<400> 10 <400> 10

<210> 11 <210> 11

<211> 311 <211> 311

<212> DNA 30 <213> Homo sapiens <212> DNA 30 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(311) 35 <223> MAR de cromosoma humano 1, cóntigos genómicos; 9418531 a 9418841 <222> (1) .. (311) 35 <223> MAR of human chromosome 1, genomic contigs; 9418531 to 9418841

<400> 11 <212> DNA <400> 11 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 10 <221> unión_misc <220> 10 <221> union_misc

<222> (1)..(302) <222> (1) .. (302)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 15088789 a 15089090 <223> MAR of human chromosome 1, genomic contigs; 15088789 to 15089090

<400> 12 15 <400> 12 15

<210> 13 <210> 13

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 25 <222> (1)..(461) <221> union_misc 25 <222> (1) .. (461)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 6791827 a 6792287 <223> MAR of human chromosome 1, genomic contigs; 6791827 to 6792287

<400> 13 <400> 13

<210> <210>: 14 35 <211> 572 14 35 <211> 572

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(572) <222> (1) .. (572)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 163530 a 164101 <223> MAR of human chromosome 1, genomic contigs; 163530 to 164101

<400> 14 <400> 14

<210> <210>: 15 10 <211> 357 15 10 <211> 357

36 <212> DNA 36 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 15 <221> unión_misc <220> 15 <221> union_misc

<222> (1)..(357) <222> (1) .. (357)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 1842332 a 1842688 <223> MAR of human chromosome 1, genomic contigs; 1842332 to 1842688

<400> 15 20 <400> 15 20

<210> 16 <210> 16

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 30 <222> (1)..(399) union_misc 30 <222> (1) .. (399)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 2309560 a 2309958 <223> MAR of human chromosome 1, genomic contigs; 2309560 to 2309958

<400> 16 <400> 16

<210> 17 <210> 17

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(394) union_misc 10 <222> (1) .. (394)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 2231759 a 2232152 <223> MAR of human chromosome 1, genomic contigs; 2231759 to 2232152

<400> 17 <400> 17

<210> 18 <210> 18

<211> 387 <211> 387

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(387) 25 <223> MAR de cromosoma humano 1, cóntigos genómicos; 7406524 a 7406910 <222> (1) .. (387) 25 <223> MAR of human chromosome 1, genomic contigs; 7406524 to 7406910

<400> 18 <400> 18

<210> 19 <210> 19

<213> Homo sapiens <220> <213> Homo sapiens <220>

<221> unión_misc <221> union_misc

<222> (1)..(370) <222> (1) .. (370)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 9399572 a 9399941 <223> MAR of human chromosome 1, genomic contigs; 9399572 to 9399941

<400> 19 <400> 19

10 <210> 20 10 <210> 20

<211> 377 <211> 377

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

15 <220>

<221> unión_misc <221> union_misc

<222> (1)..(377) <222> (1) .. (377)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 12417411 a 12417787 <223> MAR of human chromosome 1, genomic contigs; 12417411 to 12417787

20 <400> 20 20 <400> 20

<210> 21 25 <211> 1524 <210> 21 25 <211> 1524

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 30 <221> unión_misc <220> 30 <221> union_misc

<222> (1)..(1524) <222> (1) .. (1524)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 1643307 a 1644830 <223> MAR of human chromosome 1, genomic contigs; 1643307 to 1644830

<400> 21 35 <210> 22 <400> 21 35 <210> 22

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(664) <221> union_misc 10 <222> (1) .. (664)

<223> MAR de cromosoma humano 1, cóntigos genómicos; 1398763 a 1399426 <223> MAR of human chromosome 1, genomic contigs; 1398763 to 1399426

<400> 22 <400> 22

15 <210> 23 15 <210> 23

<211> 1428 5 <212> DNA <211> 1428 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(1428) <221> union_misc 10 <222> (1) .. (1428)

<223> MAR de cromosoma humano 2, cóntigos genómicos; 17840365 a 17841792 <223> MAR of human chromosome 2, genomic contigs; 17840365 to 17841792

<400> 23 <210> 24 <400> 23 <210> 24

<211> 4624 5 <212> DNA <211> 4624 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(4624) <221> union_misc 10 <222> (1) .. (4624)

<223> MAR 1_6 de cromosoma 1 <223> MAR 1_6 of chromosome 1

<400> 24 <400> 24

<210> 25 <210> 25

<211> 3616 5 <212> DNA <211> 3616 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(3616) <221> union_misc 10 <222> (1) .. (3616)

<223> MAR 1_68 de cromosoma 1 <223> MAR 1_68 on chromosome 1

<400> 25 <400> 25

<210> 26 <210> 26

<211> 4660 5 <212> DNA <211> 4660 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(4660) <221> union_misc 10 <222> (1) .. (4660)

<223> MAR 1_42 de cromosoma 1 <223> MAR 1_42 on chromosome 1

<400> 26 <400> 26

<210> 27 <210> 27

<211> 3354 5 <212> DNA <211> 3354 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(3354) union_misc 10 <222> (1) .. (3354)

<223> MAR X_S29 de cromosoma x <223> MAR X_S29 on chromosome x

<400> 27 <400> 27

<210> 28 <210> 28

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(677) union_misc 10 <222> (1) .. (677)

<223> MAR de cromosoma 1 cóntigos genómicos; 12803267..12803943 <223> MAR of chromosome 1 genomic contigs; 12803267..12803943

<400> 28 <400> 28

<210> 29 <210> 29

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(332) union_misc 10 <222> (1) .. (332)

<223> MAR de cromosoma 1 cóntigos genómicos; 13079684..13080015 <223> MAR of chromosome 1 genomic contigs; 13079684..13080015

<400> 29 <400> 29

<210> 30 <210> 30

<211> 479 <211> 479

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(479) 25 <223> MAR de cromosoma 1 cóntigos genómicos; 15682296..15682774 <222> (1) .. (479) 25 <223> MAR of chromosome 1 genomic contigs; 15682296..15682774

<400> 30 <400> 30

<210> 31 <210> 31

<211> 531 <211> 531

<212> DNA <212> DNA

<213> Homo sapiens <220> <213> Homo sapiens <220>

<221> unión_misc <221> union_misc

<222> (1)..(531) <222> (1) .. (531)

<223> MAR de cromosoma 1 cóntigos genómicos; 15694611..15695141 <223> MAR of chromosome 1 genomic contigs; 15694611..15695141

<400> 31 <400> 31

<210> 32 <210> 32

<211> 378 <211> 378

<212> DNA <212> DNA

<213> Homo sapiens 15 <213> Homo sapiens 15

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(378) <222> (1) .. (378)

<223> MAR de cromosoma 1 cóntigos genómicos; 886276..886653 20 <223> MAR of chromosome 1 genomic contigs; 886276..886653 20

<400> 32 <400> 32

25 <210> 33

<211> 595 <211> 595

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

30 <220>

<221> unión_misc <221> union_misc

<222> (1)..(595) <222> (1) .. (595)

<223> MAR de cromosoma 1 cóntigos genómicos; 3326732..3327326 <223> MAR of chromosome 1 genomic contigs; 3326732..3327326

35 <400> 33 <210> 34

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(738) <221> union_misc 10 <222> (1) .. (738)

<223> MAR de cromosoma 1 cóntigos genómicos; 4485716..4486453 <223> MAR of chromosome 1 genomic contigs; 4485716..4486453

<400> 34 <400> 34

<210> 35 <210> 35

<211> 386 <211> 386

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(386) 25 <223> MAR de cromosoma 1 cóntigos genómicos; 5423067..5423452 <222> (1) .. (386) 25 <223> MAR of chromosome 1 genomic contigs; 5423067..5423452

<400> 35 <210> 36 <400> 35 <210> 36

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(584) <221> union_misc 10 <222> (1) .. (584)

<223> MAR de cromosoma 1 cóntigos genómicos; 5805559..5806142 <223> MAR of chromosome 1 genomic contigs; 5805559..5806142

<400> 36 <400> 36

<210> 37 <210> 37

<211> 345 <211> 345

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(345) 25 <223> MAR de cromosoma 1 cóntigos genómicos; 10802644..10802988 <222> (1) .. (345) 25 <223> MAR of chromosome 1 genomic contigs; 10802644..10802988

<400> 37 <400> 37

<210> 38 <210> 38

<211> 474 <212> DNA <211> 474 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 5 <221> unión_misc <220> 5 <221> union_misc

<222> (1)..(474) <222> (1) .. (474)

<223> MAR de cromosoma 1 cóntigos genómicos; 13496468..13496941 <223> MAR of chromosome 1 genomic contigs; 13496468..13496941

<400> 38 10 <400> 38 10

<210> 39 <210> 39

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 20 <222> (1)..(483) <221> union_misc 20 <222> (1) .. (483)

<223> MAR de cromosoma 1 cóntigos genómicos; 2509163..2509645 <223> MAR of chromosome 1 genomic contigs; 2509163..2509645

<400> 39 <400> 39

<210> 40 <210> 40

<211> 641 <211> 641

<212> DNA 30 <213> Homo sapiens <212> DNA 30 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(641) 35 <223> MAR de cromosoma 1 cóntigos genómicos; 2776349..2776989 <222> (1) .. (641) 35 <223> MAR of chromosome 1 genomic contigs; 2776349..2776989

<400> 40 <210> 41 <400> 40 <210> 41

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(745) <221> union_misc 10 <222> (1) .. (745)

<223> MAR de cromosoma 1 cóntigos genómicos; 2858703..2859447 <223> MAR of chromosome 1 genomic contigs; 2858703..2859447

<400> 41 <400> 41

<210> 42 <210> 42

<211> 307 <211> 307

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(307) 25 <223> MAR de cromosoma 1 cóntigos genómicos; 945522..945828 <222> (1) .. (307) 25 <223> MAR of chromosome 1 genomic contigs; 945522..945828

<400> 42 <210> 43 <400> 42 <210> 43

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(357) <221> union_misc 10 <222> (1) .. (357)

<223> MAR de cromosoma 1 cóntigos genómicos; 3402743..3403099 <223> MAR of chromosome 1 genomic contigs; 3402743..3403099

<400> 43 <400> 43

<210> 44 <210> 44

<211> 323 <211> 323

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(323) 25 <223> MAR de cromosoma 1 cóntigos genómicos; 3485830..3486152 <222> (1) .. (323) 25 <223> MAR of chromosome 1 genomic contigs; 3485830..3486152

<400> 44 <400> 44

<210> 45 <210> 45

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 40 <222> (1)..(498) <221> union_misc 40 <222> (1) .. (498)

<223> MAR de cromosoma 1 cóntigos genómicos; 3548336..3548833 <400> 45 <223> MAR of chromosome 1 genomic contigs; 3548336..3548833 <400> 45

5 <210> 46 5 <210> 46

<211> 400 <211> 400

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

10 <220> 10 <220>

<221> unión_misc <221> union_misc

<222> (1)..(400) <222> (1) .. (400)

<223> MAR de cromosoma 1 cóntigos genómicos; 4595109..4595508 <223> MAR of chromosome 1 genomic contigs; 4595109..4595508

15 <400> 46 15 <400> 46

<210> 47 20 <211> 403 <210> 47 20 <211> 403

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(403) <222> (1) .. (403)

<223> MAR de cromosoma 1 cóntigos genómicos; 7205509..7205911 <223> MAR of chromosome 1 genomic contigs; 7205509..7205911

<400> 47 30 <400> 47 30

<210> 48 <211> 309 <210> 48 <211> 309

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

5 <220> 5 <220>

<221> unión_misc <221> union_misc

<222> (1)..(309) <222> (1) .. (309)

<223> MAR de cromosoma 1 cóntigos genómicos; 7507280..7507588 <223> MAR of chromosome 1 genomic contigs; 7507280..7507588

10 <400> 48 10 <400> 48

<210> 49 15 <211> 516 <210> 49 15 <211> 516

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 20 <221> unión_misc <220> 20 <221> union_misc

<222> (1)..(516) <222> (1) .. (516)

<223> MAR de cromosoma 1 cóntigos genómicos; 3581085..3581600 <223> MAR of chromosome 1 genomic contigs; 3581085..3581600

<400> 49 25 <400> 49 25

30 <210> 50 30 <210> 50

<211> 534 <211> 534

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

35 <220>

<221> unión_misc <221> union_misc

<222> (1)..(534) <222> (1) .. (534)

<223> MAR de cromosoma 1 cóntigos genómicos; 3084851..3085384 <223> MAR of chromosome 1 genomic contigs; 3084851..3085384

40 <400> 50 <210> 51 40 <400> 50 <210> 51

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(583) <221> union_misc 10 <222> (1) .. (583)

<223> MAR de cromosoma 1 cóntigos genómicos; 160087..160669 <223> MAR of chromosome 1 genomic contigs; 160087..160669

<400> 51 <400> 51

<210> 52 <210> 52

<211> 314 <211> 314

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(314) 25 <223> MAR de cromosoma 1 cóntigos genómicos; 4350424..4350737 <222> (1) .. (314) 25 <223> MAR of chromosome 1 genomic contigs; 4350424..4350737

<400> 52 <400> 52

<210> 53 <210> 53

<211> 828 <211> 828

<212> DNA 5 <213> Homo sapiens <212> DNA 5 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(828) 10 <223> MAR de cromosoma 1 cóntigos genómicos; 8443267..8444094 <222> (1) .. (828) 10 <223> MAR of chromosome 1 genomic contigs; 8443267..8444094

<400> 53 <400> 53

<210> 54 <210> 54

<211> 573 <211> 573

<212> DNA <212> DNA

<213> Homo sapiens 20 <213> Homo sapiens 20

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(573) <222> (1) .. (573)

<223> MAR de cromosoma 1 cóntigos genómicos; 8703190..8703762 25 <223> MAR of chromosome 1 genomic contigs; 8703190..8703762 25

<400> 54 <400> 54

<210> 55 <210> 55

<211> 597 <211> 597

<212> DNA <212> DNA

<213> Homo sapiens 5 <213> Homo sapiens 5

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(597) <222> (1) .. (597)

<223> MAR de cromosoma 1 cóntigos genómicos; 8819076..8819672 10 <223> MAR of chromosome 1 genomic contigs; 8819076..8819672 10

<400> 55 <400> 55

15 <210> 56 15 <210> 56

<211> 646 <211> 646

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

20 <220> 20 <220>

<221> unión_misc <221> union_misc

<222> (1)..(646) <222> (1) .. (646)

<223> MAR de cromosoma 1 cóntigos genómicos; 759619..760264 <223> MAR of chromosome 1 genomic contigs; 759619..760264

25 <400> 56 25 <400> 56

<210> <210>: 57 30 <211> 752 57 30 <211> 752

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(752) <222> (1) .. (752)

<223> MAR de cromosoma 1 cóntigos genómicos; 1226710..1227461 <223> MAR of chromosome 1 genomic contigs; 1226710..1227461

<400> 57 <400> 57

<210> <210>: 58 10 <211> 300 58 10 <211> 300

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 15 <221> unión_misc <220> 15 <221> union_misc

<222> (1)..(300) <222> (1) .. (300)

<223> MAR de cromosoma 1 cóntigos genómicos; 1119049..1119348 <223> MAR of chromosome 1 genomic contigs; 1119049..1119348

<400> 58 20 <400> 58 20

<210> 59 <210> 59

<211> 617 25 <212> DNA <211> 617 25 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 30 <222> (1)..(617) union_misc 30 <222> (1) .. (617)

<223> MAR de cromosoma 1 cóntigos genómicos; 3603613..3604229 <223> MAR of chromosome 1 genomic contigs; 3603613..3604229

<400> 59 <400> 59

<210> 60 <210> 60

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(674) union_misc 10 <222> (1) .. (674)

<223> MAR de cromosoma 1 cóntigos genómicos; 2592460..2593133 <223> MAR of chromosome 1 genomic contigs; 2592460..2593133

<400> 60 <400> 60

<210> 61 20 <211> 1694 <210> 61 20 <211> 1694

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(1694) <222> (1) .. (1694)

<223> MAR de cromosoma 1 cóntigos genómicos; 2891680..2893373 <223> MAR of chromosome 1 genomic contigs; 2891680..2893373

<400> 61 30 5 <210> 62 <400> 61 30 5 <210> 62

<211> 587 <211> 587

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

10 <220> 10 <220>

<221> unión_misc <221> union_misc

<222> (1)..(587) <222> (1) .. (587)

<223> MAR de cromosoma 1 cóntigos genómicos; 3432560..3433146 <223> MAR of chromosome 1 genomic contigs; 3432560..3433146

15 <400> 62 <210> 63 15 <400> 62 <210> 63

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(313) <221> misc_union 10 <222> (1) .. (313)

<223> MAR de cromosoma 1 cóntigos genómicos; 3805392..3805704 <223> MAR of chromosome 1 genomic contigs; 3805392..3805704

<400> 63 <400> 63

<210> 64 20 <211> 349 <210> 64 20 <211> 349

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(349) <222> (1) .. (349)

<223> MAR de cromosoma 1 cóntigos genómicos; 4521378..4521726 <223> MAR of chromosome 1 genomic contigs; 4521378..4521726

<400> 64 30 <400> 64 30

<210> 65 <210> 65

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(500) <222> (1) .. (500)

<223> MAR de cromosoma 1 cóntigos genómicos; 3240166..3240665 <223> MAR of chromosome 1 genomic contigs; 3240166..3240665

<400> 65 <400> 65

<210> 66 <210> 66

<211> 866 <211> 866

<212> DNA 15 <213> Homo sapiens <212> DNA 15 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(866) 20 <223> MAR de cromosoma 1 cóntigos genómicos; 409429..410294 <222> (1) .. (866) 20 <223> MAR of chromosome 1 genomic contigs; 409429..410294

<400> 66 <400> 66

25 <210> 67 25 <210> 67

<211> 335 <211> 335

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(335) <222> (1) .. (335)

<223> MAR de cromosoma 1 cóntigos genómicos; 614754..615088 <223> MAR of chromosome 1 genomic contigs; 614754..615088

<400> 67 <400> 67

10 <210> 68 10 <210> 68

<211> 455 <211> 455

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

15 <220> 15 <220>

<221> unión_misc <221> union_misc

<222> (1)..(455) <222> (1) .. (455)

<223> MAR de cromosoma 1 cóntigos genómicos; 1299520..1299974 <223> MAR of chromosome 1 genomic contigs; 1299520..1299974

20 <400> 68 20 <400> 68

<210> 69 25 <211> 404 <210> 69 25 <211> 404

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 30 <221> unión_misc <220> 30 <221> union_misc

<222> (1)..(404) <222> (1) .. (404)

<223> MAR de cromosoma 1 cóntigos genómicos; 1970778..1971181 <223> MAR of chromosome 1 genomic contigs; 1970778..1971181

<400> 69 35 <400> 69 35

<210> 70 <210> 70

<211> 605 <211> 605

<212> DNA 5 <213> Homo sapiens <212> DNA 5 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(605) 10 <223> MAR de cromosoma 1 cóntigos genómicos; 3562918..3563522 <222> (1) .. (605) 10 <223> MAR of chromosome 1 genomic contigs; 3562918..3563522

<400> 70 <400> 70

<210> 71 <210> 71

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 25 <222> (1)..(317) <221> union_misc 25 <222> (1) .. (317)

<223> MAR de cromosoma 1 cóntigos genómicos; 189743..190059 <223> MAR of chromosome 1 genomic contigs; 189743..190059

<400> 71 <400> 71

<210> 72 <210> 72

<211> 522 <211> 522

<212> DNA 35 <213> Homo sapiens <212> DNA 35 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(522) 40 <223> MAR de cromosoma 1 cóntigos genómicos; 229111..229632 <222> (1) .. (522) 40 <223> MAR of chromosome 1 genomic contigs; 229111..229632

<400> 72 <212> DNA <400> 72 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 10 <221> unión_misc <220> 10 <221> union_misc

<222> (1)..(1110) <222> (1) .. (1110)

<223> MAR de cromosoma 1 cóntigos genómicos; 1138030..1139139 <223> MAR of chromosome 1 genomic contigs; 1138030..1139139

<400> 73 <400> 73

<210> 74 <210> 74

<211> 521 <211> 521

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

70 <222> (1)..(521) 70 <222> (1) .. (521)

<223> MAR de cromosoma 1 cóntigos genómicos; 2863407..2863927 <223> MAR of chromosome 1 genomic contigs; 2863407..2863927

<400> 74 <400> 74

10 <210> 75 10 <210> 75

<211> 560 <211> 560

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

15 <220> 15 <220>

<221> unión_misc <221> union_misc

<222> (1)..(560) <222> (1) .. (560)

<223> MAR de cromosoma 1 cóntigos genómicos; 5712303..5712869 <223> MAR of chromosome 1 genomic contigs; 5712303..5712869

20 <400> 75 20 <400> 75

<210> 76 25 <211> 479 <210> 76 25 <211> 479

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 30 <221> unión_misc <220> 30 <221> union_misc

<222> (1)..(479) <222> (1) .. (479)

<223> MAR de cromosoma 1 cóntigos genómicos; 8578812..8579290 <223> MAR of chromosome 1 genomic contigs; 8578812..8579290

<400> 76 35 5 <210> 77 <400> 76 35 5 <210> 77

<211> 477 <211> 477

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

10 <220> 10 <220>

<221> unión_misc <221> union_misc

<222> (1)..(477) <222> (1) .. (477)

<223> MAR de cromosoma 1 cóntigos genómicos; 8579294..8579770 <223> MAR of chromosome 1 genomic contigs; 8579294..8579770

15 <400> 77 15 <400> 77

<210> 78 20 <211> 331 <210> 78 20 <211> 331

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(331) <222> (1) .. (331)

<223> MAR de cromosoma 1 cóntigos genómicos; 8580024..8580354 <223> MAR of chromosome 1 genomic contigs; 8580024..8580354

<400> 78 30 <400> 78 30

<210> 79 <210> 79

<213> Homo sapiens 72 <220> <213> Homo sapiens 72 <220>

<221> unión_misc <221> union_misc

<222> (1)..(410) <222> (1) .. (410)

<223> MAR de cromosoma 1 cóntigos genómicos; 8580705..8581114 <223> MAR of chromosome 1 genomic contigs; 8580705..8581114

<400> 79 <400> 79

<210> 80 <210> 80

<211> 433 <211> 433

<212> DNA <212> DNA

<213> Homo sapiens 15 <213> Homo sapiens 15

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(433) <222> (1) .. (433)

<223> MAR de cromosoma 1 cóntigos genómicos; 12979167..12979599 20 <223> MAR of chromosome 1 genomic contigs; 12979167..12979599 20

<400> 80 <400> 80

25 <210> 81 25 <210> 81

<211> 385 <211> 385

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

30 <220> 30 <220>

<221> unión_misc <221> union_misc

<222> (1)..(385) <222> (1) .. (385)

<223> MAR de cromosoma 1 cóntigos genómicos; 16336644..16337028 <223> MAR of chromosome 1 genomic contigs; 16336644..16337028

35 <400> 81 <210> 82 35 <400> 81 <210> 82

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(363) <221> union_misc 10 <222> (1) .. (363)

<223> MAR de cromosoma 1 cóntigos genómicos; 20624448..20624810 <223> MAR of chromosome 1 genomic contigs; 20624448..20624810

<400> 82 <400> 82

<210> 83 <210> 83

<211> 310 <211> 310

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(310) 25 <223> MAR de cromosoma 1 cóntigos genómicos; 566025..566334 <222> (1) .. (310) 25 <223> MAR of chromosome 1 genomic contigs; 566025..566334

<400> 83 <400> 83

<210> 84 <210> 84

<211> 1236 <211> 1236

<212> DNA <212> DNA

<213> Homo sapiens 35 <213> Homo sapiens 35

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(1236) <222> (1) .. (1236)

<223> MAR de cromosoma 1 cóntigos genómicos; 1171429..1172664 <223> MAR of chromosome 1 genomic contigs; 1171429..1172664

<400> 84 <400> 84

10 <210> 85 10 <210> 85

<211> 309 <211> 309

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

15 <220> 15 <220>

<221> unión_misc <221> union_misc

<222> (1)..(309) <222> (1) .. (309)

<223> MAR de cromosoma 1 cóntigos genómicos; 1925173..1925481 <223> MAR of chromosome 1 genomic contigs; 1925173..1925481

20 <400> 85 20 <400> 85

<210> 86 25 <211> 312 <210> 86 25 <211> 312

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 5 <221> unión_misc <220> 5 <221> union_misc

<222> (1)..(312) <222> (1) .. (312)

<223> MAR de cromosoma 1 cóntigos genómicos; 4396756..4397067 <223> MAR of chromosome 1 genomic contigs; 4396756..4397067

<400> 86 10 <400> 86 10

<210> 87 <210> 87

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 20 <222> (1)..(398) <221> union_misc 20 <222> (1) .. (398)

<223> MAR de cromosoma 1 cóntigos genómicos; 56057..56454 <223> MAR of chromosome 1 genomic contigs; 56057..56454

<400> 87 <400> 87

<210> 88 <210> 88

<211> 391 <211> 391

<212> DNA 30 <213> Homo sapiens <212> DNA 30 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(391) 35 <223> MAR de cromosoma 1 cóntigos genómicos; 56984..57374 <222> (1) .. (391) 35 <223> MAR of chromosome 1 genomic contigs; 56984..57374

<400> 88 <400> 88

<210> 89 5 <211> 309 <210> 89 5 <211> 309

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 10 <221> unión_misc <220> 10 <221> union_misc

<222> (1)..(309) <222> (1) .. (309)

<223> MAR de cromosoma 1 cóntigos genómicos; 469547..469855 <223> MAR of chromosome 1 genomic contigs; 469547..469855

<400> 89 15 <400> 89 15

<210> 90 <210> 90

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 25 <222> (1)..(441) <221> union_misc 25 <222> (1) .. (441)

<223> MAR de cromosoma 1 cóntigos genómicos; 546190..546630 <223> MAR of chromosome 1 genomic contigs; 546190..546630

<400> 90 <400> 90

<210> 91 <210> 91

<211> 1367 <211> 1367

<212> DNA 35 <213> Homo sapiens <212> DNA 35 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(1367) 40 <223> MAR de cromosoma 1 cóntigos genómicos; 124643..126009 <222> (1) .. (1367) 40 <223> MAR of chromosome 1 genomic contigs; 124643..126009

<400> 91 <210> 92 <400> 91 <210> 92

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(458) <221> union_misc 10 <222> (1) .. (458)

<223> MAR de cromosoma 1 cóntigos genómicos; 58908..59365 <223> MAR of chromosome 1 genomic contigs; 58908..59365

<400> 92 <400> 92

<210> 93 20 <211> 330 <210> 93 20 <211> 330

<212> DNA <212> DNA

78 <213> Homo sapiens 78 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(330) <222> (1) .. (330)

<223> MAR de cromosoma 1 cóntigos genómicos; 306867..307196 <223> MAR of chromosome 1 genomic contigs; 306867..307196

<400> 93 <400> 93

<210> 94 <210> 94

<211> 353 <211> 353

<212> DNA 15 <213> Homo sapiens <212> DNA 15 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(353) 20 <223> MAR de cromosoma 1 cóntigos genómicos; 636899..637251 <222> (1) .. (353) 20 <223> MAR of chromosome 1 genomic contigs; 636899..637251

<400> 94 <400> 94

<210> 95 <210> 95

<211> 345 <211> 345

<212> DNA <212> DNA

<213> Homo sapiens 30 <213> Homo sapiens 30

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(345) <222> (1) .. (345)

<223> MAR de cromosoma 1 cóntigos genómicos; 1435510..1435854 35 <223> MAR of chromosome 1 genomic contigs; 1435510..1435854 35

<400> 95 <400> 95

<210> 96 <210> 96

<211> 521 <211> 521

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

5 <220> 5 <220>

<221> unión_misc <221> union_misc

<222> (1)..(521) <222> (1) .. (521)

<223> MAR de cromosoma 1 cóntigos genómicos; 39695..40215 <223> MAR of chromosome 1 genomic contigs; 39695..40215

10 <400> 96 10 <400> 96

<210> 97 15 <211> 484 <210> 97 15 <211> 484

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 20 <221> unión_misc <220> 20 <221> union_misc

<222> (1)..(484) <222> (1) .. (484)

<223> MAR de cromosoma 1 cóntigos genómicos; 1286007..1286490 <223> MAR of chromosome 1 genomic contigs; 1286007..1286490

<400> 97 25 <400> 97 25

<210> 98 <210> 98

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 35 <222> (1)..(244) <221> union_misc 35 <222> (1) .. (244)

<223> MAR de cromosoma 1 cóntigos genómicos; 73556..73879 <223> MAR of chromosome 1 genomic contigs; 73556..73879

<400> 98 <400> 98

<210> 99 <210> 99

<211> 463 5 <212> DNA <211> 463 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(463) <221> union_misc 10 <222> (1) .. (463)

<223> MAR de cromosoma 1 cóntigos genómicos; 179038..179500 <223> MAR of chromosome 1 genomic contigs; 179038..179500

<400> 99 <400> 99

<210> 100 <210> 100

<211> 390 <211> 390

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(390) 25 <223> MAR de cromosoma 1 cóntigos genómicos; 55617..56006 <222> (1) .. (390) 25 <223> MAR of chromosome 1 genomic contigs; 55617..56006

<400> 100 <400> 100

<210> 101 <210> 101

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(582) <222> (1) .. (582)

<223> MAR de cromosoma 2 cóntigos genómicos; 1157405..1157986 <223> MAR of chromosome 2 genomic contigs; 1157405..1157986

<400> 101 <400> 101

<210> 102 <210> 102

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 15 <222> (1)..(322) <221> union_misc 15 <222> (1) .. (322)

<223> MAR de cromosoma 2 cóntigos genómicos; 1858638..1858959 <223> MAR of chromosome 2 genomic contigs; 1858638..1858959

<400> 102 <400> 102

<210> 103 <210> 103

<211> 914 <211> 914

<212> DNA 25 <213> Homo sapiens <212> DNA 25 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(914) 30 <223> MAR de cromosoma 2 cóntigos genómicos; 5712196..5713109 <222> (1) .. (914) 30 <223> MAR of chromosome 2 genomic contigs; 5712196..5713109

<400> 103 <210> 104 <400> 103 <210> 104

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(370) <221> union_misc 10 <222> (1) .. (370)

<223> MAR de cromosoma 2 cóntigos genómicos; 5713613..5713982 <223> MAR of chromosome 2 genomic contigs; 5713613..5713982

<400> 104 <400> 104

<210> 105 <210> 105

<211> 442 <211> 442

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(442) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 7481647..7482088 <222> (1) .. (442) 25 <223> MAR of chromosome 2 genomic contigs; 7481647..7482088

<400> 105 <210> 106 <400> 105 <210> 106

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(338) <221> union_misc 10 <222> (1) .. (338)

<223> MAR de cromosoma 2 cóntigos genómicos; 9594557..9594894 <223> MAR of chromosome 2 genomic contigs; 9594557..9594894

<400> 106 <400> 106

<210> 107 <210> 107

<211> 364 <211> 364

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(364) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 10519720..10520083 <222> (1) .. (364) 25 <223> MAR of chromosome 2 genomic contigs; 10519720..10520083

<400> 107 <400> 107

<210> 108 <210> 108

<213> Homo sapiens <220> <213> Homo sapiens <220>

<221> unión_misc <221> union_misc

<222> (1)..(342) <222> (1) .. (342)

<223> MAR de cromosoma 2 cóntigos genómicos; 11481943..11482284 <223> MAR of chromosome 2 genomic contigs; 11481943..11482284

<400> 108 <400> 108

10 <210> 109 10 <210> 109

<211> 415 <211> 415

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

15 <220> 15 <220>

<221> unión_misc <221> union_misc

<222> (1)..(415) <222> (1) .. (415)

<223> MAR de cromosoma 2 cóntigos genómicos; 13499598..13500012 <223> MAR of chromosome 2 genomic contigs; 13499598..13500012

20 <400> 109 20 <400> 109

<210> 110 25 <211> 330 <210> 110 25 <211> 330

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 30 <221> unión_misc <220> 30 <221> union_misc

<222> (1)..(330) <222> (1) .. (330)

<223> MAR de cromosoma 2 cóntigos genómicos; 16370976..16371305 <223> MAR of chromosome 2 genomic contigs; 16370976..16371305

<400> 110 35 <400> 110 35

<210> 111 <210> 111

<211> 702 <212> DNA <211> 702 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 5 <221> unión_misc <220> 5 <221> union_misc

<222> (1)..(702) <222> (1) .. (702)

<223> MAR de cromosoma 2 cóntigos genómicos; 626641..627342 <223> MAR of chromosome 2 genomic contigs; 626641..627342

<400> 111 10 <400> 111 10

<210> 112 <210> 112

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 20 <222> (1)..(679) <221> union_misc 20 <222> (1) .. (679)

<223> MAR de cromosoma 2 cóntigos genómicos; 3196047..3196725 <223> MAR of chromosome 2 genomic contigs; 3196047..3196725

<400> 112 <400> 112

<210> 113 30 <211> 728 <210> 113 30 <211> 728

<212> DNA 86 <212> DNA 86

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(728) <222> (1) .. (728)

<223> MAR de cromosoma 2 cóntigos genómicos; 3196778..3197505 <223> MAR of chromosome 2 genomic contigs; 3196778..3197505

<400> 113 <400> 113

<210> 114 <210> 114

<211> 413 <211> 413

<212> DNA <212> DNA

<213> Homo sapiens 15 <220> <213> Homo sapiens 15 <220>

<221> unión_misc <221> union_misc

<222> (1)..(413) <222> (1) .. (413)

<223> MAR de cromosoma 2 cóntigos genómicos; 2560638..2561050 <223> MAR of chromosome 2 genomic contigs; 2560638..2561050

<400> 114 <400> 114

<210> 115 <210> 115

<211> 361 <211> 361

<212> DNA 25 <213> Homo sapiens <212> DNA 25 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(361) 30 <223> MAR de cromosoma 2 cóntigos genómicos; 4965309..4965669 <222> (1) .. (361) 30 <223> MAR of chromosome 2 genomic contigs; 4965309..4965669

<400> 115 87 <400> 115 87

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 10 <221> unión_misc <220> 10 <221> union_misc

<222> (1)..(325) <222> (1) .. (325)

<223> MAR de cromosoma 2 cóntigos genómicos; 5258150..5258474 <223> MAR of chromosome 2 genomic contigs; 5258150..5258474

<400> 116 15 <400> 116 15

<210> 117 <210> 117

<211> 1508 20 <212> DNA <211> 1508 20 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 25 <222> (1)..(1508) union_misc 25 <222> (1) .. (1508)

<223> MAR de cromosoma 2 cóntigos genómicos; 6057499..6059006 <223> MAR of chromosome 2 genomic contigs; 6057499..6059006

<400> 117 <400> 117

<210> 118 <210> 118

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(415) union_misc 10 <222> (1) .. (415)

<223> MAR de cromosoma 2 cóntigos genómicos; 7996866..7997280 <223> MAR of chromosome 2 genomic contigs; 7996866..7997280

<400> 118 <400> 118

<210> 119 <210> 119

<211> 526 <211> 526

<212> DNA 5 <213> Homo sapiens <212> DNA 5 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(526) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 8300930..8301455 <222> (1) .. (526) 10 <223> MAR of chromosome 2 genomic contigs; 8300930..8301455

<400> 119 <400> 119

<210> 120 <210> 120

<211> 402 <211> 402

<212> DNA <212> DNA

<213> Homo sapiens 20 <213> Homo sapiens 20

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(402) <222> (1) .. (402)

<223> MAR de cromosoma 2 cóntigos genómicos; 8576553..8576954 25 <223> MAR of chromosome 2 genomic contigs; 8576553..8576954 25

<400> 120 <400> 120

<210> 121 <210> 121

<211> 477 <211> 477

<212> DNA 35 <213> Homo sapiens <212> DNA 35 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(477) 40 <223> MAR de cromosoma 2 cóntigos genómicos; 8785649..8786125 <222> (1) .. (477) 40 <223> MAR of chromosome 2 genomic contigs; 8785649..8786125

<400> 121 <210> 122 <400> 121 <210> 122

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(773) <221> union_misc 10 <222> (1) .. (773)

<223> MAR de cromosoma 2 cóntigos genómicos; 10064737..10065509 <223> MAR of chromosome 2 genomic contigs; 10064737..10065509

<400> 122 <400> 122

<210> 123 20 <211> 1554 <210> 123 20 <211> 1554

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(1554) <222> (1) .. (1554)

<223> MAR de cromosoma 2 cóntigos genómicos; 1039775..1041328 <223> MAR of chromosome 2 genomic contigs; 1039775..1041328

<400> 123 30 5 <210> 124 <400> 123 30 5 <210> 124

<211> 650 <211> 650

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

10 <220> 10 <220>

<221> unión_misc <221> union_misc

<222> (1)..(650) <222> (1) .. (650)

<223> MAR de cromosoma 2 cóntigos genómicos; 3944813..3945462 <223> MAR of chromosome 2 genomic contigs; 3944813..3945462

15 <400> 124 <210> 125 15 <400> 124 <210> 125

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(441) <221> union_misc 10 <222> (1) .. (441)

<223> MAR de cromosoma 2 cóntigos genómicos; 5314265..5314705 <223> MAR of chromosome 2 genomic contigs; 5314265..5314705

<400> 125 <400> 125

<210> 126 <210> 126

<211> 1169 <211> 1169

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(1169) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 5953971..5955139 <222> (1) .. (1169) 25 <223> MAR of chromosome 2 genomic contigs; 5953971..5955139

<400> 126 <210> 127 <400> 126 <210> 127

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(653) <221> union_misc 10 <222> (1) .. (653)

<223> MAR de cromosoma 2 cóntigos genómicos; 6427669..6428321 <223> MAR of chromosome 2 genomic contigs; 6427669..6428321

<400> 127 <400> 127

<210> 128 <210> 128

<211> 414 <211> 414

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

5 <220> 5 <220>

<221> unión_misc <221> union_misc

<222> (1)..(414) <222> (1) .. (414)

<223> MAR de cromosoma 2 cóntigos genómicos; 10890453..10890866 <223> MAR of chromosome 2 genomic contigs; 10890453..10890866

10 <400> 128 10 <400> 128

<210> 129 15 <211> 496 <210> 129 15 <211> 496

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 20 <221> unión_misc <220> 20 <221> union_misc

<222> (1)..(496) <222> (1) .. (496)

<223> MAR de cromosoma 2 cóntigos genómicos; 13952568..13953063 <223> MAR of chromosome 2 genomic contigs; 13952568..13953063

<400> 129 25 <400> 129 25

30 <210> 130 30 <210> 130

<211> 317 <211> 317

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

35 <220>

<221> unión_misc <221> union_misc

<222> (1)..(317) <222> (1) .. (317)

<223> MAR de cromosoma 2 cóntigos genómicos; 16942865..16943181 <223> MAR of chromosome 2 genomic contigs; 16942865..16943181

40 <400> 130 <210> 131 40 <400> 130 <210> 131

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(464) <221> union_misc 10 <222> (1) .. (464)

<223> MAR de cromosoma 2 cóntigos genómicos; 17217049..17217512 <223> MAR of chromosome 2 genomic contigs; 17217049..17217512

<400> 131 <400> 131

<210> 132 <210> 132

<211> 430 <211> 430

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(430) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 19647266..19647695 <222> (1) .. (430) 25 <223> MAR of chromosome 2 genomic contigs; 19647266..19647695

<400> 132 <400> 132

<210> 133 <210> 133

<211> 2131 <211> 2131

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(2131) <222> (1) .. (2131)

<223> MAR de cromosoma 2 cóntigos genómicos; 20481223..20483353 <223> MAR of chromosome 2 genomic contigs; 20481223..20483353

<400> 133 <400> 133

<210> 134 <210> 134

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(842) <221> union_misc 10 <222> (1) .. (842)

<223> MAR de cromosoma 2 cóntigos genómicos; 20483478..20484319 <223> MAR of chromosome 2 genomic contigs; 20483478..20484319

<400> 134 <400> 134

<210> 135 20 <211> 645 <210> 135 20 <211> 645

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(645) <222> (1) .. (645)

<223> MAR de cromosoma 2 cóntigos genómicos; 20897566..20898210 <223> MAR of chromosome 2 genomic contigs; 20897566..20898210

<400> 135 <400> 135

<210> 136 <210> 136

<211> 722 <211> 722

<212> DNA 15 <213> Homo sapiens <212> DNA 15 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(722) 20 <223> MAR de cromosoma 2 cóntigos genómicos; 21664541..21665262 <222> (1) .. (722) 20 <223> MAR of chromosome 2 genomic contigs; 21664541..21665262

<400> 136 <400> 136

<210> 137 <210> 137

<213> Homo sapiens 99 <220> <213> Homo sapiens 99 <220>

<221> unión_misc <221> union_misc

<222> (1)..(305) <222> (1) .. (305)

<223> MAR de cromosoma 2 cóntigos genómicos; 22834991..22835295 <223> MAR of chromosome 2 genomic contigs; 22834991..22835295

<400> 137 <400> 137

<210> 138 <210> 138

<211> 352 <211> 352

<212> DNA <212> DNA

<213> Homo sapiens 15 <213> Homo sapiens 15

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(352) <222> (1) .. (352)

<223> MAR de cromosoma 2 cóntigos genómicos; 25277762..25278113 20 <223> MAR of chromosome 2 genomic contigs; 25277762..25278113 20

<400> 138 <400> 138

25 <210> 139 25 <210> 139

<211> 342 <211> 342

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

30 <220> 30 <220>

<221> unión_misc <221> union_misc

<222> (1)..(342) <222> (1) .. (342)

<223> MAR de cromosoma 2 cóntigos genómicos; 25378452..25378793 <223> MAR of chromosome 2 genomic contigs; 25378452..25378793

35 <400> 139 35 <400> 139

<210> 140 40 <211> 663 <210> 140 40 <211> 663

<212> DNA 100 <212> DNA 100

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(663) <222> (1) .. (663)

<223> MAR de cromosoma 2 cóntigos genómicos; 30209437..30210099 <223> MAR of chromosome 2 genomic contigs; 30209437..30210099

<400> 140 <400> 140

<210> 141 <210> 141

<211> 1200 <211> 1200

<212> DNA 15 <213> Homo sapiens <212> DNA 15 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(1200) 20 <223> MAR de cromosoma 2 cóntigos genómicos; 31725089..31726288 <222> (1) .. (1200) 20 <223> MAR of chromosome 2 genomic contigs; 31725089..31726288

<400> 141 <210> 142 <400> 141 <210> 142

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(325) <221> union_misc 10 <222> (1) .. (325)

<223> MAR de cromosoma 2 cóntigos genómicos; 32147252..32147576 <223> MAR of chromosome 2 genomic contigs; 32147252..32147576

<400> 142 <400> 142

<210> 143 <210> 143

<211> 507 <211> 507

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(507) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 32312662..32313168 <222> (1) .. (507) 25 <223> MAR of chromosome 2 genomic contigs; 32312662..32313168

<400> 143 <210> 144 <400> 143 <210> 144

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(339) <221> union_misc 10 <222> (1) .. (339)

<223> MAR de cromosoma 2 cóntigos genómicos; 33651118..33651456 <223> MAR of chromosome 2 genomic contigs; 33651118..33651456

<400> 144 <400> 144

<210> 145 <210> 145

<211> 461 <211> 461

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(461) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 45073053..45073513 <222> (1) .. (461) 25 <223> MAR of chromosome 2 genomic contigs; 45073053..45073513

<400> 145 <400> 145

<210> 146 <210> 146

<211> 1162 <212> DNA <211> 1162 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 5 <221> unión_misc <220> 5 <221> union_misc

<222> (1)..(1162) <222> (1) .. (1162)

<223> MAR de cromosoma 2 cóntigos genómicos; 45487691..45488852 <223> MAR of chromosome 2 genomic contigs; 45487691..45488852

<400> 146 10 <400> 146 10

<210> 147 <210> 147

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 20 <222> (1)..(562) union_misc 20 <222> (1) .. (562)

<223> MAR de cromosoma 2 cóntigos genómicos; 45516233..45516794 <223> MAR of chromosome 2 genomic contigs; 45516233..45516794

<400> 147 <400> 147

<210> 148 <210> 148

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(801) union_misc 10 <222> (1) .. (801)

25 <223> MAR de cromosoma 2 cóntigos genómicos; 45727251..45728051 25 <223> MAR of chromosome 2 genomic contigs; 45727251..45728051

<400> 148 <400> 148

<210> 149 <210> 149

<211> 346 <211> 346

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(346) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 50937238..50937583 <222> (1) .. (346) 25 <223> MAR of chromosome 2 genomic contigs; 50937238..50937583

<400> 149 <210> 150 <400> 149 <210> 150

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(462) <221> union_misc 10 <222> (1) .. (462)

<223> MAR de cromosoma 2 cóntigos genómicos; 55672627..55673088 <223> MAR of chromosome 2 genomic contigs; 55672627..55673088

<400> 150 <400> 150

<210> 151 <210> 151

<211> 401 <211> 401

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(401) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 56081352..56081752 <222> (1) .. (401) 25 <223> MAR of chromosome 2 genomic contigs; 56081352..56081752

<400> 151 <400> 151

30 35 30 35: <210> 152 <211> 765 <212> DNA <213> Homo sapiens <220> <210> 152 <211> 765 <212> DNA <213> Homo sapiens <220>

106 106

<221> unión_misc <221> union_misc

<222> (1)..(765) <222> (1) .. (765)

<223> MAR de cromosoma 2 cóntigos genómicos; 56404208..56404972 <223> MAR of chromosome 2 genomic contigs; 56404208..56404972

<400> 152 <400> 152

<210> 153 10 <211> 443 <210> 153 10 <211> 443

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 15 <221> unión_misc <220> 15 <221> union_misc

<222> (1)..(443) <222> (1) .. (443)

<223> MAR de cromosoma 2 cóntigos genómicos; 61953416..61953858 <223> MAR of chromosome 2 genomic contigs; 61953416..61953858

<400> 153 20 <400> 153 20

<210> 154 <210> 154

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 30 <222> (1)..(372) union_misc 30 <222> (1) .. (372)

<223> MAR de cromosoma 2 cóntigos genómicos; 62076211..62076582 <223> MAR of chromosome 2 genomic contigs; 62076211..62076582

<400> 154 <400> 154

<210> 155 <210> 155

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(484) union_misc 10 <222> (1) .. (484)

<223> MAR de cromosoma 2 cóntigos genómicos; 62158581..62159064 <223> MAR of chromosome 2 genomic contigs; 62158581..62159064

<400> 155 <400> 155

<210> 156 <210> 156

<211> 644 <211> 644

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(644) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 68145036..68145679 <222> (1) .. (644) 25 <223> MAR of chromosome 2 genomic contigs; 68145036..68145679

<400> 156 <210> 157 <400> 156 <210> 157

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(530) <221> union_misc 10 <222> (1) .. (530)

<223> MAR de cromosoma 2 cóntigos genómicos; 71257289..71257818 <223> MAR of chromosome 2 genomic contigs; 71257289..71257818

<400> 157 <400> 157

<210> 158 <210> 158

<211> 337 <211> 337

<212> DNA 20 <212> DNA 20

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(337) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 73413615..73413951 <222> (1) .. (337) 25 <223> MAR of chromosome 2 genomic contigs; 73413615..73413951

<400> 158 <210> 159 <400> 158 <210> 159

<211> 1340 5 <212> DNA <211> 1340 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(1340) <221> union_misc 10 <222> (1) .. (1340)

<223> MAR de cromosoma 2 cóntigos genómicos; 77011049..77012388 <223> MAR of chromosome 2 genomic contigs; 77011049..77012388

<400> 159 <400> 159

<210> 160 <210> 160

<211> 937 <211> 937

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(937) <222> (1) .. (937)

25 <223> MAR de cromosoma 2 cóntigos genómicos; 78226855..78227791 <400> 160 25 <223> MAR of chromosome 2 genomic contigs; 78226855..78227791 <400> 160

<210> 161 <210> 161

<211> 1350 <211> 1350

<212> DNA <212> DNA

<213> Homo sapiens 10 <213> Homo sapiens 10

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(1350) <222> (1) .. (1350)

<223> MAR de cromosoma 2 cóntigos genómicos; 79287748..79289097 15 <223> MAR of chromosome 2 genomic contigs; 79287748..79289097 15

<400> 161 <210> 162 <400> 161 <210> 162

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> diferencia_misc 10 <222> (1)..(332) <221> difference_misc 10 <222> (1) .. (332)

<223> MAR de cromosoma 2 cóntigos genómicos; 81142998..81143329 <223> MAR of chromosome 2 genomic contigs; 81142998..81143329

<400> 162 <400> 162

<210> 163 <210> 163

<211> 327 <211> 327

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(327) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 84019536..84019862 <222> (1) .. (327) 25 <223> MAR of chromosome 2 genomic contigs; 84019536..84019862

<400> 163 <210> 164 <400> 163 <210> 164

<211> 407 5 <212> DNA <211> 407 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(407) <221> union_misc 10 <222> (1) .. (407)

<223> MAR de cromosoma 2 cóntigos genómicos; 1448030..1448436 <223> MAR of chromosome 2 genomic contigs; 1448030..1448436

<400> 164 <400> 164

<210> 165 <210> 165

<211> 1959 <211> 1959

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(1959) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 2117630..2119588 <222> (1) .. (1959) 25 <223> MAR of chromosome 2 genomic contigs; 2117630..2119588

<400> 165 <210> 166 <400> 165 <210> 166

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(520) <221> union_misc 10 <222> (1) .. (520)

<223> MAR de cromosoma 2 cóntigos genómicos; 2119984..2120503 <223> MAR of chromosome 2 genomic contigs; 2119984..2120503

<400> 166 <400> 166

<210> 167 <210> 167

<211> 954 <211> 954

<212> DNA 5 <213> Homo sapiens <212> DNA 5 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(954) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 2578285..2579238 <222> (1) .. (954) 10 <223> MAR of chromosome 2 genomic contigs; 2578285..2579238

<400> 167 <400> 167

<210> 168 <210> 168

<211> 452 <211> 452

<212> DNA <212> DNA

<213> Homo sapiens 20 <213> Homo sapiens 20

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(452) <222> (1) .. (452)

<223> MAR de cromosoma 2 cóntigos genómicos; 3836217..3836668 25 <223> MAR of chromosome 2 genomic contigs; 3836217..3836668 25

<400> 168 <400> 168

<210> 169 <210> 169

<211> 417 <211> 417

<212> DNA <212> DNA

<213> Homo sapiens 5 <213> Homo sapiens 5

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(417) <222> (1) .. (417)

<223> MAR de cromosoma 2 cóntigos genómicos; 3837666..3838082 10 <223> MAR of chromosome 2 genomic contigs; 3837666..3838082 10

<400> 169 <400> 169

15 <210> 170 15 <210> 170

<211> 1197 <211> 1197

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

20 <220> 20 <220>

<221> unión_misc <221> union_misc

<222> (1)..(1197) <222> (1) .. (1197)

<223> MAR de cromosoma 2 cóntigos genómicos; 6294846..6296042 <223> MAR of chromosome 2 genomic contigs; 6294846..6296042

25 <400> 170 <210> 171 25 <400> 170 <210> 171

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(362) <221> union_misc 10 <222> (1) .. (362)

<223> MAR de cromosoma 2 cóntigos genómicos; 6506971..6507332 <223> MAR of chromosome 2 genomic contigs; 6506971..6507332

<400> 171 <400> 171

<210> 172 <210> 172

<211> 2578 <211> 2578

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(2578) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 6507395..6509972 <222> (1) .. (2578) 25 <223> MAR of chromosome 2 genomic contigs; 6507395..6509972

<400> 172 <400> 172

<210> 173 <210> 173

<211> 598 <211> 598

<212> DNA <212> DNA

<213> Homo sapiens 5 <213> Homo sapiens 5

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(598) <222> (1) .. (598)

<223> MAR de cromosoma 2 cóntigos genómicos; 7770400..7770997 10 <223> MAR of chromosome 2 genomic contigs; 7770400..7770997 10

<400> 173 <400> 173

15 <210> 174 15 <210> 174

<211> 1048 <211> 1048

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

20 <220> 20 <220>

<221> unión_misc <221> union_misc

<222> (1)..(1048) <222> (1) .. (1048)

<223> MAR de cromosoma 2 cóntigos genómicos; 8332422..8333469 <223> MAR of chromosome 2 genomic contigs; 8332422..8333469

25 <400> 174 <210> 175 25 <400> 174 <210> 175

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(375) <221> union_misc 10 <222> (1) .. (375)

<223> MAR de cromosoma 2 cóntigos genómicos; 8909678..8910052 <223> MAR of chromosome 2 genomic contigs; 8909678..8910052

<400> 175 <400> 175

<210> 176 <210> 176

<211> 563 <211> 563

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(563) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 10572503..10573065 <222> (1) .. (563) 25 <223> MAR of chromosome 2 genomic contigs; 10572503..10573065

<400> 176 <210> 177 <400> 176 <210> 177

<211> 595 5 <212> DNA <211> 595 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(595) <221> union_misc 10 <222> (1) .. (595)

<223> MAR de cromosoma 2 cóntigos genómicos; 11609694..11610288 <223> MAR of chromosome 2 genomic contigs; 11609694..11610288

<400> 177 <400> 177

<210> 178 <210> 178

<211> 662 <211> 662

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(662) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 12699804..12700465 <222> (1) .. (662) 25 <223> MAR of chromosome 2 genomic contigs; 12699804..12700465

<400> 178 <210> 179 <400> 178 <210> 179

<211> 649 5 <212> DNA <211> 649 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(649) <221> union_misc 10 <222> (1) .. (649)

<223> MAR de cromosoma 2 cóntigos genómicos; 12821904..12822552 <223> MAR of chromosome 2 genomic contigs; 12821904..12822552

<400> 179 <400> 179

<210> 180 <210> 180

<211> 3191 <211> 3191

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(3191) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 15356889..15360079 <222> (1) .. (3191) 25 <223> MAR of chromosome 2 genomic contigs; 15356889..15360079

<400> 180 <400> 180

<210> 181 <210> 181

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(314) <221> union_misc 10 <222> (1) .. (314)

<223> MAR de cromosoma 2 cóntigos genómicos; 728676..728989 <223> MAR of chromosome 2 genomic contigs; 728676..728989

<400> 181 <400> 181

<210> 182 <210> 182

<211> 423 <211> 423

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(423) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 737493..737915 <222> (1) .. (423) 25 <223> MAR of chromosome 2 genomic contigs; 737493..737915

<400> 182 <210> 183 <400> 182 <210> 183

<211> 724 5 <212> DNA <211> 724 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(724) <221> union_misc 10 <222> (1) .. (724)

<223> MAR de cromosoma 2 cóntigos genómicos; 1069556..1070279 <223> MAR of chromosome 2 genomic contigs; 1069556..1070279

<400> 183 <400> 183

<210> 184 <210> 184

<211> 383 <211> 383

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(383) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 2719918..2720300 <222> (1) .. (383) 25 <223> MAR of chromosome 2 genomic contigs; 2719918..2720300

<400> 184 <400> 184

<210> 185 <210> 185

<211> 309 <211> 309

<212> DNA 5 <213> Homo sapiens <212> DNA 5 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(309) 10 <223> MAR de cromosoma 2 cóntigos genómicos; 4994249..4994557 <222> (1) .. (309) 10 <223> MAR of chromosome 2 genomic contigs; 4994249..4994557

<400> 185 <400> 185

<210> 186 <210> 186

<211> 740 <211> 740

<212> DNA <212> DNA

<213> Homo sapiens 20 <213> Homo sapiens 20

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(740) <222> (1) .. (740)

<223> MAR de cromosoma 2 cóntigos genómicos; 5034916..5035655 25 <223> MAR of chromosome 2 genomic contigs; 5034916..5035655 25

<400> 186 <400> 186

30 30: <210> 187 <211> 847 <212> DNA <213> Homo sapiens <210> 187 <211> 847 <212> DNA <213> Homo sapiens

35 35: <220> <221> unión_misc <222> (1)..(847) <220> <221> union_misc <222> (1) .. (847)

126 126

<223> MAR de cromosoma 2 cóntigos genómicos; 6074678..6075524 <223> MAR of chromosome 2 genomic contigs; 6074678..6075524

<400> 187 <400> 187

<210> 188 <210> 188

<211> 784 <211> 784

<212> DNA 10 <213> Homo sapiens <212> DNA 10 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(784) 15 <223> MAR de cromosoma 2 cóntigos genómicos; 6108986..6109769 <222> (1) .. (784) 15 <223> MAR of chromosome 2 genomic contigs; 6108986..6109769

<400> 188 <400> 188

<210> 189 <210> 189

<211> 381 <211> 381

<212> DNA <212> DNA

<213> Homo sapiens 5 <213> Homo sapiens 5

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(381) <222> (1) .. (381)

<223> MAR de cromosoma 2 cóntigos genómicos; 10389032..10389412 10 <223> MAR of chromosome 2 genomic contigs; 10389032..10389412 10

<400> 189 <400> 189

15 <210> 190 15 <210> 190

<211> 507 <211> 507

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

20 <220> 20 <220>

<221> diferencia_misc <221> difference_misc

<222> (1)..(507) <222> (1) .. (507)

<223> MAR de cromosoma 2 cóntigos genómicos; 11097807..11098313 <223> MAR of chromosome 2 genomic contigs; 11097807..11098313

25 <400> 190 25 <400> 190

<210> 191 <210> 191

<211> 329 <211> 329

<212> DNA <212> DNA

<213> Homo sapiens 35 <213> Homo sapiens 35

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(329) <222> (1) .. (329)

<223> MAR de cromosoma 2 cóntigos genómicos; 11234628..11234956 40 <223> MAR of chromosome 2 genomic contigs; 11234628..11234956 40

<400> 191 <210> 192 <400> 191 <210> 192

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(584) <221> union_misc 10 <222> (1) .. (584)

<223> MAR de cromosoma 2 cóntigos genómicos; 797844..798427 <223> MAR of chromosome 2 genomic contigs; 797844..798427

<400> 192 <400> 192

<210> 193 <210> 193

<211> 363 <211> 363

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(363) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 1093824..1094186 <222> (1) .. (363) 25 <223> MAR of chromosome 2 genomic contigs; 1093824..1094186

<400> 193 <400> 193

<210> 194 <210> 194

<211> 545 <211> 545

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 5 <221> unión_misc <220> 5 <221> union_misc

<222> (1)..(545) <222> (1) .. (545)

<223> MAR de cromosoma 2 cóntigos genómicos; 3456187..3456731 <223> MAR of chromosome 2 genomic contigs; 3456187..3456731

<400> 194 10 <400> 194 10

<210> 195 <210> 195

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 20 <222> (1)..(356) <221> union_misc 20 <222> (1) .. (356)

<223> MAR de cromosoma 2 cóntigos genómicos; 5001567..5001922 <223> MAR of chromosome 2 genomic contigs; 5001567..5001922

<400> 195 <400> 195

<210> 196 30 <211> 321 <210> 196 30 <211> 321

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 35 <221> unión_misc <220> 35 <221> union_misc

<222> (1)..(321) <222> (1) .. (321)

<223> MAR de cromosoma 2 cóntigos genómicos; 5457330..5457650 <223> MAR of chromosome 2 genomic contigs; 5457330..5457650

<400> 196 40 <210> 197 <400> 196 40 <210> 197

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(361) <221> union_misc 10 <222> (1) .. (361)

<223> MAR de cromosoma 2 cóntigos genómicos; 8124469..8124829 <223> MAR of chromosome 2 genomic contigs; 8124469..8124829

<400> 197 <400> 197

<210> 198 <210> 198

<211> 418 <211> 418

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(418) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 11151485..11151902 <222> (1) .. (418) 25 <223> MAR of chromosome 2 genomic contigs; 11151485..11151902

<400> 198 <400> 198

<210> 199 <210> 199

<211> 394 <211> 394

<212> DNA <212> DNA

<213> Homo sapiens 35 <213> Homo sapiens 35

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(394) <222> (1) .. (394)

<223> MAR de cromosoma 2 cóntigos genómicos; 13591477..13591870 <223> MAR of chromosome 2 genomic contigs; 13591477..13591870

<400> 199 <400> 199

<210> 200 <210> 200

<211> 1194 10 <212> DNA <211> 1194 10 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 15 <222> (1)..(1194) <221> union_misc 15 <222> (1) .. (1194)

<223> MAR de cromosoma 2 cóntigos genómicos; 14996824..14998017 <223> MAR of chromosome 2 genomic contigs; 14996824..14998017

<400> 200 <400> 200

<210> 201 25 <211> 487 <210> 201 25 <211> 487

<212> DNA 132 <212> DNA 132

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(487) <222> (1) .. (487)

<223> MAR de cromosoma 2 cóntigos genómicos; 14998429..14998915 <223> MAR of chromosome 2 genomic contigs; 14998429..14998915

<400> 201 <400> 201

<210> 202 <210> 202

<211> 421 <211> 421

<212> DNA 15 <213> Homo sapiens <212> DNA 15 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> <222>: (1)..(421) 20 <223> MAR de cromosoma 2 cóntigos genómicos; 16562490..16562910 (1) .. (421) 20 <223> MAR of chromosome 2 genomic contigs; 16562490..16562910

<400> 202 <400> 202

<210> 203 <210> 203

<220> <220>

<221> unión_misc <221> union_misc

<222> <222>: (1)..(479) 35 <223> MAR de cromosoma 2 cóntigos genómicos; 21592301..21592779 (1) .. (479) 35 <223> MAR of chromosome 2 genomic contigs; 21592301..21592779

<400> 203 <210> 204 <400> 203 <210> 204

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(870) <221> union_misc 10 <222> (1) .. (870)

<223> MAR de cromosoma 2 cóntigos genómicos; 22557584..22558453 <223> MAR of chromosome 2 genomic contigs; 22557584..22558453

<400> 204 <400> 204

<210> 205 20 <211> 1086 <210> 205 20 <211> 1086

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(1086) <222> (1) .. (1086)

<223> MAR de cromosoma 2 cóntigos genómicos; 30591960..30593045 <223> MAR of chromosome 2 genomic contigs; 30591960..30593045

<400> 205 30 <210> 206 <400> 205 30 <210> 206

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(406) <221> union_misc 10 <222> (1) .. (406)

<223> MAR de cromosoma 2 cóntigos genómicos; 36233909..36234314 <223> MAR of chromosome 2 genomic contigs; 36233909..36234314

<400> 206 <400> 206

<210> 207 <210> 207

<211> 797 <211> 797

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(797) <222> (1) .. (797)

25 <223> MAR de cromosoma 2 cóntigos genómicos; 36271745..36272541 <400> 207 25 <223> MAR of chromosome 2 genomic contigs; 36271745..36272541 <400> 207

5 <210> 208 5 <210> 208

<211> 423 <211> 423

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

10 <220> 10 <220>

<221> unión_misc <221> union_misc

<222> (1)..(423) <222> (1) .. (423)

<223> MAR de cromosoma 2 cóntigos genómicos; 36498521..36498943 <223> MAR of chromosome 2 genomic contigs; 36498521..36498943

15 <400> 208 15 <400> 208

<210> 209 20 <211> 304 <210> 209 20 <211> 304

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(304) <222> (1) .. (304)

<223> MAR de cromosoma 2 cóntigos genómicos; 37179891..37180194 <223> MAR of chromosome 2 genomic contigs; 37179891..37180194

<400> 209 30 <210> 210 <400> 209 30 <210> 210

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(693) <221> union_misc 10 <222> (1) .. (693)

<223> MAR de cromosoma 2 cóntigos genómicos; 38440448..38441140 <223> MAR of chromosome 2 genomic contigs; 38440448..38441140

<400> 210 <400> 210

<210> 211 20 <211> 471 <210> 211 20 <211> 471

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 25 <221> unión_misc <220> 25 <221> union_misc

<222> (1)..(471) <222> (1) .. (471)

<223> MAR de cromosoma 2 cóntigos genómicos; 38887582..38888052 <223> MAR of chromosome 2 genomic contigs; 38887582..38888052

<400> 211 30 <210> 212 <400> 211 30 <210> 212

<211> 1221 5 <212> DNA <211> 1221 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(1221) <221> union_misc 10 <222> (1) .. (1221)

<223> MAR de cromosoma 2 cóntigos genómicos; 43885944..43887164 <223> MAR of chromosome 2 genomic contigs; 43885944..43887164

<400> 212 <400> 212

<210> 213 20 <211> 543 <210> 213 20 <211> 543

<212> DNA <212> DNA

<213> Homo sapiens <220> <213> Homo sapiens <220>

<221> unión_misc <221> union_misc

<222> (1)..(543) <222> (1) .. (543)

<223> MAR de cromosoma 2 cóntigos genómicos; 45818200..45818742 <223> MAR of chromosome 2 genomic contigs; 45818200..45818742

<400> 213 <400> 213

10 <210> 214 10 <210> 214

<211> 463 <211> 463

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

15 <220> 15 <220>

<221> unión_misc <221> union_misc

<222> (1)..(463) <222> (1) .. (463)

<223> MAR de cromosoma 2 cóntigos genómicos; 47055478..47055940 <223> MAR of chromosome 2 genomic contigs; 47055478..47055940

20 <400> 214 20 <400> 214

<210> 215 25 <211> 2482 <210> 215 25 <211> 2482

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 30 <221> unión_misc <220> 30 <221> union_misc

<222> (1)..(2482) <222> (1) .. (2482)

<223> MAR de cromosoma 2 cóntigos genómicos; 47492696..47495177 <223> MAR of chromosome 2 genomic contigs; 47492696..47495177

<400> 215 35 <400> 215 35

<210> 216 <210> 216

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(539) <221> union_misc 10 <222> (1) .. (539)

<223> MAR de cromosoma 2 cóntigos genómicos; 47561069..47561607 <223> MAR of chromosome 2 genomic contigs; 47561069..47561607

<400> 216 <210> 217 <400> 216 <210> 217

<211> 336 5 <212> DNA <211> 336 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(336) <221> union_misc 10 <222> (1) .. (336)

<223> MAR de cromosoma 2 cóntigos genómicos; 52853648..52853983 <223> MAR of chromosome 2 genomic contigs; 52853648..52853983

<400> 217 <400> 217

<210> 218 <210> 218

<211> 406 <211> 406

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(406) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 54866263..54866668 <222> (1) .. (406) 25 <223> MAR of chromosome 2 genomic contigs; 54866263..54866668

<400> 218 <400> 218

<210> 219 <210> 219

<211> 1452 <211> 1452

<212> DNA <212> DNA

<213> Homo sapiens 35 <213> Homo sapiens 35

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(1452) <222> (1) .. (1452)

<223> MAR de cromosoma 2 cóntigos genómicos; 55113305..55114756 <223> MAR of chromosome 2 genomic contigs; 55113305..55114756

<400> 219 <400> 219

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 10 <221> unión_misc <220> 10 <221> union_misc

<222> (1)..(502) <222> (1) .. (502)

<223> MAR de cromosoma 2 cóntigos genómicos; 56350637..56351138 <223> MAR of chromosome 2 genomic contigs; 56350637..56351138

<400> 220 15 <210> 221 <400> 220 15 <210> 221

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(794) <221> union_misc 10 <222> (1) .. (794)

<223> MAR de cromosoma 2 cóntigos genómicos; 57051633..57052426 <223> MAR of chromosome 2 genomic contigs; 57051633..57052426

<400> 221 <400> 221

<210> 222 <210> 222

<211> 300 <211> 300

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(300) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 57069272..57069571 <222> (1) .. (300) 25 <223> MAR of chromosome 2 genomic contigs; 57069272..57069571

<400> 222 <210> 223 <400> 222 <210> 223

<211> 370 5 <212> DNA <211> 370 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(370) <221> union_misc 10 <222> (1) .. (370)

<223> MAR de cromosoma 2 cóntigos genómicos; 57235143..57235512 <223> MAR of chromosome 2 genomic contigs; 57235143..57235512

<400> 223 <400> 223

<210> 224 <210> 224

<211> 306 <211> 306

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(306) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 57693125..57693430 <222> (1) .. (306) 25 <223> MAR of chromosome 2 genomic contigs; 57693125..57693430

<400> 224 <400> 224

<210> 225 <210> 225

<211> 500 <211> 500

<212> DNA <212> DNA

<213> Homo sapiens 35 <213> Homo sapiens 35

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(500) <222> (1) .. (500)

<223> MAR de cromosoma 2 cóntigos genómicos; 59810331..59810830 40 <223> MAR of chromosome 2 genomic contigs; 59810331..59810830 40

<400> 225 145 <212> DNA <400> 225 145 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 10 <221> unión_misc <220> 10 <221> union_misc

<222> (1)..(565) <222> (1) .. (565)

<223> MAR de cromosoma 2 cóntigos genómicos; 59974589..59975153 <223> MAR of chromosome 2 genomic contigs; 59974589..59975153

<400> 226 15 <400> 226 15

<210> 227 <210> 227

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 25 <222> (1)..(427) <221> union_misc 25 <222> (1) .. (427)

<223> MAR de cromosoma 2 cóntigos genómicos; 60605573..60605999 <223> MAR of chromosome 2 genomic contigs; 60605573..60605999

<400> 227 <210> 228 <400> 227 <210> 228

<211> 1199 5 <212> DNA <211> 1199 5 <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(1199) <221> union_misc 10 <222> (1) .. (1199)

<223> MAR de cromosoma 2 cóntigos genómicos; 61229949..61231147 <223> MAR of chromosome 2 genomic contigs; 61229949..61231147

<400> 228 <400> 228

<210> 229 <210> 229

<211> 454 <211> 454

<212> <212>: DNA 20 <213> Homo sapiens DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(454) <222> (1) .. (454)

<223> MAR de cromosoma 2 cóntigos genómicos; 62181058..62181511 <223> MAR of chromosome 2 genomic contigs; 62181058..62181511

<400> 229 <400> 229

<210> 230 <210> 230

<211> 658 <211> 658

<212> <212>: DNA 10 <213> Homo sapiens DNA 10 <213> Homo sapiens

147 5 147 5

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(658) 15 <223> MAR de cromosoma 2 cóntigos genómicos; 62190919..62191576 <222> (1) .. (658) 15 <223> MAR of chromosome 2 genomic contigs; 62190919..62191576

<400> 230 <400> 230

<210> 231 <210> 231

<211> 1486 <211> 1486

<212> DNA <212> DNA

<213> Homo sapiens 25 <213> Homo sapiens 25

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(1486) <222> (1) .. (1486)

<223> MAR de cromosoma 2 cóntigos genómicos; 62384127..62385612 30 <223> MAR of chromosome 2 genomic contigs; 62384127..62385612 30

<400> 231 <210> 232 <400> 231 <210> 232

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(333) <221> union_misc 10 <222> (1) .. (333)

<223> MAR de cromosoma 2 cóntigos genómicos; 62538649..62538981 <223> MAR of chromosome 2 genomic contigs; 62538649..62538981

<400> 232 <400> 232

<210> 233 <211> 480 <210> 233 <211> 480

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

5 <220> 5 <220>

<221> unión_misc <221> union_misc

<222> (1)..(480) <222> (1) .. (480)

<223> MAR de cromosoma 2 cóntigos genómicos; 63240325..63240804 <223> MAR of chromosome 2 genomic contigs; 63240325..63240804

10 <400> 233 10 <400> 233

<210> 234 15 <211> 302 <210> 234 15 <211> 302

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 20 <221> unión_misc <220> 20 <221> union_misc

<222> (1)..(302) <222> (1) .. (302)

<223> MAR de cromosoma 2 cóntigos genómicos; 63935480..63935781 <223> MAR of chromosome 2 genomic contigs; 63935480..63935781

<400> 234 25 <400> 234 25

<210> 235 <210> 235

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 35 <222> (1)..(407) union_misc 35 <222> (1) .. (407)

<223> MAR de cromosoma 2 cóntigos genómicos; 63935888..63936294 <223> MAR of chromosome 2 genomic contigs; 63935888..63936294

<400> 235 <400> 235

<210> 236 <210> 236

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> <221>: unión_misc 10 <222> (1)..(302) union_misc 10 <222> (1) .. (302)

<223> MAR de cromosoma 2 cóntigos genómicos; 66958350..66958651 <223> MAR of chromosome 2 genomic contigs; 66958350..66958651

<400> 236 <400> 236

<210> 237 <210> 237

<211> 651 <211> 651

<212> DNA 20 <213> Homo sapiens <212> DNA 20 <213> Homo sapiens

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(651) 25 <223> MAR de cromosoma 2 cóntigos genómicos; 68307125..68307775 <222> (1) .. (651) 25 <223> MAR of chromosome 2 genomic contigs; 68307125..68307775

<400> 237 <400> 237

<210> 238 <210> 238

<211> 367 <211> 367

<212> DNA <212> DNA

<213> Homo sapiens 5 <213> Homo sapiens 5

<220> <220>

<221> unión_misc <221> union_misc

<222> (1)..(367) <222> (1) .. (367)

<223> MAR de cromosoma 2 cóntigos genómicos; 68308243..68308609 10 <223> MAR of chromosome 2 genomic contigs; 68308243..68308609 10

<400> 238 <400> 238

15 <210> 239 15 <210> 239

<211> 499 <211> 499

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

20 <220>

<221> unión_misc <221> union_misc

<222> (1)..(499) <222> (1) .. (499)

<223> MAR de cromosoma 2 cóntigos genómicos; 410241..410739 <223> MAR of chromosome 2 genomic contigs; 410241..410739

25 <400> 239 25 <400> 239

<210> 240 30 <211> 402 <210> 240 30 <211> 402

<212> DNA <212> DNA

<213> Homo sapiens <213> Homo sapiens

<220> 35 <221> unión_misc <220> 35 <221> union_misc

<222> (1)..(402) <222> (1) .. (402)

<223> MAR de cromosoma 2 cóntigos genómicos; 31531..31932 <223> MAR of chromosome 2 genomic contigs; 31531..31932

<400> 240 40 <210> 241 <400> 240 40 <210> 241

<213> Homo sapiens <213> Homo sapiens

<220> <220>

<221> unión_misc 10 <222> (1)..(421) <221> union_misc 10 <222> (1) .. (421)

<223> MAR de cromosoma 2 cóntigos genómicos; 32415..32835 <223> MAR of chromosome 2 genomic contigs; 32415..32835

<400> 241 <400> 241

Claims

1. one.: Una secuencia de DNA aislada y purificada que tiene una actividad que aumenta la producción de proteínas, caracterizada por que dicha secuencia de DNA comprende a) al menos un elemento de DNA curvado, en donde el elemento de DNA curvado contiene al menos 33% del dinucleótido TA y/o al menos 33% del dinucleótido AT en un tramo de 100 pares de bases contiguos, b) al menos un sitio de unión para una proteína de unión a DNA, y porque es una secuencia de nucleótidos de MAR que tiene la secuencia SEQ ID No 27, o una de sus secuencias complementarias, o una secuencia que tiene una identidad de al menos 90% con dicha secuencia SEQ ID No 27. An isolated and purified DNA sequence that has an activity that increases protein production, characterized in that said DNA sequence comprises a) at least one curved DNA element, where the curved DNA element contains at least 33% of the dinucleotide TA and / or at least 33% of the AT dinucleotide in a contiguous 100 base pair span, b) at least one binding site for a DNA binding protein, and because it is a MAR nucleotide sequence having the sequence SEQ ID No. 27, or one of its complementary sequences, or a sequence that has an identity of at least 90% with said sequence SEQ ID No. 27.

2. 2.: La secuencia aislada y purificada de acuerdo con la reivindicación 1, caracterizada por que dicha proteína de unión al DNA es un factor de transcripción preferiblemente un factor de transcripción seleccionado del grupo que comprende proteínas del dominio polyQpolyP., o un factor de transcripción seleccionado del grupo que comprende SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C/EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2, Pit1, TTF1, XFD1, AR, C/EBPgamma, Cdc5, FOXD3, HFH3, HNF3 beta, MRF2, Oct1, POU6F1, SRF, V$MTATA_B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL HP1, Myc, PBX, Pax3, TEF, VBP, XFD3, Brn2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1F1, Pax6, TFIIA y Vmw65 o una combinación de dos o más de estos factores de transcripción. The isolated and purified sequence according to claim 1, characterized in that said DNA-binding protein is a transcription factor preferably a transcription factor selected from the group comprising polyQpolyP domain proteins, or a transcription factor selected from the group comprising SATB1, NMP4, MEF2, S8, DLX1, FREAC7, BRN2, GATA 1/3, TATA, Bright, MSX, AP1, C / EBP, CREBP1, FOX, Freac7, HFH1, HNF3alfa, Nkx25, POU3F2, Pit1, TTF1 , XFD1, AR, C / EBPgamma, Cdc5, FOXD3, HFH3, HNF3 beta, MRF2, Oct1, POU6F1, SRF, V $ MTATA_B, XFD2, Bach2, CDP CR3, Cdx2, FOXJ2, HFL HP1, Myc, PBX, Pax TEF, VBP, XFD3, Brn2, COMP1, Evil, FOXP3, GATA4, HFN1, Lhx3, NKX3A, POU1F1, Pax6, TFIIA and Vmw65 or a combination of two or more of these transcription factors.

3. 3.: El uso in vitro de una secuencia de DNA aislada y purificada que comprende una primera secuencia de nucleótidos aislada de la región de fijación a la matriz (MAR) que es una secuencia de nucleótidos de MAR seleccionada del grupo que comprende: In vitro use of an isolated and purified DNA sequence comprising a first nucleotide sequence isolated from the matrix-binding region (MAR) which is a MAR nucleotide sequence selected from the group comprising:

--: una secuencia de DNA aislada y purificada de acuerdo con las reivindicaciones 1 a 2, an isolated and purified DNA sequence according to claims 1 to 2,

--: la secuencia SEQ ID No 27, o una de sus secuencias complementarias, para aumentar la actividad de producción de proteínas en una célula hospedante eucariótica. SEQ ID No. 27, or one of its complementary sequences, to increase protein production activity in a eukaryotic host cell.

4. Four.: El uso de la secuencia de DNA aislada y purificada de acuerdo con la reivindicación 3, caracterizado por que dicha secuencia de DNA aislada y purificada comprende además un promotor unido operativamente a un gen de interés. The use of the isolated and purified DNA sequence according to claim 3, characterized in that said isolated and purified DNA sequence further comprises a promoter operably linked to a gene of interest.

5. 5.: El uso de la secuencia de DNA aislada y purificada de acuerdo con la reivindicación 3 o 4, caracterizado por que dicha secuencia de DNA aislada y purificada comprende además al menos una segunda secuencia de nucleótidos aislada de una región de fijación a la matriz (MAR) que es una secuencia de nucleótidos de MAR seleccionada del grupo que comprende: The use of the isolated and purified DNA sequence according to claim 3 or 4, characterized in that said isolated and purified DNA sequence further comprises at least a second nucleotide sequence isolated from a matrix binding region (MAR) which is a MAR nucleotide sequence selected from the group comprising:

6. 6.: El uso de la secuencia de DNA aislada y purificada de acuerdo con la reivindicación 5, caracterizado por que dicha primera y al menos segunda secuencias de MAR están localizadas en ambos extremos 5’ y 3’ de la secuencia que contiene el promotor y el gen de interés, o en una secuencia distinta de la que contiene el promotor y el gen de interés. The use of the isolated and purified DNA sequence according to claim 5, characterized in that said first and at least second MAR sequences are located at both 5 'and 3' ends of the sequence that contains the promoter and the gene of interest, or in a sequence other than that containing the promoter and the gene of interest.

7. 7.: Un método de transfección in vitro de una célula hospedante eucariótica, comprendiendo dicho método a) introducir en dicha célula hospedante eucariótica al menos una secuencia de DNA purificada que comprende al menos una secuencia de DNA aislada y purificada que consiste en una secuencia de nucleótidos de MAR de acuerdo con cualquiera de las reivindicaciones 1 ó 2, b) someter en un tiempo definido dicha célula hospedante eucariótica transfectada a al menos una etapa adicional de transfección con al menos una secuencia de DNA purificada que comprende al menos una secuencia de DNA de interés, preferiblemente un gen de interés que codifica un proteína unida de operativamente a un promotor, y/o con al menos una secuencia de DNA aislada y purificada que consiste en una secuencia de nucleótidos de MAR u otros elementos modificadores de la cromatina, y c) seleccionar dicha célula hospedante eucariótica transfectada, preferiblemente seleccionar células hospedantes eucarióticas transfectadas que son células altamente productoras de proteínas con una tasa de producción de al menos 10 pg por célula y por día. A method of in vitro transfection of a eukaryotic host cell, said method comprising a) introducing into said eukaryotic host cell at least one purified DNA sequence comprising at least one isolated and purified DNA sequence consisting of a MAR nucleotide sequence according to any of claims 1 or 2, b) subjecting in a defined time said transfected eukaryotic host cell to at least one additional step of transfection with at least one purified DNA sequence comprising at least one DNA sequence of interest, preferably a gene of interest encoding a protein operably linked to a promoter, and / or with at least one isolated and purified DNA sequence consisting of a MAR nucleotide sequence or other chromatin modifying elements, and c) selecting said transfected eukaryotic host cell, preferably select transfected eukaryotic host cells which e are highly protein-producing cells with a production rate of at least 10 pg per cell per day.

8. 8.: El método de acuerdo con la reivindicación 7, caracterizado por que la secuencia de nucleótidos de MAR se selecciona del grupo que comprende: The method according to claim 7, characterized in that the MAR nucleotide sequence is selected from the group comprising:

--: una secuencia de DNA aislada y purificada de acuerdo con la reivindicación 1 ó 2, an isolated and purified DNA sequence according to claim 1 or 2,

--: la secuencia SEQ ID No 27, o una de sus secuencias complementarias. the sequence SEQ ID No 27, or one of its complementary sequences.

9. 9.: El método de acuerdo con la reivindicación 7 u 8, caracterizado por que el tiempo definido corresponde a intervalos relacionados con el ciclo de división celular. The method according to claim 7 or 8, characterized in that the defined time corresponds to intervals related to the cell division cycle.

10. 10.: El método de acuerdo con la reivindicación 9, caracterizado por que el tiempo definido es el momento en que la célula hospedante acaba de entrar en el segundo ciclo de división celular. The method according to claim 9, characterized in that the defined time is the moment in which the host cell has just entered the second cycle of cell division.

11. eleven.: Un método in vitro de transfección de una célula hospedante eucariótica, comprendiendo dicho método cotransfectar en dicha célula hospedante eucariótica al menos una primera secuencia de DNA aislada y purificada, que An in vitro method of transfection of a eukaryotic host cell, said method comprising cotransfecting into said eukaryotic host cell at least a first isolated and purified DNA sequence, which

5 comprises at least one DNA sequence of interest, and a second isolated and purified DNA sequence comprising at least one MAR nucleotide sequence selected from the group comprising:

--: la secuencia SEQ ID No 27 o una de sus secuencias complementarias. SEQ ID No. 27 or one of its complementary sequences.

12. A process for the production of a protein, where a) a transfected eukaryotic host cell of

According to any one of claims 7 to 11, it is cultivated in a culture medium under conditions suitable for the expression of said protein and b) said protein is recovered.

13. A cellular transfection mix or kit comprising at least one isolated and purified DNA sequence according to claim 1 or 2.

14. A eukaryotic host cell transfected with at least one DNA sequence according to claim 1 or 2, and / or transfected with a method according to any one of claims 7 to 11.

15. fifteen.: Un organismo transgénico no humano, caracterizado por que en su genoma o al menos algunas de sus células tienen establemente incorporada al menos una secuencia de DNA de acuerdo con la reivindicación 1 ó 2. A non-human transgenic organism, characterized in that at least one DNA sequence according to claim 1 or 2 is stably incorporated into its genome or at least some of its cells.

16. 16.: El organismo transgénico no humano de acuerdo con la reivindicación 15, caracterizado por que algunas de sus células han sido transfectadas según el método de acuerdo con cualquiera de las reivindicaciones 7 a 11. The non-human transgenic organism according to claim 15, characterized in that some of its cells have been transfected according to the method according to any of claims 7 to 11.

FIG. 2/1

FIG. 2/2

FIG. 2/3

FIG. 2/4