ES2367530T3 - SELECTION OF HOSPED CELLS THAT EXPRESS PROTEIN AT HIGH LEVELS. - Google Patents

SELECTION OF HOSPED CELLS THAT EXPRESS PROTEIN AT HIGH LEVELS. Download PDF

Info

Publication number
ES2367530T3
ES2367530T3 ES07712283T ES07712283T ES2367530T3 ES 2367530 T3 ES2367530 T3 ES 2367530T3 ES 07712283 T ES07712283 T ES 07712283T ES 07712283 T ES07712283 T ES 07712283T ES 2367530 T3 ES2367530 T3 ES 2367530T3
Authority
ES
Spain
Prior art keywords
polypeptide
selectable marker
sequence
interest
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07712283T
Other languages
Spanish (es)
Inventor
Arie Pieter Otte
Henricus Johannes Maria Van Blokland
Theodorus Hendrikus Jacobus Kwaks
Richard George Antonius Bernardus Sewalt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chromagenics BV
Original Assignee
Chromagenics BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chromagenics BV filed Critical Chromagenics BV
Application granted granted Critical
Publication of ES2367530T3 publication Critical patent/ES2367530T3/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Una molécula de ADN que comprende: una unidad de transcripción multicistrónica que comprende al menos una secuencia de codificación que codifica tanto i) un polipéptido de interés, como ii) un polipéptido marcador seleccionable funcional en una célula hospedadora eucariótica, en la que el polipéptido de interés tiene una secuencia de iniciación de la traducción separada de la del polipéptido marcador seleccionable, en la que al menos una secuencia de codificación del polipéptido de interés está en dirección 5' de al menos una secuencia de codificación del polipéptido marcador seleccionable en dicha unidad de transcripción multicistrónica, en la que está presente un sitio de entrada interna del ribosoma (IRES) en dirección 3' a al menos una secuencia de codificación del polipéptido de interés y en dirección 5' a al menos una secuencia de codificación del polipéptido marcador seleccionable, y caracterizada por que la secuencia de codificación que codifica el polipéptido marcador seleccionable comprende una secuencia de inicio de la traducción seleccionada del grupo constituido por: a) un codón de inicio GTG; b) un codón de inicio TTG; c) un codón de inicio CTG; d) un codón de inicio ATT y e) un codón de inicio ACG.A DNA molecule comprising: a multicistronic transcription unit comprising at least one coding sequence that encodes both i) a polypeptide of interest, and ii) a functional selectable marker polypeptide in a eukaryotic host cell, in which the polypeptide of of interest has a translation initiation sequence separate from that of the selectable marker polypeptide, in which at least one coding sequence of the polypeptide of interest is in the 5 'direction of at least one coding sequence of the selectable marker polypeptide in said unit of multicistronic transcription, in which an internal ribosome entry site (IRES) is present in the 3 'direction to at least one coding sequence of the polypeptide of interest and in the 5' direction to at least one coding sequence of the selectable marker polypeptide, and characterized in that the coding sequence that encodes the selectable marker polypeptide comprises a translation start sequence selected from the group consisting of: a) a GTG start codon; b) a TTG start codon; c) a CTG start codon; d) an ATT start codon and e) an ACG start codon.

Description

Campo de la invención Field of the Invention

La invención se refiere al campo de la biología molecular y la biotecnología. Más específicamente, la invención se refiere a medios y procedimientos para mejorar la selección de células hospedadoras que expresan proteínas a altos niveles. The invention relates to the field of molecular biology and biotechnology. More specifically, the invention relates to means and methods for improving the selection of host cells that express proteins at high levels.

Antecedentes de la invención Background of the invention

Las proteínas pueden producirse en diversas células hospedadoras para un amplio intervalo de aplicaciones en biología y biotecnología, por ejemplo como productos biofarmacéuticos. Se prefieren con este fin células hospedadoras eucarióticas, y particularmente de mamífero, para la expresión de muchas proteínas, por ejemplo, cuando dichas proteínas tienen ciertas modificaciones postraduccionales tales como glucosilación. Los procedimientos para dicha producción están bien establecidos y suponen generalmente la expresión en una célula hospedadora de un ácido nucleico (también designado como “transgén”) que codifica la proteína de interés. En general, se introduce el transgén junto con un marcador seleccionable en una célula precursora, se seleccionan las células para la expresión del gen marcador seleccionable, se identifican el uno o más clones que expresan la proteína de interés a altos niveles y se usan para la expresión de la proteína de interés. Proteins can be produced in various host cells for a wide range of applications in biology and biotechnology, for example as biopharmaceuticals. Eukaryotic, and particularly mammalian, host cells are preferred for this purpose for the expression of many proteins, for example, when said proteins have certain post-translational modifications such as glycosylation. The procedures for such production are well established and generally involve expression in a host cell of a nucleic acid (also referred to as "transgene") that encodes the protein of interest. In general, the transgene is introduced along with a selectable marker in a precursor cell, the cells are selected for expression of the selectable marker gene, the one or more clones that express the protein of interest at high levels are identified and used for Expression of the protein of interest.

Un problema asociado a la expresión de transgenes es que es impredecible, partiendo de la alta probabilidad de que el transgén se vuelva inactivo debido al silenciamiento génico (McBurney y col., 2002), y por lo tanto tiene que ensayarse en muchos clones de células hospedadoras una alta expresión del transgén. A problem associated with the expression of transgenes is that it is unpredictable, based on the high probability that the transgene will become inactive due to gene silencing (McBurney et al., 2002), and therefore has to be tested in many cell clones. hosts a high expression of the transgene.

Son conocidos procedimientos para seleccionar células hospedadoras recombinantes que expresan niveles relativamente altos de proteínas deseadas, y varios de dichos procedimientos se debaten en la introducción del documento WO 2006/048459. Methods for selecting recombinant host cells that express relatively high levels of desired proteins are known, and several such methods are discussed in the introduction of WO 2006/048459.

En ciertos procedimientos ventajosos de la técnica anterior, se han descrito vectores de expresión bicistrónicos para una creación rápida y eficaz de líneas celulares de mamífero estables que expresan proteína recombinante. Estos vectores contienen un sitio de entrada interna del ribosoma (IRES) entre la secuencia de codificación en dirección 5’ de la proteína de interés y la secuencia de codificación en dirección 3’ del marcador de selección (Rees y col., 1996). Dichos vectores están comercialmente disponibles, por ejemplo, los vectores pIRES1 de Clontech (CLONTECHniques, octubre de 1996). Usando dichos vectores para introducción en células hospedadoras, la selección de una expresión suficiente de la proteína marcadora en dirección 3’ selecciona entonces automáticamente altos niveles de transcripción del ARNm multicistrónico, y por tanto se prevé una probabilidad fuertemente aumentada de alta expresión de la proteína de interés usando dichos vectores. Preferiblemente en dichos procedimientos, el IRES usado es un IRES que da un nivel relativamente bajo de traducción del gen marcador de selección, para mejorar adicionalmente la oportunidad de seleccionar células hospedadoras con un alto nivel de expresión de la proteína de interés seleccionando la expresión de la proteína marcadora de selección (véanse, por ejemplo, los documentos WO 03/106684 y WO 2006/005718). In certain advantageous methods of the prior art, bicistronic expression vectors have been described for rapid and efficient creation of stable mammalian cell lines expressing recombinant protein. These vectors contain an internal ribosome entry site (IRES) between the 5 ′ coding sequence of the protein of interest and the 3 ′ coding sequence of the selection marker (Rees et al., 1996). Such vectors are commercially available, for example, the pIRES1 vectors from Clontech (CLONTECHniques, October 1996). Using said vectors for introduction into host cells, the selection of a sufficient expression of the marker protein in the 3 'direction then automatically selects high transcription levels of the multicistronic mRNA, and therefore a strongly increased probability of high protein expression of the protein is expected. interest using such vectors. Preferably in said procedures, the IRES used is an IRES that gives a relatively low level of translation of the selection marker gene, to further enhance the opportunity to select host cells with a high level of expression of the protein of interest by selecting the expression of the selection marker protein (see, for example, WO 03/106684 and WO 2006/005718).

La presente invención se dirige a proporcionar medios y procedimientos mejorados para la selección de células hospedadoras que expresan altos niveles de proteínas de interés. The present invention is directed to providing improved means and methods for the selection of host cells that express high levels of proteins of interest.

Sumario de la invención Summary of the invention

El documento WO 2006/048459 se presentó antes, pero se publicó después, de la fecha de prioridad de la presente solicitud. El documento WO 2006/048459 da a conocer un concepto para la selección de células hospedadoras que expresan altos niveles de polipéptidos de interés, designándose el concepto en la misma como “traducción interdependiente recíproca”. En ese concepto, se usa una unidad de transcripción multicistrónica en la que una secuencia que codifica un polipéptido marcador seleccionable está en dirección 5’ de una secuencia que codifica un polipéptido de interés, y en la que la traducción del polipéptido marcador seleccionable está dañada por mutaciones en la misma, mientras que la traducción del polipéptido de interés es muy alta (véase, por ejemplo, la FIG. 13 de la misma para una visión esquemática). La presente invención proporciona medios y procedimientos alternativos para seleccionar células hospedadoras que expresan altos niveles de polipéptido. WO 2006/048459 was submitted before, but was published after, the priority date of the present application. WO 2006/048459 discloses a concept for the selection of host cells that express high levels of polypeptides of interest, the concept being designated therein as "reciprocal interdependent translation". In that concept, a multicistronic transcription unit is used in which a sequence encoding a selectable marker polypeptide is in the 5 'direction of a sequence encoding a polypeptide of interest, and in which the translation of the selectable marker polypeptide is damaged by mutations therein, while the translation of the polypeptide of interest is very high (see, for example, FIG. 13 thereof for a schematic view). The present invention provides alternative means and methods for selecting host cells that express high levels of polypeptide.

En un aspecto, la invención proporciona una molécula de ADN que comprende una unidad de transcripción multicistrónica que codifica i) un polipéptido de interés y ii) un polipéptido marcador seleccionable funcional en una célula hospedadora eucariótica, en la que el polipéptido de interés tiene una secuencia de iniciación de la traducción separada de la del polipéptido marcador seleccionable, y en la que la secuencia de codificación del polipéptido de interés está en dirección 5’ de la secuencia de codificación del polipéptido marcador seleccionable en dicha unidad de transcripción multicistrónica, y en la que está presente un sitio de entrada interna del ribosoma (IRES) en dirección 3’ a la secuencia de codificación del polipéptido de interés y en dirección 5’ de la secuencia de codificación del polipéptido marcador seleccionable, y en la que la secuencia de ácido nucleico que codifica el polipéptido marcador seleccionable en la hebra de codificación comprende una secuencia de inicio de la traducción elegida del grupo constituido por: a) un codón de inicio GTG; b) un codón de inicio TTG; c) un codón de inicio CTG; d) un codón de inicio ATT y e) un codón de inicio ACG. In one aspect, the invention provides a DNA molecule comprising a multicistronic transcription unit encoding i) a polypeptide of interest and ii) a functional selectable marker polypeptide in a eukaryotic host cell, wherein the polypeptide of interest has a sequence translation initiation separated from that of the selectable marker polypeptide, and wherein the coding sequence of the polypeptide of interest is in the 5 'direction of the coding sequence of the selectable marker polypeptide in said multicistronic transcription unit, and in which an internal ribosome entry site (IRES) is present in the 3 'direction to the coding sequence of the polypeptide of interest and in the 5' direction of the coding sequence of the selectable marker polypeptide, and in which the nucleic acid sequence that encodes the selectable marker polypeptide in the coding strand ion comprises a translation start sequence chosen from the group consisting of: a) a GTG start codon; b) a TTG start codon; c) a CTG start codon; d) an ATT start codon and e) an ACG start codon.

La secuencia de inicio de la traducción en la hebra de codificación del polipéptido marcador seleccionable comprende un codón de inicio diferente del codón de inicio ATG, tal como una de las secuencias GTG, TTG, CTG, ATT o ACG, siendo los dos primeros de estas las más preferidas. Dichos codones de inicio no ATG están flanqueados preferiblemente por secuencias que proporcionan un reconocimiento relativamente bueno de las secuencias no ATG como codones de inicio, tales como al menos la traducción de inicio de algunos ribosomas a partir de estos codones de inicio, concretamente, la secuencia de inicio de la traducción comprende preferiblemente la secuencia ACC[codón de inicio no ATG]G o GCC[codón de inicio no ATG]G. The translation start sequence in the coding strand of the selectable marker polypeptide comprises a start codon other than the ATG start codon, such as one of the GTG, TTG, CTG, ATT or ACG sequences, the first two of these being the most preferred Said non-ATG start codons are preferably flanked by sequences that provide a relatively good recognition of non-ATG sequences as start codons, such as at least the translation of start of some ribosomes from these start codons, namely, the sequence. translation initiation preferably comprises the sequence ACC [start codon non ATG] G or GCC [start codon non ATG] G.

En realizaciones preferidas, la proteína marcadora seleccionable proporciona resistencia frente a los efectos letales y/o inhibidores del crecimiento de un agente de selección tal como un antibiótico. In preferred embodiments, the selectable marker protein provides resistance against the lethal effects and / or growth inhibitors of a selection agent such as an antibiotic.

La invención proporciona adicionalmente módulos de expresión que comprenden una molécula de ADN según la invención, comprendiendo dichos módulos de expresión adicionalmente un promotor en dirección 5’ de la unidad de expresión multicistrónica, y siendo funcionales en una célula hospedadora eucariótica para la iniciación de la transcripción de la unidad de expresión multicistrónica, y comprendiendo adicionalmente dichos módulos de expresión una secuencia de terminación de la transcripción en dirección 3’ de la unidad de expresión multicistrónica. The invention additionally provides expression modules comprising a DNA molecule according to the invention, said expression modules further comprising a promoter in the 5 'direction of the multicistronic expression unit, and being functional in a eukaryotic host cell for transcription initiation. of the multicistronic expression unit, and said expression modules additionally comprising a transcription termination sequence in the 3 'direction of the multicistronic expression unit.

En realizaciones preferidas de los mismos, dichos módulos de expresión comprenden adicionalmente al menos un elemento de control de cromatina elegido del grupo constituido por una región de unión a matriz o armazón (MAR/SAR), una secuencia aislante, un elemento de apertura de cromatina ubicuo (UCOE) y una secuencia antirrepresora. Se prefieren en este aspecto secuencias antirrepresoras, y en ciertas realizaciones se eligen dichas secuencias antirrepresoras del grupo constituido por: a) una cualquiera de SEQ. ID. NO. 1 a SEQ. ID. NO. 66; b) fragmentos de una cualquiera de SEQ. ID. NO. 1 a SEQ. ID. NO. 66, en las que dichos fragmentos tienen actividad antirrepresora; c) secuencias que son al menos un 70% idénticas en la secuencia nucleotídica a a) o a b), en las que dichas secuencias tienen actividad antirrepresora y d) el complemento de una cualquiera de a) a c). In preferred embodiments thereof, said expression modules additionally comprise at least one chromatin control element chosen from the group consisting of a matrix or framework binding region (MAR / SAR), an insulating sequence, a chromatin opening element ubiquitous (UCOE) and an antirepressant sequence. Anti-repressor sequences are preferred in this aspect, and in certain embodiments said anti-repressor sequences are chosen from the group consisting of: a) any one of SEQ. ID. NO. 1 to SEQ. ID. NO. 66; b) fragments of any one of SEQ. ID. NO. 1 to SEQ. ID. NO. 66, in which said fragments have antirepressant activity; c) sequences that are at least 70% identical in the nucleotide sequence a a) or a b), in which said sequences have antirepressant activity and d) the complement of any one of a) to c).

La invención proporciona también células hospedadoras que comprenden moléculas de ADN según la invención. The invention also provides host cells comprising DNA molecules according to the invention.

La invención proporciona adicionalmente procedimientos para generar células hospedadoras que expresan un polipéptido de interés, comprendiendo el procedimiento las etapas de: introducir en una pluralidad de células hospedadoras precursoras una molécula de ADN o un módulo de expresión según la invención, cultivar las células en condiciones de selección de la expresión del polipéptido marcador seleccionable y seleccionar al menos una célula hospedadora productora del polipéptido de interés. The invention further provides methods for generating host cells expressing a polypeptide of interest, the method comprising the steps of: introducing into a plurality of precursor host cells a DNA molecule or an expression module according to the invention, culturing the cells under conditions of selection of the selectable marker polypeptide expression and select at least one host cell producing the polypeptide of interest.

En un aspecto adicional, la invención proporciona procedimientos para la producción de un polipéptido de interés, comprendiendo los procedimientos cultivar una célula hospedadora, comprendiendo dicha célula hospedadora un módulo de expresión según la invención, y expresar el polipéptido de interés a partir del módulo de expresión. En realizaciones preferidas de la misma, el polipéptido de interés se aísla adicionalmente a partir de las células hospedadoras y/o del medio de cultivo de células hospedadoras. In a further aspect, the invention provides methods for the production of a polypeptide of interest, the methods comprising culturing a host cell, said host cell comprising an expression module according to the invention, and expressing the polypeptide of interest from the expression module . In preferred embodiments thereof, the polypeptide of interest is further isolated from the host cells and / or the host cell culture medium.

Breve descripción de los dibujos Brief description of the drawings

FIG. 1. Resultados con construcciones de expresión según la invención. La construcción de expresión contiene las secuencias que codifican el polipéptido de interés (ejemplificado aquí por d2EGFP) en dirección 5’ de un IRES, que está en dirección 5’ de la secuencia que codifica el marcador seleccionable según la invención (ejemplificado aquí por el gen de resistencia a zeocina, con un codón de inicio TTG (TTG Zeo) (o en controles con su codón de inicio ATG normal (ATG Zeo)). Véase el ejemplo 1 para detalles. Los puntos indican los puntos de datos individuales, las líneas indican los niveles de expresión media, las construcciones usadas se indican en el eje horizontal y se exhiben esquemáticamente por encima de la gráfica, el eje vertical designa la señal de d2EGFP. FIG. 1. Results with expression constructs according to the invention. The expression construct contains the sequences encoding the polypeptide of interest (exemplified herein by d2EGFP) in the 5 'direction of an IRES, which is in the 5' direction of the sequence encoding the selectable marker according to the invention (exemplified herein by the gene resistance to zeocin, with a TTG start codon (TTG Zeo) (or in controls with its normal ATG start codon (ATG Zeo). See example 1 for details. Points indicate individual data points, lines they indicate the average expression levels, the constructions used are indicated on the horizontal axis and are shown schematically above the graph, the vertical axis designates the d2EGFP signal.

FIG. 2. Resultados con módulos de expresión tricistrónicos con dhfr como marcador de mantenimiento. La construcción de expresión contiene un gen marcador seleccionable de zeocina con un codón de inicio TTG y carece de secuencias ATG internas en dirección 5’ de la secuencia que codifica el polipéptido de interés (ejemplificado aquí por d2EGFP), que adicionalmente está ligado operativamente mediante un IRES con un gen dhfr marcador de selección metabólica en dirección 3’ (con un codón de inicio ATG). Los puntos indican los puntos de datos individuales (señal de fluorescencia de GFP en colonias ZeoR en el eje vertical), las líneas indican los niveles de expresión media. Se muestra la construcción usada por encima de la gráfica, las condiciones se indican en el eje horizontal (d: día). Véase el ejemplo 2 para detalles. FIG. 2. Results with tricistronic expression modules with dhfr as maintenance marker. The expression construct contains a selectable zeocin marker gene with a TTG start codon and lacks internal ATG sequences in the 5 'direction of the sequence encoding the polypeptide of interest (exemplified herein by d2EGFP), which is additionally operably linked by a IRES with a dhfr gene marker of metabolic selection in the 3 'direction (with an ATG start codon). The dots indicate the individual data points (GFP fluorescence signal in ZeoR colonies on the vertical axis), the lines indicate the mean expression levels. The construction used above the graph is shown, the conditions are indicated on the horizontal axis (d: day). See example 2 for details.

FIG. 3. Como la Fig. 2, pero con el gen dhfr teniendo el codón de inicio GTG. FIG. 3. Like Fig. 2, but with the dhfr gene having the start codon GTG.

FIG. 4. Como la Fig. 2, pero con el gen dhfr teniendo el codón de inicio TTG. FIG. 4. Like Fig. 2, but with the dhfr gene having the start codon TTG.

FIG. 5. Números de copias de clones con la enzima dhfr (codón de inicio ATG) en diferentes condiciones. Véase el ejemplo 3 para detalles. FIG. 5. Copy numbers of clones with the dhfr enzyme (ATG start codon) under different conditions. See example 3 for details.

FIG. 6. Como la Fig. 5, pero con el gen dhfr teniendo el codón de inicio GTG. FIG. 6. Like Fig. 5, but with the dhfr gene having the start codon GTG.

FIG. 7. Como la Fig. 5, pero con el gen dhfr teniendo el codón de inicio TTG. FIG. 7. Like Fig. 5, but with the dhfr gene having the start codon TTG.

Descripción detallada de la invención Detailed description of the invention

En un aspecto, la invención proporciona una molécula de ADN según la reivindicación 1. Dicha molécula de ADN puede usarse según la invención para obtener células hospedadoras eucarióticas que expresan altos niveles del polipéptido de interés seleccionando la expresión del polipéptido marcador seleccionable. Posterior o simultáneamente, pueden identificarse una o más células hospedadoras que expresan el polipéptido de interés y usarse adicionalmente para la expresión de altos niveles del polipéptido de interés. In one aspect, the invention provides a DNA molecule according to claim 1. Said DNA molecule can be used according to the invention to obtain eukaryotic host cells expressing high levels of the polypeptide of interest by selecting the expression of the selectable marker polypeptide. Subsequently or simultaneously, one or more host cells expressing the polypeptide of interest can be identified and additionally used for the expression of high levels of the polypeptide of interest.

El término “gen monocistrónico” se define como un gen capaz de proporcionar una molécula de ARN que codifica un polipéptido. Una “unidad de transcripción multicistrónica”, también designada como un gen multicistrónico, se define como un gen capaz de proporcionar una molécula de ARN que codifica al menos dos polipéptidos. El término “gen bicistrónico” se define como un gen capaz de proporcionar una molécula de ARN que codifica dos polipéptidos. Por lo tanto, un gen bicistrónico está comprendido dentro de la definición de un gen multicistrónico. Un “polipéptido” como se usa en la presente memoria comprende al menos cinco aminoácidos ligados por enlaces peptídicos, y puede ser, por ejemplo, una proteína o una parte, tal como una subunidad de la misma. La mayoría de veces, los términos polipéptido y proteína se usan intercambiablemente en la presente memoria. Un “gen” o una “unidad transcripcional” como se usa en la presente invención puede comprender ADN cromosómico, ADNc, ADN artificial, combinaciones de los mismos y similares. Las unidades de transcripción que comprenden varios cistrones se transcriben como un ARNm individual. The term "monocistronic gene" is defined as a gene capable of providing an RNA molecule that encodes a polypeptide. A "multicistronic transcription unit", also designated as a multicistronic gene, is defined as a gene capable of providing an RNA molecule that encodes at least two polypeptides. The term "bicistronic gene" is defined as a gene capable of providing an RNA molecule that encodes two polypeptides. Therefore, a bicistronic gene is within the definition of a multicistronic gene. A "polypeptide" as used herein comprises at least five amino acids linked by peptide bonds, and may be, for example, a protein or a part, such as a subunit thereof. Most of the time, the terms polypeptide and protein are used interchangeably herein. A "gene" or a "transcriptional unit" as used in the present invention may comprise chromosomal DNA, cDNA, artificial DNA, combinations thereof and the like. Transcription units comprising several cistrons are transcribed as an individual mRNA.

Una unidad de transcripción multicistrónica según la invención es preferiblemente una unidad de transcripción bicistrónica que codifica de 5’ a 3’ un polipéptido de interés y un polipéptido marcador seleccionable. Por tanto, el polipéptido de interés está codificado en dirección 5’ de la secuencia de codificación del polipéptido marcador seleccionable. El IRES está ligado operativamente con la secuencia que codifica el polipéptido marcador seleccionable, y por tanto el polipéptido marcador seleccionable depende del IRES para su traducción. A multicistronic transcription unit according to the invention is preferably a bicistronic transcription unit encoding a polypeptide of interest and a selectable marker polypeptide from 5 'to 3'. Thus, the polypeptide of interest is encoded in the 5 ′ direction of the coding sequence of the selectable marker polypeptide. The IRES is operatively linked to the sequence encoding the selectable marker polypeptide, and therefore the selectable marker polypeptide depends on the IRES for translation.

Se prefieren usar unidades de transcripción separadas para la expresión de diferentes polipéptidos de interés, también cuando estos forman parte de una proteína multimérica (véase, por ejemplo, el ejemplo 13 del documento WO 2006/048459: la cadena pesada y ligera de un anticuerpo, cada una codificada por una unidad de transcripción separada, siendo cada una de estas unidades de expresión una unidad de expresión bicistrónica). It is preferred to use separate transcription units for the expression of different polypeptides of interest, also when these are part of a multimeric protein (see, for example, example 13 of WO 2006/048459: the heavy and light chain of an antibody, each encoded by a separate transcription unit, each of these expression units being a bicistronic expression unit).

Las moléculas de ADN de la invención pueden estar presentes en forma de ADN bicatenario, que tiene con respecto al polipéptido marcador seleccionable y el polipéptido de interés una hebra codificante y una hebra no codificante, siendo la hebra codificante la hebra con la misma secuencia que el ARN traducido, excepto por la presencia de T en lugar de U. Por tanto, un codón de inicio AUG está codificado en la hebra codificante por una secuencia ATG, y la hebra que contiene esta secuencia ATG correspondiente al codón de inicio AUG en el ARN se designa como la hebra codificante del ADN. Resultará evidente para el especialista en la materia que los codones de inicio o secuencias de iniciación de la traducción están de hecho presentes en una molécula de ARN, pero que estos pueden considerarse igualmente materializados en una molécula de ADN que codifica dicha molécula de ARN; por tanto, siempre que la presente invención designe un codón de inicio o secuencia de iniciación de la traducción, se pretende incluir la correspondiente molécula de ADN que tiene la misma secuencia que la molécula de ARN menos por la presencia de una T en lugar de una U en la hebra codificante de dicha molécula de ADN y viceversa, excepto cuando se especifica explícitamente otra cosa. En otras palabras, un codón de inicio es por ejemplo una secuencia AUG en ARN, pero la correspondiente secuencia ATG en la hebra codificante de ADN se designa como codón de inicio también en la presente invención. Se usa lo mismo para la referencia de secuencias codificantes “en fase”, lo que significa tripletes (3 bases) en la molécula de ARN que se traducen a un aminoácido, pero también han de interpretarse como las correspondientes secuencias trinucleotídicas en la hebra codificante de la molécula de ADN. The DNA molecules of the invention may be present in the form of double-stranded DNA, which has with respect to the selectable marker polypeptide and the polypeptide of interest a coding strand and a non-coding strand, the strand coding being the strand with the same sequence as the Translated RNA, except for the presence of T instead of U. Thus, an AUG start codon is encoded in the coding strand by an ATG sequence, and the strand containing this ATG sequence corresponding to the AUG start codon in the RNA It is designated as the DNA coding strand. It will be apparent to the person skilled in the art that the start codons or translation initiation sequences are in fact present in an RNA molecule, but that these can also be considered materialized in a DNA molecule encoding said RNA molecule; therefore, whenever the present invention designates a start codon or translation initiation sequence, it is intended to include the corresponding DNA molecule having the same sequence as the RNA molecule less by the presence of a T instead of a U in the coding strand of said DNA molecule and vice versa, except when otherwise explicitly specified. In other words, a start codon is for example an AUG sequence in RNA, but the corresponding ATG sequence in the DNA coding strand is designated as start codon also in the present invention. The same is used for the reference of "in-phase" coding sequences, which means triplets (3 bases) in the RNA molecule that are translated to an amino acid, but they must also be interpreted as the corresponding trinucleotide sequences in the coding strand of The DNA molecule.

El polipéptido marcador seleccionable y el polipéptido de interés codificados por el gen multicistrónico tienen cada uno su propia secuencia de iniciación de la traducción, y por lo tanto tienen cada uno su propio codón de inicio (así como codón de terminación), concretamente, están codificados por marcos de lectura abiertos separados. The selectable marker polypeptide and the polypeptide of interest encoded by the multicistronic gene each have their own translation initiation sequence, and therefore each have their own start codon (as well as termination codon), specifically, are encoded by separate open reading frames.

El término “marcador de selección” o “marcador seleccionable” se usa típicamente para designar un gen y/o proteína cuya presencia puede detectarse directa o indirectamente en una célula, por ejemplo, un polipéptido que inactiva un agente de selección y protege a la célula hospedadora de los efectos letales o inhibidores del crecimiento del agente (por ejemplo, un gen y/o proteína de resistencia a antibiótico). Es otra posibilidad que dicho marcador de selección induzca fluorescencia o un depósito coloreado (por ejemplo, proteína fluorescente verde (GFP) y derivados (por ejemplo, d2EGFP), luciferasa, lacZ, fosfatasa alcalina, etc.), que puede usarse para seleccionar células que expresan el polipéptido inductor del depósito coloreado, por ejemplo, usando un clasificador celular activado por fluorescencia (FACS) para seleccionar células que expresan GFP. Preferiblemente, el polipéptido marcador seleccionable según la invención proporciona resistencia frente a los efectos letales y/o inhibidores del crecimiento de un agente de selección. El polipéptido marcador seleccionable está codificado por el ADN de la invención. El polipéptido marcador seleccionable según la invención debe ser funcional en una célula hospedadora eucariótica, y por tanto poder seleccionarse en células hospedadoras eucarióticas. Puede usarse en principio según la presente invención cualquier polipéptido marcador seleccionable que cumpla este criterio. Dichos polipéptidos marcadores seleccionables son bien conocidos en la técnica y se usan rutinariamente cuando han de obtenerse clones de células hospedadoras eucarióticas, y se proporcionan varios ejemplos en la presente memoria. En ciertas realizaciones, es un marcador de selección usado para la invención la zeocina. En otras realizaciones, se usa blasticidina. El especialista en la materia sabrá que están disponibles y pueden usarse otros marcadores de selección, por ejemplo, neomicina, puromicina, bleomicina, higromicina, etc. En otras realizaciones, se usa kanamicina. En aún otras realizaciones, se usa el gen dhfr como marcador seleccionable, que puede seleccionarse con metotrexato, especialmente aumentando la concentración de metotrexato, pueden seleccionarse células con números aumentados de copias del gen dhfr. El gen dhfr puede usarse también para complementar la deficiencia de dhfr, por ejemplo, en células CHO que tienen un fenotipo dhfr-, en medio de cultivo con folato y que carece de glicina, hipoxantina y timidina. De forma similar, puede usarse el gen de glutamina sintetasa (GS), para el que es posible la selección en células que tienen insuficiente GS (por ejemplo, células NS-0) cultivando en medio sin glutamina o, como alternativa, en células que tienen suficiente GS (por ejemplo, células CHO) añadiendo un inhibidor de GS, la metionina sulfoximina (MSX). Se describen otros genes marcadores seleccionables que podrían usarse, y sus agentes de selección, por ejemplo, en la tabla 1 de la patente de EE.UU. 5.561.053; véase también Kaufman, Methods in Enzymology, 185: 537-566 (1990), para una revisión de estos. Si el polipéptido marcador seleccionable es dhfr, se cultiva la célula hospedadora en realizaciones ventajosas en un medio de cultivo que contiene folato y cuyo medio de cultivo está esencialmente desprovisto de hipoxantina y timidina, y preferiblemente también de glicina. The term "selection marker" or "selectable marker" is typically used to designate a gene and / or protein whose presence can be detected directly or indirectly in a cell, for example, a polypeptide that inactivates a selection agent and protects the cell. host of lethal effects or inhibitors of agent growth (for example, an antibiotic resistance gene and / or protein). It is another possibility that said selection marker induces fluorescence or a colored deposit (for example, green fluorescent protein (GFP) and derivatives (for example, d2EGFP), luciferase, lacZ, alkaline phosphatase, etc.), which can be used to select cells expressing the colored deposit inducing polypeptide, for example, using a fluorescence activated cell sorter (FACS) to select cells expressing GFP. Preferably, the selectable marker polypeptide according to the invention provides resistance against the lethal effects and / or growth inhibitors of a selection agent. The selectable marker polypeptide is encoded by the DNA of the invention. The selectable marker polypeptide according to the invention must be functional in a eukaryotic host cell, and therefore can be selected in eukaryotic host cells. Any selectable marker polypeptide that meets this criterion can be used in principle according to the present invention. Such selectable marker polypeptides are well known in the art and are routinely used when clones of eukaryotic host cells are to be obtained, and several examples are provided herein. In certain embodiments, zeocin is a selection marker used for the invention. In other embodiments, blasticidine is used. The person skilled in the art will know that other selection markers are available and can be used, for example, neomycin, puromycin, bleomycin, hygromycin, etc. In other embodiments, kanamycin is used. In still other embodiments, the dhfr gene is used as a selectable marker, which can be selected with methotrexate, especially by increasing the concentration of methotrexate, cells with increased numbers of copies of the dhfr gene can be selected. The dhfr gene can also be used to complement dhfr deficiency, for example, in CHO cells that have a dhfr- phenotype, in culture medium with folate and lacking glycine, hypoxanthine and thymidine. Similarly, the glutamine synthetase (GS) gene can be used, for which selection is possible in cells that have insufficient GS (eg, NS-0 cells) by culturing in medium without glutamine or, alternatively, in cells that they have enough GS (for example, CHO cells) by adding a GS inhibitor, methionine sulfoximin (MSX). Other selectable marker genes that could be used, and their selection agents, are described, for example, in Table 1 of US Pat. 5,561,053; see also Kaufman, Methods in Enzymology, 185: 537-566 (1990), for a review of these. If the selectable marker polypeptide is dhfr, the host cell is grown in advantageous embodiments in a culture medium containing folate and whose culture medium is essentially devoid of hypoxanthine and thymidine, and preferably also glycine.

Cuando han de seleccionarse dos unidades de transcripción multicistrónicas según la invención en una sola célula hospedadora, cada una contiene preferiblemente la secuencia de codificación de un marcador seleccionable diferente, para permitir la selección de ambas unidades de transcripción multicistrónicas. Por supuesto, ambas unidades de transcripción multicistrónicas pueden estar presentes en una sola molécula de ácido nucleico o, como alternativa, cada una puede estar presente en una molécula de ácido nucleico separada. When two multicistronic transcription units according to the invention are to be selected in a single host cell, each preferably contains the coding sequence of a different selectable marker, to allow the selection of both multicistronic transcription units. Of course, both multicistronic transcription units may be present in a single nucleic acid molecule or, alternatively, each may be present in a separate nucleic acid molecule.

El término “selección” se define típicamente como el proceso de uso de un marcador de selección/marcador selectivo y un agente de selección para identificar células hospedadoras con propiedades genéticas específicas (por ejemplo, que la célula hospedadora contenga un transgén integrado en su genoma). Resulta evidente para un especialista en la materia que son posibles numerosas combinaciones de marcadores de selección. Es un antibiótico que es particularmente ventajoso la zeocina, porque la proteína de resistencia a zeocina (zeocina-R) actúa uniéndose al fármaco y volviéndolo inofensivo. Por lo tanto, es fácil valorar la cantidad de fármaco que mata las células con bajos niveles de expresión de zeocina-R, mientras que permite sobrevivir a las de alta expresión. Todas las demás proteínas de resistencia a antibiótico de uso común son enzimas, y por tanto actúan catalíticamente (no The term "selection" is typically defined as the process of using a selection marker / selective marker and a selection agent to identify host cells with specific genetic properties (eg, that the host cell contains a transgene integrated into its genome) . It is evident to a specialist in the field that numerous combinations of selection markers are possible. It is an antibiotic that is particularly advantageous for zeocin, because the zeocin resistance protein (zeocin-R) acts by binding to the drug and rendering it harmless. Therefore, it is easy to assess the amount of drug that kills cells with low levels of zeocin-R expression, while allowing high-expression cells to survive. All other commonly used antibiotic resistance proteins are enzymes, and therefore act catalytically (not

1:1 con el fármaco). Por tanto, el antibiótico zeocina es un marcador de selección preferido. Es otro marcador de selección preferido una enzima sintetizadora de 5,6,7,8-tetrahidrofolato (dhfr). Sin embargo, la invención funciona también con otros marcadores de selección. 1: 1 with the drug). Therefore, the antibiotic zeocin is a preferred selection marker. Another preferred selection marker is a 5,6,7,8-tetrahydrofolate (dhfr) synthesizing enzyme. However, the invention also works with other selection markers.

Es un polipéptido marcador seleccionable según la invención la proteína codificada por el ácido nucleico de la invención, cuyo polipéptido puede usarse funcionalmente para la selección, por ejemplo, debido a que proporciona resistencia ante un agente de selección tal como un antibiótico. Por tanto, cuando se usa un antibiótico como agente de selección, el ADN codifica un polipéptido que confiere resistencia al agente de selección, siendo dicho polipéptido el polipéptido marcador seleccionable. Son conocidas las secuencias de ADN que codifican dichos polipéptidos marcadores seleccionables, y se proporcionan en la presente memoria varios ejemplos de secuencias de tipo natural de ADN que codifica proteínas marcadores seleccionables (por ejemplo, Fig. 26-32 del documento WO 2006/048459). Resultará evidente que los mutantes o derivados de los marcadores seleccionables pueden usarse también adecuadamente según la invención, y están por lo tanto incluidos dentro del alcance del término “polipéptido marcador seleccionable”, a condición de que la proteína marcadora seleccionable siga funcional. It is a selectable marker polypeptide according to the invention the protein encoded by the nucleic acid of the invention, whose polypeptide can be used functionally for selection, for example, because it provides resistance to a selection agent such as an antibiotic. Therefore, when an antibiotic is used as the selection agent, the DNA encodes a polypeptide that confers resistance to the selection agent, said polypeptide being the selectable marker polypeptide. DNA sequences encoding said selectable marker polypeptides are known, and several examples of wild-type DNA sequences encoding selectable marker proteins are provided herein (eg, Fig. 26-32 of WO 2006/048459) . It will be apparent that mutants or derivatives of the selectable markers can also be suitably used according to the invention, and are therefore included within the scope of the term "selectable marker polypeptide", provided that the selectable marker protein remains functional.

Por conveniencia, y como se acepta generalmente por los especialistas en la materia, en muchas publicaciones así como en la presente memoria, a menudo el gen y la proteína que codifica resistencia ante un agente de selección se designan como el “gen (de resistencia) del agente seleccionable” o la “proteína (de resistencia) del agente de selección”, respectivamente, aunque los nombres oficiales pueden ser diferentes, por ejemplo, el gen que codifica la proteína que confiere resistencia a neomicina (así como a G418 y kanamicina) se designa a menudo como gen (de resistencia) de neomicina (o neor), mientras que el nombre oficial es gen de aminoglucósido 3’-fosfotransferasa. For convenience, and as generally accepted by those skilled in the art, in many publications as well as herein, the gene and the protein encoding resistance to a selection agent are often referred to as the "resistance gene". of the selectable agent ”or the“ protein (of resistance) of the selection agent ”, respectively, although the official names may be different, for example, the gene encoding the protein that confers resistance to neomycin (as well as G418 and kanamycin) It is often referred to as a neomycin (or neor) (resistance) gene, while the official name is aminoglycoside 3'-phosphotransferase gene.

Para la presente invención, es beneficioso tener bajos niveles de expresión del polipéptido marcador seleccionable, de modo que sea posible una selección rigurosa. En la presente invención, se produce esto usando una secuencia de codificación de marcador seleccionable con un codón de inicio no ATG. Tras la selección, se seleccionarán solo las células que tengan no obstante suficientes niveles de polipéptido marcador seleccionable, lo que significa que dichas células deben tener suficiente transcripción de la unidad de transcripción multicistrónica y suficiente traducción del polipéptido marcador seleccionable, lo que proporciona una selección de células en que la unidad de transcripción multicistrónica se ha integrado o está presente de otro modo en las células hospedadoras en un lugar en que los niveles de expresión de esta unidad de transcripción son altos. For the present invention, it is beneficial to have low levels of selectable marker polypeptide expression, so that rigorous selection is possible. In the present invention, this is produced using a selectable marker coding sequence with a non-ATG start codon. After selection, only cells having nevertheless sufficient levels of selectable marker polypeptide will be selected, which means that said cells must have sufficient transcription of the multicistronic transcription unit and sufficient translation of the selectable marker polypeptide, which provides a selection of cells in which the multicistronic transcription unit has been integrated or is otherwise present in the host cells in a place where the expression levels of this transcription unit are high.

Las moléculas de ADN según la invención tienen la secuencia de codificación del polipéptido marcador seleccionable en dirección 3’ de la secuencia de codificación del polipéptido de interés. Por tanto, la unidad de transcripción multicistrónica comprende, en la dirección 5’ a 3’ (tanto en la hebra transcrita del ADN como en el ARN transcrito resultante) la secuencia que codifica el polipéptido de interés y la secuencia que codifica el polipéptido marcador seleccionable. El IRES está en dirección 5’ de la secuencia de codificación del polipéptido marcador seleccionable. The DNA molecules according to the invention have the coding sequence of the marker polypeptide selectable in the 3 ′ direction of the coding sequence of the polypeptide of interest. Thus, the multicistronic transcription unit comprises, in the 5 'to 3' direction (both in the transcribed strand of the DNA and in the resulting transcribed RNA) the sequence encoding the polypeptide of interest and the sequence encoding the selectable marker polypeptide . The IRES is in the 5 ′ direction of the coding sequence of the selectable marker polypeptide.

Según la invención, la región de codificación del gen de interés se traduce preferiblemente a partir del ORF dependiente de caperuza, y el polipéptido de interés se produce en abundancia. El polipéptido marcador seleccionable se traduce a partir de un IRES. Para reducir la traducción del cistrón marcador seleccionable, según la invención la secuencia de ácido nucleico que codifica el polipéptido marcador seleccionable comprende una mutación en el codón de inicio que reduce la eficacia de la iniciación de la traducción del polipéptido marcador seleccionable en una célula hospedadora eucariótica. Preferiblemente, se introduce por ingeniería genética un codón de inicio GTG, o más preferiblemente un codón de inicio TTG, en el polipéptido marcador seleccionable. La eficacia de traducción es menor que la de la correspondiente secuencia de tipo natural en la misma célula, concretamente, la mutación da como resultado menos polipéptido por célula por unidad de tiempo, y por tanto menos polipéptido marcador seleccionable. According to the invention, the coding region of the gene of interest is preferably translated from the hood-dependent ORF, and the polypeptide of interest is produced in abundance. The selectable marker polypeptide is translated from an IRES. To reduce the translation of the selectable marker cistron, according to the invention the nucleic acid sequence encoding the selectable marker polypeptide comprises a mutation in the start codon that reduces the efficiency of translation initiation of the selectable marker polypeptide in a eukaryotic host cell. . Preferably, a GTG start codon, or more preferably a TTG start codon, is introduced genetically into the selectable marker polypeptide. The translation efficiency is less than that of the corresponding wild-type sequence in the same cell, namely, the mutation results in less polypeptide per cell per unit of time, and therefore less selectable marker polypeptide.

Una secuencia de inicio de la traducción se designa a menudo en el campo como una “secuencia Kozak”, y es una secuencia Kozak óptima RCCATGG, con el codón de inicio subrayado, siendo R una purina, concretamente A o G (véanse Kozak M, 1986, 1987, 1989, 1990, 1997, 2002). Por tanto, además del codón de inicio mismo, es relevante el contexto del mismo, en particular los nucleótidos –3 a –1 y +4, y una secuencia de inicio de la traducción óptima comprende un codón de inicio óptimo (concretamente, ATG) en un contexto óptimo (concretamente, el ATG precedido directamente por RCC y seguido directamente por G). La traducción por los ribosomas es más eficaz cuando está presente una secuencia Kozak óptima (véanse Kozak M, 1986, 1987, 1989, 1990, 1997, 2002). Sin embargo, en un pequeño porcentaje de eventos, se reconocen secuencias de iniciación de la traducción no óptimas y se usan por el ribosoma para iniciar la traducción. La presente invención hace uso de este principio, y permite reducir e incluso un ajuste fino de la cantidad de traducción, y por tanto de la expresión del polipéptido marcador seleccionable, lo que puede usarse por lo tanto para aumentar el rigor del sistema de selección. A translation start sequence is often referred to in the field as a "Kozak sequence", and is an optimal Kozak sequence RCCATGG, with the start codon underlined, R being a purine, namely A or G (see Kozak M, 1986, 1987, 1989, 1990, 1997, 2002). Therefore, in addition to the start codon itself, its context is relevant, in particular nucleotides –3 to –1 and +4, and an optimal translation start sequence comprises an optimal start codon (specifically, ATG) in an optimal context (specifically, the ATG directly preceded by RCC and directly followed by G). Translation by ribosomes is most effective when an optimal Kozak sequence is present (see Kozak M, 1986, 1987, 1989, 1990, 1997, 2002). However, in a small percentage of events, non-optimal translation initiation sequences are recognized and used by the ribosome to initiate translation. The present invention makes use of this principle, and allows to reduce and even a fine adjustment of the amount of translation, and therefore of the expression of the selectable marker polypeptide, which can therefore be used to increase the rigor of the selection system.

El codón de inicio ATG del polipéptido marcador seleccionable de la invención se muta a otro codón, lo que se ha notificado que proporciona cierta iniciación de la traducción, por ejemplo, a GTG, TTG, CTG, ATT o ACG (designados colectivamente en la presente memoria como “codones de inicio no ATG”). En realizaciones preferidas, el codón de inicio ATG se muta a un codón de inicio GTG. Esto proporciona niveles de expresión aún menores (menor traducción) que con el codón de inicio ATG intacto, pero en un contexto no óptimo. Más preferiblemente, el codón de inicio ATG se muta a un codón de inicio TTG, que proporciona niveles de expresión aún menores del polipéptido marcador seleccionable que con el codón de inicio GTG (Kozak M, 1986, 1987, 1989, 1990, 1997, 2002; véanse también los ejemplos 9-13 en el documento WO 2006/048459). No se ha dado a conocer ni sugerido en la técnica anterior el uso de codones de inicio no ATG en la secuencia de codificación de un polipéptido marcador seleccionable en una unidad de transcripción multicistrónica según la presente invención y, preferiblemente en combinación con elementos de control de cromatina, conduce a niveles muy altos de expresión del polipéptido de interés, como se muestra también en el documento WO 2006/048459. The ATG start codon of the selectable marker polypeptide of the invention is mutated to another codon, which has been reported to provide some translation initiation, for example, to GTG, TTG, CTG, ATT or ACG (collectively designated herein. memory as "non-ATG start codons"). In preferred embodiments, the ATG start codon is mutated to a GTG start codon. This provides even lower expression levels (lower translation) than with the ATG start codon intact, but in a non-optimal context. More preferably, the ATG start codon is mutated to a TTG start codon, which provides even lower expression levels of the selectable marker polypeptide than with the GTG start codon (Kozak M, 1986, 1987, 1989, 1990, 1997, 2002 ; see also examples 9-13 in WO 2006/048459). The use of non-ATG start codons in the coding sequence of a selectable marker polypeptide in a multicistronic transcription unit according to the present invention and, preferably in combination with control elements of control, has not been disclosed or suggested in the prior art. Chromatin, leads to very high levels of expression of the polypeptide of interest, as also shown in WO 2006/048459.

Para el uso de un codón de inicio no ATG según la invención, es muy preferido proporcionar un contexto óptimo para dicho codón de inicio, concretamente, los codones de inicio no ATG preferiblemente están precedidos directamente por los nucleótidos RCC en posiciones -3 a -1 y seguidos directamente por un nucleótido G (posición +4). Sin embargo, se ha notificado que usando la secuencia TTTGTGG (codón de inicio subrayado), se observa cierta iniciación al menos in vitro, así que aunque muy preferido, puede no ser absolutamente necesario proporcionar un contexto óptimo para los codones de inicio no ATG. For the use of a non-ATG start codon according to the invention, it is very preferred to provide an optimal context for said start codon, namely, non-ATG start codons are preferably directly preceded by the RCC nucleotides at positions -3 to -1 and followed directly by a G nucleotide (position +4). However, it has been reported that using the TTTGTGG sequence (underline start codon), some initiation is observed at least in vitro, so although very preferred, it may not be absolutely necessary to provide an optimal context for the non-ATG start codons.

Las secuencias de ATG en la secuencia de codificación de un polipéptido, pero excluyendo el codón de inicio ATG, se designan como “ATG internos”, y si estos están en fase con el ORF y codifican por lo tanto metionina, la metionina resultante en el polipéptido se designa como “metionina interna”. En la invención del documento WO 2006/048459, la región de codificación (después de codón de inicio, no incluyendo necesariamente el codón de inicio) que codifica el polipéptido marcador seleccionable está desprovista de cualquier secuencia ATG en la hebra de codificación del ADN hasta (pero sin incluir) el codón de inicio del polipéptido de interés. El documento WO 2006/048459 da a conocer cómo producir esto y cómo ensayar la funcionalidad de los polipéptidos marcadores resultantes. Para la presente invención, cuando la secuencia de codificación del polipéptido marcador seleccionable está en dirección 3’ de un IRES y en dirección 3’ de la secuencia de codificación del polipéptido de interés, los ATG internos en la secuencia que codifica el polipéptido marcador seleccionable pueden permanecer intactos. The ATG sequences in the coding sequence of a polypeptide, but excluding the ATG start codon, are designated as "internal ATGs", and if these are in phase with the ORF and therefore encode methionine, the resulting methionine in the Polypeptide is designated as "internal methionine." In the invention of WO 2006/048459, the coding region (after start codon, not necessarily including the start codon) that encodes the selectable marker polypeptide is devoid of any ATG sequence in the DNA coding strand up to ( but not including) the start codon of the polypeptide of interest. WO 2006/048459 discloses how to produce this and how to test the functionality of the resulting marker polypeptides. For the present invention, when the coding sequence of the selectable marker polypeptide is in the 3 'direction of an IRES and in the 3' direction of the coding sequence of the polypeptide of interest, internal ATGs in the sequence encoding the selectable marker polypeptide can remain intact

Evidentemente, es muy preferido según la presente invención que la secuencia de inicio de la traducción del polipéptido de interés comprenda una secuencia de inicio de la traducción óptima, concretamente, que tenga la secuencia consenso RCCATGG (codón de inicio subrayado). Esto dará como resultado una traducción muy eficaz del polipéptido de interés. Obviously, it is very preferred according to the present invention that the translation initiation sequence of the polypeptide of interest comprises an optimal translation initiation sequence, namely, having the consensus sequence RCCATGG (start codon underlined). This will result in a very effective translation of the polypeptide of interest.

Al proporcionar a la secuencia de codificación del marcador diferentes mutaciones que conducen a varios niveles de eficacia de traducción reducida, puede aumentarse el rigor de la selección. Es por tanto posible el ajuste fino del sistema de selección usando las unidades de transcripción multicistrónicas según la invención: por ejemplo, usando un codón GTG de inicio para el polipéptido marcador de selección, se traducirán solo unos pocos ribosomas a partir de este codón de inicio, dando como resultado bajos niveles de proteína marcadora seleccionable y por tanto un alto rigor de selección; usar un codón de inicio TTG aumenta adicionalmente el rigor de la selección debido a que aún menos ribosomas traducirán el polipéptido marcador seleccionable a partir de este codón de inicio. By providing the marker coding sequence with different mutations that lead to various levels of reduced translation efficiency, the rigor of the selection can be increased. It is therefore possible to fine tune the selection system using the multicistronic transcription units according to the invention: for example, using a start GTG codon for the selection marker polypeptide, only a few ribosomes will be translated from this start codon , resulting in low levels of selectable marker protein and therefore high selection rigor; using a TTG start codon further increases the rigor of the selection because even less ribosomes will translate the selectable marker polypeptide from this start codon.

Se demuestra en el documento WO 2006/048459 que las unidades de expresión multicistrónicas dadas a conocer en la presente memoria pueden usarse en un sistema de selección muy robusto, conduciendo a un porcentaje muy alto de clones que expresan el polipéptido de interés a altos niveles, según se desee. Además, los niveles de expresión obtenidos para el polipéptido de interés parecen ser significativamente mayores que los obtenidos cuando se criban un número aún mayor de colonias usando los sistemas de selección conocidos hasta ahora. It is demonstrated in WO 2006/048459 that the multicistronic expression units disclosed herein can be used in a very robust selection system, leading to a very high percentage of clones expressing the polypeptide of interest at high levels, as desired. In addition, the expression levels obtained for the polypeptide of interest appear to be significantly higher than those obtained when an even larger number of colonies are screened using the selection systems known so far.

Además de una eficacia de iniciación de la traducción reducida, podría ser beneficioso proporcionar también una eficacia de alargamiento de la traducción reducida del polipéptido marcador seleccionable, por ejemplo, mutando la secuencia de codificación del mismo de modo que comprenda varios codones no preferidos de la célula hospedadora, para reducir adicionalmente los niveles de traducción del polipéptido marcador y permitir condiciones de selección aún más rigurosas, si se desea. En ciertas realizaciones, además de la mutación o mutaciones que reducen la eficacia de la traducción según la invención, el polipéptido marcador seleccionable comprende adicionalmente una mutación que reduce la actividad del polipéptido marcador seleccionable en comparación con su contrapartida de tipo natural. Eso puede usarse para aumentar el rigor de la selección más aún. Como ejemplos no limitantes, puede mutarse la prolina en posición 9 del polipéptido de resistencia a zeocina, por ejemplo, a Thr o Phe (véase, por ejemplo, en ejemplo 14 del documento WO 2006/048459), y para el polipéptido de resistencia a neomicina, pueden mutarse adicionalmente los restos aminoacídicos 182 o 261 o ambos (véase, por ejemplo, el documento WO 01/32901). In addition to a reduced translation initiation efficiency, it could also be beneficial to provide a reduced translation elongation efficiency of the selectable marker polypeptide, for example, by mutating the coding sequence thereof so as to comprise several non-preferred codons of the cell. host, to further reduce the translation levels of the marker polypeptide and allow even more stringent selection conditions, if desired. In certain embodiments, in addition to the mutation or mutations that reduce the efficiency of translation according to the invention, the selectable marker polypeptide further comprises a mutation that reduces the activity of the selectable marker polypeptide compared to its wild-type counterpart. That can be used to increase the rigor of the selection even more. As non-limiting examples, proline in position 9 of the zeocin resistance polypeptide can be mutated, for example, to Thr or Phe (see, for example, in example 14 of WO 2006/048459), and for the resistance polypeptide to neomycin, amino acid residues 182 or 261 or both may be further mutated (see, for example, WO 01/32901).

En algunas realizaciones de la invención, se dispone una denominada secuencia espaciadora en dirección 3’ de la secuencia que codifica el codón de inicio del polipéptido marcador seleccionable, siendo preferiblemente dicha secuencia espaciadora una secuencia en fase con el codón de inicio, que codifica unos pocos aminoácidos y que no contiene una estructura secundaria (Kozak, 1990). Puede usarse dicha secuencia espaciadora para reducir adicionalmente la frecuencia de iniciación de la traducción si está presente una estructura secundaria en el ARN (Kozak, 1990) del polipéptido marcador seleccionable (por ejemplo, de zeocina, posiblemente de blasticidina) y por tanto aumentar el rigor del sistema de selección según la invención (véase, por ejemplo, el ejemplo 14 del documento WO 2006/048459). In some embodiments of the invention, a so-called 3 'spacer sequence of the sequence encoding the start codon of the selectable marker polypeptide is arranged, said spacer sequence being preferably a phase sequence with the start codon, which encodes a few amino acids and that does not contain a secondary structure (Kozak, 1990). Said spacer sequence can be used to further reduce the frequency of translation initiation if a secondary structure is present in the RNA (Kozak, 1990) of the selectable marker polypeptide (eg, zeocin, possibly blasticidine) and therefore increase the rigor of the selection system according to the invention (see, for example, example 14 of WO 2006/048459).

Resultará evidente que puede usarse también cualquier molécula de ADN como se ha descrito, pero que tenga mutaciones en la secuencia en dirección 3’ del primer ATG (codón de inicio) que codifica la proteína marcadora seleccionable, y por tanto están también comprendidas en la invención, a condición de que la proteína marcadora seleccionable codificada respectiva siga teniendo actividad. Por ejemplo, está también comprendida cualquier mutación silenciosa que no altere la proteína codificada debido a la redundancia del código genético. Están también comprendidas mutaciones adicionales que conduzcan a mutaciones aminoacídicas conservativas o a otras mutaciones, a condición de que la proteína codificada siga teniendo actividad, que puede ser menor o no que la de la proteína de tipo natural codificada por las secuencias indicadas. En particular, se prefiere que la proteína codificada sea al menos un 70%, preferiblemente al menos un 80%, más preferiblemente al menos un 90%, aún más preferiblemente al menos un 95% idéntica a las proteínas codificadas por las secuencias indicadas respectivas (por ejemplo, como se proporciona en las SEQ ID NO. 68-80 de la lista de secuencias de la presente solicitud). El ensayo de la actividad de las proteínas marcadoras seleccionables puede realizarse mediante procedimientos rutinarios. It will be apparent that any DNA molecule can also be used as described, but which has mutations in the 3 'direction sequence of the first ATG (start codon) encoding the selectable marker protein, and therefore are also included in the invention. , provided that the respective coded selectable marker protein continues to have activity. For example, any silent mutation that does not alter the encoded protein due to the redundancy of the genetic code is also included. Additional mutations that lead to conservative amino acid mutations or other mutations are also included, provided that the encoded protein continues to have activity, which may or may not be less than that of the wild-type protein encoded by the indicated sequences. In particular, it is preferred that the encoded protein be at least 70%, preferably at least 80%, more preferably at least 90%, even more preferably at least 95% identical to the proteins encoded by the respective indicated sequences ( for example, as provided in SEQ ID NO 68-80 of the sequence list of the present application). The activity test of the selectable marker proteins can be performed by routine procedures.

Es un aspecto preferido de la invención proporcionar un módulo de expresión que comprende la molécula de ADN según la invención, que tiene la unidad de transcripción multicistrónica. Dicho módulo de expresión es útil para expresar secuencias de interés, por ejemplo, en células hospedadoras. Un “módulo de expresión” como se usa en la presente memoria es una secuencia de ácido nucleico que comprende al menos un promotor ligado funcionalmente con una secuencia de la que se desea la expresión. Preferiblemente, un módulo de expresión contiene adicionalmente secuencias de terminación de la transcripción y de poliadenilación. Pueden incluirse también otras secuencias reguladoras tales como potenciadores. Por tanto, la invención proporciona un módulo de expresión que comprende en el siguiente orden: 5’– promotor – unidad de transcripción multicistrónica según la invención que codifica un polipéptido de interés y en dirección 3’ de la misma un polipéptido marcador seleccionable – secuencia de terminación de la transcripción – 3’. El promotor debe ser capaz de funcionar en una célula hospedadora eucariótica, concretamente, debe ser capaz de dirigir la transcripción de la unidad de transcripción multicistrónica. El promotor está así ligado operativamente con la unidad de transcripción multicistrónica. Adicionalmente, el módulo de expresión puede contener opcionalmente otros elementos conocidos en la materia, por ejemplo, sitios de corte y empalme que comprenden intrones y similares. En algunas realizaciones, está presente un intrón detrás del promotor y antes de la secuencia que codifica el polipéptido de interés. Un IRES está ligado operativamente con el cistrón que contiene la secuencia que codifica el polipéptido marcador seleccionable. En realizaciones adicionales, está presente una secuencia que codifica un segundo marcador seleccionable en la unidad de transcripción multicistrónica – (concretamente, esta es al menos una unidad de transcripción tricistrónica en estas realizaciones). En realizaciones preferidas del mismo, dicha secuencia que codifica un segundo polipéptido marcador seleccionable: a) tiene una secuencia de iniciación de la traducción separada de la del polipéptido de interés, b) está dispuesta en dirección 5’ de dicha secuencia que codifica un polipéptido de interés, c) no tiene una secuencia ATG en la hebra de codificación después del codón de inicio de dicho segundo polipéptido marcador seleccionable hasta el codón de inicio del polipéptido de interés y d) tiene una secuencia de inicio de la traducción no óptima, por ejemplo, un codón de inicio GTG o un codón de inicio TTG. Para dichas realizaciones, es un polipéptido marcador seleccionable preferido la enzima sintetizadora de 5,6,7,8-tetrahidrofolato (dhfr). Esto permite una selección continua de altos niveles de expresión del polipéptido de interés, como se ejemplifica en el ejemplo 2. It is a preferred aspect of the invention to provide an expression module comprising the DNA molecule according to the invention, which has the multicistronic transcription unit. Said expression module is useful for expressing sequences of interest, for example, in host cells. An "expression module" as used herein is a nucleic acid sequence comprising at least one promoter linked functionally with a sequence of which expression is desired. Preferably, an expression module additionally contains transcription termination and polyadenylation sequences. Other regulatory sequences such as enhancers may also be included. Therefore, the invention provides an expression module comprising in the following order: 5'– promoter-multicistronic transcription unit according to the invention encoding a polypeptide of interest and in the 3 'direction thereof a selectable marker polypeptide-sequence of termination of transcription - 3 '. The promoter must be able to function in a eukaryotic host cell, specifically, it must be able to direct the transcription of the multicistronic transcription unit. The promoter is thus operatively linked with the multicistronic transcription unit. Additionally, the expression module may optionally contain other elements known in the art, for example, splice sites comprising introns and the like. In some embodiments, an intron is present behind the promoter and before the sequence encoding the polypeptide of interest. An IRES is operatively linked to the cistron containing the sequence encoding the selectable marker polypeptide. In further embodiments, a sequence encoding a second selectable marker is present in the multicistronic transcription unit - (specifically, this is at least one tricistronic transcription unit in these embodiments). In preferred embodiments thereof, said sequence encoding a second selectable marker polypeptide: a) has a translation initiation sequence separate from that of the polypeptide of interest, b) is arranged in the 5 'direction of said sequence encoding a polypeptide of of interest, c) does not have an ATG sequence in the coding strand after the start codon of said second selectable marker polypeptide until the start codon of the polypeptide of interest and d) has a non-optimal translation start sequence, for example, a GTG start codon or a TTG start codon. For such embodiments, a 5,6,7,8-tetrahydrofolate synthesizing enzyme (dhfr) is a preferred selectable marker polypeptide. This allows a continuous selection of high levels of expression of the polypeptide of interest, as exemplified in Example 2.

Para obtener la expresión de secuencias de ácido nucleico que codifican proteína, es bien conocido por los especialistas en la materia que las secuencias capaces de dirigir dicha expresión pueden estar ligadas funcionalmente con las secuencias de ácido nucleico que codifican proteína, dando como resultado moléculas de ácido nucleico recombinantes que codifican una proteína en formato expresable. En la presente invención, el módulo de expresión comprende una unidad de transcripción multicistrónica. En general, la secuencia promotora se dispone en dirección 5’ de las secuencias que deberían expresarse. Están disponibles en la técnica vectores de expresión muy usados, por ejemplo, la serie de vectores pcDNA y pEF de Invitrogen, pMSCV y pTK-Hyg de BD Sciences, pCMV-Script de Stratagene, etc., que pueden usarse para obtener secuencias promotoras y/o terminadoras de la transcripción adecuadas, secuencias de poliA y similares. To obtain the expression of nucleic acid sequences encoding protein, it is well known to those skilled in the art that sequences capable of directing said expression may be functionally linked to nucleic acid sequences encoding protein, resulting in acid molecules. Recombinant nucleic encoding a protein in expressible format. In the present invention, the expression module comprises a multicistronic transcription unit. In general, the promoter sequence is arranged in the 5 ’direction of the sequences that should be expressed. Widely used expression vectors are available in the art, for example, the series of pcDNA and pEF vectors from Invitrogen, pMSCV and pTK-Hyg from BD Sciences, pCMV-Script from Stratagene, etc., which can be used to obtain promoter sequences and / or suitable transcription terminators, polyA sequences and the like.

Cuando la secuencia que codifica el polipéptido de interés se inserta apropiadamente con respecto a las secuencias que rigen la transcripción y traducción del polipéptido codificado, el módulo de expresión resultante es útil para producir el polipéptido de interés, designado como expresión. Las secuencias que dirigen la expresión pueden incluir promotores, potenciadores y similares, y combinaciones de los mismos. Estos deberían ser capaces de funcionar en la célula hospedadora, dirigiendo así la expresión de las secuencias de ácido nucleico que están ligadas funcionalmente con ellos. El especialista en la materia es consciente de que pueden usarse diversos promotores para obtener la expresión de un gen en células hospedadoras. Los promotores pueden ser constitutivos o regulados, y pueden obtenerse de diversas fuentes incluyendo virus, fuentes procarióticas o eucarióticas o diseñarse artificialmente. La expresión de los ácidos nucleicos de interés puede ser a partir del promotor natural o un derivado del mismo o a partir de un promotor enteramente heterólogo (Kaufman, 2000). Según la presente invención, se prefieren promotores fuertes que dan altos niveles de transcripción en las células eucarióticas de elección. Los promotores adecuados son bien conocidos y están disponibles para el especialista en la materia, y se describen varios en el documento WO 2006/048459 (por ejemplo, páginas 28-29), incluyendo el promotor inmediato temprano (IE) de CMV (designado en la presente memoria como el promotor de CMV) (obtenible, por ejemplo, a partir de pcDNA, Invitrogen), y muchos otros. When the sequence encoding the polypeptide of interest is properly inserted with respect to the sequences that govern the transcription and translation of the encoded polypeptide, the resulting expression module is useful for producing the polypeptide of interest, designated as expression. The sequences that direct expression can include promoters, enhancers and the like, and combinations thereof. These should be able to function in the host cell, thus directing the expression of the nucleic acid sequences that are functionally linked with them. The person skilled in the art is aware that various promoters can be used to obtain the expression of a gene in host cells. Promoters can be constitutive or regulated, and can be obtained from various sources including viruses, prokaryotic or eukaryotic sources or artificially designed. The expression of the nucleic acids of interest can be from the natural promoter or a derivative thereof or from an entirely heterologous promoter (Kaufman, 2000). According to the present invention, strong promoters that give high levels of transcription in the eukaryotic cells of choice are preferred. Suitable promoters are well known and available to the person skilled in the art, and several are described in WO 2006/048459 (eg, pages 28-29), including the CMV immediate early promoter (IE) (designated in this report as the CMV promoter) (obtainable, for example, from pcDNA, Invitrogen), and many others.

En ciertas realizaciones, una molécula de ADN según la invención es parte de un vector, por ejemplo, un plásmido. Dichos vectores pueden manipularse fácilmente mediante procedimientos bien conocidos por el especialista en la materia, y pueden diseñarse, por ejemplo, para ser capaces de replicación en células procarióticas y/o eucarióticas. Además, pueden usarse muchos vectores directamente o en forma de un fragmento deseado aislado a partir del mismo para la transformación de células eucarióticas, y se integrará en todo o en parte en el genoma de dichas células, dando como resultado células hospedadoras estables que comprenden el ácido nucleico deseado en su genoma. In certain embodiments, a DNA molecule according to the invention is part of a vector, for example, a plasmid. Such vectors can be easily manipulated by methods well known to the person skilled in the art, and can be designed, for example, to be capable of replication in prokaryotic and / or eukaryotic cells. In addition, many vectors can be used directly or in the form of a desired fragment isolated therefrom for the transformation of eukaryotic cells, and will be integrated in whole or in part into the genome of said cells, resulting in stable host cells comprising the Desired nucleic acid in its genome.

Los sistemas de expresión convencionales son moléculas de ADN en forma de un plásmido recombinante o un genoma vírico recombinante. El plásmido o genoma vírico se introduce en células (hospedadoras eucarióticas) y preferiblemente se integra en sus genomas mediante procedimientos conocidos en la materia, y se han descrito varios aspectos del mismo en el documento WO 2006/048459 (pág. 30-31). Conventional expression systems are DNA molecules in the form of a recombinant plasmid or a recombinant viral genome. The plasmid or viral genome is introduced into cells (eukaryotic hosts) and preferably integrated into its genomes by methods known in the art, and various aspects thereof have been described in WO 2006/048459 (p. 30-31).

Es ampliamente apreciado que la estructura de cromatina y otros mecanismos de control epigenético pueden influir en la expresión de transgenes en células eucarióticas (por ejemplo, Whitelaw y col., 2001). Las unidades de expresión muticistrónicas según la invención forman parte de un sistema de selección con un régimen de selección bastante riguroso. Este requiere generalmente altos niveles de transcripción en las células hospedadoras de elección. Para aumentar la oportunidad de encontrar clones de células hospedadoras que sobrevivan al régimen de selección riguroso, y posiblemente aumentar la estabilidad de la expresión en los clones obtenidos, será preferiblemente generalmente aumentar la predecibilidad de la transcripción. Por lo tanto, en realizaciones preferidas, un módulo de expresión según la invención comprende adicionalmente al menos un elemento de control de cromatina. Un “elemento de control de cromatina” como se usa en la presente memoria es un término colectivo para secuencias de ADN que pueden tener de algún modo un efecto sobre la estructura de cromatina y con ello sobre el nivel de expresión y/o estabilidad de la expresión de los transgenes de su vecindad (funcionan “en cis” y por tanto se disponen preferiblemente a 5 kb, más a 2 kb, aún más preferiblemente a 1 kb del transgén) en células eucarióticas. Dichos elementos se han usado a veces para aumentar el número de clones que tienen los niveles deseados de expresión transgénica. Se han descrito varios tipos de dichos elementos que pueden usarse según la presente invención en el documento WO 2006/048459 (por ejemplo, página 32-34) y, con el fin de la presente invención, se eligen elementos de control de cromatina del grupo constituido por regiones de unión a matriz o armazón (MAR/SAR), aislantes tales como el elemento aislante de beta-globina (5’ HS4 del locus de beta-globina de pollo), scs, scs’ y similares, un elemento de apertura de cromatina ubicuo (UCOE) y secuencias antirrepresoras (también designadas como secuencias “STAR”). It is widely appreciated that chromatin structure and other epigenetic control mechanisms can influence the expression of transgenes in eukaryotic cells (eg, Whitelaw et al., 2001). The muticistronic expression units according to the invention are part of a selection system with a fairly rigorous selection regime. This generally requires high levels of transcription in the host cells of choice. To increase the opportunity to find clones of host cells that survive the rigorous selection regime, and possibly increase the stability of expression in the obtained clones, it will preferably be generally to increase the predictability of transcription. Therefore, in preferred embodiments, an expression module according to the invention additionally comprises at least one chromatin control element. A "chromatin control element" as used herein is a collective term for DNA sequences that may somehow have an effect on the chromatin structure and thereby on the level of expression and / or stability of the expression of the neighborhood transgenes (they function "in cis" and are therefore preferably arranged at 5 kb, more at 2 kb, even more preferably at 1 kb of the transgene) in eukaryotic cells. Such elements have sometimes been used to increase the number of clones that have the desired levels of transgenic expression. Various types of said elements have been described which can be used according to the present invention in WO 2006/048459 (for example, page 32-34) and, for the purpose of the present invention, chromatin control elements are chosen from the group consisting of matrix or framework-binding regions (MAR / SAR), insulators such as the beta-globin insulating element (5 'HS4 of the chicken beta-globin locus), scs, scs' and the like, an opening element of ubiquitous chromatin (UCOE) and antirepressant sequences (also referred to as "STAR" sequences).

Preferiblemente, dicho elemento de control de cromatina es una secuencia antirrepresora, preferiblemente elegida del grupo constituido por: a) una cualquiera de SEQ. ID. NO. 1 a SEQ. ID. NO. 66; b) fragmentos de una cualquiera de SEQ. ID. NO. 1 a SEQ. ID. NO. 66, en los que dichos fragmentos tienen actividad antirrepresora (‘”fragmentos funcionales”); c) secuencias que son al menos un 70% idénticas en la secuencia nucleotídica a a) o a b), en los que dichas secuencias tienen actividad antirrepresora (“derivados funcionales”); y d) el complemento de una cualquiera de a) a c). Preferiblemente, dicho elemento de control de cromatina se elige del grupo constituido por STAR67 (SEQ. ID. NO. 66), STAR7 (SEQ. ID. NO. 7), STAR9 (SEQ. ID. NO. 9), STAR17 (SEQ. ID. NO. 17), STAR27 (SEQ. ID. NO. 27), STAR29 (SEQ. ID. NO. 29), STAR43 (SEQ. ID. NO. 43), STAR44 (SEQ. ID. NO. 44), STAR45 (SEQ. ID. NO. 45), STAR47 (SEQ. ID. NO. 47), STAR61 (SEQ. ID. NO. 61) o un fragmento o derivado funcional de dichas secuencias STAR. En una realización preferida, dicha secuencia STAR es STAR67 (SEQ. ID. NO. 66) o un fragmento o derivado funcional de la misma. En ciertas realizaciones preferidas, STAR67 o un fragmento o derivado funcional de la misma se dispone en dirección 5’ de un promotor que dirige la expresión de la unidad de transcripción multicistrónica. En otras realizaciones preferidas, los módulos de expresión según la invención están flanqueados por ambos lados por al menos una secuencia antirrepresora, por ejemplo, por una de SEQ. ID. NO. 1 a SEQ. ID. NO. 65 en ambos lados, preferiblemente cada una con el extremo 3’ de estas secuencias enfrentado a la unidad de transcripción. En ciertas realizaciones, se proporcionan módulos de expresión según la invención que comprenden en orden 5’ a 3’: secuencia antirrepresora A – secuencia antirrepresora B - [promotor – unidad de transcripción multicistrónica según la invención (que codifica el polipéptido de interés y en dirección 3’ del mismo la proteína marcadora seleccionable funcional) – secuencia de terminación de la transcripción] – secuencia antirrepresora C, en los que A, B y C pueden ser iguales o diferentes. Preferably, said chromatin control element is an antirepressant sequence, preferably chosen from the group consisting of: a) any one of SEQ. ID. NO. 1 to SEQ. ID. NO. 66; b) fragments of any one of SEQ. ID. NO. 1 to SEQ. ID. NO. 66, in which said fragments have antirepressant activity (‘" functional fragments "); c) sequences that are at least 70% identical in the nucleotide sequence a a) or a b), in which said sequences have antirepressant activity ("functional derivatives"); and d) the complement of any one of a) to c). Preferably, said chromatin control element is selected from the group consisting of STAR67 (SEQ. ID. NO. 66), STAR7 (SEQ. ID. NO. 7), STAR9 (SEQ. ID. NO. 9), STAR17 (SEQ ID NO. 17), STAR27 (SEQ. ID. NO. 27), STAR29 (SEQ. ID. NO. 29), STAR43 (SEQ. ID. NO. 43), STAR44 (SEQ. ID. NO. 44) ), STAR45 (SEQ. ID. NO. 45), STAR47 (SEQ. ID. NO. 47), STAR61 (SEQ. ID. NO. 61) or a functional fragment or derivative of said STAR sequences. In a preferred embodiment, said STAR sequence is STAR67 (SEQ. ID. NO. 66) or a functional fragment or derivative thereof. In certain preferred embodiments, STAR67 or a functional fragment or derivative thereof is provided in the 5 ’direction of a promoter that directs the expression of the multicistronic transcription unit. In other preferred embodiments, the expression modules according to the invention are flanked on both sides by at least one antirepressant sequence, for example, by one of SEQ. ID. NO. 1 to SEQ. ID. NO. 65 on both sides, preferably each with the 3 ′ end of these sequences facing the transcription unit. In certain embodiments, expression modules according to the invention are provided comprising in order 5 'to 3': antirepressant sequence A - antirepressant sequence B - [promoter - multicistronic transcription unit according to the invention (which encodes the polypeptide of interest and in the direction 3 'thereof the functional selectable marker protein) - transcription termination sequence] - anti-repressor sequence C, in which A, B and C may be the same or different.

Se han descrito secuencias que tienen actividad antirrepresora (secuencias antirrepresoras) y las características de las mismas, así como fragmentos o derivados funcionales de las mismas, y las definiciones estructurales y funcionales de las mismas, y procedimientos para obtenerlas y usarlas, siendo dichas secuencias útiles para la presente invención, en el documento WO 2006/048459 (por ejemplo, páginas 34-38). Sequences that have antirepressant activity (antirepressant sequences) and the characteristics thereof, as well as functional fragments or derivatives thereof, and the structural and functional definitions thereof, and methods for obtaining and using them have been described, said sequences being useful. for the present invention, in WO 2006/048459 (for example, pages 34-38).

Para la producción de proteínas multiméricas, pueden usarse dos o más módulos de expresión. Preferiblemente, ambos módulos de expresión son módulos de expresión multicistrónicos según la invención, codificando cada uno una proteína marcadora seleccionable diferente, de modo que sea posible la selección de ambos módulos de expresión. Esta realización ha probado dar buenos resultados, por ejemplo, para la expresión de la cadena pesada y ligera de anticuerpos. Resultará evidente que ambos módulos de expresión pueden disponerse en una molécula de ácido nucleico o ambos pueden estar presentes en una molécula de ácido nucleico separada antes de introducirse en las células hospedadoras. Una ventaja de disponerlas en una molécula de ácido nucleico es que los dos módulos de expresión están presentes a una relación predeterminada única (por ejemplo, 1:1) cuando se introducen en células hospedadoras. Por otro lado, cuando están presentes en dos moléculas de ácido nucleico diferentes, esto permite la posibilidad de variar la relación molar de los dos módulos de expresión cuando se introducen en células hospedadoras, lo que puede ser una ventaja si la relación molar preferida es diferente de 1:1 o cuando es desconocido previamente cuál es la relación molar preferida, de modo que pueda efectuarse fácilmente por un especialista en la materia la variación de la misma y encontrar empíricamente la óptima. Según la invención, preferiblemente al menos uno de los módulos de expresión, pero más preferiblemente cada uno de ellos, comprende un elemento de control de cromatina, más preferiblemente una secuencia antirrepresora. For the production of multimeric proteins, two or more expression modules can be used. Preferably, both expression modules are multicistronic expression modules according to the invention, each encoding a different selectable marker protein, so that the selection of both expression modules is possible. This embodiment has proven to give good results, for example, for the expression of the heavy and light chain of antibodies. It will be apparent that both expression modules can be arranged in a nucleic acid molecule or both can be present in a separate nucleic acid molecule before being introduced into the host cells. An advantage of arranging them in a nucleic acid molecule is that the two expression modules are present at a unique predetermined ratio (eg, 1: 1) when introduced into host cells. On the other hand, when they are present in two different nucleic acid molecules, this allows the possibility of varying the molar ratio of the two expression modules when introduced into host cells, which can be an advantage if the preferred molar ratio is different of 1: 1 or when it is previously unknown what the preferred molar ratio is, so that the variation of the same can be easily carried out by a person skilled in the art and empirically finding the optimum. According to the invention, preferably at least one of the expression modules, but more preferably each of them, comprises a chromatin control element, more preferably an antirepressant sequence.

En otra realización, las diferentes subunidades o partes de una proteína multimérica están presentes en un solo módulo de expresión. In another embodiment, the different subunits or parts of a multimeric protein are present in a single expression module.

Se han descrito configuraciones útiles de antirrepresores combinados con módulos de expresión en el documento WO 2006/048459 (por ejemplo, página 40). Useful configurations of antirepressants combined with expression modules have been described in WO 2006/048459 (eg, page 40).

En ciertas realizaciones, se proporcionan unidades de transcripción o módulos de expresión según la invención que comprenden adicionalmente una secuencia de pausa de la transcripción (TRAP), esencialmente como se describe en las páginas 40-41 del documento WO 2006/048459. Se da un ejemplo no limitante de secuencia TRAP en la SEQ. ID. NO. 81. Se han descrito ejemplos de otras secuencias TRAP, procedimientos para encontrar estas y usos de las mismas en el documento WO 2004/055215. In certain embodiments, transcription units or expression modules according to the invention are provided which further comprise a transcription pause sequence (TRAP), essentially as described on pages 40-41 of WO 2006/048459. A non-limiting example of TRAP sequence is given in SEQ. ID. NO. 81. Examples of other TRAP sequences, procedures for finding these and uses thereof have been described in WO 2004/055215.

Las moléculas de ADN que comprenden unidades de transcripción muticistrónicas y/o módulos de expresión según la presente invención pueden usarse para mejorar la expresión de ácidos nucleicos, preferiblemente en células hospedadoras. Los términos “célula”/”célula hospedadora” y “línea celular”/”línea celular hospedadora” típicamente se definen respectivamente como una célula y poblaciones homogéneas de la misma que pueden mantenerse en cultivo celular mediante procedimientos conocidos en la técnica, y que tienen la capacidad de expresar proteínas heterólogas u homólogas. DNA molecules comprising muticistronic transcription units and / or expression modules according to the present invention can be used to improve the expression of nucleic acids, preferably in host cells. The terms "cell" / "host cell" and "cell line" / "host cell line" are typically defined respectively as a cell and homogeneous populations thereof that can be maintained in cell culture by methods known in the art, and which have the ability to express heterologous or homologous proteins.

Se han descrito varias células hospedadoras ejemplares que pueden usarse en el documento WO 2006/048459 (por ejemplo, páginas 41-42), y dichas células incluyen por ejemplo células de mamífero incluyendo, pero sin limitación, células CHO, por ejemplo, CHO-K1, CHO-S, CHO-DG44, CHO-DUKXB11, incluyendo células CHO que tienen un fenotipo dhfr-, así como células de mieloma (por ejemplo, Sp2/0, NS0), células HEK 293 y células PER.C6. Several exemplary host cells have been described which can be used in WO 2006/048459 (for example, pages 41-42), and said cells include for example mammalian cells including, but not limited to, CHO cells, for example, CHO- K1, CHO-S, CHO-DG44, CHO-DUKXB11, including CHO cells that have a dhfr- phenotype, as well as myeloma cells (e.g., Sp2 / 0, NS0), HEK 293 cells and PER.C6 cells.

Dichas células hospedadoras eucarióticas pueden expresar los polipéptidos deseados y a menudo se usan con ese fin. Pueden obtenerse mediante la introducción de una molécula de ADN de la invención, preferiblemente en forma de un módulo de expresión, en las células. Preferiblemente, el módulo de expresión se integra en el genoma de las células hospedadoras, pudiendo estar en diferentes posiciones en diversas células hospedadoras, y la selección proporcionará un clon en que el transgén se integra en una posición adecuada, conduciendo a un clon de célula hospedadora con las propiedades deseadas en términos de niveles de expresión, estabilidad, características de crecimiento y similares. Como alternativa, la unidad de transcripción multicistrónica puede orientarse a o seleccionarse aleatoriamente para integración en una región cromosómica que sea transcripcionalmente activa, por ejemplo, detrás de un promotor presente en el genoma. La selección de células que contienen el ADN de la invención puede efectuarse seleccionando el polipéptido marcador seleccionable, usando procedimientos rutinarios conocidos por el especialista en la materia. Cuando dicha unidad de transcripción multicistrónica se integra detrás de un promotor en el genoma, puede generarse in situ un módulo de expresión según la invención, concretamente, en el genoma de las células hospedadoras. Such eukaryotic host cells can express the desired polypeptides and are often used for that purpose. They can be obtained by introducing a DNA molecule of the invention, preferably in the form of an expression module, into the cells. Preferably, the expression module is integrated into the genome of the host cells, being able to be in different positions in various host cells, and the selection will provide a clone in which the transgene is integrated in a suitable position, leading to a host cell clone. with the desired properties in terms of expression levels, stability, growth characteristics and the like. As an alternative, the multicistronic transcription unit may be oriented to or randomly selected for integration into a chromosomal region that is transcriptionally active, for example, behind a promoter present in the genome. The selection of cells containing the DNA of the invention can be carried out by selecting the selectable marker polypeptide, using routine procedures known to the person skilled in the art. When said multicistronic transcription unit is integrated behind a promoter in the genome, an expression module according to the invention can be generated in situ, specifically, in the genome of the host cells.

Preferiblemente, las células hospedadoras son de un clon estable que puede seleccionarse y propagarse según procedimientos estándares conocidos por el especialista en la materia. El cultivo de dicho clon puede producir el polipéptido de interés si las células comprenden la unidad de transcripción multicistrónica de la invención. Preferably, the host cells are of a stable clone that can be selected and propagated according to standard procedures known to the person skilled in the art. The cultivation of said clone can produce the polypeptide of interest if the cells comprise the multicistronic transcription unit of the invention.

La introducción de ácido nucleico que se va a expresar en una célula puede hacerse mediante uno de varios procedimientos, que son conocidos como tales por el especialista en la materia, dependiendo también del formato del ácido nucleico a introducir. Dichos procedimientos incluyen, pero sin limitación, transfección, infección, inyección, transformación y similares. Las células hospedadoras adecuadas que expresan el polipéptido de interés pueden obtenerse mediante selección. The introduction of nucleic acid to be expressed in a cell can be done by one of several procedures, which are known as such by the person skilled in the art, also depending on the format of the nucleic acid to be introduced. Such procedures include, but are not limited to, transfection, infection, injection, transformation and the like. Suitable host cells expressing the polypeptide of interest can be obtained by selection.

En realizaciones preferidas, la molécula de ADN que comprende la unidad de transcripción multicistrónica de la invención, preferiblemente en forma de un módulo de expresión, se integra en el genoma de la célula hospedadora eucariótica según la invención. Esto proporcionará una herencia estable de la unidad de transcripción multicistrónica. In preferred embodiments, the DNA molecule comprising the multicistronic transcription unit of the invention, preferably in the form of an expression module, is integrated into the genome of the eukaryotic host cell according to the invention. This will provide a stable inheritance of the multicistronic transcription unit.

La selección de la presencia del polipéptido marcador seleccionable, y por tanto de la expresión, puede efectuarse durante la obtención inicial de las células. En ciertas realizaciones, el agente de selección está presente en el medio de cultivo al menos parte del tiempo durante el cultivo a concentraciones suficientes para seleccionar las células que expresan el polipéptido marcador seleccionable o a concentraciones menores. En realizaciones preferidas, el agente de selección ya no está presente en el medio de cultivo durante la fase de producción cuando se expresa el polipéptido. The selection of the presence of the selectable marker polypeptide, and therefore of the expression, can be carried out during the initial obtaining of the cells. In certain embodiments, the selection agent is present in the culture medium at least part of the time during culture at concentrations sufficient to select cells that express the selectable marker polypeptide or at lower concentrations. In preferred embodiments, the selection agent is no longer present in the culture medium during the production phase when the polypeptide is expressed.

Un polipéptido de interés según la invención puede ser cualquier proteína, y puede ser una proteína monomérica o una (parte de una) proteína multimérica. Una proteína multimérica comprende al menos dos cadenas polipeptídicas. Los ejemplos no limitantes de proteína de interés según la invención son enzimas, hormonas, cadenas de inmunoglobulina, proteínas terapéuticas como proteínas anticancerosas, proteínas de coagulación sanguínea tales como factor VIII, proteínas multifuncionales tales como eritropoyetina, proteínas de diagnóstico o proteínas o fragmentos de las mismas útiles con fines de vacunación, todas conocidas por el especialista en la materia. A polypeptide of interest according to the invention can be any protein, and it can be a monomeric protein or a (part of a) multimeric protein. A multimeric protein comprises at least two polypeptide chains. Non-limiting examples of protein of interest according to the invention are enzymes, hormones, immunoglobulin chains, therapeutic proteins such as anticancer proteins, blood coagulation proteins such as factor VIII, multifunctional proteins such as erythropoietin, diagnostic proteins or protein fragments or fragments. same useful for vaccination purposes, all known to the specialist in the field.

En ciertas realizaciones, un módulo de expresión de la invención codifica una cadena pesada o ligera de inmunoglobulina o una parte de unión a antígeno, derivado y/o análogo de la misma. En una realización preferida, se proporciona una unidad de expresión de proteína según la invención en la que dicha proteína de interés es una cadena pesada de inmunoglobulina. En aún otra realización preferida, se proporciona una unidad de expresión de proteína según la invención en la que dicha proteína de interés es una cadena ligera de inmunoglobulina. Cuando estas dos unidades de expresión de proteína están presentes en la misma célula (hospedadora), se ensambla una proteína multimérica y, más específicamente, una inmunoglobulina. Por tanto, en ciertas realizaciones, la proteína de interés es una inmunoglobulina tal como un anticuerpo, que es una proteína multimérica. Preferiblemente, dicho anticuerpo es un anticuerpo humano o humanizado. En ciertas realizaciones del mismo, es un anticuerpo de IgG, IgA o IgM. En una inmunoglobulina, pueden estar codificadas las cadenas pesada y ligera en diferentes módulos de expresión o en un solo módulo de expresión. Preferiblemente, la cadena pesada y ligera están presentes cada una en un módulo de expresión separado, que tiene cada uno su propio promotor (que puede ser el mismo o diferente para los dos módulos de expresión), comprendiendo cada uno una unidad de transcripción multicistrónica según la invención, siendo la cadena pesada y ligera el polipéptido de interés, y codificando preferiblemente cada uno una proteína marcadora seleccionable diferente, de modo que puede efectuarse la selección de módulo de expresión de ambas cadenas pesada y ligera cuando los módulos de expresión se introducen y/o están presentes en una célula hospedadora eucariótica. In certain embodiments, an expression module of the invention encodes a heavy or light chain of immunoglobulin or an antigen binding part, derivative and / or analog thereof. In a preferred embodiment, a protein expression unit according to the invention is provided in which said protein of interest is an immunoglobulin heavy chain. In yet another preferred embodiment, a protein expression unit according to the invention is provided in which said protein of interest is an immunoglobulin light chain. When these two protein expression units are present in the same cell (host), a multimeric protein and, more specifically, an immunoglobulin are assembled. Therefore, in certain embodiments, the protein of interest is an immunoglobulin such as an antibody, which is a multimeric protein. Preferably, said antibody is a human or humanized antibody. In certain embodiments thereof, it is an IgG, IgA or IgM antibody. In an immunoglobulin, heavy and light chains may be encoded in different expression modules or in a single expression module. Preferably, the heavy and light chain are each present in a separate expression module, each having its own promoter (which may be the same or different for the two expression modules), each comprising a multicistronic transcription unit according to the invention, the heavy and light chain being the polypeptide of interest, and preferably each encoding a different selectable marker protein, so that the expression module selection of both heavy and light chains can be made when the expression modules are introduced and / or are present in a eukaryotic host cell.

El polipéptido de interés puede ser de cualquier fuente, y en ciertas realizaciones es una proteína de mamífero, una proteína artificial (por ejemplo, una proteína de fusión o proteína mutada) y preferiblemente es una proteína humana. The polypeptide of interest may be from any source, and in certain embodiments it is a mammalian protein, an artificial protein (for example, a fusion protein or mutated protein) and is preferably a human protein.

Obviamente, las configuraciones de los módulos de expresión de la presente invención pueden usarse también cuando el objetivo último no se la producción de un polipéptido de interés, sino el ARN mismo, por ejemplo, para la producción de cantidades aumentadas de ARN a partir de un módulo de expresión, que puede usarse con fines de regular otros genes (por ejemplo, ARNi, ARN anticodificante), terapia génica, producción de proteína in vivo, etc. Obviously, the configurations of the expression modules of the present invention can also be used when the ultimate objective is not the production of a polypeptide of interest, but the RNA itself, for example, for the production of increased amounts of RNA from a Expression module, which can be used for the purpose of regulating other genes (eg, RNAi, antisense RNA), gene therapy, in vivo protein production, etc.

En un aspecto, la invención proporciona un procedimiento para generar una célula hospedadora que expresa un polipéptido de interés, comprendiendo el procedimiento introducir en una pluralidad de células precursoras una molécula de ADN o un módulo de expresión según la invención, cultivar las células generadas en condiciones de selección y seleccionar al menos una célula hospedadora productora del polipéptido de interés. Las ventajas de este procedimiento novedoso son similares a las descritas para el procedimiento alternativo dado a conocer en el documento WO 2006/048459 (por ejemplo, páginas 46-47). In one aspect, the invention provides a method for generating a host cell that expresses a polypeptide of interest, the method comprising introducing into a plurality of precursor cells a DNA molecule or an expression module according to the invention, culturing the cells generated under conditions of selection and selecting at least one host cell producing the polypeptide of interest. The advantages of this novel process are similar to those described for the alternative method disclosed in WO 2006/048459 (eg, pages 46-47).

Aunque puede obtenerse clones que tienen números relativamente bajos de las unidades de transcripción multicistrónicas y altos niveles de expresión, el sistema de selección de la invención puede combinarse no obstante con procedimientos de amplificación para mejorar aún más los niveles de expresión. Esto puede lograrse, por ejemplo, mediante la amplificación de un gen dhfr cointegrado usando metotrexato, por ejemplo, disponiendo a dhfr en la misma molécula de ácido nucleico que la unidad de transcripción multicistrónica de la invención, o mediante cotransfección cuando el dhfr está en una molécula de ADN separada. El gen dhfr puede ser también parte de una unidad de expresión multicistrónica de la invención. Although clones having relatively low numbers of multicistronic transcription units and high levels of expression can be obtained, the selection system of the invention can be combined, however, with amplification procedures to further improve expression levels. This can be achieved, for example, by amplifying a co-integrated dhfr gene using methotrexate, for example, by providing dhfr in the same nucleic acid molecule as the multicistronic transcription unit of the invention, or by co-transfection when the dhfr is in a separate DNA molecule. The dhfr gene may also be part of a multicistronic expression unit of the invention.

La invención proporciona también procedimientos para producir uno o más polipéptidos de interés, comprendiendo el procedimiento cultivar células hospedadoras de la invención. The invention also provides methods for producing one or more polypeptides of interest, the method comprising culturing host cells of the invention.

El cultivo de una célula se realiza para posibilitar que metabolice y/o crezca y/o se divida y/o produzca proteínas recombinantes de interés. Esto puede lograrse mediante procedimientos bien conocidos por los especialistas en la materia e incluye, pero sin limitación, proporcionar nutrientes a la célula. Los procedimientos comprenden crecimiento adherente de superficies, crecimiento en suspensión o combinaciones de los mismos. El cultivo puede realizarse por ejemplo en platos, matraces giratorios o en biorreactores, usando sistemas discontinuos, semicontinuos, continuos tales como sistemas de perfusión y similares. Para conseguir la producción a gran escala (continua) de proteínas recombinante mediante el cultivo celular, se prefiere en la técnica tener células capaces de crecer en suspensión, y se prefiere tener células aptas para cultivarse en ausencia del suero derivado del animal o ser humano o de componentes séricos derivados del animal o ser humano. The culture of a cell is carried out to enable it to metabolize and / or grow and / or divide and / or produce recombinant proteins of interest. This can be achieved by procedures well known to those skilled in the art and includes, but is not limited to, providing nutrients to the cell. The methods comprise adherent surface growth, suspension growth or combinations thereof. The culture can be carried out, for example, in plates, rotating flasks or in bioreactors, using discontinuous, semi-continuous, continuous systems such as perfusion systems and the like. In order to achieve large-scale (continuous) production of recombinant proteins by cell culture, it is preferred in the art to have cells capable of growing in suspension, and it is preferred to have cells suitable for culturing in the absence of serum derived from the animal or human being or of serum components derived from the animal or human being.

Las condiciones de crecimiento o multiplicación de las células (véase, por ejemplo, “Tissue Culture”, Academic Press, Kruse and Paterson, editores (1973)) y las condiciones de expresión del producto recombinante son conocidas para el especialista en la materia. En general, pueden encontrarse los principios, protocolos y técnicas prácticas para maximizar la productividad de cultivos de células de mamífero en “Mammalian Cell Biotechnology: a Practical Approach” (M. Butler, ed., IRL Press, 1991). The growth or multiplication conditions of the cells (see, for example, "Tissue Culture", Academic Press, Kruse and Paterson, editors (1973)) and the expression conditions of the recombinant product are known to the person skilled in the art. In general, the principles, protocols and practical techniques for maximizing the productivity of mammalian cell cultures can be found in "Mammalian Cell Biotechnology: a Practical Approach" (M. Butler, ed., IRL Press, 1991).

En una realización preferida, se recoge (aísla) la proteína expresada a partir de células o del medio de cultivo o de ambos. Puede purificarse adicionalmente entonces usando procedimientos conocidos, por ejemplo, filtración, cromatografía en columna, etc., mediante procedimientos generalmente conocidos por el especialista en la materia. In a preferred embodiment, the expressed protein is collected (isolated) from cells or the culture medium or both. It can then be further purified using known procedures, for example, filtration, column chromatography, etc., by procedures generally known to the person skilled in the art.

El procedimiento de selección según la presente invención funciona en ausencia de elementos de control de cromatina, pero se obtienen resultados mejorados cuando se proporcionan dichos elementos a las unidades de expresión multicistrónicas. El procedimiento de selección según la presente invención funciona particularmente bien cuando se usa un módulo de expresión según la invención que comprende al menos una secuencia antirrepresora. Dependiendo del agente y de las condiciones de selección, la selección puede hacerse en ciertos casos tan rigurosa que solo unas pocas o incluso ninguna célula hospedadora sobrevive a la selección, a menos que estén presentes secuencias antirrepresoras. Por tanto, la combinación del procedimiento de selección novedoso y las secuencias antirrepresoras proporciona un procedimiento muy atractivo para obtener solo números limitados de colonias con una oportunidad mejorada en gran medida de alta expresión del polipéptido de interés en las mismas mientras que, al mismo tiempo, los clones obtenidos que comprenden los módulos de expresión con secuencias antirrepresoras proporcionan la expresión estable del polipéptido de interés, concretamente, tienden menos al silenciamiento u otros mecanismos de reducción de la expresión que los módulos de expresión convencionales. The selection process according to the present invention works in the absence of chromatin control elements, but improved results are obtained when such elements are provided to the multicistronic expression units. The selection process according to the present invention works particularly well when an expression module according to the invention is used which comprises at least one antirepressant sequence. Depending on the agent and the selection conditions, the selection can be made in certain cases so rigorous that only a few or even no host cells survive the selection, unless antirepressant sequences are present. Therefore, the combination of the novel selection procedure and the antirepressant sequences provides a very attractive procedure for obtaining only limited numbers of colonies with a greatly enhanced opportunity for high expression of the polypeptide of interest therein while, at the same time, the clones obtained comprising the expression modules with antirepressant sequences provide stable expression of the polypeptide of interest, specifically, tend less to silencing or other expression reduction mechanisms than conventional expression modules.

En un aspecto, la invención proporciona una unidad de transcripción multicistrónica que tiene una configuración alternativa en comparación con la configuración dada a conocer en el documento WO 2006/048459: en la configuración alternativa de la presente invención, la secuencia que codifica el polipéptido de interés está en dirección 5’ de la secuencia que codifica el polipéptido marcador seleccionable, y el polipéptido marcador seleccionable está ligado operativamente con una secuencia de iniciación de la traducción independiente de caperuza, preferiblemente un sitio de entrada interna del ribosoma (IRES). Dichas unidades de transcripción multicistrónica eran conocidas como tales (por ejemplo, Rees y col., 1996, WO 03/106684), pero no se habían combinado con un codón de inicio no ATG. Según la alternativa de la presente invención, el codón de inicio del polipéptido marcador seleccionable se cambia por un codón de inicio no ATG para reducir adicionalmente la tasa de iniciación de la traducción del marcador seleccionable. Esto conduce por lo tanto a un nivel de expresión reducido deseado del polipéptido marcador seleccionable, y puede dar como resultado células hospedadoras de selección altamente eficaces que expresan altos niveles del polipéptido de interés, como con las realizaciones dadas a conocer en el documento WO 2006/048459. Es una ventaja potencial de este aspecto alternativo de la presente invención, en comparación con las realizaciones expuestas en el documento WO 2006/048459, que la secuencia de codificación del polipéptido marcador seleccionable no necesita la modificación adicional de secuencias ATG internas, porque cualquier secuencia ATG interna en el mismo puede permanecer intacta puesto que no son ya relevantes para la traducción de polipéptidos en dirección 3’ adicionales. Esto puede ser especialmente ventajoso si la secuencia de codificación del polipéptido marcador seleccionable contiene varias secuencias ATG internas, porque la tarea de cambiar estas y ensayar la funcionalidad de la construcción resultante no tiene que efectuarse para la presente invención: basta solo con la mutación del codón de inicio ATG en este caso. Se muestra a continuación en la presente memoria (ejemplo 1) que esta alternativa proporcionada por la presente invención conduce también a muy buenos resultados. In one aspect, the invention provides a multicistronic transcription unit that has an alternative configuration compared to the configuration disclosed in WO 2006/048459: in the alternative configuration of the present invention, the sequence encoding the polypeptide of interest it is in the 5 'direction of the sequence encoding the selectable marker polypeptide, and the selectable marker polypeptide is operably linked with a translation-independent cap initiation sequence, preferably an internal ribosome entry site (IRES). Such multicistronic transcription units were known as such (e.g., Rees et al., 1996, WO 03/106684), but had not been combined with a non-ATG start codon. According to the alternative of the present invention, the start codon of the selectable marker polypeptide is changed to a non-ATG start codon to further reduce the translation initiation rate of the selectable marker. This therefore leads to a desired reduced expression level of the selectable marker polypeptide, and can result in highly effective selection host cells that express high levels of the polypeptide of interest, as with the embodiments disclosed in WO 2006 / 048459. It is a potential advantage of this alternative aspect of the present invention, as compared to the embodiments set forth in WO 2006/048459, that the coding sequence of the selectable marker polypeptide does not require the additional modification of internal ATG sequences, because any ATG sequence internally therein can remain intact since they are no longer relevant for the translation of additional 3 'direction polypeptides. This can be especially advantageous if the coding sequence of the selectable marker polypeptide contains several internal ATG sequences, because the task of changing these and testing the functionality of the resulting construct does not have to be carried out for the present invention: only the codon mutation is sufficient ATG start in this case. It is shown hereinafter (example 1) that this alternative provided by the present invention also leads to very good results.

La secuencia de codificación del polipéptido marcador seleccionable en las moléculas de ADN de la presente invención está bajo el control traduccional del IRES, mientras que la secuencia de codificación de la proteína de interés está preferiblemente traducida de manera dependiente de caperuza. La secuencia de codificación del polipéptido de interés comprende un codón de terminación, de modo que la traducción del primer cistrón termine en dirección 5’ del IRES, estando dicho IRES ligado operativamente con el segundo cistrón. The coding sequence of the selectable marker polypeptide in the DNA molecules of the present invention is under the translational control of the IRES, while the coding sequence of the protein of interest is preferably translated in a hood-dependent manner. The coding sequence of the polypeptide of interest comprises a termination codon, so that the translation of the first cistron ends in the 5 ′ direction of the IRES, said IRES being operatively linked with the second cistron.

Como resultará fácilmente evidente para el especialista en la materia después de la lectura de la presente divulgación, la mayoría de las partes de estas unidades de expresión multicistrónica pueden variarse ventajosamente de forma similar a las unidades de expresión multicistrónica que tienen el orden opuesto a las secuencias de codificación del polipéptido de interés y el polipéptido marcador seleccionable (concretamente, las unidades de transcripción multicistrónicas del documento WO 2006/048459). Por ejemplo, pueden variarse los codones de inicio preferidos del polipéptido marcador seleccionable, la incorporación a módulos de expresión, las células hospedadoras, los promotores, la presencia de elementos de control de cromatina, etc., y usarse en realizaciones preferidas como se describe anteriormente. También el uso de estas unidades de expresión multicistrónica y módulos de expresión es como se describe anteriormente. Por lo tanto, este aspecto es verdaderamente una alternativa a los medios y procedimientos descritos en el documento WO 2006/048459, siendo la principal diferencia que el orden de los polipéptidos en las unidades de expresión multicistrónica está invertido, y que es ahora necesario un IRES para la traducción del polipéptido marcador seleccionable. As will be readily apparent to the person skilled in the art after reading the present disclosure, most parts of these multicistronic expression units can be advantageously varied similarly to multicistronic expression units that have the opposite order of the sequences. for coding the polypeptide of interest and the selectable marker polypeptide (specifically, the multicistronic transcription units of WO 2006/048459). For example, preferred start codons of the selectable marker polypeptide, incorporation into expression modules, host cells, promoters, the presence of chromatin control elements, etc., can be varied and used in preferred embodiments as described above. . Also the use of these multicistronic expression units and expression modules is as described above. Therefore, this aspect is truly an alternative to the means and procedures described in WO 2006/048459, the main difference being that the order of the polypeptides in the multicistronic expression units is reversed, and that an IRES is now necessary for the translation of the selectable marker polypeptide.

Como se usa en la presente memoria, un “sitio de entrada interna del ribosoma” o “IRES” designa un elemento que promueve la entrada directa interna del ribosoma al codón de iniciación, tal como normalmente un ATG, pero en esta invención preferiblemente GTG o TTG, de un cistrón (una región que codifica proteína), conduciendo así a la traducción independiente de caperuza del gen. Véanse, por ejemplo, Jackson R J, Howell M T, Kaminski A (1990) Trends Biochem. Sci. 15 (12): 477-83) y Jackson R J y Kaminski, A. (1995) RNA 1 (10): 985-1000. La presente invención comprende el uso de cualquier secuencia de iniciación de la traducción independiente de caperuza, en particular, cualquier elemento IRES que sea capaz de promover la entrada directa interna del ribosoma al codón de iniciación de un cistrón. “Bajo el control traduccional de un IRES” como se usa en la presente memoria significa que la traducción está asociada al IRES y procede de manera independiente de caperuza. Como se usa en la presente memoria, el término “IRES” comprende variaciones funcionales de secuencias de IRES a condición de que la variación sea capaz de promover la entrada directa interna del ribosoma al codón de iniciación de un cistrón. Como se usa en la presente memoria, “cistrón” designa una secuencia polinucleotídica o gen de una proteína, polipéptido o péptido de interés. “Ligado operativamente” designa una situación en que los componentes descritos están en una relación que les permite funcionar de la manera pretendida. Por tanto, por ejemplo, un promotor “ligado operativamente” con un cistrón está ligado de tal manera que se consigue la expresión del cistrón en condiciones compatibles con el promotor. De forma similar, una secuencia nucleotídica de un IRES ligada operativamente con un cistrón está ligada de tal manera que se consigue la traducción del cistrón en condiciones compatibles con el IRES. As used herein, an "internal ribosome entry site" or "IRES" designates an element that promotes direct internal ribosome entry to the initiation codon, such as normally an ATG, but in this invention preferably GTG or TTG, from a cistron (a region that encodes protein), thus leading to the independent translation of the gene hood. See, for example, Jackson R J, Howell M T, Kaminski A (1990) Trends Biochem. Sci. 15 (12): 477-83) and Jackson R J and Kaminski, A. (1995) RNA 1 (10): 985-1000. The present invention comprises the use of any independent translation initiation sequence of the hood, in particular, any IRES element that is capable of promoting direct internal ribosome entry into the initiation codon of a cistron. "Under the translational control of an IRES" as used herein means that the translation is associated with the IRES and proceeds independently of the hood. As used herein, the term "IRES" comprises functional variations of IRES sequences provided that the variation is capable of promoting direct internal ribosome entry to the initiation codon of a cistron. As used herein, "cistron" designates a polynucleotide sequence or gene of a protein, polypeptide or peptide of interest. "Operationally linked" means a situation in which the components described are in a relationship that allows them to function as intended. Therefore, for example, a promoter "operably linked" with a cistron is bound in such a way that the expression of the cistron is achieved under conditions compatible with the promoter. Similarly, a nucleotide sequence of an IRES operatively linked to a cistron is linked in such a way that translation of the cistron is achieved under conditions compatible with the IRES.

Los elementos de sitio de unión interna del ribosoma (IRES) son conocidos de los genes víricos y de mamíferos (Martínez-Salas, 1999), y se han identificado también en cribados de oligonucleótidos sintéticos pequeños (Venkatesan y Dasgupta, 2001). El IRES del virus de la encefalomiocarditis se ha analizado con detalle (Mizuguchi y col., 2000). Un IRES es un elemento codificado en el ADN que da como resultado una estructura en el ARN transcrito a la que los ribosomas eucarióticos pueden unirse e iniciar la traducción. Un IRES permite producir dos o más proteínas a partir de una sola molécula de ARN (la primera proteína se traduce por ribosomas que se unen al ARN en la estructura de caperuza de su extremo 5’, (Martínez-Salas, 1999)). La traducción de proteínas a partir de elementos IRES es menos eficaz que la traducción dependiente de caperuza: la cantidad de proteína de marcos abiertos de lectura (ORF) dependientes de IRES está en el intervalo de menos de 20 a 50% de la cantidad del primer ORF (Mizuguchi y col., 2000). La eficacia reducida de la traducción dependiente de IRES proporciona una ventaja que es explotada por esta realización de la presente invención. Además, la mutación de elementos IRES puede atenuar su actividad y reducir la expresión a partir de los ORG dependientes de IRES a menos de un 10% del primer ORF (López de Quinto y Martínez-Salas, 1998, Rees y col., 1996). Resulta por lo tanto evidente para un especialista en la materia que pueden hacerse cambios al IRES sin alterar la esencia de la función del IRES (por tanto, proporcionando un sitio de iniciación de la traducción de proteína con una eficacia de traducción reducida), dando como resultado un IRES modificado. El uso de un IRES modificado que sigue siendo capaz de proporcionar un pequeño porcentaje de traducción (en comparación con una traducción de la caperuza 5’), se incluye por lo tanto también en esta invención. La presente invención usa codones de inicio no ATG para reducir adicionalmente de forma significativa la iniciación de la traducción del ORF del marcador seleccionable, mejorando adicionalmente con ello las oportunidades de obtener una célula hospedadora preferida, concretamente, una célula hospedadora que exprese altos niveles de la proteína recombinante de interés. Ribosome internal binding site elements (IRES) are known from viral and mammalian genes (Martínez-Salas, 1999), and have also been identified in small synthetic oligonucleotide screens (Venkatesan and Dasgupta, 2001). The IRES of the encephalomyocarditis virus has been analyzed in detail (Mizuguchi et al., 2000). An IRES is an element encoded in DNA that results in a structure in the transcribed RNA to which eukaryotic ribosomes can bind and initiate translation. An IRES allows two or more proteins to be produced from a single RNA molecule (the first protein is translated by ribosomes that bind to the RNA in the cap structure of its 5 ’end, (Martínez-Salas, 1999)). The translation of proteins from IRES elements is less effective than the hood-dependent translation: the amount of IRES-dependent open-frame reading protein (ORF) is in the range of less than 20 to 50% of the amount of the first ORF (Mizuguchi et al., 2000). The reduced efficiency of IRES-dependent translation provides an advantage that is exploited by this embodiment of the present invention. In addition, the mutation of IRES elements can attenuate their activity and reduce expression from IRES-dependent ORGs to less than 10% of the first ORF (López de Quinto and Martínez-Salas, 1998, Rees et al., 1996) . It is therefore evident to a specialist in the field that changes can be made to the IRES without altering the essence of the IRES function (therefore, providing a protein translation initiation site with reduced translation efficiency), giving as result a modified IRES. The use of a modified IRES that is still capable of providing a small percentage of translation (as compared to a 5 ’hood translation), is therefore also included in this invention. The present invention uses non-ATG start codons to further significantly reduce the translation initiation of the selectable marker ORF, thereby further enhancing the chances of obtaining a preferred host cell, namely, a host cell that expresses high levels of the recombinant protein of interest.

Las patentes de EE.UU. 5.648.267 y 5.733.779 describen el uso de una secuencia marcadora seleccionable dominante con una secuencia Kozak de consenso dañada ([Py]xxATG[Py], en la que [Py] es un nucleótido de pirimidina (concretamente, C o T), x es un nucleótido (concretamente, G, A, T o C) y el codón de inicio ATG está subrayado). La patente de EE.UU. 6.107.477 describe el uso de una secuencia Kozak no óptima (AGATCTTTATGGACC, en la que el codón de inicio ATG no está subrayado) de un gen marcador seleccionable. Ninguna de estas patentes describe el uso de un codón de inicio no ATG ni proporciona ninguna sugerencia de hacerlo. Además, no mencionan combinaciones con un IRES. Además, puesto que un IRES tiene por sí mismo una iniciación de la traducción reducida en comparación con la traducción dependiente de caperuza, no podía preverse antes de la presente invención que la combinación de un IRES con un codón de inicio no ATG del marcador seleccionable pudiera proporcionar suficiente traducción del polipéptido marcador seleccionable para dar algún nivel seleccionable del mismo. La presente invención muestra que ese es el caso y proporciona sistemas de selección sorprendentemente eficaces. U.S. patents 5,648,267 and 5,733,779 describe the use of a dominant selectable marker sequence with a damaged consensus Kozak sequence ([Py] xxATG [Py], in which [Py] is a pyrimidine nucleotide (specifically, C or T) , x is a nucleotide (specifically, G, A, T or C) and the ATG start codon is underlined). U.S. Pat. 6,107,477 describes the use of a non-optimal Kozak sequence (AGATCTTTATGGACC, in which the ATG start codon is not underlined) of a selectable marker gene. None of these patents describe the use of a non-ATG start codon or provide any suggestion to do so. In addition, they do not mention combinations with an IRES. In addition, since an IRES itself has a reduced translation initiation compared to the cap-dependent translation, it could not be anticipated before the present invention that the combination of an IRES with a non-ATG start codon of the selectable marker could provide sufficient translation of the selectable marker polypeptide to give some selectable level thereof. The present invention shows that this is the case and provides surprisingly effective selection systems.

La invención proporciona también una molécula de ADN que comprende una secuencia que codifica un polipéptido marcador seleccionable ligado operativamente con una secuencia IRES, en la que la secuencia de codificación que codifica el polipéptido marcador seleccionable comprende una secuencia de inicio de la traducción seleccionada del grupo constituido por: a) un codón de inicio GTG, b) un codón de inicio TTG, c) un codón de inicio CTG, d) un codón de inicio ATT y e) un codón de inicio ACG. The invention also provides a DNA molecule comprising a sequence encoding a selectable marker polypeptide operably linked with an IRES sequence, wherein the coding sequence encoding the selectable marker polypeptide comprises a translation initiation sequence selected from the group constituted. by: a) a GTG start codon, b) a TTG start codon, c) a CTG start codon, d) an ATT start codon and e) an ACG start codon.

El especialista en la materia entenderá que son posibles modificaciones adicionales de la presente invención, por ejemplo, las dadas en el documento US 2006/0195935, particularmente los ejemplos 20-27 del mismo. The person skilled in the art will understand that additional modifications of the present invention are possible, for example, those given in US 2006/0195935, particularly examples 20-27 thereof.

En ciertas realizaciones, puede usarse la enzima dihidrofolato reductasa (dhfr) sintetizadora de 5,6,7,8tetrahidrofolato de mamífero como marcador de selección en células que tienen un fenotipo dhfr- (por ejemplo, células CHO-DG44), omitiendo hipoxantina y timidina (y preferiblemente también glicina) del medio de cultivo e incluyendo folato (o ácido (dihidro)fólico) en el medio de cultivo (Simonsen y col., 1988). El gen dhfr puede derivar, por ejemplo, del genoma de ratón o del ADNc de ratón y puede usarse según la invención, preferiblemente proporcionando un codón de inicio GTG o TTG (véase la SEQ. ID. NO. 73 para la secuencia del gen dhfr). En todas estas realizaciones, se entiende por “omitir del medio de cultivo” que el medio de cultivo tiene que estar esencialmente desprovisto del componente o componentes indicados, lo que significa que hay insuficiente componente indicado presente para mantener el crecimiento de las células en el medio de cultivo, de modo que es posible una buena selección cuando la información genética de la enzima indicada se expresa en las células y el componente precursor indicado está presente en el medio de cultivo. Por ejemplo, el componente indicado está presente a una concentración de menos de un 0,1% de la concentración de aquel componente que se usa normalmente en el medio de cultivo para un cierto tipo celular. Preferiblemente, el componente indicado está ausente del medio de cultivo. Puede prepararse un medio de cultivo que carece del componente indicado según procedimientos estándares por el especialista en la materia, o puede obtenerse a partir de suministradores de medios comerciales. Una ventaja potencial del uso de estos tipos de enzimas metabólicas como polipéptidos marcadores seleccionables es que pueden usarse para mantener las unidades de transcripción multicistrónicas bajo selección continua, lo que puede dar como resultado una mayor expresión del polipéptido de interés. In certain embodiments, the enzyme dihydrofolate reductase (dhfr) synthesizer of mammalian 5,6,7,8 tetrahydrofolate may be used as a selection marker in cells that have a dhfr- phenotype (eg, CHO-DG44 cells), omitting hypoxanthine and thymidine (and preferably also glycine) of the culture medium and including folate (or folic acid (dihydro)) in the culture medium (Simonsen et al., 1988). The dhfr gene can be derived, for example, from the mouse genome or from the mouse cDNA and can be used according to the invention, preferably providing a GTG or TTG start codon (see SEQ. ID. NO. 73 for the sequence of the dhfr gene ). In all these embodiments, it is understood as "omitting the culture medium" that the culture medium has to be essentially devoid of the indicated component or components, which means that there is insufficient indicated component present to maintain the growth of the cells in the medium. of culture, so that a good selection is possible when the genetic information of the indicated enzyme is expressed in the cells and the indicated precursor component is present in the culture medium. For example, the indicated component is present at a concentration of less than 0.1% of the concentration of that component that is normally used in the culture medium for a certain cell type. Preferably, the indicated component is absent from the culture medium. A culture medium may be prepared that lacks the component indicated according to standard procedures by the person skilled in the art, or it may be obtained from commercial media suppliers. A potential advantage of using these types of metabolic enzymes as selectable marker polypeptides is that they can be used to keep multicistronic transcription units under continuous selection, which may result in increased expression of the polypeptide of interest.

En otro aspecto, la invención usa el marcador de selección metabólica dhfr como marcador de selección adicional en una unidad de transcripción multicistrónica según la invención. En dichas realizaciones, la selección de clones de células hospedadoras con alta expresión se establece en primer lugar mediante el uso de, por ejemplo, un marcador de selección antibiótico, por ejemplo, zeocina, neomicina, etc., cuyas secuencias de codificación tendrán un codón de inicio GTG o TTG según la invención. Después de la selección de los clones adecuados, se interrumpe la selección de antibiótico, y puede efectuarse entonces la selección continua o intermitente usando el marcador de selección enzimático cultivando las células en medio que carece de los componentes identificados apropiados descritos anteriormente y que contiene los componentes precursores apropiados descritos anteriormente. En este aspecto, el marcador de selección metabólica está ligado operativamente con un IRES, y puede tener su contenido normal de ATG, y el codón de inicio puede elegirse adecuadamente de GTG o TTG. Las unidades de transcripción multicistrónicas en este aspecto son al menos tricistrónicas. In another aspect, the invention uses the dhfr metabolic selection marker as an additional selection marker in a multicistronic transcription unit according to the invention. In said embodiments, the selection of host cell clones with high expression is first established by the use of, for example, an antibiotic selection marker, for example, zeocin, neomycin, etc., whose coding sequences will have a codon. GTG or TTG starter according to the invention. After the selection of suitable clones, antibiotic selection is interrupted, and then continuous or intermittent selection can be performed using the enzyme selection marker by culturing the cells in medium that lacks the appropriate identified components described above and containing the components. appropriate precursors described above. In this aspect, the metabolic selection marker is operatively linked with an IRES, and can have its normal ATG content, and the start codon can be suitably chosen from GTG or TTG. Multicistronic transcription units in this aspect are at least tricistronic.

La práctica de esta invención empleará, a menos que se indique otra cosa, técnicas convencionales de inmunología, biología molecular, microbiología, biología celular y ADN recombinante, que están dentro de las habilidades de la técnica. Véanse, por ejemplo, Sambrook, Fritsch y Maniatis, “Molecular Cloning: A Laboratory Manual”, 2ª edición, 1989; “Current Protocols in Molecular Biology”, Ausubel FM y col., ed., 1987; la serie “Methods in Enzymology” (Academic Press, Inc.); “PCR2: A Practical Approach”, MacPherson MJ, Hams BD, Taylor GR, ed., 1995; “Antibodies: A Laboratory Manual”, Harlow and Lane, ed., 1988. The practice of this invention will employ, unless otherwise indicated, conventional techniques of immunology, molecular biology, microbiology, cell biology and recombinant DNA, which are within the skill of the art. See, for example, Sambrook, Fritsch and Maniatis, "Molecular Cloning: A Laboratory Manual", 2nd edition, 1989; "Current Protocols in Molecular Biology", Ausubel FM et al., Ed., 1987; the series “Methods in Enzymology” (Academic Press, Inc.); "PCR2: A Practical Approach", MacPherson MJ, Hams BD, Taylor GR, ed., 1995; "Antibodies: A Laboratory Manual", Harlow and Lane, ed., 1988.

La invención se explica adicionalmente en los siguientes ejemplos. Los ejemplos no limitan la invención en modo alguno. Sirven simplemente para clarificar la invención. The invention is further explained in the following examples. The examples do not limit the invention in any way. They simply serve to clarify the invention.

Ejemplos Examples

El ejemplo 1 describe el sistema de selección con la unidad de transcripción multicistrónica de la presente invención, y resultará evidente que las variaciones descritas en los ejemplos 8-26 del documento WO 2006/048459 pueden aplicarse también y ensayarse para las unidades de transcripción multicistrónicas de la presente solicitud. Lo mismo es válido para las de los ejemplos 20-27 del documento US 2006/0195935. Example 1 describes the selection system with the multicistronic transcription unit of the present invention, and it will be apparent that the variations described in examples 8-26 of WO 2006/048459 can also be applied and tested for multicistronic transcription units of The present application. The same is true for those of examples 20-27 of US 2006/0195935.

Ejemplo 1: Selección rigurosa disponiendo un gen de resistencia a zeocina modificado detrás de una secuencia IRES Example 1: Rigorous selection by arranging a modified zeocin resistance gene behind an IRES sequence

Los ejemplos 8-26 del documento WO 2006/048459 han mostrado un sistema de selección en que una secuencia que codifica una proteína marcadora seleccionable está en dirección 5’ de una secuencia que codifica una proteína de interés en una unidad de transcripción multicistrónica, y en el que la secuencia de iniciación de la traducción del marcador seleccionable no es óptima, y en el que se han retirado los ATG internos adicionales de la secuencia de codificación del marcador seleccionable. Este sistema da como resultado un sistema de selección de alto rigor. Por ejemplo, se ha mostrado que el marcador de selección Zeo en el que se cambia el codón de iniciación de la traducción por TTG da un rigor de selección muy alto y muy altos niveles de expresión de la proteína de interés codificada en dirección 3’. Examples 8-26 of WO 2006/048459 have shown a selection system in which a sequence encoding a selectable marker protein is in the 5 'direction of a sequence encoding a protein of interest in a multicistronic transcription unit, and in that the translation initiation sequence of the selectable marker is not optimal, and in which the additional internal ATGs of the coding sequence of the selectable marker have been removed. This system results in a high rigor selection system. For example, it has been shown that the Zeo selection marker in which the translation initiation codon is changed by TTG gives very high selection rigor and very high levels of expression of the protein of interest encoded in the 3 ′ direction.

En otro posible sistema de selección (concretamente, el sistema de la presente invención), se dispone el marcador de selección, por ejemplo Zeo, en dirección 3’ de una secuencia IRES. Esto crea un ARNm multicistrónico del que se traduce el producto del gen Zeo mediante iniciación dependiente de IRES. En la construcción d2EGFP-IRES-Zeo habitual (concretamente, una construcción de la técnica anterior, por ejemplo, el documento WO 2006/005718), el codón de inicio de Zeo es el ATG óptimo. Se ensayó si cambiar el codón de inicio de Zeo ATG, por ejemplo, a TTG (designado como IRES-TTG Zeo) da como resultado rigores de selección aumentados en comparación con el IRESATG Zeo habitual. In another possible selection system (specifically, the system of the present invention), the selection marker, for example Zeo, is arranged in the 3 ′ direction of an IRES sequence. This creates a multicistronic mRNA from which the product of the Zeo gene is translated by IRES-dependent initiation. In the usual d2EGFP-IRES-Zeo construction (specifically, a prior art construction, for example, WO 2006/005718), the Zeo start codon is the optimal ATG. Testing whether changing the start codon of Zeo ATG, for example, to TTG (designated as IRES-TTG Zeo) results in increased selection rigors compared to the usual IRESATG Zeo.

Resultados Results

Se muestran esquemáticamente en la FIG. 1 las construcciones usadas. La construcción de control consistía en un promotor de CMV, el gen d2EGFP, una secuencia IRES (la secuencia del IRES usado (Rees y col., 1996) en este ejemplo era: GCCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTAT ATGTGATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGC ATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCT GGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGG TGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGA GTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAG GTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAA CGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAGCTTGCCACAACCCCGG GATA; SEQ. ID. NO. 82), y un marcador de selección TTG Zeo, concretamente, el gen de resistencia a zeocina con un codón de inicio TTG (“d2EGFP-IRES-TTG Zeo”). La otra construcción era la misma, pero con una combinación de STAR7 y STAR67 dispuestos en dirección 5’ del módulo de expresión y STAR7 en dirección 3’ del módulo (“STAR7/67 d2EGFP-IRES-TTG Zeo STAR7”). Se transfectaron ambas construcciones a células CHO-K1 y se efectuó la selección con zeocina 100 µg/ml en el medio de cultivo. Surgieron cuatro colonias después de la transfección con la construcción de control y seis con la construcción que contiene STAR. Se aislaron y propagaron estas colonias independientes antes del análisis de los niveles de expresión de d2EGFP. Como se muestra en la FIG. 1, la incorporación de elementos STAR a la construcción dio como resultado la formación de colonias con altos niveles de expresión de d2EGFP. De las colonias de control sin elementos STAR (“d2EGFP-IRES-TTG Zeo”), solo una colonia exhibía cierta expresión de d2EGFP. Los niveles de expresión son también mucho mayores que los obtenidos con otras construcciones de control que contienen el IRES con un Zeo normal con codón de inicio ATG estándar, con o sin elementos STAR (“d2EGFP-IRES-ATG Zeo” y “STAR 7/67 d2EGFP-IRES-ATG Zeo STAR7”; también en estas construcciones de ATG Zeo había un efecto potenciador de los elementos STAR, pero estos son modestos en comparación con la variante TTG Zeo novedosa). They are shown schematically in FIG. 1 the constructions used. The control construct consisted of a CMV promoter, the d2EGFP gene, an IRES (the sequence used IRES (Rees et al, 1996) sequence in this example was:.. GCCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTAT ATGTGATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGC ATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCT GGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGG TGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGA GTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAG GTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAA CGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAAGCTTGCCACAACCCCGG GATA; SEQ ID NO. 82), and a Zeo TTG selection marker, specifically, the zeocin resistance gene with a TTG start codon ("d2EGFP-IRES-TTG Zeo"). The other construction was the same, but with a combination of STAR7 and STAR67 arranged in the 5 ’direction of the expression module and STAR7 in the 3’ direction of the module (“STAR7 / 67 d2EGFP-IRES-TTG Zeo STAR7”). Both constructs were transfected into CHO-K1 cells and selection was made with 100 µg / ml zeocin in the culture medium. Four colonies emerged after transfection with the control construct and six with the construction containing STAR. These independent colonies were isolated and propagated before analysis of d2EGFP expression levels. As shown in FIG. 1, the incorporation of STAR elements into the construction resulted in the formation of colonies with high levels of d2EGFP expression. Of the control colonies without STAR elements ("d2EGFP-IRES-TTG Zeo"), only one colony exhibited a certain expression of d2EGFP. Expression levels are also much higher than those obtained with other control constructs that contain the IRES with a normal Zeo with standard ATG start codon, with or without STAR elements (“d2EGFP-IRES-ATG Zeo” and “STAR 7 / 67 d2EGFP-IRES-ATG Zeo STAR7 ”; also in these ATG Zeo constructions there was an enhancer effect of the STAR elements, but these are modest compared to the novel TTG Zeo variant).

Estos resultados muestran que disponer un marcador de selección Zeo con un codón de inicio TTG en dirección 3’ de una secuencia URES, en combinación con elementos STAR, funciona bien y establece un sistema de selección riguroso. These results show that having a Zeo selection marker with a TTG start codon in the 3 ’direction of a URES sequence, in combination with STAR elements, works well and establishes a rigorous selection system.

A partir de estos datos y los ejemplos 8-26 del documento WO 2006/048459 y 20-27 del documento US 2006/0195935, resultará evidente que el marcador puede variar de forma similar a los ejemplos 8-26 del documento WO 2006/048459 y 20-27 del documento US 2006/0195935. Por ejemplo, en lugar de un codón de inicio TTG, puede usarse un codón de inicio GTG, y el marcador puede cambiarse de Zeo a un marcador diferente, por ejemplo, Neo, Blas, dhfr, puro, etc., todos con GTG o TTG como codón de inicio. Los elementos STAR pueden variarse usando diferentes secuencias STAR o diferentes disposiciones de los mismos, o sustituyéndolos por otros elementos de control de cromatina, por ejemplo, secuencias MAR. Esto conduce a mejoras frente a los sistemas de selección de la técnica anterior que tienen un IRES con un marcador con un codón de inicio ATG normal. From these data and examples 8-26 of WO 2006/048459 and 20-27 of US 2006/0195935, it will be apparent that the marker can vary similarly to examples 8-26 of WO 2006/048459 and 20-27 of US 2006/0195935. For example, instead of a TTG start codon, a GTG start codon can be used, and the marker can be changed from Zeo to a different marker, for example, Neo, Blas, dhfr, cigar, etc., all with GTG or TTG as start codon. STAR elements may be varied using different STAR sequences or different arrangements thereof, or by replacing them with other chromatin control elements, for example, MAR sequences. This leads to improvements over prior art selection systems that have an IRES with a marker with a normal ATG start codon.

Como ejemplo no limitante, en lugar del gen de resistencia Zeo modificado (TTG Zeo), se dispone un gen de resistencia a neomicina modificado en dirección 3’ de una secuencia IRES. La modificación consiste en el reemplazo del codón de iniciación de la traducción ATG de la secuencia de codificación de Neo por un codón de iniciación de la traducción TTG, creando TTG Neo. La construcción CMV-d2EGF-IRES-TTG Neo, rodeada por elementos STAR o no, se transfecta en células CHO-K1. Se recogen las colonias, se propagan las células y se miden los valores de d2EGFP. Este (“IRES-TTG Neo”) conduce a mejoras frente al sistema de selección conocido que tiene Neo con un codón de inicio ATG en dirección 3’ de un IRES (“IRES-ATG Neo”). La mejora es especialmente evidente cuando la construcción TTG Neo comprende elementos STAR. As a non-limiting example, instead of the modified Zeo resistance gene (TTG Zeo), a modified neomycin resistance gene in the 3 ′ direction of an IRES sequence is arranged. The modification consists in replacing the initiation codon of the ATG translation of the Neo coding sequence with a TTG translation initiation codon, creating TTG Neo. The CMV-d2EGF-IRES-TTG Neo construct, surrounded by STAR elements or not, is transfected into CHO-K1 cells. Colonies are collected, cells are propagated and d2EGFP values are measured. This (“IRES-TTG Neo”) leads to improvements over the known selection system that Neo has with an ATG start codon in the 3 ’direction of an IRES (“ IRES-ATG Neo ”). The improvement is especially evident when the TTG Neo construction comprises STAR elements.

Ejemplo 2: Estabilidad de la expresión disponiendo un gen dhfr modificado detrás de una secuencia IRES Example 2: Stability of the expression by arranging a modified dhfr gene behind an IRES sequence

La modificación del codón de iniciación de la traducción del marcador de selección de zeocina por un codón de iniciación de la traducción que se usa mucho menos frecuentemente que el codón ATG habitual da como resultado un sistema de selección de alto rigor. En el sistema de selección descrito en el documento WO 2006/048459, se dispone el TTG Zeo en dirección 5’ del gen de interés. En otro posible sistema de selección, se dispuso el marcador de selección Zeo en dirección 3’ de una secuencia IRES (presente solicitud, véase el ejemplo 1). Esto crea un ARNm bicistrónico del que se traduce el producto del gen Zeo a partir de codones de iniciación de la traducción de la secuencia IRES. Modification of the translation initiation codon of the zeocin selection marker by a translation initiation codon that is used much less frequently than the usual ATG codon results in a high rigor selection system. In the selection system described in WO 2006/048459, the TTG Zeo is arranged in the 5 ′ direction of the gene of interest. In another possible selection system, the Zeo selection marker in the 3 ′ direction of an IRES sequence was arranged (present request, see example 1). This creates a bicistronic mRNA from which the Zeo gene product is translated from translation initiation codons of the IRES sequence.

En este experimento, se combinaron realizaciones de estos dos sistemas. Se dispuso un marcador de selección TTG en dirección 5’ del gen informador y se acopló un marcador metabólico modificado con GTG o TTG con un IRES con el gen informador. Pueden usarse diferentes genes marcadores de selección, tales como los genes de resistencia a zeocina y neomicina, así como el gen dhfr. Se dispuso aquí un gen de resistencia a zeocina modificado TTG Zeo (véase el documento WO 2006/048459), en dirección 5’ de un gen de interés y el gen de selección dhfr en dirección 3’ del gen de interés, acoplado por un IRES (Fig. 2). El objetivo de este módulo de expresión era seleccionar un clon de célula de mamífero productor de un alto nivel de proteína, en primer lugar mediante selección por zeocina. La configuración TTG Zeo-gen de interés consigue muy eficazmente este objetivo. Después de esta fase de selección inicial, se emplean las características de esta proteína dhfr para conseguir el mantenimiento de altos niveles de expresión en ausencia del antibiótico zeocina. In this experiment, embodiments of these two systems were combined. A TTG selection marker was placed in the 5 ’direction of the reporter gene and a GTG or TTG modified metabolic tag was coupled with an IRES with the reporter gene. Different selection marker genes can be used, such as zeocin and neomycin resistance genes, as well as the dhfr gene. A modified ZeGin resistance gene TTG Zeo (see WO 2006/048459) was arranged here, in the 5 'direction of a gene of interest and the dhfr selection gene in the 3' direction of the gene of interest, coupled by an IRES (Fig. 2). The objective of this expression module was to select a mammalian cell clone producing a high level of protein, first by zeocin selection. The TTG Zeo-gene configuration of interest achieves this objective very effectively. After this initial selection phase, the characteristics of this dhfr protein are used to achieve the maintenance of high levels of expression in the absence of the zeocin antibiotic.

La presión de selección activa parece beneficiosa para mantener los niveles de expresión de proteína en una colonia seleccionada por TTG Zeo al mismo alto nivel durante un periodo prolongado de tiempo. Esto puede lograrse, por ejemplo, manteniendo una cantidad mínima de zeocina en el medio de cultivo, pero esto no está favorecido en instalaciones industriales por razones económicas y potencialmente regulatorias (la zeocina es tanto tóxica como costosa). The active selection pressure seems beneficial to maintain protein expression levels in a colony selected by TTG Zeo at the same high level for a prolonged period of time. This can be achieved, for example, by maintaining a minimum amount of zeocin in the culture medium, but this is not favored in industrial facilities for economic and potentially regulatory reasons (zeocin is both toxic and expensive).

Otro enfoque es acoplar el gen de interés con un marcador de selección que sea una enzima que metabolice una o más etapas esenciales en una ruta metabólica. Con esencial, se entiende que la célula no es capaz de sintetizar bloques de construcción metabólicos esenciales específicos por sí misma, implicando que estos bloques de construcción tienen que estar presentes en el medio de cultivo para permitir sobrevivir a la célula. Son ejemplos bien conocidos los aminoácidos esenciales que no pueden sintetizarse por una célula de mamífero y que tienen que estar presentes en el medio de cultivo para permitir sobrevivir a la célula. Otro ejemplo está relacionado con el gen dhfr sintetizador de 5,6,7,8-tetrahidrofolato. La correspondiente enzima dhfr es una enzima de la ruta del folato. La proteína dhfr convierte específicamente folato en 5,6,7,8-tetrahidrofolato, una lanzadera de grupos metilo necesaria para la síntesis de novo de purinas (hipoxantina), ácido timidílico (timidina) y el aminoácido glicina. Para funcionar, tiene que estar presente en el medio de cultivo la sustancia no tóxica folato (Urlaub y col., 1980). Además, el medio tiene que carecer de hipoxantina y timidina, puesto que cuando estas están disponibles para la célula, se evita la necesidad de enzima dhfr. Las células CHO-DG44 carecen del gen dhfr y estas células necesitan por lo tanto glicina, hipoxantina y timidina en el medio de cultivo para sobrevivir. Sin embargo, si los productos finales glicina, hipoxantina y timidina están ausentes del medio de cultivo, está presente folato y se proporciona el gen dhfr porque está presente en un módulo de expresión de la célula, la célula puede convertir folato en 5,6,7,8-tetrahidroglato y sobrevivir por tanto en este medio de cultivo. Este principio se ha usado durante muchos años como metodología de selección para crear líneas celulares de mamífero transfectadas establemente. Another approach is to couple the gene of interest with a selection marker that is an enzyme that metabolizes one or more essential stages in a metabolic pathway. With essential, it is understood that the cell is not able to synthesize specific essential metabolic building blocks by itself, implying that these building blocks have to be present in the culture medium to allow the cell to survive. Well-known examples are the essential amino acids that cannot be synthesized by a mammalian cell and that have to be present in the culture medium to allow the cell to survive. Another example is related to the 5,6,7,8-tetrahydrofolate synthesizer dhfr gene. The corresponding dhfr enzyme is an enzyme in the folate pathway. The dhfr protein specifically converts folate to 5,6,7,8-tetrahydrofolate, a methyl group shuttle necessary for de novo synthesis of purines (hypoxanthine), thymidyl acid (thymidine) and the amino acid glycine. To function, the non-toxic folate substance must be present in the culture medium (Urlaub et al., 1980). In addition, the medium must lack hypoxanthine and thymidine, since when these are available to the cell, the need for dhfr enzyme is avoided. CHO-DG44 cells lack the dhfr gene and these cells therefore need glycine, hypoxanthine and thymidine in the culture medium to survive. However, if the end products glycine, hypoxanthine and thymidine are absent from the culture medium, folate is present and the dhfr gene is provided because it is present in a cell expression module, the cell can convert folate to 5.6, 7,8-tetrahydroglate and therefore survive in this culture medium. This principle has been used for many years as a screening methodology to create stably transfected mammalian cell lines.

Aquí se usa este principio no para seleccionar los clones estables inicialmente (esto se hace con zeocina), sino para mantener las células bajo presión de selección metabólica. La ventaja es que puede conseguirse una expresión de proteína muy alta mediante el sistema de selección TTG Zeo, y que estos altos niveles de expresión pueden mantenerse sin necesidad de mantener la zeocina en el medio de cultivo. En lugar de ello, la zeocina puede omitirse del medio y la ausencia de glicina, hipoxantina y timidina (GHT) o solo hipoxantina y timidina (HT) del medio de cultivo es suficiente para mantener la presión de selección suficientemente alta para garantizar altos niveles de expresión de proteína. Dicha configuración requiere la presencia de dos marcadores de selección, tanto el gen de resistencia a zeocina como el gen dhfr tienen que estar presentes en el módulo de expresión. Como se indica anteriormente, esto se consigue eficazmente cuando ambos genes están presentes con el gen de interés en una configuración tal que se transcribe un ARNm tricistrónico a partir de un solo promotor. Cuando se emplea el gen de resistencia a zeocina modificado (TTG Zeo) en dirección 5’ del gen d2EGFP, el gen dhfr tiene que estar en dirección 3’ acoplado con el gen d2EGFP, por ejemplo, mediante una secuencia IRES (Fig. 1). This principle is used here not to select the stable clones initially (this is done with zeocin), but to keep the cells under metabolic selection pressure. The advantage is that very high protein expression can be achieved by the TTG Zeo selection system, and that these high levels of expression can be maintained without the need to keep the zeocin in the culture medium. Instead, zeocin can be omitted from the medium and the absence of glycine, hypoxanthine and thymidine (GHT) or only hypoxanthine and thymidine (HT) from the culture medium is sufficient to maintain the selection pressure high enough to ensure high levels of protein expression This configuration requires the presence of two selection markers, both the zeocin resistance gene and the dhfr gene must be present in the expression module. As indicated above, this is effectively achieved when both genes are present with the gene of interest in such a configuration that a tricistronic mRNA is transcribed from a single promoter. When the modified zeocin resistance gene (TTG Zeo) is used in the 5 'direction of the d2EGFP gene, the dhfr gene must be in the 3' direction coupled with the d2EGFP gene, for example, by an IRES sequence (Fig. 1) .

Resultados Results

Se prepararon construcciones en que se dispuso el marcador de selección TTG Zeo en dirección 5’ del gen informador d2EGFP y el marcador de selección dhfr en dirección 3’ del gen d2EGFP, acoplado mediante una secuencia IRES (Fig. 2). Estas construcciones estaban flanqueadas por STAR 7/67/7. Se prepararon tres versiones de estas construcciones: ATG dhfr, GTG dhfr o TTG dhfr, indicando cada nombre el codón de inicio usado para el gen dhfr. Se transfectaron las construcciones en células CHO-DG44. Se transfectó el ADN usando Lipofectamine 2000 (Invitrogen) y se cultivaron las células en presencia de zeocina 400 µg/ml en medio IMDM (Gibco) + 10% de FBS (Gibco) + suplemento de HT. Constructions were prepared in which the TTG Zeo selection marker was placed in the 5 ′ direction of the d2EGFP reporter gene and the dhfr selection marker in the 3 ′ direction of the d2EGFP gene, coupled by an IRES sequence (Fig. 2). These constructions were flanked by STAR 7/67/7. Three versions of these constructs were prepared: ATG dhfr, GTG dhfr or TTG dhfr, each name indicating the start codon used for the dhfr gene. The constructs were transfected into CHO-DG44 cells. The DNA was transfected using Lipofectamine 2000 (Invitrogen) and the cells were cultured in the presence of zeocin 400 µg / ml in IMDM medium (Gibco) + 10% FBS (Gibco) + HT supplement.

El valor medio de d2EGFP en 14 clones de TTG Zeo IRES ATG dhfr era de 341 (día 1), cuando se medía en presencia de zeocina 400 µg/ml (Fig. 2). Después de estas medidas, se dividieron las células y se cultivaron adicionalmente en tres condiciones: The mean value of d2EGFP in 14 clones of TTG Zeo IRES ATG dhfr was 341 (day 1), when measured in the presence of zeocin 400 µg / ml (Fig. 2). After these measurements, the cells were divided and further grown under three conditions:

(1) (one)
con zeocina 400 μg/ml y con hipoxantina y timidina (suplemento HT) en el medio, with zeocin 400 μg / ml and with hypoxanthine and thymidine (HT supplement) in the middle,

(2)(2)
sin zeocina, pero con suplemento de HT en el medio,  without zeocin, but with HT supplement in the middle,

(3)(3)
sin zeocina y sin suplemento de HT.  without zeocin and without HT supplement.

En resumen, en la condición 1, las células están solo bajo presión de selección de zeocina, en la condición 2 las células no están bajo presión de selección y en la condición 3 las células permanecen bajo presión de selección por dhfr. La última condición 3 requiere la expresión continua del gen dhfr para permitir como resultado la expresión de la proteína dhfr y la supervivencia celular. In summary, in condition 1, the cells are only under zeocin selection pressure, in condition 2 the cells are not under selection pressure and in condition 3 the cells remain under selection pressure by dhfr. The last condition 3 requires continuous expression of the dhfr gene to allow dhfr protein expression and cell survival as a result.

Después de 65 días, se midieron de nuevo los valores de d2EGFP. El valor medio de d2EGFP en los clones TTG Zeo IRES ATG dhfr bajo selección con zeocina era ahora de 159 (Fig. 2). El valor medio de d2EGFP en los clones TTG Zeo IRES ATG dhfr sin zeocina y con suplemento de HT era de 20 (Fig. 2). El valor medio de d2EGFP en los clones TTG Zeo IRES ATG dhfr sin selección por zeocina y sin suplemento de HT era de 37 (Fig. 2). Globalmente, se observó una caída de los valores de d2EGFP, pero mayor en ausencia de zeocina, independientemente de si estaba presente suplemento de HT o no. After 65 days, the d2EGFP values were measured again. The average value of d2EGFP in the TTG Zeo IRES ATG dhfr clones under selection with zeocin was now 159 (Fig. 2). The mean value of d2EGFP in the TTG Zeo IRES ATG dhfr clones without zeocin and with HT supplement was 20 (Fig. 2). The average value of d2EGFP in the TTG Zeo IRES ATG dhfr clones without zeocin selection and without HT supplement was 37 (Fig. 2). Overall, a drop in d2EGFP values was observed, but greater in the absence of zeocin, regardless of whether HT supplementation was present or not.

Se siguió el mismo protocolo con la construcción TTG Zeo IRES GTG dhfr. El valor medio de d2EGFP en 15 clones TTG Zeo IRES GTG dhfr era de 455 (día 1), cuando se medía en presencia de zeocina 400 μg/ml (Fig. 3). Después de estas medidas, se dividieron las células y se cultivaron adicionalmente en las tres condiciones anteriormente descritas. Después de 65 días, se midieron de nuevo los valores de d2EGFP. El valor medio de d2EGFP en los clones TTG Zeo IRES GTG dhfr con selección por zeocina era ahora de 356 (Fig. 3). El valor medio de d2EGFP en los clones TTG Zeo IRES GTG dhfr sin selección por zeocina y con suplemento de HT era de 39 (Fig. 3). El valor medio de d2EGFP en los clones TTG Zeo IRES GTG dhfr sin selección por zeocina y sin suplemento de HT era de 705 (Fig. 3). The same protocol was followed with the construction TTG Zeo IRES GTG dhfr. The average value of d2EGFP in 15 TTG Zeo IRES GTG dhfr clones was 455 (day 1), when measured in the presence of zeocin 400 μg / ml (Fig. 3). After these measurements, the cells were divided and further grown under the three conditions described above. After 65 days, the d2EGFP values were measured again. The average value of d2EGFP in the TTG Zeo IRES GTG dhfr clones with zeocin selection was now 356 (Fig. 3). The average value of d2EGFP in the TTG Zeo IRES GTG dhfr clones without zeocin selection and with HT supplement was 39 (Fig. 3). The average value of d2EGFP in the TTG Zeo IRES GTG dhfr clones without zeocin selection and without HT supplement was 705 (Fig. 3).

En este caso, se observó por tanto una caída de los valores de d2EGFP solo en ausencia de zeocina y en presencia del suplemento de HT (condición 2). En ausencia de zeocina, pero en ausencia también de suplemento de HT, los valores de d2EGFP se volvieron en realidad significativamente mayores (condición 3). Esto puede indicar que los niveles de expresión de la proteína dhfr, debido a la frecuencia de traducción dañada del ARNm de GTG dhfr, son suficientemente bajos para proporcionar un rigor de selección muy alto. Esta presión de selección, en ausencia de cualquier agente tóxico, es suficientemente alta para mantener altos niveles de expresión con el tiempo, y aparentemente mejora incluso estos niveles de expresión con el tiempo. In this case, a drop in d2EGFP values was therefore observed only in the absence of zeocin and in the presence of the HT supplement (condition 2). In the absence of zeocin, but also in the absence of HT supplementation, the d2EGFP values actually became significantly higher (condition 3). This may indicate that the expression levels of the dhfr protein, due to the damaged translation frequency of the GTG dhfr mRNA, are low enough to provide a very high selection rigor. This selection pressure, in the absence of any toxic agent, is high enough to maintain high levels of expression over time, and apparently even improves these levels of expression over time.

Se hizo lo mismo para la construcción TTG Zeo IRES TTG dhfr. El valor medio de d2EGFP en 18 clones TTG Zeo IRES TTG dhfr era de 531 (día 1), cuando se medía en presencia de zeocina 400 μg/ml (Fig. 4). Después de estas medidas, se dividieron las células y se cultivaron adicionalmente en las tres condiciones anteriormente descritas. Después de 65 días, se midieron de nuevo los valores de d2EGFP. El valor medio de d2EGFP en los clones TTG Zeo IRES TTG dhfr con selección por zeocina era ahora de 324 (Fig. 4). El valor medio de d2EGFP en los clones TTG Zeo IRES TTG dhfr sin selección por zeocina y en presencia de suplemento de HT era de 33 (Fig. 4). El valor medio de d2EGFP en los clones TTG Zeo IRES TTG dhfr sin selección por zeocina y sin suplemento con HT era de 1124 (Fig. 4). The same was done for the construction TTG Zeo IRES TTG dhfr. The average value of d2EGFP in 18 TTG Zeo IRES TTG dhfr clones was 531 (day 1), when measured in the presence of zeocin 400 μg / ml (Fig. 4). After these measurements, the cells were divided and further grown under the three conditions described above. After 65 days, the d2EGFP values were measured again. The average value of d2EGFP in the TTG Zeo IRES TTG dhfr clones with zeocin selection was now 324 (Fig. 4). The mean value of d2EGFP in the TTG Zeo IRES TTG dhfr clones without zeocin selection and in the presence of HT supplement was 33 (Fig. 4). The average value of d2EGFP in the TTG Zeo IRES TTG dhfr clones without zeocin selection and without HT supplement was 1124 (Fig. 4).

Se observó de nuevo una caída de los valores de d2EGFP solo en ausencia de zeocina y en presencia de suplemento de HT (condición 2). En ausencia de zeocina, pero en ausencia de suplemento de HT, los valores de d2EGFP se volvieron aún mayores que con la construcción TTG Zeo IRES GTG dhfr (condición 3). Puesto que la variante TTG es más rigurosa que la variante GTG, se espera que se traduzcan aún menos proteína dhfr con TTG dhfr que con la variante GTG dhfr. La presión de selección aumentada en ausencia de cualquier agente tóxico con la variante TTG dhfr es suficientemente alta para mantener altos niveles de expresión de proteína con el tiempo, y aparentemente también mejora adicionalmente los niveles de expresión de proteína con el tiempo. A drop in d2EGFP values was observed again only in the absence of zeocin and in the presence of HT supplement (condition 2). In the absence of zeocin, but in the absence of HT supplementation, d2EGFP values became even higher than with the TTG Zeo IRES GTG dhfr construct (condition 3). Since the TTG variant is more rigorous than the GTG variant, it is expected that even less dhfr protein will be translated with TTG dhfr than with the GTG variant dhfr. The increased selection pressure in the absence of any toxic agent with the TTG dhfr variant is high enough to maintain high levels of protein expression over time, and apparently also further improves protein expression levels over time.

Los datos muestran que el acoplamiento de una variante de codón de inicio no ATG del gen dhfr mediante un IRES al gen d2EGFP permite un alto grado de estabilidad de una alta expresión de d2EGFP en células CHO-DG44. Esto ocurre en medio de cultivo sin zeocina y sin productos finales metabólicos esenciales. La selección previa con zeocina mediante el marcador de selección TTG Zeo modificado permite el establecimiento eficaz de colonias con altos niveles de expresión de d2EGFP. Ahora se requiere solo un sencillo cambio del medio de cultivo (retirando zeocina y HT) para mantener los altos niveles de expresión de d2EGFP, e incluso mejorar estos niveles de expresión. The data shows that the coupling of a non-ATG start codon variant of the dhfr gene via an IRES to the d2EGFP gene allows a high degree of stability of a high d2EGFP expression in CHO-DG44 cells. This occurs in culture medium without zeocin and without essential metabolic end products. Prior selection with zeocin using the modified TTG Zeo selection marker allows efficient establishment of colonies with high levels of d2EGFP expression. Now only a simple change of the culture medium (removing zeocin and HT) is required to maintain high d2EGFP expression levels, and even improve these expression levels.

Ejemplo 3: La expresión aumentada disponiendo un gen dhfr modificado detrás de una secuencia IRES debilitada no es el resultado de la amplificación génica Example 3: Increased expression by arranging a modified dhfr gene behind a weakened IRES sequence is not the result of gene amplification

El uso del gen dhfr como marcador de selección en la técnica anterior se basaba a menudo en la amplificación del gen dhfr. Se usó un agente tóxico, metotrexato, en dichos sistemas para amplificar el gen dhfr y al mismo tiempo con él el transgén deseado, del que podrían encontrarse integradas hasta muchos miles de copias en el genoma de células CHO después de dicha amplificación. Aunque estos altos números de copias conducen a altos niveles de expresión, se consideran también una desventaja porque tantas copias pueden conducir a una inestabilidad genómica aumentada y la retirada adicional de metotrexato del medio de cultivo conduce a la rápida retirada de muchos de los loci amplificados. The use of the dhfr gene as a selection marker in the prior art was often based on the amplification of the dhfr gene. A toxic agent, methotrexate, was used in said systems to amplify the dhfr gene and at the same time with it the desired transgene, of which up to many thousands of copies could be integrated into the CHO cell genome after such amplification. Although these high copy numbers lead to high levels of expression, they are also considered a disadvantage because so many copies can lead to increased genomic instability and the additional withdrawal of methotrexate from the culture medium leads to the rapid removal of many of the amplified loci.

En el ejemplo 2, no se usó metotrexato para inhibir la actividad de la enzima dhfr. Solo se retiraron hipoxantina y precursor de timidina del medio de cultivo, y esto fue suficiente para conseguir tanto la estabilidad de la expresión de proteína como niveles de expresión incluso aumentados. Por lo tanto, se determinó si el empleo de la enzima dhfr en este entorno daba como resultado la amplificación génica. In example 2, methotrexate was not used to inhibit the activity of the dhfr enzyme. Only hypoxanthine and thymidine precursor were removed from the culture medium, and this was sufficient to achieve both protein expression stability and even increased expression levels. Therefore, it was determined whether the use of the dhfr enzyme in this environment resulted in gene amplification.

Resultados Results

Se aisló ADN de los clones que se describieron en el ejemplo 2, el mismo día (65) que se midieron los valores de d2EGFP. Con este ADN, se determinaron los números de copias de d2EGFP. DNA was isolated from the clones described in example 2, on the same day (65) that d2EGFP values were measured. With this DNA, d2EGFP copy numbers were determined.

El número medio de copias de d2EGFP en los clones TTG Zeo IRES ATG dhfr con selección por zeocina era de 86 (condición 1) (Fig. 5). El número medio de copias de d2EGFP en los clones TTG Zeo IRES ATG dhfr sin selección por zeocina y en presencia del suplemento de HT era de 53 (condición 2) (Fig. 5). El número medio de copias de d2EGFP en los clones TTG Zeo IRES ATG dhfr sin selección por zeocina y sin suplemento de HT era de 59 (condición 3) (Fig. 5). The average number of copies of d2EGFP in the TTG Zeo IRES ATG dhfr clones with zeocin selection was 86 (condition 1) (Fig. 5). The average number of copies of d2EGFP in the TTG Zeo IRES ATG dhfr clones without zeocin selection and in the presence of the HT supplement was 53 (condition 2) (Fig. 5). The average number of copies of d2EGFP in the TTG Zeo IRES ATG dhfr clones without zeocin selection and without HT supplement was 59 (condition 3) (Fig. 5).

El número medio de copias de d2EGFP en los clones TTG Zeo IRES GTG dhfr con selección por zeocina era de 23 (condición 1) (Fig. 6). El número medio de copias de d2EGFP en los clones TTG Zeo IRES GTG dhfr sin selección por zeocina y en presencia del suplemento de HT era de 14 (condición 2) (Fig. 6). El número medio de copias de d2EGFP en los clones TTG Zeo IRES GTG dhfr sin selección por zeocina y sin suplemento de HT era de 37 (condición 3) (Fig. 6). The average number of copies of d2EGFP in the TTG Zeo IRES GTG dhfr clones with zeocin selection was 23 (condition 1) (Fig. 6). The average number of copies of d2EGFP in the TTG Zeo IRES GTG dhfr clones without zeocin selection and in the presence of the HT supplement was 14 (condition 2) (Fig. 6). The average number of copies of d2EGFP in the TTG Zeo IRES GTG dhfr clones without zeocin selection and without HT supplement was 37 (condition 3) (Fig. 6).

El número medio de copias de d2EGFP en los clones TTG Zeo IRES TTG dhfr con selección por zeocina era de 33 (condición 1) (Fig. 7). El número medio de copias de d2EGFP en los clones TTG Zeo IRES TTG dhfr sin selección por zeocina y en presencia del suplemento de HT era de 26 (condición 2) (Fig. 7). El número medio de copias de d2EGFP en los clones TTG Zeo IRES TTG dhfr sin selección por zeocina y sin suplemento de HT era de 32 (condición 3) (Fig. 7). The average number of copies of d2EGFP in the TTG Zeo IRES TTG dhfr clones with zeocin selection was 33 (condition 1) (Fig. 7). The average number of copies of d2EGFP in the TTG Zeo IRES TTG dhfr clones without zeocin selection and in the presence of the HT supplement was 26 (condition 2) (Fig. 7). The average number of copies of d2EGFP in the TTG Zeo IRES TTG dhfr clones without zeocin selection and without HT supplement was 32 (condition 3) (Fig. 7).

En ningún caso se observó un fuerte aumento de los números de copias de d2EGFP después de la retirada del suplemento de HT, lo que daba como resultado valores de d2EGFP aumentados en el caso de la variante GTG dhfr y TTG dhfr. El hecho de que con ambas construcciones los valores de d2EGFP permanecieran estables con el tiempo e incluso aumentaran significativamente debe ser debido a la acción de la proteína dhfr. Es más, no se observaron números de copias de d2EGFP aumentados en los clones TTG Zeo TTG dhfr en absoluto, y solo un modesto aumento en los clones TTG Zeo GTG dhfr. De forma interesante, los números de copias de d2EGFP globales en los menores productores, los clones TTG Zeo ATG dhfr, eran mayores que en las otras dos variantes, mientras que estos clones no mantenían los valores de fluorescencia de d2EGFP iniciales altos (véase el ejemplo 2). Se concluye a partir de estos datos que la amplificación génica conocida comúnmente, observada cuando se usa la proteína dhfr en combinación con la adición de metotrexato, no es la responsable de mantener los niveles de expresión de d2EGFP estables con el tiempo y del aumento observado de estos niveles de expresión. En lugar de ello, parece que se expresa más proteína d2EGFP por copia del gen d2EGFP con las variantes GTG y TTG dhfr. In no case was a strong increase in d2EGFP copy numbers observed after withdrawal of the HT supplement, which resulted in increased d2EGFP values in the case of the GTG dhfr and TTG dhfr variant. The fact that with both constructs the d2EGFP values remained stable over time and even increased significantly must be due to the action of the dhfr protein. Moreover, no increased d2EGFP copy numbers were observed in the TTG Zeo TTG dhfr clones at all, and only a modest increase in the TTG Zeo GTG dhfr clones. Interestingly, the global d2EGFP copy numbers in the smaller producers, the TTG Zeo ATG dhfr clones, were higher than in the other two variants, while these clones did not keep the initial d2EGFP fluorescence values high (see example 2). It is concluded from these data that the commonly known gene amplification, observed when dhfr protein is used in combination with the addition of methotrexate, is not responsible for keeping d2EGFP expression levels stable over time and for the observed increase in These levels of expression. Instead, it seems that more d2EGFP protein is expressed per copy of the d2EGFP gene with the GTG and TTG dhfr variants.

Se han analizado adicionalmente los niveles de ARNm de d2EGFP de los diferentes clones y en diferentes condiciones como anteriormente, y se ha encontrado que estos niveles de ARNm seguían ampliamente la tendencia de los valores de fluorescencia de d2EGFP. Por lo tanto, se concluyó que los aumentos de los valores de fluorescencia de d2EGFP son debidos a niveles de ARNm aumentados, y no a eficacias de traducción alteradas. The d2EGFP mRNA levels of the different clones and under different conditions have been further analyzed, and it has been found that these mRNA levels largely followed the trend of d2EGFP fluorescence values. Therefore, it was concluded that increases in d2EGFP fluorescence values are due to increased mRNA levels, and not altered translation efficiencies.

Referencias References

Kaufman, RJ. (2000) “Overview of vector design for mammalian gene expresión” Mol. Biotechnol. 16, 151-160. Kaufman, RJ. (2000) “Overview of vector design for mammalian gene expression” Mol. Biotechnol 16, 151-160.

Kozak M. (1986) “Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes”. Cell 44: 283-292. Kozak M. (1986) “Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes”. Cell 44: 283-292.

Kozak M. (1987) “An analysis of 5'-noncoding sequences from 699 vertebrate messenger RNAs”. Nucleic Acids Res. Kozak M. (1987) "An analysis of 5'-noncoding sequences from 699 vertebrate messenger RNAs." Nucleic Acids Res.

15: 8125-8148. 15: 8125-8148.

Kozak M. (1989) “Context effects and inefficient initiation at non-AUG codons in eucaryotic cell-free translation systems”. Mol. Cell. Biol. 9: 5073-5080. Kozak M. (1989) “Context effects and inefficient initiation at non-AUG codons in eucaryotic cell-free translation systems”. Mol. Cell Biol. 9: 5073-5080.

Kozak M. (1990) “Downstream secondary structure facilitates recognition of initiator codons by eukaryotic ribosomes”. Proc. Natl. Acad. Sci. USA 87: 8301-8305. Kozak M. (1990) "Downstream secondary structure facilitates recognition of initiator codons by eukaryotic ribosomes". Proc. Natl Acad. Sci. USA 87: 8301-8305.

Kozak M. (1997) “Recognition of AUG and alternative initiator codons is augmented by G in position +4 but is not generally affected by the nucleotides in positions +5 and +6”. EMBO J. 16: 2482-2492. Kozak M. (1997) “Recognition of AUG and alternative initiator codons is augmented by G in position +4 but is not generally affected by the nucleotides in positions +5 and +6”. EMBO J. 16: 2482-2492.

Kozak M. (2002) “Pushing the limits of the scanning mechanism for initiation of translation”. Gene 299: 1-34. Kozak M. (2002) “Pushing the limits of the scanning mechanism for initiation of translation”. Gene 299: 1-34.

López de Quinto, S y Martínez-Salas, E. (1998) “Parameters influencing translational efficiency in aphthovirus IRES- based bicistronic expresión vectors” Gene 217, 51-6. López de Quinto, S and Martínez-Salas, E. (1998) “Parameters influencing translational efficiency in aphthovirus IRES-based bicistronic expression vectors” Gene 217, 51-6.

Martínez-Salas, E. (1999) “Internal ribosome entry site biology and its use in expresión vectors” Curr. Opin. Biotechnol. 10, 458-64. Martínez-Salas, E. (1999) “Internal ribosome entry site biology and its use in expression vectors” Curr. Opin. Biotechnol 10, 458-64.

5 McBurney, MW, Mai, T, Yang, X y Jardine, K. (2002) “Evidence for repeat-induced gene silencing in cultured Mammalian cells: inactivation of tandem repeats of transfected genes” Exp. Cell. Res. 274, 1-8. 5 McBurney, MW, Mai, T, Yang, X and Jardine, K. (2002) “Evidence for repeat-induced gene silencing in cultured Mammalian cells: inactivation of tandem repeats of transfected genes” Exp. Cell. Res. 274, 1-8.

Mizuguchi, H, Xu, Z, Ishii-Watabe, A, Uchida, E y Hayakawa, T. (2000) “IRES-dependent second gene expresión is significantly lower than cap-dependent first gene expresión in a bicistronic vector” Mol. Ther. 1, 376-82. 10 Rees, S, Coote, J, Stables, J, Goodson, S, Harris, S y Lee, MG. (1996) “Bicistronic vector for the creation of stable mammalian cell lines that predisposes all antibiotic-resistant cells to express recombinant protein” Biotechniques 20, 102-104, 106, 108-110. Mizuguchi, H, Xu, Z, Ishii-Watabe, A, Uchida, E and Hayakawa, T. (2000) "IRES-dependent second gene expression is significantly lower than cap-dependent first gene expression in a bicistronic vector" Mol. Ther. 1, 376-82. 10 Rees, S, Coote, J, Stables, J, Goodson, S, Harris, S and Lee, MG. (1996) "Bicistronic vector for the creation of stable mammalian cell lines that predisposes all antibiotic-resistant cells to express recombinant protein" Biotechniques 20, 102-104, 106, 108-110.

15 Urlaub, G. y Chasin, L.A. “Isolation of Chinese hamster cell mutants deficient in dihydrofolate reductase activity”. Proc. Natl. Acad. Sci. USA 77, 4216-20 (1980) 15 Urlaub, G. and Chasin, L.A. "Isolation of Chinese hamster cell mutants deficient in dihydrofolate reductase activity". Proc. Natl Acad. Sci. USA 77, 4216-20 (1980)

Venkatesan, A, y Dasgupta, A. (2001) “Novel fluorescence-based screen to identify small synthetic internal ribosome entry site elements” Mol. Cell. Biol. 21, 2826-37. 20 Whitelaw, E, Sutherland, H, Kearns, M, Morgan, H, Weaving, L y Garrick, D. (2001) “Epigenetic effects on transgene expresión” Methods Mol. Biol. 158, 351-68. Venkatesan, A, and Dasgupta, A. (2001) “Novel fluorescence-based screen to identify small synthetic internal ribosome entry site elements” Mol. Cell Biol. 21, 2826-37. 20 Whitelaw, E, Sutherland, H, Kearns, M, Morgan, H, Weaving, L and Garrick, D. (2001) "Epigenetic effects on transgene expression" Methods Mol. Biol. 158, 351-68.

Claims (15)

REIVINDICACIONES 1. Una molécula de ADN que comprende: una unidad de transcripción multicistrónica que comprende al menos una secuencia de codificación que codifica tanto 1. A DNA molecule comprising: a multicistronic transcription unit comprising at least one coding sequence that encodes both i) un polipéptido de interés, como i) a polypeptide of interest, such as ii) un polipéptido marcador seleccionable funcional en una célula hospedadora eucariótica, en la que el polipéptido de interés tiene una secuencia de iniciación de la traducción separada de la del polipéptido marcador seleccionable, ii) a functional selectable marker polypeptide in a eukaryotic host cell, in which the polypeptide of interest has a translation initiation sequence separate from that of the selectable marker polypeptide, en la que al menos una secuencia de codificación del polipéptido de interés está en dirección 5’ de al menos una secuencia de codificación del polipéptido marcador seleccionable en dicha unidad de transcripción multicistrónica, wherein at least one coding sequence of the polypeptide of interest is in the 5 'direction of at least one coding sequence of the selectable marker polypeptide in said multicistronic transcription unit, en la que está presente un sitio de entrada interna del ribosoma (IRES) en dirección 3’ a al menos una secuencia de codificación del polipéptido de interés y en dirección 5’ a al menos una secuencia de codificación del polipéptido marcador seleccionable, y wherein an internal ribosome entry site (IRES) is present in the 3 ′ direction to at least one coding sequence of the polypeptide of interest and in the 5 ′ direction to at least one coding sequence of the selectable marker polypeptide, and caracterizada por que la secuencia de codificación que codifica el polipéptido marcador seleccionable comprende characterized in that the coding sequence encoding the selectable marker polypeptide comprises una secuencia de inicio de la traducción seleccionada del grupo constituido por: a) un codón de inicio GTG; b) un codón de inicio TTG; c) un codón de inicio CTG; d) un codón de inicio ATT y e) un codón de inicio ACG. a translation start sequence selected from the group consisting of: a) a GTG start codon; b) a TTG start codon; c) a CTG start codon; d) an ATT start codon and e) an ACG start codon.
2. 2.
Una molécula de ADN según la reivindicación 1, en la que la secuencia de inicio de la traducción para el polipéptido marcador seleccionable comprende un codón de inicio GTG o un codón de inicio TTG. A DNA molecule according to claim 1, wherein the translation start sequence for the selectable marker polypeptide comprises a GTG start codon or a TTG start codon.
3. 3.
Una molécula de ADN según una cualquiera de las reivindicaciones precedentes, en la que el polipéptido marcador seleccionable proporciona resistencia frente a los efectos letales o inhibidores del crecimiento de un agente de selección. A DNA molecule according to any one of the preceding claims, wherein the selectable marker polypeptide provides resistance against the lethal effects or growth inhibitors of a selection agent.
4. Four.
Una molécula de ADN según la reivindicación 3, en la que dicho agente de selección se selecciona del grupo constituido por zeocina, puromicina, blasticidina, higromicina, neomicina, metotrexato, metionina sulfoximina y kanamicina. A DNA molecule according to claim 3, wherein said selection agent is selected from the group consisting of zeocin, puromycin, blasticidine, hygromycin, neomycin, methotrexate, methionine sulfoximin and kanamycin.
5. 5.
Una molécula de ADN según la reivindicación 3, en la que el agente de selección es zeocina. A DNA molecule according to claim 3, wherein the selection agent is zeocin.
6. 6.
Una molécula de ADN según la reivindicación 1 o 2, en la que el polipéptido marcador seleccionable es una enzima sintetizadora de 5,6,7,8-tetrahidrofolato (dhfrdhfr). A DNA molecule according to claim 1 or 2, wherein the selectable marker polypeptide is a 5,6,7,8-tetrahydrofolate (dhfrdhfr) synthesizing enzyme.
7. 7.
Una molécula de ADN según una cualquiera de las reivindicaciones precedentes, en la que la unidad de transcripción multicistrónica comprende adicionalmente una secuencia que codifica un segundo polipéptido marcador seleccionable funcional en la célula eucariótica, en la que dicha secuencia codifica un segundo polipéptido marcador seleccionable: A DNA molecule according to any one of the preceding claims, wherein the multicistronic transcription unit further comprises a sequence encoding a second functional selectable marker polypeptide in the eukaryotic cell, wherein said sequence encodes a second selectable marker polypeptide:
a) tiene una secuencia de iniciación de la traducción separada de la del polipéptido de interés, b) está dispuesta en dirección 5’ de dicha secuencia que codifica un polipéptido de interés, c) no tiene ninguna secuencia ATG en la hebra de codificación después del codón de inicio de dicho polipéptido marcador seleccionable hasta el codón de inicio del polipéptido de interés y d) tiene un codón de inicio GTG o un codón de inicio TTG. a) has a translation initiation sequence separate from that of the polypeptide of interest, b) is arranged in the 5 'direction of said sequence encoding a polypeptide of interest, c) has no ATG sequence in the coding thread after the start codon of said selectable marker polypeptide up to the start codon of the polypeptide of interest and d) has a GTG start codon or a TTG start codon.
8. 8.
Un módulo de expresión que comprende una molécula de ADN según una cualquiera de las reivindicaciones precedentes, comprendiendo dicho módulo de expresión un promotor en dirección 5’ de dicha unidad de transcripción multicistrónica y una secuencia de terminación de la transcripción en dirección 3’ de la unidad de transcripción multicistrónica, en el que dicho módulo de expresión es funcional en una célula hospedadora eucariótica para iniciar la transcripción de la unidad de transcripción multicistrónica. An expression module comprising a DNA molecule according to any one of the preceding claims, said expression module comprising a 5 'direction promoter of said multicistronic transcription unit and a transcription termination sequence in 3' direction of the unit multicistronic transcription, in which said expression module is functional in a eukaryotic host cell to initiate transcription of the multicistronic transcription unit.
9. 9.
Un módulo de expresión según la reivindicación 8, que comprende adicionalmente al menos un elemento de control de cromatina seleccionado del grupo constituido por una región de unión a matriz o armazón (MAR/SAR), una secuencia aislante, un elemento de apertura de cromatina universal (UCOE) y una secuencia antirrepresora (STAR). An expression module according to claim 8, further comprising at least one chromatin control element selected from the group consisting of a matrix or framework binding region (MAR / SAR), an insulating sequence, a universal chromatin opening element (UCOE) and an antirepressant sequence (STAR).
10. 10.
Un módulo de expresión según la reivindicación 9, en el que dicho al menos un elemento de control de cromatina es una secuencia antirrepresora seleccionada del grupo constituido por: An expression module according to claim 9, wherein said at least one chromatin control element is an antirepressant sequence selected from the group consisting of:
a) una cualquiera de SEQ. ID. NO. 1 a SEQ. ID. NO. 66; a) any one of SEQ. ID. NO. 1 to SEQ. ID. NO. 66; b) fragmentos de una cualquiera de SEQ. ID. NO. 1 a SEQ. ID. NO. 66, en los que dichos fragmentos tienen actividad antirrepresora; b) fragments of any one of SEQ. ID. NO. 1 to SEQ. ID. NO. 66, in which said fragments have antirepressant activity; c) secuencias que son al menos un 70% idénticas en secuencia nucleotídica a a) o a b), en las que dichas secuencias tienen actividad antirrepresora; y c) sequences that are at least 70% identical in nucleotide sequence a a) or a b), in which said sequences have antirepressant activity; Y d) el complemento de uno cualquiera de a) a c). d) the complement of any one of a) to c).
11. eleven.
Una célula hospedadora que comprende una molécula de ADN según una cualquiera de las reivindicaciones 1-7 o un módulo de expresión según una cualquiera de las reivindicaciones 8-10, siendo preferiblemente la célula hospedadora una célula de mamífero, preferiblemente una célula de ovario de hámster chino (CHO). A host cell comprising a DNA molecule according to any one of claims 1-7 or an expression module according to any one of claims 8-10, the host cell being preferably a mammalian cell, preferably a hamster ovary cell Chinese (CHO).
12. 12.
Un procedimiento de generación de una célula hospedadora capaz de expresar un polipéptido de interés, comprendiendo dicho procedimiento las etapas de: A method of generating a host cell capable of expressing a polypeptide of interest, said method comprising the steps of:
a) introducir en una pluralidad de células precursoras una molécula de ADN según una cualquiera de las reivindicaciones 1-7 o un módulo de expresión según una cualquiera de las reivindicaciones 8-10 y a) introducing into a plurality of precursor cells a DNA molecule according to any one of claims 1-7 or an expression module according to any one of claims 8-10 and b) cultivar la pluralidad de células precursoras en condiciones adecuadas para la expresión del polipéptido marcador seleccionable, y b) culturing the plurality of precursor cells under conditions suitable for the expression of the selectable marker polypeptide, and c) seleccionar al menos una célula hospedadora que expresa el polipéptido de interés. c) select at least one host cell that expresses the polypeptide of interest.
13. 13.
Un procedimiento de expresión de un polipéptido de interés, que comprende cultivar una célula hospedadora que comprende un módulo de expresión según una cualquiera de las reivindicaciones 8-10 y que expresa el polipéptido de interés a partir del módulo de expresión. An expression method of a polypeptide of interest, comprising culturing a host cell comprising an expression module according to any one of claims 8-10 and expressing the polypeptide of interest from the expression module.
14. 14.
Un procedimiento según la reivindicación 13, que comprende adicionalmente recoger el polipéptido de interés. A method according to claim 13, further comprising collecting the polypeptide of interest.
15. fifteen.
Un procedimiento según la reivindicación 13 ó 14, en el que dichas células hospedadoras son células CHO que tienen fenotipo dhfr-y en el que el módulo de expresión comprende una secuencia de codificación de un polipéptido marcador seleccionable que es una enzima sintetizadora de 5,6,7,8-tetrahidrofolato (dhfrdhfr), en el que dichas células se cultivan en un medio de cultivo que contiene folato y estando dicho medio de cultivo esencialmente desprovisto de hipoxantina y timidina. A method according to claim 13 or 14, wherein said host cells are CHO cells having a dhfr-phenotype and wherein the expression module comprises a coding sequence of a selectable marker polypeptide that is a 5.6 synthesizing enzyme , 7,8-tetrahydrofolate (dhfrdhfr), wherein said cells are cultured in a culture medium containing folate and said culture medium being essentially devoid of hypoxanthine and thymidine.
ES07712283T 2006-02-21 2007-02-21 SELECTION OF HOSPED CELLS THAT EXPRESS PROTEIN AT HIGH LEVELS. Active ES2367530T3 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US359953 1982-03-19
US416490 1982-09-10
EP06113354 2006-05-02
EP06113354 2006-05-02

Publications (1)

Publication Number Publication Date
ES2367530T3 true ES2367530T3 (en) 2011-11-04

Family

ID=39731309

Family Applications (2)

Application Number Title Priority Date Filing Date
ES07712283T Active ES2367530T3 (en) 2006-02-21 2007-02-21 SELECTION OF HOSPED CELLS THAT EXPRESS PROTEIN AT HIGH LEVELS.
ES07728440T Active ES2356485T3 (en) 2006-05-02 2007-04-24 SELECTION OF GUEST CELLS THAT EXPRESS PROTEIN AT HIGH LEVELS.

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES07728440T Active ES2356485T3 (en) 2006-05-02 2007-04-24 SELECTION OF GUEST CELLS THAT EXPRESS PROTEIN AT HIGH LEVELS.

Country Status (2)

Country Link
DE (1) DE602007010607D1 (en)
ES (2) ES2367530T3 (en)

Also Published As

Publication number Publication date
DE602007010607D1 (en) 2010-12-30
ES2356485T3 (en) 2011-04-08

Similar Documents

Publication Publication Date Title
CA2637271C (en) Selection of host cells expressing protein at high levels
ES2384391T3 (en) Selection of host cells that express protein at high levels
JP5888616B2 (en) Expression vectors for high level expression of recombinant proteins
US8039230B2 (en) Selection of host cells expressing protein at high levels
JP5270544B2 (en) Regulatory nucleic acid sequence elements
US9228004B2 (en) Selection of host cells expressing protein at high levels
US8999667B2 (en) Selection of host cells expressing protein at high levels
ES2421152T3 (en) New regulatory elements
US20060141577A1 (en) Selection of host cells expressing protein at high levels
US20100136616A1 (en) Selection of Host Cells Expressing Protein at High Levels
JP2015091238A (en) Mammalian expression vectors
US20110171729A1 (en) Method for Producing Stable Mammalian Cell Lines Producing High Levels of Recombinant Proteins
US7968700B2 (en) Expression augmenting DNA fragments, use thereof, and methods for finding thereof
IL225013A (en) Nucleic acid fragments from a ribosomal protein l32 promoter for enhancing gene expression, constructs, expression vectors and cells comprising the same and methods for their use
ES2367530T3 (en) SELECTION OF HOSPED CELLS THAT EXPRESS PROTEIN AT HIGH LEVELS.
ES2372703T3 (en) DNA FRAGMENTS THAT INCREASE EXPRESSION, USE OF THE SAME AND PROCEDURES TO FIND THEM.
AU2007217431B2 (en) Selection of host cells expressing protein at high levels
JP2024523829A (en) Methods of Eukaryotic Gene Expression
JP2012055303A (en) Expression vector for establishment of highly productive cell including gene amplification