ES2356485T3 - Selección de células huésped que expresan proteína en altos niveles. - Google Patents
Selección de células huésped que expresan proteína en altos niveles. Download PDFInfo
- Publication number
- ES2356485T3 ES2356485T3 ES07728440T ES07728440T ES2356485T3 ES 2356485 T3 ES2356485 T3 ES 2356485T3 ES 07728440 T ES07728440 T ES 07728440T ES 07728440 T ES07728440 T ES 07728440T ES 2356485 T3 ES2356485 T3 ES 2356485T3
- Authority
- ES
- Spain
- Prior art keywords
- polypeptide
- sequence
- dna molecule
- ttg
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
Molécula de ADN que comprende una secuencia de marco de lectura abierto que codifica para un polipéptido marcador seleccionable que proporciona resistencia frente a zeocina o frente a neomicina, caracterizada porque dicha molécula de ADN en la cadena codificante para el polipéptido marcador seleccionable tiene un codón de iniciación GTG o un codón de iniciación TTG, y porque se ha mutado la secuencia de marco de lectura abierto que codifica para la proteína marcadora seleccionable para sustituir al menos la mitad de sus dinucleótidos de CpG en comparación con la secuencia nativa de marco de lectura a b i e r t o q u e c o d i f i c a p a ra l a p r o t e í n a m a r c a d o r a seleccionable.
Description
1
ANTECEDENTES DE LA INVENCIÓN
Campo de la invención: La invención se refiere al campo de
la biología molecular y la biotecnología. Más específicamente,
la presente invención se refiere a medios y métodos para mejorar
la selección de células huésped que expresan proteínas en altos
niveles.
Las proteínas pueden producirse en diversas células huésped
para una amplia gama de aplicaciones en biología y
biotecnología, por ejemplo como agentes biofarmacéuticos. Para
este fin se prefieren células huésped eucariotas y
particularmente de mamífero para la expresión de muchas
proteínas, por ejemplo cuando tales proteínas tienen
determinadas modificaciones postraduccionales tales como
glicosilación. Los métodos para tal producción están bien
establecidos, y generalmente implican la expresión en una célula
huésped de un ácido nucleico (también denominado “transgén”) que
codifica para la proteína de interés. En general, el transgén se
introduce junto con un gen marcador seleccionable en una célula
precursora, se seleccionan las células para determinar la
expresión del gen marcador seleccionable, y se identifican uno o
más clones que expresan la proteína de interés en altos niveles,
y se usan para la expresión de la proteína de interés.
Se conocen métodos para seleccionar células huésped
recombinantes que expresan niveles relativamente altos de
proteínas deseadas (véanse, por ejemplo las introducciones en
los documentos WO 2006/048459 y US 2006/0141577).
Un concepto novedoso para seleccionar células huésped que
expresan altos niveles de polipéptidos de interés se dio a
conocer en la solicitud internacional PCT/EP2005/055794
(publicada como el documento WO 2006/048459), que se presentó
antes pero se publicó tras la fecha de prioridad de la presente
solicitud. Se dio a conocer una alternativa en la solicitud de
patente estadounidense n.º 11/359.953 (publicada como el
documento US 2006/0141577) y en la solicitud internacional
PCT/EP2007/051696, presentada también antes pero publicada tras
la fecha de prioridad de la presente solicitud. En resumen,
estas solicitudes enseñan el uso de una secuencia que codifica
para un polipéptido marcador seleccionable con un codón de
iniciación distinto de ATG, por ejemplo un GTG o TTG. Esto dio
como resultado la posibilidad de seleccionar clones con alta
rigurosidad y se usó para obtener clones de células huésped con
niveles de expresión muy altos.
La presente invención tiene como objetivo proporcionar
medios más mejorados y métodos para la selección de células
huésped que expresan altos niveles de proteínas de interés.
BREVE SUMARIO DE LA INVENCIÓN
Los documentos PCT/EP2005/055794 (WO 2006/048459), US
11/359.953 (US 2006/0141577) y PCT/EP2007/051696 enseñan el uso
de una secuencia que codifica para un polipéptido marcador
seleccionable con un codón de iniciación distinto de ATG, por
ejemplo un GTG o TTG. Esto dio como resultado la posibilidad de
seleccionar clones con alta rigurosidad y se usó para obtener
clones de células huésped con niveles de expresión muy altos.
La presente invención da a conocer genes marcadores
seleccionables mejorados con un codón de iniciación GTG o TTG.
Tales genes marcadores seleccionables mejorados pueden usarse
por ejemplo en las unidades de transcripción y métodos de uso de
las mismas descritos en los documentos WO 2006/048459 y US
2006/0141577. Esto conduce a (una selección de) células huésped
más mejoradas con altos niveles de expresión.
En un aspecto, la invención proporciona una molécula de ADN
que comprende una secuencia de marco de lectura abierto que
codifica para un polipéptido marcador seleccionable,
comprendiendo dicha molécula de ADN en la cadena codificante una
secuencia de inicio de la traducción para el polipéptido
marcador seleccionable elegida del grupo que consiste en: a) un
codón de iniciación GTG: y b) un codón de iniciación TTG; y en
la que se ha mutado la secuencia de marco de lectura abierto que
codifica para la proteína marcadora seleccionable para sustituir
al menos la mitad de sus dinucleótidos de CpG en comparación con
la secuencia nativa de marco de lectura abierto que codifica
para la proteína marcadora seleccionable.
Según la invención, la proteína marcadora seleccionable
proporciona resistencia frente a los efectos mortales y/o
inhibitorios del crecimiento de un agente de selección, tal como
un antibiótico. En particular, el polipéptido marcador
seleccionable proporciona resistencia frente a zeocina o frente
a neomicina.
La invención proporciona además una molécula de ADN según
la invención, en la que la secuencia de marco de lectura abierto
que codifica para un polipéptido marcador seleccionable es parte
de una unidad de transcripción multicistrónica que comprende
además una secuencia de marco de lectura abierto que codifica
para un polipéptido de interés.
La invención proporciona además un casete de expresión que
comprende tales moléculas de ADN, comprendiendo dicho casete de
expresión un promotor en el sentido de 5’ de dicha unidad de
transcripción multicistrónica y preferiblemente una secuencia de
terminación de la transcripción en el sentido de 3’ de la unidad
de transcripción multicistrónica.
La invención proporciona además células huésped que
comprenden una molécula de ADN o un casete de expresión según la
invención.
La invención proporciona además un método de expresión de
un polipéptido de interés, que comprende cultivar una célula
huésped que comprende el casete de expresión de la invención, y
expresar el polipéptido de interés a partir del casete de
expresión.
LEYENDAS DE LAS FIGURAS
Figura 1. Resultados con un marcador de resistencia a
zeocina con contenido de CpG reducido en células CHO-K1. Los
puntos indican puntos de datos individuales; las líneas indican
los niveles de expresión promedio; el eje vertical indica señal
de d2EGFP. Véase el ejemplo 1 para detalles.
Figura 2. Tal como en la figura 1, pero en este caso en
células CHO-DG44. Véase el ejemplo 1 para detalles.
Figura 3. Resultados con marcador de resistencia a
neomicina “pobre en CpG” que tiene diferentes mutaciones. Los
puntos indican puntos de datos individuales; las líneas indican
los niveles de expresión promedio; el eje vertical indica señal
de d2EGFP. Véase el ejemplo 2 para detalles.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
La expresión “gen monocistrónico” se define como un gen que
puede proporciona una molécula de ARN que codifica para un
polipéptido. Una “unidad de transcripción multicistrónica”,
también denominada gen multicistrónico, se define como un gen
que puede proporcionar una molécula de ARN que codifica para al
menos dos polipéptidos. La expresión “gen bicistrónico” se
define como un gen que puede proporcionar una molécula de ARN
que codifica para dos polipéptidos. Por tanto, un gen
bicistrónico se encuentra abarcado dentro de la definición de un
gen multicistrónico. Un “polipéptido” tal como se usa en el
presente documento comprende al menos cinco aminoácidos unidos
por enlaces peptídicos y por ejemplo puede ser una proteína o
una parte, tal como una subunidad, de la misma. Puede comprender
modificaciones postraduccionales, por ejemplo glicosilación. En
general, los términos polipéptido y proteína se usan de manera
intercambiable en el presente documento. Un “gen” o una “unidad
de transcripción” tal como se usa en la presente invención puede
comprender ADN cromosómico, ADNc, ADN artificial, combinaciones
de los mismos y similares. “Operativamente unido” se refiere a
una situación en la que los componentes descritos están en una
relación que les permite funcionar en su forma prevista. Por
tanto, por ejemplo, un promotor “operativamente unido” a un
cistrón está unido de tal manera que se consigue la expresión
del cistrón en condiciones compatibles con el promotor. De
manera similar, una secuencia de nucleótidos de un IRES
operativamente unida a un cistrón está unida de tal manera que
se consigue la traducción del cistrón en condiciones compatibles
con el IRES.
Las moléculas de ADN de la invención pueden estar presentes
en forma de ADN bicatenario, que tienen con respecto al
polipéptido marcador seleccionable y el polipéptido de interés
una cadena codificante y una cadena no codificante, siendo la
cadena codificante la cadena con la misma secuencia que el ARN
traducido, excepto por la presencia de T en lugar de U. Por
tanto, se codifica un codón de iniciación AUG en la cadena
codificante mediante una secuencia ATG, y la cadena que contiene
esta secuencia ATG correspondiente al codón de iniciación AUG en
el ARN se denomina como la cadena codificante del ADN. Será
evidente para el experto que los codones de iniciación o las
secuencias de iniciación de la traducción están presentes, de
hecho, en una molécula de ARN, pero que estas pueden
considerarse incluidas de igual manera en una molécula de ADN
que codifica para tal molécula de ARN; por tanto, siempre que la
presente invención haga referencia a un codón de iniciación o
una secuencia de iniciación de la traducción, se pretende que se
incluya la molécula de ADN correspondiente que tiene la misma
secuencia que la secuencia de ARN excepto por la presencia de
una T en lugar de un U en la cadena codificante de dicha
molécula de ADN, y viceversa, excepto cuando se especifique
explícitamente lo contrario. En otras palabras, un codón de
iniciación es por ejemplo una secuencia AUG en el ARN, pero la
secuencia ATG correspondiente en la cadena codificante del ADN
también se denomina codón de iniciación en la presente
invención. Se usa lo mismo para la referencia de secuencias
codificantes “en marco”, que significan tripletes (3 bases) en
la molécula de ARN que se traducen en un aminoácido, pero
también ha de interpretarse como las secuencias de
trinucleótidos correspondientes en la cadena codificante de la
molécula de ADN.
Una secuencia de inicio de la traducción a menudo se
denomina en el campo “secuencia de Kozak”, y una secuencia de
Kozak óptima es RCCATGG, el codón de iniciación subrayado,
siendo R una purina, es decir A o G (véase Kozak M, 1986, 1987,
1989, 1990, 1997, 2002). Por tanto, además del propio codón de
iniciación, el contexto del mismo, en particular los nucleótidos
de -3 a -1 y +4, son relevantes, y una secuencia de inicio de la
traducción óptima comprende un codón de iniciación óptimo (es
decir ATG) en un contexto óptimo (es decir, el ATG precedido
directamente por RCC y seguido directamente por G). La
traducción por los ribosomas es más eficaz cuando está presente
una secuencia de Kozak óptima (véase Kozak M, 1986, 1987, 1989,
1990, 1997, 2002). Sin embargo, en un pequeño porcentaje de
acontecimientos, el ribosoma reconoce y usa secuencias de
iniciación de la traducción no óptimas para iniciar la
traducción. La presente invención hace uso de este principio, y
permite disminuir la cantidad de traducción y por tanto la
expresión del polipéptido marcador seleccionable, que por tanto
puede usarse para aumentar la rigurosidad del sistema de
selección.
La expresión “marcador de selección” o “marcador
seleccionable” se usa normalmente para hacer referencia a un gen
y/o una proteína cuya presencia puede detectarse directa o
indirectamente en una célula, por ejemplo un polipéptido que
inactiva un agente de selección y protege a la célula huésped de
los efectos mortales o inhibitorios del crecimiento del agente
(por ejemplo, un gen y/o proteína de resistencia a
antibióticos). Los polipéptidos marcadores seleccionables se
conocen bien en la técnica y se usan de manera rutinaria cuando
se han de obtener clones de células huésped eucariotas, y se
proporcionan varios ejemplos de proteínas marcadoras
seleccionables adecuadas en el documento WO 2006/048459. Se
conocen secuencias de ADN que codifican para tales polipéptidos
marcadores seleccionables, y en el documento WO 2006/048459 se
proporcionan varios ejemplos de secuencias de ADN de tipo
natural que codifican para proteínas marcadoras seleccionables
(por ejemplo, las figuras 15-21 en el mismo). Será evidente que
los mutantes o derivados de marcadores seleccionables también
pueden usarse adecuadamente, y por tanto se incluyen dentro del
alcance de la expresión “polipéptido marcador seleccionable”,
siempre que la proteína marcadora seleccionable sea aún
funcional. Por ejemplo, también se abarca cualquier mutación
silenciosa que no altera la proteína codificada debido a la
redundancia del código genético. También se abarcan mutaciones
adicionales que conducen a mutaciones de aminoácidos
conservativas o a otras mutaciones, siempre que la proteína
codificada aún tenga actividad, que puede o no ser inferior a la
de la proteína de tipo natural que se codifica en las secuencias
indicadas. En particular, se prefiere que la proteína codificada
sea al menos el 70%, preferiblemente al menos el 80%, más
preferiblemente al menos el 90%, aún más preferiblemente al
menos el 95% idéntica con respecto a las proteínas codificadas
por las secuencias indicadas respectivas. Las pruebas para
detectar la actividad de las proteínas marcadoras seleccionables
pueden llevarse a cabo mediante métodos de rutina. Un
polipéptido marcador seleccionable según la invención es una
proteína que se codifica por ácido nucleico, polipéptido que
puede usarse funcionalmente para la selección, por ejemplo
porque proporciona resistencia frente a un agente de selección
tal como un antibiótico. Por tanto, cuando se usa un antibiótico
como un agente de selección, el ADN codifica para un polipéptido
que confiere resistencia frente al agente de selección, siendo
el polipéptido el polipéptido marcador seleccionable. El
polipéptido marcador seleccionable se codifica por el ADN de la
invención. El polipéptido marcador seleccionable según la
invención debe ser funcional en una célula huésped eucariota, y
por tanto puede seleccionarse en células huésped eucariotas.
Ejemplos de genes marcadores seleccionables adecuados para la
presente invención son zeocina y neomicina. Otros candidatos
adecuados incluyen, por ejemplo, blasticidina, puromicina,
bleomicina, higromicina, DHFR, GS, etc. (véase también el
documento WO 2006/048459). Otros genes marcadores seleccionables
que podrían usarse, y sus agentes de selección, se describen por
ejemplo en la tabla 1 de la patente estadounidense 5.561.053:
véase también Kaufman, Methods in Enzymology, 185:537-566
(1990), para una revisión de los mismos. El término “selección”
se define normalmente como el procedimiento de usar un marcador
de selección/marcador seleccionable y un agente de selección
para identificar células huésped con propiedades genéticas
específicas (por ejemplo, que la célula huésped contenga un
transgén integrado en su genoma). Por conveniencia y tal como
aceptan generalmente los expertos, en muchas publicaciones así
como en el presente documento, a menudo el gen y la proteína que
codifica para la resistencia frente a un agente de selección se
denomina “gen de (resistencia a) agente seleccionable” o
“proteína de (resistencia frente a) agente de selección”,
respectivamente, aunque los nombres oficiales pueden ser
diferentes, por ejemplo el gen que codifica para la proteína que
confiere resistencia frente a neomicina (así como frente a G418
y kanamicina) a menudo se denomina gen de (resistencia a)
neomicina (o neor), mientras que el nombre oficial es gen de
aminoglicósido 3’-fosfotransferasa.
Las secuencias codificantes de la proteína marcadora
seleccionable de los documentos WO 2006/048459 y US 2006/0141577
en realizaciones preferidas tienen un codón de iniciación GTG o
más preferiblemente uno TTG. Esto da como resultado una
selección muy rigurosa y expresión muy alta de la proteína de
interés en los clones que se obtienen. En la presente invención,
las secuencias codificantes de la proteína marcadora
seleccionable se mejoran adicionalmente reduciendo el contenido
de CpG en las mismas, lo que da como resultado una rigurosidad
aún mayor y niveles de expresión mejorados adicionalmente.
Preferiblemente, la secuencia de inicio de la traducción en
la cadena codificante para el polipéptido marcador seleccionable
comprende un codón de iniciación TTG. Preferiblemente, el codón
de iniciación GTG o TTG está flanqueado por secuencias que
proporcionan reconocimiento relativamente bueno de las
secuencias distintas de ATG como codones de iniciación, tal que
al menos algunos ribosomas inician la traducción a partir de
estos codones de iniciación, es decir la secuencia de inicio de
la traducción comprende preferiblemente la secuencia ACC[codón
de iniciación GTG o TTG]G o GCC[codón de iniciación GTG o TTG]G.
En un aspecto, la invención proporciona una molécula de ADN
que comprende una secuencia de marco de lectura abierto que
codifica para un polipéptido marcador seleccionable,
comprendiendo dicha molécula de ADN en la cadena codificante una
secuencia de inicio de la traducción para el polipéptido
marcador seleccionable elegida del grupo que consiste en: a) un
codón de iniciación GTG; y b) un codón de iniciación TTG; y en
la que se ha mutado la secuencia de marco de lectura abierto que
codifica para la proteína marcadora seleccionable para sustituir
al menos el 10% de sus dinucleótidos de CpG (cualquier “CG” en
la secuencia) en comparación con la secuencia nativa de marco de
lectura abierto que codifica para la proteína marcadora
seleccionable. Una molécula de ADN de este tipo puede usarse
según la invención para obtener células huésped eucariotas que
expresan altos niveles del polipéptido de interés, seleccionando
para detectar la expresión del polipéptido marcador
seleccionable. Posterior o simultáneamente, puede(n)
identificarse una o más célula(s) huésped que expresa(n) el
polipéptido de interés, y usarse adicionalmente para la
expresión de altos niveles del polipéptido de interés.
En el presente documento se muestra que la reducción del
contenido de CpG del gen marcador seleccionable de la invención,
es decir que tiene un codón de iniciación TTG o GTG, puede
conducir a una expresión mejorada de un polipéptido de interés
que se traduce a partir de una unidad de transcripción
multicistrónica a partir de la cual también se traduce el
polipéptido marcador seleccionable. Sin querer limitarse a la
teoría, se cree que la reducción del contenido de CpG puede
reducir la posibilidad de silenciar la transcripción, porque los
dinucleótidos de CpG pueden metilarse y silenciarse en
eucariotas. Los polipéptidos marcadores seleccionables que se
codifican por genes con un contenido de CpG relativamente alto,
a menudo derivados de secuencias bacterianas, por ejemplo
zeocina y neomicina, pueden beneficiarse mucho más de la
reducción del contenido de CpG, aunque ya puede encontrarse
algún beneficio para la selección de genes con un contenido de
CpG relativamente bajo. En determinadas realizaciones, se
eliminan los dinucleótidos de CpG de una secuencia que codifica
para un polipéptido marcador seleccionable sin cambiar la
secuencia de aminoácidos codificada. Esto puede llevarse a cabo
aprovechando la redundancia del código genético, tal como conoce
bien y resulta rutinario para el experto en la técnica de la
biología molecular.
Se espera que un efecto positivo de la eliminación de los
dinucleótidos de CpG será evidente cuando se ha sustituido al
menos el 10% de los dinucleótidos de CpG en la secuencia
codificante del gen marcador seleccionable. Se espera que la
eliminación de más dinucleótidos de CpG aumentará el efecto, y
por tanto en determinadas realizaciones, se muta al menos el
20%, al menos el 30%, al menos el 40%, al menos el 50%, al menos
el 60%, al menos el 70% o al menos el 80% de los dinucleótidos
de CpG en comparación con la secuencia nativa de marco de
lectura abierto que codifica para la proteína marcadora
seleccionable. En determinadas realizaciones ventajosas, se ha
sustituido al menos la mitad de los dinucleótidos de CpG de la
secuencia de marco de lectura abierto que codifica para el
polipéptido marcador seleccionable en comparación con la
secuencia nativa de marco de lectura abierto que codifica para
el polipéptido marcador seleccionable.
Una secuencia nativa de marco de lectura abierto que
codifica para el polipéptido marcador seleccionable que
proporciona resistencia frente a zeocina se facilita como la
SEQ. ID. NO. 1 (que contiene secuencias ATG internas), y la
mutación de A en la posición 280 por T en esta secuencia
facilita una secuencia que carece de secuencias ATG internas, y
en la que la metionina codificada internamente en la posición 94
se sustituye por leucina. Para las secuencias de ADN de la
invención, el codón de iniciación (los primeros tres nucleótidos
de las secuencias de ADN) se muta por un codón de iniciación GTG
o por uno TTG.
En determinadas realizaciones ventajosas, el polipéptido
marcador seleccionable proporciona resistencia frente a zeocina.
En determinadas realizaciones del mismo, la molécula de ADN
comprende la SEQ. ID. NO. 1, en la que se ha sustituido al menos
la mitad de los dinucleótidos de CpG sin mutar la secuencia de
aminoácidos que se codifica, con la condición de que se
sustituye el codón de iniciación (los primeros tres nucleótidos
en la secuencia) por un codón de iniciación elegido de GTG o
TTG. En una realización alternativa, la molécula de ADN
comprende SEQ. ID. NO. 1 en la que se sustituye el nucleótido A
en la posición 280 por T, tal que se sustituye el aminoácido
codificado 94 (metionina) por leucina, en la que se ha
sustituido al menos la mitad de los dinucleótidos de CpG sin
mutar adicionalmente la secuencia de aminoácidos que se
codifica, con la condición de que se sustituye el codón de
iniciación (los primeros tres nucleótidos en la secuencia) por
un codón de iniciación elegido de GTG o TTG. Esta realización
carece de secuencias ATG en la secuencia codificante para el gen
de resistencia a zeocina, y por tanto es adecuado en las
unidades de transcripción multicistrónicas de la invención en
las que la secuencia codificante para el polipéptido marcador
seleccionable está en el sentido de 5’ de la secuencia
codificante para el polipéptido de interés. En una realización
preferida de la misma, la molécula de ADN comprende SEQ. ID. NO.
3.
Una secuencia nativa de marco de lectura abierto que
codifica para el polipéptido marcador seleccionable que
proporciona resistencia frente a neomicina se facilita como SEQ.
ID. NO. 5 (que contiene secuencias ATG internas) y como SEQ. ID.
NO. 7 (que carece de secuencias ATG internas). En realizaciones
ventajosas, estas secuencias pueden contener una o más
mutaciones adicionales de modo que el polipéptido codificado
tiene una mutación de valina en la posición 201 a glicina
(201V>G), de ácido glutámico en la posición 185 a ácido
aspártico (185E>D), o ambas (185E>D, 201V>G).
En otras realizaciones ventajosas, el polipéptido marcador
seleccionable proporciona resistencia frente a neomicina. En
determinadas realizaciones del mismo, la molécula de ADN
comprende una secuencia elegida del grupo que consiste en una
cualquiera de: a) SEQ. ID. NO. 5, con la condición de que se ha
sustituido al menos la mitad de los dinucleótidos de CpG sin
mutar la secuencia de aminoácidos que se codifica, y con la
condición adicional de que se sustituye el codón de iniciación
(la primera secuencia de ATG) por o bien GTG o bien TTG; b) SEQ.
ID. NO. 7, con la condición de que se ha sustituido al menos la
mitad de los dinucleótidos de CpG sin mutar la secuencia de
aminoácidos que se codifica, y con la condición adicional de que
se sustituye el codón de iniciación (la primera secuencia de
ATG) por o bien GTG o bien TTG; y c) SEQ. ID. NO. 5 o SEQ. ID.
NO. 7, que contiene una mutación para codificar para una
variante de proteína de resistencia frente a neomicina en
comparación con las secuencias codificadas por las secuencias
indicadas, teniendo dicha variante glicina en la posición 201 en
la proteína codificada (variante 201G), o ácido aspártico en la
posición 185 (variante 185D), o tanto glicina en la posición 201
como ácido aspártico en la posición 185 (variante 185D, 201G),
con la condición de que se ha sustituido al menos la mitad de
los dinucleótidos de CpG en la secuencia de ADN facilitada sin
mutar adicionalmente la secuencia de aminoácidos que se
codifica, y con la condición adicional de que se sustituye el
codón de iniciación (la primera secuencia de ATG) por o bien GTG
o bien TTG. La variante 185D se obtiene por ejemplo sustituyendo
el codón de la posición 553-555 en las secuencias de ácido
nucleico proporcionadas por la secuencia GAC, y la variante 201G
se obtiene por ejemplo sustituyendo el codón de la posición 601603 en la secuencia de ácido nucleico proporcionada por GGT. En
una realización preferida, la molécula de ADN comprende SEQ. ID.
NO. 9, con la condición de que se sustituye el nucleótido A en
la posición 555 por C (para codificar para la variante 185E>D),
y que se sustituye el nucleótido T en la posición 602 por G y
que se sustituye el nucleótido G en la posición 603 por T (para
codificar para la variante 201 V>G), y con la condición
adicional de que se sustituye el codón de iniciación (ATG en las
posiciones 1-3) por o bien GTG o bien TTG. Será evidente para el
experto que el experto puede preparar variaciones adicionales
sin apartarse de la enseñanza de la presente invención, y tales
variaciones adicionales se abarcan con la presente invención
siempre que el codón de iniciación no sea ATG y que la proteína
codificada proporcione resistencia frente a neomicina (o G418).
Según la presente invención, las variantes 185D y 201G mejoran
adicionalmente la rigurosidad de selección.
En determinadas realizaciones, el polipéptido marcador
seleccionable comprende además una mutación que reduce la
actividad del polipéptido marcador seleccionable en comparación
con su equivalente de tipo natural. Esto puede usarse para
aumentar aún más la rigurosidad de la selección. Como ejemplos
no limitativos, puede mutarse la prolina en la posición 9 en el
polipéptido de resistencia a zeocina, por ejemplo a Thr o Phe, y
para el polipéptido de resistencia a neomicina, puede mutarse
además el residuo de aminoácido 182 ó 261 o ambos (véase por
ejemplo el documento WO 01/32901).
En principio, las moléculas de ADN de la invención, que
codifican para el polipéptido marcador seleccionable, pueden
usarse en cualquier vector de expresión, por ejemplo como un gen
monocistrónico. Proporcionan criterios de selección rigurosos.
Sin embargo, en realizaciones preferidas el ORF que codifica
para un polipéptido marcador seleccionable es parte de una
unidad de transcripción multicistrónica que comprende además una
secuencia de ORF que codifica para un polipéptido de interés.
Una unidad de transcripción multicistrónica según la
invención puede ser por ejemplo una unidad de transcripción
multicistrónica que comprende secuencias que codifican de 5’ a
3’ para un polipéptido marcador seleccionable y para un
polipéptido de interés, o por ejemplo una unidad de
transcripción multicistrónica que comprende secuencias que
codifican de 5’ a 3’ para un polipéptido de interés y para un
polipéptido marcador seleccionable. En el primer caso, la
secuencia codificante para el polipéptido marcador seleccionable
preferiblemente carece de secuencias ATG en la cadena
codificante (véase el documento WO 2006/048459). En el último
caso, el polipéptido de interés se codifica en el sentido de 5’
de la secuencia codificante para el polipéptido marcador
seleccionable y se une operativamente un sitio interno de
entrada al ribosoma (IRES) a la secuencia que codifica para el
polipéptido marcador seleccionable, y por tanto el polipéptido
marcador seleccionable es dependiente del IRES para su
traducción (véase el documento US 2006/0141577). Por tanto en
una realización, una unidad de transcripción multicistrónica de
la invención comprende en el siguiente orden: a) un promotor; b)
la secuencia que codifica para la proteína marcadora
seleccionable; y c) una secuencia que codifica para una proteína
de interés. En otra realización, una unidad de transcripción
multicistrónica de la invención comprende en el siguiente orden:
a) un promotor; b) una secuencia que codifica para una proteína
de interés; y c) un sitio interno de entrada al ribosoma (IRES),
operativamente unido a d) la secuencia que codifica para la
proteína marcadora seleccionable.
En determinadas realizaciones, las unidades de
transcripción multicistrónicas comprenden un tercer cistrón en
el sentido de 3’ del segundo cistrón, dicho tercer cistrón
preferiblemente está operativamente unido a un IRES, y por
ejemplo codifica para un segundo polipéptido marcador
seleccionable. En determinadas realizaciones, este segundo
polipéptido marcador seleccionable es DHFR, preferiblemente con
un codón de iniciación GTG o TTG para permitir la selección
continua de células deficientes en dhfr (véase, por ejemplo el
documento PCT/EP2007/051696).
En determinadas realizaciones, la invención proporciona un
casete de expresión que comprende una molécula de ADN de la
invención, comprendiendo dicho casete de expresión un promotor
en el sentido de 5’ de una unidad de transcripción
multicistrónica de la invención y una secuencia de terminación
de la transcripción en el sentido de 3’ de la misma. Dicho
casete de expresión es funcional en una célula huésped eucariota
para accionar la transcripción de la unidad de transcripción
multicistrónica
Un “casete de expresión” tal como se usa en el presente
documento es una secuencia de ácido nucleico que comprende al
menos un promotor unido funcionalmente a una secuencia cuya
expresión se desea. Preferiblemente, un casete de expresión
contiene además secuencias de terminación de la transcripción y
de poliadenilación. Se conocen bien ejemplos de promotores
adecuados y de secuencias de terminación de la
transcripción/poliadenilación y están fácilmente disponibles
para el experto, y se tratan por ejemplo en el documento WO
2006/048459, págs. 28-29.
También pueden incluirse otras secuencias reguladores tales
como potenciadores. El promotor debe poder funcionar en una
célula huésped eucariota, es decir debe poder accionar la
transcripción de la unidad de transcripción. Por tanto, el
promotor está operativamente unido a la unidad de transcripción.
El casete de expresión puede contener además opcionalmente otros
elementos conocidos en la técnica, por ejemplo sitios de corte y
empalme, para comprender intrones, y similares. En las
realizaciones en las que el polipéptido marcador seleccionable
se codifica en el sentido de 3’ del polipéptido de interés, se
une operativamente un IRES al cistrón que contiene la secuencia
que codifica para el polipéptido marcador seleccionable. En las
realizaciones en las que el polipéptido marcador seleccionable
se codifica en el sentido de 5’ del polipéptido de interés, la
secuencia que codifica para el polipéptido marcador
seleccionable carece de secuencias ATG en la cadena codificante.
Tal como se usa en el presente documento, un “sitio interno
de entrada al ribosoma” o “IRES” se refiere a un elemento que
promueve la entrada directa del ribosoma interno al codón de
iniciación, tal como normalmente un ATG, pero en esta invención
preferiblemente GTG o TTG, de un cistrón (una región que
codifica para la proteína), conduciendo de ese modo a la
traducción independiente de caperuza del gen. El experto en la
técnica conoce bien las secuencias IRES y el uso de las mismas
para la expresión, tal como se enseña en los documentos US
2006/0141577 y PCT/EP2007/051696. Véase también, por ejemplo,
Jackson R J, Howell M T, Kaminski A (1990) Trends Biochem Sci 15
(12): 477-83), Jackson R J y Kaminski, A. (1995) RNA 1 (10):
985-1000, Martinez-Salas, 1999, Venkatesan & Dasgupta, 2001,
Rees et al, 1996, y Mizuguchi et al., 2000. Un ejemplo de una
secuencia IRES adecuada se facilita en el ejemplo 19 del
documento US 2006/0141577 (SEQ ID NO. 127 en el mismo).
Las moléculas de ADN según la invención pueden generarse
mediante métodos de biología molecular convencionales
disponibles para el experto. Por ejemplo, pueden mutarse
secuencias nativas, por ejemplo a partir de plásmidos
comercialmente disponibles, mediante métodos de rutina. Además,
en la actualidad también es posible sintetizar a voluntad (si se
requiere usando etapas de subclonación) secuencias de ADN que
tienen una longitud suficiente para un ORF de un polipéptido
marcador seleccionable, y tales secuencias de ADN sintéticas en
la actualidad pueden pedirse comercialmente de diversas
compañías. Por tanto, usando las enseñanzas de la presente
invención, el experto en la técnica puede diseñar secuencias
apropiadas según la invención que codifican para un polipéptido
marcador seleccionable (con un codón de iniciación GTG o TTG, y
con contenido de CpG reducido, y en determinadas realizaciones
que no tienen secuencias ATG internas), hacer que se sintetice
esta secuencia y someter a prueba la molécula de ADN para
determinar la funcionalidad del marcador seleccionable
codificado introduciendo la molécula de ADN en células huésped
eucariotas y someter a prueba para detectar la expresión del
polipéptido marcador seleccionable funcional. La disponibilidad
comercial de tales secuencias también hace factible proporcionar
sin demasiada carga secuencias que codifican para marcador de
selección que carecen de secuencias ATG internas, en las que la
secuencia codificante de tipo natural del polipéptido marcador
de selección comprende varias secuencias ATG internas de este
tipo (véase el documento WO 2006/048459).
En determinadas realizaciones, una molécula de ADN según la
invención es parte de un vector, por ejemplo un plásmido. Tales
vectores pueden manipularse fácilmente mediante métodos bien
conocidos por el experto en la técnica, y pueden diseñarse por
ejemplo para poder replicarse en células procariotas y/o
eucariotas. Además, muchos vectores pueden usarse directamente o
en forma de fragmento deseado aislado de los mismos para la
transformación de células eucariotas y se integrarán en su
totalidad o en parte en el genoma de tales células, lo que da
como resultado células huésped estables que comprenden el ácido
nucleico deseado en su genoma.
El vector usado puede ser cualquier vector que es adecuado
para clonar ADN y que puede usarse para la transcripción del
ácido nucleico de interés. Cuando se usan las células huésped,
se prefiere que el vector sea un vector de integración.
Alternativamente, el vector puede ser un vector de replicación
episomal.
Se aprecia en gran medida que la estructura de la cromatina
y otros mecanismos de control epigenético pueden influir sobre
la expresión de transgenes en células eucariotas (por ejemplo
Whitelaw et al. 2001). Las unidades de expresión
multicistrónicas según la invención forman parte de un sistema
de selección con un régimen de selección bastante riguroso.
Generalmente esto requiere altos niveles de transcripción en las
células huésped de elección. Para aumentar la posibilidad de
encontrar clones de células huésped que sobreviven el riguroso
régimen de selección, y posiblemente para aumentar la
estabilidad de la expresión en los clones obtenidos,
generalmente será preferible aumentar la predictibilidad de la
transcripción. Por tanto, en realizaciones preferidas, un casete
de expresión según la invención comprende además al menos un
elemento de control de cromatina. Un “elemento de control de
cromatina” tal como se usa en el presente documento es una
expresión colectiva para secuencias de ADN que pueden de algún
modo tener un efecto sobre la estructura de la cromatina y con
ello sobre el nivel de expresión y/o estabilidad de la expresión
de transgenes en su proximidad (funcionan “en cis”, y por tanto
se colocan preferiblemente dentro de 5 kb, más preferiblemente
dentro de 2 kb, aún más preferiblemente dentro de 1 kb del
transgén) dentro de células eucariotas. Preferiblemente un
elemento de control de cromatina de este tipo se elige del grupo
que consiste en una secuencia aislante, un elemento de apertura
de cromatina ubicuo (UCOE), regiones de unión a matriz o
estructura (MAR/SAR) y secuencias antirrepresoras (STAR).
Ejemplos de elementos de control de cromatina, así como métodos
para obtenerlos y usarlos y someterlos funcionalmente a prueba,
se facilitan en el documento WO 2006/048459, páginas 32-37. En
determinadas realizaciones, dicho al menos un elemento de
control de cromatina es un elemento antirrepresor elegido del
grupo que consiste en una cualquiera de SEQ. ID. NO. 1 a SEQ.
ID. NO. 66 del documento WO 2006/048459, y fragmentos de las
mismas. En determinadas realizaciones del mismo, dicho casete de
expresión comprende la SEQ. ID. NO. 66 del documento WO
2006/048459, o un fragmento del mismo ubicado en el sentido de
5’ del promotor que acciona la transcripción de la unidad de
transcripción multicistrónica. En otras realizaciones, la unidad
de transcripción multicistrónica está flanqueada en ambos lados
por al menos una secuencia antirrepresora elegida del grupo que
consiste en una cualquiera de SEQ. ID. NO. 1 a SEQ. ID. NO. 65
del documento WO 2006/048459, o fragmentos de las mismas.
Preferiblemente, el elemento de control de cromatina se elige
del grupo que consiste en STAR67, STAR7, STAR9, STAR17, STAR27,
STAR29, STAR43, STAR44, STAR45, STAR47, STAR61, o un fragmento
funcional o derivado de dichas secuencias STAR (véase por
ejemplo el documento WO 2006/048459 para las secuencias y usos
preferidos de estos elementos STAR).
Un polipéptido de interés según la invención puede ser
cualquier proteína, y puede ser una proteína monomérica o una
(parte de una) proteína multimérica. Una proteína multimérica
comprende al menos dos cadenas de polipéptido. Ejemplos no
limitativos de una proteína de interés según la invención son
enzimas, hormonas, cadenas de inmunoglobulinas, proteínas
terapéuticas tales como proteínas anticancerígenas, proteínas de
la coagulación sanguínea tales como factor VIII, proteínas
multifuncionales, tales como eritropoyetina, proteínas de
diagnóstico, o proteínas o fragmentos de las mismas útiles para
fines de vacunación, todas conocidas por el experto en la
técnica.
El polipéptido de interés puede ser de cualquier fuente, y
en determinadas realizaciones es una proteína de mamífero, una
proteína artificial (por ejemplo una proteína de fusión o una
proteína mutada), y preferiblemente es una proteína humana.
Las moléculas de ADN que comprenden unidades de
transcripción multicistrónicas y/o casetes de expresión según la
invención pueden usarse para mejorar la expresión del ácido
nucleico, preferiblemente en células huésped. Las expresiones
“célula”/“célula huésped” y “línea celular”/“línea celular
huésped” normalmente se definen respectivamente como una célula
y poblaciones homogéneas de la misma que pueden mantenerse en
cultivo celular mediante métodos conocidos en la técnica, y que
tienen la capacidad de expresar proteínas homólogas o
heterólogas. La invención proporciona además células huésped que
comprenden una molécula de ADN o un casete de expresión según la
presente invención.
Las células huésped procariotas pueden usarse para propagar
y/o realizar ingeniería genética con las moléculas de ADN de la
invención, especialmente cuando están presentes en plásmidos que
pueden replicarse en células huésped procariotas tales como
bacterias.
Una célula huésped según la presente invención es
preferiblemente una células eucariota, más preferiblemente una
célula de mamífero, tal como una célula de roedor (por ejemplo
ratón, hámster) o una célula humana o fusión entre diferentes
células. En determinadas realizaciones no limitativas, dicha
célula huésped es una célula de osteosarcoma U-2 OS, célula HEK
293, célula de mieloma HuNS-1, célula de retinoblastoma WERI-Rb1, célula BHK, célula COS, célula Vero, célula de mieloma de
ratón no secretor Sp2/0-Ag 14, célula de mieloma de ratón no
secretor NS0, célula de carcinoma de glándula suprarrenal NCIH295R o una célula PER.C6®. Las células PER.C6 para el fin de la
presente invención significan células de un pasaje aguas arriba
o aguas abajo o un descendiente de un pasaje aguas arriba o
aguas abajo de células tal como se depositaron con el n.º ECACC
96022940 (véase por ejemplo la patente estadounidense
5.994.128), es decir que tienen las características de estas
células. Anteriormente se ha mostrado que tales células pueden
expresar proteínas en altos niveles (por ejemplo el documento WO
00/63403, y Jones et al, 2003). En determinadas realizaciones
preferidas, las células huésped son células CHO (ovario de
hámster chino), por ejemplo CHO-K1, CHO-S, CHO-DG44, CHO-DUKXB11
y similares. En determinadas realizaciones, dichas células CHO
tienen un fenotipo dhfr-.
Tales células huésped eucariotas pueden expresar
polipéptidos deseados, y a menudo se usan para este fin. Pueden
obtenerse mediante la introducción de una molécula de ADN de la
invención, preferiblemente en forma de un casete de expresión,
en las células. Preferiblemente, el casete de expresión se
integra en el genoma de las células huésped, que puede estar en
diferentes posiciones en diversas células huésped, y la
selección proporcionará un clon en el que el transgén está
integrado en una posición adecuada, lo que conduce a un clon de
célula huésped con las propiedades deseadas en cuanto a niveles
de expresión, estabilidad, características de crecimiento y
similares. Alternativamente, la unidad de transcripción puede
seleccionarse como diana o seleccionarse al azar para su
integración en una región cromosómica que se activa de manera
transcripcional, por ejemplo detrás de un promotor presente en
el genoma.
Preferiblemente, las células huésped provienen de un clon
estable que puede seleccionarse y propagarse según
procedimientos convencionales conocidos por el experto en la
técnica. Un cultivo de un clon de este tipo puede producir el
polipéptido de interés, si las células comprenden la unidad de
transcripción que codifica para el mismo.
La invención también proporciona un método de generación de
una célula huésped que puede expresar un polipéptido de interés,
comprendiendo dicho método las etapas de: a) introducir en una
pluralidad de células precursoras una molécula de ADN o un
casete de expresión según la invención, b) cultivar la
pluralidad de células precursoras en condiciones adecuadas para
la expresión del polipéptido marcador seleccionable, y c)
seleccionar al menos una célula huésped que expresa el
polipéptido marcador seleccionable. La selección para determinar
la expresión del polipéptido marcador seleccionable se lleva a
cabo por ejemplo aplicando presión de selección (por ejemplo,
cultivar en presencia del agente de selección) y asegurará la
expresión del polipéptido de interés en las unidades de
transcripción multicistrónicas y casetes de expresión de la
invención. Este método novedoso proporciona un muy buen
resultado en cuanto a la razón de clones obtenidos frente a
clones con alta expresión del polipéptido deseado: se obtienen
muchas menos colonias usando la misma concentración de agente de
selección que con sistemas de selección conocidos, y un
porcentaje relativamente alto de los clones obtenidos producen
el polipéptido de interés en altos niveles.
La invención proporciona además un método para producir un
polipéptido de interés, que comprende cultivar una célula
huésped que comprende un casete de expresión según la invención,
para expresar el ácido nucleico que codifica para la proteína de
interés en dicha célula. En realizaciones preferidas, la
proteína de interés se recoge de dicha célula o del medio de
cultivo o de ambos. En una realización preferida, dicha célula
es una célula de mamífero, por ejemplo, una célula CHO.
La introducción del ácido nucleico que ha de expresarse en
una célula, puede llevarse a cabo mediante uno de varios
métodos, que como tal el experto en la técnica conoce, también
dependen del formato del ácido nucleico que va introducirse.
Dichos métodos incluyen, pero no se limitan a, transfección,
infección, inyección, transformación y similares.
En determinadas realizaciones, el agente de selección está
presente en el medio de cultivo al menos parte del tiempo
durante el cultivo, o bien en concentraciones suficientes para
seleccionar células que presentan el polipéptido marcador
seleccionable o bien en concentraciones menores. En otras
realizaciones, el agente de selección ya no está presente en el
medio de cultivo durante la fase de producción cuando se expresa
el polipéptido.
Se lleva a cabo el cultivo de una célula para permitirle
metabolizar, y/o crecer y/o dividirse y/o producir proteínas
recombinantes de interés. Esto puede lograrse mediante métodos
bien conocidos por los expertos en la técnica, e incluye, pero
no se limita a, proporcionar nutrientes para la célula. Los
métodos comprenden crecimiento adhiriéndose a superficies,
crecimiento en suspensión, o combinaciones de los mismos. El
cultivo puede llevarse a cabo por ejemplo en placas, botellas de
cultivo rotatorias o en biorreactores, usando sistemas
discontinuos, semicontinuos, continuos tales como sistemas de
perfusión y similares. Con el fin de conseguir una producción
(continua) a gran escala de proteínas recombinantes mediante
cultivo celular, en la técnica se prefiere tener células que
puedan crecer en suspensión, y se prefiere tener células que
puedan cultivarse en medio de cultivo libre de suero, o incluso
libre de proteínas.
El experto en la técnica conoce las condiciones para hacer
crecer y multiplicar células (véase por ejemplo Tissue Culture,
Academic Press, Kruse and Paterson, editores (1973)) y las
condiciones para la expresión del producto recombinante. En
general, los principios, protocolos y las técnicas prácticas
para maximizar la productividad de cultivos de células de
mamíferos pueden encontrarse en Mammalian Cell Biotechnology: a
Practical Approach (M. Butler, ed., IRL Press, 1991).
En un realización preferida, la proteína expresada se
recoge (aísla), o bien de las células o bien del medio de
cultivo o bien de ambos. Entonces puede purificarse
adicionalmente usando métodos conocidos, por ejemplo filtración,
cromatografía en columna, etc., mediante métodos generalmente
conocidos por el experto en la técnica.
Obviamente, también pueden usarse las configuraciones de
los casetes de expresión cuando el objetivo final no es la
producción de un polipéptido de interés, sino el propio ARN, por
ejemplo para producir cantidades aumentadas de ARN a partir de
un casete de expresión, que puede usarse para fines de
regulación de otros genes (por ejemplo iARN, ARN antisentido),
terapia génica, producción de proteínas in vitro, etc.
La práctica de esta invención empleará, a menos que se
indique lo contrario, técnicas convencionales de inmunología,
biología molecular, microbiología, biología celular y ADN
recombinante, que están dentro de la experiencia de la técnica.
Véase por ejemplo Sambrook, Fritsch and Maniatis, Molecular
Cloning: A Laboratory Manual, 2ª edición, 1989; Current
Protocols in Molecular Biology, Ausubel FM, et al, eds, 1987; la
serie Methods in Enzymology (Academic Press, Inc.); PCR2: A
Practical Approach, MacPherson MJ, Hams BD, Taylor GR, eds,
1995; Antibodies: A Laboratory Manual, Harlow and Lane, eds,
1988.
La invención se explica adicionalmente en los siguientes
ejemplos. Los ejemplos no limitan la invención en ninguna
manera. Simplemente sirven para aclarar la invención.
EJEMPLOS
Ejemplo 1: La eliminación de dinucleótidos de CpG de la
secuencia que codifica para marcador seleccionable mejora la
expresión usando un método de selección de la invención
Los métodos de selección que usan diferentes codones de
iniciación de la traducción para el marcador seleccionable, tal
como GTG o TTG, pueden dar como resultado una selección muy
rigurosa, y niveles muy altos de producción para el polipéptido
de interés (véanse los documentos WO 2006/048459 y US
2006/0141577, por ejemplo los ejemplos 1-19 en el último). En
este ejemplo, se modificó la región codificante del propio gen
de polipéptido marcador seleccionable eliminando dinucleótidos
de CpG. El fundamento es que el nucleótido C en el nucleótido
CpG puede ser propenso a metilación, lo que puede dar como
resultado el silenciamiento génico del marcador seleccionable, y
por tanto la eliminación de los dinucleótidos de CpG puede
mejorar los resultados. Se tomó el gen de resistencia a zeocina
con un codón de iniciación TTG como el marcador, y se eliminaron
tantos dinucleótidos de CpG como fue posible, sin cambiar la
secuencia de aminoácidos de la proteína de resistencia frente a
zeocina, y además sin introducir secuencias ATG en la cadena
codificante, para evitar la iniciación de la traducción no
deseada dentro de la región codificantes de la proteína de
resistencia frente a zeocina (tal como se explica por ejemplo en
el documento WO 2006/048459). Por tanto, algunos CpG no se
eliminaron. El contenido de CpG de la secuencia nativa (en este
caso: que contiene un codón de iniciación TTG, y una mutación
para eliminar la secuencia ATG interna) es del 13,3%, mientras
que tras mutar los CpG, el contenido de CpG se redujo hasta el
1,8% [denominado “TTG Zeo (pobre en CpG)”]. Se clonó el gen de
resistencia a zeocina con contenido de CpG disminuido en el
sentido de 5’ de la secuencia que codifica para d2EGFP para dar
como resultado una construcción de expresión multicistrónico. Se
midieron los niveles de expresión de d2EGFP.
Se prepararon construcciones que contenían STAR 7 y 67 en
el sentido de 5’ del promotor de CMV, seguido del marcador de
selección TTG Zeo (pobre en CpG) (sintetizado por GeneArt GmbH,
Regensburg, Alemania; véase SEQ. ID. NO 3; véase SEQ. ID. NO. 1
para la secuencia codificante de resistencia a zeocina con su
contenido de CpG natural), el gen d2EGFP y STAR 7 (figura 1). Se
transfectaron los construcciones a células CHO-K1. Se transfectó
ADN usando Lipofectamine 2000 (Invitrogen) y se hicieron crecer
las células en presencia de zeocina 150 g/ml en medio HAM-F12 (Invitrogen) + FBS al 10% (Invitrogen).
Tras la transfección aparecieron ocho colonias con la
construcción TTG Zeo “rico en CpG” de control (A en la figura
1) y ninguna con la construcción que contenía TTG Zeo “pobre en
CpG” (C en la figura 1). Por el contrario, aparecieron más de 24
colonias con los marcadores de selección tanto TTG Zeo “rico en
CpG” (B en la figura 1) como TTG Zeo “pobre en CpG” (D en la
figura 1) cuando se incluyó STAR 7/67-7 en la construcción. Con
el marcador de selección TTG Zeocina “rico en CpG” (A en la
figura 1), la expresión promedio de d2EGFP con la construcción
de control sin STAR fue de 140, y con la construcción que
contenía STAR 1332 (B en la figura 1). Esto es un aumento debido
a la presencia de los elementos STAR. La expresión promedio de
d2EGFP con la construcción que contenía STAR y el Zeo “pobre en
CpG” fue de 2453 (D en la figura 1), un aumento de casi el doble
en comparación con el TTG Zeo “rico en CpG” (B en la figura 1).
Además, el valor de d2EGFP más alto conseguido con la
construcción TTG Zeo “rico en CpG” (B) fue de 2481 y con el TTG
Zeo “pobre en CpG” (D) de 4308.
Se concluye que la disminución del contenido de CpG del gen
marcador de zeocina aumenta la rigurosidad del sistema de
selección. Esto da como resultado mayores valores de expresión
de d2EGFP cuando se incluyen elementos STAR en la construcción y
ninguna colonia con la construcción de control.
También se transfectaron las mismas construcciones a células CHO-DG44. Esto se llevó a cabo con Lipofectamine 2000 (Invitrogen) y se realizó la selección con zeocina 150 g/ml en el medio de cultivo. El medio de cultivo consistió en HAMF12:DMEM = 1:1, + suero bovino fetal al 10%. Con el marcador de selección TTG Zeocina “rico en CpG”, la expresión promedio de d2EGFP con la construcción de control sin STAR fue de 43 (A en la figura 2), y la expresión promedio de d2EGFP con las construcciones que contenían STAR fue de 586 (B en la figura 2). Esto es un aumento debido a la presencia de los elementos STAR. La expresión promedio de d2EGFP con las construcciones con STAR y el Zeo “pobre en CpG” fue de 1152 (D en la figura 2), un aumento de casi el doble en comparación con el TTG Zeo “rico en CpG” (B en la figura 2). Además, el valor de d2EGFP más alto conseguido con la construcción TTG Zeo “rico en CpG” fue de 1296 (B en la figura 2) y con el TTG Zeo “pobre en CpG” de 2416 (D en la figura 2). A diferencia de CHO-K1, en las que no apareció ninguna colonia de control con la construcción TTG Zeo “pobre en CpG” (C en la figura 1), aparecieron colonias de control con CHO-DG44, pero el valor promedio de d2EGFP fue de 52 y el valor más alto en una colonia fue de 115 (C en la figura 2).
Se concluye que también en CHO-DG44 la adición del marcador
de selección TTG Zeo “pobre en CpG” a la construcción da como
resultado una mayor expresión de proteína cuando se emplean
elementos STAR.
Ejemplo 2: Modificaciones en la secuencia codificante de
resistencia a neomicina en el sistema de selección de la
invención
En este ejemplo, además del codón de iniciación, también se
modificó la región codificante del gen de resistencia a
neomicina, eliminando tantos dinucleótidos de CpG del gen de
resistencia a neomicina (sin ATG, de modo que ya carece de
secuencias ATG en la cadena codificante) como fue posible,
mientras que no se cambió la secuencia de aminoácidos de la
proteína de resistencia frente a neomicina (excepto por las
mutaciones Met>Leu en las que las secuencias ATG internas
estaban en marco y se sustituyeron por CTG en comparación con la
secuencia de tipo natural: obviamente esto se realizó por
razones de eliminación de las secuencias ATG de la cadena
codificante e independiente del esfuerzo de reducción del
contenido de CpG, véase el ejemplo 17 del documento WO
2006/048459), y sin introducir nuevas secuencias ATG en la
cadena codificante, de manera análoga a lo que se realizó en el
ejemplo 1 para el gen de resistencia a zeocina. El contenido de
CpG del gen marcador de selección de neomicina de “tipo natural”
es del 10,4% (SEQ. ID. NO. 5), mientras que tras los cambios se
redujo el contenido de CpG hasta el 2,3% (SEQ. ID. NO. 9). Las
construcciones que contienen las secuencias para el gen de
resistencia a neomicina en este ejemplo se pidieron a GeneArt
GmbH, Regensburg, Alemania. Como codón de iniciación, se usó TTG
en este ejemplo. Por tanto, las secuencias usadas consistieron
en SEQ. ID. NO. 9, con la condición de que se sustituyó el codón
de iniciación (los primeros tres nucleótidos, ATG) por un codón
de iniciación TTG, y además en determinados casos contenían una
de las mutaciones indicadas anteriormente.
En el gen de resistencia a neomicina “pobre en CpG”, se
realizaron algunas mutaciones para cambiar aminoácidos de la
proteína de resistencia frente a neomicina, para someter a
prueba si estas tienen influencia sobre los niveles de expresión
del polipéptido de interés cuando se usan en las unidades
transcripción multicistrónicas de la invención. Las mutaciones
(Sautter et al, 2005; se indica que la secuencia neo usada en la
presente solicitud codifica para tres aminoácidos adicionales
inmediatamente después del codón de iniciación en comparación
con las secuencia usada por (Sautter et al, 2005), y por tanto
la numeración de aminoácidos en la presente solicitud es mayor
en tres en comparación con la numeración en (Sautter et al,
2005)) consistieron en un cambio del aminoácido valina 201 (198
en Sautter et al, 2005) a glicina 201 (TTG Neo 201V>G), ácido
glutámico 185 (182 en Sautter et al, 2005) a ácido aspártico 185
(TTG Neo 185E>D) y una doble mutación en la que se cambiaron
tanto el aminoácido valina 201 como ácido glutámico 185 a
glicina 201 y ácido aspártico 185, respectivamente (TTG Neo
185E>D/201V>G) (figura 3). Estas modificaciones se compararon
con la neomicina control (TTG Neo pobre en CpG 185E/201V). En
todos los casos se prepararon construcciones con y sin elementos
STAR (figura 3).
Se incorporó el marcador de selección TTG Neo modificado en
una construcción que contenía STAR 7 y 67 en el sentido de 5’
del promotor de CMV, seguido por el marcador de selección TTG
Neo, el gen d2EGFP y STAR 7 (figura 3). Se transfectaron las
construcciones a células CHO-K1. Se transfectó ADN usando
Lipofectamine 2000 (Invitrogen) y se hicieron crecer las células
en presencia de geneticina G418 500 g/ml en medio HAM-F12 (Invitrogen) + FBS al 10% (Invitrogen).
Con la construcción Neo de control (185E/201V) sólo se observó un efecto muy limitado de los elementos STAR. Esto puede deberse al menos en parte a las numerosas colonias que se generaron con geneticina G418 500 g/ml, lo que indicó que la rigurosidad de la modificación de TTG neomicina es baja. Sin embargo, la neomicina con modificaciones de la invención es operativa: en la construcción TTG Neo 185E 201V se eliminaron todas las secuencias ATG de la cadena codificante del gen de resistencia a neomicina, y aunque los valores de d2EGFP fueron bajos, es evidente que la eliminación de las secuencias ATG aún permitió una selección apropiada bajo la presión de selección con geneticina. Cuando se modificó adicionalmente el gen de resistencia a neomicina, se observó un efecto distintivo de la adición de los elementos STAR. La media de 21 colonias de control TTG Neo 201V>G fue de 65 (A2 en la figura 3), mientras que la señal media de d2EGFP de las 24 colonias TTG Neo 201V>G con elementos STAR fue de 150 (B2 en la figura 3). Se aumentó adicionalmente la rigurosidad de selección con la mutación TTG Neo 185E>D, puesto que ninguna colonia de control sobrevivió sin elementos STAR (A3 en la figura 3), mientras que la señal media de d2EGFP de 17 colonias TTG Neo 185E>D con STAR que sobrevivieron fue de 204 (B3 en la figura 3). Esta fluorescencia media de GFP es mayor que con las colonias TTG Neo 201V>G (B2 en
la figura 3). Además el valor de d2EGFP más alto en colonias TTG
Neo 185E>D fue de 715, en comparación con 443 en las colonias
TTG Neo 201V>G (comparar B3 y B2 en la figura 3). Se observó la
rigurosidad más alta en el mutante Neo doble, TTG Neo 185E>D
201V>G. No sobrevivió ninguna colonia de control (A4 en la
figura 3) y el valor medio de d2EGFP de 7 colonias TTG Neo
185E>D 201V>G con STAR que sobrevivieron fue de 513, con el
valor de d2EGFP más alto de 923 (B4 en la figura 3).
Se concluye que la introducción de mutaciones específicas
aumenta la rigurosidad de la selección del gen de resistencia a
neomicina cuando se usa según la invención. Algunas de estas
modificaciones transmiten tal rigurosidad de selección al gen de
resistencia a neomicina que sólo pueden sobrevivir las colonias
tras la incorporación de elementos STAR, debido a mayores
valores de expresión. Esto da como resultado al mismo tiempo
mayores valores de expresión de d2EGFP. Evidentemente, las
realizaciones ventajosas descritas en el presente documento del
gen de resistencia a neomicina mejoran adicionalmente la
idoneidad de este gen para su uso según la presente invención.
Será evidente que la configuración en la que un gen de
resistencia a neomicina con un contenido de CpG disminuido y con
un codón de iniciación GTG o TTG, y con las mutaciones indicadas
(185E>D y/o 201V>G) también podría colocarse en el sentido de 3’
de la secuencia codificante para el polipéptido de interés (en
este caso d2EGFP como modelo) cuando las secuencias que
codifican para la proteína de resistencia frente a neomicina se
colocan bajo el control de un IRES (véase por ejemplo, el
ejemplo 19 en el documento US 2006/0141577). Lo mismo se
considera para el gen de resistencia a zeocina (ejemplo 1). En
tal caso, no necesita tenerse ningún cuidado de que la mutación
de dinucleótidos de CpG introduzca secuencias ATG. Se espera que
también en tales realizaciones pueden obtenerse buenos
resultados, es decir que la reducción del contenido de CpG y la
mutación específica en las posiciones indicadas de la secuencia
que codifica para la proteína marcadora seleccionable mejorarán
los niveles de expresión.
29
BIBLIOGRAFÍA
Jones D, Kroos N, Anema R, Van Montfort B, Vooys A, Van Der
Kraats S, Van Der Helm E, Smits S, Schouten J, Brouwer K,
Lagerwerf F, Van Berkel P, Opstelten D-J, Logtenberg T, Bout A
(2003) High-level expression of recombinant IgG in the human
cell line PER:C6. Biotechnol. Prog. 19: 163-168.
Kozak M. (1986) Point mutations define a sequence flanking
the AUG initiator codon that modulates translation by eukaryotic
ribosomes. Cell 44: 283-292.
Kozak M. (1987) An analysis of 5’-noncoding sequences from
699 vertebrate messenger RNAs. Nucleic Acids Res. 15: 8125-8148.
Kozak M. (1989) Context effects and inefficient initiation
at non-AUG codons in eucaryotic cell-free translation systems.
Mol Cell Biol. 9: 5073-5080.
Kozak M. (1990) Downstream secondary structure facilitates
recognition of initiator codons by eukaryotic ribosomes. Proc
Natl Acad Sci USA 87:8301-8305.
Kozak M. (1997) Recognition of AUG and alternative
initiator codons is augmented by G in position +4 but is not
generally affected by the nucleotides in positions +5 and +6.
EMBO J. 16: 2482-2492.
Kozak M. (2002) Pushing the limits of the scanning
mechanism for initiation of translation. Gene 299: 1-34.
Martinez-Salas, E. (1999) Internal ribosome entry site
biology and its use in expression vectors. Curr Opin Biotechnol
10, 458-64.
Mizuguchi, H, Xu, Z, Ishii-Watabe, A, Uchida, E, and
Hayakawa, T. (2000) IRES-dependent second gene expression is
significantly lower than cap-dependent first gene expression in
a bicistronic vector. Mol Ther 1, 376-82.
Rees, S, Coote, J, Stables, J, Goodson, S, Harris, S, and
Lee, MG. (1996) Bicistronic vector for the creation of stable
mammalian cell lines that predisposes all antibiotic-resistant
cells to express recombinant protein. Biotechniques 20, 102-104,
106, 108-110.
Sautter, K, Enenkel, B. 2005. Selection of high-producing
CHO cells using NPT selection marker with reduced enzyme
activity. Biotechnol Bioeng. 89, 530-538.
Venkatesan, A, and Dasgupta, A. (2001) Novel fluorescencebased screen to identify small synthetic internal ribosome entry
site elements. Mol Cell Biol 21, 2826-37.
Whitelaw, E, Sutherland, H, Kearns, M, Morgan, H, Weaving,
L, and Garrick, D. (2001) Epigenetic effects on transgene
expression. Methods Mol Biol 158, 351-68.
LISTADO DE SECUENCIAS
<110> ChromaGenics B.V.
Otte, Arie P.
Kwaks, Theodorus H.J.
Sewalt, Richard G.A.B.
van Blokland, Rik
<120> Selección de células huésped que expresan proteína
en altos niveles
<130> 0117 B WO 00 ORD
<150> Documento EP 06113354.2
<151> 02-05-2006
<150> Documento US 11/416.490
<151> 02-05-2006
<160> 10
<170> PatentIn versión 3.3
<210> 1
<211> 375
<212> ADN
<213> Artificial
<220>
<223> Gen de resistencia a zeocina de tipo natural (wt)
<220>
<221> CDS
<222> (1)..(375)
<400> 1
<211> 124
<212> PRT
<213> Artificial
<220> 10 <223> Construcción sintética
<400> 2
<210> 3
<211> 375
<212> ADN
5 <213> Artificial
<220>
<223> Secuencia de resistencia a zeocina (zeo) pobre en CpG
y sin ATG
<220> 10 <221> CDS
<222> (1)..(375)
<400> 3
<210> 4
<211> 124
<212> PRT
<213> Artificial
<220>
<223> Construcción sintética
<400> 4
<210> 5
<211> 804
<212> ADN
<213> Artificial
<220>
<223> Secuencia de resistencia a neomicina (Neo) de tipo
natural
<220>
<221> CDS
<222> (1)..(804)
<400> 5
<210> 6
<211> 267
<212> PRT
<213> Artificial
<220>
<223> Construcción sintética
<400> 6
<210> 7
<211> 804
<212> ADN
<213> Artificial
<220>
<223> Gen de resistencia a neomicina modificado que carece
secuencias ATG internas
<220>
<221> CDS
<222> (1)..(804)
<400> 7
<210> 8
<211> 267
<212> PRT
<213> Artificial
<220>
<223> Construcción sintética
<400> 8
<211> 804
<212> ADN
<213> Artificial
<220>
<223> Secuencia de resistencia a Neo pobre en CpG
<220>
<221> CDS
<222> (1)..(804)
<400> 9
<210> 10
<211> 267
<212> PRT
<213> Artificial
<220>
<223> Construcción sintética
<400> 10
42
Claims (14)
- 1.
- 2.
- 3.
- 4.
- 5.
una secuencia de marco de
Molécula de ADN que comprende lectura abierto que codifica para un polipéptido marcador seleccionable que proporciona resistencia frente a zeocina
Molécula de ADN que comprende lectura abierto que codifica para un polipéptido marcador seleccionable que proporciona resistencia frente a zeocina
o frente a neomicina, caracterizada porque
dicha molécula de ADN en la cadena codificante para el
polipéptido marcador seleccionable tiene un codón de
iniciación GTG o un codón de iniciación TTG, y porque
se ha mutado la secuencia de marco de lectura abierto que
codifica para la proteína marcadora seleccionable para
sustituir al menos la mitad de sus dinucleótidos de CpG en
comparación con la secuencia nativa de marco de lectura
abierto que codifica para la proteína marcadora
seleccionable.
Molécula de ADN según la reivindicación 1, en la que dicho
codón de iniciación es TTG.
Molécula de ADN según la reivindicación 1 ó 2, que
comprende una secuencia de marco de lectura abierto que
codifica para un polipéptido que proporciona resistencia
frente a zeocina, comprendiendo la molécula de ADN una
secuencia elegida del grupo que consiste en:
a) SEQ. ID. NO. 1, con la condición de que se ha
sustituido al menos la mitad de los dinucleótidos de
CpG sin mutar la secuencia de aminoácidos que se
codifica, y con la condición adicional de que el codón
de iniciación es o bien GTG o bien TTG; y
b) SEQ. ID. NO. 1, en la que el nucleótido A en la
posición 280 se sustituye por T, y con la condición
que se ha sustituido al menos la mitad de los
dinucleótidos de CpG sin mutar la secuencia de
aminoácidos que se codifica, y con la condición
adicional de que el codón de iniciación es o bien GTG
o bien TTG.
Molécula de ADN según la reivindicación 3, que comprende
SEQ. ID. NO. 3.
Molécula de ADN según la reivindicación 1 ó 2, que
comprende una secuencia de marco de lectura abierto que
codifica para un polipéptido que proporciona resistencia
frente a neomicina, comprendiendo la molécula de ADN una
secuencia elegida del grupo que consiste en:
a) SEQ. ID. NO. 5, con la condición de que se ha
sustituido al menos la mitad de los dinucleótidos de
CpG sin mutar la secuencia de aminoácidos que se
codifica, y con la condición adicional de que el codón
de iniciación es o bien GTG o bien TTG; y
b) SEQ. ID. NO. 7, con la condición de que se ha
sustituido al menos la mitad de los dinucleótidos de
CpG de la cadena codificante sin mutar la secuencia de
aminoácidos que se codifica, y con la condición
adicional de que el codón de iniciación es o bien GTG
o bien TTG; y
c) SEQ. ID. NO. 5 o SEQ. ID. NO. 7, con la condición de
que contiene una mutación que codifica para cualquiera
de las siguientes variantes de polipéptido en
comparación con el polipéptido codificado por las
secuencias nativas:
- (i)
- sustitución de valina en la posición 201 por glicina (201V>G), o
- (ii)
- sustitución de ácido glutámico en la posición 185 por ácido aspártico (185E>D), o
(iii) una combinación de ambas mutaciones (i) y
(ii) (185E>D y 201V>G),
con la condición adicional de que se ha sustituido al
menos la mitad de los dinucleótidos de CpG de la
cadena codificante sin mutación adicional de la
secuencia de aminoácidos que se codifica más allá de
la mutación indicada en (i)-(iii), y con la condición
adicional de que el codón de iniciación es o bien GTG
o bien TTG.
- 6.
- Molécula de ADN según la reivindicación 5, que comprende SEQ. ID. NO. 9, con la condición de que el nucleótido A en la posición 555 se sustituye por C, y que el nucleótido T en la posición 602 se sustituye por G y que el nucleótido G
en la posición 603 se sustituye por T, y con la condición
adicional de que el codón de iniciación es o bien GTG o
bien TTG.
- 7.
- Molécula de ADN según una cualquiera de las reivindicaciones 1-6, en la que la secuencia de marco de lectura abierto que codifica para un polipéptido marcador seleccionable es parte de una unidad de transcripción multicistrónica que comprende además una secuencia de marco de lectura abierto que codifica para un polipéptido de interés.
- 8.
- Molécula de ADN según la reivindicación 7, en la que el marco de lectura abierto que codifica para el polipéptido marcador seleccionable está en el sentido de 5’ del marco de lectura abierto que codifica para el polipéptido de interés, y en la que el marco de lectura abierto que codifica para el polipéptido marcador seleccionable no tiene ninguna secuencia de ATG en la cadena codificante.
- 9.
- Molécula de ADN según la reivindicación 7, en la que el marco de lectura abierto que codifica para el polipéptido de interés está en el sentido de 5’ del marco de lectura abierto que codifica para el polipéptido marcador seleccionable, y en la que el marco de lectura abierto que codifica para el polipéptido marcador seleccionable está operativamente unido a un sitio interno de entrada al ribosoma (IRES).
- 10.
- Casete de expresión que comprende la molécula de ADN según una cualquiera de las reivindicaciones 7-9, comprendiendo dicho casete de expresión un promotor en el sentido de 5’ de dicha unidad de expresión multicistrónica y una secuencia de terminación de la transcripción en el sentido de 3’ de la unidad de expresión multicistrónica.
- 11.
- Casete de expresión según la reivindicación 10, que comprende además al menos un elemento de control de cromatina.
- 12.
- Célula huésped que comprende la molécula de ADN según una cualquiera de las reivindicaciones 1-9 o un casete de
expresión según una cualquiera de las reivindicaciones 10
11.
13. Método de generación de una célula huésped que puede expresar un polipéptido de interés, comprendiendo dicho 5 método las etapas de:
a) introducir en una pluralidad de células precursoras una
molécula de ADN según una cualquiera de las
reivindicaciones 7-9 o un casete de expresión según una
cualquiera de las reivindicaciones 10-11,
10 b) cultivar la pluralidad de células precursoras en condiciones adecuadas para la expresión del polipéptido marcador seleccionable, y c) seleccionar al menos una célula huésped que expresa el polipéptido de interés.
15 14. Método de expresión de un polipéptido de interés, que comprende cultivar una célula huésped que comprende el casete de expresión según una cualquiera de las reivindicaciones 10-11, y expresar el polipéptido de interés a partir del casete de expresión.
20 15. Método según la reivindicación 14, que comprende además recoger el polipéptido de interés.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US416490 | 1982-09-10 | ||
EP06113354 | 2006-05-02 | ||
EP06113354 | 2006-05-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2356485T3 true ES2356485T3 (es) | 2011-04-08 |
Family
ID=39731309
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES07712283T Active ES2367530T3 (es) | 2006-02-21 | 2007-02-21 | Selección de células hospedadoras que expresan proteína a altos niveles. |
ES07728440T Active ES2356485T3 (es) | 2006-05-02 | 2007-04-24 | Selección de células huésped que expresan proteína en altos niveles. |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES07712283T Active ES2367530T3 (es) | 2006-02-21 | 2007-02-21 | Selección de células hospedadoras que expresan proteína a altos niveles. |
Country Status (2)
Country | Link |
---|---|
DE (1) | DE602007010607D1 (es) |
ES (2) | ES2367530T3 (es) |
-
2007
- 2007-02-21 ES ES07712283T patent/ES2367530T3/es active Active
- 2007-04-24 DE DE602007010607T patent/DE602007010607D1/de active Active
- 2007-04-24 ES ES07728440T patent/ES2356485T3/es active Active
Also Published As
Publication number | Publication date |
---|---|
DE602007010607D1 (de) | 2010-12-30 |
ES2367530T3 (es) | 2011-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2651088C (en) | Selection of host cells expressing protein at high levels | |
US8039230B2 (en) | Selection of host cells expressing protein at high levels | |
ES2330201T3 (es) | Regiones de union a la matriz y metodos para el uso de las mismas. | |
ES2384391T3 (es) | Selección de células hospedantes que expresan proteína a altos niveles | |
ES2421152T3 (es) | Nuevos elementos reguladores | |
US10563223B2 (en) | Intergenic elements for enhancing gene expression | |
WO2010140387A1 (ja) | 高生産性細胞の樹立のための発現ベクター及び高生産性細胞 | |
US8999667B2 (en) | Selection of host cells expressing protein at high levels | |
US7968700B2 (en) | Expression augmenting DNA fragments, use thereof, and methods for finding thereof | |
US20110171729A1 (en) | Method for Producing Stable Mammalian Cell Lines Producing High Levels of Recombinant Proteins | |
EP2611915B1 (en) | Nucleic acid fragments from a ribosomal protein promoter for enhancing gene expression | |
EP1885860A2 (en) | Regulated vectors for selection of cells exhibiting desired phenotypes | |
ES2356485T3 (es) | Selección de células huésped que expresan proteína en altos niveles. | |
ES2372703T3 (es) | Fragmentos de adn que aumentan la expresión, uso de los mismos y procedimientos para encontrarlos. | |
US20170096679A1 (en) | Eukaryotic expression vectors resistant to transgene silencing | |
WO2019225372A1 (ja) | 新規ベクターおよびその利用 |