PT2310501E

PT2310501E - Novos elementos reguladores

Info

Publication number: PT2310501E
Application number: PT98000557T
Authority: PT
Inventors: Barbara Enenkel
Original assignee: Boehringer Ingelheim Pharma
Priority date: 2008-07-23
Filing date: 2009-07-22
Publication date: 2013-07-18
Also published as: SG188882A1; HRP20130888T1; JP2011526795A; IL208700A0; US20130177943A1; US8975391B2; HK1156663A1; DK2310501T3; CN102165060A; CY1114483T1; KR20110031912A; ES2421152T3; AU2009273239B2; IL208700A; CN102165060B; EP2310501A1; MY156855A; NZ589268A; WO2010010107A1; PL2310501T3

Description

DESCRIÇÃO "NOVOS ELEMENTOS REGULADORES"

ANTECEDENTES DA INVENÇÃO

CAMPO TÉCNICO A invenção refere-se ao campo da tecnologia de cultura de células. Refere-se a novos elementos reguladores, assim como a um método para melhorar a expressão de polipéptidos a partir de ácidos nucleicos, tal como genes clonados, e à produção de vários polipéptidos em células hospedeiras eucarióticas utilizando os referidos novos elementos reguladores.

ANTECEDENTES 0 mercado de medicamentos biológicos para utilização em terapia humana continua a crescer a uma taxa elevada, com mais de 900 medicamentos biológicos a serem avaliados em estudos clínicos e vendas estimadas de 50 mil milhões em 2010. Actualmente, um número crescente de medicamentos biológicos é produzido a partir de células de mamífero devido à sua capacidade para processar e modificar correctamente proteínas humanas. Deste modo, as proteínas recombinantes são funcional e farmacocineticamente compatíveis com humanos. Uma desvantagem comparativamente a sistemas procarióticos de expressão é frequentemente o nível significativamente inferior de expressão proteica. A produção bem-sucedida e de elevado rendimento de 1 medicamentos biológicos a partir de células de mamifero é assim crucial e é controlada por vários factores incluindo linha celular do hospedeiro, sistema de expressão, crescimento e produtividade celular, meios de cultura e de alimentação, processo de produção e purificação, estrutura e sequência proteica, estabilidade proteica e formulação. A expressão da proteina recombinante requer um vector de expressão que codifique o gene de interesse desejado. Foram utilizados vários métodos para optimizar vectores de expressão para a produção eficiente de proteina. A expressão génica é regulada nos niveis transcripcional e de tradução. Assim, muitos métodos referem-se à identificação e optimização de fortes promotores e intensificadores para melhorar a eficiência de genes codificadores de proteina com os quais são transcritos. Os exemplos destes são o promotor e intensificador precoce imediato de CMV, o promotor e intensif icador de SV40, o promotor do factor de elongação (EF), o intensificador de Polioma e o promotor da [beta]-actina de galinha. Do mesmo modo, fortes sequências de sinal de poliadenilação que estabilizam ARNm e intensificam a terminação de transcrição são também utilizadas para aumentar a expressão proteica a partir de genes codificados pelos vectores de expressão. Entre os métodos para melhorar a eficiência, com o qual é traduzido o ARNm resultante, está a utilização de locais de iniciação de tradução (AUG), locais de ligação a ribossoma óptimos, tal como a sequência de Kozak (GCCGCCACCAUGG; AUG constitui o codão de iniciação) ou locais internos de entrada de ribossoma (IRES).

Um dos métodos utilizados para optimizar vectores de expressão de modo a obter niveis mais elevados de expressão de gene recombinante em células eucarióticas refere-se à utilização e selecção de sinais de poliadenilação. É utilizada uma 2 variedade de sinais de poliadenilação em vectores para a expressão de proteínas recombinantes. Os mais habitualmente utilizados incluem, por exemplo, sinais de poliadenilação da hormona de crescimento bovino (BGH) (documentos U.S. 5122458; EP0173552), região precoce e tardia do vírus 40 símio, beta-globina de coelho, imunoglobulinas humanas ou de murganho, região tardia do vírus polioma.

No ARN mensageiro (ARNm) eucariótico, a região 3' não traduzida (3'UTR) é um importante elemento regulador. Em muitos casos, determina a estabilidade do ARNm e pode também regular a eficiência da tradução. Os sinais de poliadenilação são sequências nucleotídicas dentro das 3'UTR que direccionam a ligação de um complexo proteico de poliadenilação a uma sequência AAUAAA dentro da sequência de sinal. O complexo contém uma endonuclease que corta o ARNm cerca de 14 a 30 nucleótidos a jusante da sequência AAUAAA e uma polimerase que incorpora pós-transcripcionalmente um conjunto de aproximadamente 100 a 200 nucleótidos de adenina (cauda poli A) à extremidade 3' clivada. Pensa-se que a cauda poli A influencie muitos aspectos do metabolismo do ARNm, incluindo estabilidade, eficiência da tradução e transporte do núcleo para o citoplasma. Tipicamente, o sinal de poliadenilação consiste em dois elementos de reconhecimento que flanqueiam o local de clivagem e de poliadenilação: uma sequência AAUAAA altamente conservada aproximadamente 14 a 30 nucleótidos a montante do local de clivagem e uma região rica em G/U ou U pouco conservada aproximadamente 20 a 50 nucleótidos a jusante da sequência AAUAAA. A clivagem entre estes dois elementos é geralmente no lado 3' de um resíduo A. In vivo, a eficiência com que os diferentes locais de poliadenilação são processados varia consideravelmente. A velocidade de montagem do complexo proteico de poliadenilação é um processo com vários passos e 3 correlaciona-se com a força da sequência de sinal de poliadenilação. Por exemplo, devido a uma velocidade de montagem mais rápida, a clivagem no forte sinal de poliadenilação tardio de SV40 ocorre mais rapidamente do que no fraco sinal de poliadenilação precoce de SV40 (Chao et al., Molecular and Cellular Biology, Vol. 9 (8), 5588-5600, 1999).

Existe a necessidade para identificar sinais de poliadenilação alternativos, fortes ou mesmo muito fortes, para acelerar a criação de linhas celulares fortemente produtoras para a produção de proteínas recombinantes. A utilização de sinais de poliadenilação fortes ou mesmo muito fortes aumenta a terminação transcripcional que, por sua vez, resulta em produção aumentada, estabilidade, exportação nuclear e/ou tradução de ARNm codificado por vector. Isto deve conduzir a níveis mais elevados de ARNm e resulta assim em produtividade mais elevada de células produtoras.

SUMÁRIO DA INVENÇÃO/SOLUÇÃO

Descreve-se aqui um novo sinal de poliadenilação isolado da hormona de crescimento de hamster Chinês (Cricetus griseus). Surpreendentemente, verificou-se que este sinal de poliadenilação recentemente identificado, denominado HGH, supera os fortes sinais de poliadenilação de BGH e tardio de SV40. Ao utilizarem-se vectores compreendendo HGH como sequência de sinal de poliadenilação, os títulos proteicos em transfecções transientes de células CHO-DG44 foram aumentados até 35%, comparativamente a células compreendendo BGH. Em células estáveis foram obtidas elevadas produtividades específicas até 45 pg/célula/dia e títulos em processos descontínuos até 6,3 g/L. 4

Uma forma de realização da presente invenção é uma sequência polinucleotídica compreendendo, pelo menos, um sinal de poliadenilação HGH e, pelo menos, uma sequência nucleotídica heteróloga codificando um produto de interesse. 0 sinal de poliadenilação HGH está a jusante e ligado operativamente à(s) sequência(s) nucleotídica(s) heteróloga(s) . Outra forma de realização da presente invenção é um novo vector compreendendo, pelo menos, uma sequência nucleotídica heteróloga que codifica um produto de interesse e, pelo menos, um sinal de poliadenilação HGH. 0 sinal de poliadenilação HGH está a jusante e ligado operativamente à(s) sequência(s) nucleotídica(s) heteróloga(s) . Uma forma de realização adicional da presente invenção é um novo vector ou sequência polinucleotídica compreendendo, pelo menos, um sinal de poliadenilação HGH ligado operativamente a um local de clonagem múltipla a montante que permite a clonagem do gene de interesse através de sequências de reconhecimento para endonucleases de restrição. Ainda outra forma de realização da presente invenção é uma célula eucariótica, de um modo preferido, uma célula de mamífero, compreendendo o sinal de poliadenilação HGH. Contudo, uma forma de realização adicional da presente invenção é um método para produzir um produto de interesse compreendendo cultivar células eucarióticas, de um modo preferido, células de mamífero transfectadas com vectores ou sequências polinucleotídicas compreendendo o sinal de poliadenilação HGH. Numa forma de realização preferida, o produto de interesse é um polipéptido e o polipéptido desejado é recuperado a partir do meio de cultura.

Os dados da presente invenção mostram o impacto da sequência de sinal de poliadenilação HGH na expressão transiente de sICAM (Figura 6). Surpreendentemente, a expressão mais elevada de sICAM é obtida com a sequência de sinal de poliadenilação derivada do gene da hormona de crescimento de hamster. 0 título 5 é aumentado até 21% (série de transfecção N° 1) comparativamente a células transfectadas com o vector pJRUO contendo o sinal de poliadenilação de BGH e aumentado até 40% (série de transfecção N° 1) comparativamente a células transfectadas com o vector pJR106 contendo o sinal de poliadenilação tardio de SV40.

Os dados da presente invenção mostram adicionalmente o impacto do sinal de poliadenilação HGH na expressão transiente de um anticorpo IgG4. Surpreendentemente, os títulos obtidos com a sequência de sinal de poliadenilação HGH são em média 35% mais elevados que para o sinal de poliadenilação de BGH (Fiqura 7).

Os dados da presente invenção mostram adicionalmente um teste de diferentes variantes de HGH (Fiqura 8). A sequência mais curta de HGH de 113 pb contida no vector de expressão pJR135 conduz a uma expressão reduzida de sICAM até 78% em comparação com a sequência HGH de 324 pb contida no vector de expressão pJR131. Enquanto a sequência HGH de 189 pb contida no vector de expressão pJR134 resulta numa expressão muito boa de sICAM comparável ao nível de expressão consequido com BGH (Fiqura 7) . O melhor resultado de expressão é consequido com a sequência HGH de 324 pb contida no vector de expressão pJR131 (Fiqura 8), o qual é muito melhor (35%) do que a expressão consequida com o sinal de poliadenilação de BGH (Fiqura 7).

Isto mostra que entre a região de HGH dos pb 190 a 324 da SEQ ID N°:8 estão localizadas sequências que contribuem para uma expressão eficiente de um gene de interesse.

Os dados da presente invenção mostram adicionalmente a expressão estável de proteínas a níveis elevados utilizando o sinal de poliadenilação HGH. São obtidos agrupamentos celulares e clones celulares com produtividades específicas na gama de 6 10-45 pg/célula/dia e títulos em processos descontínuos até 6,3 g/L (Figura 9) .

Numa forma de realização específica, a invenção refere-se a um sinal de poliadenilação compreendendo um ácido nucleico compreendendo uma sequência, pelo menos, 75% idêntica à SEQ ID N°:8. A invenção refere-se especificamente a um sinal de poliadenilação compreendendo um ácido nucleico consistindo essencialmente numa sequência, pelo menos, 75% idêntica à SEQ ID N°:8. A invenção refere-se, de um modo preferido, a um sinal de poliadenilação compreendendo um ácido nucleico consistindo de uma sequência, pelo menos, 75% idêntica à SEQ ID N°:8. A invenção refere-se adicionalmente a um sinal de poliadenilação compreendendo um ácido nucleico compreendendo SEQ ID N°:8.

Numa forma de realização adicional da presente invenção, o sinal de poliadenilação compreende uma sequência, pelo menos, 80%, 85%, 90%, 95% ou 98% idêntica à SEQ ID N°:8. Numa forma de realização específica, a invenção refere-se a um sinal de poliadenilação compreendendo um ácido nucleico compreendendo uma sequência, pelo menos, 85% idêntica à SEQ ID N°:8. Noutra forma de realização específica, a invenção refere-se a um sinal de poliadenilação compreendendo um ácido nucleico compreendendo uma sequência, pelo menos, 95% idêntica à SEQ ID N°:8.

Numa forma de realização preferida, o referido sinal de poliadenilação é isolado. Numa forma de realização preferida adicional, a invenção refere-se a um sinal de poliadenilação isolado compreendendo um ácido nucleico compreendendo uma sequência, pelo menos, 75% idêntica à SEQ ID N°:8. Noutra forma de realização preferida, a invenção refere-se a um sinal de poliadenilação isolado compreendendo um ácido nucleico 7 compreendendo uma sequência, pelo menos, 95% idêntica à SEQ ID N°:8. Ainda noutra forma de realização preferida, a invenção refere-se a um sinal de poliadenilação isolado compreendendo um ácido nucleico compreendendo SEQ ID N°:8.

De um modo preferido, a invenção refere-se a um ácido nucleico isolado cuja sequência compreenda SEQ ID N°:8.

Numa forma de realização preferida, o referido sinal de poliadenilação está operativamente ligado a uma sequência codificante heteróloga. Numa forma de realização especificamente preferida, o referido sinal de poliadenilação é caracterizado por os titulos/niveis de expressão obtidos com o referido sinal de poliadenilação serem, pelo menos, 10%, de um modo preferido, 20% e, de um modo muito preferido, 30% mais elevado do que aqueles obtidos para o sinal de poliadenilação de BGH. Numa forma de realização muito preferida são, pelo menos, e/ou em média 35% mais elevados do que aqueles obtidos para o sinal de poliadenilação de BGH. A invenção refere-se adicionalmente a uma sequência de ácido nucleico que compreende a SEQ ID N°:8 ligada operativamente a uma sequência codificante heteróloga. Alternativamente, a sequência consiste essencialmente da SEQ ID N°:8 ligada operativamente a uma sequência codificante heteróloga. De um modo preferido, a sequência consiste da SEQ ID N°:8 ligada operativamente a uma sequência codificante heteróloga. Uma sequência de ácido nucleico que compreenda SEQ ID N°:8 e tem função de terminação. De um modo preferido, o referido ácido nucleico tem função de terminação e está ligado operativamente a uma sequência codificante heteróloga. A invenção refere-se adicionalmente a um vector que compreende qualquer um dos sinais de poliadenilação ou sequências de ácido nucleico como acima descritos. Numa forma de realização especifica, os referidos sinais de poliadenilação estão ligados operativamente a uma unidade de expressão/cassete de expressão. Noutra forma de realização da invenção, o vector compreende o marcador de selecção e/ou amplificação di-hidrofolato redutase (DHFR), glutamina sintetase ou neomicina fosfatase (neo). Numa forma de realização preferida da presente invenção, o vector compreende um gene heterólogo de interesse codificando um produto heterólogo de interesse. De um modo preferido, o referido produto é um polipéptido. De um modo preferido, o referido polipéptido é um anticorpo, um fragmento de anticorpo ou uma proteína de fusão. A invenção refere-se adicionalmente a uma célula compreendendo qualquer um dos vectores como acima descritos. De um modo preferido, a célula compreende qualquer um dos sinais de poliadenilação como descritos acima, ligados operativamente a uma unidade de transcrição que codifica um produto de interesse. De um modo preferido, o referido produto de interesse é um nucleótido/ácido nucleico de interesse. Noutra forma de realização da célula, o referido produto de interesse é um polipéptido de interesse codificado por um gene de interesse. De um modo preferido, o referido polipéptido é um anticorpo, fragmento de anticorpo ou uma proteína de fusão.

Numa forma de realização específica, a referida célula é uma célula eucariótica, uma célula de mamífero, uma célula de hamster ou uma célula de murino. De um modo preferido, a referida célula é uma célula de hamster. De um modo mais preferido, a referida célula é célula de ovário de hamster Chinês (CHO). De um modo muito preferido, a referida célula é 9 uma célula DG44, CHO-Kl ou DUKX-B11 de CHO. Noutra forma de realização preferida, a referida célula é uma célula de NSO. Numa forma de realização preferida, as referidas células como descritas são células cultivadas. De um modo preferido, as referidas células são cultivadas em meio sem soro. De um modo preferido, as referidas células são cultivadas em cultura em suspensão. Noutra forma de realização preferida da presente invenção, a célula é caracterizada por os titulos/niveis de expressão obtidos com o referido sinal de poliadenilação serem, pelo menos, 10%, de um modo preferido, 20% e, de um modo muito preferido, 30% mais elevados do que aqueles obtidos para o sinal de poliadenilação de BGH. Numa forma de realização muito preferida são, pelo menos, e/ou em média 35% mais elevados do que aqueles obtidos para o sinal de poliadenilação de BGH. De um modo preferido, a referida célula tem níveis de expressão 35% mais elevados. A invenção refere-se adicionalmente a um método de produção de um polipéptido de interesse codificado por um gene de interesse, o método compreendendo: (a) proporcionar uma célula hospedeira compreendendo um vector como descrito acima ou proporcionar uma célula como descrita acima, (b) cultivar a referida célula, sob condições que permitem a proliferação das células e a expressão do gene de interesse, (c) recolher o polipéptido de interesse e (d) purificar o polipéptido de interesse.

Numa forma de realização especifica do referido método, a célula é uma célula eucariótica, uma célula de mamífero, uma célula de hamster ou uma célula de murino. De um modo preferido, a referida célula é uma célula de CHO, de um modo muito 10 preferido, uma célula DG44, CH0-K1 ou DUKX-B11 de CHO. Adicionalmente preferida é uma célula de NSO.

Numa forma de realização preferida do referido método, o polipéptido de interesse é uma proteína recombinante, de um modo preferido, um polipéptido excretado, de um modo mais preferido, uma proteína terapêutica. De um modo muito preferido, o polipéptido de interesse é um anticorpo, tais como um anticorpo monoclonal, policlonal, multiespecífico ou de cadeia simples, ou um seu fragmento, e. g., fragmentos Fab, Fab', F(ab')2, Fc e Fc', cadeias pesadas e leves de imunoglobulina e a sua região constante, variável ou hipervariável, assim como fragmentos Fv e Fd. Noutra forma de realização preferida do referido método, o polipéptido de interesse é uma proteína de fusão ou uma proteína estrutural. A invenção refere-se ainda a uma utilização da célula como descrita acima para o fabrico de proteínas. A invenção refere-se adicionalmente a uma utilização de qualquer um dos sinais de poliadenilação ou como descritos acima como um isolador.

Adicionalmente, a invenção refere-se a uma utilização de qualquer um dos sinais de poliadenilação como descritos acima para a criação de linhas de células hospedeiras melhoradas. A invenção refere-se especificamente a uma utilização de qualquer um dos sinais de poliadenilação descritos acima para utilização em terapia génica. A invenção refere-se ainda a um kit compreendendo qualquer um dos sinais de poliadenilação como descritos acima, um vector, 11 uma célula e um meio de cultura de células para cultivo da referida célula.

DESCRIÇÃO DAS FIGURAS

FIGURA 1: VECTORES DE EXPRESSÃO BÁSICOS A Figura 1 mostra esquematicamente as concepções dos vectores de expressão utilizados para a transfecção de células CHO-DG44. "P/E" significa uma unidade composta que contém o intensificador e o elemento promotor de CMV, "P" um elemento promotor e "1" um sinal de terminação para a transcrição, que é requerido para a poliadenilação do ARN mensageiro transcrito. Os sinais de poliadenilação "BGH", "SV40L" e "HGH" são sinais de terminação para a transcrição de derivados da região 3' não traduzida da hormona de crescimento bovino (SEQ ID N°:12), a região do gene tardio de SV40 (SEQ ID N°:ll) e 3' não traduzida da hormona de crescimento de hamster Chinês (SEQ ID N°:8), respectivamente. Estes sinais de poliadenilação são flanqueados por locais de enzimas de restrição para "SfiI" e "Xbal". A posição e sentido da iniciação da transcrição dentro de cada unidade da transcrição são indicados por uma seta. Para clonagem do gene de interesse, uma região da sequência com múltiplos locais de corte para endonucleases de restrição (locais múltiplos de clonagem - "mcs") é introduzida após o elemento promotor/intensificador. 0 marcador seleccionável amplificável di-hidrofolato redutase é abreviado "dhfr" e o marcador seleccionável neomicina fosfotransferase é abreviado "npt". 12

FIGURA 2: REGIÃO ISOLADA DO GENE DA HORMONA DE CRESCIMENTO DE CRICETUS GRISEUS A Figura 2 mostra a sequência nucleotídica da região do gene da hormona de crescimento que foi amplificada a partir de ADN genómico de CH0-DG44 (linha da células de Ovário de Hamster Chinês; Cricetus griseus) utilizando PCR interna com um total de 362 pb (SEQ ID N°: 7) . A seta indica o sentido, comprimento e posição do iniciador GH for2 específico de gene utilizado na reacção de amplificação, estando a própria sequência do iniciador destacada em itálico (SEQ ID N°:2). O codão de terminação TAG da sequência do gene da hormona de crescimento está destacado por letras em negrito sublinhadas e é seguido por 324 pb da região 3' não traduzida.

FIGURA 3: ALINHAMENTO DE REGIÕES 3' NAO TRADUZIDAS DE GENES DA HORMONA DE CRESCIMENTO

Neste alinhamento, a região 3' não traduzida isolada da hormona de crescimento de Cricetus griseus (SEQ ID N°:8) é comparada com a região 3' não traduzida da hormona de crescimento do hamster sírio Mesocricetus auratus (Genbank S66299), Mus musculus (Genbank Z46663), Rattus norvegicus (Genbank V01239) e Bos taurus (Genbank J00008). As zonas sombreadas indicam nucleótidos que diferem da sequência de C. griseus. 13

FIGURA 4: DERIVADOS COM DELEÇÃO DE HGH DA REGIÃO 3' NÃO TRADUZIDA DA HORMONA DE CRESCIMENTO DE CRICETUS GRISEUS

Neste alinhamento são mostrados derivados de deleção da sequência da hormona de crescimento (HGH) de Cricetus griseus de 362 nucleótidos (SEQ ID N°:7) contendo apenas a região 3' não traduzida. Todos os derivados têm uma extremidade 5' idêntica e diferem na sua extremidade 3'. 0 derivado mais longo com SEQ ID N°:8 consiste de 324 nucleótidos. A SEQ ID N°:9 consiste de 189 nucleótidos e a SEQ ID N°:10 apenas 113 nucleótidos. 0 codão de terminação TAG da sequência do gene da hormona de crescimento está destacada por letras em negrito sublinhadas e o potencial local de ligação para o complexo proteico de poliadenilação AATAAA é destacado em itálico.

FIGURA 5: VECTORES DE EXPRESSÃO RECOMBINANTES PARA AVALIAÇÃO DO DESEMPENHO DE HGH

Todos os vectores de expressão recombinantes codificam o gene de interesse "sICAM" sob controlo do intensificador e elemento promotor de CMV ("P/E"). A transcrição de sICAM é terminada pela região 3' não traduzida da hormona de crescimento bovino "BGH" (SEQ ID N°:12), a região do gene tardio de SV40 "SV40L" (SEQ ID N°:ll) ou a região 3' não traduzida da hormona de crescimento de hamster Chinês "HGH" (SEQ ID N°:8, SEQ ID N°:9, SEQ ID N°:10) . É indicado o tamanho dos últimos em pares de bases. Estes sinais de poliadenilação são flanqueados por locais de enzimas de restrição "Sfil" e "XbaI". "P" indica um elemento promotor e "T" um sinal de terminação para a transcrição. A posição e o sentido de iniciação da transcrição dentro de cada unidade de transcrição são indicados por uma 14 seta. 0 marcador seleccionável amplificável di-hidrofolato redutase é abreviado como "dhfr".

FIGURA 6: AVALIAÇÃO DO DESEMPENHO DE HGH EM TRANSFECÇÕES TRANSIENTES

Em duas séries independentes, células CHO-DG44 são transfectadas com vectores de expressão pJR106, pJRUO e pJR131, todos os quais codificam sICAM sob o intensificador/promotor de CMV. Para terminação da transcrição é utilizado o sinal de poliadenilação tardio de SV40 (SEQ ID N°:ll), a região 3' região não traduzida da hormona de crescimento bovino BGH (SEQ ID N°:12) ou a região 3' não traduzida da hormona de crescimento de hamster Chinês HGH (SEQ ID N°:8). Após um período de 48 horas, os títulos de sICAM nos sobrenadantes são determinados utilizando ELISA. Para corrigir em termos de eficiência de transfecção, as células são co-transfectadas com plasmídeo pCMV-SEAP e a actividade de SEAP é medida. Utilizando HGH como sinal de poliadenilação, o título é aumentado até 21% comparativamente à terminação com BGH e até 40% comparativamente à terminação com tardio de SV40.

FIGURA 7: AVALIAÇAO DO DESEMPENHO DE HGH NA EXPRESSÃO TRANSIENTE DE UM ANTICORPO IgG4/KAPA Células CHO-DG44 são co-transfectadas com a combinação de vectores pBID/IgG4 e pBIN/kapa (n=6) em que a transcrição da cadeia pesada (IgG4) e leve (kapa) do anticorpo é terminada pela região 3' não traduzida de 324 pb da hormona de crescimento de hamster Chinês HGH (SEQ ID N°:8). Como um controlo, células CHO-DG44 são co-transfectadas com a combinação de vectores 15 pBID-B/IgG4 e pBIN-B/kapa (n=6) que contém o sinal de poliadenilação de BGH (SEQ ID N°:12). Exceptuando as diferentes sequências de poliadenilação, o sistema genético dos vários vectores é idêntico. Após um período de 48 horas, os títulos de anticorpo nos sobrenadantes são determinados utilizando ELISA. Para corrigir em termos de eficiência de transfecção, as células são co-transfectadas com o plasmídeo pCMV-SEAP e a actividade de SEAP é medida. Utilizando HGH como sinal de poliadenilação, os títulos são em média 35% mais elevados do que para sinais de poliadenilação de BGH.

FIGURA 8: TESTE DE DIFERENTES VARIANTES DE DELEÇAO DE HGH EM TRANSFECÇÕES TRANSIENTES

Em duas séries independentes, células CHO-DG44 são transfectadas com vectores de expressão pJR131, pJR134 e pJR135, todos os quais codificam sICAM sob o intensificador/promotor de CMV. Para terminação da transcrição, são utilizadas 324 pb (SEQ ID N° : 8) , 189 pb (SEQ ID N°:9) ou 113 pb (SEQ ID N°:10) da região 3' não traduzida da hormona de crescimento de hamster Chinês HGH. Todos as variantes têm uma extremidade 5' idêntica, mas diferem na sua extremidade 3' . Exceptuando as diferentes sequências de poliadenilação, o sistema genético dos vários vectores é idêntico. 48 horas após as transfecções, os títulos de sICAM nos sobrenadantes são determinados utilizando ELISA. Para corrigir em termos de eficiência de transfecção, células são co-transfectadas com o plasmídeo pCMV-SEAP e a actividade de SEAP é medida. Comparativamente a células transfectadas com vectores contendo a sequência de HGH de 324 pb, células transfectadas com vectores contendo as variantes de deleção de HGH de 189 pb os 113 pb, mostram uma redução nos níveis de expressão de sICAM de 23% e 78%, respectivamente. 16

FIGURA 9: EXPRESSÃO DA PROTEÍNA DO NÍVEL ELEVADO EM

TRANSFECTED ESTÁVEL CÉLULA UTILIZANDO HGH

Na Figura 9 são resumidas as produtividades especificas e os títulos de agrupamentos celulares ou clones celulares de células CHO-DG44 estavelmente transfectadas que expressam anticorpos IgGl, IgG2 e IgG4 ou proteínas de fusão de IgGl e IgG2 Fc nos processos descontínuos realizados em biorreactores ou balões de agitação. As produtividades específicas são na gama de 10-45 pg/célula/dia e os títulos são na gama de 2,1-6,3 g/L. O sistema genético dos vectores utilizados para expressão das várias proteínas é idêntico. Todos contêm a região 3' não traduzida de 324 pb da hormona de crescimento de hamster Chinês (ID N°:8) como sinal de poliadenilação para terminar a transcrição do gene de interesse. 2 dias após transfecção, foram seleccionados agrupamentos de células estáveis utilizando uma selecção baseada em DHFR e NPT, seguida por 2 passos sucessivos de amplificação génica mediada por DHFR por adição de 100 nM e 800 nM de MTX ao meio de cultura. Foram obtidos clones de célula isolada através de clonagem por diluição ou uma deposição baseada em FACS de células isoladas em poços de uma placa de 96 poços.

DESCRIÇÃO DETALHADA DA INVENÇÃO

Os termos gerais "compreendendo" ou "compreendido" abrangem os termos mais específicos "consistindo". Além disso, as formas singulares e plurais não são utilizadas de um modo limitativo. A presente invenção proporciona novos elementos reguladores e métodos novos de preparação e selecção de linhas celulares de mamífero que permitem uma expressão elevada de produtos génicos 17 heterólogos, de um modo preferido, polipéptidos ou proteínas com relevância como medicamentos biológicos. Os processos de acordo com a invenção são baseados principalmente na utilização de novos sinais de poliadenilação isolados da hormona de crescimento de hamster Chinês (Cricetus griseus). Surpreendentemente, verificou-se gue este sinal de poliadenilação recentemente identificado, denominado HGH (SEQ ID N°:8), supera os fortes sinais de poliadenilação de BGH e tardio SV40 que conduzem a uma produtividade mais elevada de células produtoras.

As expressões utilizadas ao longo da presente invenção têm o seguinte significado.

As expressões "sinal de poliadenilação", "local de poliadenilação", "sinal poli A", "local poli A" ou "sinal de terminação" ou "terminação" referem-se a sequências nucleotídicas dentro das 3yUTR que direccionam a ligação de um complexo proteico de poliadenilação a uma sequência AAUAAA dentro da sequência de sinal. 0 complexo contém uma endonuclease que corta o ARNm cerca de 14 a 30 nucleótidos a jusante da sequência AAUAAA e uma polimerase que incorpora pós-transcripcionalmente um conjunto de aproximadamente 100 a 200 nucleótidos de adenina (cauda poli A) na extremidade 3' clivada. Pensa-se que a cauda poli A influencie muitos aspectos do metabolismo do ARNm, incluindo estabilidade, eficiência de tradução e transporte do núcleo para o citoplasma. Tipicamente, o sinal de poliadenilação consiste em dois elementos de reconhecimento que flanqueiam o local de clivagem e poliadenilação: uma sequência AAUAAA altamente conservada aproximadamente 14 a 30 nucleótidos a montante do local de clivagem e uma região rica em G/U ou U pouco conservada aproximadamente 20 a 50 nucleótidos a jusante da sequência 18 AAUAAA. A clivagem entre estes dois elementos é geralmente no lado 3' de um resíduo de A. São conhecidos vários sinais de poliadenilação, tais como poli A tk (Cole et al., Mol. Cell Biol., 5 , 2104-2113, 1985), tardio de SV40 (Schek et al., Mol.

Cell Biol. 12, 5386-5393, 1992) e poli A precoce ou poli A de BGH (descritos, por exemplo, na Pat. U.S. N° 5122458).

Embora no sinal de poliadenilação a sequência AAUAAA descrita acima seja preferida, pode ser substituída por outras sequências hexanucleotídicas com homologia para AAUAAA, desde que sejam capazes de sinalizar a poliadenilação de ARNm. Os exemplos de sequências hexanucleotídicas homólogas incluem AAAAAA, AUUAAA, AAUAUA, AAUAAU, UAUAAA, AAUUAA, AAUAAG, AGUAAA, GAUAAA, AAUGAA, AAUAGA, AAGAAA, ACUAAA, CAUAAA, AAUCAA, AACAAA, AAUCAA e AAUAAC. Deste modo, numa forma de realização, o sinal de poliadenilação HGH compreende uma sequência hexanucleotídica seleccionada do grupo consistindo de AAAAAA, AUUAAA, AAUAUA, AAUAAU, UAUAAA, AAUUAA, AAUAAG, AGUAAA, GAUAAA, AAUGAA, AAUAGA, AAGAAA, ACUAAA, CAUAAA, AAUCAA, AACAAA, AAUCAA e AAUAAC, em vez da presente AAUAAA desde que estes hexanucleótidos sejam capazes de sinalizar a poliadenilação de ARNm.

Os sinais de poliadenilação podem ser também utilizados como "isoladores" ou "sequências de isolamento". As sequências de isolamento são segmentos de ADN que bloqueiam interacções ou interferência de sequências génicas vizinhas. Por exemplo, os isoladores podem reduzir a leitura transcripcional a partir de um promotor de um gene vizinho ou promotores simulados em sequências nucleotídicas adjacentes. Ou bloqueiam a interacção de um intensificador num lado da sequência de isolamento com um promotor de um gene vizinho no outro lado da sequência de isolamento. A característica que define uma sequência de isolamento dentro do significado da presente invenção é a sua 19 capacidade para isolar ou proteger uma unidade de transcrição definida que está ligada operativamente a um elemento regulador, da influência de um elemento genético interferente a montante ou jusante. Para este objectivo a sequência de isolamento é colocada entre a (potencial) sequência genética interferente e a sequência reguladora da unidade de transcrição a ser isolada. A sequência de isolamento pode ser colocada em cada um ou em ambos os lados da unidade de transcrição em uma ou mais cópias. Numa forma de realização preferida da presente invenção, a sequência de isolamento é um sinal de poliadenilação. Numa forma de realização preferida desta invenção, a sequência de poliadenilação é a sequência de poliadenilação HGH. É também possível utilizar derivados funcionais da sequência de poliadenilação HGH, tais como subfragmentos ou subsequências, assim como mutantes/variantes funcionais da sequência completa ou os seus subfragmentos que foram modificados, por exemplo, através de substituição, inserção, adição e/ou deleção. Os subfragmentos ou subsequências correspondentes, mutantes ou variantes, são aqui também referidos adiante como "terminações modificadas" ou "derivado".

Uma "terminação modificada" ou "derivado" é um derivado funcional da SEQ ID N°:8, que inclui subfragmentos ou subsequências e mutantes/variantes funcionais e, de um modo preferido, conduz a níveis de expressão de um produto de interesse comparável a níveis de expressão obtidos com a sequência nucleotídica apresentada na SEQ ID N°:8. Uma terminação modificada provou ser útil para os objectivos da invenção se o nível de expressão de um gene repórter ligado operativamente for, pelo menos 60%, de um modo preferido, pelo menos 75%, de um modo mais preferido, pelo menos 90% e, de um modo muito preferido, pelo menos 100% do nível de expressão 20 obtido com a SEQ ID N°:8 num ensaio comparativo de gene repórter. São particularmente preferidas terminações modificadas que têm uma homologia de sequência mínima para a sequência SEQ ID N°:8 de tipo selvagem do sinal de poliadenilação da hormona de crescimento de hamster ou a sua sequência complementar de, pelo menos 75%, de um modo preferido, pelo menos 80%, de um modo preferido, pelo menos 85%, de um modo mais preferido, pelo menos 95% e, de um modo muito preferido, pelo menos 97% e conduz a níveis de expressão correspondentes num ensaio comparativo de gene repórter.

Num "ensaio de gene repórter" comparativo correspondente, os fragmentos de terminação a serem testados, incluindo a sequência de referência SEQ ID N°:8, são clonados a jusante de um gene repórter. Este gene repórter codifica, por exemplo, a luciferase, fosfatase alcalina excretada ou proteína verde fluorescente (GFP). Alternativamente, outros polipéptidos ou proteínas, por exemplo, um anticorpo ou sICAM, podem ser utilizados como genes repórter. Estas construções são introduzidas subsequentemente nas células de teste, e. g., CHO-DG44, por transfecção e a influência da terminação modificada em questão no nível de expressão do gene repórter é determinada, por exemplo, por medição do teor de proteína do gene repórter. Um teste correspondente é descrito nos exemplos 2, 3 e 4 da presente invenção.

Um sinal de poliadenilação HGH preferido é a sequência nucleotídica compreendendo a sequência da SEQ ID N°:8 ou sua subsequência compreendendo a sequência da SEQ ID N°:9. Em outras formas de realização, o sinal de poliadenilação é uma sequência nucleotídica que compreende ou consiste numa sequência nucleotídica com identidade ou homologia de sequência para SEQ ID N°:7, SEQ ID N°:8, SEQ ID N°:9 ou SEQ ID N°:10. Como aqui 21 utilizado, duas sequências tem identidade ou homologia de sequência quando as sequências nucleotidicas são homólogas ou idênticas em, pelo menos 75%, de um modo preferido, 80%, de um modo preferido, 85%, de um modo mais preferido, 90% e, de um modo ainda mais preferido, 95% ou mais. Existe também identidade substancial quando a sequência de ácido nucleico híbrida sob condições restringentes à cadeia complementar. Como aqui utilizada, a expressão "híbrida sob condições restringentes" descreve as condições para hibridação e lavagem que são conhecidas dos especialistas na técnica. Geralmente, as condições restringentes são seleccionadas como sendo cerca de 5-10 °C mais baixas do que o ponto térmico de fusão (Tm) para a sequência específica, a uma força iónica e pH. A Tm é a temperatura (sob força iónica, pH e concentração de ácidos nucleicos definidos) em que 50% das sondas complementares ao alvo hibridam com a sequência alvo no equilíbrio. As condições restringentes serão aquelas em que a concentração de sal é menos do que cerca de 1,0 M de ião sódio, tipicamente cerca de 0,01 a 1,0 M de concentração de ião sódio (ou outros sais) a pH 7,0 a 8,3 e a temperatura é, pelo menos, cerca de 30 °C para sondas curtas (e. g., 10 a cerca de 50 nucleótidos) e, pelo menos, cerca do 60 °C para sondas longas (e. g., maior do que cerca de 50 nucleótidos). Condições restringentes exemplificativas incluem hibridação a 60 a 65 °C num tampão de hibridação com 5xSSC e lavagem a 42 °C com 0,2xSSC/0,l% de SDS. Um sinal positivo de hibridação está, pelo menos, 2 vezes acima da hibridação de fundo. A sequência de poliadenilação da hormona de crescimento de hamster e terminações modificadas, as quais podem também incluir, por exemplo, sequências nucleotidicas de ocorrência natural mais a montante ou a jusante da sequência HGH isolada da SEQ ID N°:7 ou os seus fragmentos seleccionados, pode ser obtida 22 por um especialista com um conhecimento da sequência ou sequências homólogas utilizando vários métodos padrão conhecidos na técnica e um método adequado é também descrito na presente invenção no exemplo 1. Partindo da sequência descrita na SEQ ID N°: 7 pode ser seleccionado um fragmento adequado, por exemplo, uma sonda oligonucleotidica contendo a sequência desta fracção pode ser sintetizada quimicamente. Uma sonda deste tipo pode ser utilizada, por exemplo, para clonar o gene da hormona de crescimento de hamster ou a região 3' não traduzida ou outros seus fragmentos, por exemplo, através de hibridação a partir de uma biblioteca do genoma de hamster. Utilizando o ensaio do gene repórter descrito acima, o especialista está em posição para identificar fragmentos de terminação funcionais sem grande esforço e utilizá-los para os objectivos da presente invenção. A região 3' não traduzida ou os seus fragmentos especiais podem ser facilmente obtidos através de amplificação por PCR com iniciadores correspondentes a partir de ADN genómico ou uma biblioteca genómica. Os fragmentos da região 3' não traduzida podem também ser obtidos através de digestão limitada de exonuclease III a partir de fragmentos de ADN maiores. Tais moléculas de ADN podem também ser sintetizadas quimicamente ou produzidas a partir de fragmentos sintetizados quimicamente por ligação. Podem ser produzidos mutantes por deleção, inserção, adição e substituição através de mutagénese específica de local, técnicas de mutagénese baseada em PCR e/ou síntese química conhecida dos especialistas na técnica. De um modo preferido, um mutante é alterado até 3, 6, 10, 20 ou 50 pb de posições. De um modo preferido, um mutante é alterado em 6 pb de posições.

Uma abordagem semelhante como descrita na presente invenção, no exemplo 1, pode ser utilizada para isolar, por exemplo, os sinais de poliadenilação da hormona de crescimento de murganho, rato ou hamster sírio ou hormonas de crescimento de outras 23 espécies. 0 seu desempenho pode ser testado em ensaios de gene repórter como descritos nos exemplos 2, 3 ou 4 da presente invenção. Através de hibridação cruzada com sondas derivadas da sequência da hormona de crescimento de hamster, de um modo preferido, a partir da região 3' não traduzida, é também possível identificar e isolar sequências de terminação adequadas a partir de genes homólogos correspondentes de outras espécies, de um modo preferido, de mamíferos. As técnicas adequadas são conhecidas dos especialistas na técnica.

Os termos "homologia", "homólogo", "identidade", "idêntico", e as expressões "identidade de sequência" ou "sequência homóloga" são utilizadas indiscriminadamente. Os métodos para calcular "homologia" ou "identidade" são bem conhecidos na técnica. Para a comparação de sequências, tipicamente uma sequência actua como uma sequência de referência à qual sequências de teste são comparadas. As sequências são alinhadas para uma correspondência máxima. Podem ser introduzidas lacunas em qualquer das sequências de ácido nucleico na comparação para alinhamento óptimo. A percentagem de identidade entre duas sequências é uma função do número de posições idênticas partilhadas pelas sequências, tendo em consideração o número de lacunas e o comprimento de cada lacuna que tem que ser introduzida para alinhamento óptimo das duas sequências. A comparação de sequências e a determinação da percentagem de identidade entre duas sequências podem ser realizadas utilizando algoritmos matemáticos. Podem ser utilizados parâmetros de programa por defeito ou podem ser designados parâmetros alternativos. 0 algoritmo de comparação de sequências calcula depois a percentagem de identidade para a(s) sequência(s) de teste relativamente à sequência de referência, com base nos parâmetros de programa designados ou por defeito. Um exemplo de um algoritmo que é adequado para determinar a identidade é o algoritmo BLAST (Altschul et al., J. Mol. Biol. 215, 403-410, 1990; Gish et al., Nature Genetics 3, 266-272, 1993; Madden et al., Meth. Enzymol. 266, 131-141, 1996; Zhang et al. , Genome Res. 7, 649-656, 1997; Altschul et al., Nucleic Acids Res. 25, 3389-3402, 1997) . Outras implementações computorizadas de algoritmos de alinhamento são GAP, PILEUP, BESTFIT, FASTA e TFASTA no Wisconsin Genetics Software Package. Contudo, a percentagem de identidade pode também ser determinada por alinhamento manual e inspecção visual e cálculo.

Como aqui utilizado, o termo "vector" refere-se a construções de ocorrência natural ou geradas sinteticamente para incorporação, proliferação, expressão ou transmissão de ácidos nucleicos numa célula, e. g., plasmídeos, mini-círculos, fagemídeos, cosmídeos, cromossomas/mini-cromossomas artificiais, bacteriófagos, vírus, tais como baculovírus, retrovírus, adenovírus, vírus adeno-associados, vírus de Herpes simplex, bacteriófagos. Os métodos utilizados para construir vectores são bem conhecidos de um especialista na técnica e descritos em várias publicações. Em particular, técnicas para construir vectores adequados, incluindo uma descrição dos componentes funcionais e reguladores, tais como promotores, intensificadores, sinais de terminação e poliadenilação, marcadores de selecção, origens de replicação e sinais de splicing, são conhecidos do especialista na técnica. Os vectores de expressão eucarióticos conterão tipicamente também sequências procarióticas que facilitam a propagação do vector em bactérias, tais como uma origem de replicação e genes de resistência de antibióticos para selecção em bactérias. Uma variedade de vectores de expressão eucarióticos contendo um local de clonagem no qual um polinucleótido pode ser ligado operativamente, é bem conhecida na técnica e alguns estão disponíveis comercialmente a partir de empresas, tais como Stratagene, La Jolla, CA; 25

Invitrogen, Carlsbad, CA; Promega, Madison, WI ou BD Biosciences Clontech, Paio Alto, CA.

Uma forma de realização preferida da invenção são vectores ou sequências polinucleotídicas contendo uma ou mais unidades de transcrição que codificam genes de interesse que compreendem, pelo menos, um sinal de poliadenilação HGH para terminação e estabilização de transcrito e/ou como sequência de isolamento. Também preferidos de acordo com a invenção são vectores ou sequências polinucleotídicas compreendendo sinais de poliadenilação HGH para terminação e estabilização de transcrito e/ou como sequência de isolamento que, em vez de genes de interesse, têm apenas um local múltiplo de clonagem que permite a clonagem do gene de interesse através de sequências de reconhecimento para endonucleases de restrição. 0 termo "promotor" denota uma sequência polinucleotídica que permite e controla a transcrição dos genes ou sequências aí ligadas operativamente. Um promotor contém sequências de reconhecimento para ligação de ARN polimerase e o local de iniciação para transcrição (local de iniciação de transcrição). De modo a expressar uma sequência desejada num determinado tipo de célula ou célula hospedeira deve ser escolhido um promotor funcional adequado. Muitos promotores, incluindo promotores constitutivos, indutíveis e reprimíveis a partir de uma variedade de fontes diferentes, são bem conhecidos na técnica (e identificados em bases de dados, tal como GenBank) e estão disponíveis como elementos separados ou elementos clonados dentro de sequências polinucleotídicas a partir de fontes comerciais (e. g., repositórios, tal como ATCC, assim como outras fontes comerciais) ou fontes individuais. Nos promotores indutíveis a actividade do promotor pode ser aumentada ou reduzida em resposta a um sinal. Por exemplo, o promotor de 26 tetraciclina (tet) contendo a sequência do operador tetraciclina (tetO) pode ser induzido através de uma proteína transactivadora regulada por tetraciclina (tTA) . A ligação da tTA ao tetO é inibida na presença de tet. Os exemplos de outros promotores indutíveis são promotores jun, fos, metalotioneína e de choque térmico. Dos promotores que são particularmente adequados para expressão elevada em eucariotas, existe, por exemplo, o promotor de ubiquitina/S27a de hamster (documento WO 97/15664), o promotor precoce de SV40, o promotor tardio major de adenovírus, o promotor de metalotioneína-1 de murganho, a região de repetição terminal longa do vírus do sarcoma de Rous, o promotor precoce de citomegalovírus humano (CMV). Os exemplos de outros promotores heterólogos de mamífero são os promotores de actina, imunoglobulina ou de choque térmico.

Os promotores acima mencionados são bem conhecidos na técnica. Um promotor heterólogo correspondente pode ser funcionalmente ligado a outras sequências reguladoras de modo a aumentar/regular a actividade de transcrição numa cassete de expressão. Por exemplo, o promotor pode ser ligado funcionalmente a sequências intensificadoras de modo a aumentar a actividade transcripcional. Para isto, pode ser utilizado um ou mais intensificadores e/ou diversas cópias de uma sequência intensificadora, e. g., um intensificador de CMV ou SV40. Desta forma, um vector de expressão de acordo com a invenção, noutra forma de realização, contém uma ou mais sequências intensificadoras, de um modo preferido, um intensificador de CMV ou SV40. 0 termo "intensificador" denota uma sequência polinucleotídica que na posição cis actua na actividade de um promotor e estimula assim a transcrição de um gene ou sequência codificante funcionalmente ligada a este promotor. Ao contrário 27 dos promotores, o efeito dos intensificadores é independente da posição e orientação e podem, deste modo, ser posicionados à frente ou atrás de uma unidade de transcrição, dentro de um intrão ou mesmo dentro da região codificante. 0 intensificador pode ser localizado na vizinhança imediata da unidade de transcrição e a uma distância considerável do promotor. É também possivel ter uma sobreposição fisica e funcional com o promotor. 0 especialista estará ciente de um número de intensificadores a partir de várias fontes (e depositados em bancos de dados, tal como GenBank, e. g., intensificadores de SV40, intensificadores de CMV, intensificadores de polioma, intensificadores de adenovirus) que estão disponíveis como elementos independentes ou elementos clonados dentro de sequências polinucleotídicas (e. g., depositadas no ATCC ou a partir de fontes comerciais e individuais). Um número de sequências promotoras contém também sequências intensificadoras tal como o promotor de CMV frequentemente utilizado. 0 intensificador de CMV humano é um dos intensificadores mais fortes até agora identificados. Um exemplo de um intensificador indutível é o intensificador de metalotioneína, o qual pode ser estimulado por glucocorticóides ou metais pesados.

Os "elementos reguladores de transcrição" normalmente compreendem um promotor a montante da sequência génica a ser expressa, locais de iniciação e terminação de transcrição e um sinal de poliadenilação. A expressão "local de iniciação de transcrição" refere-se a um ácido nucleico na construção que corresponde ao primeiro ácido nucleico incorporado no transcrito primário, i. e., o precursor de ARNm. 0 local de iniciação de transcrição pode se sobrepor às sequências promotoras. 28 A expressão "local de terminação de transcrição" refere-se a uma sequência nucleotidica representada normalmente na extremidade 3' do gene de interesse ou do grupo de sequências a serem transcritas, que leva a ARN polimerase a terminar a transcrição.

Uma "unidade de transcrição", "unidade de expressão" ou "cassete de expressão" definem uma região dentro de um vector, construção ou sequência polinucleotidica que contém um ou mais genes a serem transcritos, em que os genes contidos dentro do segmento estão ligados operativamente entre si. São transcritos a partir de um único promotor e a transcrição é terminada através, pelo menos, de um sinal de poliadenilação. Como resultado, os diferentes genes estão ligados, pelo menos, transcripcionalmente. Mais de uma proteína ou produto pode ser transcrito e expresso a partir de cada unidade de transcrição (unidade de transcrição multicistrónica). Cada unidade de transcrição irá compreender os elementos reguladores necessários para a transcrição e tradução de qualquer uma das sequências seleccionadas que estão contidas dentro da unidade. E cada unidade de transcrição pode conter os mesmos ou diferentes elementos reguladores. Por exemplo, cada unidade de transcrição pode conter a mesma terminação. Elementos IRES ou intrões podem ser utilizados para a ligação funcional dos genes dentro de uma unidade de transcrição. Um vector ou sequência polinucleotídica podem conter mais de uma unidade de transcrição.

Os "elementos reguladores de tradução" compreendem um local de iniciação de tradução (AUG), um codão de terminação e um sinal poli A para que cada polipéptido individual a ser expresso. Um local interno de entrada de ribossoma (IRES) pode ser incluído em algumas construções. 0 IRES é definido abaixo. De modo a Optimizar a expressão que pode ser aconselhável 29 remover, adicionar ou alterar as regiões 5' e/ou 3' não traduzidas da sequência de ácido nucleico a ser expressa, para eliminar todos os potenciais codões de iniciação de tradução alternativos impróprios extra ou outras sequências que podem interferir ou reduzir a expressão, ao nível da transcrição ou tradução. Podem ser introduzidos locais de ligação a ribossoma de consenso (sequência de Kozak: GCCGCCACCAUGG (SEQ ID N°:13); AUG constitui o codão de iniciação) imediatamente a montante do codão de iniciação para aumentar a tradução e assim a expressão. Os teores aumentados de A/U em torno deste local de ligação ao ribossoma proporcionam uma ligação ao ribossoma mais eficiente. Para produzir um polipéptido excretado, o gene de interesse inclui geralmente uma sequência de sinal que codifica um péptido líder ou de sinal que direcciona o polipéptido acabado de sintetizar para e através da membrana de ER onde o polipéptido pode ser encaminhado para secreção. 0 péptido líder ou de sinal está frequentemente, mas não universalmente, no terminal amino de uma proteína excretada e é removido por clivagem através de peptidases de sinal, após a proteína cruzar a membrana de ER. A sequência génica irá geralmente, mas não necessariamente, conter a sua própria sequência de péptido de sinal. No caso em que a sequência nativa do péptido de sinal está ausente, uma sequência heteróloga de péptido de sinal pode ser fundida à sequência seleccionada. Ou a sequência nativa de péptido de sinal pode ser substituída por uma heteróloga. São conhecidas numerosas sequências de péptido de sinal pelo especialista e estão depositadas em bancos de dados de sequências, tais como GenBank e EMBL.

Um "local interno de entrada do ribossoma" ou "IRES" descreve uma sequência que promove funcionalmente a iniciação da tradução independente a partir do gene 5' do IRES e permite que dois cistrões (grelhas de leitura aberta) sejam traduzidos a 30 partir de um único transcrito numa célula animal. 0 IRES proporciona um local independente da entrada do ribossoma para tradução da grelha de leitura aberta imediatamente a jusante dela. Ao contrário do ARNm bacteriano que pode ser policistrónico, i. e., codifica diversos polipéptidos diferentes que são traduzidos sequencialmente a partir dos ARNm, a maioria dos ARNm de células animais é monocistrónico e codificam para a sintese de apenas um polipéptido. Com um transcrito policistrónico numa célula eucariótica, a tradução iniciaria a partir do local de iniciação de tradução mais a 5', terminaria no primeiro codão de terminação e o transcrito seria libertado a partir do ribossoma, resultando na tradução de apenas o primeiro polipéptido codificado no ARNm. Numa célula eucariótica, um transcrito policistrónico que tem um IRES ligado operativamente à segunda ou subsequente grelha de leitura aberta no transcrito permite a tradução sequencial dessa grelha de leitura aberta a jusante para produzir os dois ou mais polipéptidos codificados pelo mesmo transcrito. 0 IRES pode ter vários comprimentos e de várias fontes, e. g., virus da encefalomiocardite (EMCVj, picornavirus (e. g., FMDV) , virus da poliomielite (PV) ou virus da hepatite C (HCV). Várias sequências de IRES e a sua utilização na construção de vector foram descritas e são bem conhecidas na técnica. A sequência codificante a jusante está ligada operativamente à extremidade 3' do IRES a qualquer distância que não irá afectar negativamente a expressão do gene a jusante. A distância óptima ou permissível entre o IRES e o inicio do gene a jusante pode ser prontamente determinada por variação da distância e medição da expressão em função da distância.

Como aqui utilizado, o termo "intrão", refere-se a uma sequência de ácido nucleico não codificante de comprimento variável, normalmente presente dentro de muitos genes 31 eucarióticos, o qual é removido de um precursor de ARNm recentemente transcrito pelo processo de splicing para o qual são necessárias sequências altamente conservadas nas extremidades do intrão ou perto delas. Em geral, o processo de splicing requer que as extremidades 5' e 3' do intrão sejam correctamente clivadas e as extremidades resultantes do ARNm sejam fielmente ligadas, de modo que seja produzida um ARNm maduro que tem a grelha de leitura apropriada para a síntese proteica. Muitos locais aceitadores de splice e doadores de splice, significando as sequências que imediatamente cercam os limites exão-intrão e intrão-exão, foram caracterizados e descritos e são conhecidos do especialista.

Como aqui utilizadas, as expressões "gene de interesse", "sequência desejada", "polinucleótido de interesse" ou "gene desejado" têm o mesmo significado e referem-se a uma sequência polinucleotídica de qualquer comprimento que codifica um produto de interesse. A sequência seleccionada pode ser um gene truncado ou de tamanho total, uma fusão ou gene marcado, e pode ser um ADNc, um ADN genómico ou um fragmento de ADN. Pode ser a sequência nativa, i. e., forma(s) de ocorrência natural ou pode ser mutado ou, caso contrário, modificado como desejado. Estas modificações incluem optimizações de codão para optimizar a utilização de codão na célula hospedeira seleccionada, humanização ou marcação. Além disso, podem incluir remoções ou adições de locais de actuação cis, tais como doador de splice (críptico), locais aceitadores e pontos de ramificação, sinais de poliadenilação, caixas TATA, locais chi, locais de entrada ribossomal, sequências de repetição, estruturas secundárias (e. g., haste em ansa), locais de ligação para factores de transcrição ou outros factores reguladores, locais de enzima de restrição, etc., para dizer apenas alguns exemplos, mas não limitativos. A sequência seleccionada pode codificar um 32 polipéptido excretado, citoplasmático, nuclear, ligado a membrana ou superfície celular.

Dentro do âmbito da presente descrição, as expressões "ligação funcional", "ligado funcionalmente" ou "ligado operativamente" significam que duas ou mais sequências de ácidos nucleicos ou elementos de sequência estão posicionados de um modo que lhes permite funcionar do seu modo pretendido. Por exemplo, um promotor/intensificador ou terminação está ligado funcionalmente a uma sequência génica codificante se for capaz de controlar ou modular a transcrição da sequência génica ligada na posição cis. Geralmente, mas não necessariamente, as sequências de ADN que estão ligadas funcionalmente são contíguas e, sempre que necessário, para juntar duas regiões codificantes de polipéptido ou, no caso de um péptido de sinal de secreção, contíguas e em grelha de leitura. Contudo, embora um promotor ligado operativamente esteja geralmente localizado a montante ou uma terminação ligada operativamente esteja geralmente localizada a jusante da sequência codificante, não está necessariamente contígua a esta. Os intensificadores não têm que ser contíguos desde que aumentem a transcrição da sequência codificante. Para isto podem estar localizadas a montante ou a jusante da sequência codificante e mesmo a alguma distância. Um local de poliadenilação está ligado operativamente a uma sequência codificante se estiver localizado na extremidade 3' da sequência codificante de um modo que a transcrição prossiga através da sequência codificante para o sinal de poliadenilação. A ligação é realizada por métodos recombinantes conhecidos na técnica, e. g., utilizando metodologia de PCR, por ligação de locais de restrição adequados ou por emparelhamento. Podem ser utilizados ligantes ou adaptadores oligonucleotídicos sintéticos de acordo com prática convencional, se não estiverem presentes locais de restrição adequados. 33

Como aqui utilizadas, as expressões "ácido nucleico", "sequência de ácido nucleico", "sequência nucleotídica", "polinucleótido", "sequência polinucleotídica" ou "sequência de ADN", referem-se a um oliqonucleótido, nucleótido ou polinucleótido e os seus fragmentos e porções e ADN ou ARN de origem genómica ou sintética, as quais podem ser de cadeia simples ou dupla e representar a cadeia de sentido ou antissentido. A sequência pode ser uma sequência não codificante, uma sequência codificante ou uma mistura de ambos. As sequências de ácido nucleico da presente invenção podem ser preparadas utilizando técnicas convencionais bem conhecidas de um especialista na técnica. A expressão "que codifica" ou o termo "codificante" refere-se à propriedade inerente de sequências especificas de nucleótidos num ácido nucleico, tais como um gene em cromossoma ou ARNm, para servir como moldes para a síntese de outros polímeros e macromoléculas em processos biológicos que têm uma sequência definida de nucleótidos (i. e., ARNr, ARNt, outras moléculas de ARN) ou aminoácidos e as propriedades biológicas daí resultantes. Desta forma, um gene codifica para uma proteína se a proteína desejada for produzida numa célula ou outro sistema biológico por transcrição e tradução subsequente do ARNm. A cadeia codificante, a sequência nucleotídica que é idêntica à sequência de ARNm e é geralmente proporcionada em listagens de sequência de bancos de dados, e. g., EMBL ou GenBank, e a cadeia não codificante, utilizada como molde para a transcrição, de um gene ou ADNc podem ser referidas como codificantes da proteína ou outro produto desse gene ou ADNc. Um ácido nucleico que codifica uma proteína inclui quaisquer ácidos nucleicos que têm diferentes sequências nucleotídicas mas codificam a mesma sequência de aminoácidos da proteína devido à degenerescência do código genético. Os ácidos nucleicos e as 34 sequências nucleotídicas que codificam proteínas podem incluir intrões. Na Listagem de Sequências, as sequências são apresentadas como sequência de ADN em vez de ARN. Por exemplo, quando apresentado como ADN, o codão de iniciação é apresentado como ATG em vez de AUG. 0 termo "ADNc", no contexto desta invenção, refere-se a ácidos desoxirribonucleicos produzidos por transcrição reversa e tipicamente síntese da segunda cadeia de ARNm ou outro ARN produzido por um gene. Se de dupla cadeia, uma molécula de ADNc tem uma cadeia codificante ou de sentido e uma não codificante ou antissentido.

Como aqui utilizado, o termo "expressão" refere-se à transcrição e/ou tradução de uma sequência de ácido nucleico heterólogo dentro de uma célula hospedeira. 0 nível de expressão de um produto desejado numa célula hospedeira pode ser determinado com base na quantidade de ARN ou ARNm correspondente que está presente na célula, ou a quantidade do polipéptido desejado codificado pela sequência seleccionada. Por exemplo, o ARNm transcrito a partir de uma sequência seleccionada pode ser quantificado por hibridação de transferência de Northern, protecção de ARN de ribonuclease, hibridação in situ a ARN celular ou por PCR. As proteínas codificadas por uma sequência seleccionada podem ser quantificadas por vários métodos, e. g., por ELISA, por transferência de Western, por radioimunoensaios, por imunoprecipitação, por ensaio da actividade biológica da proteína, ou por imunocoloração proteína seguida por análise de FACS por PCR. 0 termo "polipéptido" é utilizado indiscriminadamente com "sequência de resíduos de aminoácidos" ou o termo "proteína" e refere-se a polímeros de aminoácidos de qualquer comprimento. 35

Estes termos incluem também proteínas que são modificadas pós-tradução através de reacções que incluem, mas não estão limitadas a glicosilação, glicação, acetilação, fosforilação, oxidação, amidação ou processamento proteico. Modificações e alterações, por exemplo, fusões a outras proteínas, substituições, deleções ou inserções de sequências de aminoácidos, podem ser feitas na estrutura de um polipéptido enquanto a molécula mantiver a sua actividade funcional biológica. Por exemplo, determinadas substituições de sequências de aminoácidos podem ser feitas num polipéptido ou na sua sequência codificante de ácidos nucleicos subjacente e uma proteína pode ser obtida com propriedades semelhantes. As modificações de aminoácidos podem ser preparadas, por exemplo, através de realização de mutagénese específica de local ou mutagénese mediada por reacção em cadeia da polimerase na sua sequência de ácidos nucleicos subjacente. 0 termo "polipéptido" inclui assim também, por exemplo, proteínas de fusão consistindo de um componente de imunoglobulina, e. g., o componente Fc, e um factor de crescimento, e. g., um interleucina.

Como aqui utilizado, o termo "anticorpo" inclui um anticorpo policlonal, monoclonal, bi-específico, multi-específico, humano, humanizado ou quimérico, anticorpo de cadeia simples, fragmento de ligação a antigénio de um anticorpo (e. g., um fragmento Fab ou F(ab')2), um Fv ligado por bissulfureto, etc. Tais anticorpos podem ser produzidos através de síntese química, por meios recombinantes ou transgénicos, por cultura de células (e. g., hibridoma) ou através de outros meios.

Os fragmentos Fab (fragmento de ligação a antigénio = Fab) consistem em regiões variáveis de ambas as cadeias que são mantidas, em conjunto, pela região constante adjacente. Estes podem ser formados por digestão com protease, e. g., com 36 papaína, a partir de anticorpos convencionais, mas fragmentos Fab semelhantes podem também ser entretanto produzidos por engenharia genética. Fragmentos de anticorpo adicionais incluem fragmentos F(ab')2, que podem ser preparados por clivagem proteolitica com pepsina.

Utilizando métodos de engenharia genética é possível produzir fragmentos de anticorpo encurtados que consistem apenas das regiões variáveis da cadeia pesada (VH) e da cadeia leve (VL) . Estes são referidos como fragmentos Fv (Fragmento variável = fragmento da parte variável). Uma vez que estes fragmentos Fv carecem da ligação covalente das duas cadeias pelas cisteínas das cadeias constantes, os fragmentos Fv são frequentemente estabilizados. É vantajoso ligar as regiões variáveis da cadeia pesada e leve através de um curto fragmento peptídico, e. g., de 10 a 30 aminoácidos, de um modo preferido, 15 aminoácidos. Deste modo, é obtida uma cadeia peptídica simples consistindo de VH e VL, ligadas por um ligante peptídico. Uma proteína de anticorpo deste tipo é conhecida como um Fv de cadeia simples (scFv). Exemplos de proteínas de anticorpo scFv deste tipo são conhecidos da técnica anterior.

Nos últimos anos, foram desenvolvidas várias estratégias para preparar scFv como um derivado multimérico. Isto é pretendido para conduzir, em particular, a anticorpos recombinantes com propriedades farmacocinéticas e de biodistribuição melhoradas, assim como com avidez de ligação aumentada. De modo a conseguir multimerização de scFv, os scFv foram preparados como proteínas de fusão com domínios de multimerização. Os domínios de multimerização podem ser, e. g., a região CH3 de uma IgG ou estrutura de hélices enroladas (estruturas de hélice) como domínios de fecho de Leucina. Contudo, existem também estratégias em que a interacção entre as 37 regiões VH/VL do scFv é utilizada para multimerização (e. g., dia-, tri- e penta-corpos). Por diacorpo o especialista entende um derivado scFv bivalente homodimérico. 0 encurtamento do

Ligante numa molécula de scFv para 5-10 aminoácidos conduz à formação de homodímeros em que ocorre uma superimposição inter-cadeia VH/VL. Os diacorpos podem adicionalmente ser estabilizados através da incorporação de pontes bissulfureto. Exemplos de proteínas diacorpo-anticorpo são conhecidos da técnica anterior.

Por minicorpo o especialista entende um derivado de scFv homodimérico bivalente. Consiste de uma proteína de fusão que contém a região CH3 de uma imunoglobulina, de um modo preferido, IgG, de um modo muito preferido, IgGl como a região de dimerização que é ligada ao scFv através de uma Região de Charneira (e. g., também de IgGl) e uma região Ligante. Exemplos de proteínas minicorpo-anticorpo são conhecidos da técnica anterior.

Por triacorpo o especialista entende: um derivado de scFv homotrimérico trivalente. Os derivados de ScFv em que VH-VL estão fundidos directamente sem uma sequência ligante conduzem à formação de trímeros. O especialista estará também familiarizado com os denominados mini-anticorpos que têm uma estrutura bi-, tri- ou tetravalente e são derivados de scFv. A multimerização é realizada através de estruturas de hélice enrolada bi-, tri- ou tetraméricas. Numa forma de realização preferida da presente invenção, o gene de interesse é codificado para qualquer um desses polipéptidos desejados mencionados acima, de um modo preferido, para um anticorpo monoclonal, um seu derivado ou fragmento. 38 "proteína de interesse" ou 0 "polipéptido de interesse", "produto de interesse" inclui proteínas, polipéptidos, seus fragmentos, péptidos, proteínas de fusão, todos os quais podem ser expressos na célula hospedeira seleccionada. As proteínas desejadas podem ser, por exemplo, anticorpos, enzimas, citocinas, linfocinas, moléculas de adesão, receptores e seus derivados ou fragmentos, e quaisquer outros polipéptidos que podem servir como agonistas ou antagonistas e/ou que têm utilização terapêutica ou diagnóstica.

Especialmente, as proteínas/polipéptidos desejados ou proteínas de interesse são, por exemplo, mas não limitados a, insulina, factor de crescimento de tipo insulina, hGH, tPA, citocinas, tais como interleucinas (IL), e. g., IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, interferão alfa (IFN), IFN beta, IFN gama, IFN omega ou IFN tau, factor de necrose tumoral (TNF) , tais como TNF alfa e TNF beta, TNF gama, TRAIL; G-CSF, GM-CSF, M-CSF, MCP-1, VEGF e nanocorpos. Está também incluída a produção do eritropoietina ou quaisquer outros factores de crescimento hormonal e quaisquer outros polipéptidos que podem servir como agonistas ou antagonistas e/ou têm utilização terapêutica ou diagnóstica. 0 método de acordo com o invenção pode também ser vantajosamente utilizado para a produção de anticorpos, tais como anticorpos monoclonais, policlonais, multiespecíficos e de cadeia simples, ou os seus fragmentos, e. g., Fab, Fab' , F(ab')2, fragmentos Fc e Fc', cadeias pesadas e leves de imunoglobulina e a sua região constante, variável ou hipervariável, assim como fragmentos Fv e

Fd. 39 0 "produto de interesse" pode também ser um ARN antissentido, ARNt, ARNr, outros ARN que fazem parte de riboproteínas ou outros ARN reguladores. 0 método da presente invenção pode ser realizado em todas as células eucarióticas. As células e linhas celulares podem estar presentes, e. g., numa cultura de células e incluem, mas não estão limitadas, a células eucarióticas, tais como células de levedura, planta, insecto ou mamífero. Por exemplo, as células podem ser oócitos, excepto oócitos humanos, células estaminais embrionárias, células estaminais hematopoiéticas ou qualquer tipo de células diferenciadas. É preferido um método em que a célula eucariótica é uma célula de mamífero. Mais preferido é um método em que a célula de mamífero é uma célula humana, de símio, de murino, de rato, coelho, hamster, cabra, bovino, carneiro ou porco. As linhas celulares ou "células hospedeiras" preferidas para a produção de medicamentos biológicos são linhas celulares de humano, murganho, rato, macaco ou de roedor. Mais preferidas são células de hamster, de um modo preferido, células BHK21, BHK TKf, CHO, CH0-K1, CHO-DUKX, CHO-DUKX Bl, CHO-S e CHO-DG44 ou os derivados/progenias de qualquer um de tais linhas celulares. São particularmente preferidas células CHO-DG44, CHO-DUKX, CH0-K1, CHO-S e BHK21 e, ainda mais preferidas, CHO-DG44 e CHO-DUKX. Além disso, as células de mieloma de murino, de um modo preferido, células NSO e Sp2/0 ou derivados/progenias de qualquer uma de tais linhas celulares são também conhecidas como linhas celulares produtivas para proteínas biofarmacêuticas. Exemplos de células de murino e hamster que podem ser utilizadas no significado desta invenção são resumidos na Tabela 1. 40 TABELA 1: Linhas celulares eucarióticas produtivas LINHA CELULAR NÚMERO DE ENCOMENDA NSO ECACC N° 85110503 Sp2/0-Agl4 ATCC CRL-1581 BHK21 ATCC CCL-10 ΒΗΚ ΤΚΓ ECACC N° 85011423 HaK ATCC CCL-15 2254-62.2 (derivada de BHK-21) ATCC CRL-8544 CHO ECACC N° 8505302 CHO tipo selvagem ECACC 00102307 CHO-K1 ATCC CCL-61 CHO-DUKX (=CHO duk~, CHO/dhfr~) ATCC CRL-9096 CHO-DUKX BI1 ATCC CRL-9010 CHO-DG4 4 Urlaub et al., Cell 33(2), 405-412, 1983 CHO PRO-5 ATCC CRL-1781 CHO-S Invitrogen Cat N° 10743-029 Lecl3 Stanley P. et al., Ann. Rev. Genetics 18, 525-552, 1984 V79 ATCC CCC-93 B14AF28-G3 ATCC CCL-14 HEK 293 ATCC CRL-1573 COS-7 ATCC CRL-1651 U2 6 6 ATCC TIB-196 HuNSI ATCC CRL-8644 Per.C6 Fallaux, F.J. et al., Human Gene Therapy 9(13), 1909-1917, 1998 CHL ECACC N° 87111906 41

As células hospedeiras são mais preferidas, quando estão estabelecidas, adaptadas e totalmente cultivadas sob condições sem soro e opcionalmente em meios que estão livres de qualquer proteina/péptido de origem animal. Os meios comercialmente disponíveis, tais como F12 de Ham (Sigma, Deisenhofen, Alemanha), RPMI-1640 (Sigma), meio de Eagle modificado por Dulbecco (DMEM; Sigma), Meio Essencial Mínimo (MEM; Sigma), meio de Dulbecco modificado por Iscove (IMDM; Sigma), CD-CHO (Invitrogen, Carlsbad, CA), CHO-S-SFMII (Invtirogen), meio CHO sem soro (Sigma), meio CHO sem proteína (Sigma), meios EX-CELL (SAFC), CDM4CHO e SFM4CH0 (HyClone) são soluções nutrientes apropriadas exemplificativas. Quaisquer dos meios podem ser suplementados como necessário, com uma variedade de exemplos de compostos que são hormonas e/ou outros factores de crescimento (tais como insulina, transferrina, factor epidérmico de crescimento, factor de crescimento de tipo insulina), sais (tais como cloreto de sódio, cálcio, magnésio, fosfato), tampões (tal como HEPES), nucleósidos (tais como adenosina, timidina), glutamina, glucose ou outras fontes de energia equivalentes, antibióticos, elementos vestigiais. Quaisquer outros suplementos necessários podem também ser incluídos em concentrações apropriadas que seriam conhecidas dos especialistas na técnica. Na presente invenção, a utilização de meio sem soro é preferida, mas meios suplementados com uma quantidade adequada de soro podem também ser utilizados para o cultivo de células hospedeiras. Para o crescimento e selecção de células geneticamente modificadas que expressam um gene seleccionável é adicionado ao meio de cultura um agente de selecção adequado. A "transfecção" de células hospedeiras eucarióticas com sequências polinucleotídicas ou vectores de expressão, resultando em células geneticamente modificadas, células recombinantes ou transgénicas, pode ser realizada através de 42 qualquer método bem conhecido do especialista. Os métodos de transfecção incluem, mas não estão limitados a, transfecção mediada por lipossoma, co-precipitação com fosfato de cálcio, electroporação, transfecção mediada por poli-catião (e. g., DEAE dextrano), fusão de protoplastos, microinjecção e infecções virais. De um modo preferido, a transfecção é uma transfecção estável. É favorecido o método de transfecção que proporciona frequência de transfecção e expressão óptima dos genes ou polinucleótidos heterólogos no tipo e linha celular hospedeira particular. Os métodos adequados podem ser determinados por processos de rotina. Para transfectantes estáveis, as construções são integradas no genoma da célula hospedeira ou num cromossoma/mini-cromossoma artificial ou localizadas epissomalmente de modo a serem estavelmente mantidas dentro da célula hospedeira. Para a criação de células geneticamente modificadas que expressam o(s) produto(s) de interesse, todos os genes heterólogos requeridos podem estar localizados num único vector ou sequência polinucleotidica em unidades mono- ou multicistrónicas de transcrição. Neste caso, a célula hospedeira é transfectada com vectores ou sequências polinucleotídicas únicos. Os genes heterólogos podem também estar posicionados em vectores ou sequências polinucleotídicas diferentes. Neste caso, as células hospedeiras são co-transfectadas com todos os vectores ou sequências polinucleotídicas e/ou são transfectadas em rondas sucessivas com os vectores ou sequências polinucleotídicas que codificam os genes de interesse.

Por definição, cada sequência polinucleotidica ou cada gene introduzido numa célula hospedeira e a respectiva proteína ou ARN aí codificado é referido como "heterólogo", "sequência heteróloga", "gene heterólogo", "sequência codificante heteróloga", "transgene" ou "proteína heteróloga" relativamente à célula hospedeira. Isto aplica-se mesmo se a sequência a ser 43 introduzida ou o gene a ser introduzido for idêntico a uma sequência endógena ou um gene endógeno da célula hospedeira. Por exemplo, um gene da actina de hamster introduzido numa célula hospedeira de hamster é por definição um gene heterólogo. 0 termo "endógeno" significa contido naturalmente na célula ou organismo. Um gene endógeno é, desta forma, um gene que é encontrado no genoma da célula de tipo selvagem não manipulada. A expressão "gene marcador de selecção" refere-se a um gene que apenas permita às células que contêm o gene de serem especificamente seleccionadas para ou contra na presença de um agente de selecção correspondente. A titulo ilustrativo, um gene de resistência a antibiótico pode ser utilizado como um gene marcador seleccionável positivo que permite à célula hospedeira transformada com o gene ser seleccionada positivamente na presença do antibiótico correspondente; uma célula hospedeira não transformada não seria capaz de crescimento ou sobrevivência sob as condições de cultura de selecção. Os marcadores seleccionáveis podem ser positivos, negativos ou bifuncionais. Os marcadores seleccionáveis positivos permitem a selecção para células que contêm o marcador por conferirem resistência a um fármaco ou compensarem um defeito metabólico ou catabólico na célula hospedeira. Pelo contrário, os marcadores negativos de selecção permitem às células que contêm o marcador de serem eliminadas selectivamente. Por exemplo, utilizando o gene HSV-tk como um marcador tornará as células sensíveis a agentes, tais como aciclovir e ganciclovir. Os genes marcadores seleccionáveis aqui utilizados, incluindo genes seleccionáveis amplificáveis, incluirão mutantes e variantes recombinantemente manipulados, fragmentos, equivalentes funcionais, derivados, homólogos e fusões do gene marcador seleccionável nativo de modo que o produto codificado retenha a propriedade seleccionável. Os 44 derivados úteis têm geralmente semelhança de sequência substancial (ao nivel de aminoácidos) em regiões ou domínios do marcador seleccionável associado com a propriedade seleccionável. Foi descrita uma variedade de genes marcadores, bem conhecidos do especialista, incluindo marcadores bifuncionais (i. e., positivos/negativos) (ver, e. g., documentos WO 92/08796 e WO 94/28143), aqui incorporados por referência. Por exemplo, os genes seleccionáveis geralmente utilizados com células eucarióticas incluem os genes para a aminoglicósido fosfotransferase (APH), higromicina fosfotransferase (HYG), di-hidrofolato redutase (DHFR), timidina cinase (TK), glutamina sintetase, asparagina sintetase e genes que codificam resistência à neomicina (G418), puromicina, histidinol D, bleomicina e fleomicina. O "gene marcador amplificável seleccionável" codifica geralmente uma enzima que é requerida para o crescimento de células eucarióticas sob aquelas condições. Por exemplo, o gene marcador amplificável seleccionável pode codificar a DHFR cujo gene é amplificado quando uma célula hospedeira transfectada com este é cultivada na presença do agente selectivo, metotrexato (MTX). Desta forma, as células hospedeiras modificadas geneticamente de acordo com qualquer método aqui descrito estão abrangidas por esta invenção, em que o gene marcador amplificável seleccionável codifica, por exemplo, para um polipéptido que tem a função de di-hidrofolato redutase (DHFR), glutamina sintetase, CAD, adenosina deaminase, adenilato deaminase, UMP sintetase, IMP 5'-desidrogenase, xantina guanina fosforibosil transferase, HGPRTase, timidina cinase, timidilato sintetase, P glicoproteína 170, ribonucleótido redutase, asparagina sintetase, arginossuccinato sintetase, ornitina decarboxilase, HMG CoA redutase, acetilglucosaminil transferase, treonil-ARNt sintetase ou Na+K+-ATPase. Para uma revisão dos 45 genes marcadores amplificáveis seleccionáveis exemplificativos listados na Tabela 2, ver Kaufman, Methods in Enzymology, 185, 537-566, 1990.

Um gene marcador amplificável seleccionável particular é o gene que codifica a di-hidrofolato redutase (DHFR) que é necessário para a biossíntese de purinas. As células que carecem do gene da DHFR não crescerão em meio que carece de purinas. 0 gene da DHFR é assim útil como um marcador seleccionável dominante para seleccionar e amplificar genes em tais células que crescem em meio que carece de purinas. O agente de selecção utilizado em conjunto com um gene da DHFR é o metotrexato (MTX).

Um outro marcador da selecção e/ou amplificação é o gene da glutamina sintetase (GS). O gene da GS codifica a enzima glutamina sintetase que é requerido para a sintese do aminoácido glutamina. As células que carecem do gene da GS ou que expressam baixos níveis endógenos de GS não crescerão em meios sem glutamina. O gene da GS é assim útil como um marcador seleccionável dominante para seleccionar e amplificar genes em tais células que crescem em meio sem glutamina. O agente de selecção utilizado em conjunto com o gene da GS é a metionina sulfoximina (MSX).

Tabela 2: Genes marcadores amplificáveis seleccionáveis

Gene Marcador Amplificável seleccionável Número de Acesso Agente de Selecção Di-hidrofolato redutase M19869 (hamster) E00236 (murganho) Metotrexato (MTX) 46 (continuação)

Gene Marcador Amplificável seleccionável Número de Acesso Agente de Selecção Metalotioneína D10551 (hamster) M13003 (humano) M11794 (rato) Cádmio CAD (Carbamoil-fosfato sintetase: Aspartato transcarbamilase: Di-hidroorotase) M23652 (hamster) D78586 (humano) N-Fosfoacetil-L-aspartato Adenosina desaminase K02567 (humano) M10319 (murganho) Xil-A- ou adenosina, 2'desoxicoformicina AMP (adeniato) desaminase Dl2775 (humano) J02811 (rato) Adenina, azasserina, coformicina UMP sintase J03626 (humano) 6-Azauridina, pirazofurano IMP 5'desidrogenase J04209 (hamster) J04208 (humano) M33934 (murganho) Ácido micofenólico Xantina-guanina fosforibosil-transferase X00221 (E. coli) Ácido micofenólico com xantina limitante HGPRTase mutante ou timidina cinase mutante J00060 (hamster) M13542, K02581 (humano) J00423, M68489 (murganho) M63983 (rato) M3 616 0 (herpesvirus) Hipoxantina, aminopterina e timidina (HAT) 47 (continuação)

Gene Marcador Amplificável seleccionável Número de Acesso Agente de Selecçao Timidilato sintetase D00596 (humano) M13019 (murganho) L12138 (rato) 5-Fluoro- desoxiuridina P-glicoproteína 170 (MDR1) AF016535 (humano) J03398 (murganho) Múltiplos fármacos, e. g., adriamicina, vincristina, colchicina Ribonucleótido redutase M124223, K02927 (murganho) Afidicolina Glutamina sintetase AF150961 (hamster) U09114, M60803 (murganho) M29579 (rato) Metionina sulfoximina (MSX) Asparagina sintetase M27838 (hamster) M27396 (humano) U38940 (murganho) U07202 (rato) β-Aspartil hidroxamato, Albizziina, 5'Azacitidina Argininossuccinato sintetase X01630 (humano) M31690 (murganho) M26198 (bovino) Canavanina Ornitina descarboxilase M34158 (humano) J03733 (murganho) M16982 (rato) a-Difluorometil-ornitina HMG-CoA redutase LO 0183, Ml2 7 05 (hamster) M11058 (humano) Compactina N-Acetilglucosaminil transferase M55621 (humano) Tunicamicina 48 (continuação)

Gene Marcador Amplificável seleccionável Número de Acesso Agente de Selecção Treonil-tRNA M63180 (humano) Borrelidina sintetase Na+K+-ATPase J05096 (humano) Ouabaína M14511 (rato) A selecção pode também ser feita por separação celular activada por fluorescência (FACS) utilizando, por exemplo, um marcador de superfície celular, β-galactosidase bacteriana ou proteína fluorescente (e. g., proteínas fluorescentes verdes (GFP) e as suas variantes de Aequorea victoria e Renilla reniformis ou outra espécie; proteínas fluorescentes vermelhas, proteínas fluorescentes e as suas variantes de espécies não bioluminescentes (e. g., Discosoma sp., Anemonia sp.r Clavularia sp., Zoanthus sp.) para seleccionar para células recombinantes. A expressão "agente de selecção" refere-se a uma substância que interfere com o crescimento ou sobrevivência de uma célula hospedeira que é deficiente num gene seleccionável particular. Por exemplo, para seleccionar para a presença de um gene de resistência a antibiótico como APH (aminoglicósido fosfotransferase) numa célula transfectada é utilizado o antibiótico Geneticina (G418). 0 agente de selecção pode também compreender um "agente de amplificação" que é aqui definido como um agente para amplificação de cópias do gene amplificável, se o gene marcador seleccionável em que se baseia for um marcador seleccionável amplificável. Por exemplo, MTX é um agente de selecção útil para a amplificação do gene da DHFR. 49

Uma forma de realização adicional dos métodos acima mencionados refere-se a um método, em que o(s) polipéptido(s)/produto(s) que é(são) codificado(s) pelo(s) gene(s) de interesse e expresso(s) na referida célula hospedeira, é(são) isolado(s) a partir das células ou do sobrenadante da cultura de células, se excretado no meio de cultura.

As referidas células produtivas são cultivadas, de um modo preferido, num meio sem soro e em cultura em suspensão sob condições que são favoráveis para a expressão do(s) gene(s) desejado(s) e isolar a proteína de interesse de células e/ou do sobrenadante de cultura de células. De um modo preferido, a proteína de interesse é recuperada do meio de cultura como um polipéptido excretado ou pode ser recuperada a partir de lisados de célula hospedeira, se expressa sem um sinal secretor. É necessário purificar a proteína de interesse de outras proteínas recombinantes, proteínas de células hospedeiras e contaminantes de um modo a serem obtidas preparações substancialmente homogéneas da proteína de interesse. Como um primeiro passo, células e/ou restos celulares particulados são, frequentemente, removidos do meio de cultura ou lisado. 0 produto de interesse é posteriormente purificado a partir de proteínas, polipéptidos e ácidos nucleicos solúveis contaminantes, por exemplo, por fraccionamento em colunas de imunoafinidade ou permuta iónica, precipitação com etanol, HPLC de fase reversa, cromatografia de Sephadex, cromatografia em sílica ou numa resina de permuta catiónica, tal como DEAE. Em geral, os métodos que ensinam um especialista como purificar uma proteína heteróloga expressa por células hospedeiras, são bem conhecidos na técnica. 50 A prática da presente invenção empregará, salvo indicação em contrário, técnicas convencionais de biologia celular, biologia molecular, cultura de células, imunologia e semelhantes que são do conhecimento de um especialista na técnica. Estas técnicas estão totalmente divulgadas na actual literatura.

Os seguintes exemplos não são limitativos. Mostram apenas formas de realização possíveis da invenção. Uma especialista na técnica poderá facilmente ajustar as condições para os aplicar a outras formas de realização.

EXEMPLOS

ABREVIATURAS AP: BGH: pb: CHO: DHFR: ELISA: FACS: HGH: HT : HRPO: IgG: IRES : kb: mAb: MTX: NPT: nt:

Fosfatase alcalina

Hormona de crescimento bovino

Pares de bases

Ovário de hamster Chinês

Di-hidrofolato Redutase imunoensaio de adsorção ligado à enzima separação celular activada por fluorescência

Hormona de crescimento de hamster

Hipoxantina/timidina

Peroxidase de rábano

Imunoglobulina

Local de entrada ribossomal interno Kilobase

Anticorpo Monoclonal Metotrexato

Neomicina fosfotransferase Nucleótidos 51 PBS: PCR: SEAP: sICAM: UTR:

Soro fisiológico tamponado com fosfato Reacção em Cadeia da Polimerase Fosfatase alcalina excretada Molécula de adesão intracelular solúvel Região não traduzida

MATERIAIS E MÉTODOS

Cultura de Células Células CH0-DG44/dhfr_/~ são cultivadas permanentemente em suspensão em meio CHO-S-SFMII sem soro (Invitrogen) suplementado com hipoxantina e timidina (HT) . As células são incubadas em frascos de cultura de células a 37 °C numa atmosfera humidificada contendo 5% de C02. 0 número de células, assim como a viabilidade celular é determinada com um Contador de Células CASY1 (Schaerfe System, Alemanha), um Cedex (Innovatis AG, Alemanha) ou por exclusão de corante azul tripano. As células são inoculadas a uma concentração de l-3xl05 células/mL em meio fresco, em cada dois a três dias.

Transfecções

As transfecções de células CHO-DG44 são conduzidas utilizando reagente Lipofectamine Plus (Invitrogen). Por transfecção, 6xl05 células em crescimento exponencial em 0,8 mL de meio CHO-S-SFMII suplementado com hipoxantina/timidina (HT) são inoculadas num poço de uma câmara de seis poços. Uma mistura de ADN plasmidico, 4 pL de Lipofectamine e 6 pL de reagente Plus num volume de 200 pL é produzida para cada transfecção e adicionada às células, seguindo o protocolo do fabricante. Após 52 incubaçao durante 3 horas, são adicionados 2 mL do meio CHO-S-SFMII suplementado com HT.

As transfecções transientes são realizadas em triplicado e o sobrenadante e as células são recolhidos 2 dias após a transfecção. Para uma selecção baseada na DHFR de células CHO-DG44 estavelmente transfectadas, o meio é substituído com meio CHO-S-SFMII sem HT 48 horas após a transfecção. A amplificação génica baseada na DHFR é realizada por adição de MTX na gama de 5-2000 nM (Sigma) como agente de selecção de amplificação para o meio. No caso de co-transfecções, uma selecção baseada em DHFR e NPT de células CHO-DG44 estavelmente transfectadas é realizada por transferência das células 48 horas após a transfecção para meio CHO-S-SFMII sem HT suplementado com G418 (Invitrogen) numa concentração de 200-400 pg/mL.

Vectores de expressão

Os vectores de expressão eucarióticos são derivados do vector pAD-CMVl (documento WO 9201055) e medeiam a expressão constitutiva dos genes heterólogos dirigidos pelo promotor/intensificador de CMV. Para terminação e poliadenilação do transcrito do gene de interesse, os vectores contêm o sinal de poliadenilação tardio de SV40 (SEQ ID N°:ll) ou o sinal de poliadenilação de BGH (SEQ ID N°:12). Os vectores pBID codificam um mini gene de DHFR como marcador de selecção amplificável (ver, por exemplo, documento EP 0393438) enquanto os vectores pBIN codificam um gene de NPT como marcador de selecção, sob o controlo do promotor precoce de SV40 e um sinal de poliadenilação da timidina cinase (Figura 1). 53

Os genes de interesse que codificam para sICAM humana, cadeia pesada e leve de anticorpos monoclonais (isotipo IgGl, IgG2 ou IgG4) ou proteinas de fusão Fc são clonados em vectores utilizando locais múltiplos de clonagem localizados entre o promotor e o sinal de poliadenilação.

ELISA

Os títulos de sICAM são quantificados por ELISA com protocolos convencionais utilizando dois anticorpos monoclonais específicos para sICAM desenvolvidos pela requerente (como descritos, por exemplo, nas Patentes U.S. N° 5284931 e 5475091), em que um dos anticorpos é um anticorpo conjugado com HRPO. A proteína sICAM purificada é utilizada como um padrão. os títulos de mAb são quantificados por ELISA com protocolos convencionais utilizando um fragmento Fc de cabra anti-IgG humana (Dianova) e um anticorpo de cabra anti-cadeia leve kapa humana conjugado com AP (Sigma). O anticorpo mAb purificado do mesmo isotipo que o mAb expresso é utilizado como padrão. As amostras são analisadas utilizando um leitor Spectra Fluor Plus (TECAN, Crailsheim, Alemanha). A produtividade celular (pg/célula/dia) é calculada com a fórmula pg/((Ct-Co)t/ln(Ct-Co)) em que "Co" é o número de células na altura da inoculação, "Ct" o número de células na altura da colheita e "t" o período de cultivo. 54

Ensaio da SEAP A actividade da SEAP é determinada com SEAP Reporte Gene Assay de acordo com o protocolo do fabricante (Roche Diagnostics). EXEMPLO 1: ISOLAMENTO E CLONAGEM DA REGIÃO DE TERMINAÇÃO DE TRANSCRIÇÃO DA HORMONA DE CRESCIMENTO DE HAMSTER (HGH)

Para isolamento da região completa do sinal de poliadenilação do gene da hormona de crescimento do genoma de CHO-DG44 (hamster chinês, Cricetus griseus), um ADN de CHO-DG44 genómico ligado a adaptador serve como molde numa PCR interna. A PCR primária é conduzida com uma combinação de iniciador com complementaridade para a sequência de adaptador e uma sequência de gene da hormona de crescimento, respectivamente. 0 iniciador GH forl especifico de gene (5'-GAGACCTACCTGCGGGTCA TGA-3'; SEQ ID N° : 1) é concebido com base numa sequência de ADNc da hormona de crescimento de hamster sírio (Mesocicetus auratus; Genbank S66299) e está localizada 35 pb a montante do codão de terminação. Uma PCR secundária é realizada nos produtos da PCR primária com uma combinação de um iniciador adaptador interno e um segundo iniciador específico de gene interno GH for2; 5'-AGTGCCGTCGCTTTGTGGAAA G-3'; SEQ ID N°:2), posicionado directamente a jusante da posição do iniciador GH forl. Os fragmentos de ADN resultantes são subclonados num vector de clonagem TA (Invitrogen) e ainda analisados por análise de sequência. 0 fragmento de ADN mais longo contém, além da sequência do iniciador GH for2, mais 13 pb da extremidade 3' da região codificante, seguida por um codão de terminação e 324 pb da região 3' não traduzida da hormona de crescimento de Cicetus griseus (Figura 2; SEQ ID N°:7). 55

Para obter apenas a região 3’ nao traduzida com um total de 324 pb (SEQ ID N°:8) uma outra PCR é realizada utilizando os iniciadores GH Sfi forl (SEQ ID N°:3) e GH Xba revi (SEQ ID N°:4). Desse modo, o fragmento de ADN de 362 pb mencionado acima (SEQ ID N°:7), subclonado no vector TA, serve como molde na PCR. A sequência amplificada (SEQ ID N°:8) tem as seguintes homologias relativamente às regiões 3' não traduzidas da hormona de crescimento de várias espécies: 72,1% para a sequência de hamster sirio Mesocricetus auratus Genbank S66299), 71,6% para a sequência de Mus musculus (Genbank Z46663), 61% para a sequência de Rattus norvegicus (Genbank V01239) e 50,4% para a sequência de BGH do Bos taurus (Genbank J00008) (Figura 3). A abordagem baseada em PCR é utilizada também para a criação de subclones com várias deleções da extremidade 3' da região 3' não traduzida isolada. Utilizando a combinação de iniciador GH Sfi forl (SEQ ID N°:3) e GH Xba rev2 (SEQ ID N°:5) é gerado um fragmento de 189 pb da região 3' não traduzida (SEQ ID N°:9) e com a combinação de iniciador GH Sfi forl (SEQ ID N°:3) e GH Xba rev3 (SEQ ID N°:6) é gerado um subfragmento de 113 pb (SEQ ID N°:10). Assim, todos os fragmentos amplificados da região 3' não traduzida têm uma extremidade 5' idêntica que corresponde ao primeiro nucleótido após o codão de terminação e uma extremidade 3' variável (Figura 4).

Os produtos de PCR são digeridos com Sfil e Xbal e os fragmentos de restrição resultantes são utilizados para substituir a sequência de sinal de poliadenilação tardio de SV40 no vector pJR106, que codifica sICAM humano (Figura 5) . Os vectores resultantes pJRl31, pJRl34 e pJR135 contêm agora uma sequência de sinal de poliadenilação derivada da hormona de crescimento de Cricetus griseus, denominada HGH curta, com um 56 tamanho de 324 pb (SEQ ID N°:8), 189 pb (SEQ ID N°:9) e 113 pb (SEQ ID N°:10), respectivamente (Figura 5).

EXEMPLO 2: IMPACTO DA SEQUÊNCIA DE SINAL DE POLIADENILAÇÃO DE HGH NA EXPRESSÃO TRANSIENTE DE sICAM

Para avaliar o impacto da sequência de sinal de poliadenilação derivada da hormona de crescimento de Cricetus griseus (HGH) na expressão de um gene de interesse, sICAM, independentemente dos locais de integração cromossomal, são realizadas transfecções transientes. As células CHO-DG44 são transfectadas com o plasmídeo pJR131 que contém 324 pb das 3'UTR da hormona de crescimento de hamster (= HGH, SEQ ID N°:8) (Figura 5) . Os vectores contendo as sequências de sinal de poliadenilação tardio de SV40 (pJR106) ou BGH (pJRUO) são utilizados como controlo (Figura 5). Além das diferentes sequências de terminação, o cenário genético dos vários vectores para a expressão de sICAM é idêntico.

Os sobrenadantes são recolhidos 2 dias após a transfecção e os títulos de sICAM determinados utilizando ELISA. Para corrigir em termos de eficiência de transfecção, as células são co-transfectadas com o plasmídeo pCMV-SEAP (100 ng de ADN/reacção de transfecção), que codifica a fosfatase alcalina excretada e é medida a actividade da SEAP. A Figura 6 mostra os dados de 2 séries de transfecções transientes independentes realizadas em duplicado.

Surpreendentemente, a expressão mais elevada de sICAM é obtida com a sequência de sinal de poliadenilação derivada do gene da hormona de crescimento de hamster. O título é aumentado até 21% (série N° 1 de transfecção) comparativamente às células 57 transf ectadas com o vector pJRUO contendo o sinal de poliadenilação da BGH e aumentado até 40% (série N° 1 de transfecção) comparativamente às células transfectadas com o vector pJR106 contendo o sinal de poliadenilação tardio de SV40. EXEMPLO 3: IMPACTO DO SINAL DE POLIADENILAÇÃO DE HGH NA EXPRESSÃO TRANSIENTE DE UM ANTICORPO IgG4

Para avaliar o impacto da sequência de sinal de poliadenilação derivada da hormona de crescimento (HGH) de Cricetus griseus na expressão de um gene de interesse, mAb IgG4 humanizada/kapa, independentemente dos locais de integração cromossomal, são realizadas transfecções transientes. As células CHO-DG44 são co-transfectadas com a combinação de vectores pBID/IgG4 e pBIN/kapa. Ambos os vectores contêm 324 pb da 3'UTR da hormona de crescimento de hamster (= HGH; SEQ ID N°:8) como uma sequência de sinal de poliadenilação. Como um controlo, as células CHO-DG44 são co-transfectadas com a combinação de vectores pBID-B/IgG4 e pBIN-B/kapa que contém o sinal de poliadenilação de BGH (ver Figura 1 para vectores básicos). Para além das diferentes sequências de terminação, o cenário genético dos vários vectores para a expressão de mAb IgG4/kapa é idêntico.

Os sobrenadantes são recolhidos 2 dias após a transfecção e os títulos de IgG4 determinados utilizando ELISA. Por combinação de vector, são transfectados 6 agrupamentos celulares. Para corrigir em termos de eficiência de transfecção, as células são co-transfectadas com o plasmídeo pCMV-SEAP (100 ng de ADN/reacção de transfecção), que codifica a fosfatase alcalina excretada e é medida a actividade da SEAP. 58

Surpreendentemente, os títulos obtidos com a sequência de sinal de poliadenilação de HGH são em média 35% mais elevados do que para o sinal de poliadenilação de BGH (Figura 7).

EXEMPLO 4: TESTE DE DIFERENTES VARIANTES DE HGH

Dois clones de deleção de 3' da sequência de HGH de 324 pb derivada da hormona de crescimento de Cricetus griseus (SEQ ID N°:8) são gerados por PCR e colocados como uma sequência de sinal de poliadenilação a jusante do gene de sICAM. Os vectores pJR135 e pJR134 resultantes (Figura 5) contêm uma curta região da sequência de HGH de 189 pb (SEQ ID N°:9) e 113 pb (SEQ ID N°:10), respectivamente, as quais têm uma posição comum da extremidade 5' (Figura 4).

Para avaliar o impacto das variantes de deleção de HGH na expressão de um gene de interesse, sICAM, independentemente dos locais de integração cromossomal, são realizadas transfecções transientes. As células CHO-DG44 são transfectadas com os vectores pJR134 e pJR135. 0 vector pJR131 contendo a sequência de HGH de 324 pb é utilizado como controlo (Figura 5) . Além das diferentes sequências de terminação, o cenário genético dos vários vectores para a expressão de sICAM é idêntico. Os sobrenadantes são recolhidos 2 dias após transfecção e os títulos de sICAM determinados utilizando ELISA. Para corrigir em termos de eficiência de transfecção, as células são co-transfectadas com o plasmídeo pCMV-SEAP (100 ng de ADN/reacção de transfecção), que codifica a fosfatase alcalina excretada e é medida a actividade da SEAP. 59 A Figura 8 mostra os dados de 2 séries de transfecções transientes independentes realizadas em duplicado. Ambas as variantes de deleção de HGH conduzem a niveis reduzidos de expressão de sICAM. A sequência de HGH de 189 pb contida no vector de expressão pJR134 resulta numa redução mais moderada até 23%. Assim, o fragmento de 189 pb mostra um desempenho comparável ao sinal de poliadenilação tardio de SV40 e BGH (ver exemplo 2 e 3). Contudo, a sequência mais curta de HGH de 113 pb contida no vector de expressão pJR135 conduz a uma redução de até 78% na expressão de sICAM. Isto mostra que entre a região de HGH de 190 a 324 pb da SEQ ID N°:8 estão localizadas sequências que contribuem para uma expressão eficiente de um gene de interesse.

EXEMPLO 5: EXPRESSÃO ESTÁVEL DE PROTEÍNAS A NIVEIS ELEVADOS UTILIZANDO O SINAL DE POLIADENILAÇÃO DE HGH

As células CHO-DG44 são co-transfectadas com combinações de vectores que codificam para a cadeia pesada e leve de mAb de vários isotipos (IgGl, IgG2, IgG4) ou para proteínas de fusão Fc, em que a parte Fc é derivada de IgGl ou IgG2. Os vectores básicos pBID e pBIN (Figura 1) utilizados para a expressão contêm a sequência de HGH de 324 pb (SEQ ID N°:8) como a sequência de sinal de poliadenilação, posicionada a jusante do gene de interesse. São seleccionados agrupamentos celulares estáveis utilizando uma selecção baseada em DHFR e NPT, 2 dias após a transfecção. A primeira selecção de transfectantes estáveis é seguida por dois passos sucessivos de amplificação génica mediada por DHFR por adição ao meio de cultura de 100 nM de MTX na primeira ronda e subsequentemente 800 nM de MTX. Foram obtidos clones celulares isolados por clonagem de diluição ou uma deposição baseada em FACS de células individuais em poços de 60 uma placa de 96 poços. Os dados experimentais mostram que a expressão elevada de uma proteína de interesse em transfectantes estáveis é conseguida utilizando o sinal de poliadenilação de HGH de Cricetus griseus. São obtidos agrupamentos celulares e clones celulares com produtividades específicas na gama de 10-45 pg/célula/dia e títulos em processos descontínuos até 6,3 g/L (Figura 9). TABELA DE SEQUÊNCIAS: SEQ ID N° : 1 Iniciador GH forl SEQ ID N° : 2 Iniciador GH for2 SEQ ID N° : 3 Iniciador GH Sfi forl SEQ ID N° : 4 Iniciador GH Xba revi SEQ ID N° : 5 Iniciador GH Xba rev2 SEQ ID N° : 6 Iniciador GH Xba rev3 SEQ ID N° : 7 Cricetus griseus, sequência da hormona de crescimento, parte da região 3' codificante e região 3' não traduzida (362 nucleótidos) SEQ ID N° : 8 Cricetus griseus, região 3' nao traduzida da hormona de crescimento (324 nucleótidos) SEQ ID N° : 9 Cricetus griseus, região 3' não traduzida da hormona de crescimento (189 nucleótidos) SEQ ID N° : 10 Cricetus griseus, região 3' não traduzida da hormona de crescimento (113 nucleótidos) SEQ ID N° : 11 SV40, terminação tardia e sequência de poliadenilação (222 nucleótidos) 61 SEQ ID N°: 12

Bos Taurus, sequência de terminação e poliadenilação da hormona de crescimento (208 nucleótidos) SEQ ID N° : 13 sequência de Kozak, local de ligação ao ribossoma de consenso (13 nucleótidos)

Lisboa, 12 de Julho de 2013 62

Claims

REIVINDICAÇÕES 1. Sinal de poliadenilação compreendendo um ácido nucleico compreendendo uma sequência, pelo menos, 75% idêntica à SEQ ID N°:9.
2. Sinal de poliadenilação de acordo com a reivindicação 1 compreendendo uma sequência, pelo menos, 80%, 85%, 90%, 95% ou 98% idêntica à SEQ ID N°:8.
3. Sinal de poliadenilação de acordo com as reivindicações 1 ou 2 compreendendo a SEQ ID N°:8.
4. Sinal de poliadenilação de acordo com as reivindicações 1 a 3, em que o referido sinal de poliadenilação está ligado operativamente a uma sequência codificante heteróloga.
5. Vector compreendendo qualquer um dos referidos sinais de poliadenilação das reivindicações de 1 a 4.
6. Vector da reivindicação 5 compreendendo um gene heterólogo de interesse que codifica um produto heterólogo de interesse.
7. Vector da reivindicação 6, em que o produto de interesse é um polipéptido de interesse e o referido polipéptido de interesse é um anticorpo, fragmento de anticorpo ou proteína de fusão.
8. Célula compreendendo o vector de qualquer uma das reivindicações 5 a 7. 1
9. Célula de acordo com a reivindicação 8, em que o sinal de poliadenilação das reivindicações 1 a 4 está ligado operativamente a uma unidade de transcrição que codifica um produto de interesse e em que o produto de interesse é um polipéptido de interesse codificado por um gene de interesse.
10. Célula de acordo com a reivindicação 8 ou 9, em que a referida célula é uma célula de hamster.
11. Célula de acordo com a reivindicação 10, em que a célula de hamster é uma célula de ovário de hamster Chinês (CHO), de um modo preferido, uma célula CHO DG44.
12. Método de produção de um polipéptido de interesse codificado por um gene de interesse, o método compreendendo: (a) proporcionar uma célula hospedeira compreendendo um vector de acordo com qualquer uma das reivindicações 5 a 7 ou proporcionar uma célula de acordo com qualquer uma das reivindicações 8 a 10 (b) cultivar a referida célula, sob condições que permitem a proliferação da célula e a expressão do gene de interesse, (c) recolher o polipéptido de interesse e (d) purificar o polipéptido de interesse.
13. Utilização de qualquer um dos sinais de poliadenilação das reivindicações 1 a 4 como um isolador. 2
14. Kit compreendendo qualquer um dos sinais de poliadenilação das reivindicações 1 a 4, um vector, uma célula e um meio de cultura de células para cultivo da referida célula. Lisboa, 12 de Julho de 2013 3