BRPI0712073B1

BRPI0712073B1 - ácido nucléico para produção de um polipeptíedeo ou proteína heteróloga

Info

Publication number: BRPI0712073B1
Application number: BRPI0712073-7A
Authority: BR
Inventors: Kopetzki Erhard; Tiefenthaler Georg; Endl Josef; Ploettner Olivier; Schwarz Ursula
Original assignee: Hoffmann La Roche
Priority date: 2006-05-17
Filing date: 2007-05-15
Publication date: 2019-11-12
Also published as: ES2543629T3; EP2027273B1; EP2208792A3; KR101202498B1; US20090311725A1; MX2008013514A; EP2208792B1; AU2007251766B2; AU2007251766A1; CA2651478A1; JP2009537124A; EP2208792A2; US20130109058A1; CN101410525A; CN101410525B; BRPI0712073B8; US8541204B2; KR20090003327A; IL193721A0; ES2573027T3

Abstract

células produtoras de polipeptídio. a presente invenção descreve um ácido nuclélco compreendendo, na direção 5' a 3': a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada em fase de leitura, b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, e c) um ácido nucléico que codifica i) pelo menos um fragmento de um domínio transmembrana, ou ii) um peptídio de sinal para uma âncora gpi.

Description

Relatório Descritivo da Patente de Invenção para CÉLULAS PRODUTORAS DE POLIPEPTÍDIO.

A presente invenção se refere ao campo da produção de polipeptídios. Descreve um ácido nucléico compreendendo um ácido nucléico de splicing alternativo, células compreendendo esse ácido nucléico, um método para o isolamento de células que expressem um polipeptídio heterólogo, que utiliza um ácido nucléico compreendendo um primeiro ácido nucléico que codifica um polipeptídio heterólogo, um segundo ácido nucléico compreendendo um ácido nucléico de splicing alternativo e um terceiro ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou um peptídio de sinal para uma âncora GPI, e também um método para a produção de polipeptídios heterólogos.

Fundamentos da Invenção

Sistemas de expressão para a produção de polipeptídios recombinantes são bem conhecidos no estado da técnica e são descritos por, por exemplo, Marino, M.H., Biopharm. 2 (1989) 18-33; Goeddel, D.V., et al., Methods Enzymol. 185 (1990) 3-7; Wurm, F., e Bernard, A., Curr. Opin. Biotechnol. 10 (1999) 156-160. Para a produção de polipeptídios e proteínas usadas em aplicações farmacêuticas, empregam-se, de preferência, células hospedeiras de mamíferos, como células CHO, células BHK, células NSO, células Sp2/0, células COS, células HEK, células PER.C6® e outras. O ácido nucléico que codifica o polipeptídio é de preferência introduzido na célula hospedeira compreendido em um ácido nucléico, como, por exemplo, um vetor de expressão. Os elementos essenciais de um vetor de expressão são uma unidade de propagação de plasm ídio procariótico, por exemplo, para Escherichia coli, compreendendo uma origem de replicação e um marcador de seleção, um marcador de seleção eucariótica e um ou mais cassetes de expressão para a expressão do(s) gene(s) estrutural(ais) de interesse, cada um compreendendo um promotor, um gene estrutural e um terminador de transcrição, incluindo um sinal de poliadenilação. Para expressão transitória em células de mamíferos, pode-se incluir uma origem de replicação de mamífero, como a SV40 Ori ou OriP de EBV. Como promotor, pode-se selecio2 nar um promotor constitutivo ou induzível. Para transcrição otimizada, podese incluir uma seqüência Kozak na região não traduzida 5'. Para processamento de mRNA, em particular terminação de transcrição e splicing prémRNA, podem-se incluir sinais de splicing de mRNA, dependendo da orga5 nização do gene estrutural (organização éxon-íntron), assim como um sinal de poliadenilação.

A expressão de um gene é realizada como expressão transitória ou permanente. O(s) polipeptídio(s) de interesse pode(m) ser um polipeptídio secretado, contendo uma extensão N terminal (também conhecida como o 10 sinal de seqüência), que é necessária para o transporte/secreção do polipeptídio através da célula e para o meio extracelular, ou pode ser um polipeptídio citosólico.

Para a produção em grande escala de um polipeptídio, tem de se estabelecer uma linhagem celular altamente produtora. Após a transfec15 ção de uma linhagem de células hospedeiras, como células CHO, células NSO, células Sp2/0, células BHK, células COS, células PER.C6®, ou células HEK, em geral uma pluralidade de clones com diferentes características são obtidos devido a, por exemplo, a ampla diferença de polipeptídios expressados por plasm ídios transitoriamente transfectados ou integrados de maneira 20 estável. Para fins de seleção, o ácido nucléico introduzido nas células possui, além disso, um marcador selecionável, por exemplo, um gene que confere resistência contra uma substância de outra forma fatal.

Após a transfecção e por crescimento em um meio seletivo apropriado, um clone altamente produtor tem de ser isolado. Isso é demorado 25 e, conseqüentemente, caro. Foram desenvolvidos vários métodos para lidar com esse problema.

Um desses métodos é a amplificação de gene. Nele, células deficientes da enzima diidrofolato redutase (DHFR) são transfectadas com um vetor/plasmídio que contém um primeiro cassete de expressão para a ex30 pressão da proteína DHFR e um segundo cassete de expressão para a expressão de um polipeptídio heterólogo de interesse. Usando-se um meio de cultura depletado de glicina, hipoxantina e timidina, estabelecem-se condi ções seletivas de crescimento. Para a amplificação, adiciona-se um inibidor de DHFR, metotrexato (MTX) (Kaufman, R.J., et al., J. Mol. Biol. 159 (1982) 601-621; US 4.656.134).

Alternativamente, moléculas repórteres, como cloranfenicolacetil-transferase, luciferase, proteína fluorescente verde ou betagalactosidase, podem ser fusionadas ao polipeptídio heterólogo para o qual se deseja uma linhagem celular altamente produtora, e usadas como um marcador de seleção indireta. A seleção ocorre na presença de um substrato ou co-fator exógeno adicionado.

Um método adicional para a identificação de um clone altamente produtor é uma transcrição ligada de um gene de marcador selecionável e um gene estrutural que codifica um polipeptídio heterólogo mediante um sítio de entrada em ribossomo interno (IRES). Com esse projeto, a expressão do polipeptídio heterólogo jpode ser correlacionada com a expressão do marcador selecionável.

Imunoglobulinas humanas são produzidas por linfócitos especializados: as células B. Essas células não apenas secretam imunoglobulinas (slg), elas também apresentam imunoglobulinas em sua membrana celular externa como imunoglobulinas ligadas à membrana plasmática (mlg). Essas mlg's desempenham um importante papel no início de uma resposta imunológiea. As imunoglobulinas ligadas à membrana plasmática apresentadas têm a função de receptores celulares para seus antígenos correspondentes.

Começando em 1980, foram publicados artigos tratando da origem de formas secretadas e ligadas a membrana plasmática de imunoglobulinas. Early et al. (Early, P., et al., Cell 20 (1980) 313-319) relataram que, em camundongos, duas espécies de mRNA que codificam a cadeia pesada de imunoglobulinas se originam do mesmo transcrito primário de um único gene μ de imunoglobulina. A formação das formas secretada (slg) e ligada a membrana plasmática (mlg) resulta do splicing alternativo do pré-mRNA de cadeia pesada. Para a isoforma slg, todos os éxons que codificam os domínios da imunoglobulina e o íntron após o éxon que codifica o domínio C terminal são retidos no mRNA, e o sinal de poliadenilação que se localiza a jusante do códon de parada no intron é usado para divagem e poliadenilação do transcrito primário. Para a isoforma mlg, um sítio doador de splice 5' alternativo depois do éxon que codifica o domínio C terminal da forma secretada (isto é, CH3 ou CH4, respectivamente) liga a região constante aos éxons a jusante Ml e M2 que codificam um domínio transmembrana. Nesse caso, a seqüência que codifica os aminoácidos terminais e o códon de parada da forma secretada, assim como o sinal de poliadenilação intrônico adjacente para a forma slg são removidos pelo splicing juntamente com o íntron.

Por exemplo, a razão entre o mRNA que codifica a forma de cadeia pesada da imunoglobulina secretada e o mRNA que codifica a forma de cadeia pesada da imunoglobulina ligada a membrana plasmática é de 10:1 a 100:1. Essa razão é estabelecida principalmente durante o splicing prémRNA. Os mecanismos de controle de tradução e pós-tradução contribuem apenas em pequena medida (veja, por exemplo, Xiang, S. D., et al., Immun. Cell Biol. 79 (2001) 472-481).

A imunoglobulina ligada à membrana plasmática da célula tem a mesma seqüência de aminoácidos e estrutura secundária que seu análogo secretado. A diferença é uma extensão C terminal da cadeia pesada de slg compreendendo um domínio transmembrana. Esse domínio transmembrana tem, em geral, um comprimento entre aproximadamente 40 e aproximadamente 75 resíduos de aminoácidos. Para imunoglobulinas murídeas e humanas, o domínio transmembrana pode ser subdividido em três regiões estruturais distintas: uma região extracelular N terminal de 13-67 resíduos de aminoácidos, um trecho transmembrana conservado central de 25 resíduos de aminoácidos, e uma região citoplasmática C terminal de 3 - 28 resíduos de aminoácidos (Major, J.G., et al., Mol. Immunol. 33 (1996) 179-187).

Vetores de expressão compreendendo um gene selecionável amplificável, um gene de proteína fluorescente e um gene que codifique um produto desejado de maneira que otimize a ligação transcricional e de tradução é relatado em WO 01/04306. Em WO 01/38557, relata-se um método para a triagem de múltiplas células transformadas/transfectadas para identificar células que expressem pelo menos dois peptídios ou proteínas de inte resse. Esses dois peptídios/proteínas estão ligados mediante um IRES (sítio de entrada em ribossomo interno) a um gene de marcador fluorescente.

Animais e células transgênicas que compreendem um transgene marcador de formação de imagem são relatados no pedido de patente norteamericana 2003/0033616. O pedido de patente norte-americana 2005/0032127 relata um método para a seleção não invasiva de células vivas únicas sob condições suaves a partir de misturas de células ou culturas celulares, com relação a um desempenho de produção específico, por métodos de detecção de fluorescência-microscópicos. Um método para a identificação e isolamento de células que produzem proteínas secretadas é relatado no pedido de patente norte-americana 2002/0168702.

Um vetor de expressão consistindo em um gene que codifica uma proteína de interesse que esteja funcionalmente ligada a um promotor de hamster, um gene que codifica uma proteína fluorescente e, de preferência, um gene marcador de seleção amplificável é relatado no pedido de patente norte-americana 2004/0148647.

Sumário da Invenção

A presente invenção compreende um ácido nucléico compreendendo na direção 5' a 3':

a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura,

b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, e

c) um terceiro ácido nucléico que codifica:

i) pelo menos um fragmento de um domínio transmembrana, ou ii) um peptídio de sinal para uma âncora GPI.

Aspectos adicionais da presente invenção são um vetor adequado para células eucarióticas, compreendendo o ácido nucléico da invenção, e uma célula eucariótica, compreendendo pelo menos um ácido nucléico de acordo com a invenção.

A presente invenção também compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio heterólogo, em que o método compreende:

a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':

i) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilaÇão, iii) um terceiro ácido nucléico que codifica:

iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,

b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA e a tradução do dito mRNA processado em um polipeptídio, em que a dita célula transfectada produz polipeptídio heterólogo solúvel e polipeptídio heterólogo ligado a membrana plasmática por splicing alternativo do dito pré-mRNA, e

c) a seleção de uma célula com polipeptídio heterólogo ligado a membrana plasmática para ser a dita célula que expressa um polipeptídio heterólogo.

Em uma modalidade, o método da invenção é para a seleção de uma célula eucariótica que expresse uma imunoglobulina, em que o método compreende:

i) um primeiro ácido nucléico que codifica pelo menos um fragmento de uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:

b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz cadeia pesada de imunoglobulina solúvel e cadeia pesada de imunoglobulina ligada a membrana plasmática por splicing alternativo do dito pré-mRNA, e

c) a seleção de uma célula com cadeia pesada de imunoglobulina ligada a membrana plasmática para ser a dita célula que expressa uma imunoglobulina.

A presente invenção também compreende um método para a produção de um polipeptídio codificado por um ácido nucléico de acordo com a invenção, por:

a) fornecimento de uma célula eucariótica,

b) transfecção da dita célula eucariótica com um ácido nucléico de acordo com a invenção,

c) cultivo da dita célula transfectada sob condições adequadas para a expressão do dito ácido nucléico,

d) recuperação do dito polipeptídio do meio de cultura ou do citoplasma da dita célula.

A presente invenção também compreende um ácido nucléico compreendendo, na direção 5' a 3':

a) um primeiro sítio de clonagem múltipla,

b) um ácido nucléico começando com um sítio doador de splice

5' e terminado por um sítio receptor de splice 3', em que:

i) o dito ácido nucléico compreende um códon de parada de tradução e um sinal de poliadenilação, e ii) o dito ácido nucléico não é constitutivamente removido durante o processamento de pré-mRNA,

c) um segundo sítio de clonagem múltipla.

A invenção também compreende um vetor compreendendo o ácido nucléico não removido constitutivamente de acordo com a invenção. Descrição Detalhada da Invenção

A presente invenção compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio ou proteína heteróloga, em que o método compreende:

i) um primeiro ácido nucléico que codifica um polipeptídio ou proteína heteróloga sem um códon de parada de tradução, ii) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:

b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em um polipeptídio ou proteína, em que a dita célula transfectada produz polipeptídio ou proteína heteróloga solúvel e polipeptídio ou proteína heteróloga ligada a membrana plasmática por splicing alternativo do dito pré-mRNA,

c) a seleção de uma célula com polipeptídio ou proteína heteróloga ligada a membrana plasmática para ser a dita célula que expressa um polipeptídio ou proteína heteróloga.

Métodos e técnicas utilizáveis para a realização da presente invenção são descritos em, por exemplo, Ausubel, F.M. (ed.), Current Protocols in Molecular Biology, Volumes I a III (1997); Glover, N.D., e Hames, B.D., ed., DNA Cloning: A Practical Approach, Volumes I e II (1985), Oxford University Press; Freshney, R.l. (ed.), Animal Cell Culture - a practical approach, IRL Press Limited (1986); Watson, J.D., et al., Recombinant DNA, Segunda Edição, CHSL Press (1992); Winnacker, E.L., From Genes to Clones; N.Y., VCH Publishers (1987); Celis, J., ed., Cell Biology, Segunda Edição, Academic Press (1998); Freshney, R.I., Culture of Animal Cells: A Manual of Basic Technique, Segunda Edição, Alan R. Liss, Inc., N.Y. (1987).

O uso de tecnologia de DNA recombinante permite a produção de inúmeros derivados de um polipeptídio. Esses derivados podem, por exemplo, ser modificados em posições de aminoácidos individuais ou várias por substituição, alteração, troca, deleção ou inserção. A modificação ou derivatização pode, por exemplo, ser realizada por meio de mutagênese direcionada a sítio. Essas modificações podem ser facilmente realizadas por aqueles versados na técnica (veja, por exemplo, Sambrook, J., et al., Molecular Cloning: A laboratory manual (1999) Cold Spring Harbor Laboratory Press, New York, USA; Hames, B. D., e Higgins, S.G., Nucleic acid hybridization - a practical approach (1985) IRL Press, Oxford, England).

Dentro do âmbito da presente invenção, alguns dos termos usados são definidos a seguir:

Um ácido nucléico, conforme aqui usado, refere-se a uma molécula de polinucleotídeo, por exemplo, a tipos de DNA e/ou RNA. Essa molécula de polinucleotídeo pode ser uma molécula de polinucleotídeo de ocorrência natural ou uma molécula de polinucleotídeo sintética ou uma combinação de uma ou mais moléculas de polinucleotídeo de ocorrência natural ou seus fragmentos com uma ou mais moléculas de polinucleotídeo sintéticas. Também estão englobadas por esta definição moléculas de polinucleotídeo de ocorrência natural em que um ou mais nucleotídeos tenham sido trocados, por exemplo, por mutagênese, deletados ou acrescentados. O áci do nucléico pode ser isolado ou integrado em outro ácido nucléico, por exemplo, em um vetor de expressão ou no cromossomo de uma célula hospedeira eucariótica. Um ácido nucléico também é caracterizado por sua seqüência de ácido nucléico, que consiste em nucleotídeos individuais. Sabese na técnica como deduzir uma seqüência de aminoácidos a partir do ácido nucléico codificador correspondente e também como derivar um ácido nucléico correspondente a partir da seqüência de aminoácidos codificada. Assim, uma seqüência de aminoácidos também é caracterizada por seu ácido nucléico. Da mesma forma,, um ácido nucléico é dado por uma seqüência de aminoácidos correspondente.

As expressões plasmídio ou vetor, que são usadas de maneira intercambiável neste pedido, incluem, por exemplo, plasmídios bifuncionais e de expressão, assim como plasmídios de transfecção. Tipicamente, o plasmídio também compreenderá uma origem de replicação (por exemplo, a origem de replicação ColEI e oriP) e um marcador selecionável (por exemplo, um gene de resistência a ampicilina ou tetraciclina) para replicação e seleção, respectivamente, do plasm ídio em bactérias.

Um cassete de expressão refere-se a um construto que contém os elementos reguladores necessários para a expressão pelo menos do gene estrutural contida em uma célula. Opcionalmente, estão contidos elementos adicionais que permitem a secreção do polipeptídio ou proteína expressada.

Um gene designa um segmento, por exemplo, em um cromossomo ou em um plasm ídio, que é necessário para a expressão de um polipeptídio ou proteína. Além da região codificadora, o gene compreende outros elementos funcionais, incluindo um promotor, um ou mais introns e/ou éxons e um ou mais terminadores.

O termo gene estrutural, conforme usado neste pedido, designa a região codificadora de um gene, isto é, os éxons, sem uma seqüência de sinal, mas com introns intervenientes.

Um marcador selecionável designa um gene que permite que células portadoras do gene sejam especificamente selecionadas para ou contra, na presença ou ausência de um agente de seleção correspondente. Um marcador selecionável positivo utilizável é um gene de resistência a antibiótico. Esse marcador selecionável permite que a célula hospedeira transformada com o gene seja positivamente selecionada na presença do antibiótico correspondente; uma célula hospedeira não transformada não seria capaz de crescer ou sobreviver sob as condições de cultura seletivas, isto é, na presença do agente de seleção, em um meio seletivo.

Marcadores selecionáveis podem ser positivos, negativos ou bifuncionais. Marcadores selecionáveis positivos permite a seleção de células portadoras do marcador, ao passo que marcadores selecionáveis negativos permitem que células portadoras do marcador sejam seletivamente eliminadas. Tipicamente, um marcador selecionável conferirá resistência a um fármaco ou compensará um defeito metabólico ou catabólico na célula hospedeira. Marcadores selecionáveis utilizáveis com células eucarióticas incluem, por exemplo, os genes da aminoglicosida fosfotransferase (ΑΡΗ), como higromicina fosfotransferase (hyg), neomicina e G418 APH, diidrofolato redutase (DHFR), timidina quinase (tk), glutamina sintetase (GS), asparagina sintetase, triptofano sintetase (agente seletivo indol), histidinol desidrogenase (agente seletivo histidinol D), e genes que codificam resistência a puromicina, bleomicina, fleomicina, cloranfenicol, Zeocin e ácido micofenólico. Genes marcadores adicionais são descritos no WO 92/08796 e WO 94/28143.

Elementos reguladores, conforme aqui usado, referem-se a seqüências nucleotídicas presentes em cis e/ou trans, necessárias para a transcrição e/ou tradução do gene compreendendo o gene estrutural de interesse. Os elementos reguladores transcricionais normalmente compreende um promotor a montante da seqüência de gene a ser expressada, sítios de início e término de transcrição e uma seqüência de sinal de poliadenilação. O termo sítio de início de transcrição refere-se ao nucleotídeo no gene que corresponde ao primeiro ácido nucléico a ser incorporado no transcrito primário, isto é, o pré-mRNA; o sítio de início de transcrição pode se superpor à seqüência promotora. O termo sítio de término de transcrição refere-se a uma seqüência nucleotídica normalmente presente na extremidade 3' de um gene de interesse a ser transcrito, que faz com que a RNA polimerase termine a transcrição. A seqüência de sinal de poliadenilação, ou sinal de adição de poli-A fornece o sinal para a divagem em um sítio específico na extremidade 3' de um mRNA eucariótico e a adição pós-transcricional de uma se5 qüência de cerca de 100 - 200 nucleotídeos adenina (cauda poliA) à extremidade 3' clivada no núcleo. A seqüência de sinal de poliadenilação pode incluir a seqüência de consenso AATAAA localizada cerca de 10 - 30 nucleotídeos a montante do sítio de divagem.

Elementos reguladores de tradução incluem um códon de início 10 de tradução (AUG) e um de parada (TAA, TAG ou TGA). Um sítio de entrada em ribossomo interno (IRES) pode ser incluído em alguns construtos.

Um promotor refere-se a uma seqüência de polinucleotídeo que contra a transcrição de um gene ou seqüência de ácido nucléico à qual está operacionalmente ligado. Um promotor inclui sinais para a ligação de 15 RNA polimerase e início de transcrição. O promotor usado será funcional no tipo de célula da célula hospedeira em que se considera a expressão da seqüência selecionada/operacionalmente ligada. Um grande número de promotores, incluindo promotores constitutivos, induzíveis e reprimíveis de várias fontes diferentes, são conhecidos na técnica (e estão identificados em 20 bases de dados como o GenBank) e estão disponíveis como ou dentro de polinucleotídeos clonados (por exemplo, de depositários como a ATCC, assim como outras fontes comerciais ou individuais). Um promotor compreende uma seqüência nucleotídica que dirige a transcrição de um gene estrutural. Tipicamente, um promotor está localizado na região não codificadora 5' 25 ou não traduzida de um gene, proximal ao sítio de início de transcrição de um gene estrutural. Elementos de seqüência dentro de promotores que funcionam no início da transcrição são freqüentemente caracterizados por seqüências nucleotídicas de consenso. Esses elementos promotores incluem sítios de ligação de RNA polimerase, seqüências TATA, seqüências CAAT, 30 elementos específicos para diferenciação (DSEs; McGehee, R.E. Jr., et al., Mol. Endocrinol. 7 (1993) 551-60), elementos de resposta a AMP cíclico (CREs), elementos de resposta sérica (SREs; Treisman, R., Seminars in

Cancer Biol. 1 (1990) 47-58), elementos de resposta a glicocorticóides (GREs) e sítios de ligação para outros fatores de transcrição, como CRE/ATF (O'Reilly, M.A., et al., J. Biol. Chem. 267 (1992) 19938- 43), AP2 (Ye, J., et al., J. Biol. Chem. 269 (1994) 25728-34), SPI, proteína de ligação a elemento de resposta a cAMP (CREB; Loeken, M.R., Gene Expr. 3 (1993) 253-64) e fatores de octâmeros (veja, genericamente, Watson et al., eds., Molecular Biology of the Gene, 4- ed., The Benjamin/Cummings Publishing Company, Inc. (1987), e Lemaigre, F.P. e Rousseau, G.G., Biochem. J. 303 (1994) 1-14). Se um promotor for um promotor induzível, então, a taxa de transcrição aumenta em resposta a um agente indutor. Em contraste, a taxa de transcrição não é regulada por um agente indutor, se o promotor for um promotor constitutivo. Também se conhecem promotores reprimíveis. Por exemplo, o promotor c-fos é especificamente ativado por ligação do hormônio de crescimento a seu receptor na superfície celular. A expressão regulada por tetraciclina (Tet) pode ser conseguida por promotores híbridos artificiais, que consistem, por exemplo, em um promotor CMV seguido por dois sítios Tet-operadores. O Tet-repressor se liga a dois sítios Tet-operadores e bloqueia a transcrição. Com a adição do indutor tetraciclina, o Tet-repressor é liberado dos sítios Tet-operadores, e a transcrição prossegue (Gossen, M. e Bujard, H. PNAS 89 (1992) 5547-5551). Para outros promotores induzíveis, incluindo metalotioneína e promotores de choque térmico, veja, por exemplo, Sambrook et al. (supra) e Gossen et al., Curr. Opin. Biotech. 5 (1994) 516-520. Entre os promotores eucarióticos que foram identificados como promotores fortes para expressão de alto níveis estão o promotor precoce SV40, promotor tardio maior de adenovirus, promotor de metalotioneína-l de camundongo, repetição terminal longa do vírus do sarcoma de Rous, fator 1 alfa de alongamento de hamster chinês (CHEF-I, veja, por exemplo, US 5.888.809), EF-I alfa humano, ubiquitina e promotor precoce imediata de citomegalovírus humano (CMV IE).

O promotor pode ser constitutivo ou induzível. Um intensificador (isto é, um elemento de DNA de ação cis, que age sobre um promotor para aumentar a transcrição) pode ser necessário para funcionar em conjun to com o promotor para aumentar o nível de expressão obtido apenas com ο promotor, e pode ser incluído como um elemento regulador de transcrição. Frequentemente, o segmento polinucleotídico contendo o promotor incluirá uma seqüência intensificadora também (por exemplo, CMV ou SV40).

Operacionalmente ligado refere-se a uma justaposição de dois ou mais componentes, em que os componentes assim descritos estão em uma relação que permite que funcionem de sua maneira desejada. Por exemplo, um promotor e/ou intensificador estão operacionalmente ligados a uma seqüência codificadora, se agir em cis para controlar ou modular a transcrição da seqüência codificadora ligada. Geralmente, mas não necessariamente, as seqüências de DNA que estão operacionalmente ligadas são contíguas e, quando necessário para unir duas regiões codificadoras de proteínas, como um líder secretor e um polipeptídio, ou um polipeptídio e um domínio transmembrana, ou um polipeptídio e um peptídio de sinal para uma âncora GPI, ou um polipeptídio e um códon de parada de tradução, contíguas e em fase de leitura. Entretanto, embora um promotor operacionalmente ligado em geral esteja localizado a montante da seqüência codificadora, não é necessariamente contígua a ela. Intensificadores não têm de ser contíguos. Um intensificador está operacionalmente ligado a uma seqüência codificadora se o intensificador aumentar a transcrição da seqüência codificadora. Intensificadores operacionalmente ligados podem estar localizados a montante, dentro ou a jusante de seqüências codificadoras e a uma distância considerável do promotor. Um sítio de poliadenilação está operacionalmente ligado a uma seqüência codificadora se estiver localizado na extremidade a jusante da seqüência codificadora, de modo que a transcrição se processe da seqüência codificadora para a seqüência de poliadenilação. A ligação é realizada por métodos recombinantes conhecidos na técnica, por exemplo, usando-se metodologia de PCR e/ou por ligação em sítios de restrição convenientes. Se não existirem sítios de restrição convenientes, então, usam-se adaptadores ou elos oligonucleotídicos sintéticos de acordo com a prática convencional.

O termo produção de pré-mRNA, conforme aqui usado, desig na um processo de transcrição de DNA em seu pré-mRNA complementar. O DNA eucariótico é composto por regiões codificadoras e não codificadoras, que são chamadas de éxons (codificadoras) e introns (não codificadoras). No processo de transcrição de DNA em seu pré-mRNA complementar, a organização genômica de éxons e introns é mantida.

O termo processamento de pré-mRNA, conforme aqui usado, designa um processo de modificação pós-transcricional. Nessa etapa, os introns do pré-mRNA são submetidos a splicing, isto é, removidos do prémRNA, a extremidade 5' do mRNA processado é capeada, e se realizada a poliadenilação 3'. O mRNA nuclear final, isto é, maduro, é obtido nessa etapa.

O termo domínio transmembrana, conforme usado neste pedido, designa um polipeptídio ou proteína que é codificada no nível do DNA por pelo menos um éxon e que compreende uma região extracelular, uma transmembrana e uma intracelular. Um domínio transmembrana em geral compreende três regiões estruturais distintas: uma região extracelular N terminal, um trecho transmembrana conservado central e uma região citoplasmática C terminal. Em uma modalidade, o domínio transmembrana compreende, na direção N para C terminal, uma região extracelular e uma região transmembrana. O domínio transmembrana também pode compreender uma região intracelular ou citoplasmática.

O termo um fragmento de um domínio transmembrana, conforme usado neste pedido, designa a parte de um domínio transmembrana que atravessa a membrana celular, isto é, que está localizada dentro da membrana cleular, isto é, o trecho transmembrana.

O termo ácido nucléico de splicing alternativo designa um ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3'. Esse ácido nucléico contém um códon de parada de tradução e um sinal de poliadenilação. Esse ácido nucléico de splicing alternativo compreende uma região não codificadora que não é constitutivamente removida do pré-mRNA correspondente, como, por exemplo, o íntron depois do éxon que codifica um domínio de cadeia pesada de imunoglobuli na Ch3 ou Ch4. O evento de splicing alternativo que ocorre no sítio doador de splice 5' do ácido nucléico de splicing alternativo é um evento de decisão quanto a se o ácido nucléico de splicing alternativo é removido do pré-mRNA ou se é pelo menos mantido e compõe o mRNA maduro (processado).

O termo splicing alternativo e seus equivalentes gramaticais, conforme aqui usado, refere-se a um processo em células eucarióticas em que, a partir de um único pré-mRNA, devido a um processamento diferente de um ou mais introns, diferentes mRNAs maduros podem ser obtidos, e portanto, diferentes isoformas de um polipeptídio podem ser expressadas. Em uma modalidade da invenção, um único, isto é, apenas um, intron do pré-mRNA produzido por ser removido alternativamente. Em outra modalidade, o segundo ácido nucléico pode ser removido alternativamente. Uma modalidade adicional compreende o segundo ácido nucléico e um íntron alternativamente removível. O processamento diferente é uma decisão de sim/não, isto é, no processo de splicing alternativo, o íntron a ser processado, isto é, o ácido nucléico de splicing alternativo, é pelo menos parcialmente retido ou removido. Isso não deve ser entendido como um mecanismo de ponto de bifurcação resultando em diferentes éxons a seguir. É, de fato, um mecanismo em que um ácido nucléico de splicing alternativo é removido ou peto menos parcialnTente mantido no mRNA maduro. Com esse mecanismo, o ácido nucléico de splicing alternativo e, portanto, o códon de parada de tradução em fase de leitura nele compreendido é retido ou removido.

O splicing alternativo é um importante mecanismo regulador em células eucarióticas. Com o splicing alternativo, diferentes combinações de éxons em um mRNA maduro podem ser obtidas a partir do mesmo prémRNA, dando origem a uma pluralidade de diferentes proteínas codificadas pelo mesmo DNA.

O termo expressão, conforme aqui usado, refere-se a processos de transcrição e/ou tradução que ocorram dentro de uma célula. O nível de transcrição de um produto desejado em uma célula pode ser determinado com base na quantidade do mRNA correspondente que está presente na célula. Por exemplo, mRNA transcrito a partir de uma seqüência selecionada pode ser quantificado por PCR ou por hibridização Northern (veja Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press (1989)). Polipeptídios podem ser quantificados por vários métodos, por exemplo, por ELISA, por ensaio de atividade biológica do polipeptídio ou por emprego de ensaios que sejam independentes dessa atividade, como Western blotting, eletroforese em SDS gel de poliacrilamida, NMR ou radioimunoensaio, por exemplo, usando anticorpos que reconheçam e se liguem ao polipeptídio (veja Sambrook et al., 1989, supra).

Uma célula hospedeira refere-se a uma célula na qual se introduz um ácido nucléico heterólogo que codifica um polipeptídio ou proteína. A célula hospedeira inclui tanto células procarióticas, que são usadas para a propagação de plasmídios, e células eucarióticas, que são usadas para a expressão do ácido nucléico heterólogo. De preferência, as células eucarióticas são células de mamíferos. De preferência, as células de mamíferos são células CHO, células BHK, células NSO, células Sp2/0, células COS, células HEK, células PER.C6®.

Um polipeptídio é um polímero que consiste em aminoácidos unidos por ligações peptídicas, quer produzidos naturalmente, quer sinteticamente. Polipeptídios de menos de cerca de 20 resíduos de aminoácidos podem ser chamados de peptídios, ao passo que polipeptídios consistindo em mais de 100 resíduos de aminoácidos ou consistindo em duas ou mais cadeias polipeptídicas podem ser chamados de proteínas.

Uma proteína é uma macromolécula compreendendo pelo menos uma cadeia polipeptídica com um comprimento de 100 aminoácidos ou mais ou compreendendo duas ou mais cadeias polipeptídicas.

Polipeptídios e proteínas também podem compreender componentes não peptídicos, como grupos carboidrato, íons metálicos, lipídios, ésteres de ácidos carboxílicos ou suas combinações. Os substituintes não peptídicos podem ser acrescentados pela célula em que o polipeptídio ou proteína é produzida e podem variar com o tipo de célula. Polipeptídios e proteínas são aqui definidos em termos de suas estruturas principais de aminoácidos; adições, como grupos carboidrato, em geral não são especifica18 das, mas podem estar presentes.

DNA heterólogo ou ácido nucléico heterólogo refere-se a uma molécula de DNA ou a um ácido nucléico, ou a uma população de moléculas de DNA ou a uma população de ácidos nucléicos, que não existem natural5 mente dentro de uma dada célula hospedeira. Moléculas de DNA heterólogas a uma célula hospedeira particular podem conter DNA derivado da espécie da célula hospedeira (isto é, DNA endógeno), contanto que o DNA hospedeiro esteja combinado com DNA não hospedeiro (isto é, DNA exógeno). Por exemplo, uma molécula de DNA contendo um segmento de DNA 10 não hospedeiro que codifica um polipeptídio operacionalmente ligado a um segmento de DNA hospedeiro compreendendo um promotor é considerada uma molécula de DNA heterólogo. Inversamente, o DNA heterólogo pode compreender um gene estrutural endógeno operacionalmente ligado a um promotor exógeno.

Um peptídio ou polipeptídio codificado por um ácido nucléico não hospedeiro, isto é, heterólogo, é um peptídio ou polipeptídio heterólogo.

O termo polipeptídio biologicamente ativo, conforme aqui usado, refere-se a uma molécula orgânica, por exemplo, uma macromolécula biológica, como um peptídio, proteína, glicoproteína, nucleoproteína, muco20 proteína, lipoproteína, polipeptídio ou proteína sintética, que cause um efeito biológico quando administrado em ou a sistemas biológicos artificiais, como bioensaios usando linhagens celulares e vírus, ou in vivo a um animal, incluindo, mas não limitados a, avez e mamíferos, incluindo seres humanos. Esse efeito biológico pode ser, mas não se limita a, inibição ou ativação de uma 25 enzima, ligação a um receptor ou ligante, no sítio d eligação ou circunferencial, desencadeamento de sinal ou modulação de sinal. Em uma modalidade, do dito polipeptídio biologicamente ativo é selecionado do grupo de polipeptídios compreendendo imunoglobulinas, fragmentos de imunoglobulinas, conugados de imunoglobulinas e peptídios antifusogênicos.

Moléculas biologicamente ativas são, sem limitação, por exemplo, hormônios, citocinas, interleucinas, imunoglobulinas, peptídios antifusogênicos, fatores de crescimento, ligantes, agonistas ou antagonistas de re ceptor, agentes citotóxicos, agentes antivirais, agentes de formação de imagem, inibidores de enzimas, ativadores de enzimas ou moduladores da atividade de enzimas, como substâncias alostéricas, e conjugados desses.

O termo aminoácido, conforme usado neste pedido, designa um grupo de carbóxi α-aminoácidos, que, diretamente ou como precursores, possam ser codificados por ácidos nucléicos, compreendendo alanina (código de três letras: Ala, código de uma letra: A), arginina (Arg, R), asparagina (Asn, N), ácido aspártico (Asp, D), cisteína (Cys, C), glutamina (Gin, Q), ácido glutâmico (Glu, E), glicina (Gly, G), histidina (His, H), isoleucina (He, I), leucina (Leu, L), lisina (Lys, K), metionina (Met, M), fenilalanina (Phe, F), prolina (Pro, P), serina (Ser, S), treonina (Thr, T), triptofano (Trp, W), tirosina (Tyr, Y) e valina (Vai, V).

Um vetor de clonagem é um ácido nucléico, como um plasmídio, cosmídio, fagemídio ou cromossoma artificial bacteriano (BAC), que tenha a capacidade de se replicar de maneira autônoma em uma célula hospedeira. Vetores de clonagem tipicamente contêm um ou um pequeno número de sítios de reconhecimento de endonuclease de restrição que permitem a inserção de um ácido nucléico de uma maneira determinável, sem perda de uma função biológica essencial do vetor, assim como seqüências nucleotídicas que codificam um marcador selecionável, isto é, adequado para uso na identificação e seleção de células transformadas com o vetor de clonagem. Marcadores selecionáveis tipicamente incluem genes que conferem resistência a tetraciclina, neomicina, G418 ou ampicilina.

Um vetor de expressão é um ácido nucléico que codifica um polipeptídio ou proteína heteróloga para ser expressada em uma célula hospedeira. Tipicamente, um vetor de expressão compreende uma unidade de propagação de plasmídio procariótico, por exemplo, para E. coli, compreendendo uma origem de replicação procariótica e um marcador de seleção procariótica, um marcador de seleção eucariótica e um ou mais cassetes de expressão para a expressão de um ácido nucléico de interesse, cada um compreendendo um promotor, um ácido nucléico e um terminador de transcrição, incluindo um sinal de poliadenilação. A expressão do gene normal mente é colocada sob o controle de um promotor, e esse gene estrutural é dito operacionalmente ligado ao promotor. Da mesma forma, um elemento regulador e um promotor de núcleo estão operacionalmente ligados se o elemento regulador modular a atividade do promotor de núcleo.

Uma unidade de transcrição policistrônica é uma unidade de transcrição em que mais de um gene estrutural está sob o controle do mesmo promotor.

Um polipeptídio isolado ou uma proteína isolada é um polipeptídio ou proteína que seja essencialmente livre de componentes celulares 10 contaminantes, como carboidratos não covalentemente ligados, lipídios ou outras impurezas proteináceas, assim como impurezas não proteináceas associadas ao polipeptídio ou proteína na natureza. Tipicamente, uma preparação de polipeptídio/proteína isolada contém o polipeptídio/proteína em uma forma altamente purificada, isto é, pelo menos cerca de 80% pura, pelo 15 menos cerca de 90% pura, pelo menos cerca de 95% pura, mais de 95% pura ou mais de 99% pura. Uma maneira de mostrar que uma preparação particular contém um polipeptídio ou proteína isolada é pelo aparecimento de uma única banda na eletroforese em dodecil sulfato de sódio (SDS)-gel de poliacrilamida da preparação e coloração com Azul Brilhante de Coomassie 20 do gel. Entretanto, o termo isolado não exclui a presença do mesmo polipeptídio ou proteína em formas físicas alternativas, como dímeros ou formas alternativamente glicosiladas ou derivatizadas.

Conforme aqui usado, o termo imunoglobulina designa uma proteína consistindo em um ou mais polipeptídios substancialmente codifica25 dos por genes de imunoglobulinas. Essa definição inclui variantes, como formas mutantes, isto é, formas com substituições, deleções e inserções de um ou mais aminoácidos, formas truncadas, assim como formas fusionadas. Os genes de imunoglobulinas reconhecidos incluem os diferentes genes de regiões constantes, assim como a miríade de genes de regiões variáveis da 30 imunoglobulina. Imunoglobulinas podem existir em vários formatos, including, por exemplo, Fv, Fab, e F(ab)2, assim como cadeias simples (scFv) (por exemplo, Huston, J.S., et al., PNAS USA 85 (1988) 5879-5883; Bird,

R.E., et al., Science 242 (1988) 423-426; e, em geral, Hood et al., Immunology, Benjamin N.Y., 2- edição (1984) e Hunkapiller, T., e Hood, L, Nature 323(1986) 15-16).

Cada uma das cadeias polipeptídicas pesadas e leves de uma imunoglobulina, caso presentes, pode compreender uma região constante (em geral a parte terminal carboxila). A região constante da cadeia pesada medeia a ligação do anticorpo: i) a células portadoras de um receptor Fc, como células fagocíticas, ou ii) a células portadoras do receptor Fc neonatal (FcRn), também conhecido como receptor Brambell. Também medeia a liga10 ção a alguns fatores, incluindo fatores do sistema complemento clássico, como o componente C1q. Além disso, um domínio transmembrana pode seguir o domínio constante C terminal de uma cadeia pesada de imunoglobulina, isto é, o domínio C_H3 ou C_H4. Esse domínio transmembrana permite a formação de imunoglobulinas ligadas a membrana plasmática ou fragmentos 15 de imunoglobulinas ou imunoglobulina-polipeptídios de fusão.

Cada uma das cadeias polipeptídicas pesadas e leves de uma imunoglobulina, caso presentes, pode compreender um domínio variável (em geral, a parte amino terminal). O domínio variável de uma cadeia leve ou pesada de imunoglobulina compreende diferentes segmentos, isto é, quatro 20 regiões de armação (FR) e três regiões hipervariáveis (CDR).

O termo pelo menos um fragmento de designa uma fração de um ácido nucléico completo ou um polipeptídio completo, isto é, pelo menos 20%, pelo menos 40%, pelo menos 60% ou pelo menos 80% do ácido nucléico, polipeptídio ou domínio completo. Por exemplo, um ácido nucléico 25 que codifica pelo menos um fragmento de um domínio Ch3 ou Ch4 de imunoglobulina designa uma fração do ácido nucléico que codifica o domínio Ch3 ou Ch4 completo da imunoglobulina, isto é, pelo menos 20%, pelo menos 40%, pelo menos 60% ou pelo menos 80% do ácido nucléico que codifica o domínio C_H3 ou Ch4 completo da imunoglobulina. Em uma modalidade, 30 um fragmento de uma cadeia pesada de imunoglobulina é um fragmento C terminal de uma cadeia pesada de imunoglobulina.

O termo um códon de parada de tradução em fase de leitura designa um códon de parada de tradução (TAA, TAG ou TGA) que suceda a uma região codificadora de um ácido nucléico sem um deslocmento de fase da fase de leitura com relação à região codificadora precedente do ácido nucléico, isto é, que termine a região codificadora durante a tradução. Um códon de parada de tradução em fase de leitura está operacionalmente ligado à região codificadora precedente de um ácido nucléico.

O termo sem um códon de parada de tradução em fase de leitura designa a ausência de um códon de parada de tradução (TAA, TAG ou TGA) no ácido nucléico designado e/ou a presença de um códon de parada de tradução, que pode ser encontrado dentro ou na extremidade de uma região codificadora de um ácido nucléico, mas que seja devido a um ou dois deslocamentos de pares de bases não reconhecidos durante a tradução do mRNA processado (isto é, fora de fase, não ligado operacionalmente) e, portanto, não termine a região codificadora no processo de tradução.

Terminador de transcrição, conforme designado neste pedido, é uma seqüência de DNA de 50 - 750 pares de bases de comprimento, que forneça à RNA polimerase o sinal para o término da síntese de mRNA. Terminadores muito eficientes (fortes) na extremidade 3' de um cassete de expressão são aconselháveis para evitar que a RNA polimerase continue lendo, particularmente quando se usam promotores fortes. Terminadores de transcrição ineficientes podem levar à formação de um mRNA do tipo óperon, o que pode ser a razão para uma expressão do gene indesejável, por exemplo, codificada por plasmídio.

Os termos não removido constitutivamente durante o processamento de pré-mRNA e não removido constitutivamente do pré-mRNA (correspondente), conforme usados neste pedido, designam um processo de splicing que não ocorre de maneira não excepcional durante o processo do pré-mRNA, isto é, o ácido nucléico de um íntron específico é removido apenas às vezes durante o processamento do pré-mRNA.Como resultado, dois mRNA maduros diferentes são obtidos, um com pelo menos uma parte do íntron e um sem o íntron.

O termo âncora GPI, conforme usado neste pedido, designa uma modificação pós-tradução fixada a uma terminação C de um polipeptídio ou proteína. Uma âncora GPI tem uma estrutura de núcleo compreendendo pelo menos um resíduo de fosfato de etanolamina, uma trimanosida, um resíduo de glucosamina residue e um inositol fosfolipídio. Apesar dessa estrutura de núcleo, uma âncora GPI normalmente possui uma certa microheterogeneidade e, conseqüentemente, uma proteína com uma âncora GPI normalmente é uma mistura de proteínas com âncoras GPI homólogas da mesma estrutura de núcleo com diferentes modificações da cadeia colateral.

O termo peptídio de sinal para uma âncora GPI designa uma seqüência de aminoácidos C terminal de um polipeptídio ou proteína que consiste em um aminoácido ao qual a âncora GPI pode ser fixada, um peptídio espaçador opcional e um peptídio hidrofóbico. Quase todo esse peptídio de sinal, isto é, o peptídio espaçador opcional e o peptídio hidrofóbico, é removido pós-tradução pela enzima GPI-transaminase, e se forma uma ligação entre o grupo amino do fosfato de etanolamina de núcleo da âncora GPI e o aminoácido ao qual a âncora GPI está ligada.

Após a transfecção com um ácido nucléico heterólogo, células que expressem um polipeptídio heterólogo codificado pelo ácido nucléico heterólogo têm de ser selecionadas. Para a seleção, usa-se um marcador. O marcador indica células em uma população que tenham sido transformadas com sucesso e facilita a seleção e o isolamento dessas células. Podem-se usar diferentes marcadores, como, por exemplo, marcadores selecionáveis, ou etiquetas detectáveis, como a Proteína Fluorescente Verde (GFP).

A seleção das células pode ser realizada em uma única etapa ou em múltiplas etapas. Em um procedimento de única/múltiplas etapas, a primeira seleção pode ser efetuada com base, por exemplo, em um nível de limitar de um marcador selecionável, como uma etiqueta detectável. Por exemplo, para a seleção por citometria de fluxo (por exemplo, por FACS Classificação de Células Ativada por Fluorescência), estabelece-se um nível de limiar de fluorescência, e células com uma fluorescência acima desse nível de limiar são selecionadas. Alternativamente, células nos 1 - 15% superiores (isto é, os 15% das células com a etiqueta detectável mais intensa), ou os 1 -10% superiores, ou 1 - 5% superiores, ou 5 -10% superiores ou 5 6% superiores da intensidade de fluorescência da população de amostra podem ser coletadas. Um método alternativo para a seleção de células é a ligação imunológica, por exemplo, a glóbulos magnéticos revestidos com Proteína A ou imunoglobulinas específicas. O painel de células selecionado pode ser tomado como a população básica para uma etapa de seleção adicional, por exemplo, por semeadura de uma única célula, cultivo e análise por ELISA (Ensaio Imunossorvente Ligado a Enzima), ou por clonagem de diluição limitada, ou por expansão por cultivo sob condições seletivas de cultura em um meio de seleção durante vários dias e uma seleção FACS adicional, ou por uma seleção FACS adicional com um nível de limiar mais alto, que pode se basear, por exemplo, nas intensidades de fluorescência detectadas em uma seleção FACS precedente, ou por um método de imunoprecipitação (veja, por exemplo, também o WO 2005/020924). A seleção de uma célula de acordo com a invenção pode ser efetuada por um método selecionado no grupo da citometria de fluxo, ELISA, imunoprecipitação, cromatografia de coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia ou ligação imunológica. Em uma modalidade, a seleção de uma célula de acordo com a invenção pode ser efetuada por um método selecionado do grupo da citometria de fluxo, ELISA, imunoprecipitação, cromatografia em coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia ou ligação imunológica, seguido por um método selecionado do grupo de semeadura e cultivo de célula única, diluição limitada ou expansão por cultivo, seguido por um método selecionado do grupo de FACS, imunoprecipitação, cromatografia em coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia, ou ELISA.

Como a eficácia dos métodos de transfecção e vetores conhecidos na técnica é muito alta e, portanto, obtém-se uma pluralidade de células transfectadas, são preferidos marcadores que também permitam a corrleção do rendimento de expressão de uma célula transfectada com a intensidade detectada do marcador. Conseqüentemente, é funcional ligar a expressão do polipeptídio heterólogo de interesse à expressão do marcador

A presente invenção usa metodologia de splicing, isto é, splicing alternativo, para expressar um polipeptídio heterólogo e um marcador pelo mesmo ácido nucléico, isto é, pelo mesmo cassete de expressão, em que, por exemplo, não se emprega IRES. O marcador na presente invenção é uma forma ligada a membrana plasmática do polipeptídio heterólogo expressado. Na presente invenção, o marcador selecionável compreende como parte N terminal o polipeptídio heterólogo e como parte C terminal pelo menos um fragmento de um domínio transmembrana ou uma âncora GPI. Assim, o polipeptídio heterólogo produzido e a parte extracelular do marcador selecionável, isto é, a parte do marcador selecionável que é detectada, são idênticos.

A presente invenção compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio heterólogo, em que o método compreende:

b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em um polipeptídio heterólogo, em que a dita célula transfectada produz polipeptídio heterólogo solúvel e polipeptídio heterólogo ligado a membrana plasmática por splicing alternativo do dito pré-mRNA, e

Durante a transcrição do DNA, obtém-se uma cópia do DNA, o chamado RNA pré-mensageiro (pré-mRNA). Esse pré-mRNA tem a mesma organização do DNA de molde, isto é, tem uma organização de íntron-éxon genômico. Apenas os éxons contêm a informação da seqüência de aminoácidos do polipeptídio codificado.

Assim, os introns têm de ser removidos do pré-mRNA antes da tradução. Esse processo é chamado de splicing de RNA.

Um ácido nucléico de splicing se caracteriza por pelo menos um sítio doador de splice 5', um sítio receptor de splice 3' e um chamado sítio de ramificação, que normalmente se localiza 20 - 50 bases a montante do sítio receptor. Essa arquitetura efetua o reconhecimento e a excisão do ácido nucléico do sítio doador de splice 5' para o sítio receptor de splice 3' do pré-mRNA durante o splicing de RNA. Durante a etapa de splicing, gerase o mRNA maduro do qual um polipeptídio ou proteína é traduzida. Em uma modalidade da presente invenção, pelo menos um ácido nucléico, de preferência o segundo ácido nucléico, é um ácido nucléico de splicing, contendo elementos reguladores adicionais, como um códon de parada em fase de leitura e um sinal de poliadenilação.

Porém, o processo de splicing não é exclusivo. É possível, por exemplo, que um íntron não seja removido durante o processamento do prémRNA a partir do pré-mRNA e esteja, portanto, pelo menos parcialmente incrustado no mRNA maduro. Se um códon de parada em fase de leitura estiver presente nesse íntron opcionalmente incluído, a tradução pára nesse códon de parada, e se produz uma vriante do polipeptídio codificado.

O reconhecimento e a excisão de um íntron freqüentemente é regulada por elementos de ação cis adicionais no pré-mRNA. Devido a sua função e posição, esses elementos são chamados de intensificador de splice exônico (ESE), silenciador de splice exônico (ESS), intensificador de splice intrônico (ISE) ou silenciador de splice intrônico (ISS), respectivamente (Black, D. L, Annu Rev Biochem 72 (2003) 291-336).

O DNA genômico da maioria dos genes eucarióticos tem uma organização íntron-éxon. Por exemplo, dentro do éxon que codifica o domínio C terminal da forma secretada de uma cadeia pesada de imunoglobulina (isto é Ch3 ou Ch4, respectivamente) é um sítio doador de splice 5'.

Se esse sítio doador de splice não for eficaz no processamento do pré-mRNA de cadeia pesada, o íntron que segue esse éxon, que contém um códon de parada e um sinal de poliadenilação, é pelo menos parcialmente retido no mRNA maduro. O mRNA é, então, traduzido em uma cadeia pesada de imunoglobulina que termina com um domínio Ch3 ou Ch4 e representa uma imunoglobulina solúvel. Essa é a principal via de processamento de genes de cadeias pesadas de imunoglobulinas em células secretoras de imunoglobulinas.

Se esse sítio doador de splice for eficaz no processamento do pré-mRNA de cadeia pesada de imunoglobulina, o íntron consecutivo e, portanto, o códon de parada são removidos. Portanto, a tradução não pára depois do domínio C terminal de uma cadeia pesada de imunoglobulina. Além disso, a tradução continua com o sucessivo splicing a éxons que codificam um domínio transmembrana. Essa via de processamento menor para genes de cadeias pesadas de imunoglobulinas resulta em uma forma de imunoglobulina ligada a membrana plasmática apresentada na superfície cleular de uma célula produtora de imunoglobulinas.

Esse processo é chamado de splicing alternativo, e o ácido nucléico (isto é, o íntron) opcionalmente removido nesse processo é chamado de ácido nucléico de splicing alternativo.

Se um ácido nucléico que codifica um polipeptídio heterólogo ou uma proteína estiver ligado a um ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou a um ácido nucléico que codifica um peptídio de sinal para uma âncora GPI por um ácido nucléico de splicing alternativo, isto é, um ácido nucléico de splicing alternativo está locali zado entre esses dois ácidos nucléicos, e, dessa forma, esses três ácidos nucléicos estão operacionalmente ligados, duas variantes do polipeptídio ou proteína heteróloga são expressadas: uma variante solúvel, isto é, uma variante compreendendo apenas o polipeptídio ou proteína, e uma variante ligada a membrana plasmática, isto é, uma variante compreendendo tanto o polipeptídio ou proteína, quanto o domínio transmembrana ou a âncora GPI.

Em uma modalidade, ácido nucléico transfectado está compreendido em um cassete de expressão. Em uma modalidade, o primeiro ácido nucléico está sem um códon de parada de tradução em fase de leitura em sua terminação 3'. Em outra modalidade, os primeiro, segundo e terceiro ácidos nucléicos estão operacionalmente ligados. Em uma modalidade, o terceiro ácido nucléico codifica pelo menos um fragmento de um domínio transmembrana. Em outra modalidade, o fragmento de um domínio transmembrana é uma região transmembrana. Em uma modalidade, o terceiro ácido nucléico codifica um peptídio de sinal para uma âncora GPI. Em uma modalidade da invenção, o polipeptídio codificado pelo primeiro ácido nucléico é selecionado do grupo que compreende cadeias pesadas de imunoglobulinas, cadeias leves de imunoglobulinas, polipeptídios biologicamente ativos, seus fragmentos e seus polipeptídios de fusão. Em uma modalidade da invenção, o polipeptídio codificado pelo primeiro ácido nucléico é selecionado do grupo que compreende cadeias pesadas de imunoglobulinas, cadeias leves de imunoglobulinas, seus fragmentos, e suas fusões. Em uma modalidade, o terceiro ácido nucléico codifica pelo menos um fragmento de um domínio transmembrana de imunoglobulina.

Em maiores detalhes, a presente invenção compreende um método para a seleção de uma célula eucariótica que expresse uma cadeia pesada de imunoglobulina, em que o método compreende:

i) um primeiro ácido nucléico que codifica uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:

b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz cadeia pesada de imunoglobulina solúvel e cadeia pesada de imunoglobulina ligada a membrana plasmática por splicing alternativo do dito pré-mRNA, e

c) a seleção de uma célula com cadeia pesada de imunoglobulina ligada a membrana plasmática para ser a dita célula que expressa uma cadeia pesada de imunoglobulina.

Em uma modalidade, a presente invenção compreende um método para a seleção de uma célula eucariótica que expresse uma imunoglobulina, em que o método compreende:

a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo um primeiro cassete de expressão para uma cadeia leve de imunoglobulina e um segundo cassete de expressão compreendendo, na direção 5' a 3':

b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz imunoglobulina solúvel e imunoglobulina ligada a membrana por splicing alternativo do dito pré-mRNA, e

c) a seleção de uma célula com imunoglobulina ligada a membrana para ser a dita célula que expressa uma imunoglobulina.

a) a transfecção de uma célula eucariótica com dois ácidos nucléicos simultânea ou seqüencialmente, em que um ácido nucléico compreende um cassete de expressão para uma cadeia leve de imunoglobulina e o outro ácido nucléico compreende um cassete de expressão compreendendo, na direção 5' a 3':

Em uma modalidade, o domínio transmembrana codificado pelo terceiro ácido nucléico é um domínio transmembrana de imunoglobulina. Em uma modalidade da invenção, o segundo ácido nucléico compreende apenas um sítio doador de splice 5' e apenas um sítio receptor de splice 3'. Em outra modalidade da presente invenção, o segundo ácido nucléico é um intron de cadeia pesada de imunoglobulina de ocorrência natural, que segue o éxon que codifica um domínio de cadeia pesada de imunoglobulina Ch3 ou Ch4, em que no dito íntron pelo menos 50 nucleotídeos consecutivos estão deletados.

Por exemplo, para a expressão recombinante de cadeias pesadas de imunoglobulinas em células eucarióticas, emprega-se um ácido nucléico com organização genômica íntron-éxon ou contendo apenas as regiões codificadoras, isto é cDNA. Em ambos os casos, o ácido nucléico termina com o códon de parada após o éxon que codifica o domínio C terminal da cadeia pesada de imunoglobulina. Depois disso, na organização genômica, os sucessivos introns e éxons, compreendendo um ácido nucléico de splicing alternativo e um domínio transmembrana, são omitidos. Conseqüentemente, com esse ácido nucléico apenas a cadeia pesada de imunoglobulina solúvel é obtida.

Se para a expressão recombinante de imunoglobulinas ou seus fragmentos a organização genômica do gene de cadeia pesada de imunoglobulina for retida pelo menos parcialmente, isto é, se o íntron depois do éxon que codifica o domínio C terminal (isto é, o ácido nucléico de splicing alternativo) e o(s) sucessivo(s) éxon(s) que codifica(m) um domínio transmembrana forem retidos, é possível o splicing alternativo. No evento de splicing alternativo, os códons terminais 3' e o códon de parada do éxon que codifica o domínio CH3 ou CH4, respectivamente, são removidos como/com a seqüência intrônica, e se gera, ao invés, um mRNA maduro diferente, em que a região codificadora, isto é, a fase de leitura, é alongada em sua extremidade 3' pelo(s) éxon(s) adicionalmente mantido(s). Esse mRNA é traduzido em uma cadeia pesada de imunoglobulina estendida na terminação C, que contém um domínio transmembrana adicional ou seu fragmento, codificado pelo(s) éxon(s) 3' adicional(ais). Essa cadeia pesada de imunoglobulina alongada é incorporada durante a montagem de imunoglobulinas, resultando em imunoglobulinas ligadas à membrana plasmática. Descobriu-se agora, surpreendentemente, que, com esse ácido nucléico de acordo com a invenção, células transfectadas produtoras de um polipeptídio heterólogo podem ser selecionadas. Essa metodologia é genericamente aplicável e não se restringe a imunoglobulinas. Para praticar essa metodologia, o ácido nucléico para expressão recombinante de um polipeptídio heterólogo sem um códon de parada em fase de leitura tem de estar operacionalmente ligado a e em fase de leitura com o ácido nucléico de splicing alternativo derivado de uma imunoglobulina compreendendo um códon de parada de tradução em fase de leitura e um sítio de poliadenilação. O sucessivo terceiro ácido nucléico também e variável e pode ser selecionado de qualquer ácido nucléico que codifique um domínio transmembrana ou seu fragmento, assim como de qualquer ácido nucléico que codifique um peptídio de sinal para uma âncora GPI. Esses elementos, isto é, o ácido nucléico que codifica o polipeptídio, o ácido nucléico de splicing alternativo e o ácido nucléico que codifica o domínio transmembrana ou o peptídio de sinal para uma âncora GPI, podem ser selecionados e combinados de diferentes genes, assim como de diferentes organismos. O único pré-requisito é que os três ácidos nucléicos sejam combinados de modo que o códon de parada de tradução no ácido nucléico de splicing alternativo esteja em fase de leitura com a fase de leitura do ácido nucléico que codifica o polipeptídio, isto é, possa ser reconhecido pelo ribossomo e a tradução seja terminada.

Genericamente, com o splicing alternativo, opcionalmente uma fração da terminação C da forma solúvel do polipeptídio heterólogo é/pode ser removida do pré-mRNA como parte de um íntron. Essa fração engloba opcionalmente os códons terminais 3', a região não traduzida 3', o códon de parada e o sinal de poliadenilação da forma secretada. Conseqüentemente, o ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' que é removido opcionalmente se superpõe/pode se superpor à terminação C da variante não processada alternativamente.

Portanto, com o uso de um ácido nucléico de acordo com a invenção com uma organização genômica pelo menos parcialmente retida de um gene de cadeia pesada de imunoglobulina, duas variantes de um polipeptídio heterólogo podem ser obtidas, uma variante solúvel curta e uma variante ligada a membrana plasmática longa.

Em uma modalidade em que o primeiro ácido nucléico codifica uma cadeia pesada de imunoglobulina, o primeiro ácido nucléico compreende todos os éxons e todos, exceto um, introns do gene de cadeia pesada de imunoglobulina genomicamente organizado. Em uma modalidade, o terceiro ácido nucléico codifica um fragmento de um domínio transmembrana ou um peptídio de sinal para uma âncora GPI, em que o fragmento do domínio transmembrana é codificado por um único éxon. Em outra modalidade, o domínio transmembrana é um domínio transmembrana de imunoglobulina codificado por uma fusão MI-M2-éxon, isto é, por um único éxon sem o intron genomicamente interveniente. Em uma modalidade, o domínio transmembrana da imunoglobulina é codificado por um cDNA.

Com a introdução de um ácido nucléico com uma organização genômica global pelo menos parcialmente retida de um gene de cadeia pesada de imunoglobulina gene em uma célula hospedeira, obtém-se uma célula que expressa, por um lado, polipeptídio heterólogo solúvel e, por outro lado, polipeptídio heterólogo ligado a membrana plasmática. Por exemplo, para se obterem as duas variantes de imunoglobulina, isto é, para permitir splicing alternativo, não é necessário manter a organização genômica inteira do gene de cadeia pesada de imunoglobulina, isto é, todos os introns e éxons. É necessário apenas manter o sítio de splice alternativo em uma forma funcional. Um sítio de splice funcional é uma seqüência de ácido nucléico compreendendo um sítio doador de splice 5' e um sítio receptor de splice 3', permitindo, dessa forma, a excisão da seqüência de ácido nucléico interveniente do pré-mRNA. O reconhecimento e a excisão de um íntron freqüentemente são regulados por elementos de ação cis adicionais no pré-mRNA. Devido a sua função e posição, esses elementos são chamados de intensificador de splice exônico (ESE), silenciador de splice exônico (ESS), intensificador de splice intrônico (ISE) ou silenciador de splice intrônico (ISS), respectivamente (Black, D. L, Annu Rev Biochem 72 (2003) 291-336, que é aqui incorporado por referência).

Para a seleção de células transfectadas que expressem um polipeptídio heterólogo, podem-se usar diferentes métodos, como, sem limitação, métodos espectroscópicos, por exemplo, fluorescência, ELISA e suas variantes, por ensaio da atividade biológica ou por emprego d eensaios que sejam independentes dessa atividade, como Western blotting, eletroforese em SDS gel de poliacrilamida, ou radioimunoensaio, usando-se anticorpos que reconheçam e se liguem ao polipeptídio heterólogo. Como o polipeptídio heterólogo ligado a membrana plasmática tem a mesma seqüência de aminoácidos e estrutura secundária que o polipeptídio heterólogo solúvel, exceto por sua terminação C, pode ser determinado, por exemplo, com os mesmos anticorpos para a variante solúvel.

A variante ligada a membrana plasmática de um polipeptídio está firmemente conectada à célula que a expressa. Conseqüentemente, a variante ligada a membrana plasmática pode ser usada como um marcador par aisolar células que tenham sido transfectadas com sucesso com um ácido nucléico para a expressão de um polipeptídio ou proteína heteróloga, por exemplo, uma imunoglobulina. Em uma modalidade, o polipeptídio é uma imunoglobulina. Em uma modalidade, a imunoglobulina é selecionada do grupo de IgG, IgE, e IgA.

A razão molecular da variante solúvel do polipeptídio heterólogo para a variante ligada a membrana plasmática do polipeptídio heterólogo é de mais de 50:50 a menos de 100:0, de preferência de mais de 75:25 a menos de 100:0. Por exemplo, se uma célula eucariótica for transfectada com um ácido nucléico de acordo com a invenção que codifique uma imunoglobu lina, células transfectadas com sucesso podem ser selecionadas pelo aparecimento de imunoglobulina ligada a membrana.

Um ácido nucléico de acordo com a invenção é um ácido nucléico contendo, na direção 5' a 3', uma região codificadora para um polipeptídio heterólogo, um ácido nucléico de splicing alternativo e uma região codificadora para um domínio transmembrana ou seu fragmento ou uma região codificadora para um peptídio de sinal para uma âncora GPI. Em maiores detalhes, a presente invenção compreende um ácido nucléico, compreendendo:

c) um terceiro ácido nucléico que codifica:

i) pelo menos um fragmento de um domínio transmembrana, ou . ii) um peptídio de sinal para uma âncora GPI.

Em outras modalidades, i) o sítio de splice 5' do intron de splice alternativo está localizado em 5' com relação ao códon de parada normal do ácido nucléico que codifica the polipeptídio heterólogo, ii) o segundo ácido nucléico é um ácido nucléico de splicing alternativo, e iii) o sítio de splice 5' é usado apenas às vezes e não constitutivamente, resultando em uma razão molecular de polipeptídio heterólogo normalmente processado, isto é, polipeptídio solúvel, para polipeptídio heterólogo alternativamente processado, isto é polipeptídio ligado a membrana plasmática, de mais de 50:50 a menos de 100:0. Em uma modalidade, o primeiro ácido nucléico e o segundo ácido nucléico estão operacionalmente ligados, isto é, o códon de parada de tradução do segundo ácido nucléico está em fase de leitura com a fase de leitura do primeiro ácido nucléico que codifica um polipeptídio ou seu fragmento.

O ácido nucléico que pode ser removido por splicing alternativo segue o ácido nucléico que codifica pelo menos um fragmento de um polipeptídio e precede o ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou que codifica um peptídio de sinal para uma âncora GPI. Em uma modalidade, o polipeptídio heterólogo é um polipeptídio de fusão compreendendo N terminalmente um polipeptídio de interesse e C terminalmente pelo menos um fragmento de um domínio de cadeia pesada de imunoglobulina Ch3 ou Ch4 ou sua variante. Em uma modalidade, o ácido nucléico compreende um quarto ácido nucléico entre o primeiro ácido nucléico e o segundo ácido nucléico e/ou o segundo ácido nucléico e o terceiro ácido nucléico. Isto é, o quarto ácido nucléico está localizado, por exemplo, depois do segundo ácido nucléico (isto é, depois do sítio receptor de splice 3') e antes da extremidade 5' do terceiro ácido nucléico.

Com um ácido nucléico de splicing alternativo localizado entre o ácido nucléico que codifica um polipeptídio heterólogo e o ácido nucléico que codifica um domínio transmembrana ou que codifica um peptídio de sinal para uma âncora GPI, duas variantes do polipeptídio heterólogo podem ser expressadas: um polipeptídio heterólogo sem domínio transmembrana ou âncora GPI e um polipeptídio heterólogo com domínio transmembrana ou âncora GPI. O polipeptídio heterólogo pode ser selecionado de, sem limitação, por exemplo, hormônios; citocinas; fatores de crescimento; ligantes, agonistas ou antagonistas de receptores; agentes citotóxicos; agentes antivirals; agentes de formação de imagem; inibidores de enzimas; ativadores de enzimas ou moduladores da atividade de enzimas, como substâncias alostéricas; imunoglobulinas; ou fusões ou seus fragmentos. Em uma modalidade, o polipeptídio é uma imunoglobulina, um polipeptídio de cadeia pesada de imunoglobulina ou uma fusão de imunoglobulina.

A invenção pode ser praticada com qualquer polipeptídio, qualquer domínio transmembrana e qualquer peptídio de sinal para uma âncora GPI, contanto que um ácido nucléico de splicing alternativo esteja incrustado. Em maiores detalhes, o fragmento de ácido nucléico começando com o sítio doador de splice 5' e terminado pelo sítio receptor de splice 3' tem de ser apropriadamente escolhido. O polipeptídio precedente e o domínio transmembrana ou âncora GPI sucessivo podem ser escolhidos livremente.

A presente invenção também compreende um ácido nucléico compreendendo:

a) um primeiro sítio de clonagem múltipla,

b) um ácido nucléico de splicing começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', em que:

i) o ácido nucléico de splicing compreende um códon de parada e um sinal de poliadenilação, e ii) o ácido nucléico de splicing não é constitutivamente removido durante o processamento de pré-mRNA,

c) um segundo sítio de clonagem múltipla.

A presente invenção pode ser praticada, por exemplo, sem limitação, com o segundo ácido nucléico, isto é, o ácido nucléico de splicing alternativo, derivado do grupo de ácidos nucléicos que codificam o receptor C3b/C4b (receptor de complemento do tipo 1) (Hourcade, D., et al, J. Exp. Med. 168 (1988) 1255-1270), EGFR humano, de galinha e e rato (Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., e Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L, et al., Mol. Cell Biol. 10 (1990) 2973-2982), cadeia pesada α, ε, γ e μ de imunoglobulina (lg) (Zhang, K., et al., J. Exp. Med. 176 (1992) 233-243; Rogers, J.E., et al., Cell 20 (1980) 303312; Milcarek, C, e Hall, B„ Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, B.J., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293-301; Peterson, MX., Gene Exp. 2 (1992) 319-327), receptor PLA₂ humano (Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), Cek5 de galinha (Connor, RJ., e Pasquale, E.B., Oncogene 11 (1995) 2429-2438), FGFR humano (Johnson, D.E., et al, Mol. Cell Biol. 11 (1991) 4627-4634.

Em uma modalidade, o segundo ácido nucléico é um íntron de uma imunoglobulina localizado entre o éxon que codifica o domínio Ch3/Ch4 e o éxon que codifica pelo menos um fragmento do domínio transmembrana. Em uma modalidade, o segundo ácido nucléico é derivado do grupo de ácidos nucléicos que codificam cadeia pesada α (alfa) de imunoglobulina (lg) humana (hu), cadeia pesada δ (delta) de lg hu, cadeia pesada ε (epsilon) de lg hu, cadeia pesada yl, γ2, γ3 e γ4 (gama) de lg hu, cadeia pesada μ (mu) de lg hu, cadeia pesada de Ig murídea de tipo α (alfa), cadeia pesada de Ig muridea do tipo δ (delta), cadeia pesada de Ig murídea do tipo ε (epsilon), cadeia pesada de Ig murídea do tipo γΙ (gama 1), cadeia pesada de lg murídea do tipo γ2Α (gama 2A), cadeia pesada de lg murídea do tipo γ2Β (gama 2B), cadeia pesada de lg murídea do tipo γ3 (gama 3) e cadeia pesada de lg murídea do tipo μ (mu).

Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada γ3 de imunoglobulina humana, cadeia pesada γ4 de imunoglobulina humana, cadeia pesada ε de imunoglobulina humana (1) e cadeia pesada ε de imunoglobulina humana (2). Em uma modalidade, o segundo ácido nucléico é derivado/selecionado do grupo de ácidos nucléicos que codificam cadeia δ pesada de imunoglobulina humana, cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada μ de imunoglobulina humana, cadeia pesada murídea do tipo a, cadeia pesada murídea do tipo γΙ, cadeia pesada murídea do tipo γ2Β, cadeia pesada murídea do tipo γ3, e cadeia pesada murídea do tipo μ.

A presente invenção pode ser praticada, por exemplo, sem limitação, com o terceiro ácido nucléico, no caso do ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana, selecionado do grupo de ácidos nucléicos que codificam receptor C3b/C4b (receptor de complemento tipo 1) (Hourcade, D., et al., J. Exp. Med. 168 (1988) 12551270), EGFR humano, de galinha e de rato (Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., e Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L, et al., Mol. Cell Biol. 10 (1990) 2973-2982), lg α, ε, γ, μ heavy chain (Zhang, Κ., et al., J. Exp. Med. 176 (1992) 233-243; Rogers,J.E., et al., Cell 20 (1980) 303-312; Milcarek, C, e Hall, B., Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, BJ., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293301; Peterson, M.L., Gene Exp. 2 (1992) 319-327), receptor PLA₂ humano (Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), Cek5 de galinha (Connor, R. J., e Pasquale, E.B., Oncogene 11 (1995) 2429-2438), FGFR humano (Johnson, D.E., et al., Mol. Cell Biol. 11 (1991) 4627-4634. Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada α (alfa) de imunoglobulina (Ig) humana (hu), cadeia pesada δ (delta) de Ig hu, cadeia pesada ε (epsilon)de Ig hu, cadeia pesada γΙ, γ2, γ3 e γ4 (gama)de Ig hu, cadeia pesada μ (mu) de Ig hu, cadeia pesada de Ig murídea do tipo α (alfa), cadeia pesada de Ig murídea do tipo δ (delta), cadeia pesada de Ig murídea do tipo ε (epsilon), cadeia pesada de Ig murídea do tipo γΙ (gama I), cadeia pesada de Ig murídea do tipo γ2Α (gama 2A), cadeia pesada de Ig murídea do tipo γ2Β (gama 2B), cadeia pesada de Ig murídea do tipo γ3 (gama 3) e cadeia pesada de Ig murídea do tipo μ (mu). Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada γ3 de imunoglobulina humana, cadeia pesada γ4 de imunoglobulina humana, cadeia pesada ε de imunoglobulina humana (1) e cadeia pesada ε de imunoglobulina humana (2). Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada δ de imunoglobulina humana, cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada μ de imunoglobulina humana, cadeia pesada murídea do tipo a, cadeia pesada murídea do tipo γΙ, cadeia pesada murídea do tipo γ2Β, cadeia pesada murídea do tipo γ3 e cadeia pesada murídea do tipo μ.

Além do grupo de ácidos nucléicos que codificam pelo menos um fragmento de um domínio transmembrana, o terceiro ácido nucléico pode ser selecionado do grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI. O grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI compreende o grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI derivado de diesterase alcalina humana, acetilcolina esterase, fosfatase alcalina (intestinal, de fígado e placenta), antígeno CAMPATH-1, antígeno carcinoembrionário, CD55, CD59, CD90, contactina-1, antígeno E48, receptor de folato A e

B, proteína p137 ancorada em GPI, antígeno 3 associado a função de linfócito, proteína de interação com mDIA, 5'-nucleotidase, fator ativador de uroquinase plasminogênio; de antígeno LY-6C murídeo, antígeno LY-6, 5¹nucleotidase, antígeno 0X45, antígeno 2 de célula tronco, molécula 1 de adesão de células vasculares, antígeno 2 de linfócito Qa (Qa2); de trealase de coelho; de proteína brevicano de rato, CD90, proteína glipicano, proteoglicano de sulfato de heparina, antígeno MRC OX-45, 5'-nucleotidase, glicoproteína maior de grânulo secretor pancreático, proteína RT6.2 de superfície de células T; de proteína de reparo de DNA de levedura PHRI, proteína 1 de superfície ancorada a glicofosfolipídio; de proteína precursora de amilóide suíno, dipeptidase; de proteínas de superfície de variantes diversas de Trypanosoma brucei, proteína repetitiva ácida policíclico; de proteína YN em 1.1 de superfície da variante Trypanosoma congolense; de melanotransferrina de galinha, molécula de adesão celular neutra; de acetilcolina esterase de Torpedo marmorata; de proteína de prion de hamster; de 5'-nucleotidase bovina; de proteína de membrana Gp64 de bolor, antígeno específico préesporo; e de Sgpl, Sgp2 de lula.

Na Tabela 1, são dados exemplos de seqüências de ácidos nucléicos do segundo ácido nucléico, de acordo com a invenção. Na Tabela 2, são dados exemplos de seqüências de ácidos nucléicos do terceiro ácido nucléico de acordo com a invenção e de seqüências de aminoácidos correspondentes às seqüências do terceiro ácido nucléico de acordo com a invenção. Na Tabela 3, são dados exemplos de seqüências de ácidos nucléicos do quarto ácido nucléico opcional e de seqüências de aminoácidos correspondentes aos quartos ácidos nucléicos opcionais de acordo com a invenção.

A Tabela 1 relaciona o sítio doador de splice 5', o segundo ácido nucléico (de splicing alternativo) e o sítio receptor de splice 3‘. Como a seqüência do segundo ácido nucléico em geral excede 1 kb, as seqüências relacionadas na Tabela 1 estão encurtadas e mostram aproximadamente o primeiro e os últimos 100 nucleotídeos do segundo ácido nucléico, separados por um número que se refere ao tamanho total do segundo ácido nucléi co completo. A seqüência completa do segundo ácido nucléico está contida na SEQ ID NO dada da listagem de seqüência. O códon de parada está sublinhado.

O sítio doador de splice é dado em um formato compreendendo a seqüência de consenso precedente do sítio doador de splice e os primeiros seis nucleotídeos do segundo ácido nucléico separados por uma linha vertical (veja também, por exemplo, Zhang, M.Q., Human Mol. Gen. 7 (1998) 919-932). Da mesma forma, o sítio receptor de splice é dado pela listagem dos últimos 6 nucleotídeos do segundo ácido nucléico e a seqüência de consenso do sítio receptor de splice sucessivo, que estão separadas por uma linha vertical. Os nucleotídeos diretamente depois (sítio doador de splice 5') e diretamente antes (sítio receptor de splice 3¹) da linha vertical são os primeiros e últimos nucleotídeos do segundo ácido nucléico (de splicing). O códon de parada no segundo ácido nucléico está sublinhado na Tabela 1.

O segundo ácido nucléico pode estar diretamente ligado ao ácido nucléico que codifica o polipeptídio heterólogo, isto é, o primeiro ácido nucléico, ou com uma pequena (9 a 21 bases) seqüência de ácido nucléico interveniente. Em uma modalidade, o ácido nucléico interveniente opcional (quinto) é derivado do ácido nucléico que precede o segundo ácido nucléico no genoma do qual o dito segundo ácido nucléico é obtido.

Na Tabela 2, relacionam-se exemplos de seqüências do terceiro ácido nucléico que codifica fragmentos dos domínios transmembrana e seqüências de aminoácidos de peptídios de sinal para âncoras GPI. Essa seqüência pode seguir diretamente ou com uma seqüência interveniente opcional, isto é, um quarto ácido nucléico, o sítio receptor de splice 3'. Na Tabela 3, relacionam-se exemplos de quartas seqüências de ácidos nucléicos e de seqüências de aminoácidos correspondentes aos quartos ácidos nucléicos.

Em uma modalidade, o ácido nucléico de acordo com a invenção compreende um quarto ácido nucléico entre o dito segundo ácido nucléico e o dito terceiro ácido nucléico. Em uma modalidade, o ácido nucléico de acordo com a invenção compreende um quinto ácido nucléico entre o dito primeiro ácido nucléico e o dito segundo ácido nucléico. Uma modalidade da presente invenção é que o dito terceiro ácido nucléico é obtido de i) o mesmo, ou ii) um gene ou organismo diferente do dito segundo ácido nucléico, isto é, o dito terceiro ácido nucléico não está necessariamente organizado 5 com o dito segundo ácido nucléico em um genoma.

As seqüências são derivadas de genomas ou bases de dados publicamente disponíveis (por exemplo, projeto do genoma humano, http://www.gdb.org/; base de dados do genoma de camundongo, http://www.informatics.jax.org/; SwissProt (http://www.expasy.org/sprot/).

Quando nenhuma anotação era acessível, as seqüências foram previstas ou complementadas pelo software ALOM (veja, por exemplo, Klein, P., et al., Biochim. Biophys. Acta 787 (1984) 221-226). No caso de domínios transmembrana completos, a seqüência entre parênteses é prevista por ALOM, além da seqüência dada no SwissProt.

Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos compreendendo SEQ ID NO: 001, 002, 003, 004, 005, 006, 007, 008, 009, 151, 152, 153, 154, 155, 156, 157, 158, 159, 169, 170, 171, 172, 173. Em uma modalidade, o segundo ácido nucléico do ácido nucléico de acordo com a invenção é selecionado do grupo de seqüências 20 de ácidos nucléicos de SEQ ID NO: 001 a SEQ ID NO: 009. Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos compreendendo SEQ ID NO: 002, 003, 156, 157, 170 e 171. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do 25 grupo de seqüências de ácidos nucléicos de SEQ ID NO: 010 a SEQ ID NO: 018, e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 019 a SEQ ID NO: 069. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo 30 de seqüências de ácidos nucléicos de SEQ ID NO: 010, 011, 012, 013, 014, 015, 016, 017, 018, 160, 161, 163, 164, 165, 166, 167, 168, 174, 175, 176, e de seqüências de ácidos nucléicos que codificam as seqüências de aminoá43 cidos de SEQ ID NO: 019 a SEQ ID NO: 069 e 162. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 011,012, 165, 166, 175 e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 019 a SEQ ID NO: 036. Em outra modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 011,012, 165, 166, e 175. Em uma modalidade, o quarto ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou compreende um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 070 a SEQ ID NO: 078 e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 079 a SEQ ID NO: 129.

Tabela 1: Exemplos de segundos ácidos nucléicos

proteína	sítio doador de splice 5'	SEGUNDO ÁCIDO NUCLÉICO (ÁCIDO NUCLÉICO DE SPLICING)	SÍTIO RECEPTOR DE SPLICE 3'
cadeia pesada δ de imunoglobulina humana	GCT \| GTGAG T	GTGAGTCACCCCCAGGCCCAGGGTTG GGACGGGGACTCTGAGGGGGGCCATA AGGAGCTGGAATCCATACTAGGCAGGGGTGGGCACTGGGCAGGGGCGGG ... (2.77 KB TOTAL) ... GACTCGCCGTCATTTCAGCTCCACGCT GTGCGGGGGTGGGTGGAGGGGTAGC CTGGCCCTCATGACCAGGGAGCTTCTCACTCAGCCCCTGTTCCTCCCCAG (SEQ ID NO: 001)	CCCCAG\|A
cadeia pesada γ1 de imunoglobulina humana	CGG \| GTAAAT	GTAAATGAGTGCCACGGCCGGCAAGC CCCCGCTCCCCAGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTGTACATACTTCCCAGGCACCC ... (1.3 KB TOTAL) ... CCCGGCCGGGCCCTACATCCTGGGTC CTGCCACAGAGGGAATCACCCCCAGA GGCCCAAGCCCAGGGGGACACAG-	GTCCAG\|A

		CACTGACCACCCCCTTCCTGTCCAG (SEQ ID NO: 002)
cadeia pesada γ2 de imunoglobulina humana	CGG \| GTAAAT	GTAAATGAGTGCCACGGCCGGCAAGC CCCCGCTCCCCAGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTCTACATACTTCCCGGGCACCC ... (1.3 KB TOTAL) ... CCCGGCCGGGCCCTACATCCTGGGTC CTGCCACAGAGGGAATCACCCCCAGAGGCCCGAGCCCAGCAGGACACAGTATTGACCACCCACTTCCTGTCCAG (SEQ ID NO: 003)	GTCCAG\|A
cadeia pesada μ de imunoglobulina humana	CCG \| GTAAA C	GTAAACCCACCCTGTACAACGTGTCCC TGGTCATGTCCGACACAGCTGGCACCTGCTACTGACCCTGC TGGCCTGCCCACAGGCTCGGGGCGGCTGGCC ... (1.9 KB TOTAL) ... GCCTAGGGGCCAAGGGTGGGCCTAGA GGATGGGCCCCGGGGGGGCTTTGCT GGGTGCCACCCCAGCCTGACCCTATT CCCCCGTGCTGTGTCTCCTGCAG (SEQ ID NO: 004)	CTGCAG\|A
cadeia pesada de Ig murídea tipo α	CGG \| GTAAA C	GTAAACCCACCAATGTCAGCGTGTCTG TGATCATGTCAGAGGGAGATGGCATCTGCTACTGAGCCACCCT GCCTGTCCCTACTCCTGAAATAAACTC TGT ... (2.43 KB TOTAL) ... CCACTGTCCCCAAAGCCCAAGGAGGC ATAGAAGCAGAAACCTTAAGTCTGAGC CCCCATCCCCATGGGTTTGGATCTAGAAGGTCATCTATGTCTTACAG (SEQ ID NO: 005)	TTACAG \| A
cadeia pesada de Ig murídea tipo ε	TTG \| GTAAC A	GTAACACCTCCCTCCATCCCTCCTAGG CCTCCATGTAGCTGTGGTGGGGAAGG TGGATGACAGACATCCGCTCACTGTTG TAACACCAG- GAAGCTACCCCAATAAACACTCAGTGC CTGATTAGAGCCCTGGGT ...(1.7KB	TTGAAG\|A

(2)		TOTAL)... ACTGGCTGGTCCCACCCCATCCCAGAGCTAGACCTCCAGGACCTATGTATTGAAG (SEQ ID NO: 173)
source	sítio doador de splice 5'	SEGUNDO ÁCIDO NUCLÉICO (ÁCIDO NUCLÉICO DE SPLICING)	SÍTIO RECEPTOR DE SPLICE 3'
cadeia pesada de lg murídea tipo γ1	CTG \| GTAAAT	gtaaatgatcccagtgtccttggagcc CTCTGGTCCTACAGGACTCTGACACCTACCTCCACCCCTCCCTGTGTAAATAA AGCACCCAGCACTGCCTTGG ... (1.4 KB TOTAL) ... CTGCAGCI I ICTCCTGGGCCTCCATAC AGCCTCCTGCCACACAGGGAATGGCCCTAGCCCCACCTTA TTGGGACAAACACTGACCGCCCTCTCT GTCCAG (SEQ ID NO: 006)	GTCCAG\|G
cadeia pesada de lg murídea tipo γ2Β	CGG \| GTAAAT	GTAAATGAGCTCAGCACCCACAAAGCT CTCAGGTCCTAAGAGACACTGGCACCCATATCCATGCATCCCTTGTATAAATAAAGCATCCAGCAAAGCCTGG ... (1.36 KB TOTAL)... AGATCTCTCCTCTGACTTCATGCAGAC ATGTCTGCCTCACAGGGAATCTCTCCC AGCATCAAC- CATGTTGGGACAAACACTGACTGTCCT CTCTGTTCAG (SEQ ID NO: 007)	GTTCAG \| G
cadeia pesada de lg murídea tipo γ3	CTG \| GTAAAT	GTAAATGAGAACAGCACCTAGCCATTC CTCGGGTCTTACAAGACACTGATACCAGCCCTAACCGGTGAACCCTATAAATAAAGCACCCAGAGATGGGACC ... (TOTAL 1.47 KB) ... CTGCAGCTTTCTCCTGGGCCTCCATGC AGCCTCCTGCCACA- CAGGGAATGGCCCTAGCTCTACCTTGT TGGGACAAACACTGACTTTCCTCTCTG TTCAG	GTTCAG\|A

		(SEQ ID NO: 008)
cadeia pesada de Ig murídea tipo μ	CTG \| GTAAA C	GTAAACCCACACTGTACAATGTCTCCC TGATCATGTCTGACACAGGCGGCACCTGCTATTGACCATGCTAGCGCTCAACCAGGCAGGCCCTGGGTGTCCA ... (TOTAL 1.86 KB)... GTCAATACTCGCTAAGATTCTCCAGAA CCATCAGGGCACCCCAACCCTTATGCA AATGCTCAGTCACCCCAAGACTTGGCTTGACCCTCCCTCTCTGTG TCCCTTCATAG (SEQ ID NO: 009)	TCATAG\|A
receptor 1 de fator de crescimento de fibroblastos humanos	AAG \| GTACAC	GTACACACTGTAACTTCTCCTCTCGATGTCCT GCCCTCGCCACGGGCAC.GGGGGGAG CATGCAI I ICCAGGCTTGGGGAGACA CAGAGGCAGGAGAGCTGGAAGAATGG GCTCCTGCCTGCCTGGTGCCACATCCTGCCCCAGCTTTGAGGGCTGA ATCCTCTCAGCTCAGA ... (2KB TOTAL) CATGGACGGGGCCCTCCAAGCCTGCT AACACCCTGTTCGCACTGACTCAG SEQ ID NO: 151)	ACTCAG \| C
receptor de fator de crescimento epitelial murídeo	TGG \| GTACG T	GTACG TTCAATGGCAGTGGATCTTAAAGACCI I I IGGATCTAAGA CCAGAAGCCA TCTCTGACTCCCCTCTCACC ...(2.7KB TOTAL)... GTATGGAATG CCCATATTAC CTTCTCTTGTCTCTCATTCCAG (SEQ ID NO: 152)	TTCCAG \| G
receptor 1 de comple mento huma-	AGG \| GTGAG T	GGGTGAGTTGGCAGCAACATCTCTTG G l I IAAGAGTTCCAGCACAGCGATAGT AC I I ICTAGCCACATCTCAGCAAGGAA ACTAGGCTATTGCCACCTGCTCTTAAGAGGCTTGAACACA ...(5.7KB TOTAL)...	CTTTAG \| G

no (C3b/C 4b)		TAGACTTCTCCTGCATTGTAATCCCTCT GGTTTGCCACATATGCATGCTGTCAGG AAGTTGATGAGGTATGTACAGCACAATTTA Illi CCA I I I I I IGCCTTTAG (SEQIDNO:153)
receptor de interleucina 4 muridea	ACC \| GTGAG T	GTGAGTAT- CAGGGTCGTAGGCTGTGAGGATCTCTACAGCCG ...(1.3KB TOTAL)... GGGCGGCCTCCCCATTCATGACTGI I I I ICTCCTTGCAG (SEQIDNO:154)	TTGCAG\|A
cadeia pesada a de imunoglobulina humana	CGG \| GTAAA C	GTAAACCCACCCATGTCAATGTGTCTG TTGTCATGGCGGAGGTGGACGGCACC TGCTACTGAGCCGCCCGCCTGTCCCC ACCCCTGAATAAACTCCATGCTCCCCC AAGCAGCCCCACGCTT ...(2.6KB TOTAL)... CCCAAGGAAGCATAGCCGCTGTTCACACGAGTCTGGGCCTGGCAG (SEQ ID NO: 155)	TGGCAG\| G
cadeia pesada ε de imunoglobulina humana (1)	CCG \| GTAAAT	GTAAATGACGTACTCCTGCCTCCCTCCCTCCCAGGG CTCCATCCAGCTGTG ...(1.9KB TOTAL) CGTTGACTGACTCGGGACCTGGGTGC CCACCCTCAG (SEQIDNO:156)	CCTCAG\|G
cadeia pesada δ de imunoglobulina muridea	GTG \| GTAAG T	GTAAGTCACAACTGGGTAAGAGTGTCA AGCAAGGACAGCACTTGGTACCTATGA TAGACAAATACTCCTG I I I GGGAAGAG GAGGTCTGCATTGTCTAGATAAGAGGA ACACTGTGCTTATCTGTTTCAGTTTAAA AGACAGAACTACATAACACTTCACCCTTTCTACAACACTTA- GA I I I I ICAGCCCTCTCCTCTA ...(6.35KB TOTAL)... TTCTGTAGGGTGGAGACCTTCTCAT-	CCCTAG\|G

		GAGCACTAGTTCTTCCCTAG (SEQ ID NO: 172)
cadeia pesada ε de imunoglobulina humana (2)	CCG \| GTAAAT	GTAAATGACGT ACTCCTGCCT CCCTCCCTCC CAGGGCTCCA TCCAGCTGTG ...(2.1KB TOTAL) GCCACTGTGG AGCCGGGAGG GCTGACTGGC CAGGTCCCCC AG (SEQ ID NO: 170)	CCCCAG\|A
cadeia pesada γ3 de imunoglobulina humana	CGG \| GTAAAT	GTAAAT- GAGTGCGACGGCCGGCAAGCCCCCG CTCCCCGGGCTCTC ...(1.3 KB TOTAL) CCCCAGAGGCCCGAGCCCAGCAGGACACAGCACTGAC- CACCCTCTTCCTGTCCAG (SEQ ID NO: 157)	GTCCAG\|A
cadeia pesada γ4 de imunoglobulina humana	TGG \| GTAAAT	GTAAATGAGTGCCAGGGCCGGCAAGC CCCCGCTCCCCGGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTGTACATACTTC ...(1.3 KB TOTAL) CCCCA- GAGGCCCAAGCCCAGGGGGACACAGCACTGAC- CACCCCCTTCCTGTCCAG (SEQ ID NO: 171)	GTCCAG\|A
cadeia pesada de lg murídea tipo ε (1)	TTG \| GTAAC A	GTAACACCTCCCTCCATCCCTCCTAGG CCTCCATGTAGCTGTGGTGGGGAAGG TGGATGACAGACATCCGCTCACTGTTG TAACACCAG- GAAGCTACCCCAATAAACACTCAGTGC CTGATTAGAGCCCTGGGT ...(1.5KB TOTAL)... CCACTCTAGCTTCATCAGAACTGCATG AGACAAGTATGGGGTCTACCCCCTCC CCACTGTCACCTGGAGTCTGGGGAAG CTAACTGGCTGGTCCCACCCCATCCCA GAGCTAGACCTCCAGGACC-	TTGAAG\|A

bulina humana/trecho transmembrana	CCTTCATCGTCCTCTTCCTCCTG AGCCTCTTCTACAGTACCACCGTCACCTTGTTCAAG
cadeia pesada de Ig muridea tipo α/trecho transmembrana	ACTGTGACCTTCCTCACCCTCTT CCTACTGAGCTTGTTCTACAGCACAGCACTCACTGTTACA	014
cadeia pesada de Ig muridea tipo γΐ/trecho transmembrana	GGGCTCTGGACGACCATCACCATCTTCATCAGCCTCTTCCTGCTCAGTGTGTGC(TACAGCGCTGCTGTC ACACTCTTCAAGGTA	015
cadeia pesada de Ig muridea tipo v2B/trecho transmembrana	GGGCTCTGGACGACCATCACCATCTTCATCAGCCTCTTCCTGCTCAGCGTGTGC(TACAGCGCCTCTGTC ACACTCTTC)	016
cadeia pesada de Ig muridea tipo v3/trecho transmembrana	GGGCTCTGGACGACCATCACCA TCTTCATCAGCCTCTTCCTGCTCAGCGTG TGCTACAGCGCCTCTGTCACCCTCTTC	017
cadeia pesada de Ig muridea tipo μ/trecho transmembrana	(AACCTGTGGAC- CACTGCCTCCACC)TTCATCGTC CTCTTCCTCCTGAGCCTCTTCTA CAGCAC- CACCGTCACCCTGTTC(AAGGTG )	018
acetilcolina esterase humana/peptidio de sinal de âncora GPI sem peptídio de elo opcional	GE- AARRPGLPLPLLLLHQLLLLFLSHL RRL	019
fosfatase alcalina humana (intestinal)/peptidio de sinal de âncora GPI sem peptídio de elo opcional	DAAHPVAASLPLLAGTLLLLGASAAP	020
fosfatase alcalina humana (figado)/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSAGSLAAGPLLVALALYPLSVLF	021
fosfatase alcalina humana	DAAHPGRSVVPALLPLLAG-	022

		TATGTATTGAAG (SEQ ID NO: 158)
cadeia pesada de Ig murídea tipo γ2Α	TGG \| GTAAAT	GTAAATGAGCTCAGCACACACAATGCT CCTGGGTCCTAATGGACACTGGCACC CATATCCATGCATCCCTTGTATAAATAAAGCACCCAGCAAAGCCTGGGACCATGTAAAACTGT ...(1.35KB TOTAL)... GAAGGCTCCAGGAAGGGTCTGCTGTA CCAGTCAGGCTGGAGCTCTCTCCTCTA CTTCATGCAAACATGTCTGCATCACAG GGAATCTCTCCCAGCACCAACCATGTTGGGACAAACACTGACTGTCCT CTCTGTTCAG (SEQ ID NO: 159)	GTTCAG\|G
receptor de interleucina 4 humana	ACT \| GTGAG T	GTGAGTATCAAGAGGCCTAAGCAATGGTAATCTCCACTCTCCATTCTTC CCCTG ...(3.1KB TOTAL)... GGAGCCCAGGCTGTACCATGGCTGACCTCAGCTCATGGCTTCC CCTCCCACTTCCAG (SEQ ID NO: 169)	TTCCAG \| C

Tabela 2: Exemplos de terceiros ácidos nucléicos e aminoácidos correspondentes aos terceiros ácidos nucléicos.

fonte	SEQÜÊNCIA DE NUCLEOTÍDEOS OU AMINOÁCIDOS	SEQ ID NO:
cadeia pesada δ de imunoglobulina humana/trecho transmembrana	AGCCTGTGGACCACCCTGTCCA CGTTTGTGGCCCTCTTCATCCTC ACCCTCCTCTACAGCGGCATTGTCACTTTCATCAAGGTGAAG	010
cadeia pesada γ1 de imunoglobulina humana/trecho transmembrana	GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGTTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC	011
cadeia pesada γ2 de imunoglobulina humana/trecho transmembrana	GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGCTAAGCGTGTG CTACAGTGCCACCATCACCTTCTTC	012
cadeia pesada μ de imunoglo-	AACCTGTGGGCCACCGCCTCCA	013

(placenta)/peptídio de sinal de âncora GPI sem peptídio de elo opcional	TLLLLETATAP
antígeno CAMPATH-1 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SASSNISGGIFLFFVANAIIHLFCFS	023
antígeno carcinoembrionário humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional	ASGTSPGLSAGATVGIMIGVLVGVALI	024
CD55 humano (fator de aceleração de decaimento)/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SGTTRLLSGHTCFTLTGLLGTLVT MGLLT	025
CD59 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional	NGGTSLSEKTVLLLVTPFLAAAW SLHP	026
antígeno CD90 humano (Thy/1 )/peptídio de sinal de âncora GPI sem peptídio de elo opcional	CEGISL- LAQNTSWLLLLLLSLSLLQATDFM SL	027
contactina-1 humana (CNTN1)/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SGAPTLSPSLLGLLLPAFGILV	028
antígeno E48 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional	DLCNEKLHNAAPTRTALAHSALSLGLALSLLAVILAPSL	029
receptor de folato A humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SGAGPWAAWPFLLSLALMLLWLL S	030
receptor de folato B humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional	NAGEMLHGTGGLLLSLALMLQLW LLG	031
proteína p137 ancorada a GPI humana/peptídio de sinal de	ARGLMNGYRGPAMDSEEDMMV TALHSLTLQTVVIHSLSSVLPGIT-	032

âncora GPI sem peptídio de elo opcional	LAIN
antígeno-3 associado a função de linfócitos humanos/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSGHSRHRYALIPIPLAVITTCIVLYMNVL	033
proteína de interação mDIA humana/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SGASSLHRHFGLLLASLAPLVLCL SLL	034
5'-nucleotidase humana/peptídio de sinal de âncora GPI sem peptídio de elo opcional	STGSHCHGSFSLIFLSLWAVIFVLYQ	035
fator ativador de uroquinase plasminogênio humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional	GAAPQPGPAHLSLTITLLMTARLWGGTLLWT	036
antígeno LY-6C de proteína de superfície celular murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional	NAAVPTGASTWTMAGVLLFSLSS VILQTLL	037
5'-nucleotidase murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional	NERLVSAAPGHALLSSVTLGLATSLSLLTVMAL CL	038
antígeno 0X45 murídeo (BCM-1 ou Blast-1)/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SAASHYQGSFPLVILSLSAVIFVLYQ	039
antígeno 2 de célula tronco murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSGVCWTATWLVVTTLIIHRILLT	040
molécula 1 de adesão de células vasculares murídeas/peptídio de sinal de âncora GPI sem peptídio de elo	NFSAAGLGLRASIPLLGLGLLLSLLALLQLSP	041

opcional
proteína brevicano de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional	AKSFYFICYLCLYLAL	042
antígeno CD90 (Thy-1) de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional	GNSAEGSMPAFLLFLLLQLWDT	043
proteína glipicano de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional	CGGISLLVQNTSWLLLLLLSLSFL QATDFISL	044
antígeno MRC OX-45 de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SAATR- PEPHYFFLLFLFTLVLAAARPRWR	045
5'-nucleotidase de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSGVHWIAAWLVVTLSIIPSILLA	046
glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SAASHYQGSFPLIILSFWAVILVLYQ	047
proteína RT6.2 de superfície de células T de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional	RNTGFLLAWPTFFLPVFLAWLF	048
proteína PHR1 de reparo de DNA de levedura/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSAGARESCVSLFLVVLPSLLVQLLCLAE P	049
proteína 1 de superfície ancorada a glicofosfolipídio de levedura/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSGVKATQQMSMVKLVSIITIVTAFVGGMSVVF	050

proteína precursora de amilóide suíno/peptídio de sinal de âncora GPI sem peptídio de elo opcional	NAATNVKANLAQWFTSIISLSIAAGVGFALV	051
dipeptidase suína/peptídio de sinal de âncora GPI sem peptídio de elo opcional	ARAAPTTSLGSLMTVSALAILGWS V	052
proteína IL Tat 1.1 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SAAPSLHLPPGSLLASLVPLLLLSL P	053
proteína MIT 117a de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SNSFVIHKAPLFLAFLLF	054
proteína MIT 118a de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional	DSSILVTKKFALTVVSAAFVALLF	055
proteína MIT 221 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional	NGSFLTSKQFAFSVVSAAFVALLF	056
proteína MITat 1.1000BC de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SNSFVISKTPLWLAVLLF	057
proteína MITat 1.5b de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional	DGSFLVNKKFALMVYDFVSLLAF	058
proteína repetitiva ácida procíclica de Trypanosoma brucei/peptídio de sinal de âncora	NGSFLTSKQFALMVSAAFVTLLF	059

GPI sem peptídio de elo opcional
proteína TxTat 1 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional	GAATLKSVALPFAIAAAALVAAF	060
proteína YNat 1.1 de superfície variante de Trypanosoma congolense/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SNSFVINKAPLLLGFLLF	061
melanotransferrina de galinha/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SGSSHGTKAIRSILHVALLM	062
molécula de adesão de células neurais de galinha/peptídio de sinal de âncora GPI sem peptídio de elo opcional	AGNKLIQQHLLVITFVPFIILGQLQGLG	063
acetilcolina esterase de Torpedo marmorata/peptídio de sinal de âncora GPI sem peptídio de elo opcional	ATLGSPSTSSSFVSLLLSAVTLLLL C	064
proteína prion de hamster/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSSGTSSSKGIIFYVLFSILYLIFY	065
5'-nucleotidase bovina/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSAVLFSSPPVILLISFLIFLMVG	066
proteína Gp64 de membrana de bolor/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SAGSHCCGSFSLIFLSVLAVIIILYQ	067
antígeno específico préesporo de bolor/peptídio de sinal de âncora GPI sem peptídio de elo opcional	SSATTIAFNAFVVFAIVLSVLLF	068

receptor 1 do fator de crescimento de fibroblastos humanos	GSASTWASLSLIIFSMILSLC	069
receptor do fator de crescimento epitelial murideo	TCGCCCCTGTACCTGGAGATCA TCATCTATTGCA- CAGGGGCCTTCCTCATCTCCTG CATGGTGGGGTCGGTCATCGTCTAC	160
receptor 1 de complemento humano (C3b/C4b)	AAGATACCATCTATTGCCACTGG GATTGTGGGTGGCCTCCTCTTC ATAGTGGTGGTGGCCCTTGGGA TTGGCCTATTCATGCGAAGACGT	161
receptor 4 de interleucina humana	THDALIVGTLSGTIFFILLIIFLSWIILK	162
receptor 4 de interleucina murídea	TTCGAGCAG- CACCTCCTGCTGGGCGTCAGCG TTTCCTGCATTGTCA TCCTGGCCGTCTGCCTGTTGTG CTATGTCAGCATCACCAAGATTAAG	174
cadeia pesada a de imunoglobulina humana/trecho transmembrana	CGCCTTCCACTGGGGGTCACCA TCTCCTGCCTCTGCATCCCGTT GI I I IGCCTGTTCTGTTACTTCA GCATTACCAAGATT	163
cadeia pesada ε de imunoglobulina humana/trecho transmembrana	ACCAT- CACCTTCCTCACCCTCTTCCTGC TGAGCCTGTTCTATAGCACAGCACTGACCGTGACC	164
cadeia pesada γ3 de imunoglobulina humana/trecho transmembrana	TGGACGTGGACCGGCCTCTGCA TCTTCGCCGCACTCTTCCTGCT CAGCGTGAGCTACAGCGCCGCCATCACGCTCCTCATGGTGCAG	165
cadeia pesada γ4 de imunoglobulina humana/trecho transmembrana	GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGTTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC	166

cadeia pesada de lg murídea tipo ε/trecho transmembrana	GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGCTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC	175
cadeia pesada de lg murídea tipo δ/trecho transmembrana	GAGCTGTGGACCAGTATTTGTG TCTTCAT- CACCCTGTTCCTGCTCAGTGTG AGCTATGGGGCCACTGTCACCG TCCTC	167
cadeia pesada de lg murídea tipo y2A/trecho transmembrana	GGCCTGTGGCCCACAATGTGCA CCTTCGTGGCCCTCTTCCTGCT CACACTGCTCTACAGTGGCTTCGTCACCTTCATCAAGGTA	176
	GGGCTCTGGACAACCATCACCA TCTTCATCAGCCTCTTCCTGCTCAGCGTG TGTTACAGCGCCTCTGTCACACTCTTC	168

Table 3: Exemplos de quartos ácidos nucléicos e aminoácidos correspondentes aos quartos ácidos nucléicos.

fonte	SEQÜÊNCIA DE NUCLEOTÍDEOS OU AMINOÁCIDOS	SEQ ID NO:
cadeia pesada δ de imunoglobulina humana	ACCTGGCCATGACCCCCCTGATCCC	070
cadeia pesada γ1 de imunoglobulina humana	AGCTGCAACTGGAGGAGAGCTGTGCGGAG	071
cadeia pesada γ2 de imunoglobulina humana	AGCTGCAACTGGAGGAGAGCTGTGCGGAGGCGC	072
cadeia pesada μ de imunoglobulina humana	AGGGGGAGGTGAGCGCCGAC GAGGA	073
cadeia pesada de lg murídea tipo α	AACGTCAAGAGCCACTTTCCTATGTGCTAC T	074
cadeia pesada de lg murídea tipo γ1	GGCTGCAACTGGACGAGACCTGTGCTGAGGCCCAGGACGGGGAGCTGG	075

cadeia pesada de Ig murídea tipo γ2Β	GGCTAGACCTGGATGATATCTGTGCTG	076
cadeia pesada de Ig murídea tipo γ3	AGCTGGAACTGAATGAGACCTGT	077
cadeia pesada de Ig murídea tipo μ	AGGGGGAGGTGAATGCTGAGGAGGAAGGCTTTG	078
acetilcolina esterase humana	GFTH	079
fosfatase alcalina humana (intestinal)	ACTT	080
fosfatase alcalina humana (fígado)	CAPA	081
fosfatase alcalina humana (placenta)	AGTT	082
antígeno CAMPATH-1 humano	TSSP	083
antígeno carcinoembrionário humano	ITVS	084
CD55 humano (fator de aceleração de decaimento)	SGTT	085
CD59 humano	EQLE	086
antígeno CD90 humano (Thy/1)	KLVK	087
contactoa-1 humana (CNTN1)	QVKI	088
antígeno E48 humano	CCQE	089
receptor de folato A humano	AAAM	090
receptor de folato B humano	AMHV	091
proteína p137 ancorada a GPI humana	GSRG	092
antígeno-3 associado a função de linfócitos humanos	TCIP	093
proteína de interação mDIA humana	YGYS	094
5'-nucleotidase humana	RIKF	095
fator ativador de uroquinase plasminogênio humano	QYRS	096
antígeno LY-6C de proteína de superfície celular murídea	EDLC	097

antígeno Ly-6 murídeo ThB	TDLC	098
5'-nucleotidase murídea	RIKF	099
antígeno 0X45 murídeo (BCM-1 ou Blast-1)	DLAR	100
antígeno 2 de célula tronco murídea	SSFC	101
molécula 1 de adesão de células vasculares murídeas	HLMF	102
proteína brevicano de rato/âncora GPI	APSS	103
antígeno CD90 (Thy-1) de rato	KLVK	104
proteína glipicano de rato	GQKT	105
antígeno MRC OX-45 de rato	TLAR	106
5'-nucleotidase de rato	RIKF	107
glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato	NGTP	108
proteína RT6.2 de superfície de células T de rato	NCLY	109
proteína PHR1 de reparo de DNA de levedura	GSSS	110
proteína 1 de superfície ancorada a glicofosfolipídio de levedura	SSKK	111
proteína precursora de amilóide suíno	EPLS	112
dipeptidase suína	NYGY	113
proteína ILTat 1.1 de superfície variante de Trypanosoma brucei	NTTG	114
proteína MIT 117a de superfície variante de Trypanosoma brucei	NACK	115
proteína MIT 118a de superfície variante de Trypanosoma brucei	EKCR	116

proteína MIT 221 de superfície variante de Trypanosoma brucei	TTGS	117
proteína MITat 1.1000BC de superfície variante de Trypanosoma brucei	EKCC	118
proteína MITat 1.5b de superfície variante de Trypanosoma brucei	EDCR	119
proteína repetitiva ácida procíclica de Trypanosoma brucei	EPEP	120
proteína TxTat 1 de superfície variante de Trypanosoma brucei	NTTA	121
proteína YNat 1.1 de superfície variante de Trypanosoma congolense	SHLP	122
melanotransferrina de galinha	QCSG	123
molécula de adesão de células neurais de galinha	TVIP	124
acetilcolina esterase de Torpedo marmorata	DGEL	125
proteína prion de hamster	DGRR	126
5'-nucleotidase bovina	RIQF	127
proteína Gp64 de membrana de bolor	NNVC	128
antígeno específico préesporo de bolor	SI I I	129

Em uma modalidade, o polipeptídio é uma cadeia pesada de imunoglobulina, e o domínio transmembrana é o de uma cadeia pesada de imunoglobulina. Para a expressão de uma imunoglobulina, o ácido nucléico da presente invenção é introduzido juntamente com um ácido nucléico que 5 codifica uma cadeia leve de imunoglobulina em uma célula hospedeira eucariótica. Esses ácidos nucléicos podem estar localizados no mesmo ácido nucléico ou em diferentes ácidos nucléicos.

A invenção engloba um vetor compreendendo o ácido nucléico da invenção, assim como uma célula eucariótica compreendendo o vetor da invenção.

A variante solúvel do polipeptídio heterólogo codificado pelo ácido nucléico de acordo com a invenção pode ser produzida pela transfecção de uma célula eucariótica com o ácido nucléico da invenção, cultivo da célula sob condições adequadas para a expressão do polipeptídio codificado pelo dito ácido nucléico, e recuperação do polipeptídio do citoplasma das células ou meio de cultura.

Para a fabricação de uma célula eucariótica de acordo com a invenção, apresenta-se um kit. O kit compreende um vetor contendo pelo menos dois sítios de clonagem múltipla e um ácido nucléico de splicing começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', em que i) o ácido nucléico compreende um códon de parada de tradução e um sinal de poliadenilação, e ii) o ácido nucléico não é constitutivamente removido durante o processamento de pré-mRNA.

Em uma modalidade, a célula eucariótica da invenção é uma célula de mamífero. Em uma modalidade, a célula de mamífero é uma célula selecionada do grupo que compreende células CHO, células NSO, células Sp2/0, células COS, K652 cells, células BHK, células PER.C6® e células HEK.

Os exemplos a seguir, listagem de seqüência e figuras são apresentados para auxiliar na compreensão da presente invenção, cujo verdadeiro âmbito é exposto nas reivindicações anexas. Deve-se entender que se podem fazer modificações nos procedimentos apresentados, sem sair do espírito da invenção.

Descrição das Figuras

Figura 1: Cartões de plasmídios do vetor de expressão de slgG/mlgG pmlgG-A (A), vetor de expressão de slgG/mlgG pmlgGA-A (B) e vetor de expressão de slgG plgG-A (C). Os elementos de vetor representados são descritos em detalhes no texto.

Figura 2: Representação esquemática das estruturas de éxon intron dos cassetes de expressão de cadeia gama.

A: Estrutura da região constante de cadeia gama 1 em um vetor de expressão pmlgG-A. O fragmento de DNA de aprox. 7,2 kb é apresentado como uma linha preta. Os éxons são representados por caixas claras, 5 com suas designações indicadas acima. A posição do sítio de poliadenilação para a forma secretada [p(A)s] e para a forma ligada a membrana [p(A)m] da IgG é apresentada por barras pretas. A numeração dos introns e da 3' UTR é indicada abaixo do diagrama. Mostram-se as posições relativas do sítio de restrição Sphl no íntron 6 e o sítio Sph I com mutação na 3'UTR (entre pa10 rênteses).

B: Estrutura da região constante de cadeias gama 1 - gama 3 gama 4 híbridas de aprox. 4,8 kb em um vetor de expressão pmlgGA-A, conforme representado em A. Além disso, o diagrama indica as regiões derivadas dos três loci do gene de cadeia gama constante pesada de imunoglobu15 lina (IGHGI, IGHG3 e IGHG4).

Figura 3: Correlação da secreção de IgG e sinal de superfície celular em clones que expressam mlgG. Seis clones independentes de células Sp2/0-Agl4 transfectadas com o plasmídio pmlgG-A (esquerda), pmlgGA-A (meio) ou plgG-A como controle (direita) são cultivados durante 20 48 horas sob condições definidas. A intensidade de fluorescência mediana na citometria de fluxo, como uma medida da quantidade de IgG ligada à membrana plasmática, é representada por barras cinza. A concentração de IgG secretada nos sobrenadantes de cultura celular correspondentes é representada por diamantes pretos.

Figura 4: Gráfico de pontos FLI /FSC típico usado para a classificação de células em um citômetro de fluxo FACS Vantage (BD). A porta RI compreende 5,7% da população de células vivas representada que foram previamente conectadas por porta por um gráfico de pontos FSC/SSC. Células que se encontravam em RI foram coletadas durante o processo de classi30 ficação.

Figura 5: Determinação das taxas de produção específicas. Os clones 5B11, 9B3 e J5-H3 foram cultivados em balões rotativos durante 92 horas.

A: Crescimento celular. Nos momentos indicados, após o início das culturas rotativas, a contagem de células de cada clone foi medida com um contador de células CASY.

B: Produção de IgG. Nos momentos indicados (como em A), as concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por cromatografia de afinidade de proteína A.

C: Taxas de produção específicas. O gráfico de barras mostra a taxa de produção específica média para cada clone calculada a partir das contagens celulares e medições de IgG nas primeiras 69 horas (veja Tabela 2 e veja texto para detalhes adicionais). Os desvios padrões são indicados por barras de erro.

Figura 6: Microscopia de imunofluorescência. O clone 5B11 (imagens 1, 4), que expressa slgG secretada e mlgG ligada a membrana, o clone J5-H3 (imagens 2, 5), que expressa apenas slgG secretada, ou células Sp2/0-Agl4 não transfectadas (imagens 3, 6) foram marcados para IgG na superfície celular (imagens 1-3), ou IgG intracelular (imagens 4-6), e imagens registradas em um microscópio de fluorescência Axiophot.

Figura 7: Análise de mRNA por Northern blot.

A: Auto-radiografia de um Northern blot hibridizado com sonda A marcada com [a-³²P] (pistas 1 - 3) ou sonda B (pistas 4 - 6). Em cada pista, 10 pg de RNA total isolados do clone 5B11 (pistas 1, 4), clone J5-H3 (pistas 2, 5) ou células Sp2/0-Agl4 não transfectadas (pistas 3, 6) foram separados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon.

B: Representação esquemática das duas isoformas de mRNA que codificam a cadeia pesada de mlgG ligada a membrana ou slgG secretada. Os éxons são representados por caixas. As regiões complementares às sondas A e B estão marcadas com barras pretas.

Figura 8: Análise de imunotransferência de isoformas de cadeia pesada de IgG. Os clones 5B11 (pistas 1, 4), J5-H3 (pistas 2, 5) ou células Sp2/0-Agl4 não transfectadas (pistas 3, 6) foram extraídos de acordo com o método de extração com carbonato alcalino (veja texto). Imunoglobulinas das frações de membrana, que contêm proteínas de membrana integradas (pistas 1 - 3), ou das frações SN, que contêm predominantemente teores solúveis das células (pistas 4 - 6), foram purificadas por ensaio de extração de proteína A e separadas por eletroforese em SDS gel de poliacrilamida desnaturante. Depois da transferência e marcação com anticorpo secundário acoplado a peroxidase de raiz-forte, as cadeias pesadas foram visualizadas por uma reação de quimioluminescência. As cadeias pesadas de SlgG secretada (slgG HC) e cadeias pesadas de mlgG ligada a membrana (mlgG HC) estão indicadas. O painel inferior mostra uma exposição de curta duração de uma seção da transferência no painel superior.

Figura 9: Análise de mRNA por Northern blot. Auto-radiografia de Northern blots hibridizados com sonda A marcada com [a-³²P] (painel esquerdo) ou sonda B (painel direito), conforme mostrado na figura 7B. Em cada pista, 10 pg de RNA total isolado dos clones 1A1, 1B6, 1C5 ou IDI (pistas 1 - 4) e dos clones 1D6, 2D6, KO2 ou KO6 (pistas 6 - 9) foram separados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon. O clone 27 expressa apenas slgG e foi adicionado para controle (pistas 5, 10). Os mRNAs de cadeia pesada das isoformas mlgG e slgG estão indicados..

Figura 10: Cartão de plasmídio do vetor de expressão de slgG/lgG-GPI plgG-GPI-B.

Descrição das Tabelas

Tabela 1: Exemplos de segundos ácidos nucléicos.

Tabela 3: Exemplos de quartos ácidos nucléicos e aminoácidos correspondentes aos quartos ácidos nucléicos.

Tabela 4: Primer oligonucleotídico para clonagem e mutagênese na construção do vetor de expressão de slgG/mlgG '.pmlgG-A¹.

Tabela 5: SPR médio determinado para cada clone selecionado com base em quatro SPRs distintos, calculados em vários momentos duran65 te a fase de crescimento exponencial.

Tabela 6: A Tabela 4 mostra a distribuição de clones para diferentes níveis de concentração de IgG três semanas após deposições de células únicas em placas de 96 poços e análise dos sobrenadantes de cultura celular de 515 clones classificados para mlgG e de 550 clones de controle por ELISA.

Tabela 7: A Tabela 5 mostra a distribuição de clones para diferentes níveis de concentração de IgG na segunda seleção.

Tabela 8: Contagem de células de culturas de agitador no dia 0, 1,2, 3, 4 e 7 de cada clone determinada com um contador de células CASY® TT (Scharfe Systems).

Tabela 9: Determinação de produtividade de culturas de agitador de 10 dias por ELISA.

Descrição das Seqüências

SEQ ID NO: 001 Segundo ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana

SEQ ID NO: 002 Segundo ácido nucléico derivado de cadeia pesada y1 de imunoglobulina humana

SEQ ID NO: 003 Segundo ácido nucléico derivado de cadeia pesada y2 de imunoglobulina humana

SEQ ID NO: 004 Segundo ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana

SEQ ID NO: 005 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo α

SEQ ID NO: 006 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γΙ

SEQ ID NO: 007 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β

SEQ ID NO: 008 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3

SEQ ID NO: 009 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ

SEQ ID NO: 010 Terceiro ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana

SEQ ID NO: 011 Terceiro ácido nucléico derivado de cadeia pesada γ1 de imunoglobulina humana

SEQ ID NO: 012 Terceiro ácido nucléico derivado de cadeia pesada γ2 de imunoglobulina humana

SEQ ID NO: 013 Terceiro ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana

SEQ ID NO: 014 Terceiro ácido nucléico derivado de cadeia pe10 sada de imunoglobulina murídea tipo α

SEQ ID NO: 015 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ1

SEQ ID NO: 016 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β

SEQ ID NO: 017 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3

SEQ ID NO: 018 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ

SEQ ID NO: 019 Terceiro ácido nucléico derivado de AChE hu20 mana

SEQ ID NO: 020 Terceiro ácido nucléico derivado de fosfatase alcalina intestinal humana

SEQ ID NO: 021 Terceiro ácido nucléico derivado de fosfatase alcalina de fígado humana

SEQ ID NO: 022 Terceiro ácido nucléico derivado de fosfatase alcalina de placenta humana

SEQ ID NO: 023 Terceiro ácido nucléico derivado de antígeno CAMPATH-1 humano

SEQ ID NO: 024 Terceiro ácido nucléico derivado de antígeno 30 carcinoembrionário humano

SEQ ID NO: 025 Terceiro ácido nucléico derivado de CD55 humano

SEQ ID NO: 026 Terceiro ácido nucléico derivado de CD59 humano

SEQ ID NO: 027 Terceiro ácido nucléico derivado de CD90 humano

SEQ ID NO: 028 Terceiro ácido nucléico derivado de contactina- humana

SEQ ID NO: 029 Terceiro ácido nucléico derivado de antígeno

E48 humano

SEQ ID NO: 030 Terceiro ácido nucléico derivado de receptor de folato A humano

SEQ ID NO: 031 Terceiro ácido nucléico derivado de receptor de folato B humano

SEQ ID NO: 032 Terceiro ácido nucléico derivado de proteína p137 ancorada em GPI humana

SEQ ID NO: 033 Terceiro ácido nucléico derivado de antígeno-3 associado à função de linfócitos humano

SEQ ID NO: 034 Terceiro ácido nucléico derivado de proteína de interação com mDIA humana

SEQ ID NO: 035 Terceiro ácido nucléico derivado de 5'nucleotidase humana

SEQ ID NO: 036 Terceiro ácido nucléico derivado de fator ativador de uroquinase plasminogênio humano

SEQ ID NO: 037 Terceiro ácido nucléico derivado de antígeno

LY-6C de proteína de superfície celular murídeo

SEQ ID NO: 038 Terceiro ácido nucléico derivado de antígeno

LY-6 ThB murídeo

SEQ ID NO: 039 Terceiro ácido nucléico derivado de 5'nucleotidase murídea

SEQ ID NO: 040 Terceiro ácido nucléico derivado de antígeno

0X45 murídeo

SEQ ID NO: 041 Terceiro ácido nucléico derivado de antígeno 2 de célula tronco murídeo

SEQ ID NO: 042 Terceiro ácido nucléico derivado de molécula 1 de adesão de células vasculares murídea

SEQ ID NO: 043 Terceiro ácido nucléico derivado de brevicano de rato

SEQ ID NO: 044 Terceiro ácido nucléico derivado de antígeno CD90 de rato

SEQ ID NO: 045 Terceiro ácido nucléico derivado de glipicano de rato

SEQ ID NO: 046 Terceiro ácido nucléico derivado de antígeno

MRC 0X45 de rato

SEQ ID NO: 047 Terceiro ácido nucléico derivado de 5'nucleotidase de rato

SEQ ID NO: 048 Terceiro ácido nucléico derivado de glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato

SEQ ID NO: 049 Terceiro ácido nucléico derivado de proteína RT6.2 de superfície de células T de rato

SEQ ID NO: 050 Terceiro ácido nucléico derivado de proteína PHR1 de reparo de DNA de levedura

SEQ ID NO: 051 Terceiro ácido nucléico derivado de proteína-1 de superfície ancorada em glicofosfolipídio de levedura

SEQ ID NO: 052 Terceiro ácido nucléico derivado de proteína precursora de amilóide suína

SEQ ID NO: 053 Terceiro ácido nucléico derivado de dipeptidase suína

SEQ ID NO: 054 Terceiro ácido nucléico derivado de proteína IL Tat 1.1 de superfície variante de Trypanosoma brucei . SEQ ID NO: 055 Terceiro ácido nucléico derivado de proteína

MIT 117a de superfície variante de Trypanosoma brucei

SEQ ID NO: 056 Terceiro ácido nucléico derivado de proteína MIT 118a de superfície variante de Trypanosoma brucei

SEQ ID NO: 057 Terceiro ácido nucléico derivado de proteína

MIT 221 de superfície variante de Trypanosoma brucei

SEQ ID NO: 058 Terceiro ácido nucléico derivado de proteína MITat 1.1000 BC de superfície variante de Trypanosoma brucei

SEQ ID NO: 059 Terceiro ácido nucléico derivado de proteína MITat 1.5b de superfície variante de Trypanosoma brucei

SEQ ID NO: 060 Terceiro ácido nucléico derivado de proteína repetitiva ácida procíclica de Trypanosoma brucei

SEQ ID NO: 061 Terceiro ácido nucléico derivado de proteína TxTat 1 de superfície variante de Trypanosoma brucei

SEQ ID NO: 062 Terceiro ácido nucléico derivado de proteína YN em 1.1 de superfície variante de Trypanosoma congolense

SEQ ID NO: 063 Terceiro ácido nucléico derivado de melanotransferrina de galinha

SEQ ID NO: 064 Terceiro ácido nucléico derivado de molécula de adesão de células neurais de galinha

SEQ ID NO: 065 Terceiro ácido nucléico derivado de AChE de Torpedo marmorata

SEQ ID NO: 066 Terceiro ácido nucléico derivado de proteína de prion de hamster

SEQ ID NO: 067 Terceiro ácido nucléico derivado de 5'nucleotidase bovina

SEQ ID NO: 068 Terceiro ácido nucléico derivado de proteína Gp64 de membrana de bolor

SEQ ID NO: 069 Terceiro ácido nucléico derivado de antígeno específico de pré-esporo de bolor

SEQ ID NO: 070 Quarto ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana

SEQ ID NO: 071 Quarto ácido nucléico derivado de cadeia pesada y1 de imunoglobulina humana

SEQ ID NO: 072 Quarto ácido nucléico derivado de cadeia pesada y2 de imunoglobulina humana

SEQ ID NO: 073 Quarto ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana

SEQ ID NO: 074 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo α

SEQ ID NO: 075 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ1

SEQ ID NO: 076 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β

SEQ ID NO: 077 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3

SEQ ID NO: 078 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ

SEQ ID NO: 079 Quarto ácido nucléico derivado de AChE humana

SEQ ID NO: 080 Quarto ácido nucléico derivado de fosfatase alcalina intestinal humana

SEQ ID NO: 081 Quarto ácido nucléico derivado de fosfatase alcalina de fígado humana

SEQ ID NO: 082 Quarto ácido nucléico derivado de fosfatase alcalina de placenta humana

SEQ ID NO: 083 Quarto ácido nucléico derivado de antígeno

CAMPATH-1 humano *

SEQ ID NO: 084 Quarto ácido nucléico derivado de antígeno carcinoembrionário humano

SEQ ID NO: 085 Quarto ácido nucléico derivado de CD55 humano

SEQ ID NO: 086 Quarto ácido nucléico derivado de CD59 humano

SEQ ID NO: 087 Quarto ácido nucléico derivado de CD90 humano

SEQ ID NO: 088 Quarto ácido nucléico derivado de contactina-1 humana

SEQ ID NO: 089 Quarto ácido nucléico derivado de antígeno

E48 humano

SEQ ID NO: 090 Quarto ácido nucléico derivado de receptor de folato A humano

SEQ ID NO: 091 Quarto ácido nucléico derivado de receptor de folato B humano

SEQ ID NO: 092 Quarto ácido nucléico derivado de proteína p137 ancorada em GPI humana

SEQ ID NO: 093 Quarto ácido nucléico derivado de antígeno-3 associado à função de linfócitos humano

SEQ ID NO: 094 Quarto ácido nucléico derivado de proteína de interação com mDIA humana

SEQ ID NO: 095 Quarto ácido nucléico derivado de 5¹nucleotidase humana

SEQ ID NO: 096 Quarto ácido nucléico derivado de fator ativador de uroquinase plasminogênio humano

SEQ ID NO: 097 Quarto ácido nucléico derivado de antígeno de proteína LY-6C de superfície celular murídeo

SEQ ID NO: 098 Quarto ácido nucléico derivado de antígeno LY6 ThB murídeo

SEQ ID NO: 099 Quarto ácido nucléico derivado de 5'nucleotidase murídea

SEQ ID NO: 100 Quarto ácido nucléico derivado de antígeno 0X45 murídeo

SEQ ID NO: 101 Quarto ácido nucléico derivado de antígeno 2 de célula tronco murídeo

SEQ ID NO: 102 Quarto ácido nucléico derivado de molécula 1 de adesão de células vasculares murídea

SEQ ID NO: 103 Quarto ácido nucléico derivado de brevicano de rato

SEQ ID NO: 104 Quarto ácido nucléico derivado de antígeno

CD90 de rato

SEQ ID NO: 105 Quarto ácido nucléico derivado de glipicano de rato

SEQ ID NO: 106 Quarto ácido nucléico derivado de antígeno

MRC 0X45 de rato

SEQ ID NO: 107 Quarto ácido nucléico derivado de 5'nucleotidase de rato

SEQ ID NO: 108 Quarto ácido nucléico derivado de glicoproteína

GP2 maior de membrana de grânulo secretor pancreático de rato

SEQ ID NO: 109 Quarto ácido nucléico derivado de proteína RT6.2 de superfície de células T de rato

SEQ ID NO: 110 Quarto ácido nucléico derivado de proteína PHR1 de reparo de DNA de levedura

SEQ ID NO: 111 Quarto ácido nucléico derivado de proteína-1 de superfície ancorada em glicofosfolipídio de levedura

SEQ ID NO: 112 Quarto ácido nucléico derivado de proteína precursora de amilóide suína

SEQ ID NO: 113 Quarto ácido nucléico derivado de dipeptidase suína

SEQ ID NO: 114 Quarto ácido nucléico derivado de Proteína IL

Tat 1.1 de superfície variante de Trypanosoma brucei

SEQ ID NO: 115 Quarto ácido nucléico derivado de proteína MIT 117a de superfície variante de Trypanosoma brucei

SEQ ID NO: 116 Quarto ácido nucléico derivado de proteína MIT

118a de superfície variante de Trypanosoma brucei

SEQ ID NO: 117 Quarto ácido nucléico derivado de proteína MIT

221 de superfície variante de Trypanosoma brucei

SEQ ID NO: 118 Quarto ácido nucléico derivado de proteína MlTat 1.1000 BC de superfície variante de Trypanosoma brucei

SEQ ID NO: 119 Quarto ácido nucléico derivado de proteína MlTat 1.5b de superfície variante de Trypanosoma brucei

SEQ ID NO: 120 Quarto ácido nucléico derivado de proteína repetitiva ácida procíclica de Trypanosoma brucei

SEQ ID NO: 121 Quarto ácido nucléico derivado de proteína TxTat 1 de superfície variante de Trypanosoma brucei

SEQ ID NO: 122 Quarto ácido nucléico derivado de proteína YNat 1.1 de superfície variante de Trypanosoma congolense

SEQ ID NO: 123 Quarto ácido nucléico derivado de melanotransferrina de galinha

SEQ ID NO: 124 Quarto ácido nucléico derivado de molécula de adesão de células neurais de galinha

SEQ ID NO: 125 Quarto ácido nucléico derivado de AChE de Torpedo marmorata

SEQ ID NO: 126 Quarto ácido nucléico derivado de proteína de prion de hamster

SEQ ID NO: 127 Quarto ácido nucléico derivado de 5'nucleotidase bovina

SEQ ID NO: 128 Quarto ácido nucléico derivado de proteína Gp64 de membrana de bolor

SEQ ID NO: 129 Quarto ácido nucléico derivado de antígeno específico de pré-esporo de bolor

SEQ ID NO: 130 Gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a CH3 com todos os introns intervenientes e a região não traduzida 3' adjacente.

SEQ ID NO: 131 Seqüência de aminoácidos da região constante de cadeia γ codificada pelo plasm ídio plgG-A.

SEQ ID NO: 132 Primer oligonucleotídico TM-fw1

SEQ ID NO: 133 Primer oligonucleotídico TM-rv1

SEQ ID NO: 134 Primer oligonucleotídico Ml-rv

SEQ ID NO: 135 Primer oligonucleotídico M2-fw

SEQ ID NO: 136 Primer oligonucleotídico TM-fw2

SEQ ID NO: 137 Primer oligonucleotídico TM-rv2

SEQ ID NO: 138 Primer oligonucleotídico mutSphl-1

SEQ ID NO: 139 Primer oligonucleotídico mut Sphl-2

SEQ ID NO: 140 Gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a M2 com todos os introns intervenientes, o sítio de poliadenilação para a forma secretada de

IgG 1 no intron 6 e a 3'UTR contendo o sítio de poliadenilação para a forma ligada a membrana de IgG 1.

SEQ ID NO: 141 Seqüências de aminoácidos da isoforma curta (slgG) codificada pelo plasmídio pmlgG-A.

SEQ ID NO: 142 Seqüências de aminoácidos da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgG-A.

SEQ ID NO: 143 Gene de IGHG1 humana incluindo os éxons de CH1 a CH3 com todos os introns intervenientes, e a parte 5' adjacente do íntron 6 incluindo o sítio de poliadenilação para a forma secretada da imunoglobulina.

SEQ ID NO: 144 Seqüências de aminoácidos da isoforma curta (slgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGA-A.

SEQ ID NO: 145 Seqüências de aminoácidos da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGAA.

SEQ ID NO: 146 Seqüência codificada removida do plasmídio pmlgGA-B

SEQ ID NO: 147 Seqüência codificada inserida para a geração do plasmídio plgG-GPI-B (seqüência de aminoácidos do peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana (acesso NCBI: M13077; nucleotídeos: 1542 - 1643))

SEQ ID NO: 148 Seqüência de DNA da região constante do cassete de expressão de cadeia gama, de CH1 a 3'UTR do plasmídio de expressão plgG-GPI-B

SEQ ID NO: 149 Seqüência de aminoácidos da isoforma slgG da região constante de cadeia gama codificada pelo plasmídio plgG-GPI-B

SEQ ID NO: 150 Seqüência de aminoácidos da isoforma longa da região constante de cadeia gama incluindo peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana codificada pelo plasmídio plgG-GPI-B

SEQ ID NO: 151 Segundo ácido nucléico derivado de receptor 1 de fator de crescimento de fibroblastos humano

SEQ ID NO: 152 Segundo ácido nucléico derivado de receptor do fator de crescimento epitelial murfdeo

SEQ ID NO: 153 Segundo ácido nucléico derivado de receptor 1 de complemento humano (C3b/C4b)

SEQ ID NO: 154 Segundo ácido nucléico derivado de receptor de interleucina 4 murideo

SEQ ID NO: 155 Segundo ácido nucléico derivado de cadeia pesada a de imunoglobulina humana

SEQ ID NO: 156 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (1)

SEQ ID NO: 157 Segundo ácido nucléico derivado de cadeia pesada γ3 de imunoglobulina humana

SEQ ID NO: 158 Segundo ácido nucléico derivado de cadeia pesada de lg murídea do tipo ε

SEQ ID NO: 159 Segundo ácido nucléico derivado de cadeia pesada de lg murídea do tipo γ2Α

SEQ ID NO: 160 Terceiro ácido nucléico derivado de receptor 1 de fator de crescimento de fibroblastos humano

SEQ ID NO: 161 Terceiro ácido nucléico derivado de receptor do fator de crescimento epitelial murídeo

SEQ ID NO: 162 Terceiro ácido nucléico derivado de receptor 1 de complemento humano (C3b/C4b)

SEQ ID NO: 163 Terceiro ácido nucléico derivado de receptor de interleucina 4 murídeo

SEQ ID NO: 164 Terceiro ácido nucléico derivado de cadeia pesada ade imunoglobulina humana

SEQ ID NO: 165 Terceiro ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana

SEQ ID NO: 166 Terceiro ácido nucléico derivado de cadeia pesada γ3 de imunoglobulina humana

SEQ ID NO: 167 Terceiro ácido nucléico derivado de cadeia pesada de lg murídea do tipo ε

SEQ ID NO: 168 Terceiro ácido nucléico derivado de cadeia pesada de Ig murídea do tipo γ2Α

SEQ ID NO: 169 Segundo ácido nucléico derivado de receptor de interleucina 4 humano

SEQ ID NO: 170 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (2)

SEQ ID NO: 171 Segundo ácido nucléico derivado de cadeia pesada γ4 de imunoglobulina humana

SEQ ID NO: 172 Segundo ácido nucléico derivado de cadeia pesada δ de imunoglobulina murídea

SEQ ID NO: 173 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (2)

SEQ ID NO: 174 Terceiro ácido nucléico derivado de receptor de interleucina 4 humano

SEQ ID NO: 175 Terceiro ácido nucléico derivado de cadeia pesada γ4 de imunoglobulina humana

SEQ ID NO: 176 Terceiro ácido nucléico derivado de cadeia pesada de Ig murídea do tipo δ

Exemplos

Exemplo 1

Clonagem de fragmentos genômicos e construção de vetores de expressão eucariótica de SlgG/mlgG

a) Construção do vetor de expressão de slgG 'plgG-A'

Para a expressão de uma imunoglobulina com especificidade contra uma proteína A, construiu-se o vetor 'plgG-A'. Ele codificada a a forma secretada slgG da imunoglobulina e compreende os seguintes elementos (veja Figura 1C):

1. Uma unidade de transcrição para uma cadeia pesada gama (γ) 1 humana, composta por:

- o intensificador precoce imediato e o promotor do citomegalovírus humano (hCMV),

- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak (Kozak, M., Nucleic Acids Res. 15 (1987) 8125-48),

- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o intron de seqüência de sinal,

- um cDNA de cadeia pesada variável de um anticorpo com especificidade contra uma proteína A,

- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador μ de Ig de camundongo (região de comutação Jh3Jh4) unido ao gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a CH3 com todos os introns intervenientes e a região não traduzida 3' adjacente contendo o sítio de poliadenilação para a cadeia pesada da forma secretada de IgGL

A seqüência de nucleotídeos da região constante de cadeia pesada é relatada na SEQ ID NO: 130. A seqüência de aminoácidos da região constante de cadeia γ codificada pelo plasmídio plgG-A é relatada na SEQ ID NO: 131.

2. Uma unidade de transcrição para uma cadeia leve kapa (K) humana, composta por:

- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),

- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,

- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,

- um cDNA de cadeia K variável de um anticorpo com especificidade contra uma proteína A

- o intensificador de íntron 2 Ig K de camundongo unido ao gene de regiãoc onstante kapa de imunoglobulina humana (IGKC), e

- a região não traduzida 3' do gene de IGKC humana contendo o sítio de poliadenilação.

3. Uma unidade de transcrição de neomicina fosfotransferase como um marcador selecionável para células de mamíferos.

4. Uma origem de replicação do vetor pUC18 para a replicação do plasmídio em E. coli.

5. Um gene de becta-lactamase que confere resistência a ampicilina em E. coli.

b) Construção do vetor de expressão de slgG/mlgG 'pmlgG-A'

Um fragmento genômico de 5,2 kb do locus gama 1 de região constante pesada de imunoglobulina humana (IGHG1) compreendendo a parte principal do íntron a jusante do éxon CH3 (intron 6), o éxon Ml, o intron a jusante do éxon Ml (intron 7), o éxon M2 e a região não traduzida 3' adjacente (3'UTR), incluindo o sinal de poliadenilação para a forma ligada a 10 membrana da cadeia gama 1 foi amplificado a partir de DNA genômico humano (Roche Diagnostics GmbH, Mannheim, Alemanha) por PCR usando ο Sistema de PCR de Molde Longo Expandido (Roche Diagnostics GmbH, Alemanha) e o primer oligonucleotídico especificado na Tabela 4.

Tabela 4: Primer oligonucleotídico para clonagem e mutagênese.

Uso para	Nome	Seqüência (na direção 5' para 3')	SEQ ID NO:
Amplificaçã o do fragmento de IGHG1 genômico de 5,2 kb	TM-fw1	GGCCGAGTCTGAGGCCTGAGTGGCAT GAGGGAGGCAGAGT	132
TM-rv1	AACTGGATCCATGTAGAAAAGAGGAGAAGCCCCGGGGGTCCATGTAGT	133
Amplificaçã o do fragmento de IGHG3 genômico de 1,1 kb	TM-fw1	GGCCGAGTCTGAGGCCTGAGTGGCAT GAGGGAGGCAGAGT	132
M1-rv	GATCCACTTCACCTTGAAGAAGGTGACGGTGGCACTGTAGCACACGC	134
Amplificaçã o do fragmento de IGHG4 genômico de 1,6 kb	M2-fw	CACCTTCTTCAAGGTGAAGTGGATCTT CTCCTCGGTGGTGGACCTGAAG	135
TM-rv1	AACTGGATCCATGTAGAAAAGAGGAGAAGCCCCGGGGGTCCATGTAGT	133
Amplificaçã	TM-fw2	CTCCAGCAG- CAGCTGCCCTGGGCTGGGCCACGA	136

o do fragmento de IGHG3IGHG4 genômico	TM-rv2	CAGGGATCCCCCGAGGTGCAGCTGGA CCAGCCTCCTCCTGACCGTGI I I I	137
Mutação do sítio Sph I na 3'UTR	mutSphl1	CTACCCCAGACCTCCGCTGCTTGGTG CcTGCAGGGCACTGGGGGCCAGGTGT CCCCTCAGCAGGACGT*	138
mutSphl- 2	CCTGCTGAGGGGACACCTGGCCCCCA GTGCCCTGCAgGCACCAAGCAGCGGAGGTCTGGGGT*	139

* Os nucleotídeos alterados para a mutagênese do sítio Sph I estão indicados por letras minúsculas.

O fragmento amplificado corresponde aos nucleotídeos

87203513 - 87208691 do contig genômico de cromossomo 14 de Homo sapiens (acesso NCBI: NT_026437, complemento reverso). O seqüenciamento do produto de PCR subclonado revelou uma identidade de 98 porcento em comparação com a seqüência de cromossomo 14 correspondente, com todas as diferenças encontradas em introns ou na região não traduzida 3' (3'UTR). O sítio de restrição Sph I de 219 pb a jusante do códon de parada do éxon M2 foi destruído por mutagênese direcionada a sítio com base em PCR usando os primers oligonucleotídicos especificados na Tabela 2. O fragmento foi, então, unido à parte de flanco 5' do íntron 6 por clonagem mediante um sítio de restrição Sph I no vetor de expressão de cadeia gama 1 de imunoglobulina plgG-A, levando, assim, a uma unidade de transcrição de cadeia gama 1 genomicamente organizada. Por subclonagem, construiuse o vetor de expressão eucariótica 'pmlgG-A', que codifica a forma secretada (slgG) e a forma ligada a membrana (mlgG) de um anticorpo com especificidade contra uma proteína A. O plasmídio contém os seguintes elementos (veja também a Figura IA):

1. A unidade de transcrição acima mencionada para uma cadeia pesada gama 1 humana, composta por:

- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador mu (μ) de lg de camundongo da região de comutação Jh3-Jh4 (Banerji, J., et al., Cell 33 (1983) 729-740; Gillies, S.D., et al., Cell, 33 (1983) 717-728) unido ao gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a M2 com todos os introns intervenientes, o sítio de poliadenilação para a forma secretada de IgG 1 no íntron 6, e a 3'UTR contendo o sítio de poliadenilação para a forma ligada a membrana de IgGI.

A organização genômica da região constante de cadeia pesada é representada na Figura 2A, a seqüência de nucleotídeos é relatada na SEQ ID NO: 140. As seqüências de aminoácidos da isoforma curta (slgG) ou da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgG-A são relatadas na SEQ ID NO: 141 ou SEQ ID NO: 142, respectivamente.

- um cDNA de cadeia K variável de um anticorpo com especificidade contra uma proteína A,

- o intensificador de íntron 2 lg K de camundongo (Emorine, L., et al., Nature 304 (1983) 447- 449; Picard, D., e Schaffner, W., Nature (1984)

307, 80-82) unido ao gene de região constante K de imunoglobulina humana (IGKC), e

- a 3'UTR do gene de IGKC humana contendo o sítio de poliadenilação.

5. Um gene de beta(P)-lactamase que confere resistência a ampicilina em E. coli.

c) Construção dos vetores de expressão de slgG/mlgG 'pmlgGAA‘ e 'pmlgGA-B'

De maneira similar à descrita no exemplo Ib), um fragmento genômico de 1,1 kb do locus de região gama 3 constante pesada de imunoglobulina humana (IGHG3) compreendendo a parte principal do íntron a jusante do éxon CH3 (íntron 6), e o éxon Ml foi amplificado por PCR (para os oligonucleotídeos, veja a Tabela 2). O fragmento corresponde aos nucleotídeos 87235195 - 87236300 do contig genômico de cromossomo 14 de Homo sapines (acesso NCBI: NT_026437, complemento reverso), com uma identidade de seqüência de 98 por cento. Todas as diferenças são encontradas dentro do íntron, exceto por uma única troca de nucleotídeo dentro do éxon M1 que é silenciosa e, portanto, não altera a seqüência de aminoácidos codificada. Da mesma forma, um fragmento genômico de 1,6 kb do locus da região gama 4 constante pesada de imunoglobulina humana (IGHG4) compreendendo o éxon M2 e a região não traduzida 3' adjacente, incluindo o sinal de poliadenilação para a forma ligada a membrana da cadeia gama 4 foi amplificado por PCR (para os oligonucleotídeos, veja a Tabela 2). O fragmento corresponde aos nucleotídeos 87087786 - 87089377 do contig genômico de cromossomo 14 de Homo sapines (acesso NCBI: NT_026437, complemento reverso), com uma identidade de seqüência de 98 por cento e todas as diferenças encontradas na 3'UTR. O sítio Sph I de 212 pb a jusante do códon de parada do éxon M2 foi destruído por mutagênese direcionada a sítio à base de PCR. Ambos os fragmentos foram unidos entre M1 e M2, amplificados por PCR (para os oligonucleotídeos, veja a Tabela 2) e, então, clonados no vetor de expressão de cadeia gama 1 por um sítio Sph I no íntron 6, levando, dessa forma, a um cassete de expressão de cadeia gama 1 - gama 3 - gama 4 híbrido, com uma organização genômica desprovida do íntron entre M1 e M2 (íntron 7). Por subclonagem, construiu-se o vetor de expressão eucariótica pmlgGA-A, que codifica a forma slgG secretada e a mlgG ligada a membrana de um anticorpo com especificidade contra uma proteína A. O plasmídio contém os seguintes elementos (veja também a Figura IB):

1. A unidade de transcrição acima mencionada para uma cadeia pesada gama 1 - gama 3 - gama 4 híbrida, composta por:

- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador μ de Ig de camundongo (região de comutação Jh3Jh4) unido ao gene de IGHG1 humana, incluindo os éxons de CH1 a CH3 com todos os introns intervenientes, e a parte 5' adjacente do íntron 6, incluindo o sítio de poliadenilação para a forma secretada da imunoglobulina,

- a parte 3' do íntron 6 e o éxon Ml do gene de IGHG3 humana, e

- o éxon M2 e a região não traduzida 3' contendo o sítio de poliadenilação para a forma ligada a membrana da imunoglobulina do gene de IGHG4 humana.

A organização genômica da região constante de cadeia pesada é representada na Figura 2B, a seqüência de nucleotídeos é relatada na SEQ ID NO: 143. As seqüências de aminoácidos da isoforma curta (slgG) ou da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGA-A são relatadas na SEQ ID NO: 144 ou SEQ ID NO: 145, respectivamente.

2. Uma unidade de transcrição para uma cadeia leve kapa humana, composta por:

- uma 5'UTR sintética incluindo uma seqüência de consenso Kozak,

- o intensificador de íntron 2 lg K de camundongo unido ao gene de região constante K de imunoglobulina humana (IGKC), e

5. Um gene de becta-lactamase que confere resistência a ampicilina em E. coli.

Por troca das seqüências de cDNA que codificam as regiões variáveis da cadeia gama e kapa, construiu-se o vetor de expressão de slgG/mlgG 'pmlgGA-B¹. Tem a mesma organização descrita para o pmlgGAA acima, mas codifica, ao invés, uma imunoglobulina com especificidade contra uma proteína B.

Exemplo 2

Transfecção e análise de células Sp2/0-Agl4

a) Cultivo e eletroporação de células Sp2/0-Agl4

Células de hibridoma Sp2/0-Agl4 (ATCC N⁹ CRL-1581, Shulman,

M., et al., Nature 276 (1978) 269-270) são cultivadas em meio RPMI (Invitrogen Corp., US) suplementado com 10% de soro de novilho fetal de IgG ultrabaixo (FCS) (Invitrogen Corp., US) e 2 mM de glutamina (Invitrogen Corp., US) a 37^SC, 5% de CO2 e 95% de umidade. Para a transfecção, as células são eletroporadas com 10 pg de DNA plasm ídico por 10⁶ células em 20 mM de tampão HEPES (ácido N-(2-hidroxietil)-piperazina-N'-2-etanossulfônico), pH 7,0, contendo 137 mM de NaCI, 5 mM de KCI, 0,7 mM de Na2HPO4 e 6 mM de glicose, a 4^QC. A eletroporação é realizada a 220 V e 960 pF com urn dispositivo de eletroporação Genepulser (Bio-Rad Laboratories Inc., US). Depois da transfecção, as células são distribuídas em placas de 96 poços com 5.000 células em 100 pL de meio por poço. Para a seleção das células transfectadas, 500 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) são adicionados ao meio um dia antes da eletroporação. O meio é trocado cada dois a três dias, para manter a pressão de seleção. Cerca de duas semanas após a transfecção, clones de transfectoma são isolados das placas de 96 poços e adicionalmente propagados em recipientes de cultura apropriados. Para armazenamento, cerca de 10⁶ células de um clone são congeladas em sulfóxido de dimetila a 10% (Sigma-Aldrich Co., Alemanha) em FCS de baixo IgG (Invitrogen Corp., US) e armazenadas em nitrogênio líquido.

As transfecções de cada uma das 10⁶ células com os plasmídios pmlgG-A, pmlgGA-A e plgG-A levou a 15, 19 e 12 clones independentes, respectivamente. Para cada transfecção, 6 clones foram aleatoriamente selecionados para análise adicional.

b) Quantificação de IgG e análise por citometria de fluxo

10⁵ células de cada clone do Exemplo 2a) foram semeadas em 2 mL de meio contendo G418 (conforme acima descrito) em placas de 6 poços e cultivadas durante 48 horas. Depois disso, os sobrenadantes foram coletados, e a quantidade de IgG secretada foi quantificada por imunoensaio de Fluorescência Resolvida no Tempo Homogênea (HTRF) usando o kit de detecção de Fc humana (CIS bio international), de acordo com o protocolo do fabricante. Para analisar os anticorpos ligados a membrana plasmática por citometria de fluxo, 10⁵ células de cada clone foram lavadas duas vezes com PBS (salina tamponada com fosfato) a 4^eC, então, ressuspensidas em 50 pL de fragmento F(ab')2 de IgG anti-humana de camundongo conjugado a FITO (Dianova, Alemanha), diluídas a 1:50 em PBS contendo 1% de BSA (Roche Diagnostics GmbH, Alemanha) e incubadas durante uma hora a 4^eC 5 no escuro.

Depois de lavar duas vezes com PBS, as células foram ressuspendidas em PBS e analisadas com um citômetro de fluxo BD FACSCalibur (BD Biosciences, US). Como uma medida da quantidade de IgG ligada à superfície celular, determinou-se a intensidade de fluorescência mediana 10 para cada clone.

Na Figura 3, a intensidade de fluorescência mediana na citometria de fluxo é apresentada juntamente com a concentração de IgG no sobrenadante de cultura celular para cada clone. Observou-se que, para clones transfectados com pmlgG-A ou pmlgGA-A (isto é, plasmídios que codifi15 cam tanto a forma slgG, quanto a mlgG), uma quantidade aumentada de IgG secretada corresponde a um sinal de superfície celular elevado. Essa correlação não foi observada para clones transfectados com plgG-A (isto é, o plasmídio que codifica apenas slgG, a forma secretada do anticorpo). Exemplo 3

Classificação de células transfectadas de maneira estável por citometria de fluxo

Para a geração de clones que expressam de maneira estável IgG, 3 x 10⁶ células Sp2/0-Agl4 foram transfectadas com o plasmídio pmlgGA-B por eletroporação, conforme acima descrito. Um dia depois da 25 transfecção, as células foram transferidas para 500 pg/mL de memio de seleção G418 e cultivadas reunidas durante cerca de duas semanas. Após a seleção, a IgG ligada à superfície das células transfectadas foi marcada, e as células com os sinais mais intensos foram classificadas por citometria de fluxo. Depois disso, 4 x 10⁶ células do material reunido foram lavadas duas 30 vezes com meio a 4⁹C, então, incubadas com fragmento F(ab')2 de IgG antihumana de camundongo conjugado a fluoresceína (FITO) (Dianova, Alemanha), diluído a 1:50 no meio, durante 20 minutos em gelo. Após duas etapas de lavagem com meio, as células foram ressuspendidas no meio e transferidas para um citômetro de fluxo BD FACSVantage (BD Biosciences, US). Estabeleceu-se uma porte englobando as células com os 5 - 6% superiores de intensidade de fluorescência da população de amostra (Figura 4), e célu5 Ias classificadas por essa porta foram coletadas. As células coletadas foram expandidas por cultivo em meio de seleção durante vários dias. Coom essas células, um segundo e, consecutivamente, um terceiro ciclo de classificação foram realizados, conforme acima descrito. Em vez de coletar as células classificadas de forma reunida, uma quarta etapa de classificação final foi 10 usada para deposições de células únicas em placas de 96 poços. A deposição levou a 141 clones independentes, dos quais 21 foram selecionados para análise de expressão de IgG por imunoensaio HTRF, conforme descrito no exemplo 2 b). Dois clones desses, 5B11 e 9B3, que mostraram as taxas de secreção de IgG mais elevadas e, correspondentemente, os sinais de 15 superfície celular mais fortes, foram adaptados para crescimento livre de soro em cultura rotativa para avaliação adicional de sua produtividade.

Exemplo 4

Determinação da produtividade específica de clones

Para a determinação de sua produtividade específica, os clones 20 5B11 e 9B3 foram cultivados sob condições definidas em meio ProCHO 6k (Cambrex Corp., US), suplementado com 1 x concentrado de Colesterol/Lipídio (Invitrogen Corp., US), 4 mM de Glutamina (Invitrogen Corp., US) e 250 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha), em balões rotativos de 100 mL (Belco, US.). As células foram cultivadas a 37^eC, 5% de 25 CO₂ e 95% de umidade até atingirem uma fase de crescimento estacionário.

Em vários momentos durante a fase de crescimento exponencial, a contagem de células de cada clone foi determinada com um contador de células CASY (Schârfe Systems, Alemanha), e a concentração de IgG nos sobrenadantes foi determinada por cromatografia de afinidade por proteína A (veja 30 abaixo). Como referência, o clone J5-H3 foi cultivado e analisados sob condições iguais. Esses clone também era derivado de transfecção de células Sp2/0-Agl4 e expressa de maneira estável o anticorpo idêntico ao dos clones

5B11 e 9B3, embora apenas a forma secretada. O clone J5-H3 foi gerado de maneira convencional por várias etapas de diluição limitativa e subclonagem e foi selecionado de mais de 1.000 clones para atender às exigências de produtividade para um processo de fabricação industrial.

As concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por cromatografia de afinidade analítica usando-se uma unidade de cromatografia Akta™explorer (GE Healthcare, anteriormente Amersham Biosciences, Suécia). Um volume definido de um sobrenadante de cultura celular foi aplicado a uma coluna de proteína A Sepharose para facilitar a ligação da IgG à matriz de afinidade. A coluna foi lavada com 100 mM de ácido cítrico a pH 5,0 e, então, os anticorpos ligados foram eluídos com 100 mM de ácido cítrico a pH 3,0. A eluição foi monitorizada por registro contínuo da absorção UV do eluído a 280 nm. A concentração de anticorpo de uma amostra foi calculada a partir da absorção de UV integrada, após calibração do sistema com amostras padronizadas contendo concentrações definidas de anticorpo.

Para cada clone, as taxas de produção específicas (SPRs) foram calculadas a partir das contagens de células e das concentrações de IgG nos sobrenadantes de cultura celular pela seguinte equação:

SPR = Ac(lgG)/c(células).Át. [pg/célula.dia] em que:

- Ác(lgG) é a diferença da concentração de IgG no sobrenadante entre o início e o fim do intervalo de tempo em [pg/mL],

- c(células) é a média aritmética da contagem de células do início e do fim do intervalo de tempo em [células/mL], e

- At é a extensão do intervalo de tempo em [dias].

Uma SPR média foi determinada para cada clone com base em quatro SPRs distintas calculadas em vários momentos durante a fase de crescimento exponencial (Figura 5 e Tabela 5).

Tabela 5: Determinação de taxas de produção específicas (SPR)

Clone

forma de IgG expressada

intervalo de tempo [h]

SPR [pg.célula- 1 .d-1]

SPR média ± DP [pg.célula-1.d-1]

Clone	forma de IgG expressada	intervalo de tempo [h]	SPR [pg.célula1.d-1]	SPR média ± DP [pg.célula-1 .d-1 ]
5B11	slgG, mlgG	0 - 26.2	16.9	18.3 ±3.4
26.2 - 45.3	22.3
45.3 - 52.7	14.3
52.7 - 68.5	19.6
9B3	slgG, mlgG	0 - 25.7	19.9	16.3 ±5.3
25.7 - 45	19.3
45 - 52.4	8.5
52.4 -68.3	17.4
J5- H3	slgG	0-26	16.7	18.4 ±3.7
26 - 45.2	17.3
45.2-52.6	15.6
52.6-68.4	23.8

Ambos os clones classificados por mlgG ligada a membrana, 5B11 e 9B3, exibiram SPRs médias entre 15 e 20 pg.célula'¹.d'¹, que está em uma faixa que é adequada para fabricação de clones em escala industrial. As SPRs desses clones são comparáveis a uma SPR que pode ser con5 seguida com um clone obtido por uma estratégia trabalhosa convencional na mesma linhagem cleular e que expressa o mesmo anticorpo (clone J5-H3). Exemplo 5

Detecção de slgG e mlgG por microscopia de imunofluorescência

Anticorpos intracelulares e ligados à superfície celular foram de10 tectados por microscopia de imunofluorescência. Para a coloração intracelular, células fixadas a lâminas de microscópio revestidas com poli-L-lisina foram fixadas com 2% (v/v) de formaldeído em PBS durante 10 minutos, permeabilizadas com 0,2% (v/v) de Triton X-100 em PBS durante 10 minutos e lavadas duas vezes com PBS. Os sítios de ligação inespecífica foram blo15 queados com 3% (p/v) de BSA (albumina sérica bovina) em PBS durante 30 min. As células foram lavadas duas vezes com tampão de lavagem (WB: 0,2% (p/v) de BSA, 0,1% (v/v) de Tween 20 em PBS), então, incubadas com fragmento F(ab')₂ de IgG de anti-humana cabra conjugado a R-Ficoeritrina (Dianova, Alemanha), diluídas a 1:50 em WB, durante uma hora. Depois de lavar quatro vezes com WB e duas vezes com H₂O duplamente desionizada, as células foram montadas sob uma lamínula e armazenadas a 4⁹C no escuro até a microscopia. Para a coloração dos anticorpos ligados a superfície celular, 10⁵ células foram lavadas com 1% (p/v) de BSA fria em PBS, então, 5 os sítios de ligação inespecífica foram bloqueados com 1% de BSA em PBS no gelo durante 30 minutos. Para a marcação de IgG, as células foram incubadas com fragmento F(ab')₂ de IgG de anti-humana cabra conjugado a RFicoeritrina (Dianova, Alemanha), diluídas a 1:50 em 1% (p/v) de BSA em PBS, durante uma hora em gelo. Depois de lavar três vezes com PBS frio, 10 as células foram fixadas a lâminas de microscopia revestidas com poli-Llisina e fixadas com 2% (v/v) de formaldeído em PBS durante 10 minutos à temperatura ambiente. Depois de lavar duas vezes com PBS, as células foram montadas sob uma lamínula e armazenadas a 4^QC no escuro até a microscopia. As células intracelulares e marcadas na superfície foram analisa15 das em um microscópio de fluorescência Axiophot usando-se uma objetiva

Plan-APO CHROMAT 40x/1.0 (Carl Zeiss, Alemanha).

No clone 5B11, os anticorpos podem ser detectados na superfície celular (Figura 6, imagem 1), que é principalmente a forma mlgG, assim como no espaço intracelular (imagem 4), que são ambas formas de IgG nas 20 vias de expressão/secreção. Em contraste, no clone J5-H3 apenas anticorpos intracelulares podem ser detectados (Figura 6, imagens 2 e 5), pois esses clones não expressam mlgG. Nenhuma coloração, com ambos os métodos, é observada na linhagem celular não transfectada Sp2/0-Agl4 (Figura 6, images 3 e 6), pois essas células não expressam nenhuma IgG.

Exemplo 6

Detecção de isoformas de mRNA de cadeia γ por Northern blotting

Para definir a razão entre as duas isoformas de cadeia pesada que surgem por splicing alternativo/poliadenilação do transcrito primário, RNA de clones transfectados de maneira estável foi analisado por Northern 30 blot. Conseqüentemente, o RNA total foi isolado das células usando-se a tecnologia RNeasy (Qiagen, Alemanha). Em cada caso, 10 pg de RNA total foram, então, fracionados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon usando o Sistema NorthernMax (Ambion Inc., US). Para a hibridização da membrana de transferência, duas sondas de DNA diferentes foram marcadas com [alfa-³²P] pelo método de marcação aleatória usando-se o kit DECAprime II (Ambion Inc. US). Conforme representado na Figura 7B, a sonda Ά' é complementar ao mRNA de cadeia pesada entre os éxons CH1 e CH3 e, portanto, se hibridiza a ambas as isoformas. Em contraste, a sonda 'B' se liga apenas a uma 3‘UTR do mRNA de cadeia pesada de mlgG longa. Após hibridização e lavagem rigorosa da membrana, a transferência foi analisada por auto-radiografia.

A Figura 7A representa uma auto-radiografia de uma Northern blot com RNA total do clone 5B11, clone J5-H3 e linhagem celular Sp2/0Agl4. A hibridização com a sonda Ά' mostra um sinal de 1,8 kb predominante em ambos os clones que expressam anticorpo (pistas 1 e 2), o que corresponde aos tamanhos esperados da isoforma de mRNA curta que codifica a cadeia pesada da slgG. Na exposição longa representada, também são detectados alguns sinais fracos entre 2 e 4 kb. A banda de 3,3 kb, que só é vista no clone 5B11 (pista 1), representa a isoforma de mRNA longa, que codifica a cadeia pesada da mlgG, pois uma banda com o mesmo padrão de migração é detectada como um único sinal quando a transferência é hibridizada com a sonda 'B' (pista 4). A comparação das forças de sinais relativas das bandas de 1,8 kb e 3,3 kb na pista 1 sugere que o transcrito primário do transgene de cadeia pesada de anticorpo é processado predominantemente na isoforma de mRNA pequena, dando origem à forma slgG secretada do anticorpo. Apenas uma pequena quantidade (menos de 5%) é completamente spliced como isoforma de mRNA longa, levando, assim, à mlgG ligada a membrana plasmática.

Exemplo 7 Purificação e detecção de isoformas de cadeia pesada de IgG por extração com carbonato alcalino e imunotransferência

Para detectar a cadeia pesada de mlgG, proteínas de membrana foram extraídas de células transfectadas de maneira estável usando-se o método de extração com carbonato alcalino desenvolvido por Fujiki (Fujiki,

Y., et al., J. Cell Biol. 93 (1982) 97-102). Em cada caso, 107 células foram lavadas duas vezes com PBS, então, uma vez com NaCI a 0,1 M em gelo. Após ressuspensão em 1 mL Na₂CO₃ frio a 0,1 M, pH 11,5, as células foram rompidas por sonicação durante 20 segundos, incubadas em gelo durante 30 minutos e, então, centrifugadas durante 60 minutos com 200.000 x g a 4^QC. Com essa etapa, as membranas celulares ainda contendo proteínas de membrana integradas são separadas do conteúdo solúvel. Os sobrenadantes foram coletados, e se adicionou Triton X-100 a uma concentração final de 1% (p/v), N-octil-beta-D-glucopiranosida a uma concentração final de 60 mM, TRIS-HCI pH 7,4 a uma concentração final de 50 mM e NaCI a uma concentração final de 300 mM (fração SN). Portanto, as pelotas de membrana foram resolvidas em 1,1 mL de Na₂CO₃ a 0,1 M, pH 11,5, 1% (p/v) de Triton X-100, 60 mM de N-octil-beta-D-glucopiranosida, 50 mM de TRIS-HCI pH 7,4 e 300 mM de NaCI. Os componentes insolúveis depois dessa etapa foram removidos por centrifugação durante 10 minutos a 15.000 x g, e os sobrenadantes foram coletados como fração de membrana. Ensaios de extração de proteína A foram realizados para purificar as isoformas de anticorpo das frações de membrana ou SN. Depois disso, cada fração foi incubada com 30 pL de volume de leito de Proteína A Sepharose (GE Healthcare, anteriormente Amersham Biosciences, Suécia) durante 60 minutos a 4⁹C, então, lavada quatro vezes com PBS contendo 0,02% (v/v) de Igepal CA360. Proteínas ligadas à matriz de proteína A foram eluídas com o tampão de amostra de gel de proteína redutora a 70⁹C e separadas por eletroforese em SDS gel de poliacrilamida (NuPAGE®-system, Invitrogen Corp., US). Depois da separação, as proteínas foram transferidas para uma membrana de PVDF (fluoreto de polivinilideno), de acordo com o método de imunotransferência semi-seco (Ausubel, F.A., et al. (eds.) Current Protocols in Molecular Biology, Vol. 2, John Wiley e Sons, Inc., New York (1995)). Cadeias pesadas de IgG imobilizadas na membrana foram marcadas com anticorpos IgG policlonais anti-humanos de coelho acoplados a peroxidase de raiz-forte (DakoCytomation, DAKO A/S, Denmark) e detectados por reação de quimioluminescência (LUMI-Light PLUS Western Blotting Kit, Roche Diagnostics

GmbH) em um LUMI-lmager F1 (Roche Diagnostics GmbH).

Um sinal forte de acordo com a cadeia pesada de slgG podia ser detectado na fração de membrana e SN de ambos os clones que expressam anticorpos (clones 5B11 e J5-H3, veja Figura 8, pistas 1, 2, 4 e 5). No caso 5 do clone 5B11, detecta-se uma proteína adicional que migra acima da cadeia pesada de slgG (Figura 8, pista 1).

Essa banda é predominantemente encontrada na fração de membrana desse clone, em que as proteínas de membrana integradas estão enriquecidas. Representa a maior isoforma de cadeia pesada de mlgG, que 10 tem um peso molecular calculado 8 kDa maior que o da cadeia pesada de slgG. Consistentemente, não há nenhum sinal correspondente no clone J5H3 (Figura 8, pista 2), pois esse clone expressa apenas a forma secretada do anticorpo.

Exemplo 8

Cultivo e transfecção de células CHO-K1.

Células CHO-K1 (ATCC No. CCL-61; Puck, T.T., et al., J. Exp. Med. 108 (1958), 945- 956), que tenham sido pré-adaptadas a crescimento livre de soro em cultura de suspensão, foram cultivadas em meio ProCHO4CDM (Cambrex Corp., US), suplementado com 8 mM de L-Alanil-L20 glutamina (Invitrogen Corp., US) e 1 x suplemento HT (Invitrogen Corp., US), a 37^SC, 5% de CO₂ e 95% de umidade em balões de suspensão. A cada 3 4 dias, as células são divididas com 2 x 10⁵ células/mL em meio fresco. Para transfecção, as células são eletroporadas com 20 pg de DNA plasmídico por

7,5 x 10⁶ células em um volume total de 200 pL de PBS à temperatura ambi25 ente. As eletroporações são realizadas com um dispositivo de eletroporação Gene Pulser XCell (Bio-Rad Laboratories, US) em uma cubeta com um vão de 2 mm, usando um protocolo de onda quadrada com um único pulso de 160 V durante 15 ms. Para a geração de clones que expressem IgG de maneira estável, 6 x 10⁷ células foram eletroporadas com o plasmídio pmlgGA30 B conforme descrito. Depois disso, as células foram cultivadas reunidas no meio acima especificado durante cerca de duas semanas com 700 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) adicionado à cultura um dia após a transfecção para seleção de células transfectadas de maneira estável.

Exemplo 9

Classificação de células CHO-K1 transfectadas de maneira estável por citometria de fluxo

Após a seleção, a IgG ligada à superfície das células transfectadas foi marcada, e as células com os sinais mais intensos foram classificadas por citometria de fluxo. Conseqüentemente, 4 x 10⁷ células do material reunido foram primeiro passadas através de uma malha de náilon de 40 μΜ para remover os agregados maiores e, então, incubadas com Accumax (PAA) durante 15 minutos a 37^eC para separar agregados menores restantes. As células foram incubadas em 1 % (p/v) de BSA no meio (veja exemplo 8) durante 20 minutos em gelo, então, tingidas com 10 ng/mL de Proteína A Alexa Fluor 488 (Molecular Probes Inc., Invitrogen Corp., US), em urn volume total de 8 mL de meio com 1% (p/v) de BSA durante 30 minutos em gelo, no escuro. Após duas etapas de lavagem com 1% (p/v) de BSA no meio, as células foram ressuspendidas no meio e transferidas para um classificador de células BD FACSAria (BD Biosciences, US). A população de células únicas vivas foi passada por um porta de gráfico de pontos de espalhamento a frente/espalhamento lateral (FSC/SSC). Foi definida uma subpopulação englobando as células com os 5% superiores de intensidade de fluorescência das células vivas passadas pela porta, e cerca de 45.000 células dessa subpopulação foram coletadas (células reunidas classificadas para mlgG). Como controle, cerca de 40.000 células foram aleatoriamente coletadas a população de células vivas passadas pela porta FSC/SSC, independentemente de sua fluorescência (células reunidas de controle). As células reunidas coletadas foram expandidas por cultivo em meio de seleção (veja exemplo 8) durante duas semanas. Realizou-se, então, um segundo ciclo de classificação. As células do grupo de células reunidas classificadas para mlgG foram tingidas para IgG de superfície celular, conforme acima descrito. Usando-se um classificador de células BD FACSAria (BD Biosciences, US), as células com os 4% superiores de intensidade de fluorescência foram separadas da população de células únicas vivas (passadas pela porta do gráfico de pontos FSC/SSC).

As células classificadas foram coletadas como células únicas em placas de 96 poços. Das células reunidas de controle, coletaram-se células únicas aleatoriamente da população de células vivas não tingidas passadas pela porta FSC/SSC. Clones de células únicas foram expandidos por cultivo em meio de seleção (veja exemplo 8) durante três semanas.

Exemplo 10

Determinação das concentrações de IgG por ELISA

A concentração de imunoglobulina nos sobrenadantes de cultura celular foi determinada por um ELISA em sanduíche, que usou um fragmento F(ab')2 de IgG anti-humana biotinilada como um reagente de captura e, para detecção, um fragmento F(ab')2 de anticorpo IgG anti-humana conjugada a peroxidase.

Placas de 96 poços revestidas com estreptavidina (Placas de Tiras de Poliestireno Revestidas com Estreptavidina Pierce Reacti-Bind™, Código N^s 15121) foram revestidas com 0,5 pg/mL de fragmento F(ab')2 de anticorpo IgG policlonal anti-humano de cabra biotinilado (F(ab')2<h-Fcy>Bi; Dianova, Alemanha, Código N⁹ 109-066-098) anticorpo de captura (0,1 mL/poço) em tampão diluente (tampão diluente: tampão PBS contendo 0,5% peso por volume (p/v) de albumina sérica bovina) por incubação durante uma hora à temperatura ambiente (TA) sob agitação. Depois disso, as placas foram lavadas três vezes com mais de 0,3 mL de tampão de lavagem (tampão de lavagem: PBS contendo 1% (p/v) de Tween 20). Sobrenadantes de cultura celular contendo IgG (amostras) foram diluídos serialmente (duas vezes) até uma concentração de 0,5 - 20 ng/mL em tampão diluente, adicionados aos poços e incubados durante uma hora à TA com agitação, Anticorpo padrão purificado (0,5 - 20 ng/mL) em tampão diluente foi usado para a geração de uma curva padrão de proteína IgG. Depois de lavar as placas três vezes com 0,3 mL/poço de tampão de lavagem, complexos ligados a Fey anti-humana foram detectados com o fragmento F(ab')2 conjugado a peroxidase de IgG anti-humana policlonal de cabra específica para F(ab')2 (F(ab')2<h-FcY>POD; Dianova, Alemanha, Código N⁹ 109-036-098). Depois de lavar as placas três vezes com 0,3 mL/poço de tampão de lavagem, as placas foram reveladas com solução de substrato de peroxidase ABTS® (ácido 2,2'-azino-bis(3- etilbenzotiazolina-6-sulfônico) (Roche Diagnostics GmbH, Alemanha, Código N⁹ 1684302). Após 10-30 minutos, mediu-se a absorbância a 405 nm e 490 nm contra um reagente em branco (tampão de incubação + solução de ABTS) em um leitor de placas Tecan Spectrafluorplus (Tecan Deutschland GmbH, Alemanha). Para uma correção de fundo, a absorbância a 490 nm foi subtraída da absorbância a 405 nm, de acordo com a seguinte fórmula:

ΛΔ_/Δ^405ηπι /\490nm \ /A405nm *490nm brancox amostra ~ ™ amostra) ~ em branco ^M em /

O teor de IgG das amostras foi calculado a partir da curva padrão.

Exemplo 11

Triagem e seleção de clones de CHO que expressam mlgG

Três semanas após as deposições de células únicas em placas de 96 poços, os sobrenadantes de cultura celular de 515 clones classificados para mlgG e de 550 clones de controle foram analisados por ELISA (veja exemplo 10). A Tabela 6 mostra a distribuição dos clones para diferentes níveis de concentração de IgG.

Tabela 6: Triagem de clones depositados em placas de 96 poços por ELISA.

IgG em SN [pg/mL]	Clones classificados para mlgG	Clones de controle
n⁹ de clo- nes	% de clones		n⁹ de clo- nes
< 1	0	0	495	90.0
<2	65	12.6	44	8.0
<3	76	14.8	5	0.9
< 4	67	13.0	2	0.4
<5	66	12.8	0	0
<6	58	11.3	1	0.2
<7	35	6.8	0	0
<8	39	7.5	0	0

IgG em SN [gg/mL]	Clones classificados para mlgG	Clones de controle
n^s de clones	% de clones		n^Q de clones
<9	32	6.2	1	0.1
< 10	21	4.1	0	0
<11	16	3.1	0	0
< 12	9	1.8	1	0.2
< 13	6	1.1	1	0.2
< 14	4	0.8
< 15	3	0.6
< 16	2	0.4
< 17	3	0.6
< 18	2	0.4
< 19	1	0.2
<20	2	0.3
<21	1	0.2
<22	1	0.2
> 22	6	1.2

Observou-se que, na abordagem de controle, 90 por cento de todos os clones mostravam uma concentração de IgG de 1 pg/mL e menor. Em contraste, nenhum clone classificado para mlgG se achava nesse grupo. Além disso, nessa abordagem, concentrações de IgG de mais de 22 pg/mL 5 foram atingidas por 6 clones, ao passo que a maior concentração de IgG medida na abordagem de controle foi de 12,3 pg/mL. Todos os clones classificados para mlgG com mais de 10 pg/mL e todos os clones de controle com mais de 3 pg/mL foram, então, transferidos para placas de 24 poços para uma segunda triagem. Os clones cresceram por cultivo em meio de seleção 10 (veja exemplo 8) durante 20 dias, então, as concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por ELISA. A Tabela 7 mostra a distribuição de clones para diferentes níveis de concentração de IgG.

Tabela 7: Triagem de clones depositados em 24 poços por ELISA.

IgG em SN [pg/mL]	Clones classificados para mlgG	Clones de controle
n⁹ de clones	% de clones		n⁹ de clones
<5	2	3.7	3	50.0
< 10	1	1.9	1	16.7
< 15	2	3.7	1	16.6
<20	1	1.8	1	16.7
<25	5	9.3
<30	12	22.2
<35	13	24.1
<40	7	12.9
<45	5	9.3
<50	4	7.4
<55	1	1.8
<60	1	1.9
average IgG conc. (pg/ml)	31.4	6.1

Os clones de controle apresentavam níveis de expressão de até

16,8 pg/mL, com uma concentração média de IgG de 6,1 pg/mL. Em contraste, a expressão média dos clones classificados para mlgG foi de 31,4 pg/mL, com 58,9 pg/mL sendo a maior concentração de IgG observada em um clone desse grupo. Os seis clones classificados para mlgG com mais de 45 pg/mL e os dois clones de controle com mais de 10 pg/mL foram, então, transferidos para balões com agitação de 125 mL para avaliação adicional. Exemplo 12

Avaliação de produtividade para clones de CHO selecionados

Para adaptação à agitação, os clones selecionados do Exemplo foram transferidos para balões de agitação de 125 mL e cultivados em 25 mL de meio de seleção (veja exemplo 8) dirante uma semana, em um agitador giratório com 150 rpm, sob condições padronizadas (veja exemplo 8).

Depois disso, para cada clone, 25 mL de meio ProCHO5-CDM (Cambrex

Corp., US), suplementado com 8 mM de L-Alanil-L-glutamina (Invitrogen

Corp., US), 1x suplemento HT (Invitrogen Corp., US) e 400 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) foram inoculados com 1 x 10⁶ células/mL e cultivados em balões de agitação de 125 mL conforme acima descrito. Nos dias 0, 1, 2, 3, 4 e 7, a contagem de células de cada clone foi determinada com um contador de células CASY® TT (Schãrfe Systems, Ale5 manha), indicando um crescimento comparável de todos os clones testados (veja Tabela 8).

Tabela 8: Contagem de células das culturas de agitador.

Clone	contagem de células [106/mLj
dia 0		dia 0		dia 0
Clones classificados para mlgG
1A1	1.10	1.15	4.30	5.57	7.46	9.96
1B6	1.10	1.22	4.12	5.60	6.58	8.76
1C5	0.99	1.81	5.59	5.53	6.06	5.76
1D1	0.99	1.58	3.08	5.77	5.39	5.40
1D6	1.11	1.31	5.06	5.70	6.60	8.36
2D6	1.09	1.42	3.37	5.32	5.42	5.12
clones de controle
KO2	1.07	1.42	3.23	4.94	5.06	7.12
KO6	1.03	1.55	5.89	5.56	7.44	8.00

No dia 10, os sobrenadantes de cultura celular foram coletados, e as concentrações de IgG foram determinadas por ELISA (veja Tabela 9).

Tabela 9: Determinação de produtividade de culturas de agitador de 10 dias por ELISA. .______________________._______________________{_}

clone	IgG no SN \|jxg/mL]
clones classificados para mlgG
1A1	47.9
1B6	57.2
1C5	188.9
1D1	151.0
1D6	59.1
2D6	165.6
clones de controle
KO2	56.5

clone	IgG no SN [gg/mL]
KO6	34.6

Observou-se que três dos seis clones classificados para mlgG (isto é clones 1 Al, 1B6 e 1D6) mostraram níveis de expressão em uma faixa comparável à dos dois clones de controle. Os outros três clones classificados para mlgG (isto é clones 1C5, 1D1 e 2D6) mostraram uma expressão de IgG acentuadamente elevada, que era até 3,3 vezes maior que a observada nos clones de controle.

Exemplo 13

Análise Northern blot de clones de CHO selecionados

Os seis clones classificados para mlgG e os dois clones de controle adaptados para crescimento em balões de agitador (veja exemplo 12) foram analisados por Northern blot para definir a razão entre as duas isoformas de cadeia pesada que surgem por splicing alternativo do transcrito primário. Para comparação, o clone '27' foi analisado em paralelo. Esse clone foi obtido por transfecção estável de células CHO-K1 com um vetor de expressão genomicamente organizado para apenas a forma secretada do anticorpo idêntico. O Northern blot foi realizado conforme descrito em detalhes no exemplo 6 e mostrado na Figura 9.

Exemplo 14

Construção do vetor de expressão de slgG/lgG-GPI 'plgG-GPI-B¹

Para ancoragem em membrana plasmática de uma imunoglobulina, o domínio transmembrana nativo codificado pela parte 3' do éxon M1 e a região intracelular codificada pelo éxon M2 são substituídos pelo peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana que medeia a ancoragem de glicosilfosfatidilinositol (GPI). Conseqüentemente, a seqüência de DNA do plasmídio pmlgGA-B (veja exemplo Ic) que codifica os seguintes 53 aminoácidos: LWTTITIFITLFLLSVCYSATVTFFKVKWIFSSVYDLKQTIVPDYRNMIRQGA (SEQ ID NO: 146) é substituída pela seqüência de DNA que codifica a seguinte seqüência de aminoácidos do peptídio de sinal carbóxi terminal da fosfatase alcalina pia

100 centária humana (acesso NCBI: M 13077; nucleotídeos: 1542 -1643): AGTTDAAHPGRSWPALLPLLAGTLLLLETATAP (SEQ ID NO: 147).

A seqüência de ácido nucléico da região constante do cassete de expressão de cadeia gama, de CH1 a 3'UTR, do plasmídio de expressão 5 plgG-GPI-B é dada na SEQ ID NO: 148.

A seqüência de aminoácidos correspondente da isoforma slgG da região constante de cadeia gama codificada pelo plasmídio plgG-GPI-B é dada na SEQ ID NO: 149.

A seqüência de aminoácidos correspondente da isoforma longa 10 da região constante de cadeia gama incluindo peptídio de sinal carbóxi terminal da placental fosfatase alcalina de placenta humana codificada pelo plasmídio plgG-GPI-B é dada na SEQ ID NO: 150.

Esse plasmídio permite a expressão da forma secretada (slgG) e uma forma ancorada a GPI de um anticorpo por splicing alternativo do pré15 mRNA de cadeia pesada (veja figura 10).

101

Seqüência de Listagem <110> F. Hoffmann-La Roche AG <120> Células Produtoras de Polipeptídio <130> 23748 WO <150> EP 06010146.6 <151> 2006-05-17 <160>176 <170> Patentln versão 3.2 <210>1 <211> 2767 <212> DNA <213> Homo sapiens <400>1

gtgagtcacc	cccaggccca	gggttgggac	ggggactçtg	aggggggcca	taaggagctg	60
gaatccatac	taggcagggg	tgggcactgg	gcaggggcgg	ggctaggctg	tcctgggcac	120
acaggcccct	tctcggtgtc	cggcaggagc	acagacttcc	cagtactcct	gggccatgga	180
tgtcccagcg	tccatccttg	ctgtccacac	cacgtgctgg	cccaggctgg	ctggcacagt	240
gtaagaggtg	gatacaaccc	ctcgccgtgc	cctgaggagt	ggcggtttcc	tcccaagaca	300
ttccccacgg	ctgggtgctg	ggcacaggcc	ttccctggtg	tgaccgtgaa	tgtggtcacc	360
ctgaacagct	gccctctctg	gggacatctg	actgtccaag	accacagtca	gcacctctgg	420
gagccagagg	ggtctccaga	gacccccaga	tgtcaggctt	gggctcagtg	cccagcgaaa	480
ggtcagcccc	acacatgccc	ataatgggcg	cccacccaga	gtgacagccc	ccagcctcct	540
gccaggccca	cccttttccg	cccccttgag	gcatggcaca	cagaccagtg	cgcccactgc	600
ccgagcatgg	ccccagtggg	atgtggtggc	cacgaggggc	tgtacacaca	gcaggaggct	660
gtccgccctg	ctcagggcct	gctgcctatg	ccccagctgt	ccaaccaagg	gaggcatgga	720
agggcccctg	gtgtaagctg	gagccaggca	cccaggcccc	cggccaccct	gcagagccaa	780
ggaaaggaag	acacccaagt	caacaagggg	cagggctgag	ggctgtccca	ggctcttttg	840
gcccgagggg	ctgccagcag	ccctgacccg	gcatgggcct	tccccaaaag	cgaccctgtg	900
aggtggcctc	acagagaacc	ccctctgagg	acagtgtctg	accctgcctg	cctcacacag	960
atgggcccca	cagcagtggg	caacctgggg	ggcagcagcc	caacctgacc	ctgcagggac	1020
tgccccctgc	agcagcagct	gcttctcagt	cccccaacct	ccctgtcccc	gccagagggt	1080

cttccccgaa gctgcagccc caacccatgg ctgcccacct ggaaccggga ctccctgtcc 1140

102

actgccccct	ccccttcggg	gccccatctg	tgctggggcc	caggttcggc	ctacagattc	1200
ccatcattgc	catggcctcc	tgaccttgcc	tatccacccc	caaccaccgg	ctccatgctg	1260
accctccccc	aggctcccac	gcccagctgg	ccggccatcc	ccaggcacag	acagtctggg	1320
atctcacagg	ttagcctgga	ccatccacct	ggccagacct	gggagaggct	ggaagctgcc	1380
ctgccaccat	gctccagggc	cccaggttgc	agtactatgg	ggtgagggtg	tgtgtgcaca	1440
cctgtgtgta	cctaggatat	ccgagtgtac	ccttgtgccc	ccaagcacaa	gtctccctcc	1500
caggcagtga	ggcccagatg	gtgcagtggt	tagagctgag	gcttatccca	cagagaaccc	1560
tggcgccttg	gtcaaggaag	cccctatgcc	tttcttgcct	cgatttcccc	tcttgtctgc	1620
tgagccagca	ggggccacgt	cctgggctgc	tgtgaggagg	aagcaagttg	gtgctaggag	1680
gggctcctgt	gtgtgcatgg	gcgggagggg	tgcaggtatc	tgagcacccc	ggtctccact	1740
tgagagagca	gggcaggagc	tccctgaccc	acccagacta	cacacgctgt	gtccacgtgt	1800
ctcccattat	ctgtggcaga	ggatccggct	tctttctcaa	tttccagttc	ttcacaaagc	1860
aatgcctttg	taaaatgcaa	taagaaatac	tagaaaaatg	atatgaacag	aaagacacgc	1920
cgattttttg	ttattagatg	taacagacca	tggccccatg	aaatgatccc	ggaccagatc	1980
cgtccacacc	cgccactcag	cagctctggc	cgagctcaca	gtacaaccac	aataaactct	2040
tgttgaatga	actctaggaa	gtctgtgacg	tggctggttc	ttgtcaatgc	ttcctgcctg	2100
cccacaggct	cttcctcgtg	gatggggctg	tgcttgccac	ggaagcgcgt	ttttcccggc	2160
ctaggcttgc	cttgggcccc	actgccgtct	ccagctggag	atgaccttct	atacacacat	2220
ttgctcatga	cagacccttg	cttagccccc	ttccatggct	ccctcctgct	gctgggataa	2280
aatcaccttg	cctggatatc	ccctcctggg	cccctttcca	ccctccttag	tcagcacccc	2340
cagttcaggg	cacctgcttt	ccccgctgcg	gagaagccac	tctctccttg	ctgcccggct	2400
gtgtcttgcc	ttccacacct	tgtcacagtg	gccacttcct	aaggaaggcc	tccctgtgtg	2460
caggtgtgca	gaagtgcccc	agcctcccgt	cacctttgtc	acgggagccc	aatccatgag	2520
agtctatggt	tctgtctgtc	tgccccactc	agggcagcga	caagtccagg	cggggaggac	2580
acagtaggca	gagatttgtc	gaggggacat	atgagcaaga	gggtgaggct	gggagctccc	2640
tggagataac	cacgcctcct	gggaagactc	gccgtcattt	cagctccacg	ctgtgcgggg	2700
gtgggtggag	gggtagcctg	gccctcatga	ccagggagct	tctcactcag	cccctgttcc	2760
tccccag						2767

<210> 2 <211> 1287 <212> DNA <213> Homo sapiens

103 <400> 2 gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtg tacatacttc ccaggcaccc agcatggaaa taaagcaccc120 agcgcttccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagt gggtcccact gtccccacac tggcccaggc240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacgag360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg420 ttctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc600 tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga780 acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc840 tcggcagctt ctccacatgc tgacctgctc agacaaaccc agccctcctc tcacaaggtg900 cccctgcagc cgccacacac acacagggga tcacacacca cgtcacgtcc ctggccctgg960 cccacttccc agtgccgccc ttccctgcag ctggggtcac atgaggtgtg ggcttcacca1020 tcctcctgcc ctctgggcct cagggaggga cacgggagac ggggagcggg tcctgctgag1080 ggccaggtcg ctatctaggg ccgggtgtct ggctgagccc cggggccaaa gctggtgccc1140 agggcgggca gctgtgggga gctgacctca ggacattgtt ggcccatccc ggccgggccc1200 tacatcctgg gtcctgccac agagggaatc acccccagag gcccaagccc agggggacac 1260 agcactgacc acccccttcc tgtccag1287 <210> 3 <211> 1301 <212> DNA <213> Homo sapiens <400> 3 gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtc tacatacttc ccgggcaccc agcatggaaa taaagcaccc120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccgtgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagc gggttccact gtccccacac tggcccaggc240

104

tgtgcaggtg	tgcctgggcc	gcctagggtg	gggctcagcc	aggggctgcc	ctcggcaggg	300
tgggggattt	gccagcgtgg	ccctccctcc	agcagcagct	gccctgggct	gggccacggg	360
aagccctagg	agcccctggg	gacagacaca	cagcccctgc	ctctgtagga	gactgtcctg	420
tcctgtgagc	gccctgtcct	ccgacctcca	tgcccactcg	ggggcatgcc	tagtccatgt	480
gcgtagggac	aggccctccc	tcacccatct	acccccacgg	cactaacccc	tggctgccct	540
gcccagcctc	gcacccgcat	ggggacacaa	ccgactccgg	ggacatgcac	tctcgggccc	600
tgtggaggga	ctggtccaga	tgcccacaca	cacactcagc	ccagacccgt	tcaacaaacc	660
ccgcgctgag	gttggccggc	cacacggcca	ccacacacac	acgtgcacgc	ctcacacacg	720
gagcctcacc	cgggcgaacc	gcacagcacc	cagaccagag	caaggtcctc	gcacacgtga	780
acactcctca	gacacaggcc	cccacgagcc	ccacgcggca	cctcaaggcc	cacgagccgc	840
tcggcagctt	ctccacatgc	tgacctgctc	agacaaaccc	agccctcctc	tcacaaggtg	900
cccctgcagc	cgccacacac	acacaggccc	ccacacacag	gggaacacac	gccacgtcgc	960
gtccctggca	ctggcccact	tcccaatgcc	gcccttccct	gcagctgagg	tcacatgagg	1020
tgtgggcttc	accatcctcc	tgccctctgg	gcctcaggga	gggacacagg	agatggggag	1080
cgggtcctgc	tgagggccag	gtcgctatct	agggctgggt	gtctggctga	gtcccggggc	1140
caaagctggt	gcccagggca	ggcagctgtg	gggagctgac	ctcaggacac	tgttggccca	1200
tcccggccgg	gccctacatc	ctgggtcctg	ccacagaggg	aatcaccccc	agaggcccga	1260
gcccagcagg	acacagtatt	gaccacccac	ttcctgtcca	g		1301

<210> 4 <211> 1914 <212> DNA <213> Homo sapiens <400> 4 gtaaacccac cctgtacaac gtgtccctgg tcatgtccga cacagctggc acctgctact60 gaccctgctg gcctgcccac aggctcgggg cggctggccg ctctgtgtgt gcatgcaaac120 taaccgtgtc aacggggtga gatgttgcat cttataaaat tagaaataaa aagatccatt180 caaaagatac tggtcctgag tgcacgatgc tctggcctac tggggtggcg gctgtgctgc240 acccaccctg cgcctcccct gcagaacacc ttcctccaca gcccccaccc ctgcctcacc300 cacctgcgtg cctcagtggc ttctagaaac ccctgaattc cctgcagctg ctcacagcag360 gctgacctca gacttgccat tcctcctact gcttccagaa agaaagctga aagcaaggcc420 acacgtatac aggcagcaca caggcatgtg tggatacaca tggacagaca cggacacaca480 caaacacatg gacacacaga gacgtgctaa cccatgggca cacacataca cagacatgga540

105

cccacacaca	aacatatgtg	gacacacatg	tacaaacatg	cacaggcaca	caaagagaac	600
actgactaca	ggcacacaca	cacacgggca	cactacccac	aggcacacaa	cagatggaca	660
cgcgtacaca	gacatgcaca	cacccacagg	cacaacacgt	gcgcatgccg	gccggccccc	720
gcccacattc	tcccagggcc	ctgccggata	ctctgtccct	gcagcagttt	gctccctgcg	780
ctgtgctggc	cccggggctt	tgggcccagg	ctctgcttgt	ccttctgtct	ctgcttggag	840
gtgctgccat	ggcacccagc	ttgggctctg	cctggggagc	ggaggcccca	gggatagcat	900
gtgacccctg	ctgaggccag	gctcctgatg	aaggcagcag	atagccccca	cacccaccgg	960
tgagcagaac	cagagcctgt	gccatgtgct	gagagcaggc	agtgactaag	catatgggcc	1020
cagagggcag	agtggctgcc	ctgggcagct	gctcctctta	gcaggaggcc	tcaggagatg	1080
agctagagca	agtctgcccc	tgcaaatacc	acctgctccc	caacccacag	cagggagcag	1140
gcgaggtcag	acagcagcag	cccgggaagg	accgagcccc	agcagggaag	gcagggcccg	1200
agtgaggtct	ccacacccaa	cgcacagtgc	tgtctctaac	tggggccacc	tccgagtccc	1260
cgccacactc	ttggcccttt	ggagtcctgg	gctccaggtg	tctcccaagg	gcccatctgt	1320
gcaggggatg	caaccccccg	aatgtcctca	tcccactgtg	gagctcaggt	ctctgtctgc	1380
tccctgggtc	ctggcagggt	aggacaagtc	cgccaggatg	tccccatgca	gactctgctc	1440
caagagggag	ctggagagtc	agggccttgg	tgagggagtc	aggatcgggt	tccccccagc	1500
tcagtcctcc	cacctgccag	cccccacagc	acagggcagg	gccacacccc	ctgcttcccc	1560
ctccaggaga	gtcaggacat	gctggccgct	gctccgctgg	ggccccgccc	tccagccccc	1620
accttggtct	gtgtgctgca	tcccccacgc	tctctctgcc	accccaggac	tctgaggaaa	1680
agacctcaga	gtcccagccc	tgcc-cagcct	cggcctgtgc	ccccgctgca	tcaggctttc	1740
aggggcccag	cccatgccct	gggcagtgcc	cgagcccccc	tgcacttgct	ctccccaccc	1800
ctgggtgcag	cacagcctag	gggccaaggg	tgggcctaga	ggatgggccc	cgggggggct	1860
ttgctgggtg	ccaccccagc	ctgaccctat	tcccccgtgc	tgtgtctcct	gcag	1914

<210>	5
<211>	2432
<212>	DNA
<213>	Mus musculus
<400>	5

gtaaacccac	caatgtcagc	gtgtctgtga	tcatgtcaga	gggagatggc	atctgctact	60
gagccaccct	gcctgtccct	actcctgaaa	taaactctgt	gctcatccaa	agtatccctg	120
cacttccatc	cagtgcctgt	ccatcatcct	tagggtctac	agaacacagg	gaggggtcag	180
ggcccaggga	gggagaaaca	ccaccaccta	agcttgtaag	gcctcggaga	ctttgaagac	240

106

ccttcatgcc	tagagtatat	gtgtatgcat	gtctatgtat	tggtgagtgc	ttatggatgg	300
gtccatgtgc	cttcatgtgt	gtacctgtgt	gcagcaagag	aggagtgagt	ttgtgtgcac	360
ctatggttta	taggtatgta	tatgggtata	agtacatatg	tggacacact	atatctatgt	420
ccctgtgagc	aagtgtgtgc	ctgtgcatac	ctatgagcat	gcatatatct	atgtgtgttc	480
atgttggtgg	aaacatgaga	gtgtgtgcac	ctgccctgtg	aatgtgcaat	gagtgaatgg	540
gaagtaagaa	taaactgggg	atgaaatcca	aggcgagcag	actcagccaa	gaaggcaaag	600
ctcatgggag	agtccccagg	gcagtgggtt	gctgcacaag	tactctgagt	ggtgggtggt	660
gtggctgttt	attagaccgc	agcttctaac	ccaaacaaga	cagggataga	tggagcaaaa	720
gggtagcacc	atcaaggctg	gtgccgtgtg	ggggtcacaa	tagagatgat	ggtatgagaa	780
tgaagggatg	aacacagggg	cactgggaag	aagatgccac	gcaccctcag	taggccatcc	840
ctgaatggaa	acatgcattc	agggtgacca	ctgactcatg	agaaagacat	atagcatggc	900
acagacaacc	ctcagcagca	ccctgctctt	cacacatgca	catgggcata	caccctgttc	960
tgcatacatg	cacatgggca	tacatgcaca	gacactcaca	tttgcacact	cacacagacc	1020
tgaaccctgg	aggaagatga	agttcacagc	ccacacccag	cttctggaaa	gcaaggggag	1080
tcccctccaa	gcccccggga	gaatttccag	gcccgacact	gacaactaca	cacaatggac	1140
aagggcatag	gcccctccag	gtgccccctt	tctaacctaa	gtctcccttc	ccatcctgag	1200
cccaagtatc	acaaaccaga	agcaggataa	gaggcaaatc	tgggaagaag	caggagcagg	1260
ccatggagac	cactcccaca	caggcctcgg	cctcctccat	gggcacccct	agaacacaaa	1320
gttctacaac	caggtatact	tggagcccag	gtgtccacaa	gagggcagtg	ggggccctgc	1380
tcctgtctca	caggccttca	gaacttcggg	gggggggggg	aggagttgct	ggtttctagc	1440
aacttccctc	tgctctcaga	gcaagagtgg	agtaaaggcc	catgcatgcc	ctggatactc	1500
tccagcttga	aagtccagtt	ccctgagaat	agcaagagca	acagaccagc	ttgggaaacc	1560
tgactcagaa	aagtaccata	gccacccatg	gaatccaagg	cctggcccat	gacagagaat	1620
cctagtaagg	aggagtcaat	aggtgaaaga	ctgaatcccc	acagggagag	ggggcagaga	1680
agctggagaa	tcacgatagt	cgggaaagat	gatgagtgag	cggctggagg	gtaatggatg	1740
gctggctaca	aggatgaacg	atggggatga	tggatggatt	gatggatggc	tgcagtgaca	1800
gaaatacgag	tggttgacta	tcagtacaca	tttcctactg	ccacttaaaa	tgaaactctg	1860
tgcgcagaga	acctgaggac	agcagggttg	gctctactgg	gggtctttac	tgttgcttaa	1920
cccccagtca	cagctcttaa	gaatgcaaca	gagtcctctg	accacatgtc	caggccttgg	1980
tagtctaact	ttggcccaga	aatcacattg	gcctgtatct	gtttgaaggt	gtctgatctt	2040
acacaaccct	agtacccaag	ccaagattag	cctaagaact	ggggtttagg	gaggtattgc	2100

taaatatcta gaaaggactg agacctaagg agccttgggt tcaaactctt ctcagagttt 2160

107 gacagaaaca actctcttac catgacaggt ctctaattaa ggtttcccta agagagagag atgggtcttg gggccatctc aagaactgct gggattccag tcccttacct gggaccctgc ctcctcatta tccctgaaca agtcccttcc cgggaataag ggacccctac caccactgtc cccaaagccc aaggaggcat agaagcagaa accttaagtc tgagccccca tccccatggg tttggatcta gaaggtcatc tatgtcttac ag <210> 6 <211> 1411 <212> DNA <213> Mus musculus <400> 6 gtaaatgatc ccagtgtcct tggagccctc tggtcctaca ggactctgac acctacctcc acccctccct gtgtaaataa agcacccagc actgccttgg gaccctgcaa taatgtcctg gtgatttctg agatgtagag tctagctagg tcatggaatg aggggtctcc atggtttgag gcctgagttg tgactaagga aaaacccata ggcctacact gccacaccca gcacttttga atttgcctga catgaaaaga atttacctct ccctggaaag tggagcctta tccctaggca gttcccttac cagaccttcc tctagcttgc actttgttct gggcacagaa tgtgtctaac cccccaaagc aaggaagaca caacctctac ctccctcact ctgtccttac cccttttcct ggctaagcat ctcactgagt gcgctgaata gatgcatgtg gccacagtct tgcagacaga cccttgccat ctctccactc agctttccag aggctaagtc tagcccgtat ggtgataatg cagggagctc tatgctatct cagtgctatc agactcccaa gtggaggatg aacatggacc cattaaaacc aacctgcgca gcaacaccct gccaataagg cccgtatgtg aaaatgtgca cacatctaca catgcacagg cacacacaca cacacatgca tgggcacaca cacatacaga gagagagaat cacagaaact cccatgagca tcctatacag tactcaaaga taaaaaggta ccaggtctac ccacatgatc atcctcggca tttacaagtg ggccaactga tacagataaa acttttctat gccaaggacg ccaacatata cacaagtccg ctcatgacaa atctgtccct gaacctcaga ctggcgcccg tgactcatac agtggacact cctccaaagc tgtatagctt cctttacttc cctgtgtgta ctttctctga agtacactca tcacacagaa gaggccctgt gattactctg gccctctgtt cttggtcatc agagaataga cagaagatca ggcaaactac acagacactt cccacaatca tcacaggccc tgactctgct ctccagtctc aaaactgaag gctggagcac acagaataag ctcctgcaca ggccaggcca gtatcgggtc cagtgtgtct gactgagccc agggacaaaa tggcagcact ttggggaact gaggtttctg gtccaagaag gagagatgga ggcccaggga gggtctgctg acccagccca gcccagccca gctgcagctt

2220

2280

2340

2400

2432

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

108

tctcctgggc	ctccatacag	cctcctgcca	cacagggaat	ggccctagcc	ccaccttatt	1380
gggacaaaca	ctgaccgccc	tctctgtcca	g			1411
<210> 7
<211> 1357	r
<212> DNA
<213> Mus	musculus
<400> 7
gtaaatgagc	tcagcaccca	caaagctctc	aggtcctaag	agacactggc	acccatatcc	60
atgcatccct	tgtataaata	aagcatccag	caaagcctgg	taccatgtaa	aactgtcctg	120
gttctttcca	aggtatagag	catagctcac	gggctgatag	gtctggccag	ggttggagga	180
cagccttgtc	tataggaaga	gaatgaggtt	tctgcactgc	atgactcaga	ggtcatgagt	240
cattctgcct	tggactgttg	gggcttggct	ttaggcagtg	ccttttcctt	gccttcccat	300
gaaccagcag	ctgccagaca	tagagataat	cctaggaagc	ctcaaatgga	taagcacaca	360
aacccacctc	ccttaggctg	ttcctgtccc	cctgccccat	ttctctactt	aggggttttt	420
ctgagtctat	tgtggagtga	cacatggcca	ggggcattcc	atagaccttt	gtcatctata	480
ctctcaactc	aggcagcttt	tcacagacga	ggtctgcaca	cccatacaaa	tggctcactc	540
ctgcctgtgc	cacctggggc	tgaggcacat	ggctcttgat	gccccaaggg	agggactatt	600
agatagccac	actcatgcta	aatcctgacc	ctgctgaaca	ccatccagtc	catatagcac	660
atgtatcctc	atgctcgtga	gcacaaaacg	catttaacac	actgggacaa	ctcctctgtg	720
cccagcacag	cacctacatc	cagcaatgta	tcaccataca	cacggccaaa	aattcaatgc	780
ccacgtttct	gccatcacaa	tcagacacac	ctttcctctt	ctgaggacac	tccattctcc	840
gctcaaaaca	agacctctga	agccagattc	atctctggta	cctcggggtc	atgcttcaac	900
cccacatgaa	taattcaaac	catagccata	atggtctgaa	tcacttcaca	ctgggatgtt	960
cccaagttca	ggcaagaaaa	gccacaggct	ctgctgatga	ctgaagaata	gcaaagggtc	1020
agtccagctg	tatagccact	gttgacctgg	gtcacaggcc	ctgctgaccc	tccaccttct	1080
cctgtactga	aggaatgaaa	gatgagacaa	gcatagaggg	cacttgaata	atccaggtca	1140
ctctgaggtc	catccaaggc	attattggac	tcaggtggag	gaagctgaga	ctgatgtccc	1200
agagggaaag	gaaggaaagc	aggccccggg	gagggtctgc	tgtcccagtc	aggctggaga	1260
tctctcctct	gacttcatgc	agacatgtct	gcctcacagg	gaatctctcc	cagcatcaac	1320
catgttggga	caaacactga	ctgtcctctc	tgttcag			1357

<210> 8 <211> 1472

109 <212> DNA <213> Mus musculus <400> 8 gtaaatgaga acagcaccta gccattcctc gggtcttaca agacactgat accagcccta 60 accggtgaac cctataaata aagcacccag agatgggacc ttgtgagatt atcttggttc 120 tttacatggc acatagttca tgatacacct cagccacagg ctgtggggtc tggccagggt 180 tcaaggtgta agttaacatc caagaaagaa caaggtctta tactgccaga cccagggcat 240 gcaagtggac ctgcccttgc cagagatcat ccctctctgc atagcaagtt tgacccaagg 300 ggccctcttc atactcttcc ccacaaccag caactgttct gtgatgagtc tggagataga 360 aatatcgccc tagaaaatat ccaaagaaag gaacacagaa agtgtatccc acctcaacac 420 gaaccccacc ttcatttgtc tgtccttccc tctaccgtga ctcccctacc ttgacctagg 480 aggtctctgt atgtattaca tagacaggca ggaagactca tacatgaagc ccgttcatct 540 ccaccacacc cctagcgata gggataggga tgagtactcc taagagacta cctcccatat 600 gacattcact cacacctaag ttccaagaca ctgagagact tatgacccta gctgccccca 660 aggaagtaac taatcaaata cctacataga tgctgagacc agaactatta gaaccagcct 720 gctaagcatc actcaaccca catggtacct ccaagcctac atacatccac tgatacctca 780 cctaggcagc atgaatagca accaaaccca tcttagtgtc gggatatccc tagacactac 840 ctaaatgtac acatttggac cagtgaagat gaaatagctc tcatgggtac ctaactgttt 900 tcccctaaca cacacaagta ccttcagacc cattctgtcc ctctatgcct aagcccctat 960 tttcatccct tacagttaac actctcccat agctgtataa cctgactcac ttcccaatgt 1020 ggaccttcta ggaagcccag gtatcatcaa acgcaggccc tactctcact ctgtccctct 1080 gtactcagtc accagggaac aagcagtagg tcaggcaagc tgcagagcta ttacctacag 1140 ggcttccaag ccttgaatca gccaagccag ccccagtact gagggatagg gtagacaaaa 1200 agggttcctg catagcccag gccagcatca ggtccagtgt atctggctct acccagggac 1260 aaaacggcag cacattgggg agctgaggtt tctggttcac agagaacata aaggagagat 1320 ggccccaggg agggtcagat ggccccaggg agggtctgct gacccagtca ggctgcagct 1380 ttctcctggg cctccatgca gcctcctgcc acacagggaa tggccctagc tctaccttgt 1440 tgggacaaac actgactttc ctctctgttc ag 1472 <210> 9 <211> 1860 <212> DNA <213> Mus musculus

110 <400> 9 gtaaacccac actgtacaat gtctccctga tcatgtctga cacaggcggc acctgctatt60 gaccatgcta gcgctcaacc aggcaggccc tgggtgtcca gttgctctgt gtatgcaaac120 taaccatgtc agagtgagat gttgcatttt ataaaaatta gaaataaaaa aaatccattc180 aaacgtcact ggttttgatt atacaatgct catgcctgct gagacagttg tgttttgctt240 gctctgcaca caccctgcat acttgcctcc accctggccc ttcctctacc ttgccagttt300 cctccttgtg tgtgaactca gtcaggctta caacagacag agtatgaaca tgcgattcct360 ccagctactt ctagatatat ggctgaaagc ttgcctaacc tggtgcaggc agcattcagg420 cacatatata gacacacatg catttataca tagatatata ggtacacatg tgtagacaca480 tacatgaatg tgtattcatg gacacacaga caaaggtaca catatataca catgagttca540 tgcgcacaca catgcatgga cacttacaaa cgccttcaga gacaaatagg catagacaca600 caaccactca cagaaacaga taccaatatg catggtcctg tgtacacaga aacagactat660 aggcaaatat acacaaataa actatataga tacaaagata tgcatataca cacatgtaca720 gaaacatctt cacatgtgta cactaacatg tgaacaggta tagcacacag atacacctgg780 actctgacca gggctgtaat ctccaaggct cacggctcag agagcctaca ctaggctggg840 tcactgatac tcctcaggag cccactctat gattgggaga gataacccca ggtacaaagt900 atgcctatct gtctcaacac catggggcag aagatactcc actaaccacc catgacagaa960 agttagcctt ggctgtgtct ccattaatag aacacctcag aagaccaatg tgaaattgcc1020 taacccactc acacccaccc tgatctccag ttcaaaatgc agaaaacata atgcagttgt1080 ccaaaagatg ccccaaccac acacacacac acacacacac acacacacac acacacacac1140 acacacacac acacacacca tcaaggagcc tctgtaagga gtcaccaccc aataacactg1200 cctctttggg ctcatatcct ggacattctt catattcata tccatttggg gcctaggctt1260 tagatatccc caagggctca tctttacagg gatcagagat cccaataaat gccctggtcc1320 cacagcctcc ctcaggtatc tgtctgttta tctcttggta ccaagaccca acattgctgg1380 caggggtagg acaagcaacg cacgggaact ctgatcaaag aaagtcatga gatgcctgag1440 tccttcagga agtaaggagg gacaacctct ggtatccctg ttcttattgc taaagcccaa1500 gagacaggga gacctgctct aaattctcag tctaaacagc accgatggca ccacctgctc1560 agggaaagtc cagagcacac caatatcatt ttgccacagt tcctgagtct gcctttaccc1620 aggtccatac attgcatctg tcttgcttgc tctgctgccc cagggctcct ggaacaaagg1680 ctccaaatta gtgtgtccta cagcttggcc tgttctgtgc ctccgtctag cttgagctat1740 taggggacca gtcaatactc gctaagattc tccagaacca tcagggcacc ccaaccctta1800 tgcaaatgct cagtcacccc aagacttggc ttgaccctcc ctctctgtgt cccttcatag 1860

111

	<210>	10
	<211>	87
	<212>	DNA
	<213>	Homo sapiens
5	<400>	10
	agcctgtgga ccaccctgtc	cacgtttgtg	gccctcttca	tcctcaccct	cctctacagc	60
	ggcattgtca ctttcatcaa	ggtgaag				87
	<210>	11
	<211>	78
10	<212>	DNA
	<213>.	Homo sapiens
	<400>	11
	gggctgtgga cgaccatcac	catcttcatc	acactcttcc	tgttaagcgt	gtgctacagt	60
	gccaccgtca ccttcttc					78
- 15	<210>	12
	<211>	78
	<212>	DNA
	<213>	Homo sapiens
	<400>	12
20	gggctgtgga ccaccatcac	catcttcatc	acactcttcc	tgctaagcgt	gtgctacagt	60
	gccaccatca ccttcttc					78
	<210>	13
	<211>	81
	<212>	DNA
25	<213>	Homo sapiens
	<400>	13
	aacctgtggg ccaccgcctc	caccttcatc	gtcctcttcc	tcctgagcct	cttctacagt	60

accaccgtca ccttgttcaa g

	<210>	14
30	<211>	63
	<212>	DNA
	<213>	Mus musculus

112 <400> 14

	actgtgacct aca	tcctcaccct cttcctactg	agcttgttct	acagcacagc	actcactgtt	60 63
<210>	15
5	<211>	84
	<212>	DNA
	<213>	Mus	musculus
	<400>	15
	gggctctgga	cgaccatcac catcttcatc	agcctcttcc	tgctcagtgt	gtgctacagc	60
10	gctgctgtca	cactcttcaa ggta				84
	<210>	16
	<211>	78
	<212>	DNA
	<213>	Mus	musculus
15	<400>	16
	gggctctgga	cgaccatcac catcttcatc	agcctcttcc	tgctcagcgt	gtgctacagc	60
	gcctctgtca	cactcttc				78
	<210>	17
	<211>	78
20	<212>	DNA
	<213>	Mus	musculus
	<400>	17
	gggctctgga	cgaccatcac catcttcatc	agcctcttcc	tgctcagcgt	gtgctacagc	60
	gcctctgtca	ccctcttc				78
25	<210>	18
	<211>	84
	<212>	DNA
	<213>	Mus	musculus
	<400>	18
30	aacctgtgga	ccactgcctc caccttcatc	gtcctcttcc	tcctgagcct	cttctacagc	60
	accaccgtca	ccctgttcaa ggtg				84

<210> 19

113 <211> 30 <212> PRT <213> Homo sapiens <400> 19

Gly Glu

Ala

Arg

Pro

Gly

Leu

Pro

Leu

Pro

Leu

1

5

10

15

His Gin

Leu

Phe

Leu

Ser

His

Leu

Arg

Leu

20

25

30

<210>

20

<211>

26

<212>

PRT

<213>

Homo

sapiens

<400>

20

Asp Ala

Ala

His

Pro

Vai

Ala

Ser

Leu

Pro

Leu

Ala

Gly

Thr

1

5

10

15

Leu Leu

Leu

Gly

Ala

Ser

Ala

Pro

25 <210> 21 <211> 24 <212> PRT <213> Homo sapiens <400> 21

Ser Ser Ala Gly Ser Leu Ala Ala Gly Pro Leu Leu Vai Ala Leu Ala

1	5	10	15
Leu Tyr	Pro Leu Ser Vai Leu Phe
	20
<210>	22
<211>	30
<212>	PRT
<213>	Homo sapiens
<400>	22

Asp Ala Ala His Pro Gly Arg Ser Vai Vai Pro Ala Leu Leu Pro Leu

114

1	5	10	15
Leu j	Ma Gly Thr Leu	Leu Leu Leu Glu Thr Ala Thr	Ala Pro
	20	25	30
<210:	> 23
<211:	> 26
<212:	> PRT
<213:	> Homo sapiens
<400:	> 23
Ser .	Ma Ser Ser Asn	lie Ser Gly Gly lie Phe Leu	Phe Phe Vai Ala
1	5	10	15
Asn .	Ma lie lie His	Leu Phe Cys Phe Ser
	20	25
<210:	> 24
<211:	> 27
<212	> PRT
<213	> Homo sapiens
<400	> 24
Ala	Ser Gly Thr Ser	Pro Gly Leu Ser Ala Gly Ala	Thr Vai Gly lie
1	5	10	15
Met	lie Gly Vai Leu	Vai Gly Vai Ala Leu lie
	20	25
<210	> 25
<211	> 29
<212	> PRT
<213	> Homo sapiens

<400> 25

Ser

Gly Thr

Thr

Arg

Leu

Ser

Gly

His

Thr

Cys

Phe Thr

Leu Thr

1

5

10

15

Gly

Leu Leu

Gly

Thr

Leu

Vai

Thr

Met

Gly

Leu

Thr

25 <210> 26 <211> 27

115

<212>	PRT
<213>	Homo sapiens
<400>	26

Asn Gly Gly

Thr

Ser Leu Ser Glu Lys

Thr Vai Leu Leu Leu Vai Thr

1

5

10

15

Pro

Phe Leu

Ala

Trp

Ser

Leu

His

Pro

20

25

<210

> 27

<211

> 32

<212

> PRT

<213

> Homo

sapiens

<400

> 27

Cys

Glu Gly

He

Ser

Leu

Ala

Gin

Asn

Thr

Ser

Trp

Leu

1

5

10

15

Leu

Leu Leu

Ser

Leu

Ser

Leu

Gin

Ala

Thr

Asp

Phe

Met

Ser

Leu

25 30 <210> 28 <211> 22 <212> PRT <213> Homo sapiens <400> 28

Ser Gly Ala Pro Thr Leu Ser Pro Ser Leu Leu Gly Leu Leu Leu Pro

10 15

Ala Phe Gly lie Leu Vai <210> 29 <211> 39 <212> PRT <213> Homo sapiens <400> 29

Asp Leu Cys Asn Glu Lys Leu His Asn Ala Ala Pro Thr Arg Thr Ala

10 15

116

Leu Ala His Ser Ala Leu Ser Leu Gly Leu Ala Leu Ser Leu Leu Ala

25 30

Vai lie Leu Ala Pro Ser Leu <210> 30 <211> 24 <212> PRT <213> Homo sapiens <400> 30

Ser Gly Ala Gly Pro Trp Ala Ala Trp Pro Phe Leu Leu Ser Leu Ala

10 15

Leu Met Leu Leu Trp Leu Leu Ser <210> 31 <211> 26 <212> PRT <213> Homo sapiens <400> 31

Asn Ala Gly Glu Met Leu His Gly Thr Gly Gly Leu Leu Leu Ser Leu

5 10 15

Ala Leu Met Leu -Gin Leu Trp Leu Leu Gly

25 <210> 32 <211> 49 <212> PRT <213> Homo sapiens <400> 32

Ala

Arg

Gly

Leu

Met

Asn

Gly

Tyr

Arg

Gly

Pro

Ala

Met

Asp

Ser

Glu

1

5

10

15

Glu

Asp

Met

Vai

Thr

Ala

Leu

His

Ser

Leu

Thr

Leu

Gin

Thr

Vai

20

25

30

Vai lie His Ser Leu Ser Ser Vai Leu Pro Gly lie Thr Leu Ala lie

117

As η <210> 33 <211> 30 <212> PRT <213> Homo sapiens <400> 33

Ser Ser Gly

His Ser

Arg

His Arg Tyr

Ala Leu

lie Pro

He

Pro

Leu

1

5

10

15

Ala Vai

lie

Thr Thr

Cys

lie

Vai

Leu

Tyr

Met

Asn

Vai

Leu

20

25

30

<210>

34

<211>

27

<212>

PRT

<213>

Homo

sapiens

<400>

34

Ser Gly Ala

Ser Ser

Leu

His

Arg

His

Phe

Gly

Leu

Ala

Ser

1

5

10

¹⁵

Leu Ala

. Pro

Leu Vai

Leu

Cys

Leu

Ser

Leu

20

25

<210>

35

<211>

26

<212>

PRT

<213>

Homo

sapiens

<400>

35

Ser Thr

Gly

Ser His

Cys

His

Gly

Ser

Phe

Ser

Leu

He

Phe

Leu

Ser

1

5

10

15

Leu Trp Ala Vai lie Phe Vai Leu Tyr Gin

25 <210> 36 <211> 31

118 <212> PRT

<213> Homo sapiens
	<400> 36 Gly Ala Ala	Pro Gin Pro Gly Pro Ala His Leu Ser Leu Thr lie Thr
5	1	5	10	15

Leu Leu Met Thr Ala Arg Leu Trp Gly Gly Thr Leu Leu Trp Thr

25 30 <210> 37 <211> 30

10

<212>

PRT

<213>

Mus musculus

<400>

37

Asn Ala

Ala Vai Pro

Thr

Gly

Ala

Ser

Thr

Trp

Thr

Met

Ala

Gly

Vai

1

5

10

15

Leu Leu

Phe Ser Leu

Ser

Vai

lie

Leu

Gin

Thr

Leu

-

20

25

30

<210>

38

<211>

35

<212>

PRT

20

<213>

Mus musculus

<400>

38

Asn Glu

. Arg Leu Vai

Ser

Ala

Pro

Gly

His

Ala

Leu

Ser

1

5

10

15

Vai Thr

Leu Gly Leu

Ala

Thr

Ser

Leu

Ser

Leu

Thr

Vai

Met

Ala

25

20

25

30

Leu Cys

: Leu

35

<210>

39

<211>

26

30

<212>

PRT

<213>

Mus musculus

<400> 39

119

Ser Ala Ala

Ser

His

Tyr

Gin

Gly

Ser

Phe

Pro

Leu

Vai

He

Leu

Ser

1

5

10

15

Leu Ser Ala

Vai

He

Phe

Vai

Leu

Tyr

Gin

20

25

5

<210> 40

<211> 24

<212> PRT

<213> Mus r

nusculus

<400> 40

10

Ser Ser Gly

Vai

Cys

Trp

Thr

Ala

Thr

Trp

Leu

Vai

Thr

Leu

1

5

10

15

lie lie His

Arg

lie

Leu

Thr

20

<210

> 41

15

<211

> 32

<212

> PRT

<213

> Mus n

nusculus

<400

> 41

Asn

Phe Ser

Ala

Gly

Leu

Gly

Leu

Arg

Ala

Ser

He

Pro

Leu

20

1

5

10

15

Gly

Leu Gly

Leu

Ser

Leu

Ala

Leu

Gin

Leu

Ser

Pro

20

25

30

<210> 42 <2H> 16 <212> PRT <213> Mus musculus <400> 42

Ala Lys Ser Phe Tyr Phe lie Cys

Tyr Leu Cys Leu Tyr Leu Ala Leu <210> 43 <211> 22 <212> PRT

120 <213> Rattus norvegicus <400> 43

Gly Asn Ser

Ala Glu Gly

Ser

Met

Pro

Ala

Phe

Leu

Phe

Leu

1

5

10

15

Leu

Gin Leu

Trp Asp Thr

20

<210

> 44

<211

> 32

<212

> PRT

<213

> Rattus norvegicus

<400

> 44

Cys

Gly Gly

lie Ser Leu

Leu

Vai

Gin

Asn

Thr

Ser

Trp

Leu

1

5

10

15

Leu

Leu Leu

Ser Leu Ser

Phe

Leu

Gin

Ala

Thr

Asp

Phe

He

Ser

Leu

25 30

210>	45
211>	29
212>	PRT
213>	Rattus norvegicus
400>	45

Ser Ala Ala Thr Arg Pro Glu Pro His Tyr Phe Phe Leu Leu Phe Leu

10 15

Phe Thr Leu Vai Leu Ala Ala Ala Arg Pro Arg Trp Arg

25 <210> 46 <211> 24 <212> PRT <213> Rattus norvegicus <400> 46

Ser Ser Gly Vai His Trp lie Ala Ala Trp Leu Vai Vai Thr Leu Ser

10 15 lie lie Pro Ser lie Leu Leu Ala

121

	20
<210>	47
<211>	26
<212>	PRT
<213>	Rattus norvegicus
<400>	47
Ser Ala	l Ala Ser His Tyr Gin Gly Ser	Phe	Pro Leu lie lie Leu Ser
1	5	10	15

Phe Trp Ala Vai lie Leu Vai Leu Tyr Gin

25 <210> 48 <211> 22 <212> PRT <213> Rattus norvegicus <400> 48

Arg Asn Thr Gly Phe Leu Leu Ala Trp Pro Thr Phe Phe Leu Pro Vai

10 15

Phe Leu Ala Trp Leu Phe <210> 49 <211> 30 <212> PRT <213> Rattus norvegicus <400> 49

Ser

Ala Gly Ala Arg Glu

Ser Cys Vai

Ser

Leu Phe Leu Vai Vai

1

5

10

15

Leu

Pro

Ser

Leu

Vai

Gin

Leu

Cys

Leu

Ala

Glu

Pro

20

25

30

<210>	50
<211>	33
<212>	PRT
<213>	Candida albicans

122 <400> 50

Ser Ser Gly Vai Lys Ala Thr Gin

5

Ser He He Thr He Vai Thr Ala

Phe <210> 51 <2H> 32 <212> PRT <213> Yeast sp.

<400> 51

Asn Ala Ala Thr Asn Vai Lys Ala

5

Ser He He Ser Leu Ser He Ala <210> 52 <211> 25 <212> PRT <213> porcine <400> 52

Ala Arg Ala Ala Pro Thr Thr Ser

5

Ala Leu Ala He Leu Gly Trp Ser <210> 53 <211> 26 <212> PRT <213> porcine <400> 53

Ser Ala Ala Pro Ser Leu His Leu

5

Gin Met Ser Met Vai Lys Leu Vai

15

Phe Vai Gly Gly Met Ser Vai Vai

30

Asn Leu Ala Gin Vai Vai Phe Thr

15

Ala Gly Vai Gly Phe Ala Leu Vai

30

Leu Gly Ser Leu Met Thr Vai Ser

15

Vai

Pro Pro Gly Ser Leu Leu Ala Ser

15

123

	Leu Vai	Pro	Leu	Leu	Leu Leu
			20
	<210>	54
	<211>	18
5	<212>	PRT
	<213>	Trypanosoma brucei
	<400>	54
	Ser Asn	. Ser	Phe	Vai	He His
	1			5
10	Leu Phe
	<210>	55
	<211>	24
	<212>	PRT
- 15	<213>	Trypanosoma brucei
	<400>	55
	Asp Ser	Ser	He	Leu	Vai Thr
	1			5
	Ala Ala	l Phe	Vai	Ala	Leu Leu
20	<210>	56	20
	<211>	24
	<212>	PRT
	<213>	Trypanosoma brucei
25	<400>	56
	Asn Gli	' Ser	Phe	Leu	Thr Ser
	1			5
	Ala Ala	i Phe	Vai	Ala	Leu Leu
			20
30	<210>	57
	<211>	18
	<212>	PRT

Ser Leu Pro

Lys Ala Pro Leu Phe Leu Ala Phe Leu

15

Lys Lys Phe Ala Leu Thr Vai Vai Ser

15

Phe

Lys Gin Phe Ala Phe Ser Vai Vai Ser

15

Phe

124 <213> Trypanosoma brucei <400> 57

Ser Asn Ser Phe Vai lie Ser Lys Thr Pro Leu Trp Leu Ala Vai Leu

10 ¹⁵

Leu Phe <210> 58 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 58

Asp Gly Ser Phe Leu Vai Asn Lys Lys Phe Ala Leu Met Vai Tyr Asp

10 15

Phe Vai Ser Leu Leu Ala Phe <210> 59 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 59

Asn Gly Ser Phe Leu Thr Ser Lys Gin Phe Ala Leu Met Vai Ser Ala

10 15

Ala Phe Vai Thr Leu Leu Phe

20
<210>	60
<211>	23
<212>	PRT
<213>	Trypanosoma brucei
<400>	60

Gly Ala Ala Thr Leu Lys Ser Vai Ala Leu Pro Phe Ala lie Ala Ala

10 15

Ala Ala Leu Vai Ala Ala Phe

125 <210> 61 <211> 18 <212> PRT <213> Trypanosoma brucei <400> 61

Ser .	Asn Ser Phe Vai	He Asn Lys	Ala	Pro	Leu	Leu	Leu	Gly	Phe	Leu
1	.5			10					15
Leu	Phe
<210	> 62
<211	> 20
<212	> PRT
<213	> Trypanosoma	Congolense
<400	> 62 .
Ser	Gly Ser Ser His	Gly Thr Lys	Ala	He	Arg	Ser	He	Leu	His	Vai
1	5			10					15

Ala Leu Leu Met

	20
<210>	63
<211>	28
<212>	PRT
<213>	Gallus sp
<400>	63

Ala Gly Asn Lys Leu lie Gin Gin His Leu Leu Vai He Thr Phe Vai

1015

Pro Phe He He Leu Gly Gin Leu Gin Gly Leu Gly

2025 <210>64 <211> 26 <212> PRT <213> Gallus sp.

126 <400> 64

Ala Thr Leu Gly Ser Pro Ser Thr Ser Ser Ser Phe Vai Ser Leu Leu

10 15

Leu Ser Ala Vai Thr Leu Leu Leu Leu Cys

25

210>	65
211>	25
212>	PRT
213>	Torpedo marmorata
:400>	65

Ser Ser

Ser

Gly

Thr

Ser

Lys

Gly

He

Phe

Tyr

Vai

Leu

1

5

10

15

Phe Ser

lie

Leu

Tyr

Leu

He

Phe

Tyr

20

25

<210>

66

<211>

24

<212>

PRT

<213>

Hamster i

sp.

<400>

66

Ser Ser

Ala

Vai

Leu

Phe

Ser

Pro

Vai

He

Leu

He

Ser

1

5

10

15

Phe Leu

lie

Phe

Leu

Met

Vai

Gly

20

<210>

67

<211>

26

<212>

PRT

<213>

Bos 1

taurus

<400>

67

Ser Ala

. Gly

Ser

His

Cys

Gly

Ser

Phe

Ser

Leu

He

Phe

Leu

Ser

1

5

10

15

Vai Leu

i Ala

Vai

He

Leu

Tyr

Gin

127 <210> 68 <211> 23 <212> PRT <213> slime mold <400> 68

Ser Ser Ala Thr Thr He Ala Phe Asn Ala Phe Vai Vai Phe Ala He 15 10 15

Vai Leu Ser Vai Leu Leu Phe <210> 69 <211> 22 <212> PRT <213> slime mold <400> 69 ’

Gly Ser Ala Ser Thr Vai Vai Ala Ser Leu Ser Leu He He Phe Ser

10 15

Met He Leu Ser Leu Cys <210> 70 <211> 25 <212> DNA <213> Homo sapiens <400> 70 acctggccat gacccccctg atccc <210> 71 <211> 29 <212> DNA <213> Homo sapiens <400> 71 agctgcaact ggaggagagc tgtgcggag <210> 72 <211> 33

128

<212>	DNA
<213>	Homo sapiens
<400>	72
agctgcaact	ggaggagagc	tgtgcggagg	cgc	33
<210>	73
<211>	25
<212>	DNA
<213>	Homo sapiens
<400>	73
agggggaggt	gagcgccgac	gagga		25
<210>	74
<211>	31
<212>	DNA
<213>	Mus	musculus
<400>	74
aacgtcaaga	gccactttcc	tatgtgctac	t	31
<210>	75
<211>	48
<212>	DNA
<213>	MUS	musculus
<400>	75
ggctgcaact	ggacgagacc	tgtgctgagg	cccaggacgg ggagctgg	48
<210>	76
<211>	27
<212>	DNA
<213>	Mus	musculus
<400>	76
ggctagacct	ggatgatatc	tgtgctg		27

<210> 77 <211> 23 <212> DNA <213> Mus musculus

129 <400> 77 agctggaact gaatgagacc tgt <210> 78 <211> 33 <212> DNA <213> Mus musculus <400> 78 agggggaggt gaatgctgag gaggaaggct ttg <210> 79 <211> 4 <212> PRT <213> Homo sapiens <400> 79

Gly Phe Thr His <210> 80 <211> 4 <212> PRT <213> Homo sapiens <400> 80

Ala Cys Thr Thr <210> 81 <211> 4 <212> PRT <213> Homo sapiens <400> 81

Cys Ala Pro Ala <210> 82 <211> 4 <212> PRT

130 <213> Homo sapiens <400> 82

Ala Gly Thr Thr

5	<210>	83
	<211>	4
	<212>	PRT
	<213>	Homo sapiens
	<400>	83
10	Thr Sei	• Ser Pro
	1
	<210>	84
	<211>	4
	<212>	PRT
15	<213>	Homo sapiens
	<400>	84
	lie Thi	: Vai Ser
	1
	<210>	85
20	<211>	4
	<212>	PRT
	<213>	Homo sapiens
	<400>	85
	Ser Gly Thr Thr
25	1
	<210>	86
	<211>	4
	<212>	PRT
	<213>	Homo sapiens
30	<400>	86

Glu Gin Leu Glu

131

	<210>	87
	<211>	4
	<212>	PRT
	<213>	Homo	sapiens
5	<400>	87
	Lys Leu	l Vai	Lys
	1
	<210>	88
	<211>	4
10	<212>	PRT
	<213>	Homo	sapiens
	<400>	88
	Gin Vai	. Lys	lie
	1
Í5	<210>	89
	<211>	4
	<212>	PRT
	<213>	Homo	sapiens
	<400>	89
20	Cys Cys	; Gin	Glu
	1
	<210>	90
	<211>	4
	<212>	PRT
25	<213>	Homo	sapiens
	<400>	90

Ala Ala Ala Met <210> 91 <211> 4 <212> PRT <213> Homo sapiens

132 <400> 91

Ala Met His Vai <210> 92

5	<211>	4
	<212>	PRT
	<213>	Homo	sapiens
	<400>	92
	Gly Ser	Arg	Gly
10	1
	<210>	93
	<211>	4
	<212>	PRT
	<213>	Homo	sapiens
15	<400>	93
-	Thr Cys	; lie	Pro
	1
	<210>	94
	<211>	4
20	<212>	PRT
	<213>	Homo	sapiens
	<400>	94
	Tyr Gli	/· Tyr	Ser
	1
25	<210>	95
	<211>	4
	<212>	PRT
	<213>	Homo	sapiens
	<400>	95
30	Arg lie	; Lys	Phe

<210> 96

133 <211> 4 <212> PRT <213> Homo sapiens <400> 96

Gin Tyr Arg Ser <210> 97 <211> 4

<212:	> PRT
<213:	> Mus musculus
<400:	> 97
Glu j	\sp Leu Cys
1
<210:	> 98
<211:	> 4
<212:	> PRT
<213:	> Mus musculus
<400:	> 98

Thr Asp Leu Cys <210> 99 <211> 4 <212> PRT <213> Mus musculus <400> 99

Arg He Lys Phe <210> 100 <211> 4 <212> PRT <213> Mus musculus <400> 100

134

Asp Leu Ala Arg

	<210>	101
	<211>	4
5	<212>	PRT
	<213>	Mus musculus
	<400>	101
	Ser Sei	: Phe Cys
	1
10	<210>	102
	<211>	4
	<212>	PRT
	<213>	Mus musculus
	<400>	102
15	His Leu Met Phe
	1
	<210>	103
	<211>	4
	<212>	PRT
20	<213>	Rattus norvegicus

<400> 103

Ala Pro Ser Ser

1
	<210>	104
25	<211>	4
	<212>	PRT
	<213>	Rattus norvegicus
	<400>	104

Lys Leu Vai Lys i

<210> 105 <211> 4

135 <212> PRT <213> Rattus norvegicus <400> 105

Gly Gin Lys Thr <210> 106 <211> 4 <212> PRT <213> Rattus norvegicus <400>106

Thr Leu Ala Arg <210>107 <211>4 <212> PRT <213> Rattus norvegicus <400> 107

Arg He Lys Phe <210> 108 <211> 4 <212> PRT <213> Rattus norvegicus <400> 108

Asn Gly Thr Pro <210> 109 <211> 4 <212> PRT <213> Rattus norvegicus <400> 109

Asn Cys Leu Tyr

136 i

<210>110 <211> 4 <212> PRT <213> Candida albicans <400>110

Gly Ser Ser Ser <210>111 <211> 4 <212> PRT <213> Yeast sp.

<400>111

Ser Ser Lys Lys

151 <210>112 <211> 4 <212> PRT <213> porcine <400> 112

Glu Pro Leu Ser <210> 113 <211> 4 <212> PRT <213> porcine <400> 113

Asn Tyr Gly Tyr <210> 114 <211> 4 <212> PRT

137 <213> Trypanosoma brucei <400> 114

Asn Thr Thr Gly <210> 115 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 115

Asn Ala Cys Lys <210> 116 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 116

Glu Lys Cys Arg <210> 117 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 117

Thr Thr Gly Ser <210> 118 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 118

Glu Lys Cys Cys

138 <210> 119 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 119

Glu Asp Cys Arg <210> 120 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 120

Glu Pro Glu Pro <210> 121 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 121

Asn Thr Thr Ala <210> 122 <211> 4 <212> PRT <213> Trypanosoma congolense <400> 122

Ser His Leu Pro <210> 123 <211> 4 <212> PRT <213> Gallus sp.

139 <400> 123

Gin Cys Ser Gly .

<210> 124 <211> 4 <212> PRT <213> Gallus sp.

<400> 124

Thr Vai He Pro

1 <210> 125 <211> 4 <212> PRT <213> Torpedo marmorata <400> 125 ' Asp Gly Glu Leu <210> 126 <211> 4 <212> PRT <213> Hamster sp.

<400> 126

Asp Gly Arg Arg <210> 127 <211> 4 <212> PRT <213> Bos taurus <400> 127

Arg He Gin Phe <210> 128

140 <211> 4 <212> PRT <213> slime mold <400> 128

Asn Asn Vai Cys <210>129 <211> 4 <212> PRT <213> slime mold <400>129

Ser Thr Thr Thr <210> ' 130 <211> 2074 <212> DNA <213> Homo sapiens <400>130 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840

141

tcctcagcac	ctgaactcct	ggggggaccg	tcagtcttcc	tcttcccccc	aaaacccaag	900
gacaccctca	tgatctcccg	gacccctgag	gtcacatgcg	tggtggtgga	cgtgagccac	960
gaagaccctg	aggtcaagtt	caactggtac	gtggacggcg	tggaggtgca	taatgccaag	1020
acaaagccgc	gggaggagca	gtacaacagc	acgtaccgtg	tggtcagcgt	cctcaccgtc	1080
ctgcaccagg	actggctgaa	tggcaaggag	tacaagtgca	aggtctccaa	caaagccctc	1140
ccagccccca	tcgagaaaac	catctccaaa	gccaaaggtg	ggacccgtgg	ggtgcgaggg	1200
ccacatggac	agaggccggc	tcggcccacc	ctctgccctg	agagtgaccg	ctgtaccaac	1260
ctctgtccct	acagggcagc	cccgagaacc	acaggtgtac	accctgcccc	catcccggga	1320
tgagctgacc	aagaaccagg	tcagcctgac	ctgcctggtc	aaaggcttct	atcccagcga	1380
catcgccgtg	gagtgggaga	gcaatgggca	gccggagaac	aactacaaga	ccacgcctcc	1440
cgtgctggac	tccgacggct	ccttcttcct	ctacagcaag	ctcaccgtgg	acaagagcag	1500
gtggcagcag	gggaacgtct	tctcatgctc	cgtgatgcat	gaggctctgc	acaaccacta	1560
cacgcagaag	agcctctccc	tgtctccggg	taaatgagtg	cgacggccgg	caagcccccg	1620
ctccccgggc	tctcgcggtc	gcacgaggat	gcttggcacg	taccccctgt	acatacttcc	1680
cgggcgccca	gcatggaaat	aaagcaccca	gcgctgccct	gggcccctgc	gagactgtga	1740
tggttctttc	cacgggtcag	gccgagtctg	aggcctgagt	ggcatgaggg	aggcagagcg	1800
ggtcccactg	tccccacact	ggcccaggct	gtgcaggtgt	gcctgggccg	cctagggtgg	1860
ggctcagcca	ggggctgccc	tcggcagggt	gggggatttg	ccagcgtggc	cctccctcca	1920
gcagcacctg	ccctgggctg	ggccacggga	agccctagga	gcccctgggg	acagacacac	1980
agcccctgcc	tctgtaggag	actgtcctgt	tctgtgagcg	ccctgtcctc	cgacctccat	2040
gcccactcgg	gggcatgcga	cagattgagg	atcc			2074
<210> 131
<211> 330
<212> PRT
<213> Artificial

<220>

<223> Amino acid sequence of the gamma-chain constant region encoded by plasmid plgG-A <400> 131

Ala Ser Thr Lys Gly Pro Ser Vai Phe Pro Leu Ala Pro Ser Ser Lys

10 15

Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Vai Lys Asp Tyr

142

25 30

Phe

Pro

Glu

Pro

Vai

Thr

Vai

Ser

Trp

Asn

Ser

Gly

Ala

Leu

Thr

Ser

35

40

45

Gly

Vai

His

Thr

Phe

Pro

Ala

Vai

Leu

Gin

Ser

Gly

Leu

Tyr

Ser

5

50

55

60

Leu

Ser

Vai

Thr

Vai

Pro

Ser

Leu

Gly

Thr

Gin

Thr

65

70

75

80

Tyr

lie

Cys

Asn

Vai

Asn

His

Lys

Pro

Ser

Asn

Thr

Lys

Vai

Asp

Lys

85

90

95

10

Lys

Vai

Glu

Pro

Lys

Ser

Cys

Asp

Lys

Thr

His

Thr

Cys

Pro

Cys

100

105

110

Pro

Ala

Pro

Glu

Leu

Gly

Pro

Ser

Vai

Phe

Leu

Phe

Pro

115

120

125

Lys

Pro

Lys

Asp

Thr

Leu

Met

He

Ser

Arg

Thr

Pro

Glu

Vai

Thr

Cys

15

130

135

140

Vai

Asp

Vai

Ser

His

Glu

Asp

Pro

Glu

Vai

Lys

Phe

Asn

Trp

145

150

155

160

Tyr

Vai

Asp

Gly

Vai

Glu

Vai

His

Asn

Ala

Lys

Thr

Lys

Pro

Arg

Glu

165

170

175

20

Glu

Gin

Tyr

Asn

Ser

Thr

Tyr

Arg

Vai

Ser

Vai

Leu

Thr

Vai

Leu

180

185

190

His

Gin

Asp

Trp

Leu

Asn Gly

Lys

Glu

Tyr

Lys

Cys

Lys

Vai

Ser

Asn

195

200

205

Lys

Ala

Leu

Pro

Ala

Pro

He

Glu

Lys

Thr

He

Ser

Lys

Ala

Lys

Gly

25

210

215

220

Gin

Pro

Arg

Glu

Pro

Gin

Vai

Tyr

Thr

Leu

Pro

Ser

Arg

Asp

Glu

225

230

235

240

Leu

Thr

Lys

Asn

Gin

Vai

Ser

Leu

Thr

Cys

Leu

Vai

Lys

Gly

Phe

Tyr

245

250

255

30

Pro

Ser

Asp

He

Ala

Vai

Glu

Trp

Glu

Ser

Asn

Gly

Gin

Pro

Glu

Asn

260

265

270

Asn

Tyr

Lys

Thr

Pro

Vai

Leu

Asp

Ser

Asp

Gly

Ser

Phe

143

275

280

285

Leu

Tyr

Ser

Lys

Leu

Thr

Vai

Asp

Lys

Ser

Arg

Trp

Gin

Gly Asn

290

295

300

Vai

Phe

Ser

Cys

Ser

Vai

Met

HÍS

Glu

Ala

Leu

His

Asn

His

Tyr Thr

5

305

310

315

320

Gin

Lys

Ser

Leu

Ser

Leu

Ser

Pro

Gly

Lys

325	330
	<210>	132
	<211>	40
10	<212>	DNA
	<213>	Artificial
	<220>
	<223>	TM-fwl
	<400>	132
15	ggccgagtct gaggcctgag	tggcatgagg	gaggcagagt		40
	<210>	133
	<211>	48
	<212>	DNA
	<213>	Artificial
20	<220>
	<223>	TM-rvl
	<400>	133
	aactggatcc atgtagaaaa	gaggagaagc	cccgggggtc	catgtagt	48
	<210>	¹³⁴
25	<211>	47
	<212>	DNA
	<213>	Artificial
	<220>
	<223>	Ml-rv
30	<400>	134
	gatccacttc accttgaaga	aggtgacggt	ggcactgtag	cacacgc	47

<210> 135

144 <211> 49 <212> DNA <213> Artificial <220>

<223> M2-fw <400> 135 caccttcttc aaggtgaagt ggatcttctc <210> 136 <211> 33 <212> DNA <213> Artificial <220>

<223> TM-fw2 <400> 136 ctccagcagc agctgccctg ggctgggcca <210> 137 <211> 50 <212> DNA <213> Artificial <220>

<223> TM-rv2 <400> 137 cagggatccc ccgaggtgca gctggaccag <210> 138 <211> 68 <212> DNA <213> Artificial <220>

<223> mutSphl-l <400> 138 ctaccccaga cctccgctgc ttggtgcctg ctcggtggtg gacctgaag 49 cga 33 cctcctcctg accgtgtttt 50 cagggcactg ggggccaggt gtcccctcag 60 caggacgt

145

<210>	139
<211>	62
<212>	DNA
<213>	Artificial
<220>
<223>	mutSphI-2
<400>	139

cctgctgagg ggacacctgg cccccagtgc cctgcaggca ccaagcagcg gaggtctggg gt

210>	140
211>	6949
212>	DNA
213>	Homo sapiens
400>	140

cctccaccaa	gggcccatcg	gtcttccccc	tggcaccctc	ctccaagagc	acctctgggg	60
gcacagcggc	cctgggctgc	ctggtcaagg	actacttccc	cgaaccggtg	acggtgtcgt	120
ggaactcagg	cgccctgacc	agcggcgtgc	acaccttccc	ggctgtccta	cagtcctcag	180
gactctactc	cctcagcagc	gtggtgaccg	tgccctccag	cagcttgggc	acccagacct	240
acatctgcaa	cgtgaatcac	aagcccagca	acaccaaggt	ggacaagaaa	gttggtgaga	300
ggccagcaca	gggagggagg	gtgtctgctg	gaagccaggc	tcagcgctcc	tgcctggacg	360
catcccggct	atgcagcccc	agtccagggc	agcaaggcag	gccccgtctg	cctcttcacc	420
cggaggcctc	-tgcccgcccc	actcatgctc	agggagaggg	tcttctggct	ttttccccgg	480
ctctgggcag	gcacaggcta	ggtgccccta	acccaggccc	tgcacacaaa	ggggcaggtg	540
ctgggctcag	acctgccaag	agccatatcc	gggaggaccc	tgcccctgac	ctaagcccac	600
cccaaaggcc	aaactctcca	ctccctcagc	tcggacacct	tctctcctcc	cagattccag	660
taactcccaa	tcttctctct	gcagagccca	aatcttgtga	caaaactcac	acatgcccac	720
cgtgcccagg	taagccagcc	caggcctcgc	cctccagctc	aaggcgggac	aggtgcccta	780
gagtagcctg	catccaggga	caggccccag	ccgggtgctg	acacgtccac	ctccatctct	840
tcctcagcac	ctgaactcct	ggggggaccg	tcagtcttcc	tcttcccccc	aaaacccaag	900
gacaccctca	tgatctcccg	gacccctgag	gtcacatgcg	tggtggtgga	cgtgagccac	960
gaagaccctg	aggtcaagtt	caactggtac	gtggacggcg	tggaggtgca	taatgccaag	1020
acaaagccgc	gggaggagca	gtacaacagc	acgtaccgtg	tggtcagcgt	cctcaccgtc	1080

146

ctgcaccagg	actggctgaa	tggcaaggag	tacaagtgca	aggtctccaa	caaagccctc	1140
ccagccccca	tcgagaaaac	catctccaaa	gccaaaggtg	ggacccgtgg	ggtgcgaggg	1200
ccacatggac	agaggccggc	tcggcccacc	ctctgccctg	agagtgaccg	ctgtaccaac	1260
ctctgtccct	acagggcagc	cccgagaacc	acaggtgtac	accctgcccc	catcccggga	1320
tgagctgacc	aagaaccagg	tcagcctgac	ctgcctggtc	aaaggcttct	atcccagcga	1380
catcgccgtg	gagtgggaga	gcaatgggca	gccggagaac	aactacaaga	ccacgcctcc	1440
cgtgctggac	tccgacggct	ccttcttcct	ctacagcaag	ctcaccgtgg	acaagagcag	1500
gtggcagcag	gggaacgtct	tctcatgctc	cgtgatgcat	gaggctctgc	acaaccacta	1560
cacgcagaag	agcctctccc	tgtctccggg	taaatgagtg	cgacggccgg	caagcccccg	1620
ctccccgggc	tctcgcggtc	gcacgaggat	gcttggcacg	taccccctgt	acatacttcc	1680
cgggcgccca	gcatggaaat	aaagcaccca	gcgctgccct	gggcccctgc	gagactgtga	1740
tggttctttc	cacgggtcag	gccgagtctg	aggcctgagt	ggcatgaggg	aggcagagcg	1800
ggtcccactg	tccccacact	ggcccaggct	gtgcaggtgt	gcctgggccg	cctagggtgg	1860
ggctcagcca	ggggctgccc	tcggcagggt	gggggatttg	ccagcgtggc	cctccctcca	1920
gcagcacctg	ccctgggctg	ggccacggga	agccctagga	gcccctgggg	acagacacac	1980
agcccctgcc	tctgtaggag	actgtcctgt	tctgtgagcg	ccctgtcctc	cgacctccat	2040
gcccactcgg	gggcatgcct	agtccatgcg	cgtagggaca	ggccctccct	cacccatcta	2100
cccccacggc	actaacccct	ggcagccctg	cccagcctcg	cacccgcatg	gggacacaac	2160
cgactccggg	gacatgcact	ctcgggccct	gtggagggac	tggtgcagat	gcccacacac	2220
acactcagcc	cagacccgtt	caacaaaccc	cgcactgagg	ttggccggcc	acacggccac	2280
cacacacaca	cgtgcacgcc	tcacacacgg	agcctcaccc	gggcgaaccg	cacagcaccc	2340
agaccagagc	aaggtcctcg	cacacgtgaa	cactcctcgg	acacaggccc	ccacgagccc	2400
cacgcggcac	ctcaaggccc	acgagccgct	cggcagcttc	tccacatgct	gacctgctca	2460
gacaaaccca	gccctcctct	cacaaggtgc	ccctgcagcc	gccacacaca	cacaggcccc	2520
cacacgcagg	ggaacacacg	ccacgtcgcg	tccctggcac	tggcccactt	cccaatacag	2580
cccttccctg	cagctggggt	cacatgaggt	gtgggcttca	ccatcctcct	gccctctggg	2640
cctcagggag	ggacacggga	gacggggagc	gggtcctgct	gagggccagg	tcgctatcta	2700
gggccgggtg	tctggctgag	tcccggggcc	aaagctggtg	cccagggcgg	gcagctgtgg	2760
ggagctgacc	tcaggacatt	gttggcccat	cccggccggg	ccctacatcc	tgggccccgc	2820
cacagaggga	atcaccccca	gaggcccaag	cccaggggga	cacagcactg	accaccccct	2880
tcctgtccag	agctgcaact	ggaggagagc	tgtgcggagg	cgcaggacgg	ggagctggac	2940

gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 3000

147

gccaccgtca	ccttcttcaa	ggtcggccgc	acgttgtccc	cagctgtcct	tgacattgtc	3060
ccccatgctg	tcacaaactg	tctctgacac	tgtcccacag	gctgtcccca	cctgtccctg	3120
acgctgtccc	ccatgctctc	acaaactgtc	cctgacattg	tccccaatgc	tgcccccacc	3180
tgtccaacag	tgtcccccag	gctctcccca	catgtccccg	acactgtccc	ccatgctgtc	3240
cccatctgtc	cccaacactg	tcccccaccc	tgtccccctt	tgtccccaac	actgtccccc	3300
acagtttcca	cctgtccctg	acactgtccc	ccatgctttc	cccacctgtc	cctgacacca	3360
tcccccactc	tgtcccctat	agttcctggc	cctgtccccc	acgctgtccc	ctacagtacc	3420
tggcactgtc	ccccatgctg	tcccctcctg	tatgaaaccc	tgtcccacat	gctgtcccca	3480
cctgtccgtg	acaatatccc	ccacactgtc	cccacctgtc	cccgacactc	tcctccacgt	3540
tgttcttacc	taaacccgac	actttcctcc	atgctgtccc	cacccatctc	cgacactgta	3600
ccccacgttg	tccccacctg	tcctcaacac	tgtcccccat	gctgtcccca	cctgtcccca	3660
acactctcct	ccatgctgtc	cccacctgtc	cctgatattg	tcccccatgc	agtctccacc	3720
tgtccccaat	gctgtccccc	aggctgtacc	taccagtaca	acactgtccc	ccatgctgtc	3780
cccacctgtc	cctgacactg	tcccccacgc	tgtcccctcc	tgtccccgac	actgtccccc	3840
acactgtccc	cacctgtccc	caacactatc	ctccatgctg	tcccctcctg	tccccacctg	3900
tcccctacac	tgtcccccat	gctgtcccca	ccagtcccca	aaactttcct	ccacactgtc	3960
cccacctgtc	cccaacactg	tcccccacgc	tatcccccct	gtccccgaca	atgtccccac	4020
tgtttcctcc	tgttccctcc	tatccctgac	actgtccgcc	atgctgtccc	cacctgtccc	4080
tgacactgtc	tcccactctg	tcccctataa	tccctgacac	tgtcccccac	gccgtcccct	4140
cccgtatgca	ccactgtccc	ccaagctgtc	cccacctgtc	ctcaacacag	tcccccatgc	4200
tgtccccacc	tgtccccaac	actctcctcc	atgtccccac	ctgtccctga	tattgtcccc	4260
catgcagtcc	ccacctgtcc	ccgatgctgt	cccccgggct	gtacctacca	gtccaacact	4320
gtcccccaca	'ctctccccac	ctgtccctga	tactgtcccc	catgctgtcc	ccacctgtcc	4380
cggacactgt	tctccacgat	ctcccctcct	gtccctgaca	ctgtccccca	cactgtcccc	4440
acctgtcccc	aacactatcc	tccatcctgt	cccaacctgt	ctcctacact	gtcccccatg	4500
ctgtccccac	cagtccccaa	cactgtcctc	catgctgtcc	cccatgtccc	caacactgtc	4560
ccccatgcta	cctcccctgc	ccctgacaat	gtccccactg	tttcctgtcc	cctcctatcc	4620
ctgacactgt	cccccatgct	gtccccacct	gtcccccaca	tggtctccac	cggtccctga	4680
cactgtctcc	cactctgtcc	cctataatcc	ctgacactgt	cccccacacc	gtcccctcct	4740
gtatgcacca	cggtccccca	tgctgtcccc	acctgtccct	gatgctgtcc	tccacacagt	4800
ccccacctct	ccctgacact	gtccccatct	ctccccaaca	ctctcctcca	tgctgtcctc	4860

aactgtcccc aacactcttc cacactctgt ctccacctgt ccctgacact gtcccccaca 4920

148

	ctgtcctcac	ctgtgtctga	cactgtcccc	cacgctgtcc	ccacctgtcc	ctgacgctgt	4980
	cttctgtgct	gtccacatgc	tgttggtgcc	ctggctctgc	tctctatcac	caagcctcag	5040
	agcaggcagt	ggtgaggcca	tggcacctgg	gtggcatgag	gggccggatg	ggcctcaggg	5100
	gcagggctgt	ggcctgcgtg	gactgacagg	tgggtgggcc	ttgggggcag	agaggtggcc	5160
5	tcagtgccct	gaggggtggg	tggggctcgg	gggcagggct	gtggcctcgc	tcacccctgt	5220
	gctgtgcctt	gcctacaggt	gaagtggatc	ttctcctcgg	tggtggacct	gaagcagacc	5280
	atcatccccg	actacaggaa	catgatcgga	cagggggcct	agggccaccc	tctgcggggt	5340
	gtccagggcc	gcccagaccc	cacacaccag	ccatgggcca	tgctcagcca	ccacccaggc	5400
	cacacctgcc	cccgacctca	ccgccctcaa	ccccatggct	ctctggcctc	gcagttgccc	5460
10	tctgaccctg	acacacctga	cacgcccccc	ttccagaccc	tgtgcatagc	aggtctaccc	5520
	cagacctccg	ctgcttggtg	cctgcagggc	actgggggcc	aggtgtcccc	tcagcaggac	5580
	gtccttgccc	tccggaccac	aaggtgctca	cacaaaagga	ggcagtgacc	ggtatcccag	5640
	gcccccaccc	aggcaggagc	tggccctgga	gccaaccccg	tccacgccag	cctcctgaac	5700
	acaggcgtgg	tttccagatg	gtgagtggga	gcatcagccg	ccaaggtagg	gaagccacag	5760
15	caccatcagg	ccctgttggg	gaggcttccg	agagctgcga	aggctcactc	agacggcctt	5820
-	cctcccagcc	-cgcagccagc	cagcctccat	tccgggcact	cccgtgaact	cctgacatga	5880
	ggaatgacgt	tgttctgatt	tcaagcaaag	aacgctgctc	tctggctcct	gggaacagtc	5940
	tcggtgccag	caccacccct	tggctgcctg	cccacactgc	tggattctcg	ggtggaactc	6000
	gacccgcagg	gacagccagc	cccagagtcc	gcactgggga	gagaaggggc	caggcccagg	6060
20	acactgccac	•ctcccaccca	ctccagtcca	ccgagatcac	tcggagaaga	gtctgggcca	6120
	tgtggccgct	gcaggagccc	cacagtgcaa	gggtgaggat	agcccaagga	agggctgggc	6180
	atctgcccag	acaggcctcc	cacagaaggc	tggtgaccag	gtcccaggcg	ggcaagactc	6240
	agccttggtg	gggcctgagg	acagaggagg	cccaggagca	tcggggagag	aggtggaggg	6300
	acaccgggag	agccaggggc	gtggacacag	ccagaactca	tcacagaggc	tggcgtccag	6360
25	tcccgggt-ca	tgtgcagcag	gaacaagcag	ccactctggg	ggcaccaggt	ggagaggcaa	6420
	gacgacaaag	agggtgcccg	tgttcttgcg	aaagcggggc	tgctggccac	gagtgctgga	6480
	cagaggcccc	cacgctctgc	tgcccccatc	acgccgttcc	gtgactgtca	cgcagaatct	6540
	gcagacagga	agggagactc	gagcgggagt	gcggccagag	cctgcctcgg	ccgtcaggga	6600
	ggactcc-cgg	gctcactcga	aggaggtgcc	accatttcag	ctttggtagc	ttttcttctt	6660
30	cttttaaatt	t.tctaaagct	cattaattgt	ctttgatgtt	tcttttgtga	tgacaataaa	6720
	atatcctttt	taagtcttgt	acttcgtgat	gggagccgcc	ttcctgtgtc	cacgcgcctc	6780
	ctgcccccgg	tgggaagcac	ggtcaggagg	aggctggtcc	agctgcacct	cgggggctcc	6840

149 ctgcactcgc cccccgcctc ctgcagccac acgcattgcc cgagcgaccc tccctggccc ctgtcactac atggaccccc ggggcttctc ctcttttcta catggatcc

6900

6949 <210> 141 <211> 330 <212> PRT <213> Homo sapiens <400> 141

Ala 1

Ser Thr

Lys

Gly 5

Pro

Ser

Vai

Phe

Pro Leu 10

Ala

Pro

Ser

Ser 15

Lys

10

Ser

Thr

Ser

Gly

Thr

Ala

Leu

Gly

Cys

Leu

Vai

Lys

Asp

Tyr

20

25

30

Phe

Pro

Glu

Pro

Vai

Thr

Vai

Ser

Trp

Asn

Ser

Gly

Ala

Leu

Thr

Ser

35

40

45

Gly

Vai

His

Thr

Phe

Pro

Ala

Vai

Leu

Gin

Ser

Gly

Leu

Tyr

Ser

15

50

55

60

-·

Leu

Ser

Vai

Thr

Vai

Pro

Ser

Leu

Gly

Thr

Gin

Thr

65

70

75

80

Tyr

He

Cys

Asn

Vai

Asn

His

Lys

Pro

Ser

Asn

Thr

Lys

Vai

Asp

Lys

85

90

95

20

Lys

Vai

Glu

Pro

Lys

Ser

Cys

Asp

Lys

Thr

His

Thr

Cys

Pro

Cys

100

105

110

Pro

Ala

Pro

Glu

Leu

Gly

Pro

Ser

Vai

Phe

Leu

Phe

Pro

115

120

125

Lys

Pro

Lys

Asp

Thr

Leu

Met

He

Ser

Arg

Thr

Pro

Glu

Vai

Thr

Cys

25

130

135

140

Vai

Asp

Vai

Ser

His

Glu

Asp

Pro

Glu

Vai

Lys

Phe

Asn

Trp

145

150

155

160

Tyr

Vai

Asp

Gly

Vai

Glu

Vai

His

Asn

Ala

Lys

Thr

Lys

Pro

Arg

Glu

165

170

175

30

Glu

Gin

Tyr

Asn

Ser

Thr

Tyr

Arg

Vai

Ser

Vai

Leu

Thr

Vai

Leu

180

185

190

His

Gin

Asp

Trp

Leu

Asn

Gly

Lys

Glu

Tyr

Lys

Cys

Lys

Vai

Ser

Asn

150

195 200 205

Lys

Ala

Leu

Pro

Ala

Pro

He

Glu

Lys

Thr

He

Ser

Lys

Ala

Lys

Gly

210

215

220

Gin

Pro

Arg

Glu

Pro

Gin

Vai

Tyr

Thr

Leu

Pro

Ser

Arg

Asp

Glu

5

225

230

235

240

Leu

Thr

Lys

Asn

Gin

Vai

Ser

Leu

Thr

Cys

Leu

Vai

Lys

Gly

Phe

Tyr

245

250

255

Pro

Ser

Asp

He

Ala

Vai

Glu

Trp

Glu

Ser

Asn

Gly

Gin

Pro

Glu

Asn

260

265

270

10

Asn

Tyr

Lys

Thr

Pro

Vai

Leu

Asp

Ser

Asp

Gly

Ser

Phe

275

280

285

Leu

Tyr

Ser

Lys

Leu

Thr

Vai

Asp

Lys

Ser

Arg

Trp

Gin

Gly

Asn

290

295

300

Vai

Phe

Ser

Cys

Ser

Vai

Met

His

Glu

Ala

Leu

His

Asn

His

Tyr

Thr

-15

305

310

315

320

-

Gin

Lys

Ser

Leu

Ser

Leu

Ser

Pro

Gly

Lys

325

330

<210>

142

<211>

399

20

<212

;> PRT

<213

! > Homo

sapiens

<400>

142

Ala

Ser

Thr

Lys

Gly

Pro

Ser

Vai

Phe

Pro

Leu

Ala

Pro

Ser

Lys

1

5

10

15

25

Ser

Thr

Ser

•Gly

Gly

Thr

Ala

Leu

Gly

Cys

Leu

Vai

Lys

Asp

Tyr

20

25

30

Phe

Pro

Glu

Pro

Vai

Thr

Vai

Ser

Trp

Asn

Ser

Gly

Ala

Leu

Thr

Ser

35

40

45

Gly

Vai

His

Thr

Phe

Pro

Ala

Vai

Leu

Gin

Ser

Gly

Leu

Tyr

Ser

30

50

55

60

Leu

Ser

Vai

Thr

Vai

Pro

Ser

Leu

Gly

Thr

Gin

Thr

65

70

75

80

151

Tyr

He

Cys

Asn Vai Asn His 85

Lys

Pro

Ser 90

Asn Thr

Lys

Vai

Asp 95

Lys

Vai

Glu

Pro

Lys

Ser

Cys

Asp

Lys

Thr

His

Thr

Cys

Pro

Cys

100

105

110

5

Pro

Ala

Pro

Glu

Leu

Gly

Pro

Ser

Vai

Phe

Leu

Phe

Pro

115

120

125

Lys

Pro

Lys

Asp

Thr

Leu

Met

He

Ser

Arg

Thr

Pro

Glu

Vai

Thr

Cys

130

135

140

Vai

Asp

Vai

Ser

His

Glu

Asp

Pro

Glu

Vai

Lys

Phe

Asn

Trp

10

145

150

155

160

Tyr

Vai

Asp

Gly

Vai

Glu

Vai

His

Asn

Ala

Lys

Thr

Lys

Pro

Arg

Glu

165

170

175

Glu

Gin

Tyr

Asn

Ser

Thr

Tyr

Arg

Vai

Ser

Vai

Leu

Thr

Vai

Leu

180

185

190

- 15

His

Gin

Asp

Trp

Leu

Asn

Gly

Lys

Glu

Tyr

Lys

Cys

Lys

Vai

Ser

Asn

195

200

205

Lys

Ala

Leu

Pro

Ala

Pro

He

Glu

Lys

Thr

He

Ser

Lys

Ala

Lys

Gly

210

215

220

Gin

Pro

Arg

Glu

Pro

Gin

Vai

Tyr

Thr

Leu

Pro

Ser

Arg

Asp

Glu

20

225

230

235

240

Leu

Thr

Lys

Asn

Gin

Vai

Ser

Leu

Thr

Cys

Leu

Vai

Lys

Gly

Phe

Tyr

245

250

255

Pro

Ser

Asp

lie

Ala

Vai

Glu

Trp

Glu

Ser

Asn

Gly

Gin

Pro

Glu

Asn

260

265

270

25

Asn

Tyr

Lys

Thr

Pro

Vai

Leu

Asp

Ser

Asp

Gly

Ser

Phe

275

280

285

Leu

Tyr

Ser

Lys

Leu

Thr

Vai

Asp

Lys

Ser

Arg

Trp

Gin

Gly

Asn

290

295

300

Vai

Phe

Ser

Cys

Ser

Vai

Met

His

Glu

Ala

Leu

His

Asn

His

Tyr

Thr

30

305

310

315

320

Gin

Lys

Ser

Leu

Ser

Leu

Ser

Pro

Glu

Leu

Gin

Leu

Glu

Ser

Cys

325 330 335

152

Ala Glu Ala Gin Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr He Thr

340

345

350

He Phe He Thr Leu Phe Leu Leu Ser Vai Cys Tyr Ser Ala Thr Vai

355

360

365

Thr Phe Phe Lys Vai Lys Trp He Phe Ser Ser Vai Vai Asp Leu Lys

370

375

380

Gin Thr He He Pro Asp Tyr Arg Asn Met He Gly Gin Gly Ala

385

390

395 <210> 143 <211> 4608 <212> DNA <213> Homo sapiens <400> 143 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140

153

	ccagccccca	tcgagaaaac	catctccaaa	gccaaaggtg	ggacccgtgg	ggtgcgaggg	1200
	ccacatggac	agaggccggc	tcggcccacc	ctctgccctg	agagtgaccg	ctgtaccaac	1260
	ctctgtccct	acagggcagc	cccgagaacc	acaggtgtac	accctgcccc	catcccggga	1320
	tgagctgacc	aagaaccagg	tcagcctgac	ctgcctggtc	aaaggcttct	atcccagcga	1380
5	catcgccgtg	gagtgggaga	gcaatgggca	gccggagaac	aactacaaga	ccacgcctcc	1440
	cgtgctggac	tccgacggct	ccttcttcct	ctacagcaag	ctcaccgtgg	acaagagcag	1500
	gtggcagcag	gggaacgtct	tctcatgctc	cgtgatgcat	gaggctctgc	acaaccacta	1560
	cacgcagaag	agcctctccc	tgtctccggg	taaatgagtg	cgacggccgg	caagcccccg	1620
	ctccccgggc	tctcgcggtc	gcacgaggat	gcttggcacg	taccccctgt	acatacttcc	1680
10	cgggcgccca	gcatggaaat	aaagcaccca	gcgctgccct	gggcccctgc	gagactgtga	1740
	tggttctttc	cacgggtcag	gccgagtctg	aggcctgagt	ggcatgaggg	aggcagagcg	1800
	ggtcccactg	tccccacact	ggcccaggct	gtgcaggtgt	gcctgggccg	cctagggtgg	1860
	ggctcagcca	ggggctgccc	tcggcagggt	gggggatttg	ccagcgtggc	cctccctcca	1920
	gcagcacctg	ccctgggctg	ggccacggga	agccctagga	gcccctgggg	acagacacac	1980
- 15	agcccctgcc	tctgtaggag	actgtcctgt	tctgtgagcg	ccctgtcctc	cgacctccat	2040
	gcccactcgg	gggcatgcct	agtccatgcg	cgtagggaca	ggccctccct	cacccatcta	2100
	cccccacggc	actaacccct	ggcagccctg	cccagcctcg	cacccacatg	gggacacaac	2160
	cgactcctgg	ggacatgcac	tctcgggccc	tgtggaggga	ctggtccaga	tgcccacaca	2220
	cacactcagc	ccagacccgt	tcaacaaacc	ccgcactgag	gttggccggc	cacacggcca	2280
20	ccacacacac	acgtgcacgc	ctcacacacg	gagcttcacc	cgggcgaacc	gcacagcacc	2340
	cagaccagag	caaggtcctc	gcacacgtga	acactcctcg	gacacaggcc	cccacgagcc	2400
	ccacgcggca	cctcaaggcc	cacgagccgc	tcggcagctt	ctccacttgc	tgaccagctc	2460
	agacaaaccc	agccctcctc	tcacaaagtg	cccctgcagc	cgccacacac	acacaggccc	2520
	ccacacacag	gggaacacac	gccacgtcac	gtccctggca	ctggcccact	tcccaataca	2580
25	gcccttccct	gcagctgagg	tcacatgagg	tgtgggcttc	accatcctcc	tgccctctgg	2640
	gcctcaggga	gggacacggg	agacggggag	tgggtcctgc	tgagggccag	gcctctatct	2700
	agggccgggt	gtctggctga	gtcccggggc	caaagctggt	gcccagggcg	ggcagctgtg	2760
	gggagctgac	ctcaggacac	tgttggccca	tcccggccgg	gccctacatc	ctgggccccg	2820
	ccacagaggg	aatcaccccc	agaggcccaa	gcccaggggg	acacagcact	gaccaccccc	2880
30	ttcctgtcca	gagctgcaac	tggaggagag	ctgtgcggag	gcgcaggacg	gggagctgga	2940
	cgggctgtgg	acgaccatca	ccatcttcat	cacactcttc	ctgctaagcg	tgtgctacag	3000
	tgccaccgtc	accttcttca	aggtgaagtg	gatcttctcc	tcggtggtgg	acctgaagca	3060

154

	gaccatcgtc cccgactaca ggaacatgat aaggcagggg gcctagggcc accctctgcg	3120 3180 3240 3300
gggtgtccag ggccgcccag	accccacaca cgagccgtgg	gccatgctca tggctctctg gcatagcagg	gccaccaccc gcttcgcagt tctaccccag
aggccacacc cgccctctga	tgccccctga gccctgaaac	cctcaccgcc gccccccttc	ctcaacccca cagaccctgt
5	acctccgctg	cttggtgcca	gggcactggg	ggccaggtgt	cccctcagca	ggacgtccct	3360
	gccctctgga	ccaccaggtg	ctcacacaaa	aggaggtaac	cggcatccca	ggcccccact	3420
	caggcaggac	ctcgccctgg	agccaacccc	gtccacgcca	gcctcctgaa	cacaggcatg	3480
	gtttccagat	ggtgagtggg	agcatcagtc	gccaaggtag	ggaagccaca	gcaccatcag	3540
	gccctgttgg	ggaggcttcc	gagagctgcg	aaggctcact	cagacggcct	tcctcccagc	3600
10	ccgcagccag	ccagcctcca	ttccgggcac	tcccgtgaac	tcctgacatg	aggaatgagg	3660
	ttgttctgat	ttcaagcaaa	gaacgctgct	ctctggctcc	tgagaacagt	ctcggtgcca	3720
	gcaccacccc	ttggctgcct	gcccacactg	ctggattctc	gggtggaact	cgacccgcag	3780
	ggacagccag	ccccagagtc	cgcactgggg	agagaagggg	ccaggcccag	gacactgcca	3840
	cctcccaccc	actccagtcc	accgagatca	ctcagagaag	agcctgggcc	atgtggccgc	3900
15	tgcaggagcc	ccacagtgca	agggtgagga	tagcccaagg	aagggctggg	catctgccca	3960
-	gacaggcctc	ccacagaagg	ctggtgacca	ggtcccaggc	gggcaagact	cagccttggt	4020
	ggggcctgag	gacagaggag	gcccaggagc	atcggggaga	gaggtggagg	gacaccggga	4080
	gagccaggag	cgtggacaca	gccagaactc	accacagagg	ctggcgtcca	gtcccgggtc	4140
	acgtgcagca	ggaacaagca	gccactctgg	gggcaccagg	tggagaggca	agacgacaaa	4200
20	gagggtgccc	gtgttcttgc	gaaagcgggg	ctgctggcca	cgagtgctgg	acagaggccc	4260
	ccacgctctg	ctgcccccat	cacgccgttc	cgtgactgtc	acgcagaatc	cacagacagg	4320
	aagggaggct	cgagcgggac	tgcggccagc	gcctgcctcg	gccgtcaggg	aggactcctg	4380
	ggctcactcg	aaggaggtgt	caccatttca	gctttggctt	ttcttcttct	tttaaatttt	4440
	ctaaagctca	ttaattgtct	ttgatgtttc	ttttttgatg	acaataaaat	atccttttta	4500
25	agtcttgtac	ttcgtgatgg	gagccacctt	cctgtgtcca	cgcgcctcct	gcccccggtg	4560
	gaaaacacgg	tcaggaggag	gctggtccag	ctgcacctcg	ggggatcc		4608

<210> 144 <211> 330 <212> PRT <213> Artificial <220>

<223> Amino acid sequence of the short (slgG) isoform of the

155 gamma-chain constant region encoded by plasmid pmlgGdelta-A <400> 144

Ala 1

Ser Thr

Lys

Gly Pro 5

Ser Vai

Phe

Pro Leu 10

Ala

Pro

Ser

Ser 15

Lys

5

Ser

Thr

Ser

Gly

Thr

Ala

Leu

Gly

Cys

Leu

Vai

Lys

Asp

Tyr

20

25

30

Phe

Pro

Glu

Pro

Vai

Thr

Vai

Ser

Trp

Asn

Ser

Gly

Ala

Leu

Thr

Ser

35

40

45

Gly

Vai

His

Thr

Phe

Pro

Ala

Vai

Leu

Gin

Ser

Gly

Leu

Tyr

Ser

10

50

55

60

Leu

Ser

Vai

Thr

Vai

Pro

Ser

Leu

Gly

Thr

Gin

Thr

65

70

75

80

Tyr

He

Cys

Asn

Vai

Asn

His

Lys

Pro

Ser

Asn

Thr

Lys

Vai

Asp

Lys

85

90

95

15

Lys

Vai

Glu

Pro

Lys

Ser

Cys

Asp

Lys

Thr

His

Thr

Cys

Pro

Cys

100

105

110

Pro

Ala

Pro

Glu

Leu

Gly

Pro

Ser

Vai

Phe

Leu

Phe

Pro

115

120

125

Lys

Pro

Lys

Asp

Thr

Leu

Met

He

Ser

Arg

Thr

Pro

Glu

Vai

Thr

Cys

20

130

135

140

Vai

Asp

Vai

Ser

His

Glu

Asp

Pro

Glu

Vai

Lys

Phe

Asn

Trp

145

150

155

160

Tyr

Vai

Asp

Gly

Vai

Glu

Vai

His

Asn

Ala

Lys

Thr

Lys

Pro

Arg

Glu

165

170

175

25

Glu

Gin

Tyr

Asn

Ser

Thr

Tyr

Arg

Vai

Ser

Vai

Leu

Thr

Vai

Leu

180

185

190

His

Gin

Asp

Trp

Leu

Asn

Gly

Lys

Glu

Tyr

Lys

Cys

Lys

Vai

Ser

Asn

195

200

205

Lys

Ala

Leu

Pro

Ala

Pro

He

Glu

Lys

Thr

He

Ser

Lys

Ala

Lys

Gly

30

210

215

220

Gin

Pro

Arg

Glu

Pro

Gin

Vai

Tyr

Thr

Leu

Pro

Ser

Arg

Asp

Glu

225

230

235

240

156

Leu Thr

Lys

Asn Gin Vai 245

Ser

Leu

Thr

Cys 250

Leu

Vai

Lys

Gly

Phe 255

Tyr

Pro

Ser

Asp

lie

Ala

Vai

Glu

Trp

Glu

Ser

Asn

Gly

Gin

Pro

Glu

Asn

260

265

270

Asn

Tyr

Lys

Thr

Pro

Vai

Leu

Asp

Ser

Asp

Gly

Ser

Phe

275

280

285

Leu

Tyr

Ser

Lys

Leu

Thr

Vai

Asp

Lys

Ser

Arg

Trp

Gin

Gly

Asn

290

295

300

Vai

Phe

Ser

Cys

Ser

Vai

Met

His

Glu

Ala

Leu

His

Asn

His

Tyr

Thr

305

310

315

320

Gin

Lys

Ser

Leu

Ser

Leu

Ser

Pro

Gly

Lys

325 330 <210> 145 <211> 399 <212> PRT <213> Artificial <220>

<223> Amino acid sequence of the long (mlgG) isoform of the gamma-chain constant region encoded by plasmid pmlgGdelta-A <400> 145

Ala

Ser

Thr

Lys

Gly

Pro

Ser

Vai

Phe

Pro

Leu

Ala

Pro

Ser

Lys

1

5

10

15

Ser

Thr

Ser

Gly

Thr

Ala

Leu

Gly

Cys

Leu

Vai

Lys

Asp

Tyr

20

25

30

Phe

Pro

Glu

Pro

Vai

Thr

Vai

Ser

Trp

Asn

Ser

Gly

Ala

Leu

Thr

Ser

35

40

45

Gly

Vai

His

Thr

Phe

Pro

Ala

Vai

Leu

Gin

Ser

Gly

Leu

Tyr

Ser

50

55

60

Leu

Ser

Vai

Thr

Vai

Pro

Ser

Leu

Gly

Thr

Gin

Thr

65

70

75

80

Tyr

He

Cys

Asn

Vai

Asn

His

Lys

Pro

Ser

Asn

Thr

Lys

Vai

Asp

Lys

157

Lys

Vai Glu

Pro 100

Lys

Ser

Cys

Asp

Lys 105

Thr His

Thr

Cys

Pro 110

Pro

Cys

Pro

Ala

Pro

Glu

Leu

Gly

Pro

Ser

Vai

Phe

Leu

Phe

Pro

115

120

125

5

Lys

Pro

Lys

Asp

Thr

Leu

Met

He

Ser

Arg

Thr

Pro

Glu

Vai

Thr

Cys

130

135

140

Vai

Asp

Vai

Ser

His

Glu

Asp

Pro

Glu

Vai

Lys

Phe

Asn

Trp

145

150

155

160

Tyr

Vai

Asp

Gly

Vai

Glu

Vai

His

Asn

Ala

Lys

Thr

Lys

Pro

Arg

Glu

10

165

170

175

Glu

Gin

Tyr

Asn

Ser

Thr

Tyr

Arg

Vai

Ser

Vai

Leu

Thr

Vai

Leu

180

185

190

His

Gin

Asp

Trp

Leu

Asn

Gly

Lys

Glu

Tyr

Lys

Cys

Lys

Vai

Ser

Asn

195

200

205

- 15

Lys

Ala

Leu

Pro

Ala

Pro

He

Glu

Lys

Thr

He

Ser

Lys

Ala

Lys

Gly

210

215

220

Gin

Pro

Arg

Glu

Pro

Gin

Vai

Tyr

Thr

Leu

Pro

Ser

Arg

Asp

Glu

225

230

235

240

Leu

Thr

Lys

Asn

Gin

Vai

Ser

Leu

Thr

Cys

Leu

Vai

Lys

Gly

Phe

Tyr

20

245

250

255

Pro

Ser

Asp

He

Ala

Vai

Glu

Trp

Glu

Ser

Asn

Gly

Gin

Pro

Glu

Asn

260

265

270

Asn

Tyr

Lys

Thr

Pro

Vai

Leu

Asp

Ser

Asp

Gly

Ser

Phe

275

280

285

25

Leu

Tyr

Ser

Lys

Leu

Thr

Vai

Asp

Lys

Ser

Arg

Trp

Gin

Gly

Asn

290

295

300

Vai

Phe

Ser

Cys

Ser

Vai

Met

His

Glu

Ala

Leu

His

Asn

His

Tyr

Thr

305

310

315

320

Gin

Lys

Ser

Leu

Ser

Leu

Ser

Pro

Glu

Leu

Gin

Leu

Glu

Ser

Cys

30

325

330

335

Ala

Glu

Ala

Gin

Asp

Gly

Glu

Leu

Asp

Gly

Leu

Trp

Thr

He

Thr

340 345 350

158

He Phe He

Thr Leu

Phe

Leu

Ser

Vai

Cys

Tyr

Ser

Ala

Thr

Vai

355

360

365

Thr Phe Phe

Lys Vai

Lys

Trp

He

Phe

Ser

Vai

Asp

Leu

Lys

370

375

380

5

Gin Thr He

Vai Pro

Asp

Tyr

Arg

Asn

Met

He

Arg

Gin

Gly

Ala

385

390

395

<210> 146

<211> 53

<212> PRT

10

<213> Homo

sapiens

<400> 146

Leu Trp Thr

Thr He

Thr

He

Phe

He

Thr

Leu

Phe

Leu

Ser

Vai

1

5

10

15

Cys Tyr Ser

Ala Thr

Vai

Thr

Phe

Lys

Vai

Lys

Trp

He

Phe

Ser

- 15

20

25

30

Ser Vai Vai

Asp Leu

Lys

Gin

Thr

He

Vai

Pro

Asp

Tyr

Arg

Asn

Met

35

40

45

He Arg Gin

Gly Ala

50

20

<210> 147

<211> 34

<212> PRT

<213> Homo

sapiens

<400> 147

25

Ala Gly Thr

Thr Asp

Ala

His

Pro

Gly

Arg

Ser

Vai

Pro

Ala

1

5

10

15

Leu Leu Pro

Leu Leu

Ala

Gly

Thr

Leu

Glu

Thr

Ala

Thr

25 30

Ala Pro <210> 148 <211> 4551

159 <212> DNA <213> Artificial <220>

<223> DNA sequence of the gamma-chain expression cassette constant region, from CHI to 3'UTR of expression plasmid plgG-GPI-B <400> 148 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480

-15 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc1140 ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg1200 ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac1260 ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga1320 tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga1380 catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc1440 cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag1500 gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta1560

160

	cacgcagaag	agcctctccc	tgtctccggg	taaatgagtg	cgacggccgg	caagcccccg	1620
	ctccccgggc	tctcgcggtc	gcacgaggat	gcttggcacg	taccccctgt	acatacttcc	1680
	cgggcgccca	gcatggaaat	aaagcaccca	gcgctgccct	gggcccctgc	gagactgtga	1740
	tggttctttc	cacgggtcag	gccgagtctg	aggcctgagt	ggcatgaggg	aggcagagcg	1800
5	ggtcccactg	tccccacact	ggcccaggct	gtgcaggtgt	gcctgggccg	cctagggtgg	1860
	ggctcagcca	ggggctgccc	tcggcagggt	gggggatttg	ccagcgtggc	cctccctcca	1920
	gcagcacctg	ccctgggctg	ggccacggga	agccctagga	gcccctgggg	acagacacac	1980
	agcccctgcc	tctgtaggag	actgtcctgt	tctgtgagcg	ccctgtcctc	cgacctccat	2040
	gcccactcgg	gggcatgcct	agtccatgcg	cgtagggaca	ggccctccct	cacccatcta	2100
10	cccccacggc	actaacccct	ggcagccctg	cccagcctcg	cacccacatg	gggacacaac	2160
	cgactcctgg	ggacatgcac	tctcgggccc	tgtggaggga	ctggtccaga	tgcccacaca	2220
	cacactcagc	ccagacccgt	tcaacaaacc	ccgcactgag	gttggccggc	cacacggcca	2280
	ccacacacac	acgtgcacgc	ctcacacacg	gagcttcacc	cgggcgaacc	gcacagcacc	2340
	cagaccagag	caaggtcctc	gcacacgtga	acactcctcg	gacacaggcc	cccacgagcc	2400
-15	ccacgcggca	cctcaaggcc	cacgagccgc	tcggcagctt	ctccacttgc	tgaccagctc	2460
	agacaaaccc	agccctcctc	tcacaaagtg	cccctgcagc	cgccacacac	acacaggccc	2520
	ccacacacag	gggaacacac	gccacgtcac	gtccctggca	ctggcccact	tcccaataca	2580
	gcccttccct	gcagctgagg	tcacatgagg	tgtgggcttc	accatcctcc	tgccctctgg	2640
	gcctcaggga	gggacacggg	agacggggag	tgggtcctgc	tgagggccag	gcctctatct	2700
20	agggccgggt	gtctggctga	gtcccggggc	caaagctggt	gcccagggcg	ggcagctgtg	2760
	gggagctgac	ctcaggacac	tgttggccca	tcccggccgg	gccctacatc	ctgggccccg	2820
	ccacagaggg	aatcaccccc	agaggcccaa	gcccaggggg	acacagcact	gaccaccccc	2880
	ttcctgtcca	gagctgcaac	tggaggagag	ctgtgcggag	gcgcaggacg	gggagctgga	2940
	cggggccggc	accaccgacg	ccgcgcaccc	ggggcggtcc	gtggtccccg	cgttgcttcc	3000
25	tctgctggcc	gggaccctgc	tgctgctgga	gacggccact	gctccctagg	gccaccctct	3060
	gcggggtgtc	cagggccgcc	cagaccccac	acacgagccg	tgggccatgc	tcagccacca	3120
	cccaggccac	acctgccccc	tgacctcacc	gccctcaacc	ccatggctct	ctggcttcgc	3180
	agtcgccctc	tgagccctga	aacgcccccc	ttccagaccc	tgtgcatagc	aggtctaccc	3240
	cagacctccg	ctgcttggtg	ccagggcact	gggggccagg	tgtcccctca	gcaggacgtc	3300
30	cctgccctct	ggaccaccag	gtgctcacac	aaaaggaggt	aaccggcatc	ccaggccccc	3360
	actcaggcag	gacctcgccc	tggagccaac	cccgtccacg	ccagcctcct	gaacacaggc	3420

atggtttcca gatggtgagt gggagcatca gtcgccaagg tagggaagcc acagcaccat 3480

161

	caggccctgt	tggggaggct	tccgagagct	gcgaaggctc	actcagacgg	ccttcctccc	3540
	agcccgcagc	cagccagcct	ccattccggg	cactcccgtg	aactcctgac	atgaggaatg	3600
	aggttgttct	gatttcaagc	aaagaacgct	gctctctggc	tcctgagaac	agtctcggtg	3660
	ccagcaccac	cccttggctg	cctgcccaca	ctgctggatt	ctcgggtgga	actcgacccg	3720
5	cagggacagc	cagccccaga	gtccgcactg	gggagagaag	gggccaggcc	caggacactg	3780
	ccacctccca	cccactccag	tccaccgaga	tcactcagag	aagagcctgg	gccatgtggc	3840
	cgctgcagga	gccccacagt	gcaagggtga	ggatagccca	aggaagggct	gggcatctgc	3900
	ccagacaggc	ctcccacaga	aggctggtga	ccaggtccca	ggcgggcaag	actcagcctt	3960
	ggtggggcct	gaggacagag	gaggcccagg	agcatcgggg	agagaggtgg	agggacaccg	4020
10	ggagagccag	gagcgtggac	acagccagaa	ctcaccacag	aggctggcgt	ccagtcccgg	4080
	gtcacgtgca	gcaggaacaa	gcagccactc	tgggggcacc	aggtggagag	gcaagacgac	4140
	aaagagggtg	cccgtgttct	tgcgaaagcg	gggctgctgg	ccacgagtgc	tggacagagg	4200
	cccccacgct	ctgctgcccc	catcacgccg	ttccgtgact	gtcacgcaga	atccacagac	4260
	aggaagggag	gctcgagcgg	gactgcggcc	agcgcctgcc	tcggccgtca	gggaggactc	4320
- 15	ctgggctcac	tcgaaggagg	tgtcaccatt	tcagctttgg	cttttcttct	tcttttaaat	4380
-	tttctaaagc	tcattaattg	tctttgatgt	ttcttttttg	atgacaataa	aatatccttt	4440
	ttaagtcttg	tacttcgtga	tgggagccac	cttcctgtgt	ccacgcgcct	cctgcccccg	4500
	gtggaaaaca	cggtcaggag	gaggctggtc	cagctgcacc	tcgggggatc	c	4551

<210> 149 <211> 330 <212> PRT <213> Artificial <220>

<223> amino acid sequence of the slgG isoform of the gamma-chain constant region encoded by plasmid plgG-GPI-B <400> 149

Ala

Ser

Thr Lys

Gly

Pro

Ser

Vai

Phe

Pro

Leu

Ala

Pro

Ser

Lys

1

5

10

15

Ser

Thr

Ser Gly

Gly

Thr

Ala

Leu

Gly

Cys

Leu

Vai

Lys

Asp

Tyr

30

20

25

30

Phe

Pro

Glu Pro

Vai

Thr

Vai

Ser

Trp

Asn

Ser

Gly

Ala

Leu

Thr

Ser

162

Gly

Vai

His

Thr

Phe

Pro

Ala

Vai

Leu

Gin

Ser

Gly

Leu

Tyr

Ser

50

55

60

Leu

Ser

Vai

Thr

Vai

Pro

Ser

Leu

Gly

Thr

Gin

Thr

65

70

75

80

5

Tyr

He

Cys

Asn

Vai

Asn

His

Lys

Pro

Ser

Asn

Thr

Lys

Vai

Asp

Lys

85

90

95

Lys

Vai

Glu

Pro

Lys

Ser

Cys

Asp

Lys

Thr

His

Thr

Cys

Pro

100

105

110

Glu

Leu

Gly

Pro

Ser

Vai

Phe

Leu

Phe

Pro

Lys

Pro

Lys

10

115

120

125

Asp

Thr

Leu

Met

He

Ser

Arg

Thr

Pro

Glu

Vai

Thr

Cys

Vai

130

135

140

Asp

Vai

Ser

His

Glu

Asp

Pro

Glu

Vai

Lys

Phe

Asn

Trp

Tyr

Vai

Asp

145

150

155

160

15

Gly

Vai

Glu

Vai

His

Asn

Ala

Lys

Thr

Lys

Pro

Arg

Glu

Gin

Tyr

165

170

175

Asn

Ser

Thr

Tyr

Arg

Vai

Ser

Vai

Leu

Thr

Vai

Leu

His

Gin

Asp

180

185

190

Trp

Leu

Asn

Gly

Lys

Glu

Tyr

Lys

Cys

Lys

Vai

Ser

Asn

Lys

Ala

Leu

20

195

200

205

Pro

Ala

Pro

He

-Glu

Lys

Thr

He

Ser

Lys

Ala

Lys

Ala

Cys

Pro

Gly

210

215

220

Gin

Pro

Arg

Glu

Pro

Gin

Vai

Tyr

Thr

Leu

Pro

Ser

Arg

Asp

Glu

225

230

235

240

25

Leu

Thr

Lys

Asn

Gin

Vai

Ser

Leu

Thr

Cys

Leu

Vai

Lys

Gly

Phe

Tyr

245

250

255

Pro

Ser

Asp

He

Ala

Vai

Glu

Trp

Glu

Ser

Asn

Gly

Gin

Pro

Glu

Asn

260

265

270

Asn

Tyr

Lys

Thr

Pro

Vai

Leu

Asp

Ser

Asp

Gly

Ser

Phe

30

275

280

285

Leu

Tyr

Ser

Lys

Leu

Thr

Vai

Asp

Lys

Ser

Arg

Trp

Gin

Gly

Asn

300

295

290

163

Val Phe Ser Cys Ser

Vai Met His Glu Ala Leu His Asn His Tyr Thr

305

310

315

320

Gin Lys Ser Leu Ser Leu Ser Pro Gly Lys

325

330 <210> 150 <211> 380 <212> PRT <213> Artificial <220>

<223> amino acid sequence of the long isoform of the gamma-chain constant region including the carboxy-terminal signal peptide of the human placental alkaline phosphatase encoded by plasmid plgG-GPI-B <400> 150

Ala

Ser Thr

Lys

Gly

Pro

Ser

Val

Phe

Pro

Leu

Ala

Pro

Ser

Lys

1

5

10

15

Ser

Thr

Ser

Gly

Thr

Ala

Leu

Gly

Cys

Leu

Val

Lys

Asp

Tyr

20

25

30

Phe

Pro

Glu

Pro

Val

Thr

Val

Ser

Trp

Asn

Ser

Gly

Ala

Leu

Thr

Ser

35

40

45

Gly

Val

His

Thr

Phe

Pro

Ala

Val

Leu

Gin

Ser

Gly

Leu

Tyr

Ser

50

55

60

Leu

Ser

Val

Thr

Val

Pro

Ser

Leu

Gly

Thr

Gin

Thr

65

70

75

80

Tyr

He Cys

Asn

Val

Asn

His

Lys

Pro

Ser

Asn

Thr

Lys

Val

Asp

Lys

85

90

95

Lys

Val

Glu

Pro

Lys

Ser

Cys

Asp

Lys

Thr

His

Thr

Cys

Pro

Cys

100

105

110

Pro

Ala

Pro

Glu

Leu

Gly

Pro

Ser

Val

Phe

Leu

Phe

Pro

115

120

125

Lys

Pro

Lys

Asp

Thr

Leu

Met

He

Ser

Arg

Thr

Pro

Glu

Val

Thr

Cys

130

135

140

164

Val

Asp

Val

Ser

His

Glu

Asp

Pro

Glu

Val

Lys

Phe

Asn

Trp

145

150

155

160

Tyr

Val

Asp

Gly

Val

Glu

Val

His

Asn

Ala

Lys

Thr

Lys

Pro

Arg

Glu

165

170

175

5

Glu

Gin

Tyr

Asn

Ser

Thr

Tyr

Arg

Val

Ser

Val

Leu

Thr

Val

Leu

180

185

190

His

Gin

Asp

Trp

Leu

Asn

Gly

Lys

Glu

Tyr

Lys

Cys

Lys

Val

Ser

Asn

195

200

205

Lys

Ala

Leu

Pro

Ala

Pro

He

Glu

Lys

Thr

He

Ser

Lys

Ala

Lys

Gly

10

210

215

220

Gin

Pro

Arg

Glu

Pro

Gin

Val

Tyr

Thr

Leu

Pro

Ser

Arg

Asp

Glu

225

230

235

240

Leu

Thr

Lys

Asn

Gin

Val

Ser

Leu

Thr

Cys

Leu

Val

Lys

Gly

Phe

Tyr

245

250

255

- 15

Pro

Ser

Asp

He

Ala

Val

Glu

Trp

Glu

Ser

Asn

Gly

Gin

Pro

Glu

Asn

-

260

265

270

Asn

Tyr

Lys

Thr

Pro

Val

Leu

Asp

Ser

Asp

Gly

Ser

Phe

275

280

285

Leu

Tyr

Ser

Lys

Leu

Thr

Val

Asp

Lys

Ser

Arg

Trp

Gin

Gly

Asn

20

290

295

300

Val

Phe

Ser

Cys

Ser

Val

Met

His

Glu

Ala

Leu

His

Asn

His

Tyr

Thr

305

310

315

320

Gin

Lys

Ser

Leu

Ser

Leu

Ser

Pro

Glu

Leu

Gin

Leu

Glu

Ser

Cys

325

330

335

25

Ala

Glu

Ala

Gin

Asp

Gly

Glu

Leu

Asp

Gly

Ala

Gly

Thr

Asp

Ala

340

345

350

Ala

His

Pro

Gly

Arg

Ser

Val

Pro

Ala

Leu

Pro

Leu

Ala

355

360

365

Gly

Thr

Leu

Glu

Thr

Ala

Thr

Ala

Pro

30

370

375

380

<210> 151 <211> 2061

165 <212>

DNA <213>

Homo sapiens <400>

151 gtacacactg taacttctcc tctcgatgtc ctgccctcgc cacgggcacg gggggagcat gcatttccag gcttggggag acacagaggc aggagagctg gaagaatggg ctcctgcctg120 cctggtgcca catcctgccc cagctttgag ggctgaatcc tctcagctca gagaagagct180 tccctagttt tgcaggcgca cggaggcctc ccacccgtac acctgcctct gctctccccc240 tggccattgc aatgcatgcc cgggatctgg gtttaccctg cagcccgact cctccagggc300 aggctccttc cgtccttggg tccagcagcc tcccccctcc gctgggtact gagcatctga360 aaagtctcag atagggccct acacctcttc tcccttctca agtgctcagc ccaggggtgg420 ggcttgctgc ttgcaaagag cagcccaccc tcctgtactg ccatcctatt gcctttgaag480 aaggaggtca gcctggacag gtgaactgag ttgccttcag aaaggcctgt ctcaggcagc540 cgcagcaggc ttcacgatgt ccatgtatcc tgtttgcctg ctgccgtctc tcctctccca600 agaggggagg tctgcgtgtt gagccaggga ggaaggagcc tgcagcctgc tcagggtggt660 ggctggtgac tgcggggcca gggcttgctg ctgtctctcg gaatgtcctg catgtgggtc720 , tggctgttcc tgctggcact gccctcttct ctctcccctc ctttcccact ctgccctgct780 tgcccgtcag ggtctccgga tgcccctgct ggaggcagag aagcgttctg tttttatcat840 ' cgtccctgtc ttggtcctgt ccgtgctccc catgtgctcc caatcagttg tcttcgttcc900 tcaacatcag ggaaagaaaa aacagcaaca cttctccctg tcatcagctc tgctgtctcc960 ttgtcaggcc ttgggacgtt ctctgggctc agtctagggt cgtgcctcat gcctcatgcc1020 tctctgggaa ggttcccagg ggcgccgcct ccatggttgg ctggtgggtt ttaaagggga1080 aggttgggag gaggcctgtg gaaggaggag ggccgtccac acccgtgggg caaagcgtgt1140 tccatgaaac cagtgctgtg cgtgctggga tgaaagcctc ccagcctctc gtgctgaagg1200 gaaaggtgga ccgaactggc ttagctgctg tggcaatggg gtggggggtg agtcctaatc1260 agaaggtggg agaagagaat aacaaaatgg aactccgccc cctgccgcca catttcctta1320 agttttagga gttggggcct atgagtagaa tttgaaagaa ctaccaaaaa agcttatttt1380 tggaaattaa gtcagctttg cctgtggttt ggctaggaat aaatatttac ctgtgtgccc1440 ctacagagat gacacagacc caaagtggga cattgagcaa ggcacaggct ggttcccctc1500 ctgtcctctg tcctcattct gtgagtgcca ccatcaccag gtactgtggc ctgcagaaat1560 aaacgaggca ccaaccctgc cctcagggac cccgtgtctt cttagggaca gaggactcag1620 aaacatctgt gtccccgcat gttaagtgca tgcacacagt gctgaggctt tgcagagaag1680 ggccatggct ccctgaggag accaagaaag gcacatagaa gtgacttctc agctggccct 1740

166 tgcaggatcc ctgggtgcct gtacctctcc agtccagctg agcaaggagg ctcaggaatt1800 aatgaagatg gggcttgtgt agcacgatgg ttctaggcca tcccttttcc atggctcaag1860 tccattgaag gcagcctcca aaatcagggg gttgcctgat cctcctagtg ccacaatccc1920 agtcctagct agaacttgcc atggttcttc tccctaaaag ttcccagggg acaggagaca1980 ggtgttgctt ttctaatgga gcgggacctc gcatggacgg ggccctccaa gcctgctaac2040 accctgttcg cactgactca g2061 <210>152 <211>2726 <212> DNA <213> Mus musculus <400>152 tacgttcaat ggcagtggat cttaaagacc ttttggatct aagaccagaa gccatctctg60 actcccctct caccttccag tttcttccaa atcctctggg ccagccagag gtctcagatt120 ctgccctctt gccctgtgcc caccttgttg accactggac agcatatgtg atggctactg180

- 15 ctagtgccag cttcacaaga ggttaacact acggactagc cattcttcct atgtatctgt240 _ ttctgcaaat acagccgctt tacttaagtc tcagcacttc ttagtctcct cttttcctct300 cagtagccca aggggtcatg tcacaaacat ggtgtgaagg gctactttgt caaatgaaaa360 ggtctatctt ggggggcatt tttttctttt ctttttttct tgaaacacat tgcccagcaa420 agccaataaa tttctctcat cattttgttt ctgataaatt cttactattg attgaaatgc480 ttccctgagg aacattaaat tatgtatgaa tttccattca aagtcatcat gcagcagtgg540 tatcaagcag gcagcatcta gtgcagaact gagattgtct acagaatgcc tgcttgatgc600 tcagccttat atcccagtta cggaca-tgtc tacaaatagc ccttctctta ccatctctcc660 cttaacttca tgatgtggta gctgattcct tctgccatca actgaaatgg caaaataaag720 gaaagcctga atcctgtctc ccctcttagt ttccaaggac acttgcccag aaaaatgcgc780 cccccccccc ccgtatcccc aggcagcatc caggactttc ttaaatggtt ctctgtacaa840 tcccaccttt aaaacagtca gtgaccattc tttgtaatca ttactttatt aatggttttc900 ttttctaaac cacctgcctt tgctgttgta gcttctcaat acatgctctg agacaaatca960 ttccttatat attccaatat tgctgaaaac tcattaattt ttactaatag ggggttgttt1020 tctaaagctc aggaaatgac ttgtactccc taagtaggaa atgttgcaaa ccaccatttc1080 atgatgtaca gttgattcaa ttaagtcagg tctgtgagga ctttggttcc ttatctatat1140 gtaaataatg ctgataccaa atctttgcta ttcattaaca tgtaatcttg caaataataa1200 taaatttaac agaaactcaa attgaggtag attcttaagg ataatagctt tcagcctagc 1260

167

cataaaagaa	atgaaaaaat	agt-ctttaaa	gatcccaaat	tcagaattag	taatattaat	1320
tcagatagtc	cttcgtaaga	ttgaaaaaca	tgacttctga	tttctcatct	ttccaaagtt	1380
agacttgacc	ttggtgagat	ggcaaagtta	aaaaattcct	ggggtttaag	gatatattgg	1440
ggcaacagtc	acagcaacgg	tgatgctttt	tatatctaaa	tcctgtcagg	ttttgtttcc	1500
actgagctca	ttcattcacc	tagggatctc	attaaaagta	ggggaccggg	ctggtgagat	1560
ggctcagcag	gtaagagcac	ccgactgctc	ttccgaaggg	cctgagttca	aatcccagaa	1620
accacatggt	ggctcacaac	catccgtaac	aagatctgac	tccctcttct	ggtgtgtctg	1680
aagacagcta	cagtgtactt	acatataata	aataaataaa	tcttaaaaaa	aaaaaaaaag	1740
taggggaccc	tatcagaggt	ctcaatgtgc	ctggaaggtc	tcccaacatg	gctgtgggaa	1800
aatgcctgac	aatttttttt	caattgcatg	tgtgttctcc	gagaaaggat	aagatgcaag	1860
tttatataag	aagcaggatt	tacttatact	aaaatgcctt	acacgtaagg	ttcaggtagc	1920
atcgtggcag	agagggtaga	aagactgtaa	gagccagagg	accaggatgt	ccgctcttag	1980
tgtcttctat	atatgaaaga	aagctgtacc	cgtgaattct	caaacagttg	tctacatatc	2040
acctgcacaa	tggccgttct	ggaaatctaa	aaaaaacaaa	aaacaaacaa	acaaataaat	2100
aaataaataa	atatcaaaaa	atcaaaaacc	acccctagat	gaaaagctac	aagtaattaa	2160
aagctgctaa	aagggggaga	atcaattttc	tccagagaca	agtccctgat	aggtcatcca	2220
atttcgggtg	atcagcccta	agcacataca	catataagca	atactaaacg	gacacagctg	2280
gtctatatac	ttacaacttg	gggcttgaag	gaagttggtg	gggaaggggg	gagagtagta	2340
atgatgtatg	taaatacagt	actcatgtac	gaaactcccc	aaaaataaag	aattcttaaa	2400
attattaaaa	actggtattc	ttgtcttgga	ctattttctg	aattttatat	taatattttc	2460
atcatcaaaa	gactataaaa	tgattataat	aatgagagaa	gttcagatga	aacatcaact	2520
gtcttaaatg	tagaaaagga	aactgacttc	aggcagagaa	gctaaaaatg	ttggcaacct	2580
tgccttggga	cttagccacc	agtcatttcc	tctatataag	tcacccatat	cccaatttct	2640
gagataattt	taaatgttat	cactgtgtca	aaggtgcagg	acatgtatgg	aatgcccata	2700
ttaccttctc	ttgtctctca	ttccag				2726

<210>	153
<211>	5686
<212>	DNA
<213>	Homo sapiens
<400>	153

gggtgagttg gcagcaacat ctcttggttt aagagttcca gcacagcgat agtactttct agccacatct cagcaaggaa actaggctat tgccacctgc tcttaagagg cttgaacaca

120

168 ggtgttaact cctgattgaa atgaacaaag ataggagaag attaggggga aaatctgtat180 ccttgctgga aaccagggca gtgcacatat aaagagtatg ctgttcactg gatgggaagg240 aaaaaaactt agaagtgtag tagtcaaagc acacaaacaa ccctaaccca gagtagacat300 tgctggaaga aagggaagac catgtagcag ctgtgtgaga gaatgaatct taatgataac360 agcatgatcc cttgctaggg ctgccatcaa aaagtacagg ccttcctcgt tttattgtac420 ttcgcagatg ttatgctttt tacaaattga acgcttgtgg gaacgctgtg taagcatgtt480 cgtcggcatc atttatccaa cagcgtgtgt tgacttcgtg tctctgtgta gcattttgat540 tattctcaca gtatcccaga tgttttcatt attatcatgt ctgtgatagt gatctgtcat60Ò cagtgatctt tgatgttact attgtcattg tttggggtcc ctacgaactg cacccatata660 agacagaaaa cttaatcaat aaatgtgcgt gctttgactg ctccatggac tagacattcc720 ccttctgtct ccctctcttc aggactccct aatccctgag acacaataat actaaaatga780 ctccaattaa taaccctaca atagccttta agtgttgaca tgaagggaag agtcatgcat840 ctcttacttt aaatcaaaag ctagagatga ttaagcttac tgaggaagat acgttgaaaa900 ccaagatagg ccaaaagcca ttcctcatgt gccaaacagc tagaaagttg taaaggcaaa960 gtaaaaatac ttgaaggaaa tttaaaatgc tcttccagtg aacacatgta tgataagaag1020 . gtaaaacagc cttattgctg atatggaaga agttttagtg gtctagacat aagatcaaac1080 tagaaacatt tcctgaagcc aaagcgtaat cctgagcaag gccgtaactc tcttcaattc1140 tgtgaaggct gacagaagct ggaagctagc agaatttggt tcctgaggtt taaggaaaga1200 agccctctcc ataacataaa ggtccaaggt gaagcagcca gtgctcatat agaagttgca1260 gcaagttatc tagaaaatct agctaagatc actgacgaag gtgttacact aaataacaga1320 ttttccatgt agacaaaaca gccatctatt ggactttcat agctagagag gagaagccaa1380 tacctgggtt caaagcttca aagaacaggc tgacttttta ggagctaatg ccgctggtga1440 ctttgagttg aagccaatgt tcaccgacca ttctaaaaat cctagggccc ttaagcatta1500 agttaaatat accttgcctg tgtctataaa tggaagaaca aagcctgatg acagaggtat1560 gtttgcggca tagtttactg aatattttaa gcccactgtt gagatctagt gctcagaaaa1620 acagattcct ttcaaaatat tactgctcat tgacattgca cctaagcagc caagagctct1680 aatggagaag gacatggaga tgaatggagt tttcctgcct gctaacaaca gcagccattc1740 tgcagcccat ggctgaagga gtaattttga ctttcaagtt tcactattta agaaatacat1800 tttgtaaggt gagtccccac agacagtaat tcctctgatg gatctgaaca aaataagttg1860 aaaactgctg gaaagaattc atcattctac ataccattaa gaacattcgt gattcatggg1920 aagagcttaa aatatcaaca ttaataggag tttggtagaa gttaattcca accctcatgg1980 ctgactttga gaggttcaag acttcagcgg aggaaataac tgaagatgtg gtgaaaatcg 2040

169

caagagaact	acaattagaa	gtggagcctg	aagacgtgac	tgaattgcga	caaattcatg	2100
atcaaacttg	aacagatgag	gagttgcttc	tcatgaatca	gcagagaaag	tggttttttt	2160
gaggtggagt	gtcttcctgg	tgatgatgac	atgagcattg	tgaaaatgac	cacaaaggat	2220
acagaatatt	acaaaaactt	aggtgataaa	gcagcagcag	tatcgggagg	attaactcca	2280
attttgaaag	cagttcagag	ggtaaaatgt	tatcaaacag	cattgcatgc	tagaaaaatc	2340
ttttgtgaaa	ggaagagtcc	atcaatacag	caattttatt	gctgtctcag	cttaagaaat	2400
tgccacagcc	accccagcct	tcagcaacca	ccaccctgat	cagtcagcag	ccatcaacct	2460
tgaggcaaga	ccctccacca	acaaaaagat	tacaaattat	tgaaggtcag	ataatcttta	2520
gtattttctt	atcaataaac	ctttttttaa	agtatgactt	tgtttagaca	taatgctatt	2580
tcacacttaa	tagactaccg	tatagtataa	acacaacttt	tagactcact	gagaaatcaa	2640
aaaattcatc	tgactcattt	gttgtgatat	gtgttttatt	gtggtggtct	ggaactgaac	2700
ctgcaatata	tttgaggaat	gtctgtaaca	cgaagtgggc	ggcttaatac	aacagaagtt	2760
tttggagttc	cattctagag	actggaaatc	caaaatcaag	gttttgggag	ggccacgctc	2820
cctctgaatc	ctgtagggaa	ggatccttca	ttgcatcttc	cagcttctgg	agccacaggc	2880
cttccttggc	atgtggcagc	agaactccaa	tttctgtctc	tgtcctcata	tggccatctt	2940
ccctctgggt	ctgtgtcctc	atatgctgtt	ctctctgtgc	atgtctgttt	ccaaagtttt	3000
cccttttaat	aaggacacca	gtcacactgg	attagggcct	accttcatga	cctcacctta	3060
acttgattgc	gtctgcaaag	atcgtatttc	caaataaggt	cacatccaca	gggactggag	3120
gttaagactt	cagcatactc	aggggagaca	caattcaacc	tataacagag	cccctttgaa	3180
aatgtcaggc	atcaggtgct	cacagcacac	ggtccagctg	ttggtgctca	cccttgctca	3240
gcacacggtg	gaggctctgc	ctcaatctca	ttcttcatgg	gaacagctaa	gccaggtagc	3300
gaatacgagt	tacgtttgtg	tcaccacagc	agacactgaa	aggaagtttg	tggtgtccag	3360
cacatttgcc	agcataggcc	tcacagacca	caacacctag	aatctgacaa	aaattagaat	3420
aaatccgatg	tctccttttc	tctctttttt	taagcatttt	taaatacaat	tggtaaattt	3480
cctgactgta	ccctactcat	cttgcattgc	tgaataagtg	aggaacctct	ctatggcatg	3540
aagcagaaaa	ccattgagct	tatgagaaga	aacaggaaat	acatgtaaaa	gagaccagtc	3600
tgaaaaatca	ggagaaattt	tacaaaagag	atttactgcc	aagaaaccag	ggaaactttc	3660
agaacactct	ccttttcata	tttgtaacaa	gattcaattg	tacaaatact	tctgtgaaac	3720
tagccatgaa	gtgtgtacat	gaatgaatat	atgtattcag	tgtgtttata	tatttcattt	3780
catacatgtg	atctatatca	tatatatata	tatatatata	tatatatatc	acaatgaata	3840
ttgcagaaaa	ttaaagcaaa	gagtaagaag	agttaaccaa	atgttccctg	aatgcagtgg	3900
gaaaagatga	aaaggagaag	acaggcaagc	acagtggctc	acacatgtaa	tcccaacata	3960

170

ttgagaggcc	ggggcaagag	gatcacttga	gcccaggagc	tcaagaccag	cctggacaac	4020
atggcaaaaa	cccatctcta	caaaaaagta	taaaaattag	ctgggcatgg	cagcatgtga	4080
ctgtagtcac	agctaggcag	gagaatgaag	tgggaggatc	acctgagccc	aggaggctga	4140
ggcttcagtg	agccttgatg	gcaaccctgc	actccagcct	ggatgacaga	atgagaccct	4200
gtctcaaaaa	aggaaaaaga	gaagacatat	gtaacacagt	gtcaggattc	aaaatacatg	4260
tagcaaaaat	tccagaaggg	taagcaaata	agcccatacc	tagccatcac	tagggaaact	4320
tctgtgtttc	agggatagag	aaaaaaactc	tgattccaga	aataaaatgt	gaaaatataa	4380
tacccgcaaa	agaaataaat	ttattgacac	cacattgatt	ctatattgta	taagatatat	4440
tgtataacac	taaattgtag	aagatagcac	ttctcttgag	ccaagctaat	atgcacacct	4500
agaggctcca	ggtacacatt	aaaggataag	caaagacaca	aaaattgtac	catttaagta	4560
tgtttcccag	gcaattcata	agcaaatttt	taaaaaggag	aatgatgaat	tccaaaggaa	4620
atctcaatga	gataggatgt	aggtaaaaag	aaaaaacaac	aataaaaaaa	acatacacac	4680
aaaatcttgg	caatgtaata	ataatttatt	aataatctct	ctaaactcat	agaatatatc	4740
aataaaacta	gaaaatgtga	gacagcaaga	aaagataggc	tagacttaca	ttacagaaaa	4800
gatgagtaga	ctgactatat	agagtttgac	tctaaaattg	agaaaagagg	tttaaatatg	4860
tgtcacgtgt	atatgtataa	tatacatgca	cacatataaa	atgaaattcc	tcactggaaa	4920
aaatattaag	tttaatttcc	aaattattag	aatgactaaa	acagttgaat	ctatctgttc	4980
catatagtaa	ttgaggggga	aggaaaagga	atagcaagga	atccattttt	ctcttccacc	5040
agaaataagc	tccctcatgt	ttgggtcagg	tcactttatt	cattgctttc	tccacatcct	5100
catcattagg	catcatgaaa	tcaatgaaaa	ggcagtgaaa	gaatgatgat	gaaagctaat	5160
caaatgtatc	atttacctca	atacgtttgg	tttaatcttc	ttgttgaaag	acaaattctc	5220
ctagacagga	tcaaaagcaa	catatcttgt	atttataaaa	aacatgtctc	aagtaaaatg	5280
acatagtatt	atacacacac	acacacatac	acacacacac	acacattaag	ggaaaatgca	5340
gacaaaaaat	ggcagaaata	atatttagag	aaagatagaa	tttaagaaaa	aaaattgtca	5400
aacaggtctg	caaaataatt	gttttatttt	ggtgccagtt	acagtccgca	atgaagcgaa	5460
gatattaaga	agcaaagtgg	gccaggagaa	attagagcag	aaatatctct	ttcaatagtg	5520
agagaatagg	aaaaagaagt	agaaaagctg	ggaacaatag	gtaaagttta	ggctaggcct	5580
tagacttctc	ctgcattgta	atccctctgg	tttgccacat	atgcatgctg	tcaggaagtt	5640
gatgaggtat	gtacagcaca	atttattttc	cattttttgc	ctttag		5686
<210> 154
<211> 1260

<212> DNA

171 <213> Mus musculus <400>154 gtgagtatca gggtcgtagg ctgtgaggat ctctacagcc gtgtatattc tctgttcaga60 aattccctct ggctgaccgt ggcgttttcc gttctaggat gcctctaact atacatccct120 gtggctgtgg tgtggtgatc cgagggctgc actaacacac agatttctgt ggttgtcact180 gttcagggcc acagaatgac tgagtcttct ttctatacag tatgcagtag ctggatagtc240 aggactgggg aaggttgtgt gaggttgact cggtggtacc gctgaggagg aaaagggctt300 gtccagagca ggcgtgatgt acagcgcaca ttgttttttt cagcaagtaa tgaaaatctg360 tgactgagtg accttggggg ctgcggtggt gaggagagct cacgggaatc ctggagcagt420 gtagctggcg tgtcaaaagc agaaacgcag gagatgggtc agtgcgccga ggcccggagt480 ttaaatcccc agagcccacg taaaagcctt gcgcagtagc acgcatgcgt aatcctgatg540 gagcaattag gagaagccgg tggccggcta gcctgtgcag actgtgaaaa cagagcatct600 gaagctgtgt gaaaggctag ctcgcctgtg ctcctcagat cctgacatac gccatctcga660 gcaaaagatt aacaatcgat taaaacccac acatgaaaac aaagaaacca gttagctcca720 gataaaagca aatgccagga aggaaaggag gcagagggca ggggtggagg agcaggtggg780 agaggatgac gtcagagaaa tctcagtggc cgtgaacaag gaagatattc cagggcttgt840 tctgaatgtg tgatctttta aaccatgtgg ccctcttagc ctgtgagaaa agtccatttc900 tagccctgct gaacagagaa gcccagggga gcaaccaact ggccttcggt cactcagcaa960 ggacctagta gaggctggct ttgaacttga gccctccagg gcacttgacc tctgagcttt1020 gggaaaacaa gcgaggcagc ttcacgctgt tgtgatctgg acttggatca gggccagtga1080 ggacagggac agggatgggt gtgataagga cttggtgtgt aagagggaga gttggggaga1140 caggtgggag ggctatctgt agccaggtaa ccaagggtcc caggggaacc cccagtgtgg1200 acgcggactg cacatgacac agggcggcct ccccattcat gactgttttt ctccttgcag1260 <210> 155 <211> 2627 <212> DNA <213> Homo sapiens <400> 155 gtaaacccac ccatgtcaat gtgtctgttg tcatggcgga ggtggacggc acctgctact60 gagccgcccg cctgtcccca cccctgaata aactccatgc tcccccaagc agccccacgc120 ttccatccgg cgcctgtctg tccatcctca gggtctcagc acttgggaaa gggccagggc180 atggacaggg aagaataccc cctgccctca gcctcggggg gcccctggca cccccctgag240

172

cctttccacc	ctggtgtgag	tgtgagttgt	gagtgtgaga	gtgtgtggtg	caggaggcct	300
cgctggtgtg	agatcttagg	tctgccaagg	caggcacagc	ccaggatggg	ttctgagaga	360
tgcacatgcc	ccggacagtt	ctgagtgagc	agtggcatgg	ccgtttgtcc	ctgagagagc	420
cgcctctggc	tgtagctggg	agggaatagg	gagggtaaaa	ggagcaggct	agccaagaaa	480
ggcgcaggta	gtggcaggag	cggcgaggga	gtgaggggct	ggactccagg	gccccactgg	540
gaggacaagc	tccaggaggg	ccccaccacc	ctagtgggtg	ggcctcagga	cgtcccactg	600
acgcatgcag	gaaggggcac	ctccccttaa	ccacactgct	ctgtacgggg	cacgtgggca	660
caggtgcaca	ctcacactca	catatacgcc	tgagccctgc	aggagcggaa	cgttcacagc	720
ccagacccag	ttccagaaaa	gccaggggag	tcccctccca	agcccccaag	ctcagcctgc	780
tcccctaggc	ccctctggct	tccctgtgtt	tccactgtgc	acagatcagg	caccaactcc	840
acagacccct	cccaggcagc	ccctgctccc	tgcctggcca	agtctcccat	cccttcctaa	900
gcccaactag	gacccaaagc	atagacaggg	aggggccacg	tggggtggca	tcagaagcag	960
gccagtgaga	cagggcctgc	ccagggccct	ctgcatgcct	ctggcttctg	cctggggctc	1020
ccaggagtgt	aagaacagtc	ccacaaccac	tgtggggaca	cctggcaccc	agactcccac	1080
aagggggcag	tggggcccct	gctcgtgcct	tagacatctt	ccgggcctcc	ccagggcccc	1140
ccgccttctg	gctgcctccc	tctgctctca	gggccaaggt	gaggtggagg	ccactgtcac	1200
ccctgagggt	ccagtcacca	gagggtaatt	gagagcaaca	ggtcactcgg	ggaagccctg	1260
ccacagagaa	gccctccagc	ccatgggacc	caggacctgg	cccaggggag	gggcttttaa	1320
agagaggggg	aaagagggag	aatcaacaga	tgaggggctg	aaccagcaga	cagagatcag	1380
gcagacacat	gggtagatcc	taggacatat	aatgaatgga	tgggtggatg	gaggattggt	1440
agacggagga	tggatgggtg	ggtaaatggc	tggatggagg	atggacagat	ggatatatga	1500
tggatggatg	aaggacgggt	ggatggagga	tggatgagtg	gatgaatgaa	ggatggaaga	1560
tggatggatg	gatgggtgga	tggactgatg	gatgatggat	ggatggatgg	atggatgatg	1620
gatggatggg	taggcggatg	gaggatggaa	gggtggatgg	aggatggaag	atagatggag	1680
gggtgaatgg	aggatgggtg	gactgacgga	ggattgagga	tactggggtg	ggtgggtggg	1740
tagatctatg	gaggataggt	gtatggaaga	taattggatg	gagaattgct	ttatgaatgg	1800
atgaatgaag	agatggaaaa	tagctttata	gatggatggg	tgaatggatg	gatggataga	1860
tggaagaagg	atgaatggat	ggaaaatagc	tttatagata	tatgggtgga	tatttaagtg	1920
atagccttac	attaatagat	gaatggagga	tgaatggttg	ggtgagtggg	taggagtgtt	1980
actgatggag	gggtggatat	acggataata	gctttataga	tggatggatg	gatagatgga	2040
tggaaggata	gaaagacagg	tgaatgactg	gatgtatcag	catatgacaa	gcaggtacag	2100

ctgtacatgg gaggtctatg ccctgagacc ctgaggaaaa tgaggatgcc cgtgctggtg 2160

173 gccctcacct ggccctcgct tgtaacccct cagccacatt ccctgggaag gcaacagagg2220 cctctggtct tgcccattca acctttggca cactgagtgt cagacccagg tctctgtctt2280 ggacccagat ctccttgagg gtgggtgtgt ctggtcctct ctggccccgg gacccagtca2340 ctgaatacgt ggctgggact gagacggggt ggggtgggag gggcgggagg gtacctcggg2400 ctcaagcttc ccttggagaa gcagatggtg tccactttct gccctgccaa gtctctccct2460 gaagtgccct aagaatgtca aagacagaag gtcccagccc ctcacctggg actctgcctc2520 ctcatcctcc ctgggggagt ctcaggcctt agatggggac ccagacccca ctgtccccag2580 accccaagga agcatagccg ctgttcacac gagtctgggc ctggcag2627 <210>156 <211> 1937 <212> DNA <213> Homo sapiens <400> 156 gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga60

-15 ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac120 tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg180 tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg240 ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc300 atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct360 accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca420 ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg480 cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc540 tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc600 ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc660 tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc720 ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc780 accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt840 ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact900 ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg960 cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc1020 catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag1080 tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg 1140

174 cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca1200 cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg1260 cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat1320 gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc1380 agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag1440 aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct1500 cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg1560 tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc1620 tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg1680 agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt1740 gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt1800 aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc1860 gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc 1920 tgggtgccca ccctcag1937

- 15 <210> 157 , <211> 1301 <212> DNA <213> Homo sapiens <400>157 gtaaatgagt gcgacggccg gcaagccccc gctccccggg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtg tacatacttc ccgggcaccc agcatggaaa taaagcaccc120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagc gggtcccact gtccccacac tggcccaggc240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacggg360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg420 tcctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc600 tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga780

175 acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc840 tcggcagctt ctccacatgc tgaccagctc agacaaaccc agccctcctc tcacaaggtg900 cccctgcagc cgccacacac acacaggccc ccacacacag gggaacacac gccacgtcgc960 gtccctggca ctggcccact tcccaataca gcccttccct gcagctgggg tcacatgagg1020 tgtgggcttc accatcctcc tgccctctgg gcctcaggga gggacacggg agacggggag1080 tgggtcctgc tgagggccag gtcgctatct agggccgggt gtgtggctga gtcccggggc1140 caaagctggt gcccagggcg ggcagctgtg gggagctgac ctcaggacac tgttggccca1200 tcccggccgg gccctacatc ctgggtcctg ccacagaggg aatcaccccc agaggcccga1260 gcccagcagg acacagcact gaccaccctc ttcctgtcca g1301 <210> 158 <211>1553 <212> DNA <213> Mus musculus <400>158 gtaacacctc cctccatccc tcctaggcct ccatgtagct gtggtgggga aggtggatga60 cagacatccg ctcactgttg taacaccagg aagctacccc aataaacact cagtgcctga120 ttagagccct gggtgcctgt tcttggggaa ggcaggttat gggcagaaat atcttggcct180 ' gaaagaaggg acaccccaag agaaggacag gagtgaagca tggctcaccc atctgtctat240 gtgttggata tttgacaaat aggacatcac aggacttcag cataggtacc cctggtcctt300 cctgctcttc actggatatc atgcacctga tctctagaga tgcagctaaa atgagccagt360 ctgggaaacc tcagcaccca cctctcagtc ttgcaagctc ctgctcccag acattcctgg420 atactaaacc ccttcaggta gagaaacagc caaagtcaac atctaggacg caggactcaa480 catggtcctg ctccttccct ctctactcaa cagccattga ggctgagccc accgccccaa540 ccgcctgcct tgccaaatga tcacaccagg cctggtgctc ctcgtcttac tacctaaact600 cactccaacc caaattcatc ccaaggacca gaatgggctg acagcctcat acagtcaggt660 tcccccatct atgacatgtt ttcacatgca tgcacacaca cacacacaca cacacacaca720 cacacacaca cacacacaca cacacaggct tcattgagct ctctggttta gcaatagccc780 aaagcaagcc atacatccat cccagttcca gaaggataag aaaaccagaa ccaagacaca840 cccacaccta ttccataccc aaccaacagc acatatggct tacacacctg agattagtgg900 ctcccatcat gtacacacac atgcacacaa aggagcccat acatacccat catttccaga960 ggtaagtatc taacctttgg atctgagata tctctgagga acaccaatgg cagagtcaac1020 cagcacctca gcctccagac taaatcctta cattttggcc caccccaagc catgagagat 1080

176 ggaggagggt ggaggcctga gctgcgggaa agcagagaca ggaagatgga ctgtttggtg agagtagtaa accagacaat ggggagacta aggcaggagt agagccccta caaggcccag agtctgcttt agagtccatg tgtcctgacc tgcccctcag atgccacaac caagatttct ggttccagag catgcatgca ggccctagaa atggacctat gagctcagag ccttcctaga 5 gagccctggg tactctctga acaaaaggca attctgtgta gaggcatcct gtggccaaag accctaagac agtcatacac acacacacac acacacacac acacacacac aacacacaca acacacacaa cacaggtagg ttttatcatg ctctttggtt tagcaatagc cctgttgatg gtgggggata ctgggtcact gtgggcactg gagtagaaag agggaatgaa cag <210> 159 <211> 1354 <212> DNA <213> Mus musculus <400> 159 gtaaatgagc tcagcacaca caatgctcct gggtcctaat ggacactggc acccatatcc atgcatccct tgtataaata aagcacccag caaagcctgg gaccatgtaa aactgtcctg gttctttcca aggtatagag catagctcac gggctgatag ttctagccag ggttggagga cagccttgtc tttaggtttc tgcactgcag gactcagagc tcatgagtca tcttggcctg ' aagagtggaa cttagcttta ggcagtatct ttcctttact tcccacaaac cagcagctgc cagacataga gataatccta ggaagcctca aatggagaag cacacaaacc cacctccctc aggctgttcc tctccccagg ccccacttct ttacctaagg gtttctctga gtctattgta gaggcacaca tggccaggga tattccggag acccttagca tccatacact caactcaggc agcttttcac aggtgaggtc tgcacatcca tacagacggc tcactcctgc ctgtgccacg tggggctgag gcacatggct cttgctgccc caagggaggg actattagat agccacagtc atgctgaatc ctgacccatt caaattagcc tgctgaacac catccagtcc atatagcaca 25 tgtatccaca tgcacgtgtg cacacacaca tttaacacac tgggacaact cctctgtgcc ctgcacagca cctacatcca gcaatgtatc accatacaca cggccaaaaa ttcaatgccc acgtttctgc catcacaaac agacacacct ttcctctctg tggccactgc attatatgct caacacaaga cctctgaagc cagatccatc tctggtacct cagggtcatg cttcaacccc acatgaatta tgcaaaccat agccataatg gtctgaatca cttcacattg gaatggtccc 30 aagatcaggc aagaaaagcc acaggctctg ttgatgactg aaggacagca aagggtcagt ccagctgtat aaccactgtt gacctgggtc acagaccctg ctgaccctcc atattctctt

1140

1200

1260

1320

1380

1440

1500

1553

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080 gtactgaatg aatgaaaaat gagacaagca tagagggccc ttgcacaatc taggtcagta 1140

177 tgaggtctac ccgaggcatc attggagtca gctggaggaa gctgagactg atgtcccaga gggaaaggaa aagaaagaag gctccaggaa gggtctgctg taccagtcag gctggagctc tctcctctac ttcatgcaaa catgtctgca tcacagggaa tctctcccag caccaaccat gttgggacaa acactgactg tcctctctgt tcag <210> 160 <211> 81 <212> DNA <213> Homo sapiens <400>160 tcgcccctgt acctggagat catcatctat tgcacagggg ccttcctcat ctcctgcatg gtggggtcgg tcatcgtcta c <210>161 <211> 90 <212> DNA <213> Mus musculus <400>161 aagataccat ctattgccac tgggattgtg ggtggcctcc tcttcatagt ggtggtggcc cttgggattg gcctattcat gcgaagacgt <210> 162 <211> 29 <212> PRT <213> Homo sapiens <400> 162

Thr His Asp Ala Leu He Vai Gly Thr Leu Ser Gly Thr He Phe Phe

5 10 15

He Leu Leu He He Phe Leu Ser Trp He He Leu Lys

1200

1260

1320

1354 <210> 163 <211> 81 <212> DNA <213> Mus musculus <400> 163

178

cgccttccac tgggggtcac	catctcctgc	ctctgcatcc	cgttgttttg	cctgttctgt	60
tacttcagca ttaccaagat	t				81
<210>	164
<211>	63
<212>	DNA
<213>	Homo sapiens
<400>	164
accatcacct tcctcaccct	cttcctgctg	agcctgttct	atagcacagc	actgaccgtg	60
acc						63
<210>	165
<211>	87
<212>	DNA
<213>	Homo sapiens
<400>	165
tggacgtgga ccggcctctg	catcttcgcc	gcactcttcc	tgctcagcgt	gagctacagc	60
gccgccatca cgctcctcat	ggtgcag				87
<210>	166
<211>	78
<212>	DNA
<213>	Homo sapiens
<400>	166
gggctgtgga cgaccatcac	catcttcatc	acactcttcc	tgttaagcgt	gtgctacagt	60
gccaccgtca ccttcttc					78
<210>	¹⁶⁷
<211>	78
<212>	DNA
<213>	Mus musculus
<400>	167
gagctgtgga ccagtatttg	tgtcttcatc	accctgttcc	tgctcagtgt	gagctatggg	60

gccactgtca ccgtcctc <210> 168 <211> 78

179

<212>	DNA
<213>	Mus	musculus
<400>	168
gggctctgga	caaccatcac catcttcatc agcctcttcc tgctcagcgt gtgttacagc	60
gcctctgtca	cactcttc	78
<210>	169

<211> 3111 <212> DNA <213> Homo sapiens <400> 169

gtgagtatca	agaggcctaa	gcaatggtaa	tctccactct	ccattcttcc	cctgtggcca	60
gacacttccc	ctggctgagt	ctctgggctt	ttatatcata	ggatgcctct	aatggcaatc	120
ctgccattag	atacacctgc	cgtggtgtat	ctgccaggta	ggcaggctag	gctgcagtaa	180
caaacaagcc	cacaatttcc	atggcttaac	actatgggaa	tatatttctt	gctcacgtaa	240
caagctaacg	tgaatgttgc	tggtttgtag	gtggtttccc	tccctgtaga	aatctgggga	300
gtgaggttct	ttccatcttg	tggtgccgtc	attctccagg	acaaagattc	ttacctactt	360
ttgtgtcctg	gtttcctttg	gcagcctggt	gaagcctatg	gacctcattt	cagaatattt	420
ttaaatacat	aaaatcccag	cctgggcaat	atagtgaaac	ccccatctgt	acaaaaatta	480
gccaggcatg	gtggcatgca	cctgtagtcc	caggtactgg	gaaggctgag	gtgggaggat	540
cacttgagcc	caggagtttg	aggctgcagt	gagccgtgat	cgtaccactt	tactcccacc	600
tgggtgacag	agcaagagcc	catctctaaa	aataaataaa	tacaatgaaa	taaaataaaa	660
taaatagaac	tacagaggaa	actaattgta	ttgaaatgca	gttataaaac	atttaaacac	720
atttttaatc	tagagatata	tgtgcttctt	tattaagatc	tataaataat	aagttctagg	780
ggtagctcgc	ataaatactg	taatttcaaa	gtagataagc	ataaataata	ctttatgata	840
ctgaaattgt	gatgtgatat	gagaatagct	gtgagttttg	ttttgctggg	gacaggatca	900
gtgatgctgt	cattactggg	gtctcttccc	tccattcttt	ttttaaaatt	gtattttatt	960
ttatttttaa	aattttaaaa	taaatagaga	cagggtatca	ctatgttgcc	caggctgctt	1020
ttgacctcct	gggctccagt	gatcttccca	tcttggcttc	ccaaagtgct	gggattacaa	1080
gtgggagcca	gtgttcctgg	ccccttcctc	cattcttaat	ggaaggagat	gctaggtgtg	1140
agaggttagg	gaaagtaaag	atgtaatttc	tttcccatcc	aagttctcag	acccctgaat	1200
tctacctgca	gccatgttgg	tccatcaacc	ccaagtgaag	aatccctgct	ctagggcccc	1260
accattgtct	gtatccagcc	agcagaagag	gcgtgattat	ggagatcaca	tctgcttctt	1320

180

gaaagcagac	agcccggaag	tgggccgcat	cacttcctct	caaattctat	tggtgaaaat	1380
ggtcacatga	ctacacatag	ccacaaagga	ggctgggaac	tttctcactt	ggaacctaca	1440
tcccagaaac	aactcttttc	agtgaggtat	cccacaggtc	tttcgcagta	gaaatattga	1500
ttatctcaca	taaaatgaag	tcttacaaat	ggacctactg	ggttttgtac	agcagccaag	1560
tgatatctct	tcccttctgc	tgtcttccct	tctgccatcc	ttcacatggt	ggcattgtat	1620
ccttagactt	gccacccatg	ccctcaggtt	ggccgttgca	cactgtctta	cataaagcag	1680
gaaggaaagg	aaaggctgct	acgagagagt	gtaccttgtg	catctctttt	ttaatcagga	1740
agcaaacatc	tttctagaag	cttccctagc	aaaattcccc	ttacatctca	ttggccaaga	1800
ctgttacatg	ttacatggtt	actgttatta	cttgctcatt	gcaaggaaga	ctgggaactc	1860
aaatgcctgg	aaaaaggaac	aggataatcg	tgattggctc	aagccttagg	gtgggcatgg	1920
ctccctgaca	agggagagag	gaaaaagctg	ttgagtgaag	aagactgctt	cagtttcccc	1980
atctgtataa	tgggaggagt	aagggctgtc	gtaaaaactc	aatgaaagaa	gattcttcaa	2040
cgtggtaggt	gcagtggcag	ctggcagtac	cctgaccctg	ccaccgcaca	gccctctcag	2100
cattgctcat	cctgcactgt	ggatatcagt	tgagccacgt	gtctcctgcc	ctgggctgtg	2160
agctccatag	gcagggtctc	catggctgta	tctccagaac	ccagcacaga	accaggtgct	2220
tgggaaagtt	ttgaattgat	tctcatctgc	cattggcatg	gggaagggaa	ctagcttgta	2280
tgaaacagat	aacaatgtat	gggaccctca	ttcattattt	cagcaaatat	ttgctgagtt	2340
cctcctacat	ggctagccct	gtgctagaca	ctggggaatc	ggcgatgaac	aaagcagata	2400
gaaatcccca	ctcttgtgga	gctgacattc	tggagggaga	gacaaaaagc	aaacatataa	2460
agaaagaaag	aaatcacatg	gatctggatg	acagtgagtg	ctgggaagaa	aataaaagca	2520
gaggaagggg	atggagcgat	gggcaggggg	caacggtagg	gagggtgtcg	gggaaaactt	2580
tttggagaat	gtgacgatga	aagtgaacaa	ggagaagtca	accgtgttga	gatgatggca	2640
gctaatgatg	tggacaggcc	actctgttct	gagtgcatta	tctattgatt	catcatgtca	2700
tcctcgcaac	agccctgcac	gatcaattct	gtcattaacc	ccatagtaca	gatgaggatg	2760
cggaggcaca	gagaagataa	gggacttgtc	ctgtgtcaca	cagcaaggag	ccatccggct	2820
cctaagttgg	tgcatttgac	ttctgtgctt	ccggaaagaa	agagcagcaa	gtttaagatc	2880
tggaggtggc	actgagcttt	ggaggagcag	ggggcaatga	ggtggccggt	gtgacgagga	2940
ctcaatgtgc	aagagggaga	gtggtgggga	gatgaggtgg	aggggtggtc	ggcggtcaga	3000
tcgtggaggg	tctcggacga	gggtcctgac	cctgggtctc	cagtcctggg	aagtggagcc	3060
caggctgtac	catggctgac	ctcagctcat	ggcttcccct	cccacttcca	g	3111
<210> 170

2093

181 <212> DNA <213> Homo sapiens <400>170 gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga60 ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac120 tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg180 tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg240 ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc300 atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct360 accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca420 ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg480 cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc540 tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc600 ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc660 tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc720 ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc780 accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt840 ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact900 ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg960 cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc1020 catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag1080 tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg1140 cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca1200 cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg1260 cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat1320 gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc1380 agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag1440 aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct1500’ cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg1560 tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc1620 tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg1680 agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt 1740

182 gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt1800 aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc1860 gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc1920 tgggtgccca ccctcagggc tggctggcgg ctccgcgcag tcccagaggg ccccggatag1980 ggtgctctgc cactccggac agcagcaggg actgccgaga gcagcaggag gctctgtccc2040 ccacccccgc tgccactgtg gagccgggag ggctgactgg ccaggtcccc cag2093 <210>171 <211> 1285.

<212> DNA <213> Homo sapiens <400>171

gtaaatgagt	gccagggccg	gcaagccccc	gctccccggg	ctctcggggt	cgcgcgagga	60
tgcttggcac	gtaccccgtg	tacatacttc	ccgggcgccc	agcatggaaa	taaagcaccc	120
agcgctgccc	tgggcccctg	cgagactgtg	atggttcttt	ccacgggtca	ggccgagtct	180
gaggcctgag	tggcatgagg	gaggcagagc	gggtcccact	gtccccacac	tggcccaggc	240
tgtgcaggtg	tgcctgggcc	gcctagggtg	gggctcagcc	aggggctgcc	ctcggcaggg	300
tgggggattt	gccagcgtgg	ccctccctcc	agcagcacct	gccctgggct	gggccacgag	360
aagccctagg	agcccctggg	gacagacaca	cagcccctgc	ctctgtagga	gactgtcctg	420
ttctgtgagc	gccctgtcct	ccgacccgca	tgcccactcg	ggggcatgcc	tagtccatgt	480
gcgtagggac	aggccctccc	tcacccatct	acccccacgg	cactaacccc	tggcagccct	540
gcccagcctc	gaacccacat	ggggacacaa	ccgactccgg	ggacatgcac	tctcgggccc	600
tgtggaggga	ctggtccaga	tgcccacaca	cacaotcagc	ccagacccgt	tcaacaaacc	660
ccgcactgag	gttggccggc	cacacggcca	ccacacacac	acgtgcacgc	ctcacacacg	720
gagcctcacc	cgggcgaacc	gcacagcacc	cagaccagag	caaggtcctc	gcacacgtga	780
acactcctca	gacacaggcc	cccacgagcc	ccacgcggca	cctcaaggcc	cacgagccgc	840
tcggcagctt	ctccacatgc	tgaccagctc	agacaaaccc	agccctcctc	tcacaaggtg	900
cccctgcagc	cgccacacac	acaggggaac	acacgccacg	tcgcgtccct	ggcactggcc	960
cacgtcccaa	tacagccctt	ccctgcagct	ggggtcacat	gaggggtggg	tttcaccatc	1020
ctcctgccct	ctggggctca	gggagggaca	cgggagacgg	ggagtgggtc	ctgctgaggg	1080
ccaggtcgct	atctagggcc	gggtgtctgg	ctgagcccca	gggccaaagc	tggtgcccag	1140
ggtggacagc	ttccgggagc	tgacctcagg	acattgttgg	cccatcccgg	ccgggcccta	1200
catcctgggc	cccgccacag	agggaatcac	ccccagaggc	ccaagcccag	ggggacacag	1260

183 cactgaccac ccccttcctg tccag1285 <210> 172 <211>6350 <212> DNA <213> Mus musculus <400>172 gtaagtcaca actgggtaag agtgtcaagc aaggacagca cttggtacct atgatagaca60 aatactcctg tttgggaaga ggaggtctgc attgtctaga taagaggaac actgtgctta120 tctgtttcag tttaaaagac agaactacat aacacttcac cctttctaca acacttagat180 ttttcagccc tctcctctat ggtgtttcct gaaccctgaa gaaagtgata tagatgttta240 tttattttct agggccactg ttccaaagaa acaatcacgt attattagca gcttgaccag300 gtgtgaattt cccccagtat ccacttctgc tccctgtggg atgaagtccc tccataagta360 aagttgaagg ctgtgggcat aaatgcaaat gcctgtaatc caattttaca agtccatgac420 atacatttaa caaacaatag cagttacttc tctactggag cctatgaact ccccagctat480 aggtttttcc cttctgcaga gcagagctta aatccaatag ggaagaagtt ggttgtaccc540 ataactgcca taccactatt acaccaataa gcacatctta catagcaaga caattagtgt600 agcactcaaa gtccatgttc aagagagaat gttggcaaca gcctatataa catctcccag660 cacagaaaag aaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag720 gaaaggaaag gaaaggaaag gaaaggaaag gaaagaaaag aaaagaaaag aaaagaaaag780 aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaagg840 aaaagaaagg aaaagaaagg aagacagcca gaaggcagct tccacttcag tcctagccca900 tgttttctat gtcttacagc caaggttagt gaagtctcta gcagtaggaa tttatcatct960 acttctggca tgcaagtaaa atcaatggtg ataacttttg tggtttgtgg ctccttggga1020 gcctccctga acaataattt atgcagaggt agcccagctt tgccactggg gcttccatta1080 aacaaacttt ggattgaggg agtgtctttt tctacctgca cacagtgatt cctatgtttt1140 aactcttaat gagtcactgt tgtttgttgt tgttgttatt gttgttgtta ttgttgttgt1200 tgttgttgtt tctatcaacc cagacactat agggctataa ggcaggtgga agcatcactg1260 gctccagctg ttctcagtca tgctcttcct atcaatgttt gtgtaatgac tgcccctttt1320 actgtcggtt ttctatgggt gcctatggat aacgctgggt tgggcgaaac ccttgatggc1380 agcttttccc actgcttgct tatccatgta ggtgagagca cattcactct cacttgagag1440 gcttaggcct ttatgaagtc tgcctgacat atgggatagg taggcttata tgcttaccca1500 tcatgcaccc atgtgctggt accataagca agatcagacc tcacctgttc atgtagcatg 1560

184

cagaggatca	gaatatttca	caagaatgcc	agaagctctc	attactctct	ggccttctct	1620
taaagatcac	atcctctaac	aaagcttacc	aaagccacta	acatctgagt	tagtcctact	1680
caggtacaca	tttcttaatg	ctccagcaaa	agcatctcta	cccacttcat	tgggcactaa	1740
acaccacttc	tcacatgttt	agagtttttt	gttaagactt	taaattatct	ttcagtcatg	1800
tctgatgttc	atgggcacct	cagccagtaa	taactgagtg	tttctggtgt	gtgcaggttt	1860
ttgtctgttt	tgtgttgttt	atatgccagg	aaaaagctgt	ttagtacaga	tctaattggc	1920
attccccttc	cttcatggtg	tggatatttc	ttttgagtta	aaacatcccc	tcttgtggca	1980
gggggagggc	tagaggtcaa	tggaatgatt	tcccgagttt	ccttggataa	atgaaacctt	2040
tgtctcaggg	aaggaagaat	ggttctactt	ctgtttctcc	acttcatgat	gctgactcta	2100
gcctcttcca	tgccccgtgt	ctccaggcta	tgaaggaatc	cagcatgctt	ttctctcttc	2160
cttccttatc	ttcttcatgg	gttccaagtg	ggttcctgtg	gtttccacag	gaaaggcttt	2220
ttagcacaaa	tctgatctgt	actgtctttc	ctttatcccc	tgccagctct	gagacagaaa	2280
gccagcatct	ctatcagaat	ctctcttttg	ccttcagaat	cagagaccac	tgtgaaaggc	2340
agcatccgtg	catctttttt	tccattgtac	tccttcatta	cgtgagcaag	atttttctaa	2400
gcagatagct	tagccttcat	cgcacatctt	agcacacact	gcaaatgtca	cacagacagc	2460
ttgctatgcc	atcccatgta	tactattttc	aaggattgca	ataccttctc	tgatctgaaa	2520
tccattcaag	taaaacaaca	tgttgcaggt	ccaattcaag	aggcatgcca	cctcatacca	2580
tataaaagaa	gatggtcagc	aaaaattcct	gctctctcag	acaactcaga	cttgggagca	2640
gaaattccta	tcacctctag	cagggagtaa	acaactacta	ctacagctgg	aagcatacta	2700
tctcctacca	taaaagatgc	tagcttctct	gacaccttag	acctgaggca	aggaatcctc	2760
tgcctcattt	ctttcgtctg	ctggaaagcc	tacaggacta	agggctgctg	taagcttgac	2820
acaagcttga	ggttgaaagg	tgtcagacag	gcttcacctg	aggggcccta	tatatgagtg	2880
tagtgaggat	ggaacaggct	acgtggggca	tcctccggca	tcttgtcctc	agagtggcct	2940
tcagagccca	ggctcaagtc	agccatactt	ccccacttag	actctggaaa	tgCcacagta	3000
tgtccacaac	ctccacaccc	agctacacaa	aattgagaga	gggacctagt	gggactgcag	3060
caatcacatg	aggccatacc	tggaccagcc	aagctgccag	tataacagtc	gtggctctga	3120
gattttgaaa	gcttggtctg	ttgtctatgc	ctcgggatct	ttgggatgcc	ttaggatcca	3180
tcgagaaagt	tctagagatc	atgcctgttt	ctggctgcac	tgtactgact	gagaacaggg	3240
gctacagcac	cactgtttct	catggcctac	ttcctgccag	gtggtgcctc	attagtactg	3300
aaaggagcct	gacctacact	tgccccaaat	tggccttttc	ttttcccctg	tggcattggt	3360
tcctcaaagg	acactaaggt	tttctcttac	ttgactccct	caggatctct	ctacagattt	3420
tcacaggtca	ctcctcagag	ctagagtcat	accagcatga	ctatcctctg	cccacattca	3480

185

	cacagcatgc ctgcctctct tctgtgcttc atcacaccaa	ttaggaagtc atctgcccct acatgtcttg cccctgagaa	tgggcatgct ctgtagtcat	cttcattagg gcctgttggt gtcccacata tcgactagca	ttgttcccac ctctccctac acacttcttc cctcctgact	3540 3600 3660 3720
gccccacttc aggtagatac caataatgtt	cccttgttct atctgcctga cttagttctg
5	tgtctctatg	atgccattct	tcccctccta	cccatccatc	accctgttgc	caaggcactc	3780
	tctgagacat	cttgtttcta	catagataca	gaagaacatt	tgattaggca	tgtaggccat	3840
	ggtgaaagaa	aaacaccaag	taaactttta	acatcacaat	tttatttaaa	actactagag	3900
	aggactcagc	aatgctcaaa	gagactaaat	tcccaggtga	aaggagatgg	gatgttgtat	3960
	tctaggcaca	gacagacaga	gcagtgggac	atatgtaatc	accaagaaat	cagccaaatt	4020
10	tttaataaac	accttagctg	ccgagaggga	tgagaacaca	gaagaatccc	aaattctgag	4080
	ccaatcacca	ctcacttaac	ctcccaccca	ggacactgct	aagcaagaaa	caccttcgag	4140
	cacagtgtgg	gcagaatatc	catcttgtac	cagctccaag	gcctgctgaa	tataagggtt	4200
	atcccaaagc	acctagagcc	agaagtcaac	tatgataccc	cagctccagc	acagctcagt	4260
	tcccagttcc	aaaaaacagg	tcttccatgc	ctggtggata	agatgatatg	cacttgtatc	4320
15	tcacccccag	actctacaat	ccatgtatat	acaatgccta	gcatgcaatc	agtaattaca	4380
	agatacaaat	gattgataac	caagacagag	acagtacatg	ggattagacc	tgaggtacgg	4440
	gaaaggttgg	gaaagcattc	atagtgtccc	ttgctacaag	aagtcccaga	gctttgcagg	4500
	gtgtgagcag	attctaacct	cccccattgg	caagtcttct	caaagctgct	tctgctacta	4560
	gagaaccctc	tttcccagcc	acctgccact	atttatcact	tatctgagtt	ttccccatga	4620
20	ttctaggatg	ctaccacctc	ctgcctgagt	cagacggtcc	ttccaggaga	cctgatggtc	4680
	ctgcccttgc	ctgagacctt	tctaggctga	atggtcatca	tgtccactgt	ctggttagct	4740
	tggttgcctc	tgtgttaagt	tgcttcatac	tacatgtagc	aaggaaagtt	acctttccac	4800
	ttctcaggac	actgtaaaga	agcacttctg	taaattatag	tgagaaacga	tcaataataa	4860
	atgaaatgaa	caaacataaa	cctctcttat	ctctatggga	cctgccctaa	ggcctcttgt	4920
25	ggatgcctga	aaccttgagt	gttcttaagc	catgtgtcac	ttcagtcatt	aacctgtggc	4980
	tgaggtggat	cctgactgac	aaacagacag	gcatgtagac	agcttgaagc	ctggacaaag	5040
	agaaggttga	•cgttccaggc	aaagcaagag	cctatcacat	tgttccaaag	tgtgtgattt	5100
	agaatcagaa	gatttcttgt	ttaaaatata	ctcaaaaagt	tataaaatat	cagccaggac	5160
	tagtcataaa	gcttaaatct	gagagagaga	gagagagaga	gagagagaga	gagaggtgtt	5220
30	catgtatata	catatgtgtg	tgtgtgtata	tatatgtatg	tatatgtatg	tatatgtgta	5280
	tattggtgtt	tgggtgtcag	attccctgga	attaaagtta	taaacagtta	tgagctgcaa	5340
	agtaggcttt	ccaatgtctt	gttctccaac	cataggtaat	tgaaactgga	aactacaggt	5400

186

aaaggaggct	gccaagtgtt	tcttattatg	ctaagattca	gtgttctaca	atattcacat	5460
gatttcactt	tgatatggtg	aaatgccttt	aggccaacgc	atccacagac	ttcacagtga	5520
ccccagctga	gcttacatat	aatgtcaaac	agcacttgtt	gaatagatac	ccaggcagcc	5580
ctgtgaccca	tggtgttttc	cttaattctt	cccatctgcc	ttggactttc	acaccttgag	5640
ttgagatgtg	ctttctgtag	aaatgtattt	ccctaggtct	gtacatcagc	caccaccctt	5700
tctgatcttg	gaccatactt	cagtctccag	ctgggatatt	catatgcatg	cttagatatg	5760
gcataaccat	cgttaacgtc	ttctgttacc	tttaggatta	agttaccgta	gctaggatgc	5820
tttccaatct	ctccctccat	ttgcaaaggc	tcagggttcc	ttctgactct	ggagtagtac	5880
tctttcccaa	tgagtgcacc	atgaccacta	ttcttcctta	gaatgttact	cccctttctc	5940
tgcctttttc	atggcacatc	tttctgagaa	aacctacctg	gtctagctgc	tctttctggg	6000
tcttcttaag	tagtaaccta	actcctgcac	catccgtgtg	gcagtgacat	agatccacat	6060
caggtttgga	ttcagatatt	ccaatcccat	gcagaccaat	ctatgtgtga	gattccagga	6120
tccagcaggc	tggggcatgg	gttgaggggt	aggattcttt	ggggcaaagt	ggttagtagg	6180
cacttgggac	tggaagtgat	aagtattagc	gggaggaggg	catatgatca	aaacattgct	6240
gctggatgtg	aaagctgtac	cttcaggttc	agtgttcagg	agaccaggtt	aataagaaat	6300
gatctttctg	tagggtggag	accttctcat	gagcactagt	tcttccctag		6350

<210> 173 <211> 1739 <212> DNA <213> Mus nusculus <400> 173

gtaacacctc	cctccatccc	tcctaggcct	ccatgtagct	gtggtgggga	aggtggatga	60
cagacatccg	ctcactgttg	taacaccagg	aagctacccc	aataaacact	cagtgcctga	120
ttagagccct	gggtgcctgt	tcttggggaa	ggcaggttat	gggcagaaat	atcttggcct	180
gaaagaaggg	acaccccaag	agaaggacag	gagtgaagca	tggctcaccc	atctgtctat	240
gtgttggata	tttgacaaat	aggacatcac	aggacttcag	cataggtacc	cctggtcctt	300
cctgctcttc	actggatatc	atgcacctga	tctctagaga	tgcagctaaa	atgagccagt	360
ctgggaaacc	tcagcaccca	cctctcagtc	ttgcaagctc	ctgctcccag	acattcctgg	420
atactaaacc	ccttcaggta	gagaaacagc	caaagtcaac	atctaggacg	caggactcaa	480
catggtcctg	ctccttccct	ctctactcaa	cagccattga	ggctgagccc	accgccccaa	540
ccgcctgcct	tgccaaatga	tcacaccagg	cctggtgctc	ctcgtcttac	tacctaaact	600
cactccaacc	caaattcatc	ccaaggacca	gaatgggctg	acagcctcat	acagtcaggt	660

187

tcccccatct	atgacatgtt	ttcacatgca	tgcacacaca	cacacacaca	cacacacaca	720
cacacacaca	cacacacaca	cacacaggct	tcattgagct	ctctggttta	gcaatagccc	780
aaagcaagcc	atacatccat	cccagttcca	gaaggataag	aaaaccagaa	ccaagacaca	840
cccacaccta	ttccataccc	aaccaacagc	acatatggct	tacacacctg	agattagtgg	900
ctcccatcat	gtacacacac	atgcacacaa	aggagcccat	acatacccat	catttccaga	960
ggtaagtatc	taacctttgg	atctgagata	tctctgagga	acaccaatgg	cagagtcaac	1020
cagcacctca	gcctccagac	taaatcctta	cattttggcc	caccccaagc	catgagagat	1080
ggaggagggt	ggaggcctga	gctgcgggaa	agcagagaca	ggaagatgga	ctgtttggtg	1140
agagtagtaa	accagacaat	ggggagacta	aggcaggagt	agagccccta	caaggcccag	1200
agtctgcttt	agagtccatg	tgtcctgacc	tgcccctcag	atgccacaac	caagatttct	1260
ggttccagag	catgcatgca	ggccctagaa	atggacctat	gagctcagag	ccttcctaga	1320
gagccctggg	tactctctga	acaaaaggca	attctgtgta	gaggcatcct	gtggccaaag	1380
accctaagac	agtcatacac	acacacacac	acacacacac	acacacacac	aacacacaca	1440
acacacacaa	cacaggtagg	ttttatcatg	ctctttggtt	tagcaatagc	cctgttgatg	1500
gtgggggata	ctgggtcact	gtgggcactg	gagtagaaag	agggaatgaa	cagtcagtgg	1560
ggaaaggaca	tctgcctcta	gggctgaaca	gagactggag	cagtctcaga	gcaggtggga	1620
tggggacctc	tgccactcta	gcttcatcag	aactgcatga	gacaagtatg	gggtctaccc	1680
cctccccact	gtcacctgga	gtctggggaa	gctaactggc	tggtcccacc	ccatcccag	1739

<210> 174 <211> 93 <212> DNA <213> Homo sapiens <400> 174

ttcgagcagc	acctcctgct	gggcgtcagc	gtttcctgca ttgtcatcct ggccgtctgc	60
ctgttgtgct	atgtcagcat	caccaagatt	aag	93
<210>	175
<211>	78
<212>	DNA				-
<213>	Homo sapiens
<400>	175

gggctgtgga cgaccatcac catcttcatc acactcttcc tgctaagcgt gtgctacagt 60 gccaccgtca ccttcttc

188 <210> 176 <211> 84 <212> DNA <213> Mus musculus <400> 176 ggcctgtggc ccacaatgtg caccttcgtg gccctcttcc tgctcacact gctctacagt 60 ggcttcgtca ccttcatcaa ggta 84

Claims

1. Ácido nucléico compreendendo, na direção 5' a 3':

a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada em fase de leitura,

b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação,

c) um terceiro ácido nucléico que codifica:

2. Célula eucariótica compreendendo um ácido nucléico de acordo com a reivindicação 1.

3. Célula eucariótica, de acordo com a reivindicação 2, caracterizada pelo fato de que a dita célula eucariótica é selecionada do grupo que consiste em células CHO, células NSO, células Sp2/0, células COS, K562 cells, células BHK, células PER.C6®, e células HEK.

4. Vetor compreendendo, na direção 5' a 3':

a) um primeiro sítio de clonagem múltipla,

b) um ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', em que:

i) o dito ácido nucléico compreende um códon de parada e um sinal de poliadenilação, e ii) o dito ácido nucléico não é constitutivamente removido durante o processamento de pré-mRNA,

c) um segundo sítio de clonagem múltipla.

5. Método para seleção de uma célula eucariótica que expresse um polipeptídio heterólogo, em que o método compreende:

b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, processamento do dito pré-mRNA, e a tradução do dito mRNA processado em um polipeptídio, em que a dita célula transfectada produz polipeptídio heterólogo solúvel e polipeptídio heterólogo ligado a membrana plasmática por splicing alternativo do dito pré-mRNA, e

6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que o dito polipeptídio heterólogo é selecionado do grupo de polipeptídios compreendendo hormônios; citocinas; interleucinas; imunoglobulinas; peptídios antifusogênicos; fatores de crescimento; ligantes, agonistas ou antagonistas de receptores; agentes citotóxicos; agentes antivirals; agentes de formação de imagem; inibidores de enzimas; ativadores de enzimas ou moduladores da atividade de enzimas como substâncias alostéricas; assim como fragmentos e suas fusões.

7. Método, de acordo com qualquer uma das reivindicações 5 ou

6, caracterizado pelo fato de que:

i) o dito primeiro ácido nucléico codifica pelo menos um fragmento de um domínio C_H3 ou C_H4 de cadeia pesada de imunoglobulina, ii) o dito segundo ácido nucléico começa com o sítio doador de splice 5' de um éxon de domínio Ch3 ou Ch4 de cadeia pesada de imunoglobulina e terminado pelo sítio receptor de splice 3' do éxon M1 do domínio transmembrana de cadeia pesada de imunoglobulina sucessivo, iii) o dito terceiro ácido nucléico é pelo menos um fragmento de um domínio transmembrana de imunoglobulina.

8. Método, de acordo com qualquer uma das reivindicações de 5 a 6, caracterizado pelo fato de que o dito segundo ácido nucléico é obtido a partir do ácido nucléico que codifica um polipeptídio ou proteína selecionada do grupo que compreende o receptor C3b/C4b; EGFR humano, de galinha e de rato; FGFR; cadeia pesada α, ε, γ, μ de imunoglobulina humana e de camundongo; receptor PLA2 humano; Cek5 de galinha; cadeia a do receptor de fator inibidor de leucemia de camundongo.

9. Método para a produção de um polipeptídio ou proteína heteróloga codificada pelo ácido nucléico de acordo com a reivindicação 1, compreendendo:

a) o fornecimento de uma célula eucariótica,

b) a transfecção da dita célula eucariótica com 0 ácido nucléico de acordo com a reivindicação 1,

c) o cultivo da dita célula transfectada sob condições adequadas para a expressão do dito ácido nucléico,

d) a recuperação do dito polipeptídio ou proteína do meio de cultura ou do citoplasma das células.

10. Kit para a fabricação de uma célula de acordo com a reivindicação 2, compreendendo um vetor de acordo com a reivindicação 4.