BRPI0712073B1 - ácido nucléico para produção de um polipeptíedeo ou proteína heteróloga - Google Patents

ácido nucléico para produção de um polipeptíedeo ou proteína heteróloga Download PDF

Info

Publication number
BRPI0712073B1
BRPI0712073B1 BRPI0712073-7A BRPI0712073A BRPI0712073B1 BR PI0712073 B1 BRPI0712073 B1 BR PI0712073B1 BR PI0712073 A BRPI0712073 A BR PI0712073A BR PI0712073 B1 BRPI0712073 B1 BR PI0712073B1
Authority
BR
Brazil
Prior art keywords
nucleic acid
heavy chain
seq
cells
cell
Prior art date
Application number
BRPI0712073-7A
Other languages
English (en)
Inventor
Kopetzki Erhard
Tiefenthaler Georg
Endl Josef
Ploettner Olivier
Schwarz Ursula
Original Assignee
Hoffmann La Roche
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hoffmann La Roche filed Critical Hoffmann La Roche
Publication of BRPI0712073A2 publication Critical patent/BRPI0712073A2/pt
Publication of BRPI0712073B1 publication Critical patent/BRPI0712073B1/pt
Publication of BRPI0712073B8 publication Critical patent/BRPI0712073B8/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/06Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies from serum
    • C07K16/065Purification, fragmentation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

células produtoras de polipeptídio. a presente invenção descreve um ácido nuclélco compreendendo, na direção 5' a 3': a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada em fase de leitura, b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, e c) um ácido nucléico que codifica i) pelo menos um fragmento de um domínio transmembrana, ou ii) um peptídio de sinal para uma âncora gpi.

Description

Relatório Descritivo da Patente de Invenção para CÉLULAS PRODUTORAS DE POLIPEPTÍDIO.
A presente invenção se refere ao campo da produção de polipeptídios. Descreve um ácido nucléico compreendendo um ácido nucléico de splicing alternativo, células compreendendo esse ácido nucléico, um método para o isolamento de células que expressem um polipeptídio heterólogo, que utiliza um ácido nucléico compreendendo um primeiro ácido nucléico que codifica um polipeptídio heterólogo, um segundo ácido nucléico compreendendo um ácido nucléico de splicing alternativo e um terceiro ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou um peptídio de sinal para uma âncora GPI, e também um método para a produção de polipeptídios heterólogos.
Fundamentos da Invenção
Sistemas de expressão para a produção de polipeptídios recombinantes são bem conhecidos no estado da técnica e são descritos por, por exemplo, Marino, M.H., Biopharm. 2 (1989) 18-33; Goeddel, D.V., et al., Methods Enzymol. 185 (1990) 3-7; Wurm, F., e Bernard, A., Curr. Opin. Biotechnol. 10 (1999) 156-160. Para a produção de polipeptídios e proteínas usadas em aplicações farmacêuticas, empregam-se, de preferência, células hospedeiras de mamíferos, como células CHO, células BHK, células NSO, células Sp2/0, células COS, células HEK, células PER.C6® e outras. O ácido nucléico que codifica o polipeptídio é de preferência introduzido na célula hospedeira compreendido em um ácido nucléico, como, por exemplo, um vetor de expressão. Os elementos essenciais de um vetor de expressão são uma unidade de propagação de plasm ídio procariótico, por exemplo, para Escherichia coli, compreendendo uma origem de replicação e um marcador de seleção, um marcador de seleção eucariótica e um ou mais cassetes de expressão para a expressão do(s) gene(s) estrutural(ais) de interesse, cada um compreendendo um promotor, um gene estrutural e um terminador de transcrição, incluindo um sinal de poliadenilação. Para expressão transitória em células de mamíferos, pode-se incluir uma origem de replicação de mamífero, como a SV40 Ori ou OriP de EBV. Como promotor, pode-se selecio2 nar um promotor constitutivo ou induzível. Para transcrição otimizada, podese incluir uma seqüência Kozak na região não traduzida 5'. Para processamento de mRNA, em particular terminação de transcrição e splicing prémRNA, podem-se incluir sinais de splicing de mRNA, dependendo da orga5 nização do gene estrutural (organização éxon-íntron), assim como um sinal de poliadenilação.
A expressão de um gene é realizada como expressão transitória ou permanente. O(s) polipeptídio(s) de interesse pode(m) ser um polipeptídio secretado, contendo uma extensão N terminal (também conhecida como o 10 sinal de seqüência), que é necessária para o transporte/secreção do polipeptídio através da célula e para o meio extracelular, ou pode ser um polipeptídio citosólico.
Para a produção em grande escala de um polipeptídio, tem de se estabelecer uma linhagem celular altamente produtora. Após a transfec15 ção de uma linhagem de células hospedeiras, como células CHO, células NSO, células Sp2/0, células BHK, células COS, células PER.C6®, ou células HEK, em geral uma pluralidade de clones com diferentes características são obtidos devido a, por exemplo, a ampla diferença de polipeptídios expressados por plasm ídios transitoriamente transfectados ou integrados de maneira 20 estável. Para fins de seleção, o ácido nucléico introduzido nas células possui, além disso, um marcador selecionável, por exemplo, um gene que confere resistência contra uma substância de outra forma fatal.
Após a transfecção e por crescimento em um meio seletivo apropriado, um clone altamente produtor tem de ser isolado. Isso é demorado 25 e, conseqüentemente, caro. Foram desenvolvidos vários métodos para lidar com esse problema.
Um desses métodos é a amplificação de gene. Nele, células deficientes da enzima diidrofolato redutase (DHFR) são transfectadas com um vetor/plasmídio que contém um primeiro cassete de expressão para a ex30 pressão da proteína DHFR e um segundo cassete de expressão para a expressão de um polipeptídio heterólogo de interesse. Usando-se um meio de cultura depletado de glicina, hipoxantina e timidina, estabelecem-se condi ções seletivas de crescimento. Para a amplificação, adiciona-se um inibidor de DHFR, metotrexato (MTX) (Kaufman, R.J., et al., J. Mol. Biol. 159 (1982) 601-621; US 4.656.134).
Alternativamente, moléculas repórteres, como cloranfenicolacetil-transferase, luciferase, proteína fluorescente verde ou betagalactosidase, podem ser fusionadas ao polipeptídio heterólogo para o qual se deseja uma linhagem celular altamente produtora, e usadas como um marcador de seleção indireta. A seleção ocorre na presença de um substrato ou co-fator exógeno adicionado.
Um método adicional para a identificação de um clone altamente produtor é uma transcrição ligada de um gene de marcador selecionável e um gene estrutural que codifica um polipeptídio heterólogo mediante um sítio de entrada em ribossomo interno (IRES). Com esse projeto, a expressão do polipeptídio heterólogo jpode ser correlacionada com a expressão do marcador selecionável.
Imunoglobulinas humanas são produzidas por linfócitos especializados: as células B. Essas células não apenas secretam imunoglobulinas (slg), elas também apresentam imunoglobulinas em sua membrana celular externa como imunoglobulinas ligadas à membrana plasmática (mlg). Essas mlg's desempenham um importante papel no início de uma resposta imunológiea. As imunoglobulinas ligadas à membrana plasmática apresentadas têm a função de receptores celulares para seus antígenos correspondentes.
Começando em 1980, foram publicados artigos tratando da origem de formas secretadas e ligadas a membrana plasmática de imunoglobulinas. Early et al. (Early, P., et al., Cell 20 (1980) 313-319) relataram que, em camundongos, duas espécies de mRNA que codificam a cadeia pesada de imunoglobulinas se originam do mesmo transcrito primário de um único gene μ de imunoglobulina. A formação das formas secretada (slg) e ligada a membrana plasmática (mlg) resulta do splicing alternativo do pré-mRNA de cadeia pesada. Para a isoforma slg, todos os éxons que codificam os domínios da imunoglobulina e o íntron após o éxon que codifica o domínio C terminal são retidos no mRNA, e o sinal de poliadenilação que se localiza a jusante do códon de parada no intron é usado para divagem e poliadenilação do transcrito primário. Para a isoforma mlg, um sítio doador de splice 5' alternativo depois do éxon que codifica o domínio C terminal da forma secretada (isto é, CH3 ou CH4, respectivamente) liga a região constante aos éxons a jusante Ml e M2 que codificam um domínio transmembrana. Nesse caso, a seqüência que codifica os aminoácidos terminais e o códon de parada da forma secretada, assim como o sinal de poliadenilação intrônico adjacente para a forma slg são removidos pelo splicing juntamente com o íntron.
Por exemplo, a razão entre o mRNA que codifica a forma de cadeia pesada da imunoglobulina secretada e o mRNA que codifica a forma de cadeia pesada da imunoglobulina ligada a membrana plasmática é de 10:1 a 100:1. Essa razão é estabelecida principalmente durante o splicing prémRNA. Os mecanismos de controle de tradução e pós-tradução contribuem apenas em pequena medida (veja, por exemplo, Xiang, S. D., et al., Immun. Cell Biol. 79 (2001) 472-481).
A imunoglobulina ligada à membrana plasmática da célula tem a mesma seqüência de aminoácidos e estrutura secundária que seu análogo secretado. A diferença é uma extensão C terminal da cadeia pesada de slg compreendendo um domínio transmembrana. Esse domínio transmembrana tem, em geral, um comprimento entre aproximadamente 40 e aproximadamente 75 resíduos de aminoácidos. Para imunoglobulinas murídeas e humanas, o domínio transmembrana pode ser subdividido em três regiões estruturais distintas: uma região extracelular N terminal de 13-67 resíduos de aminoácidos, um trecho transmembrana conservado central de 25 resíduos de aminoácidos, e uma região citoplasmática C terminal de 3 - 28 resíduos de aminoácidos (Major, J.G., et al., Mol. Immunol. 33 (1996) 179-187).
Vetores de expressão compreendendo um gene selecionável amplificável, um gene de proteína fluorescente e um gene que codifique um produto desejado de maneira que otimize a ligação transcricional e de tradução é relatado em WO 01/04306. Em WO 01/38557, relata-se um método para a triagem de múltiplas células transformadas/transfectadas para identificar células que expressem pelo menos dois peptídios ou proteínas de inte resse. Esses dois peptídios/proteínas estão ligados mediante um IRES (sítio de entrada em ribossomo interno) a um gene de marcador fluorescente.
Animais e células transgênicas que compreendem um transgene marcador de formação de imagem são relatados no pedido de patente norteamericana 2003/0033616. O pedido de patente norte-americana 2005/0032127 relata um método para a seleção não invasiva de células vivas únicas sob condições suaves a partir de misturas de células ou culturas celulares, com relação a um desempenho de produção específico, por métodos de detecção de fluorescência-microscópicos. Um método para a identificação e isolamento de células que produzem proteínas secretadas é relatado no pedido de patente norte-americana 2002/0168702.
Um vetor de expressão consistindo em um gene que codifica uma proteína de interesse que esteja funcionalmente ligada a um promotor de hamster, um gene que codifica uma proteína fluorescente e, de preferência, um gene marcador de seleção amplificável é relatado no pedido de patente norte-americana 2004/0148647.
Sumário da Invenção
A presente invenção compreende um ácido nucléico compreendendo na direção 5' a 3':
a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura,
b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, e
c) um terceiro ácido nucléico que codifica:
i) pelo menos um fragmento de um domínio transmembrana, ou ii) um peptídio de sinal para uma âncora GPI.
Aspectos adicionais da presente invenção são um vetor adequado para células eucarióticas, compreendendo o ácido nucléico da invenção, e uma célula eucariótica, compreendendo pelo menos um ácido nucléico de acordo com a invenção.
A presente invenção também compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio heterólogo, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilaÇão, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA e a tradução do dito mRNA processado em um polipeptídio, em que a dita célula transfectada produz polipeptídio heterólogo solúvel e polipeptídio heterólogo ligado a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com polipeptídio heterólogo ligado a membrana plasmática para ser a dita célula que expressa um polipeptídio heterólogo.
Em uma modalidade, o método da invenção é para a seleção de uma célula eucariótica que expresse uma imunoglobulina, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica pelo menos um fragmento de uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz cadeia pesada de imunoglobulina solúvel e cadeia pesada de imunoglobulina ligada a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com cadeia pesada de imunoglobulina ligada a membrana plasmática para ser a dita célula que expressa uma imunoglobulina.
A presente invenção também compreende um método para a produção de um polipeptídio codificado por um ácido nucléico de acordo com a invenção, por:
a) fornecimento de uma célula eucariótica,
b) transfecção da dita célula eucariótica com um ácido nucléico de acordo com a invenção,
c) cultivo da dita célula transfectada sob condições adequadas para a expressão do dito ácido nucléico,
d) recuperação do dito polipeptídio do meio de cultura ou do citoplasma da dita célula.
A presente invenção também compreende um ácido nucléico compreendendo, na direção 5' a 3':
a) um primeiro sítio de clonagem múltipla,
b) um ácido nucléico começando com um sítio doador de splice
5' e terminado por um sítio receptor de splice 3', em que:
i) o dito ácido nucléico compreende um códon de parada de tradução e um sinal de poliadenilação, e ii) o dito ácido nucléico não é constitutivamente removido durante o processamento de pré-mRNA,
c) um segundo sítio de clonagem múltipla.
A invenção também compreende um vetor compreendendo o ácido nucléico não removido constitutivamente de acordo com a invenção. Descrição Detalhada da Invenção
A presente invenção compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio ou proteína heteróloga, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica um polipeptídio ou proteína heteróloga sem um códon de parada de tradução, ii) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em um polipeptídio ou proteína, em que a dita célula transfectada produz polipeptídio ou proteína heteróloga solúvel e polipeptídio ou proteína heteróloga ligada a membrana plasmática por splicing alternativo do dito pré-mRNA,
c) a seleção de uma célula com polipeptídio ou proteína heteróloga ligada a membrana plasmática para ser a dita célula que expressa um polipeptídio ou proteína heteróloga.
Métodos e técnicas utilizáveis para a realização da presente invenção são descritos em, por exemplo, Ausubel, F.M. (ed.), Current Protocols in Molecular Biology, Volumes I a III (1997); Glover, N.D., e Hames, B.D., ed., DNA Cloning: A Practical Approach, Volumes I e II (1985), Oxford University Press; Freshney, R.l. (ed.), Animal Cell Culture - a practical approach, IRL Press Limited (1986); Watson, J.D., et al., Recombinant DNA, Segunda Edição, CHSL Press (1992); Winnacker, E.L., From Genes to Clones; N.Y., VCH Publishers (1987); Celis, J., ed., Cell Biology, Segunda Edição, Academic Press (1998); Freshney, R.I., Culture of Animal Cells: A Manual of Basic Technique, Segunda Edição, Alan R. Liss, Inc., N.Y. (1987).
O uso de tecnologia de DNA recombinante permite a produção de inúmeros derivados de um polipeptídio. Esses derivados podem, por exemplo, ser modificados em posições de aminoácidos individuais ou várias por substituição, alteração, troca, deleção ou inserção. A modificação ou derivatização pode, por exemplo, ser realizada por meio de mutagênese direcionada a sítio. Essas modificações podem ser facilmente realizadas por aqueles versados na técnica (veja, por exemplo, Sambrook, J., et al., Molecular Cloning: A laboratory manual (1999) Cold Spring Harbor Laboratory Press, New York, USA; Hames, B. D., e Higgins, S.G., Nucleic acid hybridization - a practical approach (1985) IRL Press, Oxford, England).
Dentro do âmbito da presente invenção, alguns dos termos usados são definidos a seguir:
Um ácido nucléico, conforme aqui usado, refere-se a uma molécula de polinucleotídeo, por exemplo, a tipos de DNA e/ou RNA. Essa molécula de polinucleotídeo pode ser uma molécula de polinucleotídeo de ocorrência natural ou uma molécula de polinucleotídeo sintética ou uma combinação de uma ou mais moléculas de polinucleotídeo de ocorrência natural ou seus fragmentos com uma ou mais moléculas de polinucleotídeo sintéticas. Também estão englobadas por esta definição moléculas de polinucleotídeo de ocorrência natural em que um ou mais nucleotídeos tenham sido trocados, por exemplo, por mutagênese, deletados ou acrescentados. O áci do nucléico pode ser isolado ou integrado em outro ácido nucléico, por exemplo, em um vetor de expressão ou no cromossomo de uma célula hospedeira eucariótica. Um ácido nucléico também é caracterizado por sua seqüência de ácido nucléico, que consiste em nucleotídeos individuais. Sabese na técnica como deduzir uma seqüência de aminoácidos a partir do ácido nucléico codificador correspondente e também como derivar um ácido nucléico correspondente a partir da seqüência de aminoácidos codificada. Assim, uma seqüência de aminoácidos também é caracterizada por seu ácido nucléico. Da mesma forma,, um ácido nucléico é dado por uma seqüência de aminoácidos correspondente.
As expressões plasmídio ou vetor, que são usadas de maneira intercambiável neste pedido, incluem, por exemplo, plasmídios bifuncionais e de expressão, assim como plasmídios de transfecção. Tipicamente, o plasmídio também compreenderá uma origem de replicação (por exemplo, a origem de replicação ColEI e oriP) e um marcador selecionável (por exemplo, um gene de resistência a ampicilina ou tetraciclina) para replicação e seleção, respectivamente, do plasm ídio em bactérias.
Um cassete de expressão refere-se a um construto que contém os elementos reguladores necessários para a expressão pelo menos do gene estrutural contida em uma célula. Opcionalmente, estão contidos elementos adicionais que permitem a secreção do polipeptídio ou proteína expressada.
Um gene designa um segmento, por exemplo, em um cromossomo ou em um plasm ídio, que é necessário para a expressão de um polipeptídio ou proteína. Além da região codificadora, o gene compreende outros elementos funcionais, incluindo um promotor, um ou mais introns e/ou éxons e um ou mais terminadores.
O termo gene estrutural, conforme usado neste pedido, designa a região codificadora de um gene, isto é, os éxons, sem uma seqüência de sinal, mas com introns intervenientes.
Um marcador selecionável designa um gene que permite que células portadoras do gene sejam especificamente selecionadas para ou contra, na presença ou ausência de um agente de seleção correspondente. Um marcador selecionável positivo utilizável é um gene de resistência a antibiótico. Esse marcador selecionável permite que a célula hospedeira transformada com o gene seja positivamente selecionada na presença do antibiótico correspondente; uma célula hospedeira não transformada não seria capaz de crescer ou sobreviver sob as condições de cultura seletivas, isto é, na presença do agente de seleção, em um meio seletivo.
Marcadores selecionáveis podem ser positivos, negativos ou bifuncionais. Marcadores selecionáveis positivos permite a seleção de células portadoras do marcador, ao passo que marcadores selecionáveis negativos permitem que células portadoras do marcador sejam seletivamente eliminadas. Tipicamente, um marcador selecionável conferirá resistência a um fármaco ou compensará um defeito metabólico ou catabólico na célula hospedeira. Marcadores selecionáveis utilizáveis com células eucarióticas incluem, por exemplo, os genes da aminoglicosida fosfotransferase (ΑΡΗ), como higromicina fosfotransferase (hyg), neomicina e G418 APH, diidrofolato redutase (DHFR), timidina quinase (tk), glutamina sintetase (GS), asparagina sintetase, triptofano sintetase (agente seletivo indol), histidinol desidrogenase (agente seletivo histidinol D), e genes que codificam resistência a puromicina, bleomicina, fleomicina, cloranfenicol, Zeocin e ácido micofenólico. Genes marcadores adicionais são descritos no WO 92/08796 e WO 94/28143.
Elementos reguladores, conforme aqui usado, referem-se a seqüências nucleotídicas presentes em cis e/ou trans, necessárias para a transcrição e/ou tradução do gene compreendendo o gene estrutural de interesse. Os elementos reguladores transcricionais normalmente compreende um promotor a montante da seqüência de gene a ser expressada, sítios de início e término de transcrição e uma seqüência de sinal de poliadenilação. O termo sítio de início de transcrição refere-se ao nucleotídeo no gene que corresponde ao primeiro ácido nucléico a ser incorporado no transcrito primário, isto é, o pré-mRNA; o sítio de início de transcrição pode se superpor à seqüência promotora. O termo sítio de término de transcrição refere-se a uma seqüência nucleotídica normalmente presente na extremidade 3' de um gene de interesse a ser transcrito, que faz com que a RNA polimerase termine a transcrição. A seqüência de sinal de poliadenilação, ou sinal de adição de poli-A fornece o sinal para a divagem em um sítio específico na extremidade 3' de um mRNA eucariótico e a adição pós-transcricional de uma se5 qüência de cerca de 100 - 200 nucleotídeos adenina (cauda poliA) à extremidade 3' clivada no núcleo. A seqüência de sinal de poliadenilação pode incluir a seqüência de consenso AATAAA localizada cerca de 10 - 30 nucleotídeos a montante do sítio de divagem.
Elementos reguladores de tradução incluem um códon de início 10 de tradução (AUG) e um de parada (TAA, TAG ou TGA). Um sítio de entrada em ribossomo interno (IRES) pode ser incluído em alguns construtos.
Um promotor refere-se a uma seqüência de polinucleotídeo que contra a transcrição de um gene ou seqüência de ácido nucléico à qual está operacionalmente ligado. Um promotor inclui sinais para a ligação de 15 RNA polimerase e início de transcrição. O promotor usado será funcional no tipo de célula da célula hospedeira em que se considera a expressão da seqüência selecionada/operacionalmente ligada. Um grande número de promotores, incluindo promotores constitutivos, induzíveis e reprimíveis de várias fontes diferentes, são conhecidos na técnica (e estão identificados em 20 bases de dados como o GenBank) e estão disponíveis como ou dentro de polinucleotídeos clonados (por exemplo, de depositários como a ATCC, assim como outras fontes comerciais ou individuais). Um promotor compreende uma seqüência nucleotídica que dirige a transcrição de um gene estrutural. Tipicamente, um promotor está localizado na região não codificadora 5' 25 ou não traduzida de um gene, proximal ao sítio de início de transcrição de um gene estrutural. Elementos de seqüência dentro de promotores que funcionam no início da transcrição são freqüentemente caracterizados por seqüências nucleotídicas de consenso. Esses elementos promotores incluem sítios de ligação de RNA polimerase, seqüências TATA, seqüências CAAT, 30 elementos específicos para diferenciação (DSEs; McGehee, R.E. Jr., et al., Mol. Endocrinol. 7 (1993) 551-60), elementos de resposta a AMP cíclico (CREs), elementos de resposta sérica (SREs; Treisman, R., Seminars in
Cancer Biol. 1 (1990) 47-58), elementos de resposta a glicocorticóides (GREs) e sítios de ligação para outros fatores de transcrição, como CRE/ATF (O'Reilly, M.A., et al., J. Biol. Chem. 267 (1992) 19938- 43), AP2 (Ye, J., et al., J. Biol. Chem. 269 (1994) 25728-34), SPI, proteína de ligação a elemento de resposta a cAMP (CREB; Loeken, M.R., Gene Expr. 3 (1993) 253-64) e fatores de octâmeros (veja, genericamente, Watson et al., eds., Molecular Biology of the Gene, 4- ed., The Benjamin/Cummings Publishing Company, Inc. (1987), e Lemaigre, F.P. e Rousseau, G.G., Biochem. J. 303 (1994) 1-14). Se um promotor for um promotor induzível, então, a taxa de transcrição aumenta em resposta a um agente indutor. Em contraste, a taxa de transcrição não é regulada por um agente indutor, se o promotor for um promotor constitutivo. Também se conhecem promotores reprimíveis. Por exemplo, o promotor c-fos é especificamente ativado por ligação do hormônio de crescimento a seu receptor na superfície celular. A expressão regulada por tetraciclina (Tet) pode ser conseguida por promotores híbridos artificiais, que consistem, por exemplo, em um promotor CMV seguido por dois sítios Tet-operadores. O Tet-repressor se liga a dois sítios Tet-operadores e bloqueia a transcrição. Com a adição do indutor tetraciclina, o Tet-repressor é liberado dos sítios Tet-operadores, e a transcrição prossegue (Gossen, M. e Bujard, H. PNAS 89 (1992) 5547-5551). Para outros promotores induzíveis, incluindo metalotioneína e promotores de choque térmico, veja, por exemplo, Sambrook et al. (supra) e Gossen et al., Curr. Opin. Biotech. 5 (1994) 516-520. Entre os promotores eucarióticos que foram identificados como promotores fortes para expressão de alto níveis estão o promotor precoce SV40, promotor tardio maior de adenovirus, promotor de metalotioneína-l de camundongo, repetição terminal longa do vírus do sarcoma de Rous, fator 1 alfa de alongamento de hamster chinês (CHEF-I, veja, por exemplo, US 5.888.809), EF-I alfa humano, ubiquitina e promotor precoce imediata de citomegalovírus humano (CMV IE).
O promotor pode ser constitutivo ou induzível. Um intensificador (isto é, um elemento de DNA de ação cis, que age sobre um promotor para aumentar a transcrição) pode ser necessário para funcionar em conjun to com o promotor para aumentar o nível de expressão obtido apenas com ο promotor, e pode ser incluído como um elemento regulador de transcrição. Frequentemente, o segmento polinucleotídico contendo o promotor incluirá uma seqüência intensificadora também (por exemplo, CMV ou SV40).
Operacionalmente ligado refere-se a uma justaposição de dois ou mais componentes, em que os componentes assim descritos estão em uma relação que permite que funcionem de sua maneira desejada. Por exemplo, um promotor e/ou intensificador estão operacionalmente ligados a uma seqüência codificadora, se agir em cis para controlar ou modular a transcrição da seqüência codificadora ligada. Geralmente, mas não necessariamente, as seqüências de DNA que estão operacionalmente ligadas são contíguas e, quando necessário para unir duas regiões codificadoras de proteínas, como um líder secretor e um polipeptídio, ou um polipeptídio e um domínio transmembrana, ou um polipeptídio e um peptídio de sinal para uma âncora GPI, ou um polipeptídio e um códon de parada de tradução, contíguas e em fase de leitura. Entretanto, embora um promotor operacionalmente ligado em geral esteja localizado a montante da seqüência codificadora, não é necessariamente contígua a ela. Intensificadores não têm de ser contíguos. Um intensificador está operacionalmente ligado a uma seqüência codificadora se o intensificador aumentar a transcrição da seqüência codificadora. Intensificadores operacionalmente ligados podem estar localizados a montante, dentro ou a jusante de seqüências codificadoras e a uma distância considerável do promotor. Um sítio de poliadenilação está operacionalmente ligado a uma seqüência codificadora se estiver localizado na extremidade a jusante da seqüência codificadora, de modo que a transcrição se processe da seqüência codificadora para a seqüência de poliadenilação. A ligação é realizada por métodos recombinantes conhecidos na técnica, por exemplo, usando-se metodologia de PCR e/ou por ligação em sítios de restrição convenientes. Se não existirem sítios de restrição convenientes, então, usam-se adaptadores ou elos oligonucleotídicos sintéticos de acordo com a prática convencional.
O termo produção de pré-mRNA, conforme aqui usado, desig na um processo de transcrição de DNA em seu pré-mRNA complementar. O DNA eucariótico é composto por regiões codificadoras e não codificadoras, que são chamadas de éxons (codificadoras) e introns (não codificadoras). No processo de transcrição de DNA em seu pré-mRNA complementar, a organização genômica de éxons e introns é mantida.
O termo processamento de pré-mRNA, conforme aqui usado, designa um processo de modificação pós-transcricional. Nessa etapa, os introns do pré-mRNA são submetidos a splicing, isto é, removidos do prémRNA, a extremidade 5' do mRNA processado é capeada, e se realizada a poliadenilação 3'. O mRNA nuclear final, isto é, maduro, é obtido nessa etapa.
O termo domínio transmembrana, conforme usado neste pedido, designa um polipeptídio ou proteína que é codificada no nível do DNA por pelo menos um éxon e que compreende uma região extracelular, uma transmembrana e uma intracelular. Um domínio transmembrana em geral compreende três regiões estruturais distintas: uma região extracelular N terminal, um trecho transmembrana conservado central e uma região citoplasmática C terminal. Em uma modalidade, o domínio transmembrana compreende, na direção N para C terminal, uma região extracelular e uma região transmembrana. O domínio transmembrana também pode compreender uma região intracelular ou citoplasmática.
O termo um fragmento de um domínio transmembrana, conforme usado neste pedido, designa a parte de um domínio transmembrana que atravessa a membrana celular, isto é, que está localizada dentro da membrana cleular, isto é, o trecho transmembrana.
O termo ácido nucléico de splicing alternativo designa um ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3'. Esse ácido nucléico contém um códon de parada de tradução e um sinal de poliadenilação. Esse ácido nucléico de splicing alternativo compreende uma região não codificadora que não é constitutivamente removida do pré-mRNA correspondente, como, por exemplo, o íntron depois do éxon que codifica um domínio de cadeia pesada de imunoglobuli na Ch3 ou Ch4. O evento de splicing alternativo que ocorre no sítio doador de splice 5' do ácido nucléico de splicing alternativo é um evento de decisão quanto a se o ácido nucléico de splicing alternativo é removido do pré-mRNA ou se é pelo menos mantido e compõe o mRNA maduro (processado).
O termo splicing alternativo e seus equivalentes gramaticais, conforme aqui usado, refere-se a um processo em células eucarióticas em que, a partir de um único pré-mRNA, devido a um processamento diferente de um ou mais introns, diferentes mRNAs maduros podem ser obtidos, e portanto, diferentes isoformas de um polipeptídio podem ser expressadas. Em uma modalidade da invenção, um único, isto é, apenas um, intron do pré-mRNA produzido por ser removido alternativamente. Em outra modalidade, o segundo ácido nucléico pode ser removido alternativamente. Uma modalidade adicional compreende o segundo ácido nucléico e um íntron alternativamente removível. O processamento diferente é uma decisão de sim/não, isto é, no processo de splicing alternativo, o íntron a ser processado, isto é, o ácido nucléico de splicing alternativo, é pelo menos parcialmente retido ou removido. Isso não deve ser entendido como um mecanismo de ponto de bifurcação resultando em diferentes éxons a seguir. É, de fato, um mecanismo em que um ácido nucléico de splicing alternativo é removido ou peto menos parcialnTente mantido no mRNA maduro. Com esse mecanismo, o ácido nucléico de splicing alternativo e, portanto, o códon de parada de tradução em fase de leitura nele compreendido é retido ou removido.
O splicing alternativo é um importante mecanismo regulador em células eucarióticas. Com o splicing alternativo, diferentes combinações de éxons em um mRNA maduro podem ser obtidas a partir do mesmo prémRNA, dando origem a uma pluralidade de diferentes proteínas codificadas pelo mesmo DNA.
O termo expressão, conforme aqui usado, refere-se a processos de transcrição e/ou tradução que ocorram dentro de uma célula. O nível de transcrição de um produto desejado em uma célula pode ser determinado com base na quantidade do mRNA correspondente que está presente na célula. Por exemplo, mRNA transcrito a partir de uma seqüência selecionada pode ser quantificado por PCR ou por hibridização Northern (veja Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press (1989)). Polipeptídios podem ser quantificados por vários métodos, por exemplo, por ELISA, por ensaio de atividade biológica do polipeptídio ou por emprego de ensaios que sejam independentes dessa atividade, como Western blotting, eletroforese em SDS gel de poliacrilamida, NMR ou radioimunoensaio, por exemplo, usando anticorpos que reconheçam e se liguem ao polipeptídio (veja Sambrook et al., 1989, supra).
Uma célula hospedeira refere-se a uma célula na qual se introduz um ácido nucléico heterólogo que codifica um polipeptídio ou proteína. A célula hospedeira inclui tanto células procarióticas, que são usadas para a propagação de plasmídios, e células eucarióticas, que são usadas para a expressão do ácido nucléico heterólogo. De preferência, as células eucarióticas são células de mamíferos. De preferência, as células de mamíferos são células CHO, células BHK, células NSO, células Sp2/0, células COS, células HEK, células PER.C6®.
Um polipeptídio é um polímero que consiste em aminoácidos unidos por ligações peptídicas, quer produzidos naturalmente, quer sinteticamente. Polipeptídios de menos de cerca de 20 resíduos de aminoácidos podem ser chamados de peptídios, ao passo que polipeptídios consistindo em mais de 100 resíduos de aminoácidos ou consistindo em duas ou mais cadeias polipeptídicas podem ser chamados de proteínas.
Uma proteína é uma macromolécula compreendendo pelo menos uma cadeia polipeptídica com um comprimento de 100 aminoácidos ou mais ou compreendendo duas ou mais cadeias polipeptídicas.
Polipeptídios e proteínas também podem compreender componentes não peptídicos, como grupos carboidrato, íons metálicos, lipídios, ésteres de ácidos carboxílicos ou suas combinações. Os substituintes não peptídicos podem ser acrescentados pela célula em que o polipeptídio ou proteína é produzida e podem variar com o tipo de célula. Polipeptídios e proteínas são aqui definidos em termos de suas estruturas principais de aminoácidos; adições, como grupos carboidrato, em geral não são especifica18 das, mas podem estar presentes.
DNA heterólogo ou ácido nucléico heterólogo refere-se a uma molécula de DNA ou a um ácido nucléico, ou a uma população de moléculas de DNA ou a uma população de ácidos nucléicos, que não existem natural5 mente dentro de uma dada célula hospedeira. Moléculas de DNA heterólogas a uma célula hospedeira particular podem conter DNA derivado da espécie da célula hospedeira (isto é, DNA endógeno), contanto que o DNA hospedeiro esteja combinado com DNA não hospedeiro (isto é, DNA exógeno). Por exemplo, uma molécula de DNA contendo um segmento de DNA 10 não hospedeiro que codifica um polipeptídio operacionalmente ligado a um segmento de DNA hospedeiro compreendendo um promotor é considerada uma molécula de DNA heterólogo. Inversamente, o DNA heterólogo pode compreender um gene estrutural endógeno operacionalmente ligado a um promotor exógeno.
Um peptídio ou polipeptídio codificado por um ácido nucléico não hospedeiro, isto é, heterólogo, é um peptídio ou polipeptídio heterólogo.
O termo polipeptídio biologicamente ativo, conforme aqui usado, refere-se a uma molécula orgânica, por exemplo, uma macromolécula biológica, como um peptídio, proteína, glicoproteína, nucleoproteína, muco20 proteína, lipoproteína, polipeptídio ou proteína sintética, que cause um efeito biológico quando administrado em ou a sistemas biológicos artificiais, como bioensaios usando linhagens celulares e vírus, ou in vivo a um animal, incluindo, mas não limitados a, avez e mamíferos, incluindo seres humanos. Esse efeito biológico pode ser, mas não se limita a, inibição ou ativação de uma 25 enzima, ligação a um receptor ou ligante, no sítio d eligação ou circunferencial, desencadeamento de sinal ou modulação de sinal. Em uma modalidade, do dito polipeptídio biologicamente ativo é selecionado do grupo de polipeptídios compreendendo imunoglobulinas, fragmentos de imunoglobulinas, conugados de imunoglobulinas e peptídios antifusogênicos.
Moléculas biologicamente ativas são, sem limitação, por exemplo, hormônios, citocinas, interleucinas, imunoglobulinas, peptídios antifusogênicos, fatores de crescimento, ligantes, agonistas ou antagonistas de re ceptor, agentes citotóxicos, agentes antivirais, agentes de formação de imagem, inibidores de enzimas, ativadores de enzimas ou moduladores da atividade de enzimas, como substâncias alostéricas, e conjugados desses.
O termo aminoácido, conforme usado neste pedido, designa um grupo de carbóxi α-aminoácidos, que, diretamente ou como precursores, possam ser codificados por ácidos nucléicos, compreendendo alanina (código de três letras: Ala, código de uma letra: A), arginina (Arg, R), asparagina (Asn, N), ácido aspártico (Asp, D), cisteína (Cys, C), glutamina (Gin, Q), ácido glutâmico (Glu, E), glicina (Gly, G), histidina (His, H), isoleucina (He, I), leucina (Leu, L), lisina (Lys, K), metionina (Met, M), fenilalanina (Phe, F), prolina (Pro, P), serina (Ser, S), treonina (Thr, T), triptofano (Trp, W), tirosina (Tyr, Y) e valina (Vai, V).
Um vetor de clonagem é um ácido nucléico, como um plasmídio, cosmídio, fagemídio ou cromossoma artificial bacteriano (BAC), que tenha a capacidade de se replicar de maneira autônoma em uma célula hospedeira. Vetores de clonagem tipicamente contêm um ou um pequeno número de sítios de reconhecimento de endonuclease de restrição que permitem a inserção de um ácido nucléico de uma maneira determinável, sem perda de uma função biológica essencial do vetor, assim como seqüências nucleotídicas que codificam um marcador selecionável, isto é, adequado para uso na identificação e seleção de células transformadas com o vetor de clonagem. Marcadores selecionáveis tipicamente incluem genes que conferem resistência a tetraciclina, neomicina, G418 ou ampicilina.
Um vetor de expressão é um ácido nucléico que codifica um polipeptídio ou proteína heteróloga para ser expressada em uma célula hospedeira. Tipicamente, um vetor de expressão compreende uma unidade de propagação de plasmídio procariótico, por exemplo, para E. coli, compreendendo uma origem de replicação procariótica e um marcador de seleção procariótica, um marcador de seleção eucariótica e um ou mais cassetes de expressão para a expressão de um ácido nucléico de interesse, cada um compreendendo um promotor, um ácido nucléico e um terminador de transcrição, incluindo um sinal de poliadenilação. A expressão do gene normal mente é colocada sob o controle de um promotor, e esse gene estrutural é dito operacionalmente ligado ao promotor. Da mesma forma, um elemento regulador e um promotor de núcleo estão operacionalmente ligados se o elemento regulador modular a atividade do promotor de núcleo.
Uma unidade de transcrição policistrônica é uma unidade de transcrição em que mais de um gene estrutural está sob o controle do mesmo promotor.
Um polipeptídio isolado ou uma proteína isolada é um polipeptídio ou proteína que seja essencialmente livre de componentes celulares 10 contaminantes, como carboidratos não covalentemente ligados, lipídios ou outras impurezas proteináceas, assim como impurezas não proteináceas associadas ao polipeptídio ou proteína na natureza. Tipicamente, uma preparação de polipeptídio/proteína isolada contém o polipeptídio/proteína em uma forma altamente purificada, isto é, pelo menos cerca de 80% pura, pelo 15 menos cerca de 90% pura, pelo menos cerca de 95% pura, mais de 95% pura ou mais de 99% pura. Uma maneira de mostrar que uma preparação particular contém um polipeptídio ou proteína isolada é pelo aparecimento de uma única banda na eletroforese em dodecil sulfato de sódio (SDS)-gel de poliacrilamida da preparação e coloração com Azul Brilhante de Coomassie 20 do gel. Entretanto, o termo isolado não exclui a presença do mesmo polipeptídio ou proteína em formas físicas alternativas, como dímeros ou formas alternativamente glicosiladas ou derivatizadas.
Conforme aqui usado, o termo imunoglobulina designa uma proteína consistindo em um ou mais polipeptídios substancialmente codifica25 dos por genes de imunoglobulinas. Essa definição inclui variantes, como formas mutantes, isto é, formas com substituições, deleções e inserções de um ou mais aminoácidos, formas truncadas, assim como formas fusionadas. Os genes de imunoglobulinas reconhecidos incluem os diferentes genes de regiões constantes, assim como a miríade de genes de regiões variáveis da 30 imunoglobulina. Imunoglobulinas podem existir em vários formatos, including, por exemplo, Fv, Fab, e F(ab)2, assim como cadeias simples (scFv) (por exemplo, Huston, J.S., et al., PNAS USA 85 (1988) 5879-5883; Bird,
R.E., et al., Science 242 (1988) 423-426; e, em geral, Hood et al., Immunology, Benjamin N.Y., 2- edição (1984) e Hunkapiller, T., e Hood, L, Nature 323(1986) 15-16).
Cada uma das cadeias polipeptídicas pesadas e leves de uma imunoglobulina, caso presentes, pode compreender uma região constante (em geral a parte terminal carboxila). A região constante da cadeia pesada medeia a ligação do anticorpo: i) a células portadoras de um receptor Fc, como células fagocíticas, ou ii) a células portadoras do receptor Fc neonatal (FcRn), também conhecido como receptor Brambell. Também medeia a liga10 ção a alguns fatores, incluindo fatores do sistema complemento clássico, como o componente C1q. Além disso, um domínio transmembrana pode seguir o domínio constante C terminal de uma cadeia pesada de imunoglobulina, isto é, o domínio CH3 ou CH4. Esse domínio transmembrana permite a formação de imunoglobulinas ligadas a membrana plasmática ou fragmentos 15 de imunoglobulinas ou imunoglobulina-polipeptídios de fusão.
Cada uma das cadeias polipeptídicas pesadas e leves de uma imunoglobulina, caso presentes, pode compreender um domínio variável (em geral, a parte amino terminal). O domínio variável de uma cadeia leve ou pesada de imunoglobulina compreende diferentes segmentos, isto é, quatro 20 regiões de armação (FR) e três regiões hipervariáveis (CDR).
O termo pelo menos um fragmento de designa uma fração de um ácido nucléico completo ou um polipeptídio completo, isto é, pelo menos 20%, pelo menos 40%, pelo menos 60% ou pelo menos 80% do ácido nucléico, polipeptídio ou domínio completo. Por exemplo, um ácido nucléico 25 que codifica pelo menos um fragmento de um domínio Ch3 ou Ch4 de imunoglobulina designa uma fração do ácido nucléico que codifica o domínio Ch3 ou Ch4 completo da imunoglobulina, isto é, pelo menos 20%, pelo menos 40%, pelo menos 60% ou pelo menos 80% do ácido nucléico que codifica o domínio CH3 ou Ch4 completo da imunoglobulina. Em uma modalidade, 30 um fragmento de uma cadeia pesada de imunoglobulina é um fragmento C terminal de uma cadeia pesada de imunoglobulina.
O termo um códon de parada de tradução em fase de leitura designa um códon de parada de tradução (TAA, TAG ou TGA) que suceda a uma região codificadora de um ácido nucléico sem um deslocmento de fase da fase de leitura com relação à região codificadora precedente do ácido nucléico, isto é, que termine a região codificadora durante a tradução. Um códon de parada de tradução em fase de leitura está operacionalmente ligado à região codificadora precedente de um ácido nucléico.
O termo sem um códon de parada de tradução em fase de leitura designa a ausência de um códon de parada de tradução (TAA, TAG ou TGA) no ácido nucléico designado e/ou a presença de um códon de parada de tradução, que pode ser encontrado dentro ou na extremidade de uma região codificadora de um ácido nucléico, mas que seja devido a um ou dois deslocamentos de pares de bases não reconhecidos durante a tradução do mRNA processado (isto é, fora de fase, não ligado operacionalmente) e, portanto, não termine a região codificadora no processo de tradução.
Terminador de transcrição, conforme designado neste pedido, é uma seqüência de DNA de 50 - 750 pares de bases de comprimento, que forneça à RNA polimerase o sinal para o término da síntese de mRNA. Terminadores muito eficientes (fortes) na extremidade 3' de um cassete de expressão são aconselháveis para evitar que a RNA polimerase continue lendo, particularmente quando se usam promotores fortes. Terminadores de transcrição ineficientes podem levar à formação de um mRNA do tipo óperon, o que pode ser a razão para uma expressão do gene indesejável, por exemplo, codificada por plasmídio.
Os termos não removido constitutivamente durante o processamento de pré-mRNA e não removido constitutivamente do pré-mRNA (correspondente), conforme usados neste pedido, designam um processo de splicing que não ocorre de maneira não excepcional durante o processo do pré-mRNA, isto é, o ácido nucléico de um íntron específico é removido apenas às vezes durante o processamento do pré-mRNA.Como resultado, dois mRNA maduros diferentes são obtidos, um com pelo menos uma parte do íntron e um sem o íntron.
O termo âncora GPI, conforme usado neste pedido, designa uma modificação pós-tradução fixada a uma terminação C de um polipeptídio ou proteína. Uma âncora GPI tem uma estrutura de núcleo compreendendo pelo menos um resíduo de fosfato de etanolamina, uma trimanosida, um resíduo de glucosamina residue e um inositol fosfolipídio. Apesar dessa estrutura de núcleo, uma âncora GPI normalmente possui uma certa microheterogeneidade e, conseqüentemente, uma proteína com uma âncora GPI normalmente é uma mistura de proteínas com âncoras GPI homólogas da mesma estrutura de núcleo com diferentes modificações da cadeia colateral.
O termo peptídio de sinal para uma âncora GPI designa uma seqüência de aminoácidos C terminal de um polipeptídio ou proteína que consiste em um aminoácido ao qual a âncora GPI pode ser fixada, um peptídio espaçador opcional e um peptídio hidrofóbico. Quase todo esse peptídio de sinal, isto é, o peptídio espaçador opcional e o peptídio hidrofóbico, é removido pós-tradução pela enzima GPI-transaminase, e se forma uma ligação entre o grupo amino do fosfato de etanolamina de núcleo da âncora GPI e o aminoácido ao qual a âncora GPI está ligada.
Após a transfecção com um ácido nucléico heterólogo, células que expressem um polipeptídio heterólogo codificado pelo ácido nucléico heterólogo têm de ser selecionadas. Para a seleção, usa-se um marcador. O marcador indica células em uma população que tenham sido transformadas com sucesso e facilita a seleção e o isolamento dessas células. Podem-se usar diferentes marcadores, como, por exemplo, marcadores selecionáveis, ou etiquetas detectáveis, como a Proteína Fluorescente Verde (GFP).
A seleção das células pode ser realizada em uma única etapa ou em múltiplas etapas. Em um procedimento de única/múltiplas etapas, a primeira seleção pode ser efetuada com base, por exemplo, em um nível de limitar de um marcador selecionável, como uma etiqueta detectável. Por exemplo, para a seleção por citometria de fluxo (por exemplo, por FACS Classificação de Células Ativada por Fluorescência), estabelece-se um nível de limiar de fluorescência, e células com uma fluorescência acima desse nível de limiar são selecionadas. Alternativamente, células nos 1 - 15% superiores (isto é, os 15% das células com a etiqueta detectável mais intensa), ou os 1 -10% superiores, ou 1 - 5% superiores, ou 5 -10% superiores ou 5 6% superiores da intensidade de fluorescência da população de amostra podem ser coletadas. Um método alternativo para a seleção de células é a ligação imunológica, por exemplo, a glóbulos magnéticos revestidos com Proteína A ou imunoglobulinas específicas. O painel de células selecionado pode ser tomado como a população básica para uma etapa de seleção adicional, por exemplo, por semeadura de uma única célula, cultivo e análise por ELISA (Ensaio Imunossorvente Ligado a Enzima), ou por clonagem de diluição limitada, ou por expansão por cultivo sob condições seletivas de cultura em um meio de seleção durante vários dias e uma seleção FACS adicional, ou por uma seleção FACS adicional com um nível de limiar mais alto, que pode se basear, por exemplo, nas intensidades de fluorescência detectadas em uma seleção FACS precedente, ou por um método de imunoprecipitação (veja, por exemplo, também o WO 2005/020924). A seleção de uma célula de acordo com a invenção pode ser efetuada por um método selecionado no grupo da citometria de fluxo, ELISA, imunoprecipitação, cromatografia de coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia ou ligação imunológica. Em uma modalidade, a seleção de uma célula de acordo com a invenção pode ser efetuada por um método selecionado do grupo da citometria de fluxo, ELISA, imunoprecipitação, cromatografia em coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia ou ligação imunológica, seguido por um método selecionado do grupo de semeadura e cultivo de célula única, diluição limitada ou expansão por cultivo, seguido por um método selecionado do grupo de FACS, imunoprecipitação, cromatografia em coluna de imunoafinidade, classificação por imunoafinidade com glóbulos magnéticos, métodos de isolamento à base de microscopia, ou ELISA.
Como a eficácia dos métodos de transfecção e vetores conhecidos na técnica é muito alta e, portanto, obtém-se uma pluralidade de células transfectadas, são preferidos marcadores que também permitam a corrleção do rendimento de expressão de uma célula transfectada com a intensidade detectada do marcador. Conseqüentemente, é funcional ligar a expressão do polipeptídio heterólogo de interesse à expressão do marcador
A presente invenção usa metodologia de splicing, isto é, splicing alternativo, para expressar um polipeptídio heterólogo e um marcador pelo mesmo ácido nucléico, isto é, pelo mesmo cassete de expressão, em que, por exemplo, não se emprega IRES. O marcador na presente invenção é uma forma ligada a membrana plasmática do polipeptídio heterólogo expressado. Na presente invenção, o marcador selecionável compreende como parte N terminal o polipeptídio heterólogo e como parte C terminal pelo menos um fragmento de um domínio transmembrana ou uma âncora GPI. Assim, o polipeptídio heterólogo produzido e a parte extracelular do marcador selecionável, isto é, a parte do marcador selecionável que é detectada, são idênticos.
A presente invenção compreende um método para a seleção de uma célula eucariótica que expresse um polipeptídio heterólogo, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em um polipeptídio heterólogo, em que a dita célula transfectada produz polipeptídio heterólogo solúvel e polipeptídio heterólogo ligado a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com polipeptídio heterólogo ligado a membrana plasmática para ser a dita célula que expressa um polipeptídio heterólogo.
Durante a transcrição do DNA, obtém-se uma cópia do DNA, o chamado RNA pré-mensageiro (pré-mRNA). Esse pré-mRNA tem a mesma organização do DNA de molde, isto é, tem uma organização de íntron-éxon genômico. Apenas os éxons contêm a informação da seqüência de aminoácidos do polipeptídio codificado.
Assim, os introns têm de ser removidos do pré-mRNA antes da tradução. Esse processo é chamado de splicing de RNA.
Um ácido nucléico de splicing se caracteriza por pelo menos um sítio doador de splice 5', um sítio receptor de splice 3' e um chamado sítio de ramificação, que normalmente se localiza 20 - 50 bases a montante do sítio receptor. Essa arquitetura efetua o reconhecimento e a excisão do ácido nucléico do sítio doador de splice 5' para o sítio receptor de splice 3' do pré-mRNA durante o splicing de RNA. Durante a etapa de splicing, gerase o mRNA maduro do qual um polipeptídio ou proteína é traduzida. Em uma modalidade da presente invenção, pelo menos um ácido nucléico, de preferência o segundo ácido nucléico, é um ácido nucléico de splicing, contendo elementos reguladores adicionais, como um códon de parada em fase de leitura e um sinal de poliadenilação.
Porém, o processo de splicing não é exclusivo. É possível, por exemplo, que um íntron não seja removido durante o processamento do prémRNA a partir do pré-mRNA e esteja, portanto, pelo menos parcialmente incrustado no mRNA maduro. Se um códon de parada em fase de leitura estiver presente nesse íntron opcionalmente incluído, a tradução pára nesse códon de parada, e se produz uma vriante do polipeptídio codificado.
O reconhecimento e a excisão de um íntron freqüentemente é regulada por elementos de ação cis adicionais no pré-mRNA. Devido a sua função e posição, esses elementos são chamados de intensificador de splice exônico (ESE), silenciador de splice exônico (ESS), intensificador de splice intrônico (ISE) ou silenciador de splice intrônico (ISS), respectivamente (Black, D. L, Annu Rev Biochem 72 (2003) 291-336).
O DNA genômico da maioria dos genes eucarióticos tem uma organização íntron-éxon. Por exemplo, dentro do éxon que codifica o domínio C terminal da forma secretada de uma cadeia pesada de imunoglobulina (isto é Ch3 ou Ch4, respectivamente) é um sítio doador de splice 5'.
Se esse sítio doador de splice não for eficaz no processamento do pré-mRNA de cadeia pesada, o íntron que segue esse éxon, que contém um códon de parada e um sinal de poliadenilação, é pelo menos parcialmente retido no mRNA maduro. O mRNA é, então, traduzido em uma cadeia pesada de imunoglobulina que termina com um domínio Ch3 ou Ch4 e representa uma imunoglobulina solúvel. Essa é a principal via de processamento de genes de cadeias pesadas de imunoglobulinas em células secretoras de imunoglobulinas.
Se esse sítio doador de splice for eficaz no processamento do pré-mRNA de cadeia pesada de imunoglobulina, o íntron consecutivo e, portanto, o códon de parada são removidos. Portanto, a tradução não pára depois do domínio C terminal de uma cadeia pesada de imunoglobulina. Além disso, a tradução continua com o sucessivo splicing a éxons que codificam um domínio transmembrana. Essa via de processamento menor para genes de cadeias pesadas de imunoglobulinas resulta em uma forma de imunoglobulina ligada a membrana plasmática apresentada na superfície cleular de uma célula produtora de imunoglobulinas.
Esse processo é chamado de splicing alternativo, e o ácido nucléico (isto é, o íntron) opcionalmente removido nesse processo é chamado de ácido nucléico de splicing alternativo.
Se um ácido nucléico que codifica um polipeptídio heterólogo ou uma proteína estiver ligado a um ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou a um ácido nucléico que codifica um peptídio de sinal para uma âncora GPI por um ácido nucléico de splicing alternativo, isto é, um ácido nucléico de splicing alternativo está locali zado entre esses dois ácidos nucléicos, e, dessa forma, esses três ácidos nucléicos estão operacionalmente ligados, duas variantes do polipeptídio ou proteína heteróloga são expressadas: uma variante solúvel, isto é, uma variante compreendendo apenas o polipeptídio ou proteína, e uma variante ligada a membrana plasmática, isto é, uma variante compreendendo tanto o polipeptídio ou proteína, quanto o domínio transmembrana ou a âncora GPI.
Em uma modalidade, ácido nucléico transfectado está compreendido em um cassete de expressão. Em uma modalidade, o primeiro ácido nucléico está sem um códon de parada de tradução em fase de leitura em sua terminação 3'. Em outra modalidade, os primeiro, segundo e terceiro ácidos nucléicos estão operacionalmente ligados. Em uma modalidade, o terceiro ácido nucléico codifica pelo menos um fragmento de um domínio transmembrana. Em outra modalidade, o fragmento de um domínio transmembrana é uma região transmembrana. Em uma modalidade, o terceiro ácido nucléico codifica um peptídio de sinal para uma âncora GPI. Em uma modalidade da invenção, o polipeptídio codificado pelo primeiro ácido nucléico é selecionado do grupo que compreende cadeias pesadas de imunoglobulinas, cadeias leves de imunoglobulinas, polipeptídios biologicamente ativos, seus fragmentos e seus polipeptídios de fusão. Em uma modalidade da invenção, o polipeptídio codificado pelo primeiro ácido nucléico é selecionado do grupo que compreende cadeias pesadas de imunoglobulinas, cadeias leves de imunoglobulinas, seus fragmentos, e suas fusões. Em uma modalidade, o terceiro ácido nucléico codifica pelo menos um fragmento de um domínio transmembrana de imunoglobulina.
Em maiores detalhes, a presente invenção compreende um método para a seleção de uma célula eucariótica que expresse uma cadeia pesada de imunoglobulina, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz cadeia pesada de imunoglobulina solúvel e cadeia pesada de imunoglobulina ligada a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com cadeia pesada de imunoglobulina ligada a membrana plasmática para ser a dita célula que expressa uma cadeia pesada de imunoglobulina.
Em uma modalidade, a presente invenção compreende um método para a seleção de uma célula eucariótica que expresse uma imunoglobulina, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo um primeiro cassete de expressão para uma cadeia leve de imunoglobulina e um segundo cassete de expressão compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilaÇão, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz imunoglobulina solúvel e imunoglobulina ligada a membrana por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com imunoglobulina ligada a membrana para ser a dita célula que expressa uma imunoglobulina.
Em uma modalidade, a presente invenção compreende um método para a seleção de uma célula eucariótica que expresse uma imunoglobulina, em que o método compreende:
a) a transfecção de uma célula eucariótica com dois ácidos nucléicos simultânea ou seqüencialmente, em que um ácido nucléico compreende um cassete de expressão para uma cadeia leve de imunoglobulina e o outro ácido nucléico compreende um cassete de expressão compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica uma cadeia pesada de imunoglobulina sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, o processamento do dito pré-mRNA, e a tradução do dito mRNA processado em uma cadeia pesada de imunoglobulina, em que a dita célula transfectada produz imunoglobulina solúvel e imunoglobulina ligada a membrana por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com imunoglobulina ligada a membrana para ser a dita célula que expressa uma imunoglobulina.
Em uma modalidade, o domínio transmembrana codificado pelo terceiro ácido nucléico é um domínio transmembrana de imunoglobulina. Em uma modalidade da invenção, o segundo ácido nucléico compreende apenas um sítio doador de splice 5' e apenas um sítio receptor de splice 3'. Em outra modalidade da presente invenção, o segundo ácido nucléico é um intron de cadeia pesada de imunoglobulina de ocorrência natural, que segue o éxon que codifica um domínio de cadeia pesada de imunoglobulina Ch3 ou Ch4, em que no dito íntron pelo menos 50 nucleotídeos consecutivos estão deletados.
Por exemplo, para a expressão recombinante de cadeias pesadas de imunoglobulinas em células eucarióticas, emprega-se um ácido nucléico com organização genômica íntron-éxon ou contendo apenas as regiões codificadoras, isto é cDNA. Em ambos os casos, o ácido nucléico termina com o códon de parada após o éxon que codifica o domínio C terminal da cadeia pesada de imunoglobulina. Depois disso, na organização genômica, os sucessivos introns e éxons, compreendendo um ácido nucléico de splicing alternativo e um domínio transmembrana, são omitidos. Conseqüentemente, com esse ácido nucléico apenas a cadeia pesada de imunoglobulina solúvel é obtida.
Se para a expressão recombinante de imunoglobulinas ou seus fragmentos a organização genômica do gene de cadeia pesada de imunoglobulina for retida pelo menos parcialmente, isto é, se o íntron depois do éxon que codifica o domínio C terminal (isto é, o ácido nucléico de splicing alternativo) e o(s) sucessivo(s) éxon(s) que codifica(m) um domínio transmembrana forem retidos, é possível o splicing alternativo. No evento de splicing alternativo, os códons terminais 3' e o códon de parada do éxon que codifica o domínio CH3 ou CH4, respectivamente, são removidos como/com a seqüência intrônica, e se gera, ao invés, um mRNA maduro diferente, em que a região codificadora, isto é, a fase de leitura, é alongada em sua extremidade 3' pelo(s) éxon(s) adicionalmente mantido(s). Esse mRNA é traduzido em uma cadeia pesada de imunoglobulina estendida na terminação C, que contém um domínio transmembrana adicional ou seu fragmento, codificado pelo(s) éxon(s) 3' adicional(ais). Essa cadeia pesada de imunoglobulina alongada é incorporada durante a montagem de imunoglobulinas, resultando em imunoglobulinas ligadas à membrana plasmática. Descobriu-se agora, surpreendentemente, que, com esse ácido nucléico de acordo com a invenção, células transfectadas produtoras de um polipeptídio heterólogo podem ser selecionadas. Essa metodologia é genericamente aplicável e não se restringe a imunoglobulinas. Para praticar essa metodologia, o ácido nucléico para expressão recombinante de um polipeptídio heterólogo sem um códon de parada em fase de leitura tem de estar operacionalmente ligado a e em fase de leitura com o ácido nucléico de splicing alternativo derivado de uma imunoglobulina compreendendo um códon de parada de tradução em fase de leitura e um sítio de poliadenilação. O sucessivo terceiro ácido nucléico também e variável e pode ser selecionado de qualquer ácido nucléico que codifique um domínio transmembrana ou seu fragmento, assim como de qualquer ácido nucléico que codifique um peptídio de sinal para uma âncora GPI. Esses elementos, isto é, o ácido nucléico que codifica o polipeptídio, o ácido nucléico de splicing alternativo e o ácido nucléico que codifica o domínio transmembrana ou o peptídio de sinal para uma âncora GPI, podem ser selecionados e combinados de diferentes genes, assim como de diferentes organismos. O único pré-requisito é que os três ácidos nucléicos sejam combinados de modo que o códon de parada de tradução no ácido nucléico de splicing alternativo esteja em fase de leitura com a fase de leitura do ácido nucléico que codifica o polipeptídio, isto é, possa ser reconhecido pelo ribossomo e a tradução seja terminada.
Genericamente, com o splicing alternativo, opcionalmente uma fração da terminação C da forma solúvel do polipeptídio heterólogo é/pode ser removida do pré-mRNA como parte de um íntron. Essa fração engloba opcionalmente os códons terminais 3', a região não traduzida 3', o códon de parada e o sinal de poliadenilação da forma secretada. Conseqüentemente, o ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' que é removido opcionalmente se superpõe/pode se superpor à terminação C da variante não processada alternativamente.
Portanto, com o uso de um ácido nucléico de acordo com a invenção com uma organização genômica pelo menos parcialmente retida de um gene de cadeia pesada de imunoglobulina, duas variantes de um polipeptídio heterólogo podem ser obtidas, uma variante solúvel curta e uma variante ligada a membrana plasmática longa.
Em uma modalidade em que o primeiro ácido nucléico codifica uma cadeia pesada de imunoglobulina, o primeiro ácido nucléico compreende todos os éxons e todos, exceto um, introns do gene de cadeia pesada de imunoglobulina genomicamente organizado. Em uma modalidade, o terceiro ácido nucléico codifica um fragmento de um domínio transmembrana ou um peptídio de sinal para uma âncora GPI, em que o fragmento do domínio transmembrana é codificado por um único éxon. Em outra modalidade, o domínio transmembrana é um domínio transmembrana de imunoglobulina codificado por uma fusão MI-M2-éxon, isto é, por um único éxon sem o intron genomicamente interveniente. Em uma modalidade, o domínio transmembrana da imunoglobulina é codificado por um cDNA.
Com a introdução de um ácido nucléico com uma organização genômica global pelo menos parcialmente retida de um gene de cadeia pesada de imunoglobulina gene em uma célula hospedeira, obtém-se uma célula que expressa, por um lado, polipeptídio heterólogo solúvel e, por outro lado, polipeptídio heterólogo ligado a membrana plasmática. Por exemplo, para se obterem as duas variantes de imunoglobulina, isto é, para permitir splicing alternativo, não é necessário manter a organização genômica inteira do gene de cadeia pesada de imunoglobulina, isto é, todos os introns e éxons. É necessário apenas manter o sítio de splice alternativo em uma forma funcional. Um sítio de splice funcional é uma seqüência de ácido nucléico compreendendo um sítio doador de splice 5' e um sítio receptor de splice 3', permitindo, dessa forma, a excisão da seqüência de ácido nucléico interveniente do pré-mRNA. O reconhecimento e a excisão de um íntron freqüentemente são regulados por elementos de ação cis adicionais no pré-mRNA. Devido a sua função e posição, esses elementos são chamados de intensificador de splice exônico (ESE), silenciador de splice exônico (ESS), intensificador de splice intrônico (ISE) ou silenciador de splice intrônico (ISS), respectivamente (Black, D. L, Annu Rev Biochem 72 (2003) 291-336, que é aqui incorporado por referência).
Para a seleção de células transfectadas que expressem um polipeptídio heterólogo, podem-se usar diferentes métodos, como, sem limitação, métodos espectroscópicos, por exemplo, fluorescência, ELISA e suas variantes, por ensaio da atividade biológica ou por emprego d eensaios que sejam independentes dessa atividade, como Western blotting, eletroforese em SDS gel de poliacrilamida, ou radioimunoensaio, usando-se anticorpos que reconheçam e se liguem ao polipeptídio heterólogo. Como o polipeptídio heterólogo ligado a membrana plasmática tem a mesma seqüência de aminoácidos e estrutura secundária que o polipeptídio heterólogo solúvel, exceto por sua terminação C, pode ser determinado, por exemplo, com os mesmos anticorpos para a variante solúvel.
A variante ligada a membrana plasmática de um polipeptídio está firmemente conectada à célula que a expressa. Conseqüentemente, a variante ligada a membrana plasmática pode ser usada como um marcador par aisolar células que tenham sido transfectadas com sucesso com um ácido nucléico para a expressão de um polipeptídio ou proteína heteróloga, por exemplo, uma imunoglobulina. Em uma modalidade, o polipeptídio é uma imunoglobulina. Em uma modalidade, a imunoglobulina é selecionada do grupo de IgG, IgE, e IgA.
A razão molecular da variante solúvel do polipeptídio heterólogo para a variante ligada a membrana plasmática do polipeptídio heterólogo é de mais de 50:50 a menos de 100:0, de preferência de mais de 75:25 a menos de 100:0. Por exemplo, se uma célula eucariótica for transfectada com um ácido nucléico de acordo com a invenção que codifique uma imunoglobu lina, células transfectadas com sucesso podem ser selecionadas pelo aparecimento de imunoglobulina ligada a membrana.
Um ácido nucléico de acordo com a invenção é um ácido nucléico contendo, na direção 5' a 3', uma região codificadora para um polipeptídio heterólogo, um ácido nucléico de splicing alternativo e uma região codificadora para um domínio transmembrana ou seu fragmento ou uma região codificadora para um peptídio de sinal para uma âncora GPI. Em maiores detalhes, a presente invenção compreende um ácido nucléico, compreendendo:
a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura,
b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, e
c) um terceiro ácido nucléico que codifica:
i) pelo menos um fragmento de um domínio transmembrana, ou . ii) um peptídio de sinal para uma âncora GPI.
Em outras modalidades, i) o sítio de splice 5' do intron de splice alternativo está localizado em 5' com relação ao códon de parada normal do ácido nucléico que codifica the polipeptídio heterólogo, ii) o segundo ácido nucléico é um ácido nucléico de splicing alternativo, e iii) o sítio de splice 5' é usado apenas às vezes e não constitutivamente, resultando em uma razão molecular de polipeptídio heterólogo normalmente processado, isto é, polipeptídio solúvel, para polipeptídio heterólogo alternativamente processado, isto é polipeptídio ligado a membrana plasmática, de mais de 50:50 a menos de 100:0. Em uma modalidade, o primeiro ácido nucléico e o segundo ácido nucléico estão operacionalmente ligados, isto é, o códon de parada de tradução do segundo ácido nucléico está em fase de leitura com a fase de leitura do primeiro ácido nucléico que codifica um polipeptídio ou seu fragmento.
O ácido nucléico que pode ser removido por splicing alternativo segue o ácido nucléico que codifica pelo menos um fragmento de um polipeptídio e precede o ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana ou que codifica um peptídio de sinal para uma âncora GPI. Em uma modalidade, o polipeptídio heterólogo é um polipeptídio de fusão compreendendo N terminalmente um polipeptídio de interesse e C terminalmente pelo menos um fragmento de um domínio de cadeia pesada de imunoglobulina Ch3 ou Ch4 ou sua variante. Em uma modalidade, o ácido nucléico compreende um quarto ácido nucléico entre o primeiro ácido nucléico e o segundo ácido nucléico e/ou o segundo ácido nucléico e o terceiro ácido nucléico. Isto é, o quarto ácido nucléico está localizado, por exemplo, depois do segundo ácido nucléico (isto é, depois do sítio receptor de splice 3') e antes da extremidade 5' do terceiro ácido nucléico.
Com um ácido nucléico de splicing alternativo localizado entre o ácido nucléico que codifica um polipeptídio heterólogo e o ácido nucléico que codifica um domínio transmembrana ou que codifica um peptídio de sinal para uma âncora GPI, duas variantes do polipeptídio heterólogo podem ser expressadas: um polipeptídio heterólogo sem domínio transmembrana ou âncora GPI e um polipeptídio heterólogo com domínio transmembrana ou âncora GPI. O polipeptídio heterólogo pode ser selecionado de, sem limitação, por exemplo, hormônios; citocinas; fatores de crescimento; ligantes, agonistas ou antagonistas de receptores; agentes citotóxicos; agentes antivirals; agentes de formação de imagem; inibidores de enzimas; ativadores de enzimas ou moduladores da atividade de enzimas, como substâncias alostéricas; imunoglobulinas; ou fusões ou seus fragmentos. Em uma modalidade, o polipeptídio é uma imunoglobulina, um polipeptídio de cadeia pesada de imunoglobulina ou uma fusão de imunoglobulina.
A invenção pode ser praticada com qualquer polipeptídio, qualquer domínio transmembrana e qualquer peptídio de sinal para uma âncora GPI, contanto que um ácido nucléico de splicing alternativo esteja incrustado. Em maiores detalhes, o fragmento de ácido nucléico começando com o sítio doador de splice 5' e terminado pelo sítio receptor de splice 3' tem de ser apropriadamente escolhido. O polipeptídio precedente e o domínio transmembrana ou âncora GPI sucessivo podem ser escolhidos livremente.
A presente invenção também compreende um ácido nucléico compreendendo:
a) um primeiro sítio de clonagem múltipla,
b) um ácido nucléico de splicing começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', em que:
i) o ácido nucléico de splicing compreende um códon de parada e um sinal de poliadenilação, e ii) o ácido nucléico de splicing não é constitutivamente removido durante o processamento de pré-mRNA,
c) um segundo sítio de clonagem múltipla.
A presente invenção pode ser praticada, por exemplo, sem limitação, com o segundo ácido nucléico, isto é, o ácido nucléico de splicing alternativo, derivado do grupo de ácidos nucléicos que codificam o receptor C3b/C4b (receptor de complemento do tipo 1) (Hourcade, D., et al, J. Exp. Med. 168 (1988) 1255-1270), EGFR humano, de galinha e e rato (Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., e Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L, et al., Mol. Cell Biol. 10 (1990) 2973-2982), cadeia pesada α, ε, γ e μ de imunoglobulina (lg) (Zhang, K., et al., J. Exp. Med. 176 (1992) 233-243; Rogers, J.E., et al., Cell 20 (1980) 303312; Milcarek, C, e Hall, B„ Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, B.J., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293-301; Peterson, MX., Gene Exp. 2 (1992) 319-327), receptor PLA2 humano (Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), Cek5 de galinha (Connor, RJ., e Pasquale, E.B., Oncogene 11 (1995) 2429-2438), FGFR humano (Johnson, D.E., et al, Mol. Cell Biol. 11 (1991) 4627-4634.
Em uma modalidade, o segundo ácido nucléico é um íntron de uma imunoglobulina localizado entre o éxon que codifica o domínio Ch3/Ch4 e o éxon que codifica pelo menos um fragmento do domínio transmembrana. Em uma modalidade, o segundo ácido nucléico é derivado do grupo de ácidos nucléicos que codificam cadeia pesada α (alfa) de imunoglobulina (lg) humana (hu), cadeia pesada δ (delta) de lg hu, cadeia pesada ε (epsilon) de lg hu, cadeia pesada yl, γ2, γ3 e γ4 (gama) de lg hu, cadeia pesada μ (mu) de lg hu, cadeia pesada de Ig murídea de tipo α (alfa), cadeia pesada de Ig muridea do tipo δ (delta), cadeia pesada de Ig murídea do tipo ε (epsilon), cadeia pesada de Ig murídea do tipo γΙ (gama 1), cadeia pesada de lg murídea do tipo γ2Α (gama 2A), cadeia pesada de lg murídea do tipo γ2Β (gama 2B), cadeia pesada de lg murídea do tipo γ3 (gama 3) e cadeia pesada de lg murídea do tipo μ (mu).
Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada γ3 de imunoglobulina humana, cadeia pesada γ4 de imunoglobulina humana, cadeia pesada ε de imunoglobulina humana (1) e cadeia pesada ε de imunoglobulina humana (2). Em uma modalidade, o segundo ácido nucléico é derivado/selecionado do grupo de ácidos nucléicos que codificam cadeia δ pesada de imunoglobulina humana, cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada μ de imunoglobulina humana, cadeia pesada murídea do tipo a, cadeia pesada murídea do tipo γΙ, cadeia pesada murídea do tipo γ2Β, cadeia pesada murídea do tipo γ3, e cadeia pesada murídea do tipo μ.
A presente invenção pode ser praticada, por exemplo, sem limitação, com o terceiro ácido nucléico, no caso do ácido nucléico que codifica pelo menos um fragmento de um domínio transmembrana, selecionado do grupo de ácidos nucléicos que codificam receptor C3b/C4b (receptor de complemento tipo 1) (Hourcade, D., et al., J. Exp. Med. 168 (1988) 12551270), EGFR humano, de galinha e de rato (Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., e Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L, et al., Mol. Cell Biol. 10 (1990) 2973-2982), lg α, ε, γ, μ heavy chain (Zhang, Κ., et al., J. Exp. Med. 176 (1992) 233-243; Rogers,J.E., et al., Cell 20 (1980) 303-312; Milcarek, C, e Hall, B., Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, BJ., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293301; Peterson, M.L., Gene Exp. 2 (1992) 319-327), receptor PLA2 humano (Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), Cek5 de galinha (Connor, R. J., e Pasquale, E.B., Oncogene 11 (1995) 2429-2438), FGFR humano (Johnson, D.E., et al., Mol. Cell Biol. 11 (1991) 4627-4634. Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada α (alfa) de imunoglobulina (Ig) humana (hu), cadeia pesada δ (delta) de Ig hu, cadeia pesada ε (epsilon)de Ig hu, cadeia pesada γΙ, γ2, γ3 e γ4 (gama)de Ig hu, cadeia pesada μ (mu) de Ig hu, cadeia pesada de Ig murídea do tipo α (alfa), cadeia pesada de Ig murídea do tipo δ (delta), cadeia pesada de Ig murídea do tipo ε (epsilon), cadeia pesada de Ig murídea do tipo γΙ (gama I), cadeia pesada de Ig murídea do tipo γ2Α (gama 2A), cadeia pesada de Ig murídea do tipo γ2Β (gama 2B), cadeia pesada de Ig murídea do tipo γ3 (gama 3) e cadeia pesada de Ig murídea do tipo μ (mu). Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada γ3 de imunoglobulina humana, cadeia pesada γ4 de imunoglobulina humana, cadeia pesada ε de imunoglobulina humana (1) e cadeia pesada ε de imunoglobulina humana (2). Em uma modalidade, o terceiro ácido nucléico é selecionado do grupo de ácidos nucléicos que codificam cadeia pesada δ de imunoglobulina humana, cadeia pesada γΙ de imunoglobulina humana, cadeia pesada γ2 de imunoglobulina humana, cadeia pesada μ de imunoglobulina humana, cadeia pesada murídea do tipo a, cadeia pesada murídea do tipo γΙ, cadeia pesada murídea do tipo γ2Β, cadeia pesada murídea do tipo γ3 e cadeia pesada murídea do tipo μ.
Além do grupo de ácidos nucléicos que codificam pelo menos um fragmento de um domínio transmembrana, o terceiro ácido nucléico pode ser selecionado do grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI. O grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI compreende o grupo de ácidos nucléicos que codificam um peptídio de sinal para uma âncora GPI derivado de diesterase alcalina humana, acetilcolina esterase, fosfatase alcalina (intestinal, de fígado e placenta), antígeno CAMPATH-1, antígeno carcinoembrionário, CD55, CD59, CD90, contactina-1, antígeno E48, receptor de folato A e
B, proteína p137 ancorada em GPI, antígeno 3 associado a função de linfócito, proteína de interação com mDIA, 5'-nucleotidase, fator ativador de uroquinase plasminogênio; de antígeno LY-6C murídeo, antígeno LY-6, 51nucleotidase, antígeno 0X45, antígeno 2 de célula tronco, molécula 1 de adesão de células vasculares, antígeno 2 de linfócito Qa (Qa2); de trealase de coelho; de proteína brevicano de rato, CD90, proteína glipicano, proteoglicano de sulfato de heparina, antígeno MRC OX-45, 5'-nucleotidase, glicoproteína maior de grânulo secretor pancreático, proteína RT6.2 de superfície de células T; de proteína de reparo de DNA de levedura PHRI, proteína 1 de superfície ancorada a glicofosfolipídio; de proteína precursora de amilóide suíno, dipeptidase; de proteínas de superfície de variantes diversas de Trypanosoma brucei, proteína repetitiva ácida policíclico; de proteína YN em 1.1 de superfície da variante Trypanosoma congolense; de melanotransferrina de galinha, molécula de adesão celular neutra; de acetilcolina esterase de Torpedo marmorata; de proteína de prion de hamster; de 5'-nucleotidase bovina; de proteína de membrana Gp64 de bolor, antígeno específico préesporo; e de Sgpl, Sgp2 de lula.
Na Tabela 1, são dados exemplos de seqüências de ácidos nucléicos do segundo ácido nucléico, de acordo com a invenção. Na Tabela 2, são dados exemplos de seqüências de ácidos nucléicos do terceiro ácido nucléico de acordo com a invenção e de seqüências de aminoácidos correspondentes às seqüências do terceiro ácido nucléico de acordo com a invenção. Na Tabela 3, são dados exemplos de seqüências de ácidos nucléicos do quarto ácido nucléico opcional e de seqüências de aminoácidos correspondentes aos quartos ácidos nucléicos opcionais de acordo com a invenção.
A Tabela 1 relaciona o sítio doador de splice 5', o segundo ácido nucléico (de splicing alternativo) e o sítio receptor de splice 3‘. Como a seqüência do segundo ácido nucléico em geral excede 1 kb, as seqüências relacionadas na Tabela 1 estão encurtadas e mostram aproximadamente o primeiro e os últimos 100 nucleotídeos do segundo ácido nucléico, separados por um número que se refere ao tamanho total do segundo ácido nucléi co completo. A seqüência completa do segundo ácido nucléico está contida na SEQ ID NO dada da listagem de seqüência. O códon de parada está sublinhado.
O sítio doador de splice é dado em um formato compreendendo a seqüência de consenso precedente do sítio doador de splice e os primeiros seis nucleotídeos do segundo ácido nucléico separados por uma linha vertical (veja também, por exemplo, Zhang, M.Q., Human Mol. Gen. 7 (1998) 919-932). Da mesma forma, o sítio receptor de splice é dado pela listagem dos últimos 6 nucleotídeos do segundo ácido nucléico e a seqüência de consenso do sítio receptor de splice sucessivo, que estão separadas por uma linha vertical. Os nucleotídeos diretamente depois (sítio doador de splice 5') e diretamente antes (sítio receptor de splice 31) da linha vertical são os primeiros e últimos nucleotídeos do segundo ácido nucléico (de splicing). O códon de parada no segundo ácido nucléico está sublinhado na Tabela 1.
O segundo ácido nucléico pode estar diretamente ligado ao ácido nucléico que codifica o polipeptídio heterólogo, isto é, o primeiro ácido nucléico, ou com uma pequena (9 a 21 bases) seqüência de ácido nucléico interveniente. Em uma modalidade, o ácido nucléico interveniente opcional (quinto) é derivado do ácido nucléico que precede o segundo ácido nucléico no genoma do qual o dito segundo ácido nucléico é obtido.
Na Tabela 2, relacionam-se exemplos de seqüências do terceiro ácido nucléico que codifica fragmentos dos domínios transmembrana e seqüências de aminoácidos de peptídios de sinal para âncoras GPI. Essa seqüência pode seguir diretamente ou com uma seqüência interveniente opcional, isto é, um quarto ácido nucléico, o sítio receptor de splice 3'. Na Tabela 3, relacionam-se exemplos de quartas seqüências de ácidos nucléicos e de seqüências de aminoácidos correspondentes aos quartos ácidos nucléicos.
Em uma modalidade, o ácido nucléico de acordo com a invenção compreende um quarto ácido nucléico entre o dito segundo ácido nucléico e o dito terceiro ácido nucléico. Em uma modalidade, o ácido nucléico de acordo com a invenção compreende um quinto ácido nucléico entre o dito primeiro ácido nucléico e o dito segundo ácido nucléico. Uma modalidade da presente invenção é que o dito terceiro ácido nucléico é obtido de i) o mesmo, ou ii) um gene ou organismo diferente do dito segundo ácido nucléico, isto é, o dito terceiro ácido nucléico não está necessariamente organizado 5 com o dito segundo ácido nucléico em um genoma.
As seqüências são derivadas de genomas ou bases de dados publicamente disponíveis (por exemplo, projeto do genoma humano, http://www.gdb.org/; base de dados do genoma de camundongo, http://www.informatics.jax.org/; SwissProt (http://www.expasy.org/sprot/).
Quando nenhuma anotação era acessível, as seqüências foram previstas ou complementadas pelo software ALOM (veja, por exemplo, Klein, P., et al., Biochim. Biophys. Acta 787 (1984) 221-226). No caso de domínios transmembrana completos, a seqüência entre parênteses é prevista por ALOM, além da seqüência dada no SwissProt.
Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos compreendendo SEQ ID NO: 001, 002, 003, 004, 005, 006, 007, 008, 009, 151, 152, 153, 154, 155, 156, 157, 158, 159, 169, 170, 171, 172, 173. Em uma modalidade, o segundo ácido nucléico do ácido nucléico de acordo com a invenção é selecionado do grupo de seqüências 20 de ácidos nucléicos de SEQ ID NO: 001 a SEQ ID NO: 009. Em uma modalidade, o segundo ácido nucléico é selecionado do grupo de ácidos nucléicos compreendendo SEQ ID NO: 002, 003, 156, 157, 170 e 171. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do 25 grupo de seqüências de ácidos nucléicos de SEQ ID NO: 010 a SEQ ID NO: 018, e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 019 a SEQ ID NO: 069. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo 30 de seqüências de ácidos nucléicos de SEQ ID NO: 010, 011, 012, 013, 014, 015, 016, 017, 018, 160, 161, 163, 164, 165, 166, 167, 168, 174, 175, 176, e de seqüências de ácidos nucléicos que codificam as seqüências de aminoá43 cidos de SEQ ID NO: 019 a SEQ ID NO: 069 e 162. Em uma modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 011,012, 165, 166, 175 e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 019 a SEQ ID NO: 036. Em outra modalidade, o terceiro ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou é um fragmento de um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 011,012, 165, 166, e 175. Em uma modalidade, o quarto ácido nucléico do ácido nucléico de acordo com a invenção é selecionado de ou compreende um ácido nucléico selecionado do grupo de seqüências de ácidos nucléicos de SEQ ID NO: 070 a SEQ ID NO: 078 e de seqüências de ácidos nucléicos que codificam as seqüências de aminoácidos de SEQ ID NO: 079 a SEQ ID NO: 129.
Tabela 1: Exemplos de segundos ácidos nucléicos
proteína sítio doador de splice 5' SEGUNDO ÁCIDO NUCLÉICO (ÁCIDO NUCLÉICO DE SPLICING) SÍTIO RECEPTOR DE SPLICE 3'
cadeia pesada δ de imunoglobulina humana GCT | GTGAG T GTGAGTCACCCCCAGGCCCAGGGTTG GGACGGGGACTCTGAGGGGGGCCATA AGGAGCTGGAATCCATACTAGGCAGGGGTGGGCACTGGGCAGGGGCGGG ... (2.77 KB TOTAL) ... GACTCGCCGTCATTTCAGCTCCACGCT GTGCGGGGGTGGGTGGAGGGGTAGC CTGGCCCTCATGACCAGGGAGCTTCTCACTCAGCCCCTGTTCCTCCCCAG (SEQ ID NO: 001) CCCCAG|A
cadeia pesada γ1 de imunoglobulina humana CGG | GTAAAT GTAAATGAGTGCCACGGCCGGCAAGC CCCCGCTCCCCAGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTGTACATACTTCCCAGGCACCC ... (1.3 KB TOTAL) ... CCCGGCCGGGCCCTACATCCTGGGTC CTGCCACAGAGGGAATCACCCCCAGA GGCCCAAGCCCAGGGGGACACAG- GTCCAG|A
CACTGACCACCCCCTTCCTGTCCAG (SEQ ID NO: 002)
cadeia pesada γ2 de imunoglobulina humana CGG | GTAAAT GTAAATGAGTGCCACGGCCGGCAAGC CCCCGCTCCCCAGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTCTACATACTTCCCGGGCACCC ... (1.3 KB TOTAL) ... CCCGGCCGGGCCCTACATCCTGGGTC CTGCCACAGAGGGAATCACCCCCAGAGGCCCGAGCCCAGCAGGACACAGTATTGACCACCCACTTCCTGTCCAG (SEQ ID NO: 003) GTCCAG|A
cadeia pesada μ de imunoglobulina humana CCG | GTAAA C GTAAACCCACCCTGTACAACGTGTCCC TGGTCATGTCCGACACAGCTGGCACCTGCTACTGACCCTGC TGGCCTGCCCACAGGCTCGGGGCGGCTGGCC ... (1.9 KB TOTAL) ... GCCTAGGGGCCAAGGGTGGGCCTAGA GGATGGGCCCCGGGGGGGCTTTGCT GGGTGCCACCCCAGCCTGACCCTATT CCCCCGTGCTGTGTCTCCTGCAG (SEQ ID NO: 004) CTGCAG|A
cadeia pesada de Ig murídea tipo α CGG | GTAAA C GTAAACCCACCAATGTCAGCGTGTCTG TGATCATGTCAGAGGGAGATGGCATCTGCTACTGAGCCACCCT GCCTGTCCCTACTCCTGAAATAAACTC TGT ... (2.43 KB TOTAL) ... CCACTGTCCCCAAAGCCCAAGGAGGC ATAGAAGCAGAAACCTTAAGTCTGAGC CCCCATCCCCATGGGTTTGGATCTAGAAGGTCATCTATGTCTTACAG (SEQ ID NO: 005) TTACAG | A
cadeia pesada de Ig murídea tipo ε TTG | GTAAC A GTAACACCTCCCTCCATCCCTCCTAGG CCTCCATGTAGCTGTGGTGGGGAAGG TGGATGACAGACATCCGCTCACTGTTG TAACACCAG- GAAGCTACCCCAATAAACACTCAGTGC CTGATTAGAGCCCTGGGT ...(1.7KB TTGAAG|A
(2) TOTAL)... ACTGGCTGGTCCCACCCCATCCCAGAGCTAGACCTCCAGGACCTATGTATTGAAG (SEQ ID NO: 173)
source sítio doador de splice 5' SEGUNDO ÁCIDO NUCLÉICO (ÁCIDO NUCLÉICO DE SPLICING) SÍTIO RECEPTOR DE SPLICE 3'
cadeia pesada de lg murídea tipo γ1 CTG | GTAAAT gtaaatgatcccagtgtccttggagcc CTCTGGTCCTACAGGACTCTGACACCTACCTCCACCCCTCCCTGTGTAAATAA AGCACCCAGCACTGCCTTGG ... (1.4 KB TOTAL) ... CTGCAGCI I ICTCCTGGGCCTCCATAC AGCCTCCTGCCACACAGGGAATGGCCCTAGCCCCACCTTA TTGGGACAAACACTGACCGCCCTCTCT GTCCAG (SEQ ID NO: 006) GTCCAG|G
cadeia pesada de lg murídea tipo γ2Β CGG | GTAAAT GTAAATGAGCTCAGCACCCACAAAGCT CTCAGGTCCTAAGAGACACTGGCACCCATATCCATGCATCCCTTGTATAAATAAAGCATCCAGCAAAGCCTGG ... (1.36 KB TOTAL)... AGATCTCTCCTCTGACTTCATGCAGAC ATGTCTGCCTCACAGGGAATCTCTCCC AGCATCAAC- CATGTTGGGACAAACACTGACTGTCCT CTCTGTTCAG (SEQ ID NO: 007) GTTCAG | G
cadeia pesada de lg murídea tipo γ3 CTG | GTAAAT GTAAATGAGAACAGCACCTAGCCATTC CTCGGGTCTTACAAGACACTGATACCAGCCCTAACCGGTGAACCCTATAAATAAAGCACCCAGAGATGGGACC ... (TOTAL 1.47 KB) ... CTGCAGCTTTCTCCTGGGCCTCCATGC AGCCTCCTGCCACA- CAGGGAATGGCCCTAGCTCTACCTTGT TGGGACAAACACTGACTTTCCTCTCTG TTCAG GTTCAG|A
(SEQ ID NO: 008)
cadeia pesada de Ig murídea tipo μ CTG | GTAAA C GTAAACCCACACTGTACAATGTCTCCC TGATCATGTCTGACACAGGCGGCACCTGCTATTGACCATGCTAGCGCTCAACCAGGCAGGCCCTGGGTGTCCA ... (TOTAL 1.86 KB)... GTCAATACTCGCTAAGATTCTCCAGAA CCATCAGGGCACCCCAACCCTTATGCA AATGCTCAGTCACCCCAAGACTTGGCTTGACCCTCCCTCTCTGTG TCCCTTCATAG (SEQ ID NO: 009) TCATAG|A
receptor 1 de fator de crescimento de fibroblastos humanos AAG | GTACAC GTACACACTGTAACTTCTCCTCTCGATGTCCT GCCCTCGCCACGGGCAC.GGGGGGAG CATGCAI I ICCAGGCTTGGGGAGACA CAGAGGCAGGAGAGCTGGAAGAATGG GCTCCTGCCTGCCTGGTGCCACATCCTGCCCCAGCTTTGAGGGCTGA ATCCTCTCAGCTCAGA ... (2KB TOTAL) CATGGACGGGGCCCTCCAAGCCTGCT AACACCCTGTTCGCACTGACTCAG SEQ ID NO: 151) ACTCAG | C
receptor de fator de crescimento epitelial murídeo TGG | GTACG T GTACG TTCAATGGCAGTGGATCTTAAAGACCI I I IGGATCTAAGA CCAGAAGCCA TCTCTGACTCCCCTCTCACC ...(2.7KB TOTAL)... GTATGGAATG CCCATATTAC CTTCTCTTGTCTCTCATTCCAG (SEQ ID NO: 152) TTCCAG | G
receptor 1 de comple mento huma- AGG | GTGAG T GGGTGAGTTGGCAGCAACATCTCTTG G l I IAAGAGTTCCAGCACAGCGATAGT AC I I ICTAGCCACATCTCAGCAAGGAA ACTAGGCTATTGCCACCTGCTCTTAAGAGGCTTGAACACA ...(5.7KB TOTAL)... CTTTAG | G
no (C3b/C 4b) TAGACTTCTCCTGCATTGTAATCCCTCT GGTTTGCCACATATGCATGCTGTCAGG AAGTTGATGAGGTATGTACAGCACAATTTA Illi CCA I I I I I IGCCTTTAG (SEQIDNO:153)
receptor de interleucina 4 muridea ACC | GTGAG T GTGAGTAT- CAGGGTCGTAGGCTGTGAGGATCTCTACAGCCG ...(1.3KB TOTAL)... GGGCGGCCTCCCCATTCATGACTGI I I I ICTCCTTGCAG (SEQIDNO:154) TTGCAG|A
cadeia pesada a de imunoglobulina humana CGG | GTAAA C GTAAACCCACCCATGTCAATGTGTCTG TTGTCATGGCGGAGGTGGACGGCACC TGCTACTGAGCCGCCCGCCTGTCCCC ACCCCTGAATAAACTCCATGCTCCCCC AAGCAGCCCCACGCTT ...(2.6KB TOTAL)... CCCAAGGAAGCATAGCCGCTGTTCACACGAGTCTGGGCCTGGCAG (SEQ ID NO: 155) TGGCAG| G
cadeia pesada ε de imunoglobulina humana (1) CCG | GTAAAT GTAAATGACGTACTCCTGCCTCCCTCCCTCCCAGGG CTCCATCCAGCTGTG ...(1.9KB TOTAL) CGTTGACTGACTCGGGACCTGGGTGC CCACCCTCAG (SEQIDNO:156) CCTCAG|G
cadeia pesada δ de imunoglobulina muridea GTG | GTAAG T GTAAGTCACAACTGGGTAAGAGTGTCA AGCAAGGACAGCACTTGGTACCTATGA TAGACAAATACTCCTG I I I GGGAAGAG GAGGTCTGCATTGTCTAGATAAGAGGA ACACTGTGCTTATCTGTTTCAGTTTAAA AGACAGAACTACATAACACTTCACCCTTTCTACAACACTTA- GA I I I I ICAGCCCTCTCCTCTA ...(6.35KB TOTAL)... TTCTGTAGGGTGGAGACCTTCTCAT- CCCTAG|G
GAGCACTAGTTCTTCCCTAG (SEQ ID NO: 172)
cadeia pesada ε de imunoglobulina humana (2) CCG | GTAAAT GTAAATGACGT ACTCCTGCCT CCCTCCCTCC CAGGGCTCCA TCCAGCTGTG ...(2.1KB TOTAL) GCCACTGTGG AGCCGGGAGG GCTGACTGGC CAGGTCCCCC AG (SEQ ID NO: 170) CCCCAG|A
cadeia pesada γ3 de imunoglobulina humana CGG | GTAAAT GTAAAT- GAGTGCGACGGCCGGCAAGCCCCCG CTCCCCGGGCTCTC ...(1.3 KB TOTAL) CCCCAGAGGCCCGAGCCCAGCAGGACACAGCACTGAC- CACCCTCTTCCTGTCCAG (SEQ ID NO: 157) GTCCAG|A
cadeia pesada γ4 de imunoglobulina humana TGG | GTAAAT GTAAATGAGTGCCAGGGCCGGCAAGC CCCCGCTCCCCGGGCTCTCGGGGTCG CGCGAGGATGCTTGGCACGTACCCCGTGTACATACTTC ...(1.3 KB TOTAL) CCCCA- GAGGCCCAAGCCCAGGGGGACACAGCACTGAC- CACCCCCTTCCTGTCCAG (SEQ ID NO: 171) GTCCAG|A
cadeia pesada de lg murídea tipo ε (1) TTG | GTAAC A GTAACACCTCCCTCCATCCCTCCTAGG CCTCCATGTAGCTGTGGTGGGGAAGG TGGATGACAGACATCCGCTCACTGTTG TAACACCAG- GAAGCTACCCCAATAAACACTCAGTGC CTGATTAGAGCCCTGGGT ...(1.5KB TOTAL)... CCACTCTAGCTTCATCAGAACTGCATG AGACAAGTATGGGGTCTACCCCCTCC CCACTGTCACCTGGAGTCTGGGGAAG CTAACTGGCTGGTCCCACCCCATCCCA GAGCTAGACCTCCAGGACC- TTGAAG|A
bulina humana/trecho transmembrana CCTTCATCGTCCTCTTCCTCCTG AGCCTCTTCTACAGTACCACCGTCACCTTGTTCAAG
cadeia pesada de Ig muridea tipo α/trecho transmembrana ACTGTGACCTTCCTCACCCTCTT CCTACTGAGCTTGTTCTACAGCACAGCACTCACTGTTACA 014
cadeia pesada de Ig muridea tipo γΐ/trecho transmembrana GGGCTCTGGACGACCATCACCATCTTCATCAGCCTCTTCCTGCTCAGTGTGTGC(TACAGCGCTGCTGTC ACACTCTTCAAGGTA 015
cadeia pesada de Ig muridea tipo v2B/trecho transmembrana GGGCTCTGGACGACCATCACCATCTTCATCAGCCTCTTCCTGCTCAGCGTGTGC(TACAGCGCCTCTGTC ACACTCTTC) 016
cadeia pesada de Ig muridea tipo v3/trecho transmembrana GGGCTCTGGACGACCATCACCA TCTTCATCAGCCTCTTCCTGCTCAGCGTG TGCTACAGCGCCTCTGTCACCCTCTTC 017
cadeia pesada de Ig muridea tipo μ/trecho transmembrana (AACCTGTGGAC- CACTGCCTCCACC)TTCATCGTC CTCTTCCTCCTGAGCCTCTTCTA CAGCAC- CACCGTCACCCTGTTC(AAGGTG ) 018
acetilcolina esterase humana/peptidio de sinal de âncora GPI sem peptídio de elo opcional GE- AARRPGLPLPLLLLHQLLLLFLSHL RRL 019
fosfatase alcalina humana (intestinal)/peptidio de sinal de âncora GPI sem peptídio de elo opcional DAAHPVAASLPLLAGTLLLLGASAAP 020
fosfatase alcalina humana (figado)/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSAGSLAAGPLLVALALYPLSVLF 021
fosfatase alcalina humana DAAHPGRSVVPALLPLLAG- 022
TATGTATTGAAG (SEQ ID NO: 158)
cadeia pesada de Ig murídea tipo γ2Α TGG | GTAAAT GTAAATGAGCTCAGCACACACAATGCT CCTGGGTCCTAATGGACACTGGCACC CATATCCATGCATCCCTTGTATAAATAAAGCACCCAGCAAAGCCTGGGACCATGTAAAACTGT ...(1.35KB TOTAL)... GAAGGCTCCAGGAAGGGTCTGCTGTA CCAGTCAGGCTGGAGCTCTCTCCTCTA CTTCATGCAAACATGTCTGCATCACAG GGAATCTCTCCCAGCACCAACCATGTTGGGACAAACACTGACTGTCCT CTCTGTTCAG (SEQ ID NO: 159) GTTCAG|G
receptor de interleucina 4 humana ACT | GTGAG T GTGAGTATCAAGAGGCCTAAGCAATGGTAATCTCCACTCTCCATTCTTC CCCTG ...(3.1KB TOTAL)... GGAGCCCAGGCTGTACCATGGCTGACCTCAGCTCATGGCTTCC CCTCCCACTTCCAG (SEQ ID NO: 169) TTCCAG | C
Tabela 2: Exemplos de terceiros ácidos nucléicos e aminoácidos correspondentes aos terceiros ácidos nucléicos.
fonte SEQÜÊNCIA DE NUCLEOTÍDEOS OU AMINOÁCIDOS SEQ ID NO:
cadeia pesada δ de imunoglobulina humana/trecho transmembrana AGCCTGTGGACCACCCTGTCCA CGTTTGTGGCCCTCTTCATCCTC ACCCTCCTCTACAGCGGCATTGTCACTTTCATCAAGGTGAAG 010
cadeia pesada γ1 de imunoglobulina humana/trecho transmembrana GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGTTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC 011
cadeia pesada γ2 de imunoglobulina humana/trecho transmembrana GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGCTAAGCGTGTG CTACAGTGCCACCATCACCTTCTTC 012
cadeia pesada μ de imunoglo- AACCTGTGGGCCACCGCCTCCA 013
(placenta)/peptídio de sinal de âncora GPI sem peptídio de elo opcional TLLLLETATAP
antígeno CAMPATH-1 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional SASSNISGGIFLFFVANAIIHLFCFS 023
antígeno carcinoembrionário humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional ASGTSPGLSAGATVGIMIGVLVGVALI 024
CD55 humano (fator de aceleração de decaimento)/peptídio de sinal de âncora GPI sem peptídio de elo opcional SGTTRLLSGHTCFTLTGLLGTLVT MGLLT 025
CD59 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional NGGTSLSEKTVLLLVTPFLAAAW SLHP 026
antígeno CD90 humano (Thy/1 )/peptídio de sinal de âncora GPI sem peptídio de elo opcional CEGISL- LAQNTSWLLLLLLSLSLLQATDFM SL 027
contactina-1 humana (CNTN1)/peptídio de sinal de âncora GPI sem peptídio de elo opcional SGAPTLSPSLLGLLLPAFGILV 028
antígeno E48 humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional DLCNEKLHNAAPTRTALAHSALSLGLALSLLAVILAPSL 029
receptor de folato A humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional SGAGPWAAWPFLLSLALMLLWLL S 030
receptor de folato B humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional NAGEMLHGTGGLLLSLALMLQLW LLG 031
proteína p137 ancorada a GPI humana/peptídio de sinal de ARGLMNGYRGPAMDSEEDMMV TALHSLTLQTVVIHSLSSVLPGIT- 032
âncora GPI sem peptídio de elo opcional LAIN
antígeno-3 associado a função de linfócitos humanos/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSGHSRHRYALIPIPLAVITTCIVLYMNVL 033
proteína de interação mDIA humana/peptídio de sinal de âncora GPI sem peptídio de elo opcional SGASSLHRHFGLLLASLAPLVLCL SLL 034
5'-nucleotidase humana/peptídio de sinal de âncora GPI sem peptídio de elo opcional STGSHCHGSFSLIFLSLWAVIFVLYQ 035
fator ativador de uroquinase plasminogênio humano/peptídio de sinal de âncora GPI sem peptídio de elo opcional GAAPQPGPAHLSLTITLLMTARLWGGTLLWT 036
antígeno LY-6C de proteína de superfície celular murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional NAAVPTGASTWTMAGVLLFSLSS VILQTLL 037
5'-nucleotidase murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional NERLVSAAPGHALLSSVTLGLATSLSLLTVMAL CL 038
antígeno 0X45 murídeo (BCM-1 ou Blast-1)/peptídio de sinal de âncora GPI sem peptídio de elo opcional SAASHYQGSFPLVILSLSAVIFVLYQ 039
antígeno 2 de célula tronco murídea/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSGVCWTATWLVVTTLIIHRILLT 040
molécula 1 de adesão de células vasculares murídeas/peptídio de sinal de âncora GPI sem peptídio de elo NFSAAGLGLRASIPLLGLGLLLSLLALLQLSP 041
opcional
proteína brevicano de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional AKSFYFICYLCLYLAL 042
antígeno CD90 (Thy-1) de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional GNSAEGSMPAFLLFLLLQLWDT 043
proteína glipicano de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional CGGISLLVQNTSWLLLLLLSLSFL QATDFISL 044
antígeno MRC OX-45 de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional SAATR- PEPHYFFLLFLFTLVLAAARPRWR 045
5'-nucleotidase de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSGVHWIAAWLVVTLSIIPSILLA 046
glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional SAASHYQGSFPLIILSFWAVILVLYQ 047
proteína RT6.2 de superfície de células T de rato/peptídio de sinal de âncora GPI sem peptídio de elo opcional RNTGFLLAWPTFFLPVFLAWLF 048
proteína PHR1 de reparo de DNA de levedura/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSAGARESCVSLFLVVLPSLLVQLLCLAE P 049
proteína 1 de superfície ancorada a glicofosfolipídio de levedura/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSGVKATQQMSMVKLVSIITIVTAFVGGMSVVF 050
proteína precursora de amilóide suíno/peptídio de sinal de âncora GPI sem peptídio de elo opcional NAATNVKANLAQWFTSIISLSIAAGVGFALV 051
dipeptidase suína/peptídio de sinal de âncora GPI sem peptídio de elo opcional ARAAPTTSLGSLMTVSALAILGWS V 052
proteína IL Tat 1.1 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional SAAPSLHLPPGSLLASLVPLLLLSL P 053
proteína MIT 117a de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional SNSFVIHKAPLFLAFLLF 054
proteína MIT 118a de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional DSSILVTKKFALTVVSAAFVALLF 055
proteína MIT 221 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional NGSFLTSKQFAFSVVSAAFVALLF 056
proteína MITat 1.1000BC de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional SNSFVISKTPLWLAVLLF 057
proteína MITat 1.5b de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional DGSFLVNKKFALMVYDFVSLLAF 058
proteína repetitiva ácida procíclica de Trypanosoma brucei/peptídio de sinal de âncora NGSFLTSKQFALMVSAAFVTLLF 059
GPI sem peptídio de elo opcional
proteína TxTat 1 de superfície variante de Trypanosoma brucei/peptídio de sinal de âncora GPI sem peptídio de elo opcional GAATLKSVALPFAIAAAALVAAF 060
proteína YNat 1.1 de superfície variante de Trypanosoma congolense/peptídio de sinal de âncora GPI sem peptídio de elo opcional SNSFVINKAPLLLGFLLF 061
melanotransferrina de galinha/peptídio de sinal de âncora GPI sem peptídio de elo opcional SGSSHGTKAIRSILHVALLM 062
molécula de adesão de células neurais de galinha/peptídio de sinal de âncora GPI sem peptídio de elo opcional AGNKLIQQHLLVITFVPFIILGQLQGLG 063
acetilcolina esterase de Torpedo marmorata/peptídio de sinal de âncora GPI sem peptídio de elo opcional ATLGSPSTSSSFVSLLLSAVTLLLL C 064
proteína prion de hamster/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSSGTSSSKGIIFYVLFSILYLIFY 065
5'-nucleotidase bovina/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSAVLFSSPPVILLISFLIFLMVG 066
proteína Gp64 de membrana de bolor/peptídio de sinal de âncora GPI sem peptídio de elo opcional SAGSHCCGSFSLIFLSVLAVIIILYQ 067
antígeno específico préesporo de bolor/peptídio de sinal de âncora GPI sem peptídio de elo opcional SSATTIAFNAFVVFAIVLSVLLF 068
receptor 1 do fator de crescimento de fibroblastos humanos GSASTWASLSLIIFSMILSLC 069
receptor do fator de crescimento epitelial murideo TCGCCCCTGTACCTGGAGATCA TCATCTATTGCA- CAGGGGCCTTCCTCATCTCCTG CATGGTGGGGTCGGTCATCGTCTAC 160
receptor 1 de complemento humano (C3b/C4b) AAGATACCATCTATTGCCACTGG GATTGTGGGTGGCCTCCTCTTC ATAGTGGTGGTGGCCCTTGGGA TTGGCCTATTCATGCGAAGACGT 161
receptor 4 de interleucina humana THDALIVGTLSGTIFFILLIIFLSWIILK 162
receptor 4 de interleucina murídea TTCGAGCAG- CACCTCCTGCTGGGCGTCAGCG TTTCCTGCATTGTCA TCCTGGCCGTCTGCCTGTTGTG CTATGTCAGCATCACCAAGATTAAG 174
cadeia pesada a de imunoglobulina humana/trecho transmembrana CGCCTTCCACTGGGGGTCACCA TCTCCTGCCTCTGCATCCCGTT GI I I IGCCTGTTCTGTTACTTCA GCATTACCAAGATT 163
cadeia pesada ε de imunoglobulina humana/trecho transmembrana ACCAT- CACCTTCCTCACCCTCTTCCTGC TGAGCCTGTTCTATAGCACAGCACTGACCGTGACC 164
cadeia pesada γ3 de imunoglobulina humana/trecho transmembrana TGGACGTGGACCGGCCTCTGCA TCTTCGCCGCACTCTTCCTGCT CAGCGTGAGCTACAGCGCCGCCATCACGCTCCTCATGGTGCAG 165
cadeia pesada γ4 de imunoglobulina humana/trecho transmembrana GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGTTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC 166
cadeia pesada de lg murídea tipo ε/trecho transmembrana GGGCTGTGGACGACCATCACCA TCTTCATCACACTCTTCCTGCTAAGCGTGTG CTACAGTGCCACCGTCACCTTCTTC 175
cadeia pesada de lg murídea tipo δ/trecho transmembrana GAGCTGTGGACCAGTATTTGTG TCTTCAT- CACCCTGTTCCTGCTCAGTGTG AGCTATGGGGCCACTGTCACCG TCCTC 167
cadeia pesada de lg murídea tipo y2A/trecho transmembrana GGCCTGTGGCCCACAATGTGCA CCTTCGTGGCCCTCTTCCTGCT CACACTGCTCTACAGTGGCTTCGTCACCTTCATCAAGGTA 176
GGGCTCTGGACAACCATCACCA TCTTCATCAGCCTCTTCCTGCTCAGCGTG TGTTACAGCGCCTCTGTCACACTCTTC 168
Table 3: Exemplos de quartos ácidos nucléicos e aminoácidos correspondentes aos quartos ácidos nucléicos.
fonte SEQÜÊNCIA DE NUCLEOTÍDEOS OU AMINOÁCIDOS SEQ ID NO:
cadeia pesada δ de imunoglobulina humana ACCTGGCCATGACCCCCCTGATCCC 070
cadeia pesada γ1 de imunoglobulina humana AGCTGCAACTGGAGGAGAGCTGTGCGGAG 071
cadeia pesada γ2 de imunoglobulina humana AGCTGCAACTGGAGGAGAGCTGTGCGGAGGCGC 072
cadeia pesada μ de imunoglobulina humana AGGGGGAGGTGAGCGCCGAC GAGGA 073
cadeia pesada de lg murídea tipo α AACGTCAAGAGCCACTTTCCTATGTGCTAC T 074
cadeia pesada de lg murídea tipo γ1 GGCTGCAACTGGACGAGACCTGTGCTGAGGCCCAGGACGGGGAGCTGG 075
cadeia pesada de Ig murídea tipo γ2Β GGCTAGACCTGGATGATATCTGTGCTG 076
cadeia pesada de Ig murídea tipo γ3 AGCTGGAACTGAATGAGACCTGT 077
cadeia pesada de Ig murídea tipo μ AGGGGGAGGTGAATGCTGAGGAGGAAGGCTTTG 078
acetilcolina esterase humana GFTH 079
fosfatase alcalina humana (intestinal) ACTT 080
fosfatase alcalina humana (fígado) CAPA 081
fosfatase alcalina humana (placenta) AGTT 082
antígeno CAMPATH-1 humano TSSP 083
antígeno carcinoembrionário humano ITVS 084
CD55 humano (fator de aceleração de decaimento) SGTT 085
CD59 humano EQLE 086
antígeno CD90 humano (Thy/1) KLVK 087
contactoa-1 humana (CNTN1) QVKI 088
antígeno E48 humano CCQE 089
receptor de folato A humano AAAM 090
receptor de folato B humano AMHV 091
proteína p137 ancorada a GPI humana GSRG 092
antígeno-3 associado a função de linfócitos humanos TCIP 093
proteína de interação mDIA humana YGYS 094
5'-nucleotidase humana RIKF 095
fator ativador de uroquinase plasminogênio humano QYRS 096
antígeno LY-6C de proteína de superfície celular murídea EDLC 097
antígeno Ly-6 murídeo ThB TDLC 098
5'-nucleotidase murídea RIKF 099
antígeno 0X45 murídeo (BCM-1 ou Blast-1) DLAR 100
antígeno 2 de célula tronco murídea SSFC 101
molécula 1 de adesão de células vasculares murídeas HLMF 102
proteína brevicano de rato/âncora GPI APSS 103
antígeno CD90 (Thy-1) de rato KLVK 104
proteína glipicano de rato GQKT 105
antígeno MRC OX-45 de rato TLAR 106
5'-nucleotidase de rato RIKF 107
glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato NGTP 108
proteína RT6.2 de superfície de células T de rato NCLY 109
proteína PHR1 de reparo de DNA de levedura GSSS 110
proteína 1 de superfície ancorada a glicofosfolipídio de levedura SSKK 111
proteína precursora de amilóide suíno EPLS 112
dipeptidase suína NYGY 113
proteína ILTat 1.1 de superfície variante de Trypanosoma brucei NTTG 114
proteína MIT 117a de superfície variante de Trypanosoma brucei NACK 115
proteína MIT 118a de superfície variante de Trypanosoma brucei EKCR 116
proteína MIT 221 de superfície variante de Trypanosoma brucei TTGS 117
proteína MITat 1.1000BC de superfície variante de Trypanosoma brucei EKCC 118
proteína MITat 1.5b de superfície variante de Trypanosoma brucei EDCR 119
proteína repetitiva ácida procíclica de Trypanosoma brucei EPEP 120
proteína TxTat 1 de superfície variante de Trypanosoma brucei NTTA 121
proteína YNat 1.1 de superfície variante de Trypanosoma congolense SHLP 122
melanotransferrina de galinha QCSG 123
molécula de adesão de células neurais de galinha TVIP 124
acetilcolina esterase de Torpedo marmorata DGEL 125
proteína prion de hamster DGRR 126
5'-nucleotidase bovina RIQF 127
proteína Gp64 de membrana de bolor NNVC 128
antígeno específico préesporo de bolor SI I I 129
Em uma modalidade, o polipeptídio é uma cadeia pesada de imunoglobulina, e o domínio transmembrana é o de uma cadeia pesada de imunoglobulina. Para a expressão de uma imunoglobulina, o ácido nucléico da presente invenção é introduzido juntamente com um ácido nucléico que 5 codifica uma cadeia leve de imunoglobulina em uma célula hospedeira eucariótica. Esses ácidos nucléicos podem estar localizados no mesmo ácido nucléico ou em diferentes ácidos nucléicos.
A invenção engloba um vetor compreendendo o ácido nucléico da invenção, assim como uma célula eucariótica compreendendo o vetor da invenção.
A variante solúvel do polipeptídio heterólogo codificado pelo ácido nucléico de acordo com a invenção pode ser produzida pela transfecção de uma célula eucariótica com o ácido nucléico da invenção, cultivo da célula sob condições adequadas para a expressão do polipeptídio codificado pelo dito ácido nucléico, e recuperação do polipeptídio do citoplasma das células ou meio de cultura.
Para a fabricação de uma célula eucariótica de acordo com a invenção, apresenta-se um kit. O kit compreende um vetor contendo pelo menos dois sítios de clonagem múltipla e um ácido nucléico de splicing começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', em que i) o ácido nucléico compreende um códon de parada de tradução e um sinal de poliadenilação, e ii) o ácido nucléico não é constitutivamente removido durante o processamento de pré-mRNA.
Em uma modalidade, a célula eucariótica da invenção é uma célula de mamífero. Em uma modalidade, a célula de mamífero é uma célula selecionada do grupo que compreende células CHO, células NSO, células Sp2/0, células COS, K652 cells, células BHK, células PER.C6® e células HEK.
Os exemplos a seguir, listagem de seqüência e figuras são apresentados para auxiliar na compreensão da presente invenção, cujo verdadeiro âmbito é exposto nas reivindicações anexas. Deve-se entender que se podem fazer modificações nos procedimentos apresentados, sem sair do espírito da invenção.
Descrição das Figuras
Figura 1: Cartões de plasmídios do vetor de expressão de slgG/mlgG pmlgG-A (A), vetor de expressão de slgG/mlgG pmlgGA-A (B) e vetor de expressão de slgG plgG-A (C). Os elementos de vetor representados são descritos em detalhes no texto.
Figura 2: Representação esquemática das estruturas de éxon intron dos cassetes de expressão de cadeia gama.
A: Estrutura da região constante de cadeia gama 1 em um vetor de expressão pmlgG-A. O fragmento de DNA de aprox. 7,2 kb é apresentado como uma linha preta. Os éxons são representados por caixas claras, 5 com suas designações indicadas acima. A posição do sítio de poliadenilação para a forma secretada [p(A)s] e para a forma ligada a membrana [p(A)m] da IgG é apresentada por barras pretas. A numeração dos introns e da 3' UTR é indicada abaixo do diagrama. Mostram-se as posições relativas do sítio de restrição Sphl no íntron 6 e o sítio Sph I com mutação na 3'UTR (entre pa10 rênteses).
B: Estrutura da região constante de cadeias gama 1 - gama 3 gama 4 híbridas de aprox. 4,8 kb em um vetor de expressão pmlgGA-A, conforme representado em A. Além disso, o diagrama indica as regiões derivadas dos três loci do gene de cadeia gama constante pesada de imunoglobu15 lina (IGHGI, IGHG3 e IGHG4).
Figura 3: Correlação da secreção de IgG e sinal de superfície celular em clones que expressam mlgG. Seis clones independentes de células Sp2/0-Agl4 transfectadas com o plasmídio pmlgG-A (esquerda), pmlgGA-A (meio) ou plgG-A como controle (direita) são cultivados durante 20 48 horas sob condições definidas. A intensidade de fluorescência mediana na citometria de fluxo, como uma medida da quantidade de IgG ligada à membrana plasmática, é representada por barras cinza. A concentração de IgG secretada nos sobrenadantes de cultura celular correspondentes é representada por diamantes pretos.
Figura 4: Gráfico de pontos FLI /FSC típico usado para a classificação de células em um citômetro de fluxo FACS Vantage (BD). A porta RI compreende 5,7% da população de células vivas representada que foram previamente conectadas por porta por um gráfico de pontos FSC/SSC. Células que se encontravam em RI foram coletadas durante o processo de classi30 ficação.
Figura 5: Determinação das taxas de produção específicas. Os clones 5B11, 9B3 e J5-H3 foram cultivados em balões rotativos durante 92 horas.
A: Crescimento celular. Nos momentos indicados, após o início das culturas rotativas, a contagem de células de cada clone foi medida com um contador de células CASY.
B: Produção de IgG. Nos momentos indicados (como em A), as concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por cromatografia de afinidade de proteína A.
C: Taxas de produção específicas. O gráfico de barras mostra a taxa de produção específica média para cada clone calculada a partir das contagens celulares e medições de IgG nas primeiras 69 horas (veja Tabela 2 e veja texto para detalhes adicionais). Os desvios padrões são indicados por barras de erro.
Figura 6: Microscopia de imunofluorescência. O clone 5B11 (imagens 1, 4), que expressa slgG secretada e mlgG ligada a membrana, o clone J5-H3 (imagens 2, 5), que expressa apenas slgG secretada, ou células Sp2/0-Agl4 não transfectadas (imagens 3, 6) foram marcados para IgG na superfície celular (imagens 1-3), ou IgG intracelular (imagens 4-6), e imagens registradas em um microscópio de fluorescência Axiophot.
Figura 7: Análise de mRNA por Northern blot.
A: Auto-radiografia de um Northern blot hibridizado com sonda A marcada com [a-32P] (pistas 1 - 3) ou sonda B (pistas 4 - 6). Em cada pista, 10 pg de RNA total isolados do clone 5B11 (pistas 1, 4), clone J5-H3 (pistas 2, 5) ou células Sp2/0-Agl4 não transfectadas (pistas 3, 6) foram separados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon.
B: Representação esquemática das duas isoformas de mRNA que codificam a cadeia pesada de mlgG ligada a membrana ou slgG secretada. Os éxons são representados por caixas. As regiões complementares às sondas A e B estão marcadas com barras pretas.
Figura 8: Análise de imunotransferência de isoformas de cadeia pesada de IgG. Os clones 5B11 (pistas 1, 4), J5-H3 (pistas 2, 5) ou células Sp2/0-Agl4 não transfectadas (pistas 3, 6) foram extraídos de acordo com o método de extração com carbonato alcalino (veja texto). Imunoglobulinas das frações de membrana, que contêm proteínas de membrana integradas (pistas 1 - 3), ou das frações SN, que contêm predominantemente teores solúveis das células (pistas 4 - 6), foram purificadas por ensaio de extração de proteína A e separadas por eletroforese em SDS gel de poliacrilamida desnaturante. Depois da transferência e marcação com anticorpo secundário acoplado a peroxidase de raiz-forte, as cadeias pesadas foram visualizadas por uma reação de quimioluminescência. As cadeias pesadas de SlgG secretada (slgG HC) e cadeias pesadas de mlgG ligada a membrana (mlgG HC) estão indicadas. O painel inferior mostra uma exposição de curta duração de uma seção da transferência no painel superior.
Figura 9: Análise de mRNA por Northern blot. Auto-radiografia de Northern blots hibridizados com sonda A marcada com [a-32P] (painel esquerdo) ou sonda B (painel direito), conforme mostrado na figura 7B. Em cada pista, 10 pg de RNA total isolado dos clones 1A1, 1B6, 1C5 ou IDI (pistas 1 - 4) e dos clones 1D6, 2D6, KO2 ou KO6 (pistas 6 - 9) foram separados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon. O clone 27 expressa apenas slgG e foi adicionado para controle (pistas 5, 10). Os mRNAs de cadeia pesada das isoformas mlgG e slgG estão indicados..
Figura 10: Cartão de plasmídio do vetor de expressão de slgG/lgG-GPI plgG-GPI-B.
Descrição das Tabelas
Tabela 1: Exemplos de segundos ácidos nucléicos.
Tabela 2: Exemplos de terceiros ácidos nucléicos e aminoácidos correspondentes aos terceiros ácidos nucléicos.
Tabela 3: Exemplos de quartos ácidos nucléicos e aminoácidos correspondentes aos quartos ácidos nucléicos.
Tabela 4: Primer oligonucleotídico para clonagem e mutagênese na construção do vetor de expressão de slgG/mlgG '.pmlgG-A1.
Tabela 5: SPR médio determinado para cada clone selecionado com base em quatro SPRs distintos, calculados em vários momentos duran65 te a fase de crescimento exponencial.
Tabela 6: A Tabela 4 mostra a distribuição de clones para diferentes níveis de concentração de IgG três semanas após deposições de células únicas em placas de 96 poços e análise dos sobrenadantes de cultura celular de 515 clones classificados para mlgG e de 550 clones de controle por ELISA.
Tabela 7: A Tabela 5 mostra a distribuição de clones para diferentes níveis de concentração de IgG na segunda seleção.
Tabela 8: Contagem de células de culturas de agitador no dia 0, 1,2, 3, 4 e 7 de cada clone determinada com um contador de células CASY® TT (Scharfe Systems).
Tabela 9: Determinação de produtividade de culturas de agitador de 10 dias por ELISA.
Descrição das Seqüências
SEQ ID NO: 001 Segundo ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana
SEQ ID NO: 002 Segundo ácido nucléico derivado de cadeia pesada y1 de imunoglobulina humana
SEQ ID NO: 003 Segundo ácido nucléico derivado de cadeia pesada y2 de imunoglobulina humana
SEQ ID NO: 004 Segundo ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana
SEQ ID NO: 005 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo α
SEQ ID NO: 006 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γΙ
SEQ ID NO: 007 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β
SEQ ID NO: 008 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3
SEQ ID NO: 009 Segundo ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ
SEQ ID NO: 010 Terceiro ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana
SEQ ID NO: 011 Terceiro ácido nucléico derivado de cadeia pesada γ1 de imunoglobulina humana
SEQ ID NO: 012 Terceiro ácido nucléico derivado de cadeia pesada γ2 de imunoglobulina humana
SEQ ID NO: 013 Terceiro ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana
SEQ ID NO: 014 Terceiro ácido nucléico derivado de cadeia pe10 sada de imunoglobulina murídea tipo α
SEQ ID NO: 015 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ1
SEQ ID NO: 016 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β
SEQ ID NO: 017 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3
SEQ ID NO: 018 Terceiro ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ
SEQ ID NO: 019 Terceiro ácido nucléico derivado de AChE hu20 mana
SEQ ID NO: 020 Terceiro ácido nucléico derivado de fosfatase alcalina intestinal humana
SEQ ID NO: 021 Terceiro ácido nucléico derivado de fosfatase alcalina de fígado humana
SEQ ID NO: 022 Terceiro ácido nucléico derivado de fosfatase alcalina de placenta humana
SEQ ID NO: 023 Terceiro ácido nucléico derivado de antígeno CAMPATH-1 humano
SEQ ID NO: 024 Terceiro ácido nucléico derivado de antígeno 30 carcinoembrionário humano
SEQ ID NO: 025 Terceiro ácido nucléico derivado de CD55 humano
SEQ ID NO: 026 Terceiro ácido nucléico derivado de CD59 humano
SEQ ID NO: 027 Terceiro ácido nucléico derivado de CD90 humano
SEQ ID NO: 028 Terceiro ácido nucléico derivado de contactina- humana
SEQ ID NO: 029 Terceiro ácido nucléico derivado de antígeno
E48 humano
SEQ ID NO: 030 Terceiro ácido nucléico derivado de receptor de folato A humano
SEQ ID NO: 031 Terceiro ácido nucléico derivado de receptor de folato B humano
SEQ ID NO: 032 Terceiro ácido nucléico derivado de proteína p137 ancorada em GPI humana
SEQ ID NO: 033 Terceiro ácido nucléico derivado de antígeno-3 associado à função de linfócitos humano
SEQ ID NO: 034 Terceiro ácido nucléico derivado de proteína de interação com mDIA humana
SEQ ID NO: 035 Terceiro ácido nucléico derivado de 5'nucleotidase humana
SEQ ID NO: 036 Terceiro ácido nucléico derivado de fator ativador de uroquinase plasminogênio humano
SEQ ID NO: 037 Terceiro ácido nucléico derivado de antígeno
LY-6C de proteína de superfície celular murídeo
SEQ ID NO: 038 Terceiro ácido nucléico derivado de antígeno
LY-6 ThB murídeo
SEQ ID NO: 039 Terceiro ácido nucléico derivado de 5'nucleotidase murídea
SEQ ID NO: 040 Terceiro ácido nucléico derivado de antígeno
0X45 murídeo
SEQ ID NO: 041 Terceiro ácido nucléico derivado de antígeno 2 de célula tronco murídeo
SEQ ID NO: 042 Terceiro ácido nucléico derivado de molécula 1 de adesão de células vasculares murídea
SEQ ID NO: 043 Terceiro ácido nucléico derivado de brevicano de rato
SEQ ID NO: 044 Terceiro ácido nucléico derivado de antígeno CD90 de rato
SEQ ID NO: 045 Terceiro ácido nucléico derivado de glipicano de rato
SEQ ID NO: 046 Terceiro ácido nucléico derivado de antígeno
MRC 0X45 de rato
SEQ ID NO: 047 Terceiro ácido nucléico derivado de 5'nucleotidase de rato
SEQ ID NO: 048 Terceiro ácido nucléico derivado de glicoproteína GP2 maior de membrana de grânulo secretor pancreático de rato
SEQ ID NO: 049 Terceiro ácido nucléico derivado de proteína RT6.2 de superfície de células T de rato
SEQ ID NO: 050 Terceiro ácido nucléico derivado de proteína PHR1 de reparo de DNA de levedura
SEQ ID NO: 051 Terceiro ácido nucléico derivado de proteína-1 de superfície ancorada em glicofosfolipídio de levedura
SEQ ID NO: 052 Terceiro ácido nucléico derivado de proteína precursora de amilóide suína
SEQ ID NO: 053 Terceiro ácido nucléico derivado de dipeptidase suína
SEQ ID NO: 054 Terceiro ácido nucléico derivado de proteína IL Tat 1.1 de superfície variante de Trypanosoma brucei . SEQ ID NO: 055 Terceiro ácido nucléico derivado de proteína
MIT 117a de superfície variante de Trypanosoma brucei
SEQ ID NO: 056 Terceiro ácido nucléico derivado de proteína MIT 118a de superfície variante de Trypanosoma brucei
SEQ ID NO: 057 Terceiro ácido nucléico derivado de proteína
MIT 221 de superfície variante de Trypanosoma brucei
SEQ ID NO: 058 Terceiro ácido nucléico derivado de proteína MITat 1.1000 BC de superfície variante de Trypanosoma brucei
SEQ ID NO: 059 Terceiro ácido nucléico derivado de proteína MITat 1.5b de superfície variante de Trypanosoma brucei
SEQ ID NO: 060 Terceiro ácido nucléico derivado de proteína repetitiva ácida procíclica de Trypanosoma brucei
SEQ ID NO: 061 Terceiro ácido nucléico derivado de proteína TxTat 1 de superfície variante de Trypanosoma brucei
SEQ ID NO: 062 Terceiro ácido nucléico derivado de proteína YN em 1.1 de superfície variante de Trypanosoma congolense
SEQ ID NO: 063 Terceiro ácido nucléico derivado de melanotransferrina de galinha
SEQ ID NO: 064 Terceiro ácido nucléico derivado de molécula de adesão de células neurais de galinha
SEQ ID NO: 065 Terceiro ácido nucléico derivado de AChE de Torpedo marmorata
SEQ ID NO: 066 Terceiro ácido nucléico derivado de proteína de prion de hamster
SEQ ID NO: 067 Terceiro ácido nucléico derivado de 5'nucleotidase bovina
SEQ ID NO: 068 Terceiro ácido nucléico derivado de proteína Gp64 de membrana de bolor
SEQ ID NO: 069 Terceiro ácido nucléico derivado de antígeno específico de pré-esporo de bolor
SEQ ID NO: 070 Quarto ácido nucléico derivado de cadeia pesada δ de imunoglobulina humana
SEQ ID NO: 071 Quarto ácido nucléico derivado de cadeia pesada y1 de imunoglobulina humana
SEQ ID NO: 072 Quarto ácido nucléico derivado de cadeia pesada y2 de imunoglobulina humana
SEQ ID NO: 073 Quarto ácido nucléico derivado de cadeia pesada μ de imunoglobulina humana
SEQ ID NO: 074 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo α
SEQ ID NO: 075 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ1
SEQ ID NO: 076 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ2Β
SEQ ID NO: 077 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo γ3
SEQ ID NO: 078 Quarto ácido nucléico derivado de cadeia pesada de imunoglobulina murídea tipo μ
SEQ ID NO: 079 Quarto ácido nucléico derivado de AChE humana
SEQ ID NO: 080 Quarto ácido nucléico derivado de fosfatase alcalina intestinal humana
SEQ ID NO: 081 Quarto ácido nucléico derivado de fosfatase alcalina de fígado humana
SEQ ID NO: 082 Quarto ácido nucléico derivado de fosfatase alcalina de placenta humana
SEQ ID NO: 083 Quarto ácido nucléico derivado de antígeno
CAMPATH-1 humano *
SEQ ID NO: 084 Quarto ácido nucléico derivado de antígeno carcinoembrionário humano
SEQ ID NO: 085 Quarto ácido nucléico derivado de CD55 humano
SEQ ID NO: 086 Quarto ácido nucléico derivado de CD59 humano
SEQ ID NO: 087 Quarto ácido nucléico derivado de CD90 humano
SEQ ID NO: 088 Quarto ácido nucléico derivado de contactina-1 humana
SEQ ID NO: 089 Quarto ácido nucléico derivado de antígeno
E48 humano
SEQ ID NO: 090 Quarto ácido nucléico derivado de receptor de folato A humano
SEQ ID NO: 091 Quarto ácido nucléico derivado de receptor de folato B humano
SEQ ID NO: 092 Quarto ácido nucléico derivado de proteína p137 ancorada em GPI humana
SEQ ID NO: 093 Quarto ácido nucléico derivado de antígeno-3 associado à função de linfócitos humano
SEQ ID NO: 094 Quarto ácido nucléico derivado de proteína de interação com mDIA humana
SEQ ID NO: 095 Quarto ácido nucléico derivado de 51nucleotidase humana
SEQ ID NO: 096 Quarto ácido nucléico derivado de fator ativador de uroquinase plasminogênio humano
SEQ ID NO: 097 Quarto ácido nucléico derivado de antígeno de proteína LY-6C de superfície celular murídeo
SEQ ID NO: 098 Quarto ácido nucléico derivado de antígeno LY6 ThB murídeo
SEQ ID NO: 099 Quarto ácido nucléico derivado de 5'nucleotidase murídea
SEQ ID NO: 100 Quarto ácido nucléico derivado de antígeno 0X45 murídeo
SEQ ID NO: 101 Quarto ácido nucléico derivado de antígeno 2 de célula tronco murídeo
SEQ ID NO: 102 Quarto ácido nucléico derivado de molécula 1 de adesão de células vasculares murídea
SEQ ID NO: 103 Quarto ácido nucléico derivado de brevicano de rato
SEQ ID NO: 104 Quarto ácido nucléico derivado de antígeno
CD90 de rato
SEQ ID NO: 105 Quarto ácido nucléico derivado de glipicano de rato
SEQ ID NO: 106 Quarto ácido nucléico derivado de antígeno
MRC 0X45 de rato
SEQ ID NO: 107 Quarto ácido nucléico derivado de 5'nucleotidase de rato
SEQ ID NO: 108 Quarto ácido nucléico derivado de glicoproteína
GP2 maior de membrana de grânulo secretor pancreático de rato
SEQ ID NO: 109 Quarto ácido nucléico derivado de proteína RT6.2 de superfície de células T de rato
SEQ ID NO: 110 Quarto ácido nucléico derivado de proteína PHR1 de reparo de DNA de levedura
SEQ ID NO: 111 Quarto ácido nucléico derivado de proteína-1 de superfície ancorada em glicofosfolipídio de levedura
SEQ ID NO: 112 Quarto ácido nucléico derivado de proteína precursora de amilóide suína
SEQ ID NO: 113 Quarto ácido nucléico derivado de dipeptidase suína
SEQ ID NO: 114 Quarto ácido nucléico derivado de Proteína IL
Tat 1.1 de superfície variante de Trypanosoma brucei
SEQ ID NO: 115 Quarto ácido nucléico derivado de proteína MIT 117a de superfície variante de Trypanosoma brucei
SEQ ID NO: 116 Quarto ácido nucléico derivado de proteína MIT
118a de superfície variante de Trypanosoma brucei
SEQ ID NO: 117 Quarto ácido nucléico derivado de proteína MIT
221 de superfície variante de Trypanosoma brucei
SEQ ID NO: 118 Quarto ácido nucléico derivado de proteína MlTat 1.1000 BC de superfície variante de Trypanosoma brucei
SEQ ID NO: 119 Quarto ácido nucléico derivado de proteína MlTat 1.5b de superfície variante de Trypanosoma brucei
SEQ ID NO: 120 Quarto ácido nucléico derivado de proteína repetitiva ácida procíclica de Trypanosoma brucei
SEQ ID NO: 121 Quarto ácido nucléico derivado de proteína TxTat 1 de superfície variante de Trypanosoma brucei
SEQ ID NO: 122 Quarto ácido nucléico derivado de proteína YNat 1.1 de superfície variante de Trypanosoma congolense
SEQ ID NO: 123 Quarto ácido nucléico derivado de melanotransferrina de galinha
SEQ ID NO: 124 Quarto ácido nucléico derivado de molécula de adesão de células neurais de galinha
SEQ ID NO: 125 Quarto ácido nucléico derivado de AChE de Torpedo marmorata
SEQ ID NO: 126 Quarto ácido nucléico derivado de proteína de prion de hamster
SEQ ID NO: 127 Quarto ácido nucléico derivado de 5'nucleotidase bovina
SEQ ID NO: 128 Quarto ácido nucléico derivado de proteína Gp64 de membrana de bolor
SEQ ID NO: 129 Quarto ácido nucléico derivado de antígeno específico de pré-esporo de bolor
SEQ ID NO: 130 Gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a CH3 com todos os introns intervenientes e a região não traduzida 3' adjacente.
SEQ ID NO: 131 Seqüência de aminoácidos da região constante de cadeia γ codificada pelo plasm ídio plgG-A.
SEQ ID NO: 132 Primer oligonucleotídico TM-fw1
SEQ ID NO: 133 Primer oligonucleotídico TM-rv1
SEQ ID NO: 134 Primer oligonucleotídico Ml-rv
SEQ ID NO: 135 Primer oligonucleotídico M2-fw
SEQ ID NO: 136 Primer oligonucleotídico TM-fw2
SEQ ID NO: 137 Primer oligonucleotídico TM-rv2
SEQ ID NO: 138 Primer oligonucleotídico mutSphl-1
SEQ ID NO: 139 Primer oligonucleotídico mut Sphl-2
SEQ ID NO: 140 Gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a M2 com todos os introns intervenientes, o sítio de poliadenilação para a forma secretada de
IgG 1 no intron 6 e a 3'UTR contendo o sítio de poliadenilação para a forma ligada a membrana de IgG 1.
SEQ ID NO: 141 Seqüências de aminoácidos da isoforma curta (slgG) codificada pelo plasmídio pmlgG-A.
SEQ ID NO: 142 Seqüências de aminoácidos da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgG-A.
SEQ ID NO: 143 Gene de IGHG1 humana incluindo os éxons de CH1 a CH3 com todos os introns intervenientes, e a parte 5' adjacente do íntron 6 incluindo o sítio de poliadenilação para a forma secretada da imunoglobulina.
SEQ ID NO: 144 Seqüências de aminoácidos da isoforma curta (slgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGA-A.
SEQ ID NO: 145 Seqüências de aminoácidos da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGAA.
SEQ ID NO: 146 Seqüência codificada removida do plasmídio pmlgGA-B
SEQ ID NO: 147 Seqüência codificada inserida para a geração do plasmídio plgG-GPI-B (seqüência de aminoácidos do peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana (acesso NCBI: M13077; nucleotídeos: 1542 - 1643))
SEQ ID NO: 148 Seqüência de DNA da região constante do cassete de expressão de cadeia gama, de CH1 a 3'UTR do plasmídio de expressão plgG-GPI-B
SEQ ID NO: 149 Seqüência de aminoácidos da isoforma slgG da região constante de cadeia gama codificada pelo plasmídio plgG-GPI-B
SEQ ID NO: 150 Seqüência de aminoácidos da isoforma longa da região constante de cadeia gama incluindo peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana codificada pelo plasmídio plgG-GPI-B
SEQ ID NO: 151 Segundo ácido nucléico derivado de receptor 1 de fator de crescimento de fibroblastos humano
SEQ ID NO: 152 Segundo ácido nucléico derivado de receptor do fator de crescimento epitelial murfdeo
SEQ ID NO: 153 Segundo ácido nucléico derivado de receptor 1 de complemento humano (C3b/C4b)
SEQ ID NO: 154 Segundo ácido nucléico derivado de receptor de interleucina 4 murideo
SEQ ID NO: 155 Segundo ácido nucléico derivado de cadeia pesada a de imunoglobulina humana
SEQ ID NO: 156 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (1)
SEQ ID NO: 157 Segundo ácido nucléico derivado de cadeia pesada γ3 de imunoglobulina humana
SEQ ID NO: 158 Segundo ácido nucléico derivado de cadeia pesada de lg murídea do tipo ε
SEQ ID NO: 159 Segundo ácido nucléico derivado de cadeia pesada de lg murídea do tipo γ2Α
SEQ ID NO: 160 Terceiro ácido nucléico derivado de receptor 1 de fator de crescimento de fibroblastos humano
SEQ ID NO: 161 Terceiro ácido nucléico derivado de receptor do fator de crescimento epitelial murídeo
SEQ ID NO: 162 Terceiro ácido nucléico derivado de receptor 1 de complemento humano (C3b/C4b)
SEQ ID NO: 163 Terceiro ácido nucléico derivado de receptor de interleucina 4 murídeo
SEQ ID NO: 164 Terceiro ácido nucléico derivado de cadeia pesada ade imunoglobulina humana
SEQ ID NO: 165 Terceiro ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana
SEQ ID NO: 166 Terceiro ácido nucléico derivado de cadeia pesada γ3 de imunoglobulina humana
SEQ ID NO: 167 Terceiro ácido nucléico derivado de cadeia pesada de lg murídea do tipo ε
SEQ ID NO: 168 Terceiro ácido nucléico derivado de cadeia pesada de Ig murídea do tipo γ2Α
SEQ ID NO: 169 Segundo ácido nucléico derivado de receptor de interleucina 4 humano
SEQ ID NO: 170 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (2)
SEQ ID NO: 171 Segundo ácido nucléico derivado de cadeia pesada γ4 de imunoglobulina humana
SEQ ID NO: 172 Segundo ácido nucléico derivado de cadeia pesada δ de imunoglobulina murídea
SEQ ID NO: 173 Segundo ácido nucléico derivado de cadeia pesada ε de imunoglobulina humana (2)
SEQ ID NO: 174 Terceiro ácido nucléico derivado de receptor de interleucina 4 humano
SEQ ID NO: 175 Terceiro ácido nucléico derivado de cadeia pesada γ4 de imunoglobulina humana
SEQ ID NO: 176 Terceiro ácido nucléico derivado de cadeia pesada de Ig murídea do tipo δ
Exemplos
Exemplo 1
Clonagem de fragmentos genômicos e construção de vetores de expressão eucariótica de SlgG/mlgG
a) Construção do vetor de expressão de slgG 'plgG-A'
Para a expressão de uma imunoglobulina com especificidade contra uma proteína A, construiu-se o vetor 'plgG-A'. Ele codificada a a forma secretada slgG da imunoglobulina e compreende os seguintes elementos (veja Figura 1C):
1. Uma unidade de transcrição para uma cadeia pesada gama (γ) 1 humana, composta por:
- o intensificador precoce imediato e o promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak (Kozak, M., Nucleic Acids Res. 15 (1987) 8125-48),
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o intron de seqüência de sinal,
- um cDNA de cadeia pesada variável de um anticorpo com especificidade contra uma proteína A,
- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador μ de Ig de camundongo (região de comutação Jh3Jh4) unido ao gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a CH3 com todos os introns intervenientes e a região não traduzida 3' adjacente contendo o sítio de poliadenilação para a cadeia pesada da forma secretada de IgGL
A seqüência de nucleotídeos da região constante de cadeia pesada é relatada na SEQ ID NO: 130. A seqüência de aminoácidos da região constante de cadeia γ codificada pelo plasmídio plgG-A é relatada na SEQ ID NO: 131.
2. Uma unidade de transcrição para uma cadeia leve kapa (K) humana, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia K variável de um anticorpo com especificidade contra uma proteína A
- o intensificador de íntron 2 Ig K de camundongo unido ao gene de regiãoc onstante kapa de imunoglobulina humana (IGKC), e
- a região não traduzida 3' do gene de IGKC humana contendo o sítio de poliadenilação.
3. Uma unidade de transcrição de neomicina fosfotransferase como um marcador selecionável para células de mamíferos.
4. Uma origem de replicação do vetor pUC18 para a replicação do plasmídio em E. coli.
5. Um gene de becta-lactamase que confere resistência a ampicilina em E. coli.
b) Construção do vetor de expressão de slgG/mlgG 'pmlgG-A'
Um fragmento genômico de 5,2 kb do locus gama 1 de região constante pesada de imunoglobulina humana (IGHG1) compreendendo a parte principal do íntron a jusante do éxon CH3 (intron 6), o éxon Ml, o intron a jusante do éxon Ml (intron 7), o éxon M2 e a região não traduzida 3' adjacente (3'UTR), incluindo o sinal de poliadenilação para a forma ligada a 10 membrana da cadeia gama 1 foi amplificado a partir de DNA genômico humano (Roche Diagnostics GmbH, Mannheim, Alemanha) por PCR usando ο Sistema de PCR de Molde Longo Expandido (Roche Diagnostics GmbH, Alemanha) e o primer oligonucleotídico especificado na Tabela 4.
Tabela 4: Primer oligonucleotídico para clonagem e mutagênese.
Uso para Nome Seqüência (na direção 5' para 3') SEQ ID NO:
Amplificaçã o do fragmento de IGHG1 genômico de 5,2 kb TM-fw1 GGCCGAGTCTGAGGCCTGAGTGGCAT GAGGGAGGCAGAGT 132
TM-rv1 AACTGGATCCATGTAGAAAAGAGGAGAAGCCCCGGGGGTCCATGTAGT 133
Amplificaçã o do fragmento de IGHG3 genômico de 1,1 kb TM-fw1 GGCCGAGTCTGAGGCCTGAGTGGCAT GAGGGAGGCAGAGT 132
M1-rv GATCCACTTCACCTTGAAGAAGGTGACGGTGGCACTGTAGCACACGC 134
Amplificaçã o do fragmento de IGHG4 genômico de 1,6 kb M2-fw CACCTTCTTCAAGGTGAAGTGGATCTT CTCCTCGGTGGTGGACCTGAAG 135
TM-rv1 AACTGGATCCATGTAGAAAAGAGGAGAAGCCCCGGGGGTCCATGTAGT 133
Amplificaçã TM-fw2 CTCCAGCAG- CAGCTGCCCTGGGCTGGGCCACGA 136
o do fragmento de IGHG3IGHG4 genômico TM-rv2 CAGGGATCCCCCGAGGTGCAGCTGGA CCAGCCTCCTCCTGACCGTGI I I I 137
Mutação do sítio Sph I na 3'UTR mutSphl1 CTACCCCAGACCTCCGCTGCTTGGTG CcTGCAGGGCACTGGGGGCCAGGTGT CCCCTCAGCAGGACGT* 138
mutSphl- 2 CCTGCTGAGGGGACACCTGGCCCCCA GTGCCCTGCAgGCACCAAGCAGCGGAGGTCTGGGGT* 139
* Os nucleotídeos alterados para a mutagênese do sítio Sph I estão indicados por letras minúsculas.
O fragmento amplificado corresponde aos nucleotídeos
87203513 - 87208691 do contig genômico de cromossomo 14 de Homo sapiens (acesso NCBI: NT_026437, complemento reverso). O seqüenciamento do produto de PCR subclonado revelou uma identidade de 98 porcento em comparação com a seqüência de cromossomo 14 correspondente, com todas as diferenças encontradas em introns ou na região não traduzida 3' (3'UTR). O sítio de restrição Sph I de 219 pb a jusante do códon de parada do éxon M2 foi destruído por mutagênese direcionada a sítio com base em PCR usando os primers oligonucleotídicos especificados na Tabela 2. O fragmento foi, então, unido à parte de flanco 5' do íntron 6 por clonagem mediante um sítio de restrição Sph I no vetor de expressão de cadeia gama 1 de imunoglobulina plgG-A, levando, assim, a uma unidade de transcrição de cadeia gama 1 genomicamente organizada. Por subclonagem, construiuse o vetor de expressão eucariótica 'pmlgG-A', que codifica a forma secretada (slgG) e a forma ligada a membrana (mlgG) de um anticorpo com especificidade contra uma proteína A. O plasmídio contém os seguintes elementos (veja também a Figura IA):
1. A unidade de transcrição acima mencionada para uma cadeia pesada gama 1 humana, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia pesada variável de um anticorpo com especificidade contra uma proteína A,
- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador mu (μ) de lg de camundongo da região de comutação Jh3-Jh4 (Banerji, J., et al., Cell 33 (1983) 729-740; Gillies, S.D., et al., Cell, 33 (1983) 717-728) unido ao gene de cadeia constante gama 1 de imunoglobulina humana (IGHG1) incluindo os éxons de CH1 a M2 com todos os introns intervenientes, o sítio de poliadenilação para a forma secretada de IgG 1 no íntron 6, e a 3'UTR contendo o sítio de poliadenilação para a forma ligada a membrana de IgGI.
A organização genômica da região constante de cadeia pesada é representada na Figura 2A, a seqüência de nucleotídeos é relatada na SEQ ID NO: 140. As seqüências de aminoácidos da isoforma curta (slgG) ou da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgG-A são relatadas na SEQ ID NO: 141 ou SEQ ID NO: 142, respectivamente.
2. Uma unidade de transcrição para uma cadeia leve kapa (K) humana, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia K variável de um anticorpo com especificidade contra uma proteína A,
- o intensificador de íntron 2 lg K de camundongo (Emorine, L., et al., Nature 304 (1983) 447- 449; Picard, D., e Schaffner, W., Nature (1984)
307, 80-82) unido ao gene de região constante K de imunoglobulina humana (IGKC), e
- a 3'UTR do gene de IGKC humana contendo o sítio de poliadenilação.
3. Uma unidade de transcrição de neomicina fosfotransferase como um marcador selecionável para células de mamíferos.
4. Uma origem de replicação do vetor pUC18 para a replicação do plasmídio em E. coli.
5. Um gene de beta(P)-lactamase que confere resistência a ampicilina em E. coli.
c) Construção dos vetores de expressão de slgG/mlgG 'pmlgGAA‘ e 'pmlgGA-B'
De maneira similar à descrita no exemplo Ib), um fragmento genômico de 1,1 kb do locus de região gama 3 constante pesada de imunoglobulina humana (IGHG3) compreendendo a parte principal do íntron a jusante do éxon CH3 (íntron 6), e o éxon Ml foi amplificado por PCR (para os oligonucleotídeos, veja a Tabela 2). O fragmento corresponde aos nucleotídeos 87235195 - 87236300 do contig genômico de cromossomo 14 de Homo sapines (acesso NCBI: NT_026437, complemento reverso), com uma identidade de seqüência de 98 por cento. Todas as diferenças são encontradas dentro do íntron, exceto por uma única troca de nucleotídeo dentro do éxon M1 que é silenciosa e, portanto, não altera a seqüência de aminoácidos codificada. Da mesma forma, um fragmento genômico de 1,6 kb do locus da região gama 4 constante pesada de imunoglobulina humana (IGHG4) compreendendo o éxon M2 e a região não traduzida 3' adjacente, incluindo o sinal de poliadenilação para a forma ligada a membrana da cadeia gama 4 foi amplificado por PCR (para os oligonucleotídeos, veja a Tabela 2). O fragmento corresponde aos nucleotídeos 87087786 - 87089377 do contig genômico de cromossomo 14 de Homo sapines (acesso NCBI: NT_026437, complemento reverso), com uma identidade de seqüência de 98 por cento e todas as diferenças encontradas na 3'UTR. O sítio Sph I de 212 pb a jusante do códon de parada do éxon M2 foi destruído por mutagênese direcionada a sítio à base de PCR. Ambos os fragmentos foram unidos entre M1 e M2, amplificados por PCR (para os oligonucleotídeos, veja a Tabela 2) e, então, clonados no vetor de expressão de cadeia gama 1 por um sítio Sph I no íntron 6, levando, dessa forma, a um cassete de expressão de cadeia gama 1 - gama 3 - gama 4 híbrido, com uma organização genômica desprovida do íntron entre M1 e M2 (íntron 7). Por subclonagem, construiu-se o vetor de expressão eucariótica pmlgGA-A, que codifica a forma slgG secretada e a mlgG ligada a membrana de um anticorpo com especificidade contra uma proteína A. O plasmídio contém os seguintes elementos (veja também a Figura IB):
1. A unidade de transcrição acima mencionada para uma cadeia pesada gama 1 - gama 3 - gama 4 híbrida, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma região não traduzida 5' sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia pesada variável de um anticorpo com especificidade contra uma proteína A,
- um íntron 2 híbrido de cadeia pesada de camundongo/humana incluindo o intensificador μ de Ig de camundongo (região de comutação Jh3Jh4) unido ao gene de IGHG1 humana, incluindo os éxons de CH1 a CH3 com todos os introns intervenientes, e a parte 5' adjacente do íntron 6, incluindo o sítio de poliadenilação para a forma secretada da imunoglobulina,
- a parte 3' do íntron 6 e o éxon Ml do gene de IGHG3 humana, e
- o éxon M2 e a região não traduzida 3' contendo o sítio de poliadenilação para a forma ligada a membrana da imunoglobulina do gene de IGHG4 humana.
A organização genômica da região constante de cadeia pesada é representada na Figura 2B, a seqüência de nucleotídeos é relatada na SEQ ID NO: 143. As seqüências de aminoácidos da isoforma curta (slgG) ou da isoforma longa (mlgG) da região constante de cadeia γ codificada pelo plasmídio pmlgGA-A são relatadas na SEQ ID NO: 144 ou SEQ ID NO: 145, respectivamente.
2. Uma unidade de transcrição para uma cadeia leve kapa humana, composta por:
- o intensificador precoce imediato e promotor do citomegalovírus humano (hCMV),
- uma 5'UTR sintética incluindo uma seqüência de consenso Kozak,
- uma seqüência de sinal de cadeia pesada de imunoglobulinuma murídea incluindo o íntron de seqüência de sinal,
- um cDNA de cadeia K variável de um anticorpo com especificidade contra uma proteína A,
- o intensificador de íntron 2 lg K de camundongo unido ao gene de região constante K de imunoglobulina humana (IGKC), e
- a região não traduzida 3' do gene de IGKC humana contendo o sítio de poliadenilação.
3. Uma unidade de transcrição de neomicina fosfotransferase como um marcador selecionável para células de mamíferos.
4. Uma origem de replicação do vetor pUC18 para a replicação do plasmídio em E. coli.
5. Um gene de becta-lactamase que confere resistência a ampicilina em E. coli.
Por troca das seqüências de cDNA que codificam as regiões variáveis da cadeia gama e kapa, construiu-se o vetor de expressão de slgG/mlgG 'pmlgGA-B1. Tem a mesma organização descrita para o pmlgGAA acima, mas codifica, ao invés, uma imunoglobulina com especificidade contra uma proteína B.
Exemplo 2
Transfecção e análise de células Sp2/0-Agl4
a) Cultivo e eletroporação de células Sp2/0-Agl4
Células de hibridoma Sp2/0-Agl4 (ATCC N9 CRL-1581, Shulman,
M., et al., Nature 276 (1978) 269-270) são cultivadas em meio RPMI (Invitrogen Corp., US) suplementado com 10% de soro de novilho fetal de IgG ultrabaixo (FCS) (Invitrogen Corp., US) e 2 mM de glutamina (Invitrogen Corp., US) a 37SC, 5% de CO2 e 95% de umidade. Para a transfecção, as células são eletroporadas com 10 pg de DNA plasm ídico por 106 células em 20 mM de tampão HEPES (ácido N-(2-hidroxietil)-piperazina-N'-2-etanossulfônico), pH 7,0, contendo 137 mM de NaCI, 5 mM de KCI, 0,7 mM de Na2HPO4 e 6 mM de glicose, a 4QC. A eletroporação é realizada a 220 V e 960 pF com urn dispositivo de eletroporação Genepulser (Bio-Rad Laboratories Inc., US). Depois da transfecção, as células são distribuídas em placas de 96 poços com 5.000 células em 100 pL de meio por poço. Para a seleção das células transfectadas, 500 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) são adicionados ao meio um dia antes da eletroporação. O meio é trocado cada dois a três dias, para manter a pressão de seleção. Cerca de duas semanas após a transfecção, clones de transfectoma são isolados das placas de 96 poços e adicionalmente propagados em recipientes de cultura apropriados. Para armazenamento, cerca de 106 células de um clone são congeladas em sulfóxido de dimetila a 10% (Sigma-Aldrich Co., Alemanha) em FCS de baixo IgG (Invitrogen Corp., US) e armazenadas em nitrogênio líquido.
As transfecções de cada uma das 106 células com os plasmídios pmlgG-A, pmlgGA-A e plgG-A levou a 15, 19 e 12 clones independentes, respectivamente. Para cada transfecção, 6 clones foram aleatoriamente selecionados para análise adicional.
b) Quantificação de IgG e análise por citometria de fluxo
105 células de cada clone do Exemplo 2a) foram semeadas em 2 mL de meio contendo G418 (conforme acima descrito) em placas de 6 poços e cultivadas durante 48 horas. Depois disso, os sobrenadantes foram coletados, e a quantidade de IgG secretada foi quantificada por imunoensaio de Fluorescência Resolvida no Tempo Homogênea (HTRF) usando o kit de detecção de Fc humana (CIS bio international), de acordo com o protocolo do fabricante. Para analisar os anticorpos ligados a membrana plasmática por citometria de fluxo, 105 células de cada clone foram lavadas duas vezes com PBS (salina tamponada com fosfato) a 4eC, então, ressuspensidas em 50 pL de fragmento F(ab')2 de IgG anti-humana de camundongo conjugado a FITO (Dianova, Alemanha), diluídas a 1:50 em PBS contendo 1% de BSA (Roche Diagnostics GmbH, Alemanha) e incubadas durante uma hora a 4eC 5 no escuro.
Depois de lavar duas vezes com PBS, as células foram ressuspendidas em PBS e analisadas com um citômetro de fluxo BD FACSCalibur (BD Biosciences, US). Como uma medida da quantidade de IgG ligada à superfície celular, determinou-se a intensidade de fluorescência mediana 10 para cada clone.
Na Figura 3, a intensidade de fluorescência mediana na citometria de fluxo é apresentada juntamente com a concentração de IgG no sobrenadante de cultura celular para cada clone. Observou-se que, para clones transfectados com pmlgG-A ou pmlgGA-A (isto é, plasmídios que codifi15 cam tanto a forma slgG, quanto a mlgG), uma quantidade aumentada de IgG secretada corresponde a um sinal de superfície celular elevado. Essa correlação não foi observada para clones transfectados com plgG-A (isto é, o plasmídio que codifica apenas slgG, a forma secretada do anticorpo). Exemplo 3
Classificação de células transfectadas de maneira estável por citometria de fluxo
Para a geração de clones que expressam de maneira estável IgG, 3 x 106 células Sp2/0-Agl4 foram transfectadas com o plasmídio pmlgGA-B por eletroporação, conforme acima descrito. Um dia depois da 25 transfecção, as células foram transferidas para 500 pg/mL de memio de seleção G418 e cultivadas reunidas durante cerca de duas semanas. Após a seleção, a IgG ligada à superfície das células transfectadas foi marcada, e as células com os sinais mais intensos foram classificadas por citometria de fluxo. Depois disso, 4 x 106 células do material reunido foram lavadas duas 30 vezes com meio a 49C, então, incubadas com fragmento F(ab')2 de IgG antihumana de camundongo conjugado a fluoresceína (FITO) (Dianova, Alemanha), diluído a 1:50 no meio, durante 20 minutos em gelo. Após duas etapas de lavagem com meio, as células foram ressuspendidas no meio e transferidas para um citômetro de fluxo BD FACSVantage (BD Biosciences, US). Estabeleceu-se uma porte englobando as células com os 5 - 6% superiores de intensidade de fluorescência da população de amostra (Figura 4), e célu5 Ias classificadas por essa porta foram coletadas. As células coletadas foram expandidas por cultivo em meio de seleção durante vários dias. Coom essas células, um segundo e, consecutivamente, um terceiro ciclo de classificação foram realizados, conforme acima descrito. Em vez de coletar as células classificadas de forma reunida, uma quarta etapa de classificação final foi 10 usada para deposições de células únicas em placas de 96 poços. A deposição levou a 141 clones independentes, dos quais 21 foram selecionados para análise de expressão de IgG por imunoensaio HTRF, conforme descrito no exemplo 2 b). Dois clones desses, 5B11 e 9B3, que mostraram as taxas de secreção de IgG mais elevadas e, correspondentemente, os sinais de 15 superfície celular mais fortes, foram adaptados para crescimento livre de soro em cultura rotativa para avaliação adicional de sua produtividade.
Exemplo 4
Determinação da produtividade específica de clones
Para a determinação de sua produtividade específica, os clones 20 5B11 e 9B3 foram cultivados sob condições definidas em meio ProCHO 6k (Cambrex Corp., US), suplementado com 1 x concentrado de Colesterol/Lipídio (Invitrogen Corp., US), 4 mM de Glutamina (Invitrogen Corp., US) e 250 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha), em balões rotativos de 100 mL (Belco, US.). As células foram cultivadas a 37eC, 5% de 25 CO2 e 95% de umidade até atingirem uma fase de crescimento estacionário.
Em vários momentos durante a fase de crescimento exponencial, a contagem de células de cada clone foi determinada com um contador de células CASY (Schârfe Systems, Alemanha), e a concentração de IgG nos sobrenadantes foi determinada por cromatografia de afinidade por proteína A (veja 30 abaixo). Como referência, o clone J5-H3 foi cultivado e analisados sob condições iguais. Esses clone também era derivado de transfecção de células Sp2/0-Agl4 e expressa de maneira estável o anticorpo idêntico ao dos clones
5B11 e 9B3, embora apenas a forma secretada. O clone J5-H3 foi gerado de maneira convencional por várias etapas de diluição limitativa e subclonagem e foi selecionado de mais de 1.000 clones para atender às exigências de produtividade para um processo de fabricação industrial.
As concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por cromatografia de afinidade analítica usando-se uma unidade de cromatografia Akta™explorer (GE Healthcare, anteriormente Amersham Biosciences, Suécia). Um volume definido de um sobrenadante de cultura celular foi aplicado a uma coluna de proteína A Sepharose para facilitar a ligação da IgG à matriz de afinidade. A coluna foi lavada com 100 mM de ácido cítrico a pH 5,0 e, então, os anticorpos ligados foram eluídos com 100 mM de ácido cítrico a pH 3,0. A eluição foi monitorizada por registro contínuo da absorção UV do eluído a 280 nm. A concentração de anticorpo de uma amostra foi calculada a partir da absorção de UV integrada, após calibração do sistema com amostras padronizadas contendo concentrações definidas de anticorpo.
Para cada clone, as taxas de produção específicas (SPRs) foram calculadas a partir das contagens de células e das concentrações de IgG nos sobrenadantes de cultura celular pela seguinte equação:
SPR = Ac(lgG)/c(células).Át. [pg/célula.dia] em que:
- Ác(lgG) é a diferença da concentração de IgG no sobrenadante entre o início e o fim do intervalo de tempo em [pg/mL],
- c(células) é a média aritmética da contagem de células do início e do fim do intervalo de tempo em [células/mL], e
- At é a extensão do intervalo de tempo em [dias].
Uma SPR média foi determinada para cada clone com base em quatro SPRs distintas calculadas em vários momentos durante a fase de crescimento exponencial (Figura 5 e Tabela 5).
Tabela 5: Determinação de taxas de produção específicas (SPR)
Clone forma de IgG expressada intervalo de tempo [h] SPR [pg.célula- 1 .d-1] SPR média ± DP [pg.célula-1.d-1]
Clone forma de IgG expressada intervalo de tempo [h] SPR [pg.célula1.d-1] SPR média ± DP [pg.célula-1 .d-1 ]
5B11 slgG, mlgG 0 - 26.2 16.9 18.3 ±3.4
26.2 - 45.3 22.3
45.3 - 52.7 14.3
52.7 - 68.5 19.6
9B3 slgG, mlgG 0 - 25.7 19.9 16.3 ±5.3
25.7 - 45 19.3
45 - 52.4 8.5
52.4 -68.3 17.4
J5- H3 slgG 0-26 16.7 18.4 ±3.7
26 - 45.2 17.3
45.2-52.6 15.6
52.6-68.4 23.8
Ambos os clones classificados por mlgG ligada a membrana, 5B11 e 9B3, exibiram SPRs médias entre 15 e 20 pg.célula'1.d'1, que está em uma faixa que é adequada para fabricação de clones em escala industrial. As SPRs desses clones são comparáveis a uma SPR que pode ser con5 seguida com um clone obtido por uma estratégia trabalhosa convencional na mesma linhagem cleular e que expressa o mesmo anticorpo (clone J5-H3). Exemplo 5
Detecção de slgG e mlgG por microscopia de imunofluorescência
Anticorpos intracelulares e ligados à superfície celular foram de10 tectados por microscopia de imunofluorescência. Para a coloração intracelular, células fixadas a lâminas de microscópio revestidas com poli-L-lisina foram fixadas com 2% (v/v) de formaldeído em PBS durante 10 minutos, permeabilizadas com 0,2% (v/v) de Triton X-100 em PBS durante 10 minutos e lavadas duas vezes com PBS. Os sítios de ligação inespecífica foram blo15 queados com 3% (p/v) de BSA (albumina sérica bovina) em PBS durante 30 min. As células foram lavadas duas vezes com tampão de lavagem (WB: 0,2% (p/v) de BSA, 0,1% (v/v) de Tween 20 em PBS), então, incubadas com fragmento F(ab')2 de IgG de anti-humana cabra conjugado a R-Ficoeritrina (Dianova, Alemanha), diluídas a 1:50 em WB, durante uma hora. Depois de lavar quatro vezes com WB e duas vezes com H2O duplamente desionizada, as células foram montadas sob uma lamínula e armazenadas a 49C no escuro até a microscopia. Para a coloração dos anticorpos ligados a superfície celular, 105 células foram lavadas com 1% (p/v) de BSA fria em PBS, então, 5 os sítios de ligação inespecífica foram bloqueados com 1% de BSA em PBS no gelo durante 30 minutos. Para a marcação de IgG, as células foram incubadas com fragmento F(ab')2 de IgG de anti-humana cabra conjugado a RFicoeritrina (Dianova, Alemanha), diluídas a 1:50 em 1% (p/v) de BSA em PBS, durante uma hora em gelo. Depois de lavar três vezes com PBS frio, 10 as células foram fixadas a lâminas de microscopia revestidas com poli-Llisina e fixadas com 2% (v/v) de formaldeído em PBS durante 10 minutos à temperatura ambiente. Depois de lavar duas vezes com PBS, as células foram montadas sob uma lamínula e armazenadas a 4QC no escuro até a microscopia. As células intracelulares e marcadas na superfície foram analisa15 das em um microscópio de fluorescência Axiophot usando-se uma objetiva
Plan-APO CHROMAT 40x/1.0 (Carl Zeiss, Alemanha).
No clone 5B11, os anticorpos podem ser detectados na superfície celular (Figura 6, imagem 1), que é principalmente a forma mlgG, assim como no espaço intracelular (imagem 4), que são ambas formas de IgG nas 20 vias de expressão/secreção. Em contraste, no clone J5-H3 apenas anticorpos intracelulares podem ser detectados (Figura 6, imagens 2 e 5), pois esses clones não expressam mlgG. Nenhuma coloração, com ambos os métodos, é observada na linhagem celular não transfectada Sp2/0-Agl4 (Figura 6, images 3 e 6), pois essas células não expressam nenhuma IgG.
Exemplo 6
Detecção de isoformas de mRNA de cadeia γ por Northern blotting
Para definir a razão entre as duas isoformas de cadeia pesada que surgem por splicing alternativo/poliadenilação do transcrito primário, RNA de clones transfectados de maneira estável foi analisado por Northern 30 blot. Conseqüentemente, o RNA total foi isolado das células usando-se a tecnologia RNeasy (Qiagen, Alemanha). Em cada caso, 10 pg de RNA total foram, então, fracionados por eletroforese em gel de agarose desnaturante e transferidos para uma membrana de náilon usando o Sistema NorthernMax (Ambion Inc., US). Para a hibridização da membrana de transferência, duas sondas de DNA diferentes foram marcadas com [alfa-32P] pelo método de marcação aleatória usando-se o kit DECAprime II (Ambion Inc. US). Conforme representado na Figura 7B, a sonda Ά' é complementar ao mRNA de cadeia pesada entre os éxons CH1 e CH3 e, portanto, se hibridiza a ambas as isoformas. Em contraste, a sonda 'B' se liga apenas a uma 3‘UTR do mRNA de cadeia pesada de mlgG longa. Após hibridização e lavagem rigorosa da membrana, a transferência foi analisada por auto-radiografia.
A Figura 7A representa uma auto-radiografia de uma Northern blot com RNA total do clone 5B11, clone J5-H3 e linhagem celular Sp2/0Agl4. A hibridização com a sonda Ά' mostra um sinal de 1,8 kb predominante em ambos os clones que expressam anticorpo (pistas 1 e 2), o que corresponde aos tamanhos esperados da isoforma de mRNA curta que codifica a cadeia pesada da slgG. Na exposição longa representada, também são detectados alguns sinais fracos entre 2 e 4 kb. A banda de 3,3 kb, que só é vista no clone 5B11 (pista 1), representa a isoforma de mRNA longa, que codifica a cadeia pesada da mlgG, pois uma banda com o mesmo padrão de migração é detectada como um único sinal quando a transferência é hibridizada com a sonda 'B' (pista 4). A comparação das forças de sinais relativas das bandas de 1,8 kb e 3,3 kb na pista 1 sugere que o transcrito primário do transgene de cadeia pesada de anticorpo é processado predominantemente na isoforma de mRNA pequena, dando origem à forma slgG secretada do anticorpo. Apenas uma pequena quantidade (menos de 5%) é completamente spliced como isoforma de mRNA longa, levando, assim, à mlgG ligada a membrana plasmática.
Exemplo 7 Purificação e detecção de isoformas de cadeia pesada de IgG por extração com carbonato alcalino e imunotransferência
Para detectar a cadeia pesada de mlgG, proteínas de membrana foram extraídas de células transfectadas de maneira estável usando-se o método de extração com carbonato alcalino desenvolvido por Fujiki (Fujiki,
Y., et al., J. Cell Biol. 93 (1982) 97-102). Em cada caso, 107 células foram lavadas duas vezes com PBS, então, uma vez com NaCI a 0,1 M em gelo. Após ressuspensão em 1 mL Na2CO3 frio a 0,1 M, pH 11,5, as células foram rompidas por sonicação durante 20 segundos, incubadas em gelo durante 30 minutos e, então, centrifugadas durante 60 minutos com 200.000 x g a 4QC. Com essa etapa, as membranas celulares ainda contendo proteínas de membrana integradas são separadas do conteúdo solúvel. Os sobrenadantes foram coletados, e se adicionou Triton X-100 a uma concentração final de 1% (p/v), N-octil-beta-D-glucopiranosida a uma concentração final de 60 mM, TRIS-HCI pH 7,4 a uma concentração final de 50 mM e NaCI a uma concentração final de 300 mM (fração SN). Portanto, as pelotas de membrana foram resolvidas em 1,1 mL de Na2CO3 a 0,1 M, pH 11,5, 1% (p/v) de Triton X-100, 60 mM de N-octil-beta-D-glucopiranosida, 50 mM de TRIS-HCI pH 7,4 e 300 mM de NaCI. Os componentes insolúveis depois dessa etapa foram removidos por centrifugação durante 10 minutos a 15.000 x g, e os sobrenadantes foram coletados como fração de membrana. Ensaios de extração de proteína A foram realizados para purificar as isoformas de anticorpo das frações de membrana ou SN. Depois disso, cada fração foi incubada com 30 pL de volume de leito de Proteína A Sepharose (GE Healthcare, anteriormente Amersham Biosciences, Suécia) durante 60 minutos a 49C, então, lavada quatro vezes com PBS contendo 0,02% (v/v) de Igepal CA360. Proteínas ligadas à matriz de proteína A foram eluídas com o tampão de amostra de gel de proteína redutora a 709C e separadas por eletroforese em SDS gel de poliacrilamida (NuPAGE®-system, Invitrogen Corp., US). Depois da separação, as proteínas foram transferidas para uma membrana de PVDF (fluoreto de polivinilideno), de acordo com o método de imunotransferência semi-seco (Ausubel, F.A., et al. (eds.) Current Protocols in Molecular Biology, Vol. 2, John Wiley e Sons, Inc., New York (1995)). Cadeias pesadas de IgG imobilizadas na membrana foram marcadas com anticorpos IgG policlonais anti-humanos de coelho acoplados a peroxidase de raiz-forte (DakoCytomation, DAKO A/S, Denmark) e detectados por reação de quimioluminescência (LUMI-Light PLUS Western Blotting Kit, Roche Diagnostics
GmbH) em um LUMI-lmager F1 (Roche Diagnostics GmbH).
Um sinal forte de acordo com a cadeia pesada de slgG podia ser detectado na fração de membrana e SN de ambos os clones que expressam anticorpos (clones 5B11 e J5-H3, veja Figura 8, pistas 1, 2, 4 e 5). No caso 5 do clone 5B11, detecta-se uma proteína adicional que migra acima da cadeia pesada de slgG (Figura 8, pista 1).
Essa banda é predominantemente encontrada na fração de membrana desse clone, em que as proteínas de membrana integradas estão enriquecidas. Representa a maior isoforma de cadeia pesada de mlgG, que 10 tem um peso molecular calculado 8 kDa maior que o da cadeia pesada de slgG. Consistentemente, não há nenhum sinal correspondente no clone J5H3 (Figura 8, pista 2), pois esse clone expressa apenas a forma secretada do anticorpo.
Exemplo 8
Cultivo e transfecção de células CHO-K1.
Células CHO-K1 (ATCC No. CCL-61; Puck, T.T., et al., J. Exp. Med. 108 (1958), 945- 956), que tenham sido pré-adaptadas a crescimento livre de soro em cultura de suspensão, foram cultivadas em meio ProCHO4CDM (Cambrex Corp., US), suplementado com 8 mM de L-Alanil-L20 glutamina (Invitrogen Corp., US) e 1 x suplemento HT (Invitrogen Corp., US), a 37SC, 5% de CO2 e 95% de umidade em balões de suspensão. A cada 3 4 dias, as células são divididas com 2 x 105 células/mL em meio fresco. Para transfecção, as células são eletroporadas com 20 pg de DNA plasmídico por
7,5 x 106 células em um volume total de 200 pL de PBS à temperatura ambi25 ente. As eletroporações são realizadas com um dispositivo de eletroporação Gene Pulser XCell (Bio-Rad Laboratories, US) em uma cubeta com um vão de 2 mm, usando um protocolo de onda quadrada com um único pulso de 160 V durante 15 ms. Para a geração de clones que expressem IgG de maneira estável, 6 x 107 células foram eletroporadas com o plasmídio pmlgGA30 B conforme descrito. Depois disso, as células foram cultivadas reunidas no meio acima especificado durante cerca de duas semanas com 700 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) adicionado à cultura um dia após a transfecção para seleção de células transfectadas de maneira estável.
Exemplo 9
Classificação de células CHO-K1 transfectadas de maneira estável por citometria de fluxo
Após a seleção, a IgG ligada à superfície das células transfectadas foi marcada, e as células com os sinais mais intensos foram classificadas por citometria de fluxo. Conseqüentemente, 4 x 107 células do material reunido foram primeiro passadas através de uma malha de náilon de 40 μΜ para remover os agregados maiores e, então, incubadas com Accumax (PAA) durante 15 minutos a 37eC para separar agregados menores restantes. As células foram incubadas em 1 % (p/v) de BSA no meio (veja exemplo 8) durante 20 minutos em gelo, então, tingidas com 10 ng/mL de Proteína A Alexa Fluor 488 (Molecular Probes Inc., Invitrogen Corp., US), em urn volume total de 8 mL de meio com 1% (p/v) de BSA durante 30 minutos em gelo, no escuro. Após duas etapas de lavagem com 1% (p/v) de BSA no meio, as células foram ressuspendidas no meio e transferidas para um classificador de células BD FACSAria (BD Biosciences, US). A população de células únicas vivas foi passada por um porta de gráfico de pontos de espalhamento a frente/espalhamento lateral (FSC/SSC). Foi definida uma subpopulação englobando as células com os 5% superiores de intensidade de fluorescência das células vivas passadas pela porta, e cerca de 45.000 células dessa subpopulação foram coletadas (células reunidas classificadas para mlgG). Como controle, cerca de 40.000 células foram aleatoriamente coletadas a população de células vivas passadas pela porta FSC/SSC, independentemente de sua fluorescência (células reunidas de controle). As células reunidas coletadas foram expandidas por cultivo em meio de seleção (veja exemplo 8) durante duas semanas. Realizou-se, então, um segundo ciclo de classificação. As células do grupo de células reunidas classificadas para mlgG foram tingidas para IgG de superfície celular, conforme acima descrito. Usando-se um classificador de células BD FACSAria (BD Biosciences, US), as células com os 4% superiores de intensidade de fluorescência foram separadas da população de células únicas vivas (passadas pela porta do gráfico de pontos FSC/SSC).
As células classificadas foram coletadas como células únicas em placas de 96 poços. Das células reunidas de controle, coletaram-se células únicas aleatoriamente da população de células vivas não tingidas passadas pela porta FSC/SSC. Clones de células únicas foram expandidos por cultivo em meio de seleção (veja exemplo 8) durante três semanas.
Exemplo 10
Determinação das concentrações de IgG por ELISA
A concentração de imunoglobulina nos sobrenadantes de cultura celular foi determinada por um ELISA em sanduíche, que usou um fragmento F(ab')2 de IgG anti-humana biotinilada como um reagente de captura e, para detecção, um fragmento F(ab')2 de anticorpo IgG anti-humana conjugada a peroxidase.
Placas de 96 poços revestidas com estreptavidina (Placas de Tiras de Poliestireno Revestidas com Estreptavidina Pierce Reacti-Bind™, Código Ns 15121) foram revestidas com 0,5 pg/mL de fragmento F(ab')2 de anticorpo IgG policlonal anti-humano de cabra biotinilado (F(ab')2<h-Fcy>Bi; Dianova, Alemanha, Código N9 109-066-098) anticorpo de captura (0,1 mL/poço) em tampão diluente (tampão diluente: tampão PBS contendo 0,5% peso por volume (p/v) de albumina sérica bovina) por incubação durante uma hora à temperatura ambiente (TA) sob agitação. Depois disso, as placas foram lavadas três vezes com mais de 0,3 mL de tampão de lavagem (tampão de lavagem: PBS contendo 1% (p/v) de Tween 20). Sobrenadantes de cultura celular contendo IgG (amostras) foram diluídos serialmente (duas vezes) até uma concentração de 0,5 - 20 ng/mL em tampão diluente, adicionados aos poços e incubados durante uma hora à TA com agitação, Anticorpo padrão purificado (0,5 - 20 ng/mL) em tampão diluente foi usado para a geração de uma curva padrão de proteína IgG. Depois de lavar as placas três vezes com 0,3 mL/poço de tampão de lavagem, complexos ligados a Fey anti-humana foram detectados com o fragmento F(ab')2 conjugado a peroxidase de IgG anti-humana policlonal de cabra específica para F(ab')2 (F(ab')2<h-FcY>POD; Dianova, Alemanha, Código N9 109-036-098). Depois de lavar as placas três vezes com 0,3 mL/poço de tampão de lavagem, as placas foram reveladas com solução de substrato de peroxidase ABTS® (ácido 2,2'-azino-bis(3- etilbenzotiazolina-6-sulfônico) (Roche Diagnostics GmbH, Alemanha, Código N9 1684302). Após 10-30 minutos, mediu-se a absorbância a 405 nm e 490 nm contra um reagente em branco (tampão de incubação + solução de ABTS) em um leitor de placas Tecan Spectrafluorplus (Tecan Deutschland GmbH, Alemanha). Para uma correção de fundo, a absorbância a 490 nm foi subtraída da absorbância a 405 nm, de acordo com a seguinte fórmula:
ΛΔ_/Δ405ηπι /\490nm \ /A405nm *490nm brancox amostra ~ ™ amostra) ~ em branco M em /
O teor de IgG das amostras foi calculado a partir da curva padrão.
Exemplo 11
Triagem e seleção de clones de CHO que expressam mlgG
Três semanas após as deposições de células únicas em placas de 96 poços, os sobrenadantes de cultura celular de 515 clones classificados para mlgG e de 550 clones de controle foram analisados por ELISA (veja exemplo 10). A Tabela 6 mostra a distribuição dos clones para diferentes níveis de concentração de IgG.
Tabela 6: Triagem de clones depositados em placas de 96 poços por ELISA.
IgG em SN [pg/mL] Clones classificados para mlgG Clones de controle
n9 de clo- nes % de clones n9 de clo- nes
< 1 0 0 495 90.0
<2 65 12.6 44 8.0
<3 76 14.8 5 0.9
< 4 67 13.0 2 0.4
<5 66 12.8 0 0
<6 58 11.3 1 0.2
<7 35 6.8 0 0
<8 39 7.5 0 0
IgG em SN [gg/mL] Clones classificados para mlgG Clones de controle
ns de clones % de clones nQ de clones
<9 32 6.2 1 0.1
< 10 21 4.1 0 0
<11 16 3.1 0 0
< 12 9 1.8 1 0.2
< 13 6 1.1 1 0.2
< 14 4 0.8
< 15 3 0.6
< 16 2 0.4
< 17 3 0.6
< 18 2 0.4
< 19 1 0.2
<20 2 0.3
<21 1 0.2
<22 1 0.2
> 22 6 1.2
Observou-se que, na abordagem de controle, 90 por cento de todos os clones mostravam uma concentração de IgG de 1 pg/mL e menor. Em contraste, nenhum clone classificado para mlgG se achava nesse grupo. Além disso, nessa abordagem, concentrações de IgG de mais de 22 pg/mL 5 foram atingidas por 6 clones, ao passo que a maior concentração de IgG medida na abordagem de controle foi de 12,3 pg/mL. Todos os clones classificados para mlgG com mais de 10 pg/mL e todos os clones de controle com mais de 3 pg/mL foram, então, transferidos para placas de 24 poços para uma segunda triagem. Os clones cresceram por cultivo em meio de seleção 10 (veja exemplo 8) durante 20 dias, então, as concentrações de IgG nos sobrenadantes de cultura celular foram determinadas por ELISA. A Tabela 7 mostra a distribuição de clones para diferentes níveis de concentração de IgG.
Tabela 7: Triagem de clones depositados em 24 poços por ELISA.
IgG em SN [pg/mL] Clones classificados para mlgG Clones de controle
n9 de clones % de clones n9 de clones
<5 2 3.7 3 50.0
< 10 1 1.9 1 16.7
< 15 2 3.7 1 16.6
<20 1 1.8 1 16.7
<25 5 9.3
<30 12 22.2
<35 13 24.1
<40 7 12.9
<45 5 9.3
<50 4 7.4
<55 1 1.8
<60 1 1.9
average IgG conc. (pg/ml) 31.4 6.1
Os clones de controle apresentavam níveis de expressão de até
16,8 pg/mL, com uma concentração média de IgG de 6,1 pg/mL. Em contraste, a expressão média dos clones classificados para mlgG foi de 31,4 pg/mL, com 58,9 pg/mL sendo a maior concentração de IgG observada em um clone desse grupo. Os seis clones classificados para mlgG com mais de 45 pg/mL e os dois clones de controle com mais de 10 pg/mL foram, então, transferidos para balões com agitação de 125 mL para avaliação adicional. Exemplo 12
Avaliação de produtividade para clones de CHO selecionados
Para adaptação à agitação, os clones selecionados do Exemplo foram transferidos para balões de agitação de 125 mL e cultivados em 25 mL de meio de seleção (veja exemplo 8) dirante uma semana, em um agitador giratório com 150 rpm, sob condições padronizadas (veja exemplo 8).
Depois disso, para cada clone, 25 mL de meio ProCHO5-CDM (Cambrex
Corp., US), suplementado com 8 mM de L-Alanil-L-glutamina (Invitrogen
Corp., US), 1x suplemento HT (Invitrogen Corp., US) e 400 pg/mL de G418 (Roche Diagnostics GmbH, Alemanha) foram inoculados com 1 x 106 células/mL e cultivados em balões de agitação de 125 mL conforme acima descrito. Nos dias 0, 1, 2, 3, 4 e 7, a contagem de células de cada clone foi determinada com um contador de células CASY® TT (Schãrfe Systems, Ale5 manha), indicando um crescimento comparável de todos os clones testados (veja Tabela 8).
Tabela 8: Contagem de células das culturas de agitador.
Clone contagem de células [106/mLj
dia 0 dia 0 dia 0
Clones classificados para mlgG
1A1 1.10 1.15 4.30 5.57 7.46 9.96
1B6 1.10 1.22 4.12 5.60 6.58 8.76
1C5 0.99 1.81 5.59 5.53 6.06 5.76
1D1 0.99 1.58 3.08 5.77 5.39 5.40
1D6 1.11 1.31 5.06 5.70 6.60 8.36
2D6 1.09 1.42 3.37 5.32 5.42 5.12
clones de controle
KO2 1.07 1.42 3.23 4.94 5.06 7.12
KO6 1.03 1.55 5.89 5.56 7.44 8.00
No dia 10, os sobrenadantes de cultura celular foram coletados, e as concentrações de IgG foram determinadas por ELISA (veja Tabela 9).
Tabela 9: Determinação de produtividade de culturas de agitador de 10 dias por ELISA. .______________________._______________________
clone IgG no SN |jxg/mL]
clones classificados para mlgG
1A1 47.9
1B6 57.2
1C5 188.9
1D1 151.0
1D6 59.1
2D6 165.6
clones de controle
KO2 56.5
clone IgG no SN [gg/mL]
KO6 34.6
Observou-se que três dos seis clones classificados para mlgG (isto é clones 1 Al, 1B6 e 1D6) mostraram níveis de expressão em uma faixa comparável à dos dois clones de controle. Os outros três clones classificados para mlgG (isto é clones 1C5, 1D1 e 2D6) mostraram uma expressão de IgG acentuadamente elevada, que era até 3,3 vezes maior que a observada nos clones de controle.
Exemplo 13
Análise Northern blot de clones de CHO selecionados
Os seis clones classificados para mlgG e os dois clones de controle adaptados para crescimento em balões de agitador (veja exemplo 12) foram analisados por Northern blot para definir a razão entre as duas isoformas de cadeia pesada que surgem por splicing alternativo do transcrito primário. Para comparação, o clone '27' foi analisado em paralelo. Esse clone foi obtido por transfecção estável de células CHO-K1 com um vetor de expressão genomicamente organizado para apenas a forma secretada do anticorpo idêntico. O Northern blot foi realizado conforme descrito em detalhes no exemplo 6 e mostrado na Figura 9.
Exemplo 14
Construção do vetor de expressão de slgG/lgG-GPI 'plgG-GPI-B1
Para ancoragem em membrana plasmática de uma imunoglobulina, o domínio transmembrana nativo codificado pela parte 3' do éxon M1 e a região intracelular codificada pelo éxon M2 são substituídos pelo peptídio de sinal carbóxi terminal da fosfatase alcalina placentária humana que medeia a ancoragem de glicosilfosfatidilinositol (GPI). Conseqüentemente, a seqüência de DNA do plasmídio pmlgGA-B (veja exemplo Ic) que codifica os seguintes 53 aminoácidos: LWTTITIFITLFLLSVCYSATVTFFKVKWIFSSVYDLKQTIVPDYRNMIRQGA (SEQ ID NO: 146) é substituída pela seqüência de DNA que codifica a seguinte seqüência de aminoácidos do peptídio de sinal carbóxi terminal da fosfatase alcalina pia
100 centária humana (acesso NCBI: M 13077; nucleotídeos: 1542 -1643): AGTTDAAHPGRSWPALLPLLAGTLLLLETATAP (SEQ ID NO: 147).
A seqüência de ácido nucléico da região constante do cassete de expressão de cadeia gama, de CH1 a 3'UTR, do plasmídio de expressão 5 plgG-GPI-B é dada na SEQ ID NO: 148.
A seqüência de aminoácidos correspondente da isoforma slgG da região constante de cadeia gama codificada pelo plasmídio plgG-GPI-B é dada na SEQ ID NO: 149.
A seqüência de aminoácidos correspondente da isoforma longa 10 da região constante de cadeia gama incluindo peptídio de sinal carbóxi terminal da placental fosfatase alcalina de placenta humana codificada pelo plasmídio plgG-GPI-B é dada na SEQ ID NO: 150.
Esse plasmídio permite a expressão da forma secretada (slgG) e uma forma ancorada a GPI de um anticorpo por splicing alternativo do pré15 mRNA de cadeia pesada (veja figura 10).
101
Seqüência de Listagem <110> F. Hoffmann-La Roche AG <120> Células Produtoras de Polipeptídio <130> 23748 WO <150> EP 06010146.6 <151> 2006-05-17 <160>176 <170> Patentln versão 3.2 <210>1 <211> 2767 <212> DNA <213> Homo sapiens <400>1
gtgagtcacc cccaggccca gggttgggac ggggactçtg aggggggcca taaggagctg 60
gaatccatac taggcagggg tgggcactgg gcaggggcgg ggctaggctg tcctgggcac 120
acaggcccct tctcggtgtc cggcaggagc acagacttcc cagtactcct gggccatgga 180
tgtcccagcg tccatccttg ctgtccacac cacgtgctgg cccaggctgg ctggcacagt 240
gtaagaggtg gatacaaccc ctcgccgtgc cctgaggagt ggcggtttcc tcccaagaca 300
ttccccacgg ctgggtgctg ggcacaggcc ttccctggtg tgaccgtgaa tgtggtcacc 360
ctgaacagct gccctctctg gggacatctg actgtccaag accacagtca gcacctctgg 420
gagccagagg ggtctccaga gacccccaga tgtcaggctt gggctcagtg cccagcgaaa 480
ggtcagcccc acacatgccc ataatgggcg cccacccaga gtgacagccc ccagcctcct 540
gccaggccca cccttttccg cccccttgag gcatggcaca cagaccagtg cgcccactgc 600
ccgagcatgg ccccagtggg atgtggtggc cacgaggggc tgtacacaca gcaggaggct 660
gtccgccctg ctcagggcct gctgcctatg ccccagctgt ccaaccaagg gaggcatgga 720
agggcccctg gtgtaagctg gagccaggca cccaggcccc cggccaccct gcagagccaa 780
ggaaaggaag acacccaagt caacaagggg cagggctgag ggctgtccca ggctcttttg 840
gcccgagggg ctgccagcag ccctgacccg gcatgggcct tccccaaaag cgaccctgtg 900
aggtggcctc acagagaacc ccctctgagg acagtgtctg accctgcctg cctcacacag 960
atgggcccca cagcagtggg caacctgggg ggcagcagcc caacctgacc ctgcagggac 1020
tgccccctgc agcagcagct gcttctcagt cccccaacct ccctgtcccc gccagagggt 1080
cttccccgaa gctgcagccc caacccatgg ctgcccacct ggaaccggga ctccctgtcc 1140
102
actgccccct ccccttcggg gccccatctg tgctggggcc caggttcggc ctacagattc 1200
ccatcattgc catggcctcc tgaccttgcc tatccacccc caaccaccgg ctccatgctg 1260
accctccccc aggctcccac gcccagctgg ccggccatcc ccaggcacag acagtctggg 1320
atctcacagg ttagcctgga ccatccacct ggccagacct gggagaggct ggaagctgcc 1380
ctgccaccat gctccagggc cccaggttgc agtactatgg ggtgagggtg tgtgtgcaca 1440
cctgtgtgta cctaggatat ccgagtgtac ccttgtgccc ccaagcacaa gtctccctcc 1500
caggcagtga ggcccagatg gtgcagtggt tagagctgag gcttatccca cagagaaccc 1560
tggcgccttg gtcaaggaag cccctatgcc tttcttgcct cgatttcccc tcttgtctgc 1620
tgagccagca ggggccacgt cctgggctgc tgtgaggagg aagcaagttg gtgctaggag 1680
gggctcctgt gtgtgcatgg gcgggagggg tgcaggtatc tgagcacccc ggtctccact 1740
tgagagagca gggcaggagc tccctgaccc acccagacta cacacgctgt gtccacgtgt 1800
ctcccattat ctgtggcaga ggatccggct tctttctcaa tttccagttc ttcacaaagc 1860
aatgcctttg taaaatgcaa taagaaatac tagaaaaatg atatgaacag aaagacacgc 1920
cgattttttg ttattagatg taacagacca tggccccatg aaatgatccc ggaccagatc 1980
cgtccacacc cgccactcag cagctctggc cgagctcaca gtacaaccac aataaactct 2040
tgttgaatga actctaggaa gtctgtgacg tggctggttc ttgtcaatgc ttcctgcctg 2100
cccacaggct cttcctcgtg gatggggctg tgcttgccac ggaagcgcgt ttttcccggc 2160
ctaggcttgc cttgggcccc actgccgtct ccagctggag atgaccttct atacacacat 2220
ttgctcatga cagacccttg cttagccccc ttccatggct ccctcctgct gctgggataa 2280
aatcaccttg cctggatatc ccctcctggg cccctttcca ccctccttag tcagcacccc 2340
cagttcaggg cacctgcttt ccccgctgcg gagaagccac tctctccttg ctgcccggct 2400
gtgtcttgcc ttccacacct tgtcacagtg gccacttcct aaggaaggcc tccctgtgtg 2460
caggtgtgca gaagtgcccc agcctcccgt cacctttgtc acgggagccc aatccatgag 2520
agtctatggt tctgtctgtc tgccccactc agggcagcga caagtccagg cggggaggac 2580
acagtaggca gagatttgtc gaggggacat atgagcaaga gggtgaggct gggagctccc 2640
tggagataac cacgcctcct gggaagactc gccgtcattt cagctccacg ctgtgcgggg 2700
gtgggtggag gggtagcctg gccctcatga ccagggagct tctcactcag cccctgttcc 2760
tccccag 2767
<210> 2 <211> 1287 <212> DNA <213> Homo sapiens
103 <400> 2 gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtg tacatacttc ccaggcaccc agcatggaaa taaagcaccc120 agcgcttccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagt gggtcccact gtccccacac tggcccaggc240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacgag360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg420 ttctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc600 tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga780 acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc840 tcggcagctt ctccacatgc tgacctgctc agacaaaccc agccctcctc tcacaaggtg900 cccctgcagc cgccacacac acacagggga tcacacacca cgtcacgtcc ctggccctgg960 cccacttccc agtgccgccc ttccctgcag ctggggtcac atgaggtgtg ggcttcacca1020 tcctcctgcc ctctgggcct cagggaggga cacgggagac ggggagcggg tcctgctgag1080 ggccaggtcg ctatctaggg ccgggtgtct ggctgagccc cggggccaaa gctggtgccc1140 agggcgggca gctgtgggga gctgacctca ggacattgtt ggcccatccc ggccgggccc1200 tacatcctgg gtcctgccac agagggaatc acccccagag gcccaagccc agggggacac 1260 agcactgacc acccccttcc tgtccag1287 <210> 3 <211> 1301 <212> DNA <213> Homo sapiens <400> 3 gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtc tacatacttc ccgggcaccc agcatggaaa taaagcaccc120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccgtgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagc gggttccact gtccccacac tggcccaggc240
104
tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300
tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacggg 360
aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420
tcctgtgagc gccctgtcct ccgacctcca tgcccactcg ggggcatgcc tagtccatgt 480
gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggctgccct 540
gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600
tgtggaggga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660
ccgcgctgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720
gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780
acactcctca gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840
tcggcagctt ctccacatgc tgacctgctc agacaaaccc agccctcctc tcacaaggtg 900
cccctgcagc cgccacacac acacaggccc ccacacacag gggaacacac gccacgtcgc 960
gtccctggca ctggcccact tcccaatgcc gcccttccct gcagctgagg tcacatgagg 1020
tgtgggcttc accatcctcc tgccctctgg gcctcaggga gggacacagg agatggggag 1080
cgggtcctgc tgagggccag gtcgctatct agggctgggt gtctggctga gtcccggggc 1140
caaagctggt gcccagggca ggcagctgtg gggagctgac ctcaggacac tgttggccca 1200
tcccggccgg gccctacatc ctgggtcctg ccacagaggg aatcaccccc agaggcccga 1260
gcccagcagg acacagtatt gaccacccac ttcctgtcca g 1301
<210> 4 <211> 1914 <212> DNA <213> Homo sapiens <400> 4 gtaaacccac cctgtacaac gtgtccctgg tcatgtccga cacagctggc acctgctact60 gaccctgctg gcctgcccac aggctcgggg cggctggccg ctctgtgtgt gcatgcaaac120 taaccgtgtc aacggggtga gatgttgcat cttataaaat tagaaataaa aagatccatt180 caaaagatac tggtcctgag tgcacgatgc tctggcctac tggggtggcg gctgtgctgc240 acccaccctg cgcctcccct gcagaacacc ttcctccaca gcccccaccc ctgcctcacc300 cacctgcgtg cctcagtggc ttctagaaac ccctgaattc cctgcagctg ctcacagcag360 gctgacctca gacttgccat tcctcctact gcttccagaa agaaagctga aagcaaggcc420 acacgtatac aggcagcaca caggcatgtg tggatacaca tggacagaca cggacacaca480 caaacacatg gacacacaga gacgtgctaa cccatgggca cacacataca cagacatgga540
105
cccacacaca aacatatgtg gacacacatg tacaaacatg cacaggcaca caaagagaac 600
actgactaca ggcacacaca cacacgggca cactacccac aggcacacaa cagatggaca 660
cgcgtacaca gacatgcaca cacccacagg cacaacacgt gcgcatgccg gccggccccc 720
gcccacattc tcccagggcc ctgccggata ctctgtccct gcagcagttt gctccctgcg 780
ctgtgctggc cccggggctt tgggcccagg ctctgcttgt ccttctgtct ctgcttggag 840
gtgctgccat ggcacccagc ttgggctctg cctggggagc ggaggcccca gggatagcat 900
gtgacccctg ctgaggccag gctcctgatg aaggcagcag atagccccca cacccaccgg 960
tgagcagaac cagagcctgt gccatgtgct gagagcaggc agtgactaag catatgggcc 1020
cagagggcag agtggctgcc ctgggcagct gctcctctta gcaggaggcc tcaggagatg 1080
agctagagca agtctgcccc tgcaaatacc acctgctccc caacccacag cagggagcag 1140
gcgaggtcag acagcagcag cccgggaagg accgagcccc agcagggaag gcagggcccg 1200
agtgaggtct ccacacccaa cgcacagtgc tgtctctaac tggggccacc tccgagtccc 1260
cgccacactc ttggcccttt ggagtcctgg gctccaggtg tctcccaagg gcccatctgt 1320
gcaggggatg caaccccccg aatgtcctca tcccactgtg gagctcaggt ctctgtctgc 1380
tccctgggtc ctggcagggt aggacaagtc cgccaggatg tccccatgca gactctgctc 1440
caagagggag ctggagagtc agggccttgg tgagggagtc aggatcgggt tccccccagc 1500
tcagtcctcc cacctgccag cccccacagc acagggcagg gccacacccc ctgcttcccc 1560
ctccaggaga gtcaggacat gctggccgct gctccgctgg ggccccgccc tccagccccc 1620
accttggtct gtgtgctgca tcccccacgc tctctctgcc accccaggac tctgaggaaa 1680
agacctcaga gtcccagccc tgcc-cagcct cggcctgtgc ccccgctgca tcaggctttc 1740
aggggcccag cccatgccct gggcagtgcc cgagcccccc tgcacttgct ctccccaccc 1800
ctgggtgcag cacagcctag gggccaaggg tgggcctaga ggatgggccc cgggggggct 1860
ttgctgggtg ccaccccagc ctgaccctat tcccccgtgc tgtgtctcct gcag 1914
<210> 5
<211> 2432
<212> DNA
<213> Mus musculus
<400> 5
gtaaacccac caatgtcagc gtgtctgtga tcatgtcaga gggagatggc atctgctact 60
gagccaccct gcctgtccct actcctgaaa taaactctgt gctcatccaa agtatccctg 120
cacttccatc cagtgcctgt ccatcatcct tagggtctac agaacacagg gaggggtcag 180
ggcccaggga gggagaaaca ccaccaccta agcttgtaag gcctcggaga ctttgaagac 240
106
ccttcatgcc tagagtatat gtgtatgcat gtctatgtat tggtgagtgc ttatggatgg 300
gtccatgtgc cttcatgtgt gtacctgtgt gcagcaagag aggagtgagt ttgtgtgcac 360
ctatggttta taggtatgta tatgggtata agtacatatg tggacacact atatctatgt 420
ccctgtgagc aagtgtgtgc ctgtgcatac ctatgagcat gcatatatct atgtgtgttc 480
atgttggtgg aaacatgaga gtgtgtgcac ctgccctgtg aatgtgcaat gagtgaatgg 540
gaagtaagaa taaactgggg atgaaatcca aggcgagcag actcagccaa gaaggcaaag 600
ctcatgggag agtccccagg gcagtgggtt gctgcacaag tactctgagt ggtgggtggt 660
gtggctgttt attagaccgc agcttctaac ccaaacaaga cagggataga tggagcaaaa 720
gggtagcacc atcaaggctg gtgccgtgtg ggggtcacaa tagagatgat ggtatgagaa 780
tgaagggatg aacacagggg cactgggaag aagatgccac gcaccctcag taggccatcc 840
ctgaatggaa acatgcattc agggtgacca ctgactcatg agaaagacat atagcatggc 900
acagacaacc ctcagcagca ccctgctctt cacacatgca catgggcata caccctgttc 960
tgcatacatg cacatgggca tacatgcaca gacactcaca tttgcacact cacacagacc 1020
tgaaccctgg aggaagatga agttcacagc ccacacccag cttctggaaa gcaaggggag 1080
tcccctccaa gcccccggga gaatttccag gcccgacact gacaactaca cacaatggac 1140
aagggcatag gcccctccag gtgccccctt tctaacctaa gtctcccttc ccatcctgag 1200
cccaagtatc acaaaccaga agcaggataa gaggcaaatc tgggaagaag caggagcagg 1260
ccatggagac cactcccaca caggcctcgg cctcctccat gggcacccct agaacacaaa 1320
gttctacaac caggtatact tggagcccag gtgtccacaa gagggcagtg ggggccctgc 1380
tcctgtctca caggccttca gaacttcggg gggggggggg aggagttgct ggtttctagc 1440
aacttccctc tgctctcaga gcaagagtgg agtaaaggcc catgcatgcc ctggatactc 1500
tccagcttga aagtccagtt ccctgagaat agcaagagca acagaccagc ttgggaaacc 1560
tgactcagaa aagtaccata gccacccatg gaatccaagg cctggcccat gacagagaat 1620
cctagtaagg aggagtcaat aggtgaaaga ctgaatcccc acagggagag ggggcagaga 1680
agctggagaa tcacgatagt cgggaaagat gatgagtgag cggctggagg gtaatggatg 1740
gctggctaca aggatgaacg atggggatga tggatggatt gatggatggc tgcagtgaca 1800
gaaatacgag tggttgacta tcagtacaca tttcctactg ccacttaaaa tgaaactctg 1860
tgcgcagaga acctgaggac agcagggttg gctctactgg gggtctttac tgttgcttaa 1920
cccccagtca cagctcttaa gaatgcaaca gagtcctctg accacatgtc caggccttgg 1980
tagtctaact ttggcccaga aatcacattg gcctgtatct gtttgaaggt gtctgatctt 2040
acacaaccct agtacccaag ccaagattag cctaagaact ggggtttagg gaggtattgc 2100
taaatatcta gaaaggactg agacctaagg agccttgggt tcaaactctt ctcagagttt 2160
107 gacagaaaca actctcttac catgacaggt ctctaattaa ggtttcccta agagagagag atgggtcttg gggccatctc aagaactgct gggattccag tcccttacct gggaccctgc ctcctcatta tccctgaaca agtcccttcc cgggaataag ggacccctac caccactgtc cccaaagccc aaggaggcat agaagcagaa accttaagtc tgagccccca tccccatggg tttggatcta gaaggtcatc tatgtcttac ag <210> 6 <211> 1411 <212> DNA <213> Mus musculus <400> 6 gtaaatgatc ccagtgtcct tggagccctc tggtcctaca ggactctgac acctacctcc acccctccct gtgtaaataa agcacccagc actgccttgg gaccctgcaa taatgtcctg gtgatttctg agatgtagag tctagctagg tcatggaatg aggggtctcc atggtttgag gcctgagttg tgactaagga aaaacccata ggcctacact gccacaccca gcacttttga atttgcctga catgaaaaga atttacctct ccctggaaag tggagcctta tccctaggca gttcccttac cagaccttcc tctagcttgc actttgttct gggcacagaa tgtgtctaac cccccaaagc aaggaagaca caacctctac ctccctcact ctgtccttac cccttttcct ggctaagcat ctcactgagt gcgctgaata gatgcatgtg gccacagtct tgcagacaga cccttgccat ctctccactc agctttccag aggctaagtc tagcccgtat ggtgataatg cagggagctc tatgctatct cagtgctatc agactcccaa gtggaggatg aacatggacc cattaaaacc aacctgcgca gcaacaccct gccaataagg cccgtatgtg aaaatgtgca cacatctaca catgcacagg cacacacaca cacacatgca tgggcacaca cacatacaga gagagagaat cacagaaact cccatgagca tcctatacag tactcaaaga taaaaaggta ccaggtctac ccacatgatc atcctcggca tttacaagtg ggccaactga tacagataaa acttttctat gccaaggacg ccaacatata cacaagtccg ctcatgacaa atctgtccct gaacctcaga ctggcgcccg tgactcatac agtggacact cctccaaagc tgtatagctt cctttacttc cctgtgtgta ctttctctga agtacactca tcacacagaa gaggccctgt gattactctg gccctctgtt cttggtcatc agagaataga cagaagatca ggcaaactac acagacactt cccacaatca tcacaggccc tgactctgct ctccagtctc aaaactgaag gctggagcac acagaataag ctcctgcaca ggccaggcca gtatcgggtc cagtgtgtct gactgagccc agggacaaaa tggcagcact ttggggaact gaggtttctg gtccaagaag gagagatgga ggcccaggga gggtctgctg acccagccca gcccagccca gctgcagctt
2220
2280
2340
2400
2432
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
108
tctcctgggc ctccatacag cctcctgcca cacagggaat ggccctagcc ccaccttatt 1380
gggacaaaca ctgaccgccc tctctgtcca g 1411
<210> 7
<211> 1357 r
<212> DNA
<213> Mus musculus
<400> 7
gtaaatgagc tcagcaccca caaagctctc aggtcctaag agacactggc acccatatcc 60
atgcatccct tgtataaata aagcatccag caaagcctgg taccatgtaa aactgtcctg 120
gttctttcca aggtatagag catagctcac gggctgatag gtctggccag ggttggagga 180
cagccttgtc tataggaaga gaatgaggtt tctgcactgc atgactcaga ggtcatgagt 240
cattctgcct tggactgttg gggcttggct ttaggcagtg ccttttcctt gccttcccat 300
gaaccagcag ctgccagaca tagagataat cctaggaagc ctcaaatgga taagcacaca 360
aacccacctc ccttaggctg ttcctgtccc cctgccccat ttctctactt aggggttttt 420
ctgagtctat tgtggagtga cacatggcca ggggcattcc atagaccttt gtcatctata 480
ctctcaactc aggcagcttt tcacagacga ggtctgcaca cccatacaaa tggctcactc 540
ctgcctgtgc cacctggggc tgaggcacat ggctcttgat gccccaaggg agggactatt 600
agatagccac actcatgcta aatcctgacc ctgctgaaca ccatccagtc catatagcac 660
atgtatcctc atgctcgtga gcacaaaacg catttaacac actgggacaa ctcctctgtg 720
cccagcacag cacctacatc cagcaatgta tcaccataca cacggccaaa aattcaatgc 780
ccacgtttct gccatcacaa tcagacacac ctttcctctt ctgaggacac tccattctcc 840
gctcaaaaca agacctctga agccagattc atctctggta cctcggggtc atgcttcaac 900
cccacatgaa taattcaaac catagccata atggtctgaa tcacttcaca ctgggatgtt 960
cccaagttca ggcaagaaaa gccacaggct ctgctgatga ctgaagaata gcaaagggtc 1020
agtccagctg tatagccact gttgacctgg gtcacaggcc ctgctgaccc tccaccttct 1080
cctgtactga aggaatgaaa gatgagacaa gcatagaggg cacttgaata atccaggtca 1140
ctctgaggtc catccaaggc attattggac tcaggtggag gaagctgaga ctgatgtccc 1200
agagggaaag gaaggaaagc aggccccggg gagggtctgc tgtcccagtc aggctggaga 1260
tctctcctct gacttcatgc agacatgtct gcctcacagg gaatctctcc cagcatcaac 1320
catgttggga caaacactga ctgtcctctc tgttcag 1357
<210> 8 <211> 1472
109 <212> DNA <213> Mus musculus <400> 8 gtaaatgaga acagcaccta gccattcctc gggtcttaca agacactgat accagcccta 60 accggtgaac cctataaata aagcacccag agatgggacc ttgtgagatt atcttggttc 120 tttacatggc acatagttca tgatacacct cagccacagg ctgtggggtc tggccagggt 180 tcaaggtgta agttaacatc caagaaagaa caaggtctta tactgccaga cccagggcat 240 gcaagtggac ctgcccttgc cagagatcat ccctctctgc atagcaagtt tgacccaagg 300 ggccctcttc atactcttcc ccacaaccag caactgttct gtgatgagtc tggagataga 360 aatatcgccc tagaaaatat ccaaagaaag gaacacagaa agtgtatccc acctcaacac 420 gaaccccacc ttcatttgtc tgtccttccc tctaccgtga ctcccctacc ttgacctagg 480 aggtctctgt atgtattaca tagacaggca ggaagactca tacatgaagc ccgttcatct 540 ccaccacacc cctagcgata gggataggga tgagtactcc taagagacta cctcccatat 600 gacattcact cacacctaag ttccaagaca ctgagagact tatgacccta gctgccccca 660 aggaagtaac taatcaaata cctacataga tgctgagacc agaactatta gaaccagcct 720 gctaagcatc actcaaccca catggtacct ccaagcctac atacatccac tgatacctca 780 cctaggcagc atgaatagca accaaaccca tcttagtgtc gggatatccc tagacactac 840 ctaaatgtac acatttggac cagtgaagat gaaatagctc tcatgggtac ctaactgttt 900 tcccctaaca cacacaagta ccttcagacc cattctgtcc ctctatgcct aagcccctat 960 tttcatccct tacagttaac actctcccat agctgtataa cctgactcac ttcccaatgt 1020 ggaccttcta ggaagcccag gtatcatcaa acgcaggccc tactctcact ctgtccctct 1080 gtactcagtc accagggaac aagcagtagg tcaggcaagc tgcagagcta ttacctacag 1140 ggcttccaag ccttgaatca gccaagccag ccccagtact gagggatagg gtagacaaaa 1200 agggttcctg catagcccag gccagcatca ggtccagtgt atctggctct acccagggac 1260 aaaacggcag cacattgggg agctgaggtt tctggttcac agagaacata aaggagagat 1320 ggccccaggg agggtcagat ggccccaggg agggtctgct gacccagtca ggctgcagct 1380 ttctcctggg cctccatgca gcctcctgcc acacagggaa tggccctagc tctaccttgt 1440 tgggacaaac actgactttc ctctctgttc ag 1472 <210> 9 <211> 1860 <212> DNA <213> Mus musculus
110 <400> 9 gtaaacccac actgtacaat gtctccctga tcatgtctga cacaggcggc acctgctatt60 gaccatgcta gcgctcaacc aggcaggccc tgggtgtcca gttgctctgt gtatgcaaac120 taaccatgtc agagtgagat gttgcatttt ataaaaatta gaaataaaaa aaatccattc180 aaacgtcact ggttttgatt atacaatgct catgcctgct gagacagttg tgttttgctt240 gctctgcaca caccctgcat acttgcctcc accctggccc ttcctctacc ttgccagttt300 cctccttgtg tgtgaactca gtcaggctta caacagacag agtatgaaca tgcgattcct360 ccagctactt ctagatatat ggctgaaagc ttgcctaacc tggtgcaggc agcattcagg420 cacatatata gacacacatg catttataca tagatatata ggtacacatg tgtagacaca480 tacatgaatg tgtattcatg gacacacaga caaaggtaca catatataca catgagttca540 tgcgcacaca catgcatgga cacttacaaa cgccttcaga gacaaatagg catagacaca600 caaccactca cagaaacaga taccaatatg catggtcctg tgtacacaga aacagactat660 aggcaaatat acacaaataa actatataga tacaaagata tgcatataca cacatgtaca720 gaaacatctt cacatgtgta cactaacatg tgaacaggta tagcacacag atacacctgg780 actctgacca gggctgtaat ctccaaggct cacggctcag agagcctaca ctaggctggg840 tcactgatac tcctcaggag cccactctat gattgggaga gataacccca ggtacaaagt900 atgcctatct gtctcaacac catggggcag aagatactcc actaaccacc catgacagaa960 agttagcctt ggctgtgtct ccattaatag aacacctcag aagaccaatg tgaaattgcc1020 taacccactc acacccaccc tgatctccag ttcaaaatgc agaaaacata atgcagttgt1080 ccaaaagatg ccccaaccac acacacacac acacacacac acacacacac acacacacac1140 acacacacac acacacacca tcaaggagcc tctgtaagga gtcaccaccc aataacactg1200 cctctttggg ctcatatcct ggacattctt catattcata tccatttggg gcctaggctt1260 tagatatccc caagggctca tctttacagg gatcagagat cccaataaat gccctggtcc1320 cacagcctcc ctcaggtatc tgtctgttta tctcttggta ccaagaccca acattgctgg1380 caggggtagg acaagcaacg cacgggaact ctgatcaaag aaagtcatga gatgcctgag1440 tccttcagga agtaaggagg gacaacctct ggtatccctg ttcttattgc taaagcccaa1500 gagacaggga gacctgctct aaattctcag tctaaacagc accgatggca ccacctgctc1560 agggaaagtc cagagcacac caatatcatt ttgccacagt tcctgagtct gcctttaccc1620 aggtccatac attgcatctg tcttgcttgc tctgctgccc cagggctcct ggaacaaagg1680 ctccaaatta gtgtgtccta cagcttggcc tgttctgtgc ctccgtctag cttgagctat1740 taggggacca gtcaatactc gctaagattc tccagaacca tcagggcacc ccaaccctta1800 tgcaaatgct cagtcacccc aagacttggc ttgaccctcc ctctctgtgt cccttcatag 1860
111
<210> 10
<211> 87
<212> DNA
<213> Homo sapiens
5 <400> 10
agcctgtgga ccaccctgtc cacgtttgtg gccctcttca tcctcaccct cctctacagc 60
ggcattgtca ctttcatcaa ggtgaag 87
<210> 11
<211> 78
10 <212> DNA
<213>. Homo sapiens
<400> 11
gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 60
gccaccgtca ccttcttc 78
- 15 <210> 12
<211> 78
<212> DNA
<213> Homo sapiens
<400> 12
20 gggctgtgga ccaccatcac catcttcatc acactcttcc tgctaagcgt gtgctacagt 60
gccaccatca ccttcttc 78
<210> 13
<211> 81
<212> DNA
25 <213> Homo sapiens
<400> 13
aacctgtggg ccaccgcctc caccttcatc gtcctcttcc tcctgagcct cttctacagt 60
accaccgtca ccttgttcaa g
<210> 14
30 <211> 63
<212> DNA
<213> Mus musculus
112 <400> 14
actgtgacct aca tcctcaccct cttcctactg agcttgttct acagcacagc actcactgtt 60 63
<210> 15
5 <211> 84
<212> DNA
<213> Mus musculus
<400> 15
gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagtgt gtgctacagc 60
10 gctgctgtca cactcttcaa ggta 84
<210> 16
<211> 78
<212> DNA
<213> Mus musculus
15 <400> 16
gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagcgt gtgctacagc 60
gcctctgtca cactcttc 78
<210> 17
<211> 78
20 <212> DNA
<213> Mus musculus
<400> 17
gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagcgt gtgctacagc 60
gcctctgtca ccctcttc 78
25 <210> 18
<211> 84
<212> DNA
<213> Mus musculus
<400> 18
30 aacctgtgga ccactgcctc caccttcatc gtcctcttcc tcctgagcct cttctacagc 60
accaccgtca ccctgttcaa ggtg 84
<210> 19
113 <211> 30 <212> PRT <213> Homo sapiens <400> 19
Gly Glu Ala Ala Arg Arg Pro Gly Leu Pro Leu Pro Leu Leu Leu Leu
1 5 10 15
His Gin Leu Leu Leu Leu Phe Leu Ser His Leu Arg Arg Leu
20 25 30
<210> 20
<211> 26
<212> PRT
<213> Homo sapiens
<400> 20
Asp Ala Ala His Pro Vai Ala Ala Ser Leu Pro Leu Leu Ala Gly Thr
1 5 10 15
Leu Leu Leu Leu Gly Ala Ser Ala Ala Pro
25 <210> 21 <211> 24 <212> PRT <213> Homo sapiens <400> 21
Ser Ser Ala Gly Ser Leu Ala Ala Gly Pro Leu Leu Vai Ala Leu Ala
1 5 10 15
Leu Tyr Pro Leu Ser Vai Leu Phe
20
<210> 22
<211> 30
<212> PRT
<213> Homo sapiens
<400> 22
Asp Ala Ala His Pro Gly Arg Ser Vai Vai Pro Ala Leu Leu Pro Leu
114
1 5 10 15
Leu j Ma Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr Ala Pro
20 25 30
<210: > 23
<211: > 26
<212: > PRT
<213: > Homo sapiens
<400: > 23
Ser . Ma Ser Ser Asn lie Ser Gly Gly lie Phe Leu Phe Phe Vai Ala
1 5 10 15
Asn . Ma lie lie His Leu Phe Cys Phe Ser
20 25
<210: > 24
<211: > 27
<212 > PRT
<213 > Homo sapiens
<400 > 24
Ala Ser Gly Thr Ser Pro Gly Leu Ser Ala Gly Ala Thr Vai Gly lie
1 5 10 15
Met lie Gly Vai Leu Vai Gly Vai Ala Leu lie
20 25
<210 > 25
<211 > 29
<212 > PRT
<213 > Homo sapiens
<400> 25
Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr
1 5 10 15
Gly Leu Leu Gly Thr Leu Vai Thr Met Gly Leu Leu Thr
25 <210> 26 <211> 27
115
<212> PRT
<213> Homo sapiens
<400> 26
Asn Gly Gly Thr Ser Leu Ser Glu Lys Thr Vai Leu Leu Leu Vai Thr
1 5 10 15
Pro Phe Leu Ala Ala Ala Trp Ser Leu His Pro
20 25
<210 > 27
<211 > 32
<212 > PRT
<213 > Homo sapiens
<400 > 27
Cys Glu Gly He Ser Leu Leu Ala Gin Asn Thr Ser Trp Leu Leu Leu
1 5 10 15
Leu Leu Leu Ser Leu Ser Leu Leu Gin Ala Thr Asp Phe Met Ser Leu
25 30 <210> 28 <211> 22 <212> PRT <213> Homo sapiens <400> 28
Ser Gly Ala Pro Thr Leu Ser Pro Ser Leu Leu Gly Leu Leu Leu Pro
10 15
Ala Phe Gly lie Leu Vai <210> 29 <211> 39 <212> PRT <213> Homo sapiens <400> 29
Asp Leu Cys Asn Glu Lys Leu His Asn Ala Ala Pro Thr Arg Thr Ala
10 15
116
Leu Ala His Ser Ala Leu Ser Leu Gly Leu Ala Leu Ser Leu Leu Ala
25 30
Vai lie Leu Ala Pro Ser Leu <210> 30 <211> 24 <212> PRT <213> Homo sapiens <400> 30
Ser Gly Ala Gly Pro Trp Ala Ala Trp Pro Phe Leu Leu Ser Leu Ala
10 15
Leu Met Leu Leu Trp Leu Leu Ser <210> 31 <211> 26 <212> PRT <213> Homo sapiens <400> 31
Asn Ala Gly Glu Met Leu His Gly Thr Gly Gly Leu Leu Leu Ser Leu
5 10 15
Ala Leu Met Leu -Gin Leu Trp Leu Leu Gly
25 <210> 32 <211> 49 <212> PRT <213> Homo sapiens <400> 32
Ala Arg Gly Leu Met Asn Gly Tyr Arg Gly Pro Ala Met Asp Ser Glu
1 5 10 15
Glu Asp Met Met Vai Thr Ala Leu His Ser Leu Thr Leu Gin Thr Vai
20 25 30
Vai lie His Ser Leu Ser Ser Vai Leu Pro Gly lie Thr Leu Ala lie
117
As η <210> 33 <211> 30 <212> PRT <213> Homo sapiens <400> 33
Ser Ser Gly His Ser Arg His Arg Tyr Ala Leu lie Pro He Pro Leu
1 5 10 15
Ala Vai lie Thr Thr Cys lie Vai Leu Tyr Met Asn Vai Leu
20 25 30
<210> 34
<211> 27
<212> PRT
<213> Homo sapiens
<400> 34
Ser Gly Ala Ser Ser Leu His Arg His Phe Gly Leu Leu Leu Ala Ser
1 5 10 15
Leu Ala . Pro Leu Vai Leu Cys Leu Ser Leu Leu
20 25
<210> 35
<211> 26
<212> PRT
<213> Homo sapiens
<400> 35
Ser Thr Gly Ser His Cys His Gly Ser Phe Ser Leu He Phe Leu Ser
1 5 10 15
Leu Trp Ala Vai lie Phe Vai Leu Tyr Gin
25 <210> 36 <211> 31
118 <212> PRT
<213> Homo sapiens
<400> 36 Gly Ala Ala Pro Gin Pro Gly Pro Ala His Leu Ser Leu Thr lie Thr
5 1 5 10 15
Leu Leu Met Thr Ala Arg Leu Trp Gly Gly Thr Leu Leu Trp Thr
25 30 <210> 37 <211> 30
10 <212> PRT
<213> Mus musculus
<400> 37
Asn Ala Ala Vai Pro Thr Gly Ala Ser Thr Trp Thr Met Ala Gly Vai
1 5 10 15
15 Leu Leu Phe Ser Leu Ser Ser Vai lie Leu Gin Thr Leu Leu
- 20 25 30
<210> 38
<211> 35
<212> PRT
20 <213> Mus musculus
<400> 38
Asn Glu . Arg Leu Vai Ser Ala Ala Pro Gly His Ala Leu Leu Ser Ser
1 5 10 15
Vai Thr Leu Gly Leu Ala Thr Ser Leu Ser Leu Leu Thr Vai Met Ala
25 20 25 30
Leu Cys : Leu
35
<210> 39
<211> 26
30 <212> PRT
<213> Mus musculus
<400> 39
119
Ser Ala Ala Ser His Tyr Gin Gly Ser Phe Pro Leu Vai He Leu Ser
1 5 10 15
Leu Ser Ala Vai He Phe Vai Leu Tyr Gin
20 25
5 <210> 40
<211> 24
<212> PRT
<213> Mus r nusculus
<400> 40
10 Ser Ser Gly Vai Cys Trp Thr Ala Thr Trp Leu Vai Vai Thr Thr Leu
1 5 10 15
lie lie His Arg lie Leu Leu Thr
20
<210 > 41
15 <211 > 32
<212 > PRT
<213 > Mus n nusculus
<400 > 41
Asn Phe Ser Ala Ala Gly Leu Gly Leu Arg Ala Ser He Pro Leu Leu
20 1 5 10 15
Gly Leu Gly Leu Leu Leu Ser Leu Leu Ala Leu Leu Gin Leu Ser Pro
20 25 30
<210> 42 <2H> 16 <212> PRT <213> Mus musculus <400> 42
Ala Lys Ser Phe Tyr Phe lie Cys
Tyr Leu Cys Leu Tyr Leu Ala Leu <210> 43 <211> 22 <212> PRT
120 <213> Rattus norvegicus <400> 43
Gly Asn Ser Ala Glu Gly Ser Met Pro Ala Phe Leu Leu Phe Leu Leu
1 5 10 15
Leu Gin Leu Trp Asp Thr
20
<210 > 44
<211 > 32
<212 > PRT
<213 > Rattus norvegicus
<400 > 44
Cys Gly Gly lie Ser Leu Leu Vai Gin Asn Thr Ser Trp Leu Leu Leu
1 5 10 15
Leu Leu Leu Ser Leu Ser Phe Leu Gin Ala Thr Asp Phe He Ser Leu
25 30
210> 45
211> 29
212> PRT
213> Rattus norvegicus
400> 45
Ser Ala Ala Thr Arg Pro Glu Pro His Tyr Phe Phe Leu Leu Phe Leu
10 15
Phe Thr Leu Vai Leu Ala Ala Ala Arg Pro Arg Trp Arg
25 <210> 46 <211> 24 <212> PRT <213> Rattus norvegicus <400> 46
Ser Ser Gly Vai His Trp lie Ala Ala Trp Leu Vai Vai Thr Leu Ser
10 15 lie lie Pro Ser lie Leu Leu Ala
121
20
<210> 47
<211> 26
<212> PRT
<213> Rattus norvegicus
<400> 47
Ser Ala l Ala Ser His Tyr Gin Gly Ser Phe Pro Leu lie lie Leu Ser
1 5 10 15
Phe Trp Ala Vai lie Leu Vai Leu Tyr Gin
25 <210> 48 <211> 22 <212> PRT <213> Rattus norvegicus <400> 48
Arg Asn Thr Gly Phe Leu Leu Ala Trp Pro Thr Phe Phe Leu Pro Vai
10 15
Phe Leu Ala Trp Leu Phe <210> 49 <211> 30 <212> PRT <213> Rattus norvegicus <400> 49
Ser Ser Ala Gly Ala Arg Glu Ser Cys Vai Ser Leu Phe Leu Vai Vai
1 5 10 15
Leu Pro Ser Leu Leu Vai Gin Leu Leu Cys Leu Ala Glu Pro
20 25 30
<210> 50
<211> 33
<212> PRT
<213> Candida albicans
122 <400> 50
Ser Ser Gly Vai Lys Ala Thr Gin
5
Ser He He Thr He Vai Thr Ala
Phe <210> 51 <2H> 32 <212> PRT <213> Yeast sp.
<400> 51
Asn Ala Ala Thr Asn Vai Lys Ala
5
Ser He He Ser Leu Ser He Ala <210> 52 <211> 25 <212> PRT <213> porcine <400> 52
Ala Arg Ala Ala Pro Thr Thr Ser
5
Ala Leu Ala He Leu Gly Trp Ser <210> 53 <211> 26 <212> PRT <213> porcine <400> 53
Ser Ala Ala Pro Ser Leu His Leu
5
Gin Met Ser Met Vai Lys Leu Vai
15
Phe Vai Gly Gly Met Ser Vai Vai
30
Asn Leu Ala Gin Vai Vai Phe Thr
15
Ala Gly Vai Gly Phe Ala Leu Vai
30
Leu Gly Ser Leu Met Thr Vai Ser
15
Vai
Pro Pro Gly Ser Leu Leu Ala Ser
15
123
Leu Vai Pro Leu Leu Leu Leu
20
<210> 54
<211> 18
5 <212> PRT
<213> Trypanosoma brucei
<400> 54
Ser Asn . Ser Phe Vai He His
1 5
10 Leu Phe
<210> 55
<211> 24
<212> PRT
- 15 <213> Trypanosoma brucei
<400> 55
Asp Ser Ser He Leu Vai Thr
1 5
Ala Ala l Phe Vai Ala Leu Leu
20 <210> 56 20
<211> 24
<212> PRT
<213> Trypanosoma brucei
25 <400> 56
Asn Gli ' Ser Phe Leu Thr Ser
1 5
Ala Ala i Phe Vai Ala Leu Leu
20
30 <210> 57
<211> 18
<212> PRT
Ser Leu Pro
Lys Ala Pro Leu Phe Leu Ala Phe Leu
15
Lys Lys Phe Ala Leu Thr Vai Vai Ser
15
Phe
Lys Gin Phe Ala Phe Ser Vai Vai Ser
15
Phe
124 <213> Trypanosoma brucei <400> 57
Ser Asn Ser Phe Vai lie Ser Lys Thr Pro Leu Trp Leu Ala Vai Leu
10 15
Leu Phe <210> 58 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 58
Asp Gly Ser Phe Leu Vai Asn Lys Lys Phe Ala Leu Met Vai Tyr Asp
10 15
Phe Vai Ser Leu Leu Ala Phe <210> 59 <211> 23 <212> PRT <213> Trypanosoma brucei <400> 59
Asn Gly Ser Phe Leu Thr Ser Lys Gin Phe Ala Leu Met Vai Ser Ala
10 15
Ala Phe Vai Thr Leu Leu Phe
20
<210> 60
<211> 23
<212> PRT
<213> Trypanosoma brucei
<400> 60
Gly Ala Ala Thr Leu Lys Ser Vai Ala Leu Pro Phe Ala lie Ala Ala
10 15
Ala Ala Leu Vai Ala Ala Phe
125 <210> 61 <211> 18 <212> PRT <213> Trypanosoma brucei <400> 61
Ser . Asn Ser Phe Vai He Asn Lys Ala Pro Leu Leu Leu Gly Phe Leu
1 .5 10 15
Leu Phe
<210 > 62
<211 > 20
<212 > PRT
<213 > Trypanosoma Congolense
<400 > 62 .
Ser Gly Ser Ser His Gly Thr Lys Ala He Arg Ser He Leu His Vai
1 5 10 15
Ala Leu Leu Met
20
<210> 63
<211> 28
<212> PRT
<213> Gallus sp
<400> 63
Ala Gly Asn Lys Leu lie Gin Gin His Leu Leu Vai He Thr Phe Vai
1015
Pro Phe He He Leu Gly Gin Leu Gin Gly Leu Gly
2025 <210>64 <211> 26 <212> PRT <213> Gallus sp.
126 <400> 64
Ala Thr Leu Gly Ser Pro Ser Thr Ser Ser Ser Phe Vai Ser Leu Leu
10 15
Leu Ser Ala Vai Thr Leu Leu Leu Leu Cys
25
210> 65
211> 25
212> PRT
213> Torpedo marmorata
:400> 65
Ser Ser Ser Gly Thr Ser Ser Ser Lys Gly He He Phe Tyr Vai Leu
1 5 10 15
Phe Ser lie Leu Tyr Leu He Phe Tyr
20 25
<210> 66
<211> 24
<212> PRT
<213> Hamster i sp.
<400> 66
Ser Ser Ala Vai Leu Phe Ser Ser Pro Pro Vai He Leu Leu He Ser
1 5 10 15
Phe Leu lie Phe Leu Met Vai Gly
20
<210> 67
<211> 26
<212> PRT
<213> Bos 1 taurus
<400> 67
Ser Ala . Gly Ser His Cys Cys Gly Ser Phe Ser Leu He Phe Leu Ser
1 5 10 15
Vai Leu i Ala Vai He He He Leu Tyr Gin
127 <210> 68 <211> 23 <212> PRT <213> slime mold <400> 68
Ser Ser Ala Thr Thr He Ala Phe Asn Ala Phe Vai Vai Phe Ala He 15 10 15
Vai Leu Ser Vai Leu Leu Phe <210> 69 <211> 22 <212> PRT <213> slime mold <400> 69 ’
Gly Ser Ala Ser Thr Vai Vai Ala Ser Leu Ser Leu He He Phe Ser
10 15
Met He Leu Ser Leu Cys <210> 70 <211> 25 <212> DNA <213> Homo sapiens <400> 70 acctggccat gacccccctg atccc <210> 71 <211> 29 <212> DNA <213> Homo sapiens <400> 71 agctgcaact ggaggagagc tgtgcggag <210> 72 <211> 33
128
<212> DNA
<213> Homo sapiens
<400> 72
agctgcaact ggaggagagc tgtgcggagg cgc 33
<210> 73
<211> 25
<212> DNA
<213> Homo sapiens
<400> 73
agggggaggt gagcgccgac gagga 25
<210> 74
<211> 31
<212> DNA
<213> Mus musculus
<400> 74
aacgtcaaga gccactttcc tatgtgctac t 31
<210> 75
<211> 48
<212> DNA
<213> MUS musculus
<400> 75
ggctgcaact ggacgagacc tgtgctgagg cccaggacgg ggagctgg 48
<210> 76
<211> 27
<212> DNA
<213> Mus musculus
<400> 76
ggctagacct ggatgatatc tgtgctg 27
<210> 77 <211> 23 <212> DNA <213> Mus musculus
129 <400> 77 agctggaact gaatgagacc tgt <210> 78 <211> 33 <212> DNA <213> Mus musculus <400> 78 agggggaggt gaatgctgag gaggaaggct ttg <210> 79 <211> 4 <212> PRT <213> Homo sapiens <400> 79
Gly Phe Thr His <210> 80 <211> 4 <212> PRT <213> Homo sapiens <400> 80
Ala Cys Thr Thr <210> 81 <211> 4 <212> PRT <213> Homo sapiens <400> 81
Cys Ala Pro Ala <210> 82 <211> 4 <212> PRT
130 <213> Homo sapiens <400> 82
Ala Gly Thr Thr
5 <210> 83
<211> 4
<212> PRT
<213> Homo sapiens
<400> 83
10 Thr Sei • Ser Pro
1
<210> 84
<211> 4
<212> PRT
15 <213> Homo sapiens
<400> 84
lie Thi : Vai Ser
1
<210> 85
20 <211> 4
<212> PRT
<213> Homo sapiens
<400> 85
Ser Gly Thr Thr
25 1
<210> 86
<211> 4
<212> PRT
<213> Homo sapiens
30 <400> 86
Glu Gin Leu Glu
131
<210> 87
<211> 4
<212> PRT
<213> Homo sapiens
5 <400> 87
Lys Leu l Vai Lys
1
<210> 88
<211> 4
10 <212> PRT
<213> Homo sapiens
<400> 88
Gin Vai . Lys lie
1
Í5 <210> 89
<211> 4
<212> PRT
<213> Homo sapiens
<400> 89
20 Cys Cys ; Gin Glu
1
<210> 90
<211> 4
<212> PRT
25 <213> Homo sapiens
<400> 90
Ala Ala Ala Met <210> 91 <211> 4 <212> PRT <213> Homo sapiens
132 <400> 91
Ala Met His Vai <210> 92
5 <211> 4
<212> PRT
<213> Homo sapiens
<400> 92
Gly Ser Arg Gly
10 1
<210> 93
<211> 4
<212> PRT
<213> Homo sapiens
15 <400> 93
- Thr Cys ; lie Pro
1
<210> 94
<211> 4
20 <212> PRT
<213> Homo sapiens
<400> 94
Tyr Gli /· Tyr Ser
1
25 <210> 95
<211> 4
<212> PRT
<213> Homo sapiens
<400> 95
30 Arg lie ; Lys Phe
<210> 96
133 <211> 4 <212> PRT <213> Homo sapiens <400> 96
Gin Tyr Arg Ser <210> 97 <211> 4
<212: > PRT
<213: > Mus musculus
<400: > 97
Glu j \sp Leu Cys
1
<210: > 98
<211: > 4
<212: > PRT
<213: > Mus musculus
<400: > 98
Thr Asp Leu Cys <210> 99 <211> 4 <212> PRT <213> Mus musculus <400> 99
Arg He Lys Phe <210> 100 <211> 4 <212> PRT <213> Mus musculus <400> 100
134
Asp Leu Ala Arg
<210> 101
<211> 4
5 <212> PRT
<213> Mus musculus
<400> 101
Ser Sei : Phe Cys
1
10 <210> 102
<211> 4
<212> PRT
<213> Mus musculus
<400> 102
15 His Leu Met Phe
1
<210> 103
<211> 4
<212> PRT
20 <213> Rattus norvegicus
<400> 103
Ala Pro Ser Ser
1
<210> 104
25 <211> 4
<212> PRT
<213> Rattus norvegicus
<400> 104
Lys Leu Vai Lys i
<210> 105 <211> 4
135 <212> PRT <213> Rattus norvegicus <400> 105
Gly Gin Lys Thr <210> 106 <211> 4 <212> PRT <213> Rattus norvegicus <400>106
Thr Leu Ala Arg <210>107 <211>4 <212> PRT <213> Rattus norvegicus <400> 107
Arg He Lys Phe <210> 108 <211> 4 <212> PRT <213> Rattus norvegicus <400> 108
Asn Gly Thr Pro <210> 109 <211> 4 <212> PRT <213> Rattus norvegicus <400> 109
Asn Cys Leu Tyr
136 i
<210>110 <211> 4 <212> PRT <213> Candida albicans <400>110
Gly Ser Ser Ser <210>111 <211> 4 <212> PRT <213> Yeast sp.
<400>111
Ser Ser Lys Lys
151 <210>112 <211> 4 <212> PRT <213> porcine <400> 112
Glu Pro Leu Ser <210> 113 <211> 4 <212> PRT <213> porcine <400> 113
Asn Tyr Gly Tyr <210> 114 <211> 4 <212> PRT
137 <213> Trypanosoma brucei <400> 114
Asn Thr Thr Gly <210> 115 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 115
Asn Ala Cys Lys <210> 116 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 116
Glu Lys Cys Arg <210> 117 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 117
Thr Thr Gly Ser <210> 118 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 118
Glu Lys Cys Cys
138 <210> 119 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 119
Glu Asp Cys Arg <210> 120 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 120
Glu Pro Glu Pro <210> 121 <211> 4 <212> PRT <213> Trypanosoma brucei <400> 121
Asn Thr Thr Ala <210> 122 <211> 4 <212> PRT <213> Trypanosoma congolense <400> 122
Ser His Leu Pro <210> 123 <211> 4 <212> PRT <213> Gallus sp.
139 <400> 123
Gin Cys Ser Gly .
<210> 124 <211> 4 <212> PRT <213> Gallus sp.
<400> 124
Thr Vai He Pro
1 <210> 125 <211> 4 <212> PRT <213> Torpedo marmorata <400> 125 ' Asp Gly Glu Leu <210> 126 <211> 4 <212> PRT <213> Hamster sp.
<400> 126
Asp Gly Arg Arg <210> 127 <211> 4 <212> PRT <213> Bos taurus <400> 127
Arg He Gin Phe <210> 128
140 <211> 4 <212> PRT <213> slime mold <400> 128
Asn Asn Vai Cys <210>129 <211> 4 <212> PRT <213> slime mold <400>129
Ser Thr Thr Thr <210> ' 130 <211> 2074 <212> DNA <213> Homo sapiens <400>130 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840
141
tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900
gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960
gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020
acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080
ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140
ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200
ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260
ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320
tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380
catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440
cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500
gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560
cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620
ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680
cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740
tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800
ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860
ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920
gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980
agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040
gcccactcgg gggcatgcga cagattgagg atcc 2074
<210> 131
<211> 330
<212> PRT
<213> Artificial
<220>
<223> Amino acid sequence of the gamma-chain constant region encoded by plasmid plgG-A <400> 131
Ala Ser Thr Lys Gly Pro Ser Vai Phe Pro Leu Ala Pro Ser Ser Lys
10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Vai Lys Asp Tyr
142
25 30
Phe Pro Glu Pro Vai Thr Vai Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Vai His Thr Phe Pro Ala Vai Leu Gin Ser Ser Gly Leu Tyr Ser
5 50 55 60
Leu Ser Ser Vai Vai Thr Vai Pro Ser Ser Ser Leu Gly Thr Gin Thr
65 70 75 80
Tyr lie Cys Asn Vai Asn His Lys Pro Ser Asn Thr Lys Vai Asp Lys
85 90 95
10 Lys Vai Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Vai Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met He Ser Arg Thr Pro Glu Vai Thr Cys
15 130 135 140
Vai Vai Vai Asp Vai Ser His Glu Asp Pro Glu Vai Lys Phe Asn Trp
145 150 155 160
Tyr Vai Asp Gly Vai Glu Vai His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
20 Glu Gin Tyr Asn Ser Thr Tyr Arg Vai Vai Ser Vai Leu Thr Vai Leu
180 185 190
His Gin Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Vai Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro He Glu Lys Thr He Ser Lys Ala Lys Gly
25 210 215 220
Gin Pro Arg Glu Pro Gin Vai Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gin Vai Ser Leu Thr Cys Leu Vai Lys Gly Phe Tyr
245 250 255
30 Pro Ser Asp He Ala Vai Glu Trp Glu Ser Asn Gly Gin Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Vai Leu Asp Ser Asp Gly Ser Phe Phe
143
275 280 285
Leu Tyr Ser Lys Leu Thr Vai Asp Lys Ser Arg Trp Gin Gin Gly Asn
290 295 300
Vai Phe Ser Cys Ser Vai Met HÍS Glu Ala Leu His Asn His Tyr Thr
5 305 310 315 320
Gin Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 132
<211> 40
10 <212> DNA
<213> Artificial
<220>
<223> TM-fwl
<400> 132
15 ggccgagtct gaggcctgag tggcatgagg gaggcagagt 40
<210> 133
<211> 48
<212> DNA
<213> Artificial
20 <220>
<223> TM-rvl
<400> 133
aactggatcc atgtagaaaa gaggagaagc cccgggggtc catgtagt 48
<210> 134
25 <211> 47
<212> DNA
<213> Artificial
<220>
<223> Ml-rv
30 <400> 134
gatccacttc accttgaaga aggtgacggt ggcactgtag cacacgc 47
<210> 135
144 <211> 49 <212> DNA <213> Artificial <220>
<223> M2-fw <400> 135 caccttcttc aaggtgaagt ggatcttctc <210> 136 <211> 33 <212> DNA <213> Artificial <220>
<223> TM-fw2 <400> 136 ctccagcagc agctgccctg ggctgggcca <210> 137 <211> 50 <212> DNA <213> Artificial <220>
<223> TM-rv2 <400> 137 cagggatccc ccgaggtgca gctggaccag <210> 138 <211> 68 <212> DNA <213> Artificial <220>
<223> mutSphl-l <400> 138 ctaccccaga cctccgctgc ttggtgcctg ctcggtggtg gacctgaag 49 cga 33 cctcctcctg accgtgtttt 50 cagggcactg ggggccaggt gtcccctcag 60 caggacgt
145
<210> 139
<211> 62
<212> DNA
<213> Artificial
<220>
<223> mutSphI-2
<400> 139
cctgctgagg ggacacctgg cccccagtgc cctgcaggca ccaagcagcg gaggtctggg gt
210> 140
211> 6949
212> DNA
213> Homo sapiens
400> 140
cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60
gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120
ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180
gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240
acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300
ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360
catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420
cggaggcctc -tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480
ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540
ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600
cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660
taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720
cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780
gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840
tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900
gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960
gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020
acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080
146
ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140
ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200
ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260
ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320
tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380
catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440
cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500
gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560
cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620
ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680
cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740
tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800
ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860
ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920
gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980
agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040
gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100
cccccacggc actaacccct ggcagccctg cccagcctcg cacccgcatg gggacacaac 2160
cgactccggg gacatgcact ctcgggccct gtggagggac tggtgcagat gcccacacac 2220
acactcagcc cagacccgtt caacaaaccc cgcactgagg ttggccggcc acacggccac 2280
cacacacaca cgtgcacgcc tcacacacgg agcctcaccc gggcgaaccg cacagcaccc 2340
agaccagagc aaggtcctcg cacacgtgaa cactcctcgg acacaggccc ccacgagccc 2400
cacgcggcac ctcaaggccc acgagccgct cggcagcttc tccacatgct gacctgctca 2460
gacaaaccca gccctcctct cacaaggtgc ccctgcagcc gccacacaca cacaggcccc 2520
cacacgcagg ggaacacacg ccacgtcgcg tccctggcac tggcccactt cccaatacag 2580
cccttccctg cagctggggt cacatgaggt gtgggcttca ccatcctcct gccctctggg 2640
cctcagggag ggacacggga gacggggagc gggtcctgct gagggccagg tcgctatcta 2700
gggccgggtg tctggctgag tcccggggcc aaagctggtg cccagggcgg gcagctgtgg 2760
ggagctgacc tcaggacatt gttggcccat cccggccggg ccctacatcc tgggccccgc 2820
cacagaggga atcaccccca gaggcccaag cccaggggga cacagcactg accaccccct 2880
tcctgtccag agctgcaact ggaggagagc tgtgcggagg cgcaggacgg ggagctggac 2940
gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 3000
147
gccaccgtca ccttcttcaa ggtcggccgc acgttgtccc cagctgtcct tgacattgtc 3060
ccccatgctg tcacaaactg tctctgacac tgtcccacag gctgtcccca cctgtccctg 3120
acgctgtccc ccatgctctc acaaactgtc cctgacattg tccccaatgc tgcccccacc 3180
tgtccaacag tgtcccccag gctctcccca catgtccccg acactgtccc ccatgctgtc 3240
cccatctgtc cccaacactg tcccccaccc tgtccccctt tgtccccaac actgtccccc 3300
acagtttcca cctgtccctg acactgtccc ccatgctttc cccacctgtc cctgacacca 3360
tcccccactc tgtcccctat agttcctggc cctgtccccc acgctgtccc ctacagtacc 3420
tggcactgtc ccccatgctg tcccctcctg tatgaaaccc tgtcccacat gctgtcccca 3480
cctgtccgtg acaatatccc ccacactgtc cccacctgtc cccgacactc tcctccacgt 3540
tgttcttacc taaacccgac actttcctcc atgctgtccc cacccatctc cgacactgta 3600
ccccacgttg tccccacctg tcctcaacac tgtcccccat gctgtcccca cctgtcccca 3660
acactctcct ccatgctgtc cccacctgtc cctgatattg tcccccatgc agtctccacc 3720
tgtccccaat gctgtccccc aggctgtacc taccagtaca acactgtccc ccatgctgtc 3780
cccacctgtc cctgacactg tcccccacgc tgtcccctcc tgtccccgac actgtccccc 3840
acactgtccc cacctgtccc caacactatc ctccatgctg tcccctcctg tccccacctg 3900
tcccctacac tgtcccccat gctgtcccca ccagtcccca aaactttcct ccacactgtc 3960
cccacctgtc cccaacactg tcccccacgc tatcccccct gtccccgaca atgtccccac 4020
tgtttcctcc tgttccctcc tatccctgac actgtccgcc atgctgtccc cacctgtccc 4080
tgacactgtc tcccactctg tcccctataa tccctgacac tgtcccccac gccgtcccct 4140
cccgtatgca ccactgtccc ccaagctgtc cccacctgtc ctcaacacag tcccccatgc 4200
tgtccccacc tgtccccaac actctcctcc atgtccccac ctgtccctga tattgtcccc 4260
catgcagtcc ccacctgtcc ccgatgctgt cccccgggct gtacctacca gtccaacact 4320
gtcccccaca 'ctctccccac ctgtccctga tactgtcccc catgctgtcc ccacctgtcc 4380
cggacactgt tctccacgat ctcccctcct gtccctgaca ctgtccccca cactgtcccc 4440
acctgtcccc aacactatcc tccatcctgt cccaacctgt ctcctacact gtcccccatg 4500
ctgtccccac cagtccccaa cactgtcctc catgctgtcc cccatgtccc caacactgtc 4560
ccccatgcta cctcccctgc ccctgacaat gtccccactg tttcctgtcc cctcctatcc 4620
ctgacactgt cccccatgct gtccccacct gtcccccaca tggtctccac cggtccctga 4680
cactgtctcc cactctgtcc cctataatcc ctgacactgt cccccacacc gtcccctcct 4740
gtatgcacca cggtccccca tgctgtcccc acctgtccct gatgctgtcc tccacacagt 4800
ccccacctct ccctgacact gtccccatct ctccccaaca ctctcctcca tgctgtcctc 4860
aactgtcccc aacactcttc cacactctgt ctccacctgt ccctgacact gtcccccaca 4920
148
ctgtcctcac ctgtgtctga cactgtcccc cacgctgtcc ccacctgtcc ctgacgctgt 4980
cttctgtgct gtccacatgc tgttggtgcc ctggctctgc tctctatcac caagcctcag 5040
agcaggcagt ggtgaggcca tggcacctgg gtggcatgag gggccggatg ggcctcaggg 5100
gcagggctgt ggcctgcgtg gactgacagg tgggtgggcc ttgggggcag agaggtggcc 5160
5 tcagtgccct gaggggtggg tggggctcgg gggcagggct gtggcctcgc tcacccctgt 5220
gctgtgcctt gcctacaggt gaagtggatc ttctcctcgg tggtggacct gaagcagacc 5280
atcatccccg actacaggaa catgatcgga cagggggcct agggccaccc tctgcggggt 5340
gtccagggcc gcccagaccc cacacaccag ccatgggcca tgctcagcca ccacccaggc 5400
cacacctgcc cccgacctca ccgccctcaa ccccatggct ctctggcctc gcagttgccc 5460
10 tctgaccctg acacacctga cacgcccccc ttccagaccc tgtgcatagc aggtctaccc 5520
cagacctccg ctgcttggtg cctgcagggc actgggggcc aggtgtcccc tcagcaggac 5580
gtccttgccc tccggaccac aaggtgctca cacaaaagga ggcagtgacc ggtatcccag 5640
gcccccaccc aggcaggagc tggccctgga gccaaccccg tccacgccag cctcctgaac 5700
acaggcgtgg tttccagatg gtgagtggga gcatcagccg ccaaggtagg gaagccacag 5760
15 caccatcagg ccctgttggg gaggcttccg agagctgcga aggctcactc agacggcctt 5820
- cctcccagcc -cgcagccagc cagcctccat tccgggcact cccgtgaact cctgacatga 5880
ggaatgacgt tgttctgatt tcaagcaaag aacgctgctc tctggctcct gggaacagtc 5940
tcggtgccag caccacccct tggctgcctg cccacactgc tggattctcg ggtggaactc 6000
gacccgcagg gacagccagc cccagagtcc gcactgggga gagaaggggc caggcccagg 6060
20 acactgccac •ctcccaccca ctccagtcca ccgagatcac tcggagaaga gtctgggcca 6120
tgtggccgct gcaggagccc cacagtgcaa gggtgaggat agcccaagga agggctgggc 6180
atctgcccag acaggcctcc cacagaaggc tggtgaccag gtcccaggcg ggcaagactc 6240
agccttggtg gggcctgagg acagaggagg cccaggagca tcggggagag aggtggaggg 6300
acaccgggag agccaggggc gtggacacag ccagaactca tcacagaggc tggcgtccag 6360
25 tcccgggt-ca tgtgcagcag gaacaagcag ccactctggg ggcaccaggt ggagaggcaa 6420
gacgacaaag agggtgcccg tgttcttgcg aaagcggggc tgctggccac gagtgctgga 6480
cagaggcccc cacgctctgc tgcccccatc acgccgttcc gtgactgtca cgcagaatct 6540
gcagacagga agggagactc gagcgggagt gcggccagag cctgcctcgg ccgtcaggga 6600
ggactcc-cgg gctcactcga aggaggtgcc accatttcag ctttggtagc ttttcttctt 6660
30 cttttaaatt t.tctaaagct cattaattgt ctttgatgtt tcttttgtga tgacaataaa 6720
atatcctttt taagtcttgt acttcgtgat gggagccgcc ttcctgtgtc cacgcgcctc 6780
ctgcccccgg tgggaagcac ggtcaggagg aggctggtcc agctgcacct cgggggctcc 6840
149 ctgcactcgc cccccgcctc ctgcagccac acgcattgcc cgagcgaccc tccctggccc ctgtcactac atggaccccc ggggcttctc ctcttttcta catggatcc
6900
6949 <210> 141 <211> 330 <212> PRT <213> Homo sapiens <400> 141
Ala 1 Ser Thr Lys Gly 5 Pro Ser Vai Phe Pro Leu 10 Ala Pro Ser Ser 15 Lys
10 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Vai Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Vai Thr Vai Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Vai His Thr Phe Pro Ala Vai Leu Gin Ser Ser Gly Leu Tyr Ser
15 50 55 60
Leu Ser Ser Vai Vai Thr Vai Pro Ser Ser Ser Leu Gly Thr Gin Thr
65 70 75 80
Tyr He Cys Asn Vai Asn His Lys Pro Ser Asn Thr Lys Vai Asp Lys
85 90 95
20 Lys Vai Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Vai Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met He Ser Arg Thr Pro Glu Vai Thr Cys
25 130 135 140
Vai Vai Vai Asp Vai Ser His Glu Asp Pro Glu Vai Lys Phe Asn Trp
145 150 155 160
Tyr Vai Asp Gly Vai Glu Vai His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
30 Glu Gin Tyr Asn Ser Thr Tyr Arg Vai Vai Ser Vai Leu Thr Vai Leu
180 185 190
His Gin Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Vai Ser Asn
150
195 200 205
Lys Ala Leu Pro Ala Pro He Glu Lys Thr He Ser Lys Ala Lys Gly
210 215 220
Gin Pro Arg Glu Pro Gin Vai Tyr Thr Leu Pro Pro Ser Arg Asp Glu
5 225 230 235 240
Leu Thr Lys Asn Gin Vai Ser Leu Thr Cys Leu Vai Lys Gly Phe Tyr
245 250 255
Pro Ser Asp He Ala Vai Glu Trp Glu Ser Asn Gly Gin Pro Glu Asn
260 265 270
10 Asn Tyr Lys Thr Thr Pro Pro Vai Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Vai Asp Lys Ser Arg Trp Gin Gin Gly Asn
290 295 300
Vai Phe Ser Cys Ser Vai Met His Glu Ala Leu His Asn His Tyr Thr
-15 305 310 315 320
- Gin Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 142
<211> 399
20 <212 ;> PRT
<213 ! > Homo sapiens
<400> 142
Ala Ser Thr Lys Gly Pro Ser Vai Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
25 Ser Thr Ser •Gly Gly Thr Ala Ala Leu Gly Cys Leu Vai Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Vai Thr Vai Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Vai His Thr Phe Pro Ala Vai Leu Gin Ser Ser Gly Leu Tyr Ser
30 50 55 60
Leu Ser Ser Vai Vai Thr Vai Pro Ser Ser Ser Leu Gly Thr Gin Thr
65 70 75 80
151
Tyr He Cys Asn Vai Asn His 85 Lys Pro Ser 90 Asn Thr Lys Vai Asp 95 Lys
Lys Vai Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
5 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Vai Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met He Ser Arg Thr Pro Glu Vai Thr Cys
130 135 140
Vai Vai Vai Asp Vai Ser His Glu Asp Pro Glu Vai Lys Phe Asn Trp
10 145 150 155 160
Tyr Vai Asp Gly Vai Glu Vai His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
Glu Gin Tyr Asn Ser Thr Tyr Arg Vai Vai Ser Vai Leu Thr Vai Leu
180 185 190
- 15 His Gin Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Vai Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro He Glu Lys Thr He Ser Lys Ala Lys Gly
210 215 220
Gin Pro Arg Glu Pro Gin Vai Tyr Thr Leu Pro Pro Ser Arg Asp Glu
20 225 230 235 240
Leu Thr Lys Asn Gin Vai Ser Leu Thr Cys Leu Vai Lys Gly Phe Tyr
245 250 255
Pro Ser Asp lie Ala Vai Glu Trp Glu Ser Asn Gly Gin Pro Glu Asn
260 265 270
25 Asn Tyr Lys Thr Thr Pro Pro Vai Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Vai Asp Lys Ser Arg Trp Gin Gin Gly Asn
290 295 300
Vai Phe Ser Cys Ser Vai Met His Glu Ala Leu His Asn His Tyr Thr
30 305 310 315 320
Gin Lys Ser Leu Ser Leu Ser Pro Glu Leu Gin Leu Glu Glu Ser Cys
325 330 335
152
Ala Glu Ala Gin Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr He Thr
340
345
350
He Phe He Thr Leu Phe Leu Leu Ser Vai Cys Tyr Ser Ala Thr Vai
355
360
365
Thr Phe Phe Lys Vai Lys Trp He Phe Ser Ser Vai Vai Asp Leu Lys
370
375
380
Gin Thr He He Pro Asp Tyr Arg Asn Met He Gly Gin Gly Ala
385
390
395 <210> 143 <211> 4608 <212> DNA <213> Homo sapiens <400> 143 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140
153
ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200
ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260
ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320
tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380
5 catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440
cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500
gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560
cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620
ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680
10 cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740
tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800
ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860
ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920
gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980
- 15 agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040
gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100
cccccacggc actaacccct ggcagccctg cccagcctcg cacccacatg gggacacaac 2160
cgactcctgg ggacatgcac tctcgggccc tgtggaggga ctggtccaga tgcccacaca 2220
cacactcagc ccagacccgt tcaacaaacc ccgcactgag gttggccggc cacacggcca 2280
20 ccacacacac acgtgcacgc ctcacacacg gagcttcacc cgggcgaacc gcacagcacc 2340
cagaccagag caaggtcctc gcacacgtga acactcctcg gacacaggcc cccacgagcc 2400
ccacgcggca cctcaaggcc cacgagccgc tcggcagctt ctccacttgc tgaccagctc 2460
agacaaaccc agccctcctc tcacaaagtg cccctgcagc cgccacacac acacaggccc 2520
ccacacacag gggaacacac gccacgtcac gtccctggca ctggcccact tcccaataca 2580
25 gcccttccct gcagctgagg tcacatgagg tgtgggcttc accatcctcc tgccctctgg 2640
gcctcaggga gggacacggg agacggggag tgggtcctgc tgagggccag gcctctatct 2700
agggccgggt gtctggctga gtcccggggc caaagctggt gcccagggcg ggcagctgtg 2760
gggagctgac ctcaggacac tgttggccca tcccggccgg gccctacatc ctgggccccg 2820
ccacagaggg aatcaccccc agaggcccaa gcccaggggg acacagcact gaccaccccc 2880
30 ttcctgtcca gagctgcaac tggaggagag ctgtgcggag gcgcaggacg gggagctgga 2940
cgggctgtgg acgaccatca ccatcttcat cacactcttc ctgctaagcg tgtgctacag 3000
tgccaccgtc accttcttca aggtgaagtg gatcttctcc tcggtggtgg acctgaagca 3060
154
gaccatcgtc cccgactaca ggaacatgat aaggcagggg gcctagggcc accctctgcg 3120 3180 3240 3300
gggtgtccag ggccgcccag accccacaca cgagccgtgg gccatgctca tggctctctg gcatagcagg gccaccaccc gcttcgcagt tctaccccag
aggccacacc cgccctctga tgccccctga gccctgaaac cctcaccgcc gccccccttc ctcaacccca cagaccctgt
5 acctccgctg cttggtgcca gggcactggg ggccaggtgt cccctcagca ggacgtccct 3360
gccctctgga ccaccaggtg ctcacacaaa aggaggtaac cggcatccca ggcccccact 3420
caggcaggac ctcgccctgg agccaacccc gtccacgcca gcctcctgaa cacaggcatg 3480
gtttccagat ggtgagtggg agcatcagtc gccaaggtag ggaagccaca gcaccatcag 3540
gccctgttgg ggaggcttcc gagagctgcg aaggctcact cagacggcct tcctcccagc 3600
10 ccgcagccag ccagcctcca ttccgggcac tcccgtgaac tcctgacatg aggaatgagg 3660
ttgttctgat ttcaagcaaa gaacgctgct ctctggctcc tgagaacagt ctcggtgcca 3720
gcaccacccc ttggctgcct gcccacactg ctggattctc gggtggaact cgacccgcag 3780
ggacagccag ccccagagtc cgcactgggg agagaagggg ccaggcccag gacactgcca 3840
cctcccaccc actccagtcc accgagatca ctcagagaag agcctgggcc atgtggccgc 3900
15 tgcaggagcc ccacagtgca agggtgagga tagcccaagg aagggctggg catctgccca 3960
- gacaggcctc ccacagaagg ctggtgacca ggtcccaggc gggcaagact cagccttggt 4020
ggggcctgag gacagaggag gcccaggagc atcggggaga gaggtggagg gacaccggga 4080
gagccaggag cgtggacaca gccagaactc accacagagg ctggcgtcca gtcccgggtc 4140
acgtgcagca ggaacaagca gccactctgg gggcaccagg tggagaggca agacgacaaa 4200
20 gagggtgccc gtgttcttgc gaaagcgggg ctgctggcca cgagtgctgg acagaggccc 4260
ccacgctctg ctgcccccat cacgccgttc cgtgactgtc acgcagaatc cacagacagg 4320
aagggaggct cgagcgggac tgcggccagc gcctgcctcg gccgtcaggg aggactcctg 4380
ggctcactcg aaggaggtgt caccatttca gctttggctt ttcttcttct tttaaatttt 4440
ctaaagctca ttaattgtct ttgatgtttc ttttttgatg acaataaaat atccttttta 4500
25 agtcttgtac ttcgtgatgg gagccacctt cctgtgtcca cgcgcctcct gcccccggtg 4560
gaaaacacgg tcaggaggag gctggtccag ctgcacctcg ggggatcc 4608
<210> 144 <211> 330 <212> PRT <213> Artificial <220>
<223> Amino acid sequence of the short (slgG) isoform of the
155 gamma-chain constant region encoded by plasmid pmlgGdelta-A <400> 144
Ala 1 Ser Thr Lys Gly Pro 5 Ser Vai Phe Pro Leu 10 Ala Pro Ser Ser 15 Lys
5 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Vai Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Vai Thr Vai Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Vai His Thr Phe Pro Ala Vai Leu Gin Ser Ser Gly Leu Tyr Ser
10 50 55 60
Leu Ser Ser Vai Vai Thr Vai Pro Ser Ser Ser Leu Gly Thr Gin Thr
65 70 75 80
Tyr He Cys Asn Vai Asn His Lys Pro Ser Asn Thr Lys Vai Asp Lys
85 90 95
15 Lys Vai Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Vai Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met He Ser Arg Thr Pro Glu Vai Thr Cys
20 130 135 140
Vai Vai Vai Asp Vai Ser His Glu Asp Pro Glu Vai Lys Phe Asn Trp
145 150 155 160
Tyr Vai Asp Gly Vai Glu Vai His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
25 Glu Gin Tyr Asn Ser Thr Tyr Arg Vai Vai Ser Vai Leu Thr Vai Leu
180 185 190
His Gin Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Vai Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro He Glu Lys Thr He Ser Lys Ala Lys Gly
30 210 215 220
Gin Pro Arg Glu Pro Gin Vai Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225
230
235
240
156
Leu Thr Lys Asn Gin Vai 245 Ser Leu Thr Cys 250 Leu Vai Lys Gly Phe 255 Tyr
Pro Ser Asp lie Ala Vai Glu Trp Glu Ser Asn Gly Gin Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Vai Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Vai Asp Lys Ser Arg Trp Gin Gin Gly Asn
290 295 300
Vai Phe Ser Cys Ser Vai Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gin Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330 <210> 145 <211> 399 <212> PRT <213> Artificial <220>
<223> Amino acid sequence of the long (mlgG) isoform of the gamma-chain constant region encoded by plasmid pmlgGdelta-A <400> 145
Ala Ser Thr Lys Gly Pro Ser Vai Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Vai Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Vai Thr Vai Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Vai His Thr Phe Pro Ala Vai Leu Gin Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Vai Vai Thr Vai Pro Ser Ser Ser Leu Gly Thr Gin Thr
65 70 75 80
Tyr He Cys Asn Vai Asn His Lys Pro Ser Asn Thr Lys Vai Asp Lys
157
Lys Vai Glu Pro 100 Lys Ser Cys Asp Lys 105 Thr His Thr Cys Pro 110 Pro Cys
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Vai Phe Leu Phe Pro Pro
115 120 125
5 Lys Pro Lys Asp Thr Leu Met He Ser Arg Thr Pro Glu Vai Thr Cys
130 135 140
Vai Vai Vai Asp Vai Ser His Glu Asp Pro Glu Vai Lys Phe Asn Trp
145 150 155 160
Tyr Vai Asp Gly Vai Glu Vai His Asn Ala Lys Thr Lys Pro Arg Glu
10 165 170 175
Glu Gin Tyr Asn Ser Thr Tyr Arg Vai Vai Ser Vai Leu Thr Vai Leu
180 185 190
His Gin Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Vai Ser Asn
195 200 205
- 15 Lys Ala Leu Pro Ala Pro He Glu Lys Thr He Ser Lys Ala Lys Gly
210 215 220
Gin Pro Arg Glu Pro Gin Vai Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gin Vai Ser Leu Thr Cys Leu Vai Lys Gly Phe Tyr
20 245 250 255
Pro Ser Asp He Ala Vai Glu Trp Glu Ser Asn Gly Gin Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Vai Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
25 Leu Tyr Ser Lys Leu Thr Vai Asp Lys Ser Arg Trp Gin Gin Gly Asn
290 295 300
Vai Phe Ser Cys Ser Vai Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gin Lys Ser Leu Ser Leu Ser Pro Glu Leu Gin Leu Glu Glu Ser Cys
30 325 330 335
Ala Glu Ala Gin Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr He Thr
340 345 350
158
He Phe He Thr Leu Phe Leu Leu Ser Vai Cys Tyr Ser Ala Thr Vai
355 360 365
Thr Phe Phe Lys Vai Lys Trp He Phe Ser Ser Vai Vai Asp Leu Lys
370 375 380
5 Gin Thr He Vai Pro Asp Tyr Arg Asn Met He Arg Gin Gly Ala
385 390 395
<210> 146
<211> 53
<212> PRT
10 <213> Homo sapiens
<400> 146
Leu Trp Thr Thr He Thr He Phe He Thr Leu Phe Leu Leu Ser Vai
1 5 10 15
Cys Tyr Ser Ala Thr Vai Thr Phe Phe Lys Vai Lys Trp He Phe Ser
- 15 20 25 30
Ser Vai Vai Asp Leu Lys Gin Thr He Vai Pro Asp Tyr Arg Asn Met
35 40 45
He Arg Gin Gly Ala
50
20 <210> 147
<211> 34
<212> PRT
<213> Homo sapiens
<400> 147
25 Ala Gly Thr Thr Asp Ala Ala His Pro Gly Arg Ser Vai Vai Pro Ala
1 5 10 15
Leu Leu Pro Leu Leu Ala Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr
25 30
Ala Pro <210> 148 <211> 4551
159 <212> DNA <213> Artificial <220>
<223> DNA sequence of the gamma-chain expression cassette constant region, from CHI to 3'UTR of expression plasmid plgG-GPI-B <400> 148 cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg60 gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt120 ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag180 gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct240 acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga300 ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg360 catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc420 cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg480
-15 ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg540 ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac600 cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag660 taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac720 cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta780 gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct840 tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag900 gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac960 gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag1020 acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc1080 ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc1140 ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg1200 ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac1260 ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga1320 tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga1380 catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc1440 cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag1500 gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta1560
160
cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620
ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680
cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740
tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800
5 ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860
ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920
gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980
agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040
gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100
10 cccccacggc actaacccct ggcagccctg cccagcctcg cacccacatg gggacacaac 2160
cgactcctgg ggacatgcac tctcgggccc tgtggaggga ctggtccaga tgcccacaca 2220
cacactcagc ccagacccgt tcaacaaacc ccgcactgag gttggccggc cacacggcca 2280
ccacacacac acgtgcacgc ctcacacacg gagcttcacc cgggcgaacc gcacagcacc 2340
cagaccagag caaggtcctc gcacacgtga acactcctcg gacacaggcc cccacgagcc 2400
-15 ccacgcggca cctcaaggcc cacgagccgc tcggcagctt ctccacttgc tgaccagctc 2460
agacaaaccc agccctcctc tcacaaagtg cccctgcagc cgccacacac acacaggccc 2520
ccacacacag gggaacacac gccacgtcac gtccctggca ctggcccact tcccaataca 2580
gcccttccct gcagctgagg tcacatgagg tgtgggcttc accatcctcc tgccctctgg 2640
gcctcaggga gggacacggg agacggggag tgggtcctgc tgagggccag gcctctatct 2700
20 agggccgggt gtctggctga gtcccggggc caaagctggt gcccagggcg ggcagctgtg 2760
gggagctgac ctcaggacac tgttggccca tcccggccgg gccctacatc ctgggccccg 2820
ccacagaggg aatcaccccc agaggcccaa gcccaggggg acacagcact gaccaccccc 2880
ttcctgtcca gagctgcaac tggaggagag ctgtgcggag gcgcaggacg gggagctgga 2940
cggggccggc accaccgacg ccgcgcaccc ggggcggtcc gtggtccccg cgttgcttcc 3000
25 tctgctggcc gggaccctgc tgctgctgga gacggccact gctccctagg gccaccctct 3060
gcggggtgtc cagggccgcc cagaccccac acacgagccg tgggccatgc tcagccacca 3120
cccaggccac acctgccccc tgacctcacc gccctcaacc ccatggctct ctggcttcgc 3180
agtcgccctc tgagccctga aacgcccccc ttccagaccc tgtgcatagc aggtctaccc 3240
cagacctccg ctgcttggtg ccagggcact gggggccagg tgtcccctca gcaggacgtc 3300
30 cctgccctct ggaccaccag gtgctcacac aaaaggaggt aaccggcatc ccaggccccc 3360
actcaggcag gacctcgccc tggagccaac cccgtccacg ccagcctcct gaacacaggc 3420
atggtttcca gatggtgagt gggagcatca gtcgccaagg tagggaagcc acagcaccat 3480
161
caggccctgt tggggaggct tccgagagct gcgaaggctc actcagacgg ccttcctccc 3540
agcccgcagc cagccagcct ccattccggg cactcccgtg aactcctgac atgaggaatg 3600
aggttgttct gatttcaagc aaagaacgct gctctctggc tcctgagaac agtctcggtg 3660
ccagcaccac cccttggctg cctgcccaca ctgctggatt ctcgggtgga actcgacccg 3720
5 cagggacagc cagccccaga gtccgcactg gggagagaag gggccaggcc caggacactg 3780
ccacctccca cccactccag tccaccgaga tcactcagag aagagcctgg gccatgtggc 3840
cgctgcagga gccccacagt gcaagggtga ggatagccca aggaagggct gggcatctgc 3900
ccagacaggc ctcccacaga aggctggtga ccaggtccca ggcgggcaag actcagcctt 3960
ggtggggcct gaggacagag gaggcccagg agcatcgggg agagaggtgg agggacaccg 4020
10 ggagagccag gagcgtggac acagccagaa ctcaccacag aggctggcgt ccagtcccgg 4080
gtcacgtgca gcaggaacaa gcagccactc tgggggcacc aggtggagag gcaagacgac 4140
aaagagggtg cccgtgttct tgcgaaagcg gggctgctgg ccacgagtgc tggacagagg 4200
cccccacgct ctgctgcccc catcacgccg ttccgtgact gtcacgcaga atccacagac 4260
aggaagggag gctcgagcgg gactgcggcc agcgcctgcc tcggccgtca gggaggactc 4320
- 15 ctgggctcac tcgaaggagg tgtcaccatt tcagctttgg cttttcttct tcttttaaat 4380
- tttctaaagc tcattaattg tctttgatgt ttcttttttg atgacaataa aatatccttt 4440
ttaagtcttg tacttcgtga tgggagccac cttcctgtgt ccacgcgcct cctgcccccg 4500
gtggaaaaca cggtcaggag gaggctggtc cagctgcacc tcgggggatc c 4551
<210> 149 <211> 330 <212> PRT <213> Artificial <220>
<223> amino acid sequence of the slgG isoform of the gamma-chain constant region encoded by plasmid plgG-GPI-B <400> 149
Ala Ser Thr Lys Gly Pro Ser Vai Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Vai Lys Asp Tyr
30 20 25 30
Phe Pro Glu Pro Vai Thr Vai Ser Trp Asn Ser Gly Ala Leu Thr Ser
162
Gly Vai His Thr Phe Pro Ala Vai Leu Gin Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Vai Vai Thr Vai Pro Ser Ser Ser Leu Gly Thr Gin Thr
65 70 75 80
5 Tyr He Cys Asn Vai Asn His Lys Pro Ser Asn Thr Lys Vai Asp Lys
85 90 95
Lys Vai Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Pro
100 105 110
Glu Leu Leu Gly Gly Pro Ser Vai Phe Leu Phe Pro Pro Lys Pro Lys
10 115 120 125
Asp Thr Leu Met He Ser Arg Thr Pro Glu Vai Thr Cys Vai Vai Vai
130 135 140
Asp Vai Ser His Glu Asp Pro Glu Vai Lys Phe Asn Trp Tyr Vai Asp
145 150 155 160
15 Gly Vai Glu Vai His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gin Tyr
165 170 175
Asn Ser Thr Tyr Arg Vai Vai Ser Vai Leu Thr Vai Leu His Gin Asp
180 185 190
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Vai Ser Asn Lys Ala Leu
20 195 200 205
Pro Ala Pro He -Glu Lys Thr He Ser Lys Ala Lys Ala Cys Pro Gly
210 215 220
Gin Pro Arg Glu Pro Gin Vai Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
25 Leu Thr Lys Asn Gin Vai Ser Leu Thr Cys Leu Vai Lys Gly Phe Tyr
245 250 255
Pro Ser Asp He Ala Vai Glu Trp Glu Ser Asn Gly Gin Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Vai Leu Asp Ser Asp Gly Ser Phe Phe
30 275 280 285
Leu Tyr Ser Lys Leu Thr Vai Asp Lys Ser Arg Trp Gin Gin Gly Asn
300
295
290
163
Val Phe Ser Cys Ser
Vai Met His Glu Ala Leu His Asn His Tyr Thr
305
310
315
320
Gin Lys Ser Leu Ser Leu Ser Pro Gly Lys
325
330 <210> 150 <211> 380 <212> PRT <213> Artificial <220>
<223> amino acid sequence of the long isoform of the gamma-chain constant region including the carboxy-terminal signal peptide of the human placental alkaline phosphatase encoded by plasmid plgG-GPI-B <400> 150
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gin Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gin Thr
65 70 75 80
Tyr He Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met He Ser Arg Thr Pro Glu Val Thr Cys
130
135
140
164
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
5 Glu Gin Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190
His Gin Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro He Glu Lys Thr He Ser Lys Ala Lys Gly
10 210 215 220
Gin Pro Arg Glu Pro Gin Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gin Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
- 15 Pro Ser Asp He Ala Val Glu Trp Glu Ser Asn Gly Gin Pro Glu Asn
- 260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gin Gin Gly Asn
20 290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gin Lys Ser Leu Ser Leu Ser Pro Glu Leu Gin Leu Glu Glu Ser Cys
325 330 335
25 Ala Glu Ala Gin Asp Gly Glu Leu Asp Gly Ala Gly Thr Thr Asp Ala
340 345 350
Ala His Pro Gly Arg Ser Val Val Pro Ala Leu Leu Pro Leu Leu Ala
355 360 365
Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr Ala Pro
30 370 375 380
<210> 151 <211> 2061
165 <212>
DNA <213>
Homo sapiens <400>
151 gtacacactg taacttctcc tctcgatgtc ctgccctcgc cacgggcacg gggggagcat gcatttccag gcttggggag acacagaggc aggagagctg gaagaatggg ctcctgcctg120 cctggtgcca catcctgccc cagctttgag ggctgaatcc tctcagctca gagaagagct180 tccctagttt tgcaggcgca cggaggcctc ccacccgtac acctgcctct gctctccccc240 tggccattgc aatgcatgcc cgggatctgg gtttaccctg cagcccgact cctccagggc300 aggctccttc cgtccttggg tccagcagcc tcccccctcc gctgggtact gagcatctga360 aaagtctcag atagggccct acacctcttc tcccttctca agtgctcagc ccaggggtgg420 ggcttgctgc ttgcaaagag cagcccaccc tcctgtactg ccatcctatt gcctttgaag480 aaggaggtca gcctggacag gtgaactgag ttgccttcag aaaggcctgt ctcaggcagc540 cgcagcaggc ttcacgatgt ccatgtatcc tgtttgcctg ctgccgtctc tcctctccca600 agaggggagg tctgcgtgtt gagccaggga ggaaggagcc tgcagcctgc tcagggtggt660 ggctggtgac tgcggggcca gggcttgctg ctgtctctcg gaatgtcctg catgtgggtc720 , tggctgttcc tgctggcact gccctcttct ctctcccctc ctttcccact ctgccctgct780 tgcccgtcag ggtctccgga tgcccctgct ggaggcagag aagcgttctg tttttatcat840 ' cgtccctgtc ttggtcctgt ccgtgctccc catgtgctcc caatcagttg tcttcgttcc900 tcaacatcag ggaaagaaaa aacagcaaca cttctccctg tcatcagctc tgctgtctcc960 ttgtcaggcc ttgggacgtt ctctgggctc agtctagggt cgtgcctcat gcctcatgcc1020 tctctgggaa ggttcccagg ggcgccgcct ccatggttgg ctggtgggtt ttaaagggga1080 aggttgggag gaggcctgtg gaaggaggag ggccgtccac acccgtgggg caaagcgtgt1140 tccatgaaac cagtgctgtg cgtgctggga tgaaagcctc ccagcctctc gtgctgaagg1200 gaaaggtgga ccgaactggc ttagctgctg tggcaatggg gtggggggtg agtcctaatc1260 agaaggtggg agaagagaat aacaaaatgg aactccgccc cctgccgcca catttcctta1320 agttttagga gttggggcct atgagtagaa tttgaaagaa ctaccaaaaa agcttatttt1380 tggaaattaa gtcagctttg cctgtggttt ggctaggaat aaatatttac ctgtgtgccc1440 ctacagagat gacacagacc caaagtggga cattgagcaa ggcacaggct ggttcccctc1500 ctgtcctctg tcctcattct gtgagtgcca ccatcaccag gtactgtggc ctgcagaaat1560 aaacgaggca ccaaccctgc cctcagggac cccgtgtctt cttagggaca gaggactcag1620 aaacatctgt gtccccgcat gttaagtgca tgcacacagt gctgaggctt tgcagagaag1680 ggccatggct ccctgaggag accaagaaag gcacatagaa gtgacttctc agctggccct 1740
166 tgcaggatcc ctgggtgcct gtacctctcc agtccagctg agcaaggagg ctcaggaatt1800 aatgaagatg gggcttgtgt agcacgatgg ttctaggcca tcccttttcc atggctcaag1860 tccattgaag gcagcctcca aaatcagggg gttgcctgat cctcctagtg ccacaatccc1920 agtcctagct agaacttgcc atggttcttc tccctaaaag ttcccagggg acaggagaca1980 ggtgttgctt ttctaatgga gcgggacctc gcatggacgg ggccctccaa gcctgctaac2040 accctgttcg cactgactca g2061 <210>152 <211>2726 <212> DNA <213> Mus musculus <400>152 tacgttcaat ggcagtggat cttaaagacc ttttggatct aagaccagaa gccatctctg60 actcccctct caccttccag tttcttccaa atcctctggg ccagccagag gtctcagatt120 ctgccctctt gccctgtgcc caccttgttg accactggac agcatatgtg atggctactg180
- 15 ctagtgccag cttcacaaga ggttaacact acggactagc cattcttcct atgtatctgt240 _ ttctgcaaat acagccgctt tacttaagtc tcagcacttc ttagtctcct cttttcctct300 cagtagccca aggggtcatg tcacaaacat ggtgtgaagg gctactttgt caaatgaaaa360 ggtctatctt ggggggcatt tttttctttt ctttttttct tgaaacacat tgcccagcaa420 agccaataaa tttctctcat cattttgttt ctgataaatt cttactattg attgaaatgc480 ttccctgagg aacattaaat tatgtatgaa tttccattca aagtcatcat gcagcagtgg540 tatcaagcag gcagcatcta gtgcagaact gagattgtct acagaatgcc tgcttgatgc600 tcagccttat atcccagtta cggaca-tgtc tacaaatagc ccttctctta ccatctctcc660 cttaacttca tgatgtggta gctgattcct tctgccatca actgaaatgg caaaataaag720 gaaagcctga atcctgtctc ccctcttagt ttccaaggac acttgcccag aaaaatgcgc780 cccccccccc ccgtatcccc aggcagcatc caggactttc ttaaatggtt ctctgtacaa840 tcccaccttt aaaacagtca gtgaccattc tttgtaatca ttactttatt aatggttttc900 ttttctaaac cacctgcctt tgctgttgta gcttctcaat acatgctctg agacaaatca960 ttccttatat attccaatat tgctgaaaac tcattaattt ttactaatag ggggttgttt1020 tctaaagctc aggaaatgac ttgtactccc taagtaggaa atgttgcaaa ccaccatttc1080 atgatgtaca gttgattcaa ttaagtcagg tctgtgagga ctttggttcc ttatctatat1140 gtaaataatg ctgataccaa atctttgcta ttcattaaca tgtaatcttg caaataataa1200 taaatttaac agaaactcaa attgaggtag attcttaagg ataatagctt tcagcctagc 1260
167
cataaaagaa atgaaaaaat agt-ctttaaa gatcccaaat tcagaattag taatattaat 1320
tcagatagtc cttcgtaaga ttgaaaaaca tgacttctga tttctcatct ttccaaagtt 1380
agacttgacc ttggtgagat ggcaaagtta aaaaattcct ggggtttaag gatatattgg 1440
ggcaacagtc acagcaacgg tgatgctttt tatatctaaa tcctgtcagg ttttgtttcc 1500
actgagctca ttcattcacc tagggatctc attaaaagta ggggaccggg ctggtgagat 1560
ggctcagcag gtaagagcac ccgactgctc ttccgaaggg cctgagttca aatcccagaa 1620
accacatggt ggctcacaac catccgtaac aagatctgac tccctcttct ggtgtgtctg 1680
aagacagcta cagtgtactt acatataata aataaataaa tcttaaaaaa aaaaaaaaag 1740
taggggaccc tatcagaggt ctcaatgtgc ctggaaggtc tcccaacatg gctgtgggaa 1800
aatgcctgac aatttttttt caattgcatg tgtgttctcc gagaaaggat aagatgcaag 1860
tttatataag aagcaggatt tacttatact aaaatgcctt acacgtaagg ttcaggtagc 1920
atcgtggcag agagggtaga aagactgtaa gagccagagg accaggatgt ccgctcttag 1980
tgtcttctat atatgaaaga aagctgtacc cgtgaattct caaacagttg tctacatatc 2040
acctgcacaa tggccgttct ggaaatctaa aaaaaacaaa aaacaaacaa acaaataaat 2100
aaataaataa atatcaaaaa atcaaaaacc acccctagat gaaaagctac aagtaattaa 2160
aagctgctaa aagggggaga atcaattttc tccagagaca agtccctgat aggtcatcca 2220
atttcgggtg atcagcccta agcacataca catataagca atactaaacg gacacagctg 2280
gtctatatac ttacaacttg gggcttgaag gaagttggtg gggaaggggg gagagtagta 2340
atgatgtatg taaatacagt actcatgtac gaaactcccc aaaaataaag aattcttaaa 2400
attattaaaa actggtattc ttgtcttgga ctattttctg aattttatat taatattttc 2460
atcatcaaaa gactataaaa tgattataat aatgagagaa gttcagatga aacatcaact 2520
gtcttaaatg tagaaaagga aactgacttc aggcagagaa gctaaaaatg ttggcaacct 2580
tgccttggga cttagccacc agtcatttcc tctatataag tcacccatat cccaatttct 2640
gagataattt taaatgttat cactgtgtca aaggtgcagg acatgtatgg aatgcccata 2700
ttaccttctc ttgtctctca ttccag 2726
<210> 153
<211> 5686
<212> DNA
<213> Homo sapiens
<400> 153
gggtgagttg gcagcaacat ctcttggttt aagagttcca gcacagcgat agtactttct agccacatct cagcaaggaa actaggctat tgccacctgc tcttaagagg cttgaacaca
120
168 ggtgttaact cctgattgaa atgaacaaag ataggagaag attaggggga aaatctgtat180 ccttgctgga aaccagggca gtgcacatat aaagagtatg ctgttcactg gatgggaagg240 aaaaaaactt agaagtgtag tagtcaaagc acacaaacaa ccctaaccca gagtagacat300 tgctggaaga aagggaagac catgtagcag ctgtgtgaga gaatgaatct taatgataac360 agcatgatcc cttgctaggg ctgccatcaa aaagtacagg ccttcctcgt tttattgtac420 ttcgcagatg ttatgctttt tacaaattga acgcttgtgg gaacgctgtg taagcatgtt480 cgtcggcatc atttatccaa cagcgtgtgt tgacttcgtg tctctgtgta gcattttgat540 tattctcaca gtatcccaga tgttttcatt attatcatgt ctgtgatagt gatctgtcat60Ò cagtgatctt tgatgttact attgtcattg tttggggtcc ctacgaactg cacccatata660 agacagaaaa cttaatcaat aaatgtgcgt gctttgactg ctccatggac tagacattcc720 ccttctgtct ccctctcttc aggactccct aatccctgag acacaataat actaaaatga780 ctccaattaa taaccctaca atagccttta agtgttgaca tgaagggaag agtcatgcat840 ctcttacttt aaatcaaaag ctagagatga ttaagcttac tgaggaagat acgttgaaaa900 ccaagatagg ccaaaagcca ttcctcatgt gccaaacagc tagaaagttg taaaggcaaa960 gtaaaaatac ttgaaggaaa tttaaaatgc tcttccagtg aacacatgta tgataagaag1020 . gtaaaacagc cttattgctg atatggaaga agttttagtg gtctagacat aagatcaaac1080 tagaaacatt tcctgaagcc aaagcgtaat cctgagcaag gccgtaactc tcttcaattc1140 tgtgaaggct gacagaagct ggaagctagc agaatttggt tcctgaggtt taaggaaaga1200 agccctctcc ataacataaa ggtccaaggt gaagcagcca gtgctcatat agaagttgca1260 gcaagttatc tagaaaatct agctaagatc actgacgaag gtgttacact aaataacaga1320 ttttccatgt agacaaaaca gccatctatt ggactttcat agctagagag gagaagccaa1380 tacctgggtt caaagcttca aagaacaggc tgacttttta ggagctaatg ccgctggtga1440 ctttgagttg aagccaatgt tcaccgacca ttctaaaaat cctagggccc ttaagcatta1500 agttaaatat accttgcctg tgtctataaa tggaagaaca aagcctgatg acagaggtat1560 gtttgcggca tagtttactg aatattttaa gcccactgtt gagatctagt gctcagaaaa1620 acagattcct ttcaaaatat tactgctcat tgacattgca cctaagcagc caagagctct1680 aatggagaag gacatggaga tgaatggagt tttcctgcct gctaacaaca gcagccattc1740 tgcagcccat ggctgaagga gtaattttga ctttcaagtt tcactattta agaaatacat1800 tttgtaaggt gagtccccac agacagtaat tcctctgatg gatctgaaca aaataagttg1860 aaaactgctg gaaagaattc atcattctac ataccattaa gaacattcgt gattcatggg1920 aagagcttaa aatatcaaca ttaataggag tttggtagaa gttaattcca accctcatgg1980 ctgactttga gaggttcaag acttcagcgg aggaaataac tgaagatgtg gtgaaaatcg 2040
169
caagagaact acaattagaa gtggagcctg aagacgtgac tgaattgcga caaattcatg 2100
atcaaacttg aacagatgag gagttgcttc tcatgaatca gcagagaaag tggttttttt 2160
gaggtggagt gtcttcctgg tgatgatgac atgagcattg tgaaaatgac cacaaaggat 2220
acagaatatt acaaaaactt aggtgataaa gcagcagcag tatcgggagg attaactcca 2280
attttgaaag cagttcagag ggtaaaatgt tatcaaacag cattgcatgc tagaaaaatc 2340
ttttgtgaaa ggaagagtcc atcaatacag caattttatt gctgtctcag cttaagaaat 2400
tgccacagcc accccagcct tcagcaacca ccaccctgat cagtcagcag ccatcaacct 2460
tgaggcaaga ccctccacca acaaaaagat tacaaattat tgaaggtcag ataatcttta 2520
gtattttctt atcaataaac ctttttttaa agtatgactt tgtttagaca taatgctatt 2580
tcacacttaa tagactaccg tatagtataa acacaacttt tagactcact gagaaatcaa 2640
aaaattcatc tgactcattt gttgtgatat gtgttttatt gtggtggtct ggaactgaac 2700
ctgcaatata tttgaggaat gtctgtaaca cgaagtgggc ggcttaatac aacagaagtt 2760
tttggagttc cattctagag actggaaatc caaaatcaag gttttgggag ggccacgctc 2820
cctctgaatc ctgtagggaa ggatccttca ttgcatcttc cagcttctgg agccacaggc 2880
cttccttggc atgtggcagc agaactccaa tttctgtctc tgtcctcata tggccatctt 2940
ccctctgggt ctgtgtcctc atatgctgtt ctctctgtgc atgtctgttt ccaaagtttt 3000
cccttttaat aaggacacca gtcacactgg attagggcct accttcatga cctcacctta 3060
acttgattgc gtctgcaaag atcgtatttc caaataaggt cacatccaca gggactggag 3120
gttaagactt cagcatactc aggggagaca caattcaacc tataacagag cccctttgaa 3180
aatgtcaggc atcaggtgct cacagcacac ggtccagctg ttggtgctca cccttgctca 3240
gcacacggtg gaggctctgc ctcaatctca ttcttcatgg gaacagctaa gccaggtagc 3300
gaatacgagt tacgtttgtg tcaccacagc agacactgaa aggaagtttg tggtgtccag 3360
cacatttgcc agcataggcc tcacagacca caacacctag aatctgacaa aaattagaat 3420
aaatccgatg tctccttttc tctctttttt taagcatttt taaatacaat tggtaaattt 3480
cctgactgta ccctactcat cttgcattgc tgaataagtg aggaacctct ctatggcatg 3540
aagcagaaaa ccattgagct tatgagaaga aacaggaaat acatgtaaaa gagaccagtc 3600
tgaaaaatca ggagaaattt tacaaaagag atttactgcc aagaaaccag ggaaactttc 3660
agaacactct ccttttcata tttgtaacaa gattcaattg tacaaatact tctgtgaaac 3720
tagccatgaa gtgtgtacat gaatgaatat atgtattcag tgtgtttata tatttcattt 3780
catacatgtg atctatatca tatatatata tatatatata tatatatatc acaatgaata 3840
ttgcagaaaa ttaaagcaaa gagtaagaag agttaaccaa atgttccctg aatgcagtgg 3900
gaaaagatga aaaggagaag acaggcaagc acagtggctc acacatgtaa tcccaacata 3960
170
ttgagaggcc ggggcaagag gatcacttga gcccaggagc tcaagaccag cctggacaac 4020
atggcaaaaa cccatctcta caaaaaagta taaaaattag ctgggcatgg cagcatgtga 4080
ctgtagtcac agctaggcag gagaatgaag tgggaggatc acctgagccc aggaggctga 4140
ggcttcagtg agccttgatg gcaaccctgc actccagcct ggatgacaga atgagaccct 4200
gtctcaaaaa aggaaaaaga gaagacatat gtaacacagt gtcaggattc aaaatacatg 4260
tagcaaaaat tccagaaggg taagcaaata agcccatacc tagccatcac tagggaaact 4320
tctgtgtttc agggatagag aaaaaaactc tgattccaga aataaaatgt gaaaatataa 4380
tacccgcaaa agaaataaat ttattgacac cacattgatt ctatattgta taagatatat 4440
tgtataacac taaattgtag aagatagcac ttctcttgag ccaagctaat atgcacacct 4500
agaggctcca ggtacacatt aaaggataag caaagacaca aaaattgtac catttaagta 4560
tgtttcccag gcaattcata agcaaatttt taaaaaggag aatgatgaat tccaaaggaa 4620
atctcaatga gataggatgt aggtaaaaag aaaaaacaac aataaaaaaa acatacacac 4680
aaaatcttgg caatgtaata ataatttatt aataatctct ctaaactcat agaatatatc 4740
aataaaacta gaaaatgtga gacagcaaga aaagataggc tagacttaca ttacagaaaa 4800
gatgagtaga ctgactatat agagtttgac tctaaaattg agaaaagagg tttaaatatg 4860
tgtcacgtgt atatgtataa tatacatgca cacatataaa atgaaattcc tcactggaaa 4920
aaatattaag tttaatttcc aaattattag aatgactaaa acagttgaat ctatctgttc 4980
catatagtaa ttgaggggga aggaaaagga atagcaagga atccattttt ctcttccacc 5040
agaaataagc tccctcatgt ttgggtcagg tcactttatt cattgctttc tccacatcct 5100
catcattagg catcatgaaa tcaatgaaaa ggcagtgaaa gaatgatgat gaaagctaat 5160
caaatgtatc atttacctca atacgtttgg tttaatcttc ttgttgaaag acaaattctc 5220
ctagacagga tcaaaagcaa catatcttgt atttataaaa aacatgtctc aagtaaaatg 5280
acatagtatt atacacacac acacacatac acacacacac acacattaag ggaaaatgca 5340
gacaaaaaat ggcagaaata atatttagag aaagatagaa tttaagaaaa aaaattgtca 5400
aacaggtctg caaaataatt gttttatttt ggtgccagtt acagtccgca atgaagcgaa 5460
gatattaaga agcaaagtgg gccaggagaa attagagcag aaatatctct ttcaatagtg 5520
agagaatagg aaaaagaagt agaaaagctg ggaacaatag gtaaagttta ggctaggcct 5580
tagacttctc ctgcattgta atccctctgg tttgccacat atgcatgctg tcaggaagtt 5640
gatgaggtat gtacagcaca atttattttc cattttttgc ctttag 5686
<210> 154
<211> 1260
<212> DNA
171 <213> Mus musculus <400>154 gtgagtatca gggtcgtagg ctgtgaggat ctctacagcc gtgtatattc tctgttcaga60 aattccctct ggctgaccgt ggcgttttcc gttctaggat gcctctaact atacatccct120 gtggctgtgg tgtggtgatc cgagggctgc actaacacac agatttctgt ggttgtcact180 gttcagggcc acagaatgac tgagtcttct ttctatacag tatgcagtag ctggatagtc240 aggactgggg aaggttgtgt gaggttgact cggtggtacc gctgaggagg aaaagggctt300 gtccagagca ggcgtgatgt acagcgcaca ttgttttttt cagcaagtaa tgaaaatctg360 tgactgagtg accttggggg ctgcggtggt gaggagagct cacgggaatc ctggagcagt420 gtagctggcg tgtcaaaagc agaaacgcag gagatgggtc agtgcgccga ggcccggagt480 ttaaatcccc agagcccacg taaaagcctt gcgcagtagc acgcatgcgt aatcctgatg540 gagcaattag gagaagccgg tggccggcta gcctgtgcag actgtgaaaa cagagcatct600 gaagctgtgt gaaaggctag ctcgcctgtg ctcctcagat cctgacatac gccatctcga660 gcaaaagatt aacaatcgat taaaacccac acatgaaaac aaagaaacca gttagctcca720 gataaaagca aatgccagga aggaaaggag gcagagggca ggggtggagg agcaggtggg780 agaggatgac gtcagagaaa tctcagtggc cgtgaacaag gaagatattc cagggcttgt840 tctgaatgtg tgatctttta aaccatgtgg ccctcttagc ctgtgagaaa agtccatttc900 tagccctgct gaacagagaa gcccagggga gcaaccaact ggccttcggt cactcagcaa960 ggacctagta gaggctggct ttgaacttga gccctccagg gcacttgacc tctgagcttt1020 gggaaaacaa gcgaggcagc ttcacgctgt tgtgatctgg acttggatca gggccagtga1080 ggacagggac agggatgggt gtgataagga cttggtgtgt aagagggaga gttggggaga1140 caggtgggag ggctatctgt agccaggtaa ccaagggtcc caggggaacc cccagtgtgg1200 acgcggactg cacatgacac agggcggcct ccccattcat gactgttttt ctccttgcag1260 <210> 155 <211> 2627 <212> DNA <213> Homo sapiens <400> 155 gtaaacccac ccatgtcaat gtgtctgttg tcatggcgga ggtggacggc acctgctact60 gagccgcccg cctgtcccca cccctgaata aactccatgc tcccccaagc agccccacgc120 ttccatccgg cgcctgtctg tccatcctca gggtctcagc acttgggaaa gggccagggc180 atggacaggg aagaataccc cctgccctca gcctcggggg gcccctggca cccccctgag240
172
cctttccacc ctggtgtgag tgtgagttgt gagtgtgaga gtgtgtggtg caggaggcct 300
cgctggtgtg agatcttagg tctgccaagg caggcacagc ccaggatggg ttctgagaga 360
tgcacatgcc ccggacagtt ctgagtgagc agtggcatgg ccgtttgtcc ctgagagagc 420
cgcctctggc tgtagctggg agggaatagg gagggtaaaa ggagcaggct agccaagaaa 480
ggcgcaggta gtggcaggag cggcgaggga gtgaggggct ggactccagg gccccactgg 540
gaggacaagc tccaggaggg ccccaccacc ctagtgggtg ggcctcagga cgtcccactg 600
acgcatgcag gaaggggcac ctccccttaa ccacactgct ctgtacgggg cacgtgggca 660
caggtgcaca ctcacactca catatacgcc tgagccctgc aggagcggaa cgttcacagc 720
ccagacccag ttccagaaaa gccaggggag tcccctccca agcccccaag ctcagcctgc 780
tcccctaggc ccctctggct tccctgtgtt tccactgtgc acagatcagg caccaactcc 840
acagacccct cccaggcagc ccctgctccc tgcctggcca agtctcccat cccttcctaa 900
gcccaactag gacccaaagc atagacaggg aggggccacg tggggtggca tcagaagcag 960
gccagtgaga cagggcctgc ccagggccct ctgcatgcct ctggcttctg cctggggctc 1020
ccaggagtgt aagaacagtc ccacaaccac tgtggggaca cctggcaccc agactcccac 1080
aagggggcag tggggcccct gctcgtgcct tagacatctt ccgggcctcc ccagggcccc 1140
ccgccttctg gctgcctccc tctgctctca gggccaaggt gaggtggagg ccactgtcac 1200
ccctgagggt ccagtcacca gagggtaatt gagagcaaca ggtcactcgg ggaagccctg 1260
ccacagagaa gccctccagc ccatgggacc caggacctgg cccaggggag gggcttttaa 1320
agagaggggg aaagagggag aatcaacaga tgaggggctg aaccagcaga cagagatcag 1380
gcagacacat gggtagatcc taggacatat aatgaatgga tgggtggatg gaggattggt 1440
agacggagga tggatgggtg ggtaaatggc tggatggagg atggacagat ggatatatga 1500
tggatggatg aaggacgggt ggatggagga tggatgagtg gatgaatgaa ggatggaaga 1560
tggatggatg gatgggtgga tggactgatg gatgatggat ggatggatgg atggatgatg 1620
gatggatggg taggcggatg gaggatggaa gggtggatgg aggatggaag atagatggag 1680
gggtgaatgg aggatgggtg gactgacgga ggattgagga tactggggtg ggtgggtggg 1740
tagatctatg gaggataggt gtatggaaga taattggatg gagaattgct ttatgaatgg 1800
atgaatgaag agatggaaaa tagctttata gatggatggg tgaatggatg gatggataga 1860
tggaagaagg atgaatggat ggaaaatagc tttatagata tatgggtgga tatttaagtg 1920
atagccttac attaatagat gaatggagga tgaatggttg ggtgagtggg taggagtgtt 1980
actgatggag gggtggatat acggataata gctttataga tggatggatg gatagatgga 2040
tggaaggata gaaagacagg tgaatgactg gatgtatcag catatgacaa gcaggtacag 2100
ctgtacatgg gaggtctatg ccctgagacc ctgaggaaaa tgaggatgcc cgtgctggtg 2160
173 gccctcacct ggccctcgct tgtaacccct cagccacatt ccctgggaag gcaacagagg2220 cctctggtct tgcccattca acctttggca cactgagtgt cagacccagg tctctgtctt2280 ggacccagat ctccttgagg gtgggtgtgt ctggtcctct ctggccccgg gacccagtca2340 ctgaatacgt ggctgggact gagacggggt ggggtgggag gggcgggagg gtacctcggg2400 ctcaagcttc ccttggagaa gcagatggtg tccactttct gccctgccaa gtctctccct2460 gaagtgccct aagaatgtca aagacagaag gtcccagccc ctcacctggg actctgcctc2520 ctcatcctcc ctgggggagt ctcaggcctt agatggggac ccagacccca ctgtccccag2580 accccaagga agcatagccg ctgttcacac gagtctgggc ctggcag2627 <210>156 <211> 1937 <212> DNA <213> Homo sapiens <400> 156 gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga60
-15 ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac120 tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg180 tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg240 ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc300 atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct360 accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca420 ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg480 cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc540 tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc600 ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc660 tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc720 ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc780 accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt840 ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact900 ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg960 cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc1020 catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag1080 tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg 1140
174 cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca1200 cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg1260 cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat1320 gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc1380 agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag1440 aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct1500 cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg1560 tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc1620 tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg1680 agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt1740 gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt1800 aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc1860 gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc 1920 tgggtgccca ccctcag1937
- 15 <210> 157 , <211> 1301 <212> DNA <213> Homo sapiens <400>157 gtaaatgagt gcgacggccg gcaagccccc gctccccggg ctctcggggt cgcgcgagga60 tgcttggcac gtaccccgtg tacatacttc ccgggcaccc agcatggaaa taaagcaccc120 agcgctgccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct180 gaggcctgag tggcatgagg gaggcagagc gggtcccact gtccccacac tggcccaggc240 tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg300 tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacggg360 aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg420 tcctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt480 gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct540 gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc600 tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc660 ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg720 gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga780
175 acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc840 tcggcagctt ctccacatgc tgaccagctc agacaaaccc agccctcctc tcacaaggtg900 cccctgcagc cgccacacac acacaggccc ccacacacag gggaacacac gccacgtcgc960 gtccctggca ctggcccact tcccaataca gcccttccct gcagctgggg tcacatgagg1020 tgtgggcttc accatcctcc tgccctctgg gcctcaggga gggacacggg agacggggag1080 tgggtcctgc tgagggccag gtcgctatct agggccgggt gtgtggctga gtcccggggc1140 caaagctggt gcccagggcg ggcagctgtg gggagctgac ctcaggacac tgttggccca1200 tcccggccgg gccctacatc ctgggtcctg ccacagaggg aatcaccccc agaggcccga1260 gcccagcagg acacagcact gaccaccctc ttcctgtcca g1301 <210> 158 <211>1553 <212> DNA <213> Mus musculus <400>158 gtaacacctc cctccatccc tcctaggcct ccatgtagct gtggtgggga aggtggatga60 cagacatccg ctcactgttg taacaccagg aagctacccc aataaacact cagtgcctga120 ttagagccct gggtgcctgt tcttggggaa ggcaggttat gggcagaaat atcttggcct180 ' gaaagaaggg acaccccaag agaaggacag gagtgaagca tggctcaccc atctgtctat240 gtgttggata tttgacaaat aggacatcac aggacttcag cataggtacc cctggtcctt300 cctgctcttc actggatatc atgcacctga tctctagaga tgcagctaaa atgagccagt360 ctgggaaacc tcagcaccca cctctcagtc ttgcaagctc ctgctcccag acattcctgg420 atactaaacc ccttcaggta gagaaacagc caaagtcaac atctaggacg caggactcaa480 catggtcctg ctccttccct ctctactcaa cagccattga ggctgagccc accgccccaa540 ccgcctgcct tgccaaatga tcacaccagg cctggtgctc ctcgtcttac tacctaaact600 cactccaacc caaattcatc ccaaggacca gaatgggctg acagcctcat acagtcaggt660 tcccccatct atgacatgtt ttcacatgca tgcacacaca cacacacaca cacacacaca720 cacacacaca cacacacaca cacacaggct tcattgagct ctctggttta gcaatagccc780 aaagcaagcc atacatccat cccagttcca gaaggataag aaaaccagaa ccaagacaca840 cccacaccta ttccataccc aaccaacagc acatatggct tacacacctg agattagtgg900 ctcccatcat gtacacacac atgcacacaa aggagcccat acatacccat catttccaga960 ggtaagtatc taacctttgg atctgagata tctctgagga acaccaatgg cagagtcaac1020 cagcacctca gcctccagac taaatcctta cattttggcc caccccaagc catgagagat 1080
176 ggaggagggt ggaggcctga gctgcgggaa agcagagaca ggaagatgga ctgtttggtg agagtagtaa accagacaat ggggagacta aggcaggagt agagccccta caaggcccag agtctgcttt agagtccatg tgtcctgacc tgcccctcag atgccacaac caagatttct ggttccagag catgcatgca ggccctagaa atggacctat gagctcagag ccttcctaga 5 gagccctggg tactctctga acaaaaggca attctgtgta gaggcatcct gtggccaaag accctaagac agtcatacac acacacacac acacacacac acacacacac aacacacaca acacacacaa cacaggtagg ttttatcatg ctctttggtt tagcaatagc cctgttgatg gtgggggata ctgggtcact gtgggcactg gagtagaaag agggaatgaa cag <210> 159 <211> 1354 <212> DNA <213> Mus musculus <400> 159 gtaaatgagc tcagcacaca caatgctcct gggtcctaat ggacactggc acccatatcc atgcatccct tgtataaata aagcacccag caaagcctgg gaccatgtaa aactgtcctg gttctttcca aggtatagag catagctcac gggctgatag ttctagccag ggttggagga cagccttgtc tttaggtttc tgcactgcag gactcagagc tcatgagtca tcttggcctg ' aagagtggaa cttagcttta ggcagtatct ttcctttact tcccacaaac cagcagctgc cagacataga gataatccta ggaagcctca aatggagaag cacacaaacc cacctccctc aggctgttcc tctccccagg ccccacttct ttacctaagg gtttctctga gtctattgta gaggcacaca tggccaggga tattccggag acccttagca tccatacact caactcaggc agcttttcac aggtgaggtc tgcacatcca tacagacggc tcactcctgc ctgtgccacg tggggctgag gcacatggct cttgctgccc caagggaggg actattagat agccacagtc atgctgaatc ctgacccatt caaattagcc tgctgaacac catccagtcc atatagcaca 25 tgtatccaca tgcacgtgtg cacacacaca tttaacacac tgggacaact cctctgtgcc ctgcacagca cctacatcca gcaatgtatc accatacaca cggccaaaaa ttcaatgccc acgtttctgc catcacaaac agacacacct ttcctctctg tggccactgc attatatgct caacacaaga cctctgaagc cagatccatc tctggtacct cagggtcatg cttcaacccc acatgaatta tgcaaaccat agccataatg gtctgaatca cttcacattg gaatggtccc 30 aagatcaggc aagaaaagcc acaggctctg ttgatgactg aaggacagca aagggtcagt ccagctgtat aaccactgtt gacctgggtc acagaccctg ctgaccctcc atattctctt
1140
1200
1260
1320
1380
1440
1500
1553
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080 gtactgaatg aatgaaaaat gagacaagca tagagggccc ttgcacaatc taggtcagta 1140
177 tgaggtctac ccgaggcatc attggagtca gctggaggaa gctgagactg atgtcccaga gggaaaggaa aagaaagaag gctccaggaa gggtctgctg taccagtcag gctggagctc tctcctctac ttcatgcaaa catgtctgca tcacagggaa tctctcccag caccaaccat gttgggacaa acactgactg tcctctctgt tcag <210> 160 <211> 81 <212> DNA <213> Homo sapiens <400>160 tcgcccctgt acctggagat catcatctat tgcacagggg ccttcctcat ctcctgcatg gtggggtcgg tcatcgtcta c <210>161 <211> 90 <212> DNA <213> Mus musculus <400>161 aagataccat ctattgccac tgggattgtg ggtggcctcc tcttcatagt ggtggtggcc cttgggattg gcctattcat gcgaagacgt <210> 162 <211> 29 <212> PRT <213> Homo sapiens <400> 162
Thr His Asp Ala Leu He Vai Gly Thr Leu Ser Gly Thr He Phe Phe
5 10 15
He Leu Leu He He Phe Leu Ser Trp He He Leu Lys
1200
1260
1320
1354 <210> 163 <211> 81 <212> DNA <213> Mus musculus <400> 163
178
cgccttccac tgggggtcac catctcctgc ctctgcatcc cgttgttttg cctgttctgt 60
tacttcagca ttaccaagat t 81
<210> 164
<211> 63
<212> DNA
<213> Homo sapiens
<400> 164
accatcacct tcctcaccct cttcctgctg agcctgttct atagcacagc actgaccgtg 60
acc 63
<210> 165
<211> 87
<212> DNA
<213> Homo sapiens
<400> 165
tggacgtgga ccggcctctg catcttcgcc gcactcttcc tgctcagcgt gagctacagc 60
gccgccatca cgctcctcat ggtgcag 87
<210> 166
<211> 78
<212> DNA
<213> Homo sapiens
<400> 166
gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 60
gccaccgtca ccttcttc 78
<210> 167
<211> 78
<212> DNA
<213> Mus musculus
<400> 167
gagctgtgga ccagtatttg tgtcttcatc accctgttcc tgctcagtgt gagctatggg 60
gccactgtca ccgtcctc <210> 168 <211> 78
179
<212> DNA
<213> Mus musculus
<400> 168
gggctctgga caaccatcac catcttcatc agcctcttcc tgctcagcgt gtgttacagc 60
gcctctgtca cactcttc 78
<210> 169
<211> 3111 <212> DNA <213> Homo sapiens <400> 169
gtgagtatca agaggcctaa gcaatggtaa tctccactct ccattcttcc cctgtggcca 60
gacacttccc ctggctgagt ctctgggctt ttatatcata ggatgcctct aatggcaatc 120
ctgccattag atacacctgc cgtggtgtat ctgccaggta ggcaggctag gctgcagtaa 180
caaacaagcc cacaatttcc atggcttaac actatgggaa tatatttctt gctcacgtaa 240
caagctaacg tgaatgttgc tggtttgtag gtggtttccc tccctgtaga aatctgggga 300
gtgaggttct ttccatcttg tggtgccgtc attctccagg acaaagattc ttacctactt 360
ttgtgtcctg gtttcctttg gcagcctggt gaagcctatg gacctcattt cagaatattt 420
ttaaatacat aaaatcccag cctgggcaat atagtgaaac ccccatctgt acaaaaatta 480
gccaggcatg gtggcatgca cctgtagtcc caggtactgg gaaggctgag gtgggaggat 540
cacttgagcc caggagtttg aggctgcagt gagccgtgat cgtaccactt tactcccacc 600
tgggtgacag agcaagagcc catctctaaa aataaataaa tacaatgaaa taaaataaaa 660
taaatagaac tacagaggaa actaattgta ttgaaatgca gttataaaac atttaaacac 720
atttttaatc tagagatata tgtgcttctt tattaagatc tataaataat aagttctagg 780
ggtagctcgc ataaatactg taatttcaaa gtagataagc ataaataata ctttatgata 840
ctgaaattgt gatgtgatat gagaatagct gtgagttttg ttttgctggg gacaggatca 900
gtgatgctgt cattactggg gtctcttccc tccattcttt ttttaaaatt gtattttatt 960
ttatttttaa aattttaaaa taaatagaga cagggtatca ctatgttgcc caggctgctt 1020
ttgacctcct gggctccagt gatcttccca tcttggcttc ccaaagtgct gggattacaa 1080
gtgggagcca gtgttcctgg ccccttcctc cattcttaat ggaaggagat gctaggtgtg 1140
agaggttagg gaaagtaaag atgtaatttc tttcccatcc aagttctcag acccctgaat 1200
tctacctgca gccatgttgg tccatcaacc ccaagtgaag aatccctgct ctagggcccc 1260
accattgtct gtatccagcc agcagaagag gcgtgattat ggagatcaca tctgcttctt 1320
180
gaaagcagac agcccggaag tgggccgcat cacttcctct caaattctat tggtgaaaat 1380
ggtcacatga ctacacatag ccacaaagga ggctgggaac tttctcactt ggaacctaca 1440
tcccagaaac aactcttttc agtgaggtat cccacaggtc tttcgcagta gaaatattga 1500
ttatctcaca taaaatgaag tcttacaaat ggacctactg ggttttgtac agcagccaag 1560
tgatatctct tcccttctgc tgtcttccct tctgccatcc ttcacatggt ggcattgtat 1620
ccttagactt gccacccatg ccctcaggtt ggccgttgca cactgtctta cataaagcag 1680
gaaggaaagg aaaggctgct acgagagagt gtaccttgtg catctctttt ttaatcagga 1740
agcaaacatc tttctagaag cttccctagc aaaattcccc ttacatctca ttggccaaga 1800
ctgttacatg ttacatggtt actgttatta cttgctcatt gcaaggaaga ctgggaactc 1860
aaatgcctgg aaaaaggaac aggataatcg tgattggctc aagccttagg gtgggcatgg 1920
ctccctgaca agggagagag gaaaaagctg ttgagtgaag aagactgctt cagtttcccc 1980
atctgtataa tgggaggagt aagggctgtc gtaaaaactc aatgaaagaa gattcttcaa 2040
cgtggtaggt gcagtggcag ctggcagtac cctgaccctg ccaccgcaca gccctctcag 2100
cattgctcat cctgcactgt ggatatcagt tgagccacgt gtctcctgcc ctgggctgtg 2160
agctccatag gcagggtctc catggctgta tctccagaac ccagcacaga accaggtgct 2220
tgggaaagtt ttgaattgat tctcatctgc cattggcatg gggaagggaa ctagcttgta 2280
tgaaacagat aacaatgtat gggaccctca ttcattattt cagcaaatat ttgctgagtt 2340
cctcctacat ggctagccct gtgctagaca ctggggaatc ggcgatgaac aaagcagata 2400
gaaatcccca ctcttgtgga gctgacattc tggagggaga gacaaaaagc aaacatataa 2460
agaaagaaag aaatcacatg gatctggatg acagtgagtg ctgggaagaa aataaaagca 2520
gaggaagggg atggagcgat gggcaggggg caacggtagg gagggtgtcg gggaaaactt 2580
tttggagaat gtgacgatga aagtgaacaa ggagaagtca accgtgttga gatgatggca 2640
gctaatgatg tggacaggcc actctgttct gagtgcatta tctattgatt catcatgtca 2700
tcctcgcaac agccctgcac gatcaattct gtcattaacc ccatagtaca gatgaggatg 2760
cggaggcaca gagaagataa gggacttgtc ctgtgtcaca cagcaaggag ccatccggct 2820
cctaagttgg tgcatttgac ttctgtgctt ccggaaagaa agagcagcaa gtttaagatc 2880
tggaggtggc actgagcttt ggaggagcag ggggcaatga ggtggccggt gtgacgagga 2940
ctcaatgtgc aagagggaga gtggtgggga gatgaggtgg aggggtggtc ggcggtcaga 3000
tcgtggaggg tctcggacga gggtcctgac cctgggtctc cagtcctggg aagtggagcc 3060
caggctgtac catggctgac ctcagctcat ggcttcccct cccacttcca g 3111
<210> 170
2093
181 <212> DNA <213> Homo sapiens <400>170 gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga60 ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac120 tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg180 tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg240 ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc300 atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct360 accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca420 ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg480 cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc540 tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc600 ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc660 tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc720 ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc780 accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt840 ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact900 ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg960 cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc1020 catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag1080 tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg1140 cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca1200 cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg1260 cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat1320 gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc1380 agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag1440 aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct1500’ cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg1560 tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc1620 tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg1680 agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt 1740
182 gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt1800 aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc1860 gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc1920 tgggtgccca ccctcagggc tggctggcgg ctccgcgcag tcccagaggg ccccggatag1980 ggtgctctgc cactccggac agcagcaggg actgccgaga gcagcaggag gctctgtccc2040 ccacccccgc tgccactgtg gagccgggag ggctgactgg ccaggtcccc cag2093 <210>171 <211> 1285.
<212> DNA <213> Homo sapiens <400>171
gtaaatgagt gccagggccg gcaagccccc gctccccggg ctctcggggt cgcgcgagga 60
tgcttggcac gtaccccgtg tacatacttc ccgggcgccc agcatggaaa taaagcaccc 120
agcgctgccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct 180
gaggcctgag tggcatgagg gaggcagagc gggtcccact gtccccacac tggcccaggc 240
tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300
tgggggattt gccagcgtgg ccctccctcc agcagcacct gccctgggct gggccacgag 360
aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420
ttctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt 480
gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct 540
gcccagcctc gaacccacat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600
tgtggaggga ctggtccaga tgcccacaca cacaotcagc ccagacccgt tcaacaaacc 660
ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720
gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780
acactcctca gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840
tcggcagctt ctccacatgc tgaccagctc agacaaaccc agccctcctc tcacaaggtg 900
cccctgcagc cgccacacac acaggggaac acacgccacg tcgcgtccct ggcactggcc 960
cacgtcccaa tacagccctt ccctgcagct ggggtcacat gaggggtggg tttcaccatc 1020
ctcctgccct ctggggctca gggagggaca cgggagacgg ggagtgggtc ctgctgaggg 1080
ccaggtcgct atctagggcc gggtgtctgg ctgagcccca gggccaaagc tggtgcccag 1140
ggtggacagc ttccgggagc tgacctcagg acattgttgg cccatcccgg ccgggcccta 1200
catcctgggc cccgccacag agggaatcac ccccagaggc ccaagcccag ggggacacag 1260
183 cactgaccac ccccttcctg tccag1285 <210> 172 <211>6350 <212> DNA <213> Mus musculus <400>172 gtaagtcaca actgggtaag agtgtcaagc aaggacagca cttggtacct atgatagaca60 aatactcctg tttgggaaga ggaggtctgc attgtctaga taagaggaac actgtgctta120 tctgtttcag tttaaaagac agaactacat aacacttcac cctttctaca acacttagat180 ttttcagccc tctcctctat ggtgtttcct gaaccctgaa gaaagtgata tagatgttta240 tttattttct agggccactg ttccaaagaa acaatcacgt attattagca gcttgaccag300 gtgtgaattt cccccagtat ccacttctgc tccctgtggg atgaagtccc tccataagta360 aagttgaagg ctgtgggcat aaatgcaaat gcctgtaatc caattttaca agtccatgac420 atacatttaa caaacaatag cagttacttc tctactggag cctatgaact ccccagctat480 aggtttttcc cttctgcaga gcagagctta aatccaatag ggaagaagtt ggttgtaccc540 ataactgcca taccactatt acaccaataa gcacatctta catagcaaga caattagtgt600 agcactcaaa gtccatgttc aagagagaat gttggcaaca gcctatataa catctcccag660 cacagaaaag aaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag720 gaaaggaaag gaaaggaaag gaaaggaaag gaaagaaaag aaaagaaaag aaaagaaaag780 aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaagg840 aaaagaaagg aaaagaaagg aagacagcca gaaggcagct tccacttcag tcctagccca900 tgttttctat gtcttacagc caaggttagt gaagtctcta gcagtaggaa tttatcatct960 acttctggca tgcaagtaaa atcaatggtg ataacttttg tggtttgtgg ctccttggga1020 gcctccctga acaataattt atgcagaggt agcccagctt tgccactggg gcttccatta1080 aacaaacttt ggattgaggg agtgtctttt tctacctgca cacagtgatt cctatgtttt1140 aactcttaat gagtcactgt tgtttgttgt tgttgttatt gttgttgtta ttgttgttgt1200 tgttgttgtt tctatcaacc cagacactat agggctataa ggcaggtgga agcatcactg1260 gctccagctg ttctcagtca tgctcttcct atcaatgttt gtgtaatgac tgcccctttt1320 actgtcggtt ttctatgggt gcctatggat aacgctgggt tgggcgaaac ccttgatggc1380 agcttttccc actgcttgct tatccatgta ggtgagagca cattcactct cacttgagag1440 gcttaggcct ttatgaagtc tgcctgacat atgggatagg taggcttata tgcttaccca1500 tcatgcaccc atgtgctggt accataagca agatcagacc tcacctgttc atgtagcatg 1560
184
cagaggatca gaatatttca caagaatgcc agaagctctc attactctct ggccttctct 1620
taaagatcac atcctctaac aaagcttacc aaagccacta acatctgagt tagtcctact 1680
caggtacaca tttcttaatg ctccagcaaa agcatctcta cccacttcat tgggcactaa 1740
acaccacttc tcacatgttt agagtttttt gttaagactt taaattatct ttcagtcatg 1800
tctgatgttc atgggcacct cagccagtaa taactgagtg tttctggtgt gtgcaggttt 1860
ttgtctgttt tgtgttgttt atatgccagg aaaaagctgt ttagtacaga tctaattggc 1920
attccccttc cttcatggtg tggatatttc ttttgagtta aaacatcccc tcttgtggca 1980
gggggagggc tagaggtcaa tggaatgatt tcccgagttt ccttggataa atgaaacctt 2040
tgtctcaggg aaggaagaat ggttctactt ctgtttctcc acttcatgat gctgactcta 2100
gcctcttcca tgccccgtgt ctccaggcta tgaaggaatc cagcatgctt ttctctcttc 2160
cttccttatc ttcttcatgg gttccaagtg ggttcctgtg gtttccacag gaaaggcttt 2220
ttagcacaaa tctgatctgt actgtctttc ctttatcccc tgccagctct gagacagaaa 2280
gccagcatct ctatcagaat ctctcttttg ccttcagaat cagagaccac tgtgaaaggc 2340
agcatccgtg catctttttt tccattgtac tccttcatta cgtgagcaag atttttctaa 2400
gcagatagct tagccttcat cgcacatctt agcacacact gcaaatgtca cacagacagc 2460
ttgctatgcc atcccatgta tactattttc aaggattgca ataccttctc tgatctgaaa 2520
tccattcaag taaaacaaca tgttgcaggt ccaattcaag aggcatgcca cctcatacca 2580
tataaaagaa gatggtcagc aaaaattcct gctctctcag acaactcaga cttgggagca 2640
gaaattccta tcacctctag cagggagtaa acaactacta ctacagctgg aagcatacta 2700
tctcctacca taaaagatgc tagcttctct gacaccttag acctgaggca aggaatcctc 2760
tgcctcattt ctttcgtctg ctggaaagcc tacaggacta agggctgctg taagcttgac 2820
acaagcttga ggttgaaagg tgtcagacag gcttcacctg aggggcccta tatatgagtg 2880
tagtgaggat ggaacaggct acgtggggca tcctccggca tcttgtcctc agagtggcct 2940
tcagagccca ggctcaagtc agccatactt ccccacttag actctggaaa tgCcacagta 3000
tgtccacaac ctccacaccc agctacacaa aattgagaga gggacctagt gggactgcag 3060
caatcacatg aggccatacc tggaccagcc aagctgccag tataacagtc gtggctctga 3120
gattttgaaa gcttggtctg ttgtctatgc ctcgggatct ttgggatgcc ttaggatcca 3180
tcgagaaagt tctagagatc atgcctgttt ctggctgcac tgtactgact gagaacaggg 3240
gctacagcac cactgtttct catggcctac ttcctgccag gtggtgcctc attagtactg 3300
aaaggagcct gacctacact tgccccaaat tggccttttc ttttcccctg tggcattggt 3360
tcctcaaagg acactaaggt tttctcttac ttgactccct caggatctct ctacagattt 3420
tcacaggtca ctcctcagag ctagagtcat accagcatga ctatcctctg cccacattca 3480
185
cacagcatgc ctgcctctct tctgtgcttc atcacaccaa ttaggaagtc atctgcccct acatgtcttg cccctgagaa tgggcatgct ctgtagtcat cttcattagg gcctgttggt gtcccacata tcgactagca ttgttcccac ctctccctac acacttcttc cctcctgact 3540 3600 3660 3720
gccccacttc aggtagatac caataatgtt cccttgttct atctgcctga cttagttctg
5 tgtctctatg atgccattct tcccctccta cccatccatc accctgttgc caaggcactc 3780
tctgagacat cttgtttcta catagataca gaagaacatt tgattaggca tgtaggccat 3840
ggtgaaagaa aaacaccaag taaactttta acatcacaat tttatttaaa actactagag 3900
aggactcagc aatgctcaaa gagactaaat tcccaggtga aaggagatgg gatgttgtat 3960
tctaggcaca gacagacaga gcagtgggac atatgtaatc accaagaaat cagccaaatt 4020
10 tttaataaac accttagctg ccgagaggga tgagaacaca gaagaatccc aaattctgag 4080
ccaatcacca ctcacttaac ctcccaccca ggacactgct aagcaagaaa caccttcgag 4140
cacagtgtgg gcagaatatc catcttgtac cagctccaag gcctgctgaa tataagggtt 4200
atcccaaagc acctagagcc agaagtcaac tatgataccc cagctccagc acagctcagt 4260
tcccagttcc aaaaaacagg tcttccatgc ctggtggata agatgatatg cacttgtatc 4320
15 tcacccccag actctacaat ccatgtatat acaatgccta gcatgcaatc agtaattaca 4380
agatacaaat gattgataac caagacagag acagtacatg ggattagacc tgaggtacgg 4440
gaaaggttgg gaaagcattc atagtgtccc ttgctacaag aagtcccaga gctttgcagg 4500
gtgtgagcag attctaacct cccccattgg caagtcttct caaagctgct tctgctacta 4560
gagaaccctc tttcccagcc acctgccact atttatcact tatctgagtt ttccccatga 4620
20 ttctaggatg ctaccacctc ctgcctgagt cagacggtcc ttccaggaga cctgatggtc 4680
ctgcccttgc ctgagacctt tctaggctga atggtcatca tgtccactgt ctggttagct 4740
tggttgcctc tgtgttaagt tgcttcatac tacatgtagc aaggaaagtt acctttccac 4800
ttctcaggac actgtaaaga agcacttctg taaattatag tgagaaacga tcaataataa 4860
atgaaatgaa caaacataaa cctctcttat ctctatggga cctgccctaa ggcctcttgt 4920
25 ggatgcctga aaccttgagt gttcttaagc catgtgtcac ttcagtcatt aacctgtggc 4980
tgaggtggat cctgactgac aaacagacag gcatgtagac agcttgaagc ctggacaaag 5040
agaaggttga •cgttccaggc aaagcaagag cctatcacat tgttccaaag tgtgtgattt 5100
agaatcagaa gatttcttgt ttaaaatata ctcaaaaagt tataaaatat cagccaggac 5160
tagtcataaa gcttaaatct gagagagaga gagagagaga gagagagaga gagaggtgtt 5220
30 catgtatata catatgtgtg tgtgtgtata tatatgtatg tatatgtatg tatatgtgta 5280
tattggtgtt tgggtgtcag attccctgga attaaagtta taaacagtta tgagctgcaa 5340
agtaggcttt ccaatgtctt gttctccaac cataggtaat tgaaactgga aactacaggt 5400
186
aaaggaggct gccaagtgtt tcttattatg ctaagattca gtgttctaca atattcacat 5460
gatttcactt tgatatggtg aaatgccttt aggccaacgc atccacagac ttcacagtga 5520
ccccagctga gcttacatat aatgtcaaac agcacttgtt gaatagatac ccaggcagcc 5580
ctgtgaccca tggtgttttc cttaattctt cccatctgcc ttggactttc acaccttgag 5640
ttgagatgtg ctttctgtag aaatgtattt ccctaggtct gtacatcagc caccaccctt 5700
tctgatcttg gaccatactt cagtctccag ctgggatatt catatgcatg cttagatatg 5760
gcataaccat cgttaacgtc ttctgttacc tttaggatta agttaccgta gctaggatgc 5820
tttccaatct ctccctccat ttgcaaaggc tcagggttcc ttctgactct ggagtagtac 5880
tctttcccaa tgagtgcacc atgaccacta ttcttcctta gaatgttact cccctttctc 5940
tgcctttttc atggcacatc tttctgagaa aacctacctg gtctagctgc tctttctggg 6000
tcttcttaag tagtaaccta actcctgcac catccgtgtg gcagtgacat agatccacat 6060
caggtttgga ttcagatatt ccaatcccat gcagaccaat ctatgtgtga gattccagga 6120
tccagcaggc tggggcatgg gttgaggggt aggattcttt ggggcaaagt ggttagtagg 6180
cacttgggac tggaagtgat aagtattagc gggaggaggg catatgatca aaacattgct 6240
gctggatgtg aaagctgtac cttcaggttc agtgttcagg agaccaggtt aataagaaat 6300
gatctttctg tagggtggag accttctcat gagcactagt tcttccctag 6350
<210> 173 <211> 1739 <212> DNA <213> Mus nusculus <400> 173
gtaacacctc cctccatccc tcctaggcct ccatgtagct gtggtgggga aggtggatga 60
cagacatccg ctcactgttg taacaccagg aagctacccc aataaacact cagtgcctga 120
ttagagccct gggtgcctgt tcttggggaa ggcaggttat gggcagaaat atcttggcct 180
gaaagaaggg acaccccaag agaaggacag gagtgaagca tggctcaccc atctgtctat 240
gtgttggata tttgacaaat aggacatcac aggacttcag cataggtacc cctggtcctt 300
cctgctcttc actggatatc atgcacctga tctctagaga tgcagctaaa atgagccagt 360
ctgggaaacc tcagcaccca cctctcagtc ttgcaagctc ctgctcccag acattcctgg 420
atactaaacc ccttcaggta gagaaacagc caaagtcaac atctaggacg caggactcaa 480
catggtcctg ctccttccct ctctactcaa cagccattga ggctgagccc accgccccaa 540
ccgcctgcct tgccaaatga tcacaccagg cctggtgctc ctcgtcttac tacctaaact 600
cactccaacc caaattcatc ccaaggacca gaatgggctg acagcctcat acagtcaggt 660
187
tcccccatct atgacatgtt ttcacatgca tgcacacaca cacacacaca cacacacaca 720
cacacacaca cacacacaca cacacaggct tcattgagct ctctggttta gcaatagccc 780
aaagcaagcc atacatccat cccagttcca gaaggataag aaaaccagaa ccaagacaca 840
cccacaccta ttccataccc aaccaacagc acatatggct tacacacctg agattagtgg 900
ctcccatcat gtacacacac atgcacacaa aggagcccat acatacccat catttccaga 960
ggtaagtatc taacctttgg atctgagata tctctgagga acaccaatgg cagagtcaac 1020
cagcacctca gcctccagac taaatcctta cattttggcc caccccaagc catgagagat 1080
ggaggagggt ggaggcctga gctgcgggaa agcagagaca ggaagatgga ctgtttggtg 1140
agagtagtaa accagacaat ggggagacta aggcaggagt agagccccta caaggcccag 1200
agtctgcttt agagtccatg tgtcctgacc tgcccctcag atgccacaac caagatttct 1260
ggttccagag catgcatgca ggccctagaa atggacctat gagctcagag ccttcctaga 1320
gagccctggg tactctctga acaaaaggca attctgtgta gaggcatcct gtggccaaag 1380
accctaagac agtcatacac acacacacac acacacacac acacacacac aacacacaca 1440
acacacacaa cacaggtagg ttttatcatg ctctttggtt tagcaatagc cctgttgatg 1500
gtgggggata ctgggtcact gtgggcactg gagtagaaag agggaatgaa cagtcagtgg 1560
ggaaaggaca tctgcctcta gggctgaaca gagactggag cagtctcaga gcaggtggga 1620
tggggacctc tgccactcta gcttcatcag aactgcatga gacaagtatg gggtctaccc 1680
cctccccact gtcacctgga gtctggggaa gctaactggc tggtcccacc ccatcccag 1739
<210> 174 <211> 93 <212> DNA <213> Homo sapiens <400> 174
ttcgagcagc acctcctgct gggcgtcagc gtttcctgca ttgtcatcct ggccgtctgc 60
ctgttgtgct atgtcagcat caccaagatt aag 93
<210> 175
<211> 78
<212> DNA -
<213> Homo sapiens
<400> 175
gggctgtgga cgaccatcac catcttcatc acactcttcc tgctaagcgt gtgctacagt 60 gccaccgtca ccttcttc
188 <210> 176 <211> 84 <212> DNA <213> Mus musculus <400> 176 ggcctgtggc ccacaatgtg caccttcgtg gccctcttcc tgctcacact gctctacagt 60 ggcttcgtca ccttcatcaa ggta 84

Claims (10)

1. Ácido nucléico compreendendo, na direção 5' a 3':
a) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada em fase de leitura,
b) um segundo ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3' compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação,
c) um terceiro ácido nucléico que codifica:
i) pelo menos um fragmento de um domínio transmembrana, ou ii) um peptídio de sinal para uma âncora GPI.
2. Célula eucariótica compreendendo um ácido nucléico de acordo com a reivindicação 1.
3. Célula eucariótica, de acordo com a reivindicação 2, caracterizada pelo fato de que a dita célula eucariótica é selecionada do grupo que consiste em células CHO, células NSO, células Sp2/0, células COS, K562 cells, células BHK, células PER.C6®, e células HEK.
4. Vetor compreendendo, na direção 5' a 3':
a) um primeiro sítio de clonagem múltipla,
b) um ácido nucléico começando com um sítio doador de splice 5' e terminado por um sítio receptor de splice 3', em que:
i) o dito ácido nucléico compreende um códon de parada e um sinal de poliadenilação, e ii) o dito ácido nucléico não é constitutivamente removido durante o processamento de pré-mRNA,
c) um segundo sítio de clonagem múltipla.
5. Método para seleção de uma célula eucariótica que expresse um polipeptídio heterólogo, em que o método compreende:
a) a transfecção de uma célula eucariótica com um ácido nucléico compreendendo, na direção 5' a 3':
i) um primeiro ácido nucléico que codifica um polipeptídio heterólogo sem um códon de parada de tradução em fase de leitura, ii) um segundo ácido nucléico começando com um sítio doador de splice e terminado por um sítio receptor de splice compreendendo um códon de parada de tradução em fase de leitura e um sinal de poliadenilação, iii) um terceiro ácido nucléico que codifica:
iiia) pelo menos um fragmento de um domínio transmembrana, ou iiib) um peptídio de sinal para uma âncora GPI,
b) o cultivo da dita célula transfectada sob condições adequadas para a produção de pré-mRNA a partir do dito ácido nucléico, processamento do dito pré-mRNA, e a tradução do dito mRNA processado em um polipeptídio, em que a dita célula transfectada produz polipeptídio heterólogo solúvel e polipeptídio heterólogo ligado a membrana plasmática por splicing alternativo do dito pré-mRNA, e
c) a seleção de uma célula com polipeptídio heterólogo ligado a membrana plasmática para ser a dita célula que expressa um polipeptídio heterólogo.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que o dito polipeptídio heterólogo é selecionado do grupo de polipeptídios compreendendo hormônios; citocinas; interleucinas; imunoglobulinas; peptídios antifusogênicos; fatores de crescimento; ligantes, agonistas ou antagonistas de receptores; agentes citotóxicos; agentes antivirals; agentes de formação de imagem; inibidores de enzimas; ativadores de enzimas ou moduladores da atividade de enzimas como substâncias alostéricas; assim como fragmentos e suas fusões.
7. Método, de acordo com qualquer uma das reivindicações 5 ou
6, caracterizado pelo fato de que:
i) o dito primeiro ácido nucléico codifica pelo menos um fragmento de um domínio CH3 ou CH4 de cadeia pesada de imunoglobulina, ii) o dito segundo ácido nucléico começa com o sítio doador de splice 5' de um éxon de domínio Ch3 ou Ch4 de cadeia pesada de imunoglobulina e terminado pelo sítio receptor de splice 3' do éxon M1 do domínio transmembrana de cadeia pesada de imunoglobulina sucessivo, iii) o dito terceiro ácido nucléico é pelo menos um fragmento de um domínio transmembrana de imunoglobulina.
8. Método, de acordo com qualquer uma das reivindicações de 5 a 6, caracterizado pelo fato de que o dito segundo ácido nucléico é obtido a partir do ácido nucléico que codifica um polipeptídio ou proteína selecionada do grupo que compreende o receptor C3b/C4b; EGFR humano, de galinha e de rato; FGFR; cadeia pesada α, ε, γ, μ de imunoglobulina humana e de camundongo; receptor PLA2 humano; Cek5 de galinha; cadeia a do receptor de fator inibidor de leucemia de camundongo.
9. Método para a produção de um polipeptídio ou proteína heteróloga codificada pelo ácido nucléico de acordo com a reivindicação 1, compreendendo:
a) o fornecimento de uma célula eucariótica,
b) a transfecção da dita célula eucariótica com 0 ácido nucléico de acordo com a reivindicação 1,
c) o cultivo da dita célula transfectada sob condições adequadas para a expressão do dito ácido nucléico,
d) a recuperação do dito polipeptídio ou proteína do meio de cultura ou do citoplasma das células.
10. Kit para a fabricação de uma célula de acordo com a reivindicação 2, compreendendo um vetor de acordo com a reivindicação 4.
BRPI0712073A 2006-05-17 2007-05-15 ácido nucléico para produção de um polipeptídio ou proteína heteróloga BRPI0712073B8 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06010146 2006-05-17
EP06010146.6 2006-05-17
PCT/EP2007/004313 WO2007131774A1 (en) 2006-05-17 2007-05-15 Polypeptide producing cells

Publications (3)

Publication Number Publication Date
BRPI0712073A2 BRPI0712073A2 (pt) 2012-03-06
BRPI0712073B1 true BRPI0712073B1 (pt) 2019-11-12
BRPI0712073B8 BRPI0712073B8 (pt) 2021-05-25

Family

ID=37076089

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0712073A BRPI0712073B8 (pt) 2006-05-17 2007-05-15 ácido nucléico para produção de um polipeptídio ou proteína heteróloga

Country Status (12)

Country Link
US (2) US8354516B2 (pt)
EP (2) EP2208792B1 (pt)
JP (1) JP4870208B2 (pt)
KR (1) KR101202498B1 (pt)
CN (1) CN101410525B (pt)
AU (1) AU2007251766B2 (pt)
BR (1) BRPI0712073B8 (pt)
CA (1) CA2651478C (pt)
ES (2) ES2573027T3 (pt)
IL (1) IL193721A (pt)
MX (1) MX2008013514A (pt)
WO (1) WO2007131774A1 (pt)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2573027T3 (es) * 2006-05-17 2016-06-03 F. Hoffmann-La Roche Ag Células productoras de polipéptido
US7732195B2 (en) 2006-11-01 2010-06-08 Facet Biotech Corporation Tethered vectors for cell surface immunoglobulin display
US7947495B2 (en) 2007-11-01 2011-05-24 Abbott Biotherapeutics Corp. Immunoglobulin display vectors
CA2734340C (en) * 2008-08-28 2019-03-05 Novartis Ag Cell surface display of polypeptide isoforms by stop codon readthrough
CA2753814C (en) 2009-02-27 2018-07-31 Novartis Ag Novel selection vectors and methods of selecting eukaryotic host cells
FR2944016B1 (fr) 2009-04-02 2012-03-09 Isp Investments Inc Nouveaux peptides anti-age activateurs du proteasome et compositions les contenant
FR2944017B1 (fr) * 2009-04-02 2012-03-09 Isp Investments Inc Nouveaux peptides eclaircissants activateurs du proteasome et compositions les contenant
FR2944018B1 (fr) * 2009-04-02 2012-03-09 Isp Investments Inc Nouveaux peptides anti-age activateurs du proteasome et compositions les contenant
FR2944797B1 (fr) 2009-04-23 2013-05-10 Isp Investments Inc Hydrolysats peptidiques activateurs du proteasome et compositions les contenant
FR2944798B1 (fr) 2009-04-23 2013-05-10 Isp Investments Inc Hydrolysats peptidiques eclaircissants activateurs du proteasome et compositions les contenant
CN101875916B (zh) * 2009-11-27 2013-04-17 西安交通大学 一种fgfr1高表达的重组hek293细胞及其应用
EP2922962B1 (en) 2012-11-20 2016-12-21 Novartis AG Optimized expression cassette for expressing a polypeptide with high yield
WO2014126254A1 (ja) * 2013-02-18 2014-08-21 協和発酵キリン株式会社 膜結合型タンパク質発現ベクター
EP2970956A1 (en) 2013-03-11 2016-01-20 Novartis AG Method of screening cell clones
WO2014171826A1 (en) 2013-04-17 2014-10-23 Stichting Vu-Vumc Treatment of cognitive impairment in depressive disorders
JP6576924B2 (ja) 2013-07-31 2019-09-18 ノバルティス アーゲー 新規の選択ベクターおよび真核宿主細胞を選択する方法
EP3083676B1 (en) 2013-12-20 2019-08-28 Novartis AG Novel eukaryotic cells and methods for recombinantly expressing a product of interest
US11242551B2 (en) 2013-12-20 2022-02-08 Novartis Ag Eukaryotic cells and methods for recombinantly expressing a product of interest
EA035266B1 (ru) * 2014-02-28 2020-05-22 Икнос Сайенсиз Са Экспрессирующие конструкции и способы для отбора клеток-хозяев, экспрессирующих полипептиды
US11623950B2 (en) 2015-07-09 2023-04-11 Institut National De La Sante Et De La Recherche Medicale (Inserm) Lentiviral vector expressing membrane-anchored or secreted antibody
US20170119820A1 (en) 2015-07-31 2017-05-04 Regents Of The University Of Minnesota Modified cells and methods of therapy
CN109790214B (zh) * 2016-09-29 2022-09-06 豪夫迈·罗氏有限公司 用于选择产生多肽的细胞的改进方法
GB2573406B (en) 2016-10-18 2021-11-10 Univ Minnesota Tumor infiltrating lymphocytes and methods of therapy
EP3645021A4 (en) 2017-06-30 2021-04-21 Intima Bioscience, Inc. ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY
WO2019015677A1 (en) * 2017-07-21 2019-01-24 Beijing Biocytogen Co., Ltd GENETICALLY MODIFIED IMMUNOGLOBULIN HEAVY CHAIN ANIMALS
CN107557367B (zh) * 2017-09-08 2020-11-03 北京大学人民医院 Ighg1基因突变体及其应用
CA3196641A1 (en) * 2020-12-01 2022-06-09 Yaakov Benenson Dna constructs comprising alternative promoters

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4656134A (en) 1982-01-11 1987-04-07 Board Of Trustees Of Leland Stanford Jr. University Gene amplification in eukaryotic cells
CA2096222C (en) 1990-11-13 1998-12-29 Stephen D. Lupton Bifunctional selectable fusion genes
IL104570A0 (en) * 1992-03-18 1993-05-13 Yeda Res & Dev Chimeric genes and cells transformed therewith
JPH09500783A (ja) 1993-05-21 1997-01-28 ターゲッティッド ジェネティクス コーポレイション シトシンデアミナーゼ(cd)遺伝子に基づく二機能性選択融合遺伝子
US5888809A (en) 1997-05-01 1999-03-30 Icos Corporation Hamster EF-1α transcriptional regulatory DNA
ES2257303T3 (es) 1999-07-12 2006-08-01 Genentech, Inc. Vectores de expresion y procedimientos.
AUPQ422399A0 (en) 1999-11-24 1999-12-16 University Of New South Wales, The Method of screening transformed or transfected cells
IL136459A0 (en) * 2000-05-30 2001-06-14 Galim Galil Immunology Ltd Antibody library
EP1392859B1 (en) 2001-01-16 2006-05-10 Regeneron Pharmaceuticals, Inc. Isolating cells expressing secreted proteins
EP1418808B1 (en) 2001-07-30 2005-11-30 SmithKline Beecham Corporation Imaging marker transgenes
US7384744B2 (en) 2002-11-29 2008-06-10 Boehringer Ingelheim Pharma Gmbh & Co., Kg Expression vector, methods for the production of heterologous gene products and for the selection of recombinant cells producing high levels of such products
EP1477805A1 (de) 2003-05-12 2004-11-17 ProBioGen AG Verfahren zur Zellselektion
WO2005020924A2 (en) 2003-08-29 2005-03-10 Centocor, Inc. A rapid way to obtain high expression clones of mammalian cells using a methylcellulose and immunoprecipitation screening method
BRPI0415296A (pt) 2003-10-16 2006-12-26 Claude Negrier cdna modificado para os nìveis de expressão elevados do fator viii e seus derivados
KR20070004026A (ko) * 2004-03-15 2007-01-05 비오겐 아이덱 엠에이 아이엔씨. 선택적 스플라이싱을 이용하여 진핵 세포에서 폴리펩티드다량체를 발현하기 위한 방법 및 구축물
ES2573027T3 (es) * 2006-05-17 2016-06-03 F. Hoffmann-La Roche Ag Células productoras de polipéptido

Also Published As

Publication number Publication date
ES2543629T3 (es) 2015-08-20
EP2027273B1 (en) 2016-04-13
EP2208792A3 (en) 2010-10-27
KR101202498B1 (ko) 2012-11-16
US20090311725A1 (en) 2009-12-17
MX2008013514A (es) 2008-10-28
EP2208792B1 (en) 2015-05-06
AU2007251766B2 (en) 2013-06-20
AU2007251766A1 (en) 2007-11-22
CA2651478A1 (en) 2007-11-22
JP2009537124A (ja) 2009-10-29
EP2208792A2 (en) 2010-07-21
US20130109058A1 (en) 2013-05-02
CN101410525A (zh) 2009-04-15
CN101410525B (zh) 2012-09-05
BRPI0712073B8 (pt) 2021-05-25
US8541204B2 (en) 2013-09-24
KR20090003327A (ko) 2009-01-09
IL193721A0 (en) 2011-08-01
ES2573027T3 (es) 2016-06-03
IL193721A (en) 2014-09-30
CA2651478C (en) 2015-02-03
EP2027273A1 (en) 2009-02-25
US8354516B2 (en) 2013-01-15
WO2007131774A1 (en) 2007-11-22
BRPI0712073A2 (pt) 2012-03-06
JP4870208B2 (ja) 2012-02-08

Similar Documents

Publication Publication Date Title
KR101202498B1 (ko) 폴리펩티드 생성 세포
CN101688222B (zh) 启动子
Carpino et al. Absence of an essential role for thymic stromal lymphopoietin receptor in murine B-cell development
KR102531749B1 (ko) Cho 세포 내 통합 부위
KR101476010B1 (ko) 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포
KR20150123803A (ko) 향상된 이식유전자 발현 및 가공
AU2018204332A1 (en) Expression cassette
IL90514A (en) A fusion gene that contains a gene for multidrug resistance that is fused to a gene for adenine diamines
WO2010092335A1 (en) Method for producing protein
US11591383B2 (en) Method for selecting polypeptide producing cells
Chang et al. Expression of a human cDNA encoding a protein containing GAR synthetase, AIR synthetase, and GAR transformylase corrects the defects in mutant Chinese hamster ovary cells lacking these activities
US20110229903A1 (en) Determination of immunoglobulin encoding nucleic acid
Poon Mutation detection in TNFRSF13b encoding taci in patients with common variable immunodeficency

Legal Events

Date Code Title Description
B07D Technical examination (opinion) related to article 229 of industrial property law [chapter 7.4 patent gazette]
B07E Notification of approval relating to section 229 industrial property law [chapter 7.5 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 12/11/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 12/11/2019, OBSERVADAS AS CONDICOES LEGAIS

B16C Correction of notification of the grant [chapter 16.3 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 15/05/2007 OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 16A ANUIDADE.

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)

Free format text: EM VIRTUDE DA EXTINCAO PUBLICADA NA RPI 2723 DE 14-03-2023 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDA A EXTINCAO DA PATENTE E SEUS CERTIFICADOS, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.