PT1098972E - Proteína semelhante a proteína especificamente neuroendócrina e adnc codificante - Google Patents

Proteína semelhante a proteína especificamente neuroendócrina e adnc codificante Download PDF

Info

Publication number
PT1098972E
PT1098972E PT99934913T PT99934913T PT1098972E PT 1098972 E PT1098972 E PT 1098972E PT 99934913 T PT99934913 T PT 99934913T PT 99934913 T PT99934913 T PT 99934913T PT 1098972 E PT1098972 E PT 1098972E
Authority
PT
Portugal
Prior art keywords
glu
pro
ser
leu
ala
Prior art date
Application number
PT99934913T
Other languages
English (en)
Inventor
David Michalovich
Rabinder Kumar Prinjha
Original Assignee
Smithkline Beecham Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26314097&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=PT1098972(E) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from GBGB9816024.5A external-priority patent/GB9816024D0/en
Priority claimed from GBGB9916898.1A external-priority patent/GB9916898D0/en
Application filed by Smithkline Beecham Ltd filed Critical Smithkline Beecham Ltd
Publication of PT1098972E publication Critical patent/PT1098972E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2497Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals

Description

DESCRIÇÃO
"PROTEÍNA SEMELHANTE A PROTEÍNA ESPECIFICAMENTE NEUROENDÓCRINA E ADNC CODIFICANTE"
Campo da Invenção
Esta invenção refere-se a polipéptidos e a polinucleótidos codificando esses polipéptidos recentemente identificados, à sua utilização em diagnóstico e na identificação de compostos que podem ser agonistas, antagonistas que são potencialmente úteis em terapia e à produção desses polipéptidos e polinucleótidos.
Antecedentes da Invenção 0 processo de pesquisa de fármacos está actualmente a sofrer uma revolução fundamental à medida que esta adopta a "genómica funcional", ou seja, a biologia com base em genomas ou em genes com elevada capacidade de processamento. Esta abordagem como um meio para identificar genes e produtos génicos como alvos terapêuticos está a substituir rapidamente as abordagens anteriores baseadas na "clonagem posicionai". Um fenótipo, que é uma função biológica ou uma doença genética, irá ser identificado e este será, então, seguido até ao gene responsável, com base na sua posição no mapa genético. A genómica funcional baseia-se, significativamente, em tecnologias de sequenciação de ADN de elevada capacidade de 1 processamento e nas várias ferramentas da bioinformática para identificar sequências génicas com interesse potencial a partir das muitas bases de dados de biologia molecular agora disponíveis. Existe uma necessidade continua de identificar e caracterizar novos genes e seus polipéptidos/proteinas relacionados como alvos da pesquisa de fármacos. A presente invenção proporciona um polipéptido compreendendo uma sequência de aminoácidos que tem uma identidade de, pelo menos, 95% com a da SEQ ID N°: 4 ao longo da totalidade do comprimento da SEQ ID N°: 4. Esses polipéptidos são aqui designados como "MAGI". Esses polipéptidos e polinucleótidos têm interesse no que se refere a métodos de tratamento de determinadas doenças, incluindo, mas não limitadas a neuropatias, traumatismos da coluna vertebral, degenerescência neuronal, distúrbios neuromusculares, distúrbios psiquiátricos e distúrbios do desenvolvimento, cancro, acidente vascular cerebral e distúrbios inflamatórios, seguidamente designadas como "doenças da invenção".
Considera-se que os polipéptidos da presente invenção sejam membros da família de polipéptidos do reticulão. Estes são, consequentemente, de interesse, uma vez que os membros desta família revelaram apresentar expressão proeminente, mas não exclusiva, em células do sistema nervoso. A expressão de uma isoforma destes polipéptidos, proteína C especificamente neuroendócrina (NSP-C) (J. Hens et al., Cell Tissue Res. 292:229-237, 1998), revelou correlacionar-se com a diferenciação neuronal. É conhecido o facto do processamento alternativo dos genes desta família de polipéptidos produzir isoformas expressas diferencialmente com funções sobrepostas e distintas em tecidos diferentes (Geisler et al., Mamm. Genome 9:164-173, 1998). A 2 semelhança em termos de aminoácidos entre membros desta família de polipéptidos e fragmentos de uma proteína de peso molecular elevado purificada de medula óssea bovina (Spillmann et al. J. Biol. Chem. 273:15487-15493, 1998) indica um papel potencial no papel de inibição do crescimento axonial destas proteínas. De um modo semelhante, a expressão de proteína A especificamente neuroendócrina (NSP-A) em células cancerosas específicas (Senden et al., Histochem. Cell Biol. 108:155-165, 1997) pode indicar uma utilização potencial destes polipéptidos no diagnóstico e ou no tratamento de cancros. A detecção de polinucleótidos compreendendo porções de MAGI em ADNc no cérebro fetal humano e na coluna vertebral adulta humana e de uma isoforma ARNm > 5 leb abundante no cérebro adulto humano, em conjunto com transcritos diferentes que surgem potencialmente por processamento alternativo no coração, pulmão, fígado, rim e músculo esquelético, sugere que as isoformas dos MAGI podem, de um modo semelhante, ter funções sobrepostas e distintas nestes tecidos. Por analogia com a família de polipéptidos moduladores de neurites da semaforina poderá ser postulado que estas diferentes isoformas irão funcionar em cada um destes tecidos para controlar a inervação local por populações neuronais distintas. É previsível que a expressão aberrante de isoformas específicas dentro, por exemplo, do músculo esquelético altere a inervação dos neurónios motores e sensoriais em doenças tal como esclerose lateral amiotrófica (ALS). A presença de polipéptidos distintivos característicos e de regiões altamente hidrofóbicas no polipéptido da presente invenção sugere que a sua expressão em regiões do sistema nervoso e em tecidos que formam delimitações para o crescimento 3 possa modular o crescimento e a exploração tanto durante o desenvolvimento como após processos patológicos ou que provocam ferimentos. A expressão do polipéptido da invenção, seus fragmentos ou variantes processadas alternativamente do polipéptido na superfície de células quer naturalmente, como uma proteína segregada, quer após libertação por danos celulares, pode actuar em outras células quer através de receptores específicos quer patologicamente, através de interacções não-específicas para modular a ligação, a extensão, a migração ou o crescimento celular. Poder-se-á esperar que esta inibição seja quer reversível quer permanente, resultando possivelmente na morte celular.
As propriedades biológicas dos MAGI são aqui, de seguida, designadas como "actividade biológica MAGI" ou "actividade MAGI". De um modo preferido, um polipéptido da presente invenção apresenta, pelo menos, uma actividade biológica MAGI.
Os polipéptidos da presente invenção incluem, também, variantes dos polipéptidos acima referidos tendo uma identidade de, pelo menos, 95% em relação à sequência de aminoácidos da SEQ ID N°: 4, incluindo todas as formas alélicas e variantes de processamento. Esses polipéptidos variam em relação ao polipéptido de referência por inserções, eliminações e substituições, que podem ser conservadoras ou não-conservadoras, ou qualquer sua combinação. As variantes particularmente preferidas são aquelas em que são inseridos, substituídos ou eliminados vários, por exemplo, de 20 a 10, de 10 a 5, de 5 a 3, de 3 a 2, de 2 a 1 ou 1 aminoácidos, em qualquer combinação. 4
Os fragmentos preferidos são fragmentos biologicamente activos que medeiam a actividade biológica MAGI, incluindo aqueles com uma actividade semelhante ou uma actividade melhorada ou com uma actividade indesejável reduzida. São também preferidos os fragmentos que são antigénicos ou imunogénicos num animal, especialmente num humano.
Podem ser utilizados fragmentos dos polipéptidos da invenção para produzir o polipéptido completo correspondente por síntese peptidica; consequentemente, estas variantes podem ser utilizadas como intermediários para produzir os polipéptidos completos da invenção. Os polipéptidos da presente invenção podem estar sob a forma de proteína "madura" ou podem ser parte de uma proteina maior, tais como um precursor ou uma proteína de fusão. É frequentemente vantajoso incluir uma sequência de aminoácidos adicional que contém sequências secretoras ou líder, pró-sequências, sequências que auxiliam na purificação, por exemplo, resíduos de histidina múltiplos ou uma sequência adicional para a estabilidade durante a produção recombinante.
Os polipéptidos da presente invenção podem ser preparados de qualquer forma adequada, por exemplo, por isolamento a partir de fontes de ocorrência natural, de células hospedeiras modificadas geneticamente compreendendo sistemas de expressão (vide infra) ou por síntese química, utilizando, por exemplo, sintetizadores de péptidos automatizados ou uma combinação desses métodos. Os meios para preparar esses polipéptidos são bem conhecidos na técnica.
A sequência polinucleotídica da SEQ ID N°: 1 apresenta homologia com a proteína C especificamente neuroendócrina Humana (Roebroek et al., J. Biol. Chem. 268: 13439-13447, 1993). A 5 sequência polinucleotídica da SEQ ID N°: 1 é uma sequência de ADNc que codifica o polipéptido da SEQ IDN°: 2. A sequência polinucleotídica codificando o polipéptido da SEQ ID N°: 2 pode ser idêntica ao polipéptido codificando a sequência da SEQ ID N°: 1 ou esta pode ser uma sequência diferente da SEQ ID N°: 1, a qual, em consequência da redundância (degenerescência) do código genético, codifica, também, o polipéptido da SEQ ID N°: 2. 0 polipéptido da SEQ ID N°: 2 está relacionado com outras proteínas da família do reticulão, tendo homologia e/ou semelhança estrutural com a proteína C especificamente neuroendócrina Humana (Roebroek et ai., J. Biol. Chem. 268: 13439-13447,1993). 0 polinucleótido da SEQ ID N°: 5 e o polipéptido codificado por este, SEQ ID N°: 6, é uma variante do polinucleótido da SEQ ID N°: 1 e do seu polipéptido codificado, SEQ ID N° : 2. É esperado que os polipéptidos preferidos da presente invenção tenham, inter alia, funções/propriedades biológicas semelhantes às dos seus polipéptidos homólogos. Além disso, os polipéptidos e os polinucleótidos preferidos da presente invenção têm, pelo menos, uma actividade MAGI.
Deste modo, a presente invenção proporciona um polipéptido que: (a) compreende uma sequência de aminoácidos que tem uma identidade de, pelo menos, 95%, de um modo preferido, uma identidade de, pelo menos, 97-99%, com a da SEQ ID N° : 4 ao longo da totalidade do comprimento da SEQ ID N°: 4; (b) tem uma sequência de aminoácidos que tem uma identidade de, pelo menos, 95%, de um modo preferido, uma identidade de, pelo 6 menos, 97-99%, com a sequência de aminoácidos da SEQ ID N°: 4 ao longo da totalidade do comprimento da SEQ ID N° : 4; (c) compreende o aminoácido da SEQ ID N°: 4; e (d) é o polipéptido da SEQ ID N°: 4. A sequência nucleotidica da SEQ ID N°: 3 e a sequência peptídica codificada por esta é derivada de sequências EST (Marcação de Sequências Expressas). É reconhecido pelos especialista na técnica que irão inevitavelmente ocorrer alguns erros de leitura da sequência nucleotidica das sequências EST (ver Adams, M.D. et al., Nature 377 (sup) 3, 1995).
Consequentemente, a sequência nucleotidica da SEQ ID N°: 3 e a sequência peptidica codificada a partir desta estão, consequentemente, sujeitas às mesmas limitações inerentes na exactidão da sequência. Além disso, a sequência peptidica codificada pela SEQ ID N°: 3 compreende uma região de identidade ou de homologia próxima e/ou semelhança estrutural próxima (por exemplo, uma diferença de aminoácidos conservadora) com a proteína homóloga ou estruturalmente semelhante mais próxima.
Os polinucleótidos como aqui descritos podem ser obtidos utilizando técnicas convencionais de clonagem e de rastreio a partir de uma biblioteca de ADNc derivada de ARNm em células de cérebro fetal e coluna vertebral humanas, (ver, por exemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, 2a Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. I. (1989)). Os polinucleótidos podem ser também obtidos a partir de fontes naturais, tais como bibliotecas de ADN genómico ou podem ser sintetizados utilizando técnicas bem conhecidas e comercialmente disponíveis. 7
Quando são utilizados polinucleótidos para a produção recombinante de polipéptidos da presente invenção, o polinucleótido pode incluir a sequência codificante para o polipéptido maduro, em si ou a sequência codificante para o polipéptido maduro na mesma grelha de leitura que outras sequências codificantes, tais como aquelas codificando uma sequência lider ou secretora, uma sequência proteica pré ou pró ou pré-pró ou outras porções de péptido de fusão. Por exemplo, pode ser codificada uma sequência marcadora que facilita a purificação do polipéptido fundido. Em algumas formas de realização preferidas deste aspecto da invenção, a sequência marcadora é um péptido hexa-histidina, como proporcionado no vector pQE (Qiagen, Inc.) e descrito em Gentz et al., Proc Natl Acad Sei USA (1989) 86:821-824 ou é uma marcação HA. 0 polinucleótido pode, também, conter sequências 5' e 3' não-codificantes, tais como sequências transcritas, não-traduzidas, sinais de processamento e poliadenilação, locais de ligação a ribossomas e sequências que estabilizam ARNm.
Podem ser utilizados polinucleótidos que são idênticos ou que têm identidade suficiente com uma sequência polinucleotidica da SEQ ID N°: 1 ou da SEQ ID N°: 5, como sondas de hibridação para ADNc e ADN genómico ou como iniciadores de uma reacção de amplificação de ácidos nucleicos (por exemplo, PCR). Essas sondas e iniciadores podem ser utilizados para isolar ADNc completos e clones genómicos codificando polipéptidos da presente invenção e para isolar ADNc e clones genómicos de outros genes (incluindo genes codificando parálogos de fontes humanas e ortólogos e parálogos provenientes de espécies diferentes da humana) que têm uma elevada semelhança de sequência com a SEQ ID N°: 1 ou a SEQ ID N°: 5, tipicamente uma identidade de, pelo menos, 95%. As sondas e os iniciadores preferidos irão geralmente compreender, pelo menos, 15 nucleótidos, de um modo preferido, pelo menos, 30 nucleótidos e podem ter pelo menos 50, se não pelo menos 100 nucleótidos. As sondas particularmente preferidas irão ter entre 30 e 50 nucleótidos. Os iniciadores particularmente preferidos irão ter entre 20 e 25 nucleótidos.
Um polinucleótido codificando um polipéptido da presente invenção, incluindo homólogos de espécies além da humana, pode ser obtido por um processo compreendendo os passos de rastreio de uma biblioteca sob condições de hibridação de severidade com uma sonda marcada tendo a sequência da SEQ ID N°: 1 ou da SEQ ID N°: 5 ou um seu fragmento, de um modo preferido, com, pelo menos, 15 nucleótidos; e isolamento de clones de ADNc e genómicos completo, contendo a referida sequência polinucleotidica. Essas técnicas de hibridação são bem conhecidas do especialista na técnica. As condições de hibridação de severidade preferidas incluem a incubação, durante a noite, a 42 °C, numa solução compreendendo: formamida a 50%, SSC 5 x (NaCl 150 mM, citrato trissódico 15 mM), fosfato de sódio 50 mM (pH 7,6), solução de Denhardt 5 x, sulfato de dextrano a 10% e ADN de esperma de salmão desnaturado, quebrado, 20 microgramas/mL; seguido de lavagem dos filtros em SSC 0,1 x a cerca de 65 °C. O especialista na técnica irá ter em consideração que, em muitos casos, uma sequência de ADNc isolado irá ser incompleta, pelo que a região codificante do polipéptido não se estende por toda a extensão do terminal 5'. Isto é uma consequência da transcritase reversa, uma enzima com uma "capacidade de processamento" (uma medida da capacidade da enzima permanecer 9 ligada ao molde durante a reacção de polimerização) inerentemente baixa, não conseguindo finalizar uma cópia de ADN do ARNm molde durante a síntese da primeira cadeia de ADNc.
Existem vários métodos disponíveis, e bem conhecidos dos especialistas na técnica para obter ADNc completo ou estender ADNc curtos, por exemplo, os baseados no método da Amplificação Rápida de extremidades de ADNc (RACE) (ver, por exemplo, Frohman et al., Proc Nat Acad Sei USA 85, 8998-9002, 1988). As modificações recentes da técnica, exemplificadas, por exemplo, pela tecnologia Marathon (marca comercial) (Clontech Laboratories Inc.), simplificaram significativamente a pesquisa de ADNc mais longos. Na tecnologia Marathon (marca comercial), os ADNc foram preparados a partir de ARNm extraído a partir de um tecido seleccionado e é ligada uma sequência "adaptadora" a cada extremidade. É, então, realizada uma amplificação de ácidos nucleicos (PCR) para amplificar extremidade 5' do ADNc "ausente" utilizando uma combinação de iniciadores oligonucleotídicos específicos para um gene e específicos para um adaptador. A reacção PCR é, então, repetida utilizando iniciadores "internos", ou sejam, iniciadores concebidos para se ligarem dentro do produto amplificado (tipicamente um iniciador específico para um adaptador que se liga mais além no sentido 3' na sequência do adaptador e um iniciador específico para um gene que liga mais além no sentido 5' na sequência génica conhecida). Os produtos desta reacção podem ser, então, analisados por sequenciação de ADN e pode ser construído um ADNc completo quer por ligação do produto directamente ao ADNc existente para originar uma sequência completa, quer realizando uma PCR completa distinta utilizando a nova informação sobre a sequência para a concepção do iniciador 5'. 10
Os polipéptidos recombinantes da presente invenção podem ser preparados por processos bem conhecidos na técnica a partir de células hospedeiras modificadas geneticamente compreendendo sistemas de expressão. Consequentemente, são aqui também descritos sistemas de expressão compreendendo um polinucleótido ou polinucleótidos codificando um polipéptido da presente invenção, para células hospedeiras que são modificadas geneticamente com esses sistemas de expressão e para a produção de polipéptidos da invenção por técnicas recombinantes. Podem ser também utilizados sistemas de tradução isentos de células para produzir essas proteínas utilizando ARN derivados do construções de ADN.
Para a produção recombinante, as células hospedeiras podem ser modificadas geneticamente para incorporar sistemas de expressão ou suas porções para polinucleótidos. Podem ser introduzidos polinucleótidos em células hospedeiras por métodos descritos em muitos manuais de laboratório convencionais, tais como Davis et al., Basic Methods in Molecular Biology (1986) e Sambrook et al., (ibid). Os métodos preferidos para introduzir polinucleótidos em células hospedeiras incluem, por exemplo, transfecção com fosfato de cálcio, transfecção mediada por DEAE-dextrano, transvecção, microinjecção, transfecção catiónica mediada por lipidos, electroporação, transdução, aplicação por raspagem, introdução balística ou infecção.
Os exemplos representativos de hospedeiros adequados incluem células bacterianas, tais como células de Streptococci, Staphylococci, E. coli, Streptomyces e Bacillus subtilis; células fúngicas, tais como células de levedura e células de Aspergillus; células de insecto, tais como células de Drosophila S2 e Spodoptera Sf9; células animais, tais como células CHO, 11 COS, HeLa, C127, 3T3, BHK, HEK 293 e de melanoma de Bowes; e células vegetais.
Pode ser utilizada uma grande variedade de sistemas de expressão, por exemplo, sistemas cromossómicos, epissómicos e derivados de virus, e. g., vectores derivados de plasmídeos bacterianos, bacteriófagos, transposões, epissomas de levedura, elementos de inserção, elementos cromossómicos de levedura, virus, tais como baculovirus, virus papova, tais como SV40, virus vaccinia, adenovirus, virus da varíola das ave, vírus da pseudoraiva e retrovírus e vectores derivados de suas combinações, tais como os derivados de elementos genéticos de plasmídeos e de bacteriófagos, tais como cosmídeos e fagemídeos. Os sistemas de expressão podem conter regiões de controlo que regulam, assim como originam a expressão. De um modo geral, pode ser utilizado qualquer sistema ou vector que seja capaz de manter, propagar ou expressar um polinucleótido para produzir um polipéptido num hospedeiro. A sequência polinucleotídica adequada pode ser inserida num sistema de expressão por qualquer de várias técnicas bem conhecidas e de rotina, tais como, por exemplo, as estabelecidas em Sambrook et al., (ibid). Podem ser incorporados sinais de secreção adequados no polipéptido pretendido para permitir a secreção da proteína traduzida para o lúmen do retículo endoplasmático, o espaço periplasmático ou o ambiente extracelular. Estes sinais podem ser endógenos ao polipéptido ou estes podem ser sinais heterólogos.
Se um polipéptido da presente invenção se destinar a ser expresso para utilização em ensaios de rastreio, é geralmente preferido que o polipéptido seja produzido na superfície da célula. Neste caso, as células podem ser recolhidas antes da utilização no ensaio de rastreio. Se o polipéptido for segregado 12 para o meio, o meio pode ser recuperado para recuperar e purificar o polipéptido. Se for produzido intracelularmente, as células têm que ser inicialmente lisadas antes do polipéptido ser recuperado.
Os polipéptidos da presente invenção podem ser recuperados e purificados a partir de culturas de células recombinantes por métodos bem conhecidos, incluindo precipitação com sulfato de amónio ou etanol, extracção ácida, cromatografia de permuta aniónica ou de catiónica, cromatografia em fosfocelulose, cromatografia de interacção hidrofóbica, cromatografia de afinidade, cromatografias em hidroxilapatite e cromatografia em lectina. De um modo muito preferido, é utilizada cromatografia liquida de elevado desempenho para a purificação. Podem ser utilizadas técnicas bem conhecidas para enrolar novamente proteínas para regenerar a conformação activa quando o polipéptido é desnaturado durante a síntese intracelular, o isolamento e/ou a purificação.
Os polinucleótidos codificando os polipéptidos da presente invenção podem ser utilizados como reagentes de diagnóstico, através da detecção de mutações no gene associado. A detecção de uma forma mutada do gene caracterizada pelo polinucleótido da SEQ ID N°: 1 ou SEQ ID N°: 5 na sequência de ADNc ou genómica e que está associada com uma disfunção irá proporcionar uma ferramenta de diagnóstico que pode acrescentar ou definir um diagnóstico de uma doença ou susceptibilidade a uma doença, o que resulta na sub-expressão, sobre-expressão ou expressão espacial ou temporalmente alterada do gene. Podem ser detectados indivíduos contendo mutações no gene ao nível do ADN através de várias técnicas bem conhecidas na técnica. 13
Os ácidos nucleicos para diagnóstico podem ser obtidos a partir de células de um indivíduo, tais como de sangue, urina, saliva, biópsia de tecidos ou material de autópsia. 0 ADN genómico pode ser utilizado directamente para a detecção ou pode ser amplificado enzimaticamente utilizando PCR, de um modo preferido, RT-PCR ou outras técnicas de amplificação antes da análise. Podem ser também utilizados ARN ou ADNc de forma semelhante. As eliminações e as inserções podem ser detectadas por uma alteração no tamanho do produto amplificado em comparação com o genótipo normal. Podem ser identificadas mutações pontuais através de ADN amplificado hibridando com sequências nucleotídicas de MAGI marcados. As sequências perfeitamente emparelhadas podem ser distinguidas de duplexes com emparelhamento incorrecto por digestão com ARNase ou por diferenças nas temperaturas de fusão. Podem ser também detectadas diferenças entre sequências de ADN por alterações na mobilidade electroforética de fragmentos de ADN em géis, com ou sem agentes desnaturantes ou por sequenciação directa de ADN (ver, por exemplo, Myers et al., Science (1985) 230:1242). Podem ser também reveladas alterações de sequência em posições específicas por ensaios de protecção de nucleases, tais como protecção de ARNase e de SI ou pelo método de quebra química (ver Cotton et al., Proc Natl Acad Sei USA (1985) 85: 4397-4401) .
Pode ser construída uma matriz de sondas oligonucleotídicas compreendendo sequências polinucleotídicas de MAGI ou de seus fragmentos para realizar um rastreio eficiente de e. g., mutações genéticas. Essas matrizes são, de um modo preferido, matrizes ou grelhas de elevada densidade. Os métodos da tecnologia de matrizes são bem conhecidos e têm aplicabilidade geral e podem ser utilizados para abordar várias questões em 14 genética molecular incluindo expressão génica, ligação genética e variabilidade genética, ver, por exemplo, M. Chee et al., Science, 274, 610-613 (1996) e outras referências aí citadas. A detecção de níveis anormalmente diminuídos ou aumentados de expressão do polipéptido ou de ARNm pode ser também utilizada para diagnosticar ou determinar a susceptibilidade de uma indivíduo a uma doença da invenção. A expressão diminuída ou aumentada pode ser medida ao nível do ARN utilizando qualquer dos métodos bem conhecidos na técnica da quantificação de polinucleótidos, tais como, por exemplo, amplificação de ácidos nucleicos, por exemplo PCR, RT-PCR, protecção de ARNase, transferência de Northern e outros métodos de hibridação. As técnicas de ensaio que podem ser utilizadas para determinar níveis de uma proteína, tal como um polipéptido da presente invenção, numa amostra derivada de um hospedeiro são bem conhecidas dos especialistas na técnica. Esses métodos de ensaio incluem radioimunoensaios, ensaios de ligação competitiva, análise de Transferência de Western e ensaios de ELISA.
As sequências polinucleotídicas codificando os polipéptidos da presente invenção são valiosas para estudos de localização em cromossomas. A sequência é especificamente visada e pode hibridar com uma localização particular num cromossoma humano individual. O mapeamento de sequências relevantes em cromossomas, de acordo com a presente invenção, é um primeiro passo importante no correlacionamento dessas sequências com a doença associada ao gene. Logo que a sequência está mapeada numa posição cromossómica precisa, a posição física da sequência no cromossoma pode ser correlacionada com dados do mapa genético. Esses dados são encontrados, por exemplo, em V. McKusick, Mendelian Inheritance in Man (disponível online através de Johns 15
Hopkins University Welch Medicai Library). É então identificada a relação entre genes e doenças que foram mapeados na mesma região cromossómica por análise de ligação (co-transmissão de genes fisicamente adjacentes). As localizações cromossómicas humanas precisas para uma sequência genómica (fragmento de gene, etc.) podem ser determinadas utilizando Mapeamento de Híbridos de Radiação (RH) (Walter, M. Spillett, D., Thomas, P., Weissenbach, J. e Goodfellow, P., (1994) A method for constructing a radiation hybrid maps of whole genomes, Nature Genetics 7, 22-28). Estão disponíveis vários painéis RH de Research Genetics (Huntsville, AL, EUA) e. g., o painel GeneBridge4 RH (Hum Mol Genet 1996 Mar; 5(3):339-46 A radiation hybrid map of the human genome. Gyapay G, Schmitt K, Fizames C, Jones H, Vega-Czarny N, Spillett D, Muselet D, Prud'Homme JF, Dib C, Auffray C, Morissette J, Weissenbach J, Goodfellow PN) . Para determinar a posição cromossómica de um gene utilizando este painel, são realizadas 93 PCR utilizando iniciadores concebidos a partir do gene de interesse em ADN de RH. Cada destes ADN contém fragmentos genómicos humanos aleatórios mantidos num fundo de hamster (linhas celulares híbridas humano/hamster). Estas PCR resultam em 93 pontuações indicando a presença ou a ausência do produto de PCR do gene de interesse. Estas pontuações são comparadas com as pontuações criadas utilizando produtos de PCR de sequências genómicas com posição conhecida. Esta comparação é realizada em http://www.genome.wi.mit.edu/. 0 gene da presente invenção é mapeado no cromossoma humano 2p21.
As sequências polinucleotídicas codificando os polipéptidos da presente invenção são também ferramentas valiosas para estudos de expressão em tecidos. Esses estudos permitem que a determinação de padrões de expressão desses polinucleótidos que 16 possam dar uma indicação no que respeita aos padrões de expressão dos polipéptidos codificados em tecidos, por detecção dos ARNm que os codificam. As técnicas utilizadas são bem conhecidas na técnica e incluem técnicas de hibridação in situ com clones dispostos numa qrelha, tais como hibridação de micromatrizes de ADNc (Schena et al, Science, 270, 467-470, 1995 e Shalon et al, Genome Res, 6, 639-645, 1996) e técnicas de amplificação de nucleótidos, tal como PCR. Um método preferido utiliza a tecnologia TAQMAN (Marca comercial) disponível de Perkin Elmer. Os resultados destes estudos podem proporcionar uma indicação da função normal do polipéptido no organismo. Além disso, estudos comparativos entre o padrão de expressão normal de ARNm com o de ARNm codificados por uma forma alternativa do mesmo gene (por exemplo, uma tendo uma alteração no polipéptido codificando uma mutação potencial ou reguladora) podem proporcionar perspectivas valiosas sobre o papel dos polipéptidos da presente invenção ou sobre o da sua expressão inadequada na doença. Essa expressão inadequada pode ser de uma natureza temporal, espacial ou apenas quantitativa. Os polipéptidos da presente invenção são expressos no cérebro, coração, fígado, músculo esquelético, pâncreas e rim, baseado em dados de transferência de Northern proporcionados na figura 1.
Um aspecto adicional da presente invenção refere-se a anticorpos. Os polipéptidos da invenção ou os seus fragmentos ou células que os expressam, podem ser utilizados como imunogénios para produzir anticorpos que são imunoespecíficos para polipéptidos da presente invenção. O termo "imunoespecífico" significa que os anticorpos têm uma afinidade substancialmente maior para os polipéptidos da invenção do que a sua afinidade para outros polipéptidos relacionados na técnica anterior. 17
Os anticorpos produzidos contra polipéptidos da presente invenção podem ser obtidos pela administração dos polipéptidos ou fragmentos contendo o epitopo ou células a um animal, de um modo preferido, a um animal não-humano, utilizando protocolos de rotina. Podem ser utilizada qualquer técnica que proporcione anticorpos produzidos por culturas de linhas celulares contínuas na preparação de anticorpos monoclonais. Os exemplos incluem a técnica do hibridoma (Kohler, G. e Milstein, C., Nature (1975) 256:495-497), a técnica do trioma, a técnica do hibridoma de células B humanas (Kozbor et al.r Immunology Today (1983) 4:72) e a técnica do EBV-hibridoma (Cole et al., Monoclonal Antibodies and Câncer Therapy, 77-96, Alan R. Liss, Inc., 1985).
As técnicas para a produção de anticorpos de cadeia única, tais como as descritas na Patente U. S. N° 4946778, podem ser também adaptadas para produzir anticorpos de cadeia única contra polipéptidos desta invenção. Do mesmo modo, podem ser utilizados murganhos transgénicos ou outros organismos, incluindo outros mamíferos, para expressar anticorpos humanizados.
Os anticorpos descritos acima podem ser utilizados para isolar ou identificar clones expressando o polipéptido ou para purificar os polipéptidos por cromatografia de afinidade. Podem ser também utilizados anticorpos contra polipéptidos da presente invenção para tratar doenças da invenção, entre outros.
Os polipéptidos da presente invenção podem ser também utilizados como vacinas. Consequentemente, é aqui também descrito um método para induzir uma resposta imunológica num mamífero compreendendo inocular o mamífero com um polipéptido da presente invenção, adequado para produzir o anticorpo e/ou a resposta imunitária de células T, incluindo, por exemplo, 18 células T produtoras de citocina ou células T citotóxicas, para proteger o referido animal de doença, quer a doença esteja já estabelecida no indivíduo ou não. Pode ser também induzida uma resposta imunológica num mamífero por um método compreendendo a distribuição de um polipéptido da presente invenção através de um vector que regula a expressão do polinucleótido e codificando para o polipéptido in vivo para induzir essa resposta imunológica para produzir anticorpo para proteger o referido animal de doenças da invenção. Uma forma de administração do vector consiste em acelerá-lo para o interior das células pretendidas sob a forma de um revestimento em partículas ou de outra forma. Esse vector de ácidos nucleicos pode compreender ADN, ARN, um ácido nucleico modificado ou um híbrido ADN/ARN. Para utilização, uma vacina, um polipéptido ou um vector de ácidos nucleicos irão ser normalmente proporcionados como uma formulação de vacina (composição). A formulação pode compreender, além disso, um veículo adequado. Uma vez que um polipéptido pode ser decomposto no estômago, este é, de um modo preferido, administrado parentericamente (por exemplo, por injecção subcutânea, intramuscular, intravenosa ou intradérmica). As formulações adequadas para administração parentérica incluem soluções de injecção estéreis aquosas e não-aquosas que podem conter antioxidantes, tampões, bacteriostáticos e solutos que tornam a formulação isotónica com o sangue do receptor; e as suspensões estéreis aquosas e não-aquosas que podem incluir agentes de suspensão ou agentes de espessamento. As formulações podem ser apresentadas em contentores de dose unitária ou multi-dose, por exemplo, ampolas seladas e frascos e podem ser armazenadas num estado liofilizado requerendo apenas a adição de veículo líquido estéril imediatamente antes da utilização. A formulação de vacina pode também incluir sistemas de adjuvante para aumentar a 19 imunogenicidade da formulação, tal como sistemas de óleo-em-água e outros sistemas conhecidos na técnica. A dosagem irá depender da actividade especifica da vacina e pode ser facilmente determinada por experimentação de rotina.
Os polipéptidos da presente invenção têm uma ou mais funções biológicas que são de relevância em um ou mais estados de doença, em particular, nas doenças da invenção aqui anteriormente referidas. É, consequentemente, útil a identificação de compostos que estimulem ou inibam a função ou o nivel do polipéptido. Consequentemente, é aqui também descrito um método de rastreio de compostos para identificar os que estimulam ou inibem a função ou o nivel do polipéptido. Esses métodos identificam agonistas ou antagonistas que podem ser utilizados para finalidades terapêuticas profilácticas para essas doenças da invenção como aqui anteriormente referido. Os compostos podem ser identificados a partir de várias fontes, por exemplo, células, preparações isentas de células, bibliotecas químicas, colecções de compostos químicos e misturas de produtos naturais. Esses agonistas ou antagonistas identificados deste modo podem ser substratos naturais ou modificados, ligandos, receptores, enzimas, etc., conforme o caso, do polipéptido; um seu mimético estrutural ou funcional (ver Coligan et ai., Current protocols in Immunology 1 (2): Capítulo 5 (1991)) ou uma molécula pequena. 0 método de rastreio pode medir apenas a ligação de um composto candidato ao polipéptido ou a células ou membranas contendo o polipéptido ou uma sua proteína de fusão, através de uma marcação directa ou indirectamente associada com o composto candidato. Alternativamente, o método de rastreio pode envolver a medição ou a detecção (qualitativa ou quantitativamente) da 20 ligação competitiva de um composto candidato ao polipéptido contra um competidor marcado (e. g., agonista ou antagonista). Além disso, estes métodos de rastreio pode testar se o composto candidato resulta num sinal produzido por activação ou inibição do polipéptido, utilizando sistemas de detecção adequados às células contendo o polipéptido. Os inibidores de activação são geralmente ensaiados na presença de um agonista conhecido e é observado o efeito sobre a activação pelo agonista pela presença do composto candidato. Além disso, os métodos de rastreio podem compreender apenas os passos de mistura de um composto candidato com uma solução contendo um polipéptido da presente invenção, para formar uma mistura, medindo uma actividade MAGI na mistura e comparando a actividade MAGI da mistura com uma mistura de controlo que não contém qualquer composto candidato.
Os polipéptidos da presente invenção podem ser utilizados em métodos de rastreio convencional de baixa capacidade e também em formatos de rastreio de elevada capacidade de processamento (HTS). Esses formatos de HTS incluem, não apenas a utilização bem estabelecida de placas de microtitulação de 96 e, mais recentemente, 384 poços, mas também métodos emergentes, tais como o método dos nanopoços descrito por Schullek et ai, Biochem Anal., 246, 20-29, (1997).
As proteínas de fusão, tais como as constituídas pela porção Fc e polipéptido MAGI, como aqui anteriormente descrito, podem ser também utilizadas em ensaios de rastreio de elevada capacidade de processamento para identificar antagonistas do polipéptido da presente invenção (ver D. Bennett et ai., J Mol Recognition, 8:52-58 (1995); e K. Johanson et ai., J Biol Chem, 270 (16) :9459-9471 (1995)) . 21
Os polipéptidos e os anticorpos contra o polipéptido da presente invenção podem ser também utilizados para configurar métodos de rastreio para detectar o efeito de compostos adicionados na produção de ARNm e polipéptido em células. Por exemplo, pode ser concebido um ensaio ELISA para medir níveis segregados ou associados a células do polipéptido utilizando anticorpos monoclonais e policlonais por métodos convencionais conhecidos na técnica. Isto pode ser utilizado para detectar agentes que podem inibir ou intensificar a produção do polipéptido (também designados, respectivamente, antagonistas ou agonistas) a partir de células ou tecidos adequadamente manipulados.
Pode ser utilizado um polipéptido da presente invenção para identificar receptores ligados à membrana ou solúveis, se existir algum, através de técnicas de ligação a um receptor convencionais conhecidas na técnica. Estas incluem, mas não estão limitadas a, ligação de ligando e ensaios de reticulação em que o polipéptido é marcado com um isótopo radioactivo (por exemplo, 125I), quimicamente modificado (por exemplo, biotininilado) ou fundido com uma sequência peptídica adequada para detecção ou purificação e é incubado com uma fonte do receptor putativo (células, membranas celulares, sobrenadantes celulares, extractos de tecido, fluidos corporais). Outros métodos incluem técnicas biofísicas, tais como ressonância do plasmão de superfície e espectroscopia. Estes métodos de rastreio podem ser também utilizados para identificar agonistas e antagonistas do polipéptido que competem com a ligação do polipéptido aos seus receptores, se existir algum. São bem conhecidos na técnica métodos convencionais para realizar esses ensaios. 22
Os exemplos de antagonistas de polipéptidos da presente invenção incluem anticorpos ou, em alguns casos, oligonucleótidos ou proteínas que estão relacionados proximamente com os ligandos, substratos, receptores, enzimas, etc., conforme o caso, do polipéptido, e. g., um fragmento dos ligandos, substratos, receptores, enzimas, etc.; ou uma pequena molécula que se liga ao polipéptido da presente invenção mas não promove uma resposta, de forma a que a actividade do polipéptido seja prevenida.
Os métodos de rastreio podem também envolver a utilização de tecnologia transgénica e do gene MAGI. A técnica de construção de animais transgénicos está bem estabelecida. Por exemplo, o gene MAGI pode ser introduzido por microinjecção no pronúcleo masculino de oócitos fertilizados, transferência retroviral para embriões pré ou de pós-implantação ou injecção de células estaminais embrionárias geneticamente modificadas em blastocistos de um hospedeiro, tal como por electroporação. Os animais transgénicos particularmente úteis, os designados animais "de inserção", em que um gene animal é substituído pelo equivalente humano dentro do genoma desse animal. Os animais transgénicos de inserção são úteis no processo de pesquisa de fármacos, para a validação de alvos, em que o composto é específico para o alvo humano. Outros animais transgénicos úteis são designados animais "de inactivação" em que a expressão do ortólogo animal de um polipéptido da presente invenção e codificado por uma sequência de ADN endógena numa célula é parcial ou completamente anulada. A inserção do gene pode ser direccionada para células ou tecidos específicos, pode ocorrer apenas em algumas células ou tecidos como consequência das limitações da tecnologia ou pode ocorrer em todas ou em substancialmente todas as células do animal. A tecnologia dos 23 animais transgénicos oferece também um sistema de clonagem para expressão em animais completos em que os genes introduzidos são expressos para originar grandes quantidades de polipéptidos da presente invenção.
Glossário
As seguintes definições são proporcionadas para facilitar a compreensão de determinados termos aqui anteriormente utilizados frequentemente. "Anticorpos", como aqui utilizado, incluem anticorpos policlonais e monoclonais, quiméricos, de cadeia única e anticorpos humanizados, assim como fragmentos Fab, incluindo os produtos de uma biblioteca de expressão de imunoglobulinas Fab ou outra. "Isolado" significa alterados "por mão humana" em relação ao seu estado natural. í. e., se este ocorre na natureza, este foi alterado ou removido do seu ambiente original ou ambos. Por exemplo, um polinucleótido ou um polipéptido presente naturalmente num organismo vivo não está "isolado", mas o mesmo polinucleótido ou o polipéptido separado dos materiais coexistentes no seu estado natural está "isolado", na medida em que o termo é aqui utilizado. Além disso, um polinucleótido ou polipéptido que é introduzido num organismo por transformação, manipulação genética ou por qualquer outro método recombinante está "isolado" mesmo se este estiver ainda presente no referido organismo, em que o organismo pode ser vivo ou não-vivo. 24 "Polinucleótido" refere-se, geralmente, a qualquer polirribonucleótido (ARN) ou polidesoxibonucleótido (ADN), que pode ser ARN ou ADN não modificado ou modificado. "Polinucleótidos" inclui, sem limitação, ADN de cadeia simples e dupla. ADN que é uma mistura regiões de cadeia simples e dupla, ARN de cadeia simples e dupla e ARN que é uma mistura de regiões de cadeia simples e dupla, moléculas híbridas compreendendo ADN e ARN que pode ser de cadeia simples ou, mais tipicamente, de cadeia dupla ou uma mistura de regiões de cadeia simples e dupla. Além disso, "polinucleótido" refere-se a regiões de cadeia tripla compreendendo ARN ou ADN ou tanto ARN como ADN. 0 termo "polinucleótido" inclui também ADN ou ARN contendo uma ou mais bases modificadas e ADN ou ARN com estruturas base modificadas para estabilidade ou por outros motivos. Bases "modificadas" incluem, por exemplo, bases tritiladas e bases invulgares tais como inosina. Podem ser realizadas várias modificações ao ADN e ao ARN; deste modo, "polinucleótido" abrange formas química, enzimatica ou metabolicamente modificadas de polinucleótidos como tipicamente encontrado na natureza, assim como as formas químicas de ADN e de ARN características de vírus e células. "Polinucleótido" abrange também polinucleótidos relativamente curtos, frequentemente designados como oligonucleótidos. "Polipéptido" refere-se a qualquer polipéptido compreendendo dois ou mais aminoácidos ligados entre si por ligações peptídicas ou ligações peptídicas modificadas, í. e., isoésteres de péptido. "Polipéptido" refere-se tanto a cadeias curtas, normalmente designadas como péptidos, oligopéptidos ou oligómeros, como a cadeias mais longas, geralmente designadas como proteínas. Os polipéptidos podem conter aminoácidos para além dos 20 aminoácidos codificados por genes. "Polipéptidos" 25 incluem sequências de aminoácidos modificadas por processos naturais, tais como processamento pós-tradução ou por técnicas de modificação química que são bem conhecidas na técnica. Essas modificações estão bem descritas em textos básicos e em monografias mais detalhadas, assim como em muita literatura de investigação. Podem ocorrer modificações em qualquer local num polipéptido, incluindo a estrutura base peptídica, as cadeias laterais dos aminoácidos e os terminais amino ou carboxilo. Irá ser tido em consideração que o mesmo tipo da modificação pode estar presente no mesmo ou em graus variáveis em vários locais num determinado polipéptido. De igual modo, um determinado polipéptido pode conter muitos tipos de modificações. Os polipéptidos podem estar ramificados em consequência de ubiquitinação e estes podem ser cíclicos, com ou sem ramificação. Os polipéptidos cíclicos, ramificados e ramificados cíclicos podem resultar de processos naturais pós-tradução ou podem ser realizados por métodos sintéticos. As modificações incluem acetilação, acilação. ribosilação com ADP, amidação, biotinilação, ligação covalente de flavina, ligação covalente de uma parte heme, ligação covalente de um nucleótido ou derivado de nucleótido, ligação covalente de um lípido ou derivado de lípido, ligação covalente de fosfotidilinositol, reticulação, ciclização, formação de ligação persulfureto, desmetilação, formação de reticulações covalentes, formação de cistina, formação de piroglutamato, formilação, gama-carboxilação, glicosilação, formação de âncora GPI, hidroxilação, iodinação, metilação, miristoilação, oxidação, processamento proteolítico, fosforilação, fenilação, racemização, selenoilação, sulfação, adição de aminoácidos a proteínas mediada por arn de transferência, tais como arginilação e ubiquitinação (ver, por exemplo. Proteins - Structure and Molecular Properties. 2a Ed. . T. E. Creighton, W. H. Freeman and Company, Nova Iorque. 1993; 26
Wold. F.. Post-translational Protein Modifications: Perspectives and Prospects. 1-12. em Post-translational Covalent Modification of Proteins. B. C. Johnson, Editor.. Academic Press. Nova Iorque. 1983; Seifter et al., "Analysis for protein modifications and nonprotein cofactors". Meth Enzymol, 182. 626-646, 1990 e Rattan et al., "Protein synthesis: Post-translation Modifications and Aging", Ann NY Acad Sei. 663. 48-62. 1992). "Fragmento" de uma sequência polipeptidica refere-se a uma sequência polipeptidica que é mais curta do que a sequência de referência mas que conserva, essencialmente, a mesma função ou actividade biológica que o polipéptido de referência. "Fragmento" de uma sequência polinucleotidica refere-se a uma sequência polinucleotidica que é mais curta do que a sequência de referência da SEQ ID N° : 1 ou da SEQ ID N°: 5. "Variante" refere-se a um polinucleótido ou polipéptido que difere de um polinucleótido ou de um polipéptido de referência, mas que conserva as suas propriedades essenciais. Uma variante tipica de um polinucleótido difere do polinucleótido de referência na sequência nucleotidica. As alterações na sequência nucleotidica da variante podem, ou não, alterar a sequência de aminoácidos de um polipéptido codificado pelo polinucleótido de referência. As alterações de nucleótidos podem resultar em substituições, adições, eliminações, fusões e truncamentos de aminoácidos no polipéptido codificado pela sequência de referência, como discutido abaixo. Uma variante tipica de um polipéptido difere na sequência de aminoácidos em relação ao polipéptido de referência. Geralmente, as alterações são limitadas de forma a que as sequências do polipéptido de referência e da variante sejam proximamente semelhantes globalmente e, em muitas regiões, idênticas. Uma variante e um 27 polipéptido de referência podem diferir na sequência de aminoácidos numa ou mais substituições, inserções, eliminações em qualquer combinação. Um resíduo de aminoácidos substituído ou inserido pode, ou não, ser o codificado pelo código genético. As substituições conservadoras típicas incluem Gly, Ala; Vai, Ile, Leu; Asp, Glu: Asn, Gin; Ser, Thr; Lys, Arg; e Phe e Tyr. Uma variante de um polinucleótido ou de um polipéptido pode ser de ocorrência natural, tal como um alelo ou esta pode ser uma variante que não é conhecida por ocorrer naturalmente. As variantes de polinucleótidos e polipéptidos que não ocorrem naturalmente podem ser produzidas por técnicas de mutagénese ou por síntese directa. São também incluídas como variantes polipéptidos tendo uma ou mais modificações pós-tradução, por exemplo, glicosilação, fosforilação, metilação, ribosilação com ADP e semelhantes. As formas de realização incluem metilação do aminoácido do terminal N, fosforilações de serinas e treoninas e modificação do terminal C de glicinas. "Alelo" refere-se a uma de duas ou mais formas alternativas de um gene que ocorre num local determinado no genoma. "Polimorfismo" refere-se a uma variação na sequência nucleotídica (e na sequência polipeptídica codificada, se relevante) numa determinada posição no genoma dentro de uma população. "Polimorfismo Num Único Nucleótido" (SNP) refere-se à ocorrência de variabilidade de um nucleótido numa posição nucleotídica única no genoma, dentro de uma população. Os SNP podem ocorrer dentro de um gene ou no interior de regiões intergénicas do genoma. Os SNP podem ser ensaiados utilizando Amplificação Específica para Alelos (ASA). São necessários, pelo 28 menos, 3 iniciadores para o processo. É utilizado um iniciador comum no complemento reverso do polimorfismo que está a ser ensaiado. Este iniciador comum pode situar-se entre 50 e 1500 bp da base polimórfica. Os outros dois ou mais) iniciadores são idênticos entre si excepto por a base 3' final variar para corresponder a um dos dois (ou mais) alelos que constituem o polimorfismo. São então realizadas duas (ou mais) reacções de PCR sobre o ADN de amostra, cada utilizando o iniciador comum e um dos Iniciadores Específicos para um Alelo. "Variante de Processamento" como aqui utilizado refere-se a moléculas de ADNc produzidas a partir de moléculas de ARN inicialmente transcritas a partir da mesma sequência de ADN genómica mas que sofreram processamento de ARN alternativo. O processamento de ARN alternativo ocorre quando um transcrito primário de ARN sofre processamento, geralmente para a remoção de intrões, o que resulta na produção de mais de uma molécula de ARNm em que cada uma pode codificar sequências de aminoácidos diferentes. O termo variante de processamento refere-se também às proteínas codificadas pelas moléculas ADNc acima. "Identidade" reflecte uma relação entre duas ou mais sequências polipeptídicas ou duas ou mais sequências polinucleotídicas, determinada comparando as sequências. Em geral, identidade refere-se a uma correspondência exacta nucleótido a nucleótido ou aminoácido a aminoácido, respectivamente, das duas sequências polinucleotídicas ou das duas polipeptídicas ao longo do comprimento das sequências que são comparadas. "% de Identidade" - para sequências em que não existe uma correspondência exacta, pode ser determinada uma "% de 29 identidade". Em geral, as duas sequências a serem comparadas são alinhadas para proporcionar uma correlação máxima entre as sequências. Isto pode incluir a inserção de "espaços" numa ou em ambas as sequências, para aumentar o grau de alinhamento. Pode ser determinada uma % de identidade ao longo da totalidade do comprimento de cada uma das sequências que são comparadas (designado alinhamento global), que é particularmente adequada para sequências com o mesmo ou com comprimento muito semelhante ou ao longo de comprimentos mais curtos, definidos (designado alinhamento local), que é mais adequado para sequências de comprimento desigual. "Semelhança" é uma medida adicional, mais sofisticada da relação entre duas sequências polipeptidicas. Em geral, "semelhança" significa uma comparação entre os aminoácidos de duas cadeias polipeptidica, numa base de resíduo a resíduo, tendo em consideração não apenas correspondências exactas entre a entre pares de resíduos, um de cada uma das sequências que estão a ser comparadas (como na identidade) mas também, quando não existe uma correspondência exacta, se, numa base evolutiva, um resíduo for um substituto provável de outro. Esta probabilidade tem uma "pontuação" associada a partir da qual pode ser, então, determinada a "% de semelhança" das duas sequências. São bem conhecidos na técnica métodos para comparar a identidade e a semelhança de duas ou mais sequências. Deste modo por exemplo, programas disponíveis no Wisconsin Sequence Analysis Package, versão 9.1 (Devereux J et al., Nucleic Acids Res, 12, 387-395, 1984, disponível de Genetics Computer Group, Madison. Wisconsin. EUA), por exemplo, podem ser utilizados os programas BESTFIT e GAP, para determinar a % de identidade entre 30 dois polinucleótidos e a % de identidade e a % de semelhança entre duas sequências polipeptidicas. 0 BESTFIT utiliza o algoritmo de "homologia local" de Smith e Waterman (J Mol Biol, 147, 195-197,1981. Advances in Applied Mathematics. 2, 482-459, 1981) e pesquisa a melhor região única de semelhança entre duas sequências. 0 bestfit é mais adequado à comparação entre dois polinucleótidos ou duas sequências polipeptidicas que são dissemelhantes no comprimento, assumindo o programa que a sequência mais curta representa uma porção da mais longa. Em comparação, o GAP alinha duas sequências, pesquisando uma "semelhança máxima", de acordo com o algoritmo de Neddleman e Wunsch (J Mol Biol, 48, 443-453. 1970). O GAP é mais adequado à comparação entre sequências que têm aproximadamente o mesmo comprimento e em que é esperado um alinhamento ao longo da totalidade do comprimento. De um modo preferido, os parâmetros "Ponderação de Espaço" e "Ponderação de comprimento" utilizados em cada programa são, respectivamente, 50 e 3, para sequências polinucleotídicas e 12 e 4 para sequências polipeptidicas. De um modo preferido, as % de identidades e de semelhanças são determinadas quando as duas sequências a serem comparadas são alinhadas optimamente. São também conhecidos na técnica outros programas para determinar identidade e/ou semelhança entre sequências, por exemplo, a família de programas BLAST (Altschul S F et al. J Mol Biol, 215, 403-410.1990. Altschul S F et al. Nucleic Acids Res.. 25:389-3402, 1997, disponível do National Center for Biotechnology Information (NCBI), Bethesda. Maryland, EUA e acessível através da página web do NCBI em www.ncbi.nlm.nih.gov) e FASTA (Pearson w R. Methods in Enzymology, 183, 63-99. 1990: Pearson W R e Lipman D J. Proc Nat Acad Sei USA. 85. 2444-24488, 31 1988, disponível como parte do Wisconsin Sequence Analysis Package) .
De um modo preferido, é utilizada a matriz de substituição de aminoácidos BLOSUM62 (Henikoff S e Henikoff J G, Proc. Nat. Acad Sei. USA. 89, 10915-10919, 1992) em comparações de sequências polipeptídicas incluindo quando as sequências nucleotídicas são inicialmente traduzidas em sequências de aminoácidos antes da comparação.
De um modo preferido, é utilizado o programa BESTFIT para determinar a % de identidade de um sequência polinucleotídica ou polipeptídica de pesquisa em relação a uma sequência polinucleotídica ou polipeptídica de referência, estando as sequências de pesquisa e de referência alinhadas optimamente e os parâmetros do programa estabelecidos no valor por omissão, como aqui anteriormente descrito. "índice de Identidade" é uma medida do grau de relação entre sequências que pode ser utilizada para comparar uma sequência candidata (polinucleotídica ou polipeptídica) com uma sequência de referência. Deste modo, por exemplo, uma sequência polinucleotídica candidata tendo, por exemplo, um índice de Identidade de 0,95 em comparação com uma sequência polinucleotídica de referência é idêntica à sequência de referência excepto por sequência polinucleotídica candidata poder incluir em média até cinco diferenças por cada 100 nucleótidos da sequência de referência. Essas diferenças são seleccionadas do grupo consistindo de, pelo menos, uma eliminação, substituição, incluindo transição e transversão ou inserção de nucleótidos. Estas diferenças podem ocorrer nas posições dos terminais 5' ou 3' da sequência polinucleotídica de 32 referência ou em qualquer local entre estas posições terminais, intercaladas individualmente entre os nucleótidos na sequência de referência ou em um ou mais grupos contíguos dentro da sequência de referência. Por outras palavras, para obter uma sequência polinucleotidica tendo um índice de Identidade de 0,95 em comparação com uma sequência polinucleotidica de referência, pode ser eliminada, substituída ou inserida uma média de até 5 em cada 100 dos nucleótidos na sequência de referência ou qualquer sua combinação, como aqui anteriormente descrito. O mesmo se aplica, mutatis mutandis, para outros valores do índice de Identidade, por exemplo 0,96, 0,97, 0,98 e 0,99.
De um modo semelhante, para um polipéptido, uma sequência polipeptídica candidata tendo, por exemplo, um índice de Identidade de 0,95 em comparação com uma sequência polipeptídica de referência é idêntica à sequência de referência excepto por a sequência polipeptídica poder incluir uma média de até cinco diferenças por cada 100 aminoácidos da sequência de referência. Essas diferenças são seleccionadas do grupo consistindo em pelo menos uma eliminação, substituição, incluindo substituição conservadora e não-conservadora ou inserção de aminoácidos. Estas diferenças podem ocorrer nas posições do terminal amino ou carboxilo da sequência polipeptídica de referência ou em qualquer local entre estas posições terminais, intercaladas quer individualmente entre os aminoácidos na sequência de referência quer em um ou mais grupos contíguos dentro da sequência de referência. Por outras palavras, para obter uma sequência polipeptídica tendo um índice de identidade de 0,95 em comparação com uma sequência polipeptídica de referência, pode ser eliminada, substituída ou inserida uma média de até 5 em cada 100 dos aminoácidos na sequência de referência ou qualquer sua combinação, como aqui anteriormente descrito. O mesmo se 33 aplica, mutatis mutandis, para outros valores do índice de Identidade, por exemplo, 0,96, 0,97, 0,98 e 0,99. A relação entre o número de diferenças em nucleótidos ou em aminoácidos e o indice de identidade pode ser expressa na equação seguinte: na < xa - (xa · 1). em que: na é o número de diferenças em nucleótidos ou em aminoácidos, xa é o número total de nucleótidos ou de aminoácidos, respectivamente, na SEQ ID N°: 1 ou SEQ ID N°: 5 ou na SEQ ID N°: 2 ou SEQ ID N° : 6, I é o índice de Identidade. • é o simbolo para o operador da multiplicação, e em que qualquer produto não-número inteiro de xa e I é arredondado para baixo para o número inteiro mais próximo antes o subtrair de xa. "Homólogo" é um termo genérico utilizado na técnica para designar uma sequência polinucleotidica ou polipeptídica que possui um elevado grau de relação em termos de sequência com uma sequência de referência. Esse grau de relação pode ser quantificado pela determinação do grau de identidade e/ou de 34 semelhança entre as duas sequências como aqui anteriormente definido. Os termos "ortólogo" e "parálogo" estão incluídos neste termo genérico. "Ortólogo" refere-se a um polinucleótido ou a um polipéptido que é um equivalente funcional de um polinucleótido ou de um polipéptido numa outra espécie. "Parálogo" refere-se a um polinucleótido ou polipéptido que é funcionalmente semelhante dentro da mesma espécie. "Proteína de fusão" refere-se a uma proteína codificada por dois genes, frequentemente não relacionados, fundidos ou seus fragmentos. Num exemplo, o documento EP-A-0464*** divulga proteínas de fusão compreendendo várias porções da região constante de moléculas de imunoglobulina em conjunto com outras proteínas humana ou suas partes. Em muitos casos, a utilização uma região Fc de uma imunoglobulina como uma parte de uma proteína de fusão é vantajosa para utilização em terapia e diagnóstico resultando, por exemplo, em propriedades farmacocinéticas melhoradas [ver, e. g., documento EP-A 0232262] . Por outro lado, para algumas utilizações irá ser desejável ser possível eliminar a parte Fc após a proteína de fusão ter sido expressa, detectada e purificada.
Exemplo - Distribuição de MAGI humanos em tecidos
Foi hibridada uma sonda de ADN marcada radioactivamente correspondente aos 2 kb do terminal C da grelha de leitura aberta de MAGI com um filtro Clontech MTN-1 contendo aplicações equivalentes de ARNm de cada dos tecidos indicados e foi de seguida lavado com severidade elevada para detectar apenas transcritos dos MAGI. Os resultados são mostrados na figura 1. São visíveis, pelo menos, três bandas (>5 kb, 2,4kb e <2 kb) . O 35 transcrito maior está presente no cérebro e num menor grau no músculo cardíaco e esquelético adulto. 0 transcrito médio está presente a níveis essencialmente semelhantes em todos os tecidos enquanto os transcritos mais curtos são expressos mais especificamente, mais abundantemente no músculo esquelético, cérebro e rim com níveis baixos detectáveis no pâncreas. A Figura 1 representa uma transferência de Northern mostrando a distribuição nos tecidos dos MAGI humanos. A faixa 1 contém ARN de coração adulto humano. A faixa 2 contém ARN de cérebro adulto humano. A faixa 3 contém ARN placentário humano. A faixa 4 contém ARN de pulmão adulto humano, a faixa 5 contém ARN de fígado adulto humano, a faixa 6 contém ARN de músculo esquelético adulto humano. A faixa 7 contém ARN de rim adulto humano e a faixa 8 contém ARN de pâncreas adulto humano.
INFORMAÇÃO SOBRE SEQUÊNCIAS SEQ ID N° : 1
ATGGAAGACCTGGACCAGTCTCCTCTGGTCTCGTCCTCGGACAGCCCACCCCGGCCGCAG
CCCGCGTTCAAGTACCAGTTCGTGAGGGAGCCCGAGGACGAGGAGGAAGAAGAGGAGGAG
GAAGAGGAGGACGAGGACGAAGACCT3GAGGAGCTGGAGGTGCTGGAGAGGAAGCCCGCC
GCCGGGCTGTCCGCGGCCCCAGTGCCGACCGCGCCTGCCGCCGGCGCGCCCCTGATGGAC
TTCGGAAATGACTTCGTGCCGCCGGCGCCCCGGGGACCCCTGCCGGCCGCTCCCCCCGTC
GCCCCGGAGCGGCAGCCGTCTTGGGACCCGAGCCCGGTGTCGTCGACCGTGCCCGCGCCA
TCCCCGCTGTCTGCTGCCGCAGTCTGGCCCTCCAAGCTCCCTGAGGACGACGAGCCTCCG
GCCCGGCCTCCCCCTCCTCCCCCGGCCAGCGTGAGCCCCCAGGCAGAGCCCGTGTGGACC
CCGCCAGCCCCGGCTCCCGCCGCGCCCCCCTCCÁCCCCGGCCGCGCCCAAGCGCAGGGGC
TCCTCGGGCTCAGTGGATGAGACCCTTTTTGCTCTTCCTGCTGCATCTGAGCCTGTGATA
CGCTCCTCTGCAGAAAATATGGACTTGAAGGAGCAGCCAGGTAACACTATTTCGGCTGGT
CAAGAGGATTTCCCATCTGTCCTGCTTGAAACTGCTGCTTCTCTTCCTTCTCTGTCTCCT 36
CTCTCAGCCGCTTCTTTCAAAGAACATGAATACCTTGGTAATTTGTCAACAGTATTACCC
ACTGAAGGAACACTTCAAGAAAATGTCAGTGAAGCTTCTAAAGAGGTCTCAGAGAAGGCA
AAAACTCTACTCATAGATAGAGATTTAACAGAGTTTTCAGAATTAGAATACTCAGAAATG
GGATCATCGTTCAGTGTCTCTCCAAAAGCAGAATCTGCCGTAATAGTAGCAAATCCTAGG
GAAGAAATAATCGTGAAAAATAAAGATGAAGAAGAGAAGTTAGTTAGTAATAACATCCTT
CATAATCAACAAGAGTTACCTACAGCTCTTACTAAATTGGTTAAAGAGGATGAAGTTGTG
TCTTCAGAAAAAGCAAAAGACAGTTTTAATGAAAAGAGAGTTGCAGTGGAAGCTCCTATG
AGGGAGGAATATGCAGACTTCAAACCATTTGAGCGAGTATGGGAAGTGAAAGATAGTAAG
GAAGATAGTGATATGTTGGCTGCTGGAGGTAAAATCGAGAGCAACTTGGAAAGTAAAGTG
GATAAAAAATGTTTTGCAGATAGCCTTGAGCAAACTAATCACGAAAAAGATAGTGAGAGT
AGTAATGATGATACTTCTTTCCCCAGTACGCCAGAAGGTATAAAGGATCGTCCAGGAGCA
TATATCACATGTGCTCCCTTTAACCCAGCAGCAACTGAGAGCATTGCAACAAACATTTTT
CCTTTGTTAGGAGATCCTACTTCAGAAAATAAGACCGATGAAAAAAAAATAGAAGAAAAG
AAGGCCCAAATAGTAACAGAGAAGAATACTAGCACCAAAACATCAAACCCTTTTCTTGTA
GCAGCACAGGATTCTGAGACAGATTATGTCACAACAGATAATTTAACAAAGGTGACTGAG
GAAGTCGTGGCAAACATGCCTGAAGGCCTGACTCCAGATTTAGTACAGGAAGCATGTGAA
AGTGAATTGAATGAAGTTACTGGTACAAAGATTGCTTATGAAACAAAAATGGACTTGGTT
CAAACATCAGAAGTTATGCAAGAGTCACTCTATCCTGCAGCACAGCTTTGCCCATCATTT
GAAGAGTCAGAAGCTACTCCTTCACCAGTTTTGCCTGACATTGTTATGGAAGCACCATTG
AATTCTGCAGTTCCTAGTGCTGGTGCTTCCGTGATACAGCCCAGCTCATCACCATTAGAA gcttcttcagttaattatgaaagcataaaacatgagcctgaaaaccccccaccatatgaa
GAGGCCATGAGTGTATCACTAAAAAAAGTATCAGGAATAAAGGAAGAAATTAAAGAGCCT GAAAATATTAATGCAGCTCTTCAAGAAACAGAAGCTCCTTATATATCTATTGCATGTGAT TTAATTAAAGAAACAAAGCTTTCTGCTGAACCAGCTCCGGATTTCTCTGATTATTCAGAA ATGGCAAAAGTTGAACAGCCAGTGCCTGATCATTCTGAGCTAGTTGAAGATTCCTCACCT GATTCTGAACCAGTTGACTTATTTAGTGATGATTCAATACCTGACGTTCCACAAAAACAA GATGAAACTGTGATGCTTGTGAAAGAAAGTCTCACTGAGACTTCATTTGAGTCAATGATA GAATATGAAAATAAGGAAAAACTCAGTGCTTTGCCACCTGAGGGAGGAAAGCCATATTTG GAATCTTTTAAGCTCAGTTTAGATAACACAAAAGATACCCTGTTACCTGATGAAGTTTCA ACATTGAGCAAAAAGGAGAAAATTCCTTTGCAGATGGAGGAGCTCAGTACTGCAGTTTAT TCAAATGATGACTTATTTATTTCTAAGGAAG CACAG ATAAGAGAAACTGAAACGTTTT CA GATTCATCTCCAATTGAAATTATAGATGAGTTCCCTACATTGATCAGTTCTAAAACTGAT TCATTTTCTAAATTAGCCAGGGAATATACTGACCTAGAAGTATCCCACAAAAGTGAAATT GCTAATGCCCCGGATGGAGCTGGGTCATTGCCTTGCACAGAATTGCCCCATGACCTTTCT TTGAAGAACATACAACCCAAAGTTGAAGAGAAAATCAGTTTCTCAGATGACTTTTCTAAA aatgggtctgctacatcaaaggtgctcttattgcctccagatgtttctgctttggccact caagcagagatagagagcatagttaaacccaaagttcttgtgaaagaagctgagaaaaaa cttccttccgatacagaaaaagaggacagatcaccatctgctatattttcagcagagctg
AGTAAAACTTCAGTTGTTGACCTCCTGTACTGGAGAGACATTAAGAAGACTGGAGTGGTG
TTTGGTGCCAGCCTATTCCTOCTGCTTTCATTGACAGTATTCAGCATTGTGAGCGTAACA 37
GCCTACATTGCCTTGGCCCTGCTCTCTGTGACCATCAGCTTTAGGATATACAAGGGTGTG atccaagctatccagaaatcagatgaaggccacccattcagggcatatctggaatctgaa
GTTGCTATATCTGAGGAGTTGGTTCAGAAGTACAGTAATTCTGCTCTTGGTCATGTGAAC
TGCACGATAAAGGAACTCAGGCGCCTCTTCTTAGTTGATGATTTAGTTGATTCTCTGAAG
TTTGCAGTGTTGATGTGGGTATTTACCTATGTTGGTGCCTTGTTTAATGGTCTGACACTA
CTGATTTTGGCTCTCATTTCACTCTTCAGTGTTCCTGTTATTTATGAACGGCATCAGGCG
CAGATAGATCATTATCTAGGACTTGCAAATAAGAATGTTAAAGATGCTATGGCTAAAATC
CAAGCAAAAATCCCTGGATTGAAGCGCAAAGCTGAATGA SEQ ID Na : 2
MEDLDQSPLVSSSDSPPRPQPAFKYQFVREPEDEEEEEEEEEEDEDEDLEELEVLERKPA AGLSAAPVPTAPAAGAPLMDFGNDFVPPAPRGPLPAAPPVAPERQPSWDPSPVSSTVPAP S PLS AAAVS PS KLPEDDEP P ARP P PP PPASVS PQAEPVWTPP AP AP AAPPSTP AAPKRRG SSGSVDETLFALPAASEPVIRSSAENMDLKEQPGNTISAGQEDFPSVLLETAASLPSLSP LSAASFKEHEYLGNLSTVLPTEGTLQENVSEASKEVSEKAKTLLIDRDLTEFSELSYSEM GSS FSVS PKAES AVIVANPREEIIVKNKDEEEKLVSNNILHNQQELPTALTKLVKEDEW SSEKAKDSFNEKRVAVEAPMREEYADFKPFERVWEVKDSKEDSDMLAAGGKIESNLESKV DKKCFADSLEQTNHEKDSESSNDDTSFPSTPEGIKDRPGAYITCAPFNPAATESIATNIF PLLGDPTSENKTDEKKIEEKKAQIVTEKNTSTKTSNPFLVAAQDSETDYVTTDNLTKVTE EWANMPEGLTPDLVQEACESELNEVTGTKIAYETKMDLVQTSEVMQESLYPAAQLCPSF EESEATPSPVLPDIVMEAPLNSAVPSAGASVIQPSSSPLEASSVNYESIKHEPENPPPYE EAMSVS.LKKVSGIKEEIKEPENINAALQETEAPYISIACDLIKETKLSAEPAPDFSDYSE MAKVEQPVPDHSELVEDSSPDSEPVDLFSDDSIPDVPQKQDETVMLVKESLTETSFESMI EYENKEKLS ALPPEGGKP YLES FKLS LDNTKDTLLPDEVSTLS KKEKIPLQMEELSTAVY SNDDLFISKEAQIRETETFSDSSPIEIIDEFPTLISSKTDSFSKLAREY7DLEVSHKSEI ANAPDGAGSLPCTELPHDLSLKNIQPKVEEKISFSDDFSKNGSATSKVLLLPPDVSALAT QAEIESIVKPKVLVKEAEKKLPSDTEXEDRSPSAIFSAELSKTSWDLLYWRDIKKTGW fgaslflllsltvfsivsvtayialallsvtisfriykgviqaiqksdegkpfraylese
VAISEELVQKYSNSALGHWCTIKELRRLFLVDDLVDSLKFAVLMWVFTYVGALFNGLTL
LILALISLFSVPVIYERHQAQIDHYLGLA2IKNVKDAMAKXQAKIPGLKRKAE 38 SEQ ID N2 : 3
GAAAATATGGACTTGAAGGAGCAGCCAGGTAACACTATTTCGGCTGGTCAA.GAGGATTTC
CCATCTGTCCTGCTTGAAACTGCTGCTTCTNTTCCTTCTCTGTCTCCTCTCTCAGCCGCT
TCTTTCAAAGAACATGAATACCTTGGTAATTTGTCAACAGTATTACCCACTGAAGGAACA
CTTCAAGAAAATGTCAGTGAAGCTTCTAAAGAGGTCTCAGAGAAGGCAAAAACTCTACTC
ATAGATAGAGATTTAACAGAGTTTTCAGAATTAGAATACTCAGAAATGGGATCATCGTTC
AGTGTCTCTCCAAAAGCAGAATCTGCCGTAATAGTAGCAAATCCTAGGGAAGAAATAATC
GTGAAAAATAAAGATGAAGAAGAGAAGTTAGTTAGTAATAACATCCTTCATAMTCAACAA gagttacctacagctcttactaaattggttaaagaggatgaagttgtgtcttcagaaaaa
GCAAAAGACAGTTTTAATGAAAAGAGAGTTGCAGTGGAAGCTCCTATGAGGGAGGAATAT GCAGACTTCAAACCATTTGAGCGAGTATGGGAAGTGAAAGATAGTAAGGAAGATAGTGAT ATGTTGGCTGCTGGAGGTAAAATCGAGAGCAACTTGGAAAGTAAAGTGGATAAAAAATG7 TTTGCAGATAGCCTTGAGCAAACTAATCACGAAAAAGATAGTGAGAGTAGTAATGATGAT ACTTCTTTCCCCAGTACGCCAGAAGGTATAAAGGATCGTTCAGGAGCATATATCACATGT GCTCCCTTTAACCCAGCAGCAACTGAGAGCATTGCAACAAACATTTTTCCTTTGTTAGGA GAT C CTACTTCAGAAAATAAG ACCGATG SEQ ID N2 : 4
ENMDLKEQPGNTISAGQEDFPSVLLETAASXPSLSPLSAASFKEHEYLGNLSTVLPTEGT LQENVS EASKEVSEKAKTLLIDRDLTEFS ELEYSEMGSSFSVS PKAESAVIVANPREEII VKNKDEEEKLVSNKILHXQQELPTALTKLVKEDEWSSEKAKDSFNEKRVAVEAPMREEY ADFKPFERVWEVKDSKEDSDMLAAGGKIESNLESKVDKKCFADSLEQTNHEKDSESSNDD TSFPSTPEGIKDRSGAYITCAPFNPAATESIATNIFPLLGDPTSENKTD SEQ ID NS : 5
ATGGAAGACCTGGACCAGTCTCCTCTGGTCTCGTCCTCGGACAGCCCACCCCGGCCGCAG
CCCGCGTTCAAGTACCAGTTCGTGAGGGAGCCCGAGGACGAGGAGGAAGAAGAGGAGGAG
GAAGAGGAGGACGAGGACGAAGACCTGGAGGAGCTGGAGGTGCTGGAGAGGAAGCCCGCC
GCCGGGCTGTCCGCGGCCCCAGTGCCCACCGCCCCTGCCGCCGGCGCGCCCCTGATGGAC
TTCGGAAATGACTTCGTGCCGCCGGCGCCCCGGGGACCCCTGCCGGCCGCTCCCCCCGTC
GCCCCGGAGCGGCAGCCGTCTTGGGACCCGAGCCCGGTGTCGTCGACCGTGCCCGCGCCA
TCCCCGCTGTCTGCTGCCGCAGTCTCGCCCTCCAAGCTCCCTGAGGACGACGAGCCTCCG
GCCCGGCCTCCCCCTCCTCCCCCGGCCAGCGTGAGCCCCCAGGCAGAGCCCGTGTGGACC 39
CCGCCAGCCCCGGCTCCCGCCGCGCCCCCCTCCACCCCGGCCGCGCCCAAGCGCAGGGGC
TCCTCGGGCTCAGTGGTTGTTGACCTCCTGTACTGGAGAGACATTAAGAAGACTGGAGTG gtgtttggtgccagcctaitcctgctgctttcattgacagtattcagcattgtgagcgta
ACAGCCTACATTGCCTTGGCCCTGCTCTCTGTGACCATCAGCTTTAGGATATACAAGGGT
GTGATCCAAGCTATCCAGAAATCAGATGAAGGCCACCCATTCAGGGCATATCTGGAATCT
GAAGTTGCTATATCTGAGGAGTTGGTTCAGAAGTACAGTAATTCTGCTCTTGGTCATGTG
AACTGCACGATAAAGGAACTCAGGCGCCTCTTCTTAGTTGATGATTTAGTTGATTCTCTG
AAGTTTGCAGTGTTGATGTGGGTATTTACCTATGTTGGTGCCTTGTTTAATGGTCTGACA
GTACTGATTTTGGCTCTCATTTCACTCTTCAGTGTTCCTGTTATTTATGAACGGCATCAG
GCACAGATAGATCATTATCTAGGACTTGCAAATAAGAATGTTAAAGATGCTATGGCTAAA
ATCCAAGCAAAAATCCCTGGATTGAÀGCGCAAAGCTGAATGA SEQ ID N2 : 6
MEDLDQSPLVSSSDSPPRPQPAFKYQFVREPEDEEEEEEEEEEDEDEDLEELEVLERKPA AGLSAAPVPTAPAAGAPLMDFGNTFVPPAPRGPLPAAPPVAPEP.QPSWDPSPVSSTVPAP SPLSAAAVSPSKLPEDDEPPARPPPPPPASVSPQAEPVWTPPAPAPAAPPSTPAAPKRRG S SGS VWDLLYWRDIKKTGWFGA3 LFLLLS LTVFSIVSVTAYIALALLSVTIS FRIYKG VIQAIQKSDEGHPFRAYLESEVAISSELVQKYSNSALGHVNCTIKELRRLFLVDDLVDSL KFAVLMWVFTYVGALFNGLTLLILALIS LFSVPVIYERHQAQIDHYLGLANKNVKDAMAK IQAKIPGLKRKAE LISTAGEM DE SEQUÊNCIAS <110> SmithKline Beecham plc <120> Compostos novos <130> GP30165 <160> 6 <170> FastSEQ para Windows Versão 3.0 40 < 210 > 1
<211> 3579 <212> ADN <213> Homo sapiens <400> 1 atggaagacc tggaccagtc tcctctggtc tcgtcctcgg acagcccacc ccggccgcag 60 cccgcgttca agtaccagtt cgtgagggag cccgaggacg aggaggaaga agaggaggag 120 gaagaggagg acgaggacga agacctggag gagctggagg Cgctggagag gaagcccgcc iao gccgggctgt ccgcggcccc agtgcccacc gcccctgccg ccggcgcgcc cctgatggac 240 ttcggaaatg acttcgtgcc gccggcgccc cggggacccc tgccggccgc tccccccgtc 300 gccccggagc ggcagccgcc ctgggacccg agcccggtgt cgtcgaccgt gcccgcgcca 360 tccccgctgt ctgctgccgc agtctcgccc tccaagctcc ctgaggacga cgagcctccg 420 gcccggcctc ccccccctcc cccggccagc gtgagccccc aggcagagcc cgtgtggacc 480 ccgccagccc cggctcccgc cgcgcccccc Cccaccccgg ccgcgcccaa gcgcaggggc 540 tccecgggct cagtggatga gacçcctttt gcccttcctg ctgcatctga gcctgcgata 600 cgctcctctg cagaaaatat ggacttgaag gagcagccag gtaacactat ttcggctggt 660 caagaggatc tcccatctgt cctgcttgaa accgctgctt ctcttccttc tctgtctcct 720 cCctcagccg cttctttcaa agaacatgaa taccttggta atttgtcaac agtattaccc 780 actgaaggaa cactccaaga aaacgccagc gaagcctcta aagaggtctc agagaaggca 840 aaaactctac tcatagatag agatttaaca gagttctcag aattagaata ctcagaaatg 900 ggatcatcgt tcagtgcctc cccaaaagca gaacccgccg taacagcagc aaaccctagg 960 gaagaaataa tcgcgaaaaa taaagatgaa gaagagaagt tagttagtaa taacatcctt 1020 cacaatcaac aagagttacc tacagctctt accaaactgg ttaaagagga cgaagttgtg 1080 tcttcagaaa aagcaaaaga cagttttaat gaaaagagag ttgcagtgga agctcctatg 1140 agggaggaac atgcagacct caaaccattt gagcgagtat gggaagtgaa agatagtaag 1200 gaagatagtg atatgttggc tgctggaggt aaaatcgaga gcaacttgga aagtàaagtg 1260 gataaaaaat gtctcgcaga tagccttgag caaactaacc acgaaaaaga tagtgagagt 1320 agCaatgatg atácttcttt ccccagcacg ccagaaggta Caaaggatcg tccaggagca 1380 tatatcacat gtgctccctt taacccagca gcaactgaga gcattgcaac aaacattttt 1440 cctttgttag gagatcctac ttcagaaaat aagaccgatg aaaaaaaaac agaagaaaag 1500 aaggcccaaa tagtaacaga gaagaatact agcaccaaaa catcaaaccc ttttcttgta 1560 gcagcacagg attctgagac agattatgtc acaacagata atttaacaaa ggtgactgag 1620 gaagtcgtgg caaacatgcc tgaaggcctg actccagatt cagtacagga agcatgtgaa 1680 agtgaattga atgaagttac tggtacaaag attgcttatg aaacaaaaat ggacttggtt 1740 caaacatcag aagttatgca agagtcactc tatcctgcag cacagctttg cccatcattt 1800 gaagagtcag aagctactcc ttcaccagtt ttgcctgaca ttgttatgga agcaccattg 1360 41 aattctgcag ttcctagtgc tggtgcttcc gtgatacagc ccagctcatc accattagaa 1920 gcttcttcag ttaattatga aagcataaaa catgagcctg aaaacccccc accatatgaa 19Θ0 gaggccatga gtgtatcact aaaaaaagta tcaggaataa aggaagaaac caaagagccc 2040 gaaaatatCa acgcagctct tcaagaaaca gaagctcctt atatatctat tgcatgtgat 2100 ttaattaaag aaacaaagct ttctgctgaa ccagctccgg atttctctga ttattcagaa 2160 atggcaaaag ttgaacagcc agtgcctgat cattccgagc tagttgaaga ttcctcacct 2220 gattctgaac cagttgactt acttagtgat gattcaatac ctgacgctcc acaaaaacaa 2280 gatgaaactg tgatgcttgt gaaagaaagt ctcactgaga cttcatttga gtcaatgata 2340 gaacatgaaa ataaggaaaa actcagtgct ttgccacctg agggaggaaa gccatatttg 2400 gaatctttta agctcagttt agataacaca aaagataccc tgttacctga tgaagtttca 2460 acattgagca aaaaggagaa aattcctttg cagatggagg agctcagtac tgcagtttat 2520 tcaaatgatg actcacttat ceceaaggaa gcacagataa gagaaactga aacgctttca 2580 gattcatctc caattgaaat tatagatgag ccccctacat tgatcagttc taaaactgat 2640 tcattttcta aattagccag ggaatatact gacctagaag tatcccacaa aagtgaaatt 2700 gctaatgccc cggatggagc tgggtcaccg ccttgcacag aattgcccca tgacctctcc 2760 ttgaagaaca tacaacccaa agttgaagag aaaatcagtt tctcagatga ctttCctaaa 2820 aatgggtctg ctacatcaaa ggtgctctta ttgcctccag atgtttctgc tttggccact 2880 caagcagaga tagagagcat agttaaaccc aaagctcCtg tgaaagaagc tgagaaaaaa 2940 ctcccttccg atacagaaaa agaggacaga tcaccatctg ctatattttc agcagagctg 3000 agtaaaacct cagttgttga cctcctgtac Cggagagaca tcaagaagac tggagtggtg 3060 tttggtgcca gcctattcct gctgctttca ttgacagtat tcagcattgt gagcgtaaca 3120 gcctacattg ccttggccct gctctctgtg accatcagct ttaggaCata caagggtgtg 3180 atccaagcta tccagaaatc agatgaaggc cacccattca gggcatatct ggaatctgaa 3240 gtcgctatat ctgaggagtt ggttcagaag tacagtaatt ctgctcttgg tcatgtgaac 3300 tgcacgataa aggaactcag gcgcctcttc ttagttgatg atttagttga ttctctgaag 3360 tttgcagtgt tgatgcgggt atCCacctat gttggtgcct tgtttaatgg tctgacacta 3420 ctgaccttgg ctctcattcc actCttcagt gttcctgtta tttatgaacg gcatcaggcg 3480 cagacagatc attatctagg acctgcaaat aagaatgcta aagatgctat ggctaaaatc 3540 caagcaaaaa tccctggatt gaagcgcaaa gctgaatga 3579
<210> 2 <211> 1192 <212> PRT <213> Homo sapiens 42 < 4 Ο Ο > 2
Met Glu Asp Leu Asp Gin Ser Pro Leu Val Ser Ser Ser Asp Ser Pro 1 5 10 15 Pro Arg Pro Gin Pro Ala Phe Lys Tyr Gin Phe Val Arg Glu Pro Glu 20 25 30 Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Asp Glu Asp Glu Asp 35 40 45 Leu Glu Glu Leu Glu Vai Leu Glu Arg Lys Pro Ala Ala Gly Leu Ser 50 55 60 Ala Ala Pro Vai Pro Thr Ala Pro Ala Ala Gly Ala Pro Leu Met Asp 65 70 75 80 Phe Gly Asn Asp Phe Vai Pro Pro Ala Pro Arg Gly Pro Leu Pro Ala 85 90 95 Ala Pro Pro Vai Ala Pro Glu Arg Gin Pro Ser Trp Asp Pro Ser Pro 100 105 110 Vai Ser Ser Thr Vai Pro Ala Pro Ser Pro Leu Ser Ala Ala Ala Val 115 120 125 Ser Pro Ser Lys Leu Pro Glu Asp Asp Glu Pro Pro Ala Arg Pro Pro 130 135 140 Pro Pro Pro Pro Ala Ser Vai Ser Pro Gin Ala Glu Pro Val Trp Thr 145 150 155 160 Pro Pro Ala Pro Ala Pro Ala Ala Pro Pro Ser Thr Pro Ala Ala Pro 165 170 175 Lys Arg Arg Gly Ser Ser Gly Ser Val Asp Glu Thr Leu Phe Ala Leu 100 IBS 190 Pro Ala Ala Ser Glu Pro Vai Ile Arg Ser Ser Ala Glu Asn Met Asp 195 200 205 Leu Lys Glu Gin Pro Gly Asn Thr Ile Ser Ala Gly Gin Glu Asp Phe 210 215 220 Pro Ser Vai Leu Leu Glu Thr Ala Ala Ser Leu Pro Ser Leu Ser Pro 225 230 235 240 Leu Ser Ala Ala Ser Phe Lys Glu His Glu Tyr Leu Gly Asn Leu Ser 245 250 255 Thr Vai Leu Pro Thr Glu Gly Thr Leu Gin Glu Asn Val Ser Glu Ala 260 265 270 Ser Lys Glu Vai Ser Glu Lys Ala Lys Thr Leu Leu Ile Asp Arg Asp 275 280 285 Leu Thr Glu Phe Ser Glu Leu Glu Tyr Ser Glu Met Gly Ser Ser Phe 290 295 300 43
Ser Vai Ser Pro Lys Ala Glu Ser Ala Vai Ile Vai Ala Asn Pro Arg 305 310 315 320 Glu Glu Ile Ile Val Lys Asn Lys Asp Glu Glu Glu Lys Leu Val Ser 325 330 335 Asn Asn Ile Leu His Asn Gin Gin Glu Leu Pro Thr Ala Leu Thr Lys 340 345 350 Leu Val Lys Glu Asp Glu Val Val Ser Ser Glu Lys Ala Lys Asp Ser 355 360 365 Phe Asn Glu Lys Arg Val Ala Val Glu Ala Pro Met Arg Glu Glu Tyr 370 375 380 Ala Asp Phe Lys Pro Phe Glu Arg Val Trp Glu Val Lys Asp Ser Lys 385 390 395 400 Glu Asp Ser Asp Met Leu Ala Ala Gly Gly Lys' Ile Glu Ser Asn Leu 405 410 415 Glu Ser Lys Val Asp Lys Lys Cys Phe Ala Asp Ser Leu Glu Gin Thr 420 425 430 Asn His Glu Lys Asp Ser Glu Ser Ser Asn Asp Asp Thr Ser Phe Pro 435 440 445 Ser Thr Pro Glu Gly Ile Lys Asp Arg Pro Gly Ala Tyr Ile Thr Cys 450 455 460 Ala Pro Phe Asn Pro Ala Ala Thr Glu Ser Ile Ala Thr Asn Ile Phe 465 470 475 480 Pro Leu Leu Gly Asp Pro Thr Ser Glu Asn Lys Thr Asp Glu Lys Lys 485 490 495 Ile Glu Glu Lys Lys Ala Gin Ile Val Thr Glu Lys Asn Thr Ser Thr 500 505 510 Lys Thr Ser Asn Pro Phe Leu Val Ala Ala Gin Asp Ser Glu Thr Asp 515 520 525 Tyr Val Thr Thr Asp Asn Leu Thr Lys Val Thr Glu Glu Val Val Ala 530 535 540 Asn Met Pro Glu Gly Leu Thr Pro Asp Leu Val Gin Glu Ala Cys Glu 545 550 555 560 Ser Glu Leu Asn Glu Val Thr Gly Thr Lys Ile Ala Tyr Glu Thr Lys 565 570 575 Met Asp Leu Val Gin Thr Ser Glu Val Met Gin Glu Ser Leu Tyr Pro 580 585 590 Ala Ala Gin Leu Cys Pro Ser Phe Glu Glu Ser Glu Ala Thr Pro Ser 595 600 605 Pro Val Leu Pro Asp Ile Val Met Glu Ala Pro Leu Asn Ser Ala Val 610 615 620 Pro Ser Ala Gly Ala Ser Val Ile Gin Pro Ser Ser Ser Pro Leu Glu 625 630 635 640 44
Ala Ser Ser Vai Asn Tyr Glu Ser Ile Lys Kis Glu Pro Glu Asn Pro 645 650 655 Pro Pro Tyr Glu Glu Ala Met Ser Val Ser Leu Lys Lys Val Ser Gly 660 665 670 Ile Lys Glu Glu Ile Lys Glu Pro GlU Asn Ile Asn Ala Ala Leu Gin 675 680 685 Glu Thr Glu Ala Pro Tyr Ile Ser Ile Ala Cys Asp Leu Ile Lys Glu S90 695 700 Thr Lys Leu Ser Ala Glu Pro Ala Pro Asp Phe Ser Asp Tyr Ser Glu 705 710 715 720 Met Ala Lys Vai Glu Gin Pro Val Pro Asp His Ser Glu Leu Val Glu 725 730 735 Asp Ser Ser Pro Asp Ser Glu Pro Val Asp Leu Phe Ser Asp Asp Ser 740 745 750 Ile Pro Asp Vai Pro Gin Lys Gin Asp Glu Thr Val Met Leu Val Lys 755 760 765 Glu Ser Leu Thr Glu Thr Ser Phe Glu Ser Met Ile Glu Tyr Glu Asn 770 775 780 Lys Glu Lys Leu Ser Ala Leu Pro Pro Glu Gly Gly Lys Pro Tyr Leu 785 790 795 800 Glu Ser Phe Lys Leu Ser Leu Asp Asn Thr Lys Asp Thr Leu Leu Pro 805 810 81S Asp Glu Vai Ser Thr Leu Ser Lys Lys Glu Lys Ile Pro Leu Gin Met 820 825 830 Glu Glu Leu Ser Thr Ala Val Tyr Ser Asn Asp Asp Leu Phe Ile Ser 835 840 845 Lys Glu Ala Gin Ile Arg Glu Thr Glu Thr Phe Ser Asp Ser Ser Pro 850 8S5 860 Ile Glu Ile Ile Asp Glu Phe Pro Thr Leu Ile Ser Ser Lys Thr Asp SS5 870 875 880 Ser Phe Ser Lys Leu Ala Arg Glu Tyr Thr Asp Leu Glu Val Ser His 885 890 B95 Lys Ser Glu Ile Ala Asn Ala Pro Asp Gly Ala Gly Ser Leu Pro Cys 900 905 910 Thr Glu Leu Pro Kis Asp Leu Ser Leu Lys Asn Ile Gin Pro Lys Val 915 920 925 Glu Glu Lys ile Ser Phe Ser Asp Asp Phe Ser Lys Asn Gly Ser Ala 930 935 940 Thr Ser Lys Val Leu Leu Leu Pro Pro Asp Val Ser Ala Leu Ala Thr 945 950 955 960 Gin Ala Glu Ile Glu Ser Ile Val Lys Pro Lys Val Leu Val Lys Glu 965 970 975 45
Ala Glu Lys Lys Leu Pro Ser Asp Thr Glu Lys Glu Asp Arg Ser Pro 980 985 990
Ser Ala Ile Phe Ser Ala Glu Leu Ser Lys Thr Ser Vai Vai Asp Leu 995 1000 1005
Leu Tyr Trp Arg Asp Ile Lys Lys Thr Gly Vai Vai Phe Gly Ala Ser 1010 1015 1020
Leu Phe Leu Leu Leu Ser Leu Thr Vai Phe Ser Ile Vai Ser Vai Thr 1025 1030 1035 104
Ala Tyr Ile Ala Leu Ala Leu Leu Ser Vai Thr Ile Ser Phe Arg Ile 1045 1050 1055
Tyr Lys Gly Vai Ile Gin Ala Ile Gin Lys Ser Asp Glu Gly His Pro 1060 1065 1070
Phe Arg Ala Tyr Leu Glu Ser Glu Vai Ala Ile Ser Glu Glu Leu Vai 1075 1080 1085
Gin Lys Tyr Ser Asn Ser Ala Leu Gly His Vai Asn Cys Thr Ile Lys 1090 1095 1100
Glu Leu Arg Arg Leu Phe Leu Vai Asp Asp Leu Vai Asp Ser Leu Lys 1105 1110 1115 112
Phe Ala Vai Leu MeC Trp Vai Phe Thr Tyr Vai Gly Ala Leu Phe Asn 1125 1130 1135
Gly Leu Thr Leu Leu Ile Leu Ala Leu Ile Ser Leu Phe Ser Vai Pro 1140 1145 1150
Vai Ile Tyr Glu Arg His Gin Ala Gin Ile Asp His Tyr Leu Gly Leu 1155 1160 1165
Ala Asn Lys Asn Vai Lys Asp Ala Met Ala Lys Ile Gin Ala Lys Ile 1170 1175 1180
Pro Gly Leu Lys Arg Lys Ala Glu 1185 1190 <210> 3 <211> 868 <212> ADN <213> Homo sapiens 46 < 4 Ο Ο > 3 gaaaatatgg acttgaagga gcagccaggc aacactattt cggctggtca agaggatttc 60 ccatctgtcc tgcttgaaac tgctgcttce nttccttctc tgtctcctct ctcagccgct 120 tctttcaaag aacatgaata ccttggtaat ttgtcaacag tatcacccac cgaaggaaca 180 ctccaagaaa atgtcagtga agcttctaaa gaggtctcag agaaggcaaa aactctactc 240 atagatagag atttaacaga gttttcagaa ttagaatact cagaaacggg accatcgttc 300 agtgtctctc caaaagcaga atctgccgta atagtagcaa atcctaggga agaaataatc 360 gtgaaaaata aagatgaaga agagaagtca gttagtaata acatccttca tanccaacaa 420 gagttaccta cagctcttac taaattggtt aaagaggatg aagttgcgtc ttcagaaaaa 480 gcaaaagaca gttttaatga aaagagagtt gcagtggaag ctcctatgag ggaggaatae 540 geagacttca aaccatttga gcgagtatgg gaagtgaaag atagtaagga agatagtgat 600 atgttggctg ctggaggtaa aatcgagagc aacttggaaa gtaaagtgga taaaaaatgt 660 tctgcagata gccttgagca aactaatcac gaaaaagata gtgagagtag taatgatgat 720 acttctttcc ccagtacgcc agaaggtata aaggatcgtt caggagcata tatcacatgt 780 gctcccttta acccagcagc aactgagagc attgcaacaa acatttttcc tttgttagga 840 gatcctactt cagaaaataa gaccgatg 868
< 210 > 4 <211> 289 <212> PRT <213> Homo sapiens < 4 Ο Ο > 4
Glu Asn Met Asp Leu Lys Glu Gin Pro Gly Asn Thr Ile Ser Ala Gly 1 5 10 15 Gin Glu Asp Phe Pro Ser Vai Leu Leu Glu Thr Ala Ala Ser Xaa Pro 20 25 30 Ser Leu Ser Pro Leu Ser Ala Ala Ser Phe Lys Glu His Glu Tyr Leu 35 40 45 Gly Asn Leu Ser Thr Vai Leu Pro Thr Glu Gly Thr Leu Gin Glu Asn 50 55 60 Vai Ser Glu Ala Ser Lys Glu Val Ser Glu Lys Ala Lys Thr Leu Leu 65 70 75 80 47
Ile Asp Arg Asp Leu Thr Glu Phe Ser Glu Leu Glu Tyr Ser Glu Met 85 90 95 Gly Ser Ser Phe Ser Vai Ser Pro Lys Ala Glu Ser Ala Vai Ile Vai 100 105 110 Ala Asn Pro Arg Glu Glu Ile Ile Vai Lys Asn Lys Asp Glu Glu Glu 115 120 125 Lys Leu Vai Ser Asn Asn Ile Leu His Xaa Gin Gin Glu Leu Pro Thr 130 135 140 Ala Leu Thr Lys Leu Vai Lys Glu Asp Glu Vai Vai Ser Ser Glu Lys 145 150 155 160 Ala Lys Asp Ser Phe Asn Glu Lys Arg Vai Ala Vai Glu Ala Pro Met 165 170 175 Arg Glu Glu Tyr Ala Asp Phe Lys Pro Phe Glu Arg Vai Trp Glu Vai 180 185 190 Lys Asp Ser Lys Glu Asp Ser Asp Met Leu Ala Ala Gly Gly Lys Ile 195 200 205 Glu Ser Asn Leu Glu Ser & Lys Vai Asp Lys Lys Cys Phe Ala Asp Ser 210 215 220 Leu Glu Gin Thr Asn His Glu Lys Asp Ser Glu Ser Ser Asn Asp Asp 225 230 235 240 Thr Ser Phe Pro Ser Thr Pro Glu Gly He Lys Asp Arg Ser Gly Ala 245 250 255 Tyr Ile Thr Cys Ala Pro Phe Asn Pro Ala Ala Thr Glu Ser Ile Ala 260 265 270 Thr Asn Ile Phe Pro Leu Leu Gly Asp Pro Thr Ser Glu Asn Lys Thr 275 280 285
Asp
<210> 5 <211> 1122 <212> ADN <213> Homo sapiens 48 < 4 Ο Ο > 5 atggaagacc tggaccagtc tcotctggtc tcgtcctcgg acagcccacc ccggccgcag 60 cccgcgttca agtaccagtt cgtgagggag cccgaggacg aggaggaaga agaggaggag 120 gaagaggagg acgaggacga agacctggag gagctggagg tgctggagag gaagcccgcc 180 gccgggctgt ccgcggcccc agtgcccacc gcccctgccg ccggcgcgcc cctgatggac 240 ttcggaaatg acttcgtgcc gccggcgccc cggggacccc tgccggccgc tccccccgtc 300 gccccggagc ggcagccgtc ttgggacccg agcccggtgt cgtcgaccgt gcccgcgcca 360 tccccgctgt ccgctgccgc agtctcgccc tccaagctcc etgaggacga cgagcctccg 420 gcccggcctc cccctcctcc cccggccagc gtgagccccc aggcagagcc cgtgtggacc 480 ccgccagccc cggetcccgc cgcgcccccc tccaccccgg ccgcgcccaa gcgcaggggc 540 tcctcgggct cagtggttgt tgacctcctg tactggagag acattaagaa gactggagtg 600 gtgtttggtg ccagcctatt cctgctgctt tcattgacag tattcagcat tgtgagcgta 660 acagcctaca ttgccttggc cctgctctct gtgaccatca gctttaggat atacaagggt 720 gtgatccaag ctatccagaa atcagatgaa ggccacccat tcagggcata tctggaatct 780 gaagttgcta tatctgagga gttggttcag aagtacagta attcCgctct tggtcatgtg 840 aactgcacga taaaggaact caggcgcctc ttcttagttg atgaettagt tgattctctg 900 aagtttgcag tgccgatgtg ggtactcacc tatgtcggtg ccttgtttaa tggcctgaca 960 ctactgattt tggctctcat ttcactcttc agtgttcctg ttatttatga acggcatcag 1020 gcacagatag atcattatct aggacttgca aataagaatg ttaaagatgc taCggctaaa 1080 atccaagcaa aaatccctgg attgaagcgc aaagctgaat ga 1122 <210> 6 <211> 373 <212> PRT <213> Homo sapiens <400> 6 Met Glu Asp Leu Asp Gin Ser Pro Leu Vai Ser Ser Ser Asp Ser Pro 1 5 10 15 Pro Arg Pro Gin Pro Ala Phe Lys Tyr Gin Phe Vai Arg Glu Pro Glu 20 25 30 Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Asp Glu Asp Glu Asp 35 40 45 Leu Glu Glu Leu Glu Vai Leu Glu Arg Lys Pro Ala Ala Gly Leu Ser 50 55 60 49
Ala Ala Pro Vai Pro Thr Ala Pro Ala Ala Gly Ala Pro Leu Met Asp 65 70 75 80 Phe Gly Asn Asp Phe Vai Pro Pro Ala Pro Arg Gly Pro Leu Pro Ala 85 90 95 Ala Pro Pro Vai Ala Pro Glu Arg Gin Pro Ser Trp Asp Pro Ser Pro 100 105 110 Vai Ser Ser Thr Vai Pro Ala Pro Ser Pro Leu Ser Ala Ala Ala val 115 120 125 Ser Pro Ser Lys Leu Pro Glu Asp Asp Glu Pro Pro Ala Arg Pro Pro 130 135 140 Pro Pro Pro Pro Ala Ser val Ser Pro Gin Ala Glu Pro Val Trp Thr 145 150 155 160 Pro Pro Ala Pro Ala Pro Ala Ala Pro Pro Ser Thr Pro Ala Ala Pro 165 170 175 Lys Arg Arg Gly Ser Ser Gly Ser Val Val Val Asp Leu Leu Tyr Trp 180 185 190 Arg Asp Ile Lys Lys Thr Gly Val Val Phe Gly Ala Ser Leu Phe Leu 195 200 205 Leu Leu Ser Leu Thr Vai Phe Ser Ile Val Ser Val Thr Ala Tyr Ile 210 215 220 Ala Leu Ala Leu Leu Ser Val Thr Ile Ser Phe Arg Ile Tyr Lys Gly 225 230 235 240 Vai Ile Gin Ala Ile Gin Lys Ser Asp Glu Gly His Pro Phe Arg Ala 245 250 255 Tyr Leu Glu Ser Glu Vai Ala Ile Ser Glu Glu Leu Val Gin Lys Tyr 260 265 270 Ser Asn Ser Ala Leu Gly His Val Asn Cys Thr Ile Lys Glu Leu Arg 275 280 285 Arg Leu Phe Leu Vai Asp Asp Leu Val Asp Ser Leu Lys Phe Ala Val 290 295 300 Leu Met Trp Vai Phe Thr Tyr Val Gly Ala Leu Phe Asn Gly Leu Thr 305 310 315 320 Leu Leu Ile Leu Ala Leu Ile Ser Leu Phe Ser Val Pro Val Ue Tyr 325 330 335 Glu Arg His Gin Ala Gin Ile Asp His Tyr Leu Gly Leu Ala Asn Lys 340 345 350 Asn Vai Lys Asp Ala Mec Ala Lys Ile Gin Ala Lys Ile Pro Gly Leu 35S 360 365
Lys Arg Lys Ala Glu 370
Lisboa, 6 de Dezembro de 2010 50

Claims (7)

  1. REIVINDICAÇÕES 1. Polipéptido que compreende uma sequência de aminoácidos que tem uma identidade de, pelo menos, 95% com a da SEQ ID N° : 4 ao longo da totalidade do comprimento da SEQ IDN°: 4.
  2. 2. Polipéptido de acordo com a reivindicação 1, que compreende a sequência de aminoácidos da SEQ ID N°: 4.
  3. 3. Polipéptido de acordo com a reivindicação 1 ou 2, que é o polipéptido da SEQ ID N° : 4.
  4. 4. Anticorpo que é imunoespecifico para um polipéptido de acordo com a reivindicação 3.
  5. 5. Anticorpo de acordo com a reivindicação 4, que é um anticorpo monoclonal.
  6. 6. Anticorpo de acordo com a reivindicação 4 ou 5, que é um anticorpo de cadeia única.
  7. 7. Linha celular expressando um anticorpo de acordo com qualquer das reivindicações 4 a 6. Lisboa, 6 de Dezembro de 2010 1
PT99934913T 1998-07-22 1999-07-21 Proteína semelhante a proteína especificamente neuroendócrina e adnc codificante PT1098972E (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB9816024.5A GB9816024D0 (en) 1998-07-22 1998-07-22 Novel compounds
GBGB9916898.1A GB9916898D0 (en) 1999-07-19 1999-07-19 Novel compounds

Publications (1)

Publication Number Publication Date
PT1098972E true PT1098972E (pt) 2010-12-14

Family

ID=26314097

Family Applications (1)

Application Number Title Priority Date Filing Date
PT99934913T PT1098972E (pt) 1998-07-22 1999-07-21 Proteína semelhante a proteína especificamente neuroendócrina e adnc codificante

Country Status (9)

Country Link
US (4) US20020010324A1 (pt)
EP (2) EP2264174A3 (pt)
JP (1) JP2002522016A (pt)
AT (1) ATE483021T1 (pt)
CY (1) CY1110961T1 (pt)
DE (1) DE69942803D1 (pt)
DK (1) DK1098972T3 (pt)
PT (1) PT1098972E (pt)
WO (1) WO2000005364A1 (pt)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT1098972E (pt) * 1998-07-22 2010-12-14 Smithkline Beecham Ltd Proteína semelhante a proteína especificamente neuroendócrina e adnc codificante
CN101684155A (zh) * 1998-11-06 2010-03-31 苏黎世大学 Nogo基因的核苷酸序列和蛋白序列以及基于其的方法
US7186530B1 (en) 2000-04-07 2007-03-06 Chiron Corporation Protein associated with cell stress response
WO2000060083A1 (en) * 1999-04-08 2000-10-12 Chiron Corporation Novel protein associated with cell stress response
US6566372B1 (en) * 1999-08-27 2003-05-20 Ligand Pharmaceuticals Incorporated Bicyclic androgen and progesterone receptor modulator compounds and methods
US7119165B2 (en) 2000-01-12 2006-10-10 Yale University Nogo receptor-mediated blockade of axonal growth
AU2002211539B2 (en) 2000-10-06 2007-01-25 Biogen Idec Ma Inc. Nogo receptor homologs
AR040778A1 (es) 2002-08-06 2005-04-20 Glaxo Group Ltd Anticuerpos alterados o fragmentos funcionales que se unen a mag (glicoproteina asociada a mielina).
GB0228832D0 (en) 2002-12-10 2003-01-15 Novartis Ag Organic compound
WO2004052389A2 (en) * 2002-12-06 2004-06-24 Singapore General Hospital Pte Ltd. Nogo, caspr, f3 nb-3 useful in the treatment of injury and disease to the central nervous system
GB0306309D0 (en) 2003-03-19 2003-04-23 Glaxo Group Ltd Method of treatment
GB0321997D0 (en) * 2003-09-19 2003-10-22 Novartis Ag Organic compound
WO2007008732A2 (en) 2005-07-07 2007-01-18 Yale University Compositions and methods for suppressing axonal growth inhibition
CN101310183A (zh) 2005-11-16 2008-11-19 诺瓦提斯公司 用于脊髓损伤中抗Nogo-A抗体治疗的生物标记
GB0525662D0 (en) 2005-12-16 2006-01-25 Glaxo Group Ltd Immunoglobulins
CN105611926A (zh) * 2013-10-09 2016-05-25 味之素株式会社 抗疲劳组合物

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0232262A4 (en) 1985-08-15 1989-09-19 Stauffer Chemical Co MICROORGANISM PRODUCING TRYPTOPHANE.
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
CA1341050C (en) * 1988-11-04 2000-07-11 Martin E. Schwab Neurite growth regulatory factors
US5858708A (en) * 1996-08-12 1999-01-12 Bandman; Olga Polynucleotides encoding two novel human neuroendocrine-specific proteins
WO1998017687A2 (en) * 1996-10-25 1998-04-30 Genetics Institute, Inc. Secreted proteins and polynucleotides encoding them
WO1998056804A1 (en) * 1997-06-13 1998-12-17 Human Genome Sciences, Inc. 86 human secreted proteins
US20070224663A1 (en) * 1997-03-07 2007-09-27 Human Genome Sciences, Inc. Human Secreted Proteins
WO1998045435A2 (en) * 1997-04-10 1998-10-15 Genetics Institute, Inc. SECRETED EXPRESSED SEQUENCE TAGS (sESTs)
JP2001518793A (ja) * 1997-04-10 2001-10-16 ジェネティックス・インスチチュート・インコーポレーテッド 分泌発現配列タグ(sESTs)
EP1000146B1 (en) * 1997-08-01 2006-08-30 Serono Genetics Institute S.A. 5'ESTs FOR NON TISSUE SPECIFIC SECRETED PROTEINS
US6222029B1 (en) * 1997-08-01 2001-04-24 Genset 5′ ESTs for secreted proteins expressed in brain
JP2002508182A (ja) * 1997-12-17 2002-03-19 ジェンセット 分泌タンパク質の伸長cDNA
AU1929599A (en) * 1997-12-30 1999-07-19 Chiron Corporation Bone marrow secreted proteins and polynucleotides
US20020072493A1 (en) * 1998-05-19 2002-06-13 Yeda Research And Development Co. Ltd. Activated T cells, nervous system-specific antigens and their uses
PT1098972E (pt) * 1998-07-22 2010-12-14 Smithkline Beecham Ltd Proteína semelhante a proteína especificamente neuroendócrina e adnc codificante
CN101684155A (zh) * 1998-11-06 2010-03-31 苏黎世大学 Nogo基因的核苷酸序列和蛋白序列以及基于其的方法
US7119165B2 (en) * 2000-01-12 2006-10-10 Yale University Nogo receptor-mediated blockade of axonal growth
EP2085181A1 (en) * 2000-07-31 2009-08-05 Ebara Corporation Substrate holding apparatus and substrate polishing apparatus

Also Published As

Publication number Publication date
US20020010324A1 (en) 2002-01-24
US20130196412A1 (en) 2013-08-01
EP1098972A1 (en) 2001-05-16
ATE483021T1 (de) 2010-10-15
DE69942803D1 (de) 2010-11-11
US20070059721A1 (en) 2007-03-15
US20090192294A1 (en) 2009-07-30
EP1098972B1 (en) 2010-09-29
EP2264174A3 (en) 2012-03-07
CY1110961T1 (el) 2015-06-11
WO2000005364A1 (en) 2000-02-03
JP2002522016A (ja) 2002-07-23
EP2264174A2 (en) 2010-12-22
DK1098972T3 (da) 2011-01-03

Similar Documents

Publication Publication Date Title
US20090192294A1 (en) Magi polynucleotides, polypeptides, and antibodies
US20030027232A1 (en) Novel compounds
US6426197B1 (en) Polynucleotides encoding a human potassium channel
US7074899B2 (en) Human EphA9 receptor polypeptides
CA2407959C (en) Human wingless-like gene
US6183990B1 (en) Compounds
CA2404160A1 (en) Identification of new human gaba transporter
US20030096282A1 (en) Gtpase-activating protein 1
US6274380B1 (en) Cacnglike3 polynucleotides and expression systems
WO2001014423A1 (en) Identification of three putative calcium channel vanilrep peptides
JP2004500111A (ja) ヒトサバイビン相互作用タンパク質1(sip−1)
US7193051B2 (en) Histidine phosphatase interacting protein with 240kD
ES2351685T3 (es) Proteína similar a la proteína específica neuroendocrina y adnc codificante.
US7087716B2 (en) Regulator of G protein signalling
US20040086973A1 (en) Identification of a novel cam-kinase II inhibitor
US20030170808A1 (en) Transcription factor carp-2
EP1170365A1 (en) Member of the ion channel family of polypeptides; vanilrep4
US7176285B2 (en) Histidine phosphatase interacting protein with 120kD
US20040054135A1 (en) Novel calcium - binding regulatory subunit
US20060205641A1 (en) VANILREP4 polypeptides and VANILREP4 polynucleotides
US20030108932A1 (en) Ras guanine-nucleotide-exchange factor 1 (nrg1)
US20020004223A1 (en) FHAR1, a new ring finger protein
US20040265818A1 (en) Histidine phosphatase interacting protein with 180kd
US20030207293A1 (en) Cryptic-like secreted protein
US20040171801A1 (en) Nk-2 homeobox transcription factor