PT1621619E - Polipéptidos segregados e transmenbranares e ácidos nucleicos que os codificam - Google Patents

Polipéptidos segregados e transmenbranares e ácidos nucleicos que os codificam Download PDF

Info

Publication number
PT1621619E
PT1621619E PT05011884T PT05011884T PT1621619E PT 1621619 E PT1621619 E PT 1621619E PT 05011884 T PT05011884 T PT 05011884T PT 05011884 T PT05011884 T PT 05011884T PT 1621619 E PT1621619 E PT 1621619E
Authority
PT
Portugal
Prior art keywords
pro
polypeptide
quot
acid sequence
nucleic acid
Prior art date
Application number
PT05011884T
Other languages
English (en)
Inventor
Colin K Watanabe
Timothy A Stewart
Luc Desnoyers
Dan L Eaton
Paul J Godowski
Zemin Zhang
Austin L Gurney
Andrey Goddard
James Pan
William I Wood
Original Assignee
Genentech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genentech Inc filed Critical Genentech Inc
Publication of PT1621619E publication Critical patent/PT1621619E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70578NGF-receptor/TNF-receptor superfamily, e.g. CD27, CD30, CD40, CD95
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Description

ΕΡ 1 621 619/ΡΤ
DESCRIÇÃO "Polipéptidos segregados e transmembranares e ácidos nucleicos que os codificam"
CAMPO DA INVENÇÃO A presente invenção refere-se genericamente à identificação e isolamento de um novo ADN e à produção recombinante de novos polipéptidos.
ANTECEDENTES DA INVENÇÃO
As proteínas extracelulares desempenham papéis importantes, entre outras coisas, na formação, diferenciação e manutenção de organismos pluricelulares. 0 destino de muitas células individuais, e.g., proliferação, migração, diferenciação ou interacção com outras células, é tipicamente governado por informação recebida de outras células e/ou do ambiente imediato. Esta informação é frequentemente transmitida por polipéptidos segregados (por exemplo, factores mitogénicos, factores de sobrevivência, factores citotóxicos, factores de diferenciação, neuropéptidos e hormonas) que são, por sua vez, recebidos e interpretados por diversos receptores celulares ou proteínas ligadas a membranas. Estes polipéptidos segregados ou moléculas de sinalização normalmente passam através da via de secreção celular para atingir o seu local de acção no ambiente extracelular.
As proteínas segregadas têm várias aplicações industriais, incluindo como fármacos, para diagnósticos, como biossensores e biorreactores. A maioria dos fármacos proteínicos disponíveis presentemente, tais como agentes trombolíticos, interferões, interleucinas, eritropoietinas, factores estimulantes de colónias, e várias outras citoquinas, são proteínas secretórias. Os seus receptores, que são proteínas de membrana, possuem igualmente potencial como agentes terapêuticos ou de diagnóstico. Estão a decorrer esforços tanto industriais como académicos, para identificar novas proteínas nativas segregadas. Muitos esforços focaram-se na pesquisa de bibliotecas de ADN recombinante de mamífero para identificar as sequências de codificação para novas 2 ΕΡ 1 621 619/ΡΤ proteínas segregadas. Exemplos de métodos e técnicas de pesquisa estão descritos na literatura [veja-se, por exemplo, Klein et al., Proc. Natl. Acad. Sei. 93:7108-7113 (1996); Patente U.S. 5,536,637)].
As proteínas ligadas a membranas e receptores podem desempenhar importantes papéis, entre outras coisas, na formação, diferenciação e manutenção de organismos pluricelulares. O destino de muitas células individuais, e.g., proliferação, migração, diferenciação ou interaeção com outras células, é tipicamente governado pela informação recebida de outras células e/ou do ambiente imediato. Esta informação é frequentemente transmitida por polipéptidos segregados (por exemplo, factores mitogénicos, factores de sobrevivência, factores citotóxicos, factores de diferenciação, neuropéptidos, e hormonas) que são, por sua vez, recebidos e interpretados por diversos receptores celulares ou proteínas ligadas a membranas. Estas proteínas ligadas a membranas e receptores celulares incluem; mas não lhes estão limitados, receptores de citoquinas, quinases receptoras, fosfatases receptoras, receptores envolvidos em interaeções célula-célula, e moléculas de adesão celular como as selectinas e as integrinas. Por exemplo, a transdução de sinais que regulam o crescimento e a diferenciação celulares é regulada em parte pela fosforilação de várias proteínas celulares. As proteína-tirosina-quinases, enzimas que catalisam esse processo, podem também actuar como receptores de factores do crescimento. Os exemplos incluem o receptor do factor de crescimento de fibroblastos e o receptor do factor de crescimento dos nervos.
As proteínas ligadas a membranas e moléculas receptoras possuem várias aplicações industriais, incluindo como agentes farmacêuticos e de diagnóstico. As imunoadesinas receptoras, por exemplo, podem ser empregues como agentes terapêuticos para bloquear as interaeções receptor-ligando. As proteínas ligadas a membranas podem também ser empregues para a pesquisa de potenciais inibidores peptídicos ou de molécula pequena da interaeção receptor/ligando relevante.
Estão a decorrer esforços, tanto industriais como académicos, para identificar novas proteínas nativas ligadas a membranas ou receptoras. Muitos esforços estão focados na 3 ΕΡ 1 621 619/ΡΤ pesquisa de bibliotecas de ADN recombinante de mamifero para identificar as sequências de codificação para novas proteínas ligadas a membranas ou receptores. PRO4405
Estão a decorrer esforços, tanto industriais como académicos, para identificar novas proteínas nativas receptoras transmembranares. Muitos esforços estão focados na pesquisa de bibliotecas de ADN recombinante de mamífero para identificar as sequências de codificação para novas proteínas receptoras transmembranares. Descreve-se aqui a identificação e a caracterização de novos polipéptidos transmembranares, aqui designados por polipéptidos PRO4405.
SUMÁRIO DA INVENÇÃO PRO4405
Identificou-se um clone de ADNc (DNA84920-2614), que codifica um novo polipéptido, designado no presente pedido de patente por "PRO4405".
Numa concretização, a invenção proporciona uma molécula de ácido nucleico isolada como definida nas reivindicações, compreendendo ADN que codifica um polipéptido PRO4405.
Num aspecto, o ácido nucleico isolado compreende ADN possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 85% de identidade de sequência, mais preferivelmente pelo menos cerca de 90% de identidade de sequência, o mais preferivelmente pelo menos cerca de 95% de identidade de sequência com a sequência de ácido nucleico apresentada na Figura 1 (SEQ ID NO:3), ou a sua sequência de codificação de comprimento completo.
Noutro aspecto, a invenção refere-se a uma molécula de ácido nucleico isolada que codifica um polipéptido PRO4405 compreendendo ADN que híbrida com o complemento do ácido nucleico entre cerca dos resíduos 181 e cerca de 1008, inclusive, da Figura 1 (SEQ ID NO:3), sob condições rigorosas de hibridação e lavagem. 4 ΕΡ 1 621 619/ΡΤ
Num outro aspecto, a invenção refere-se a uma molécula de ácido nucleico isolada compreendendo ADN possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 85% de identidade de sequência, mais preferivelmente pelo menos cerca de 90% de identidade de sequência, o mais preferivelmente pelo menos cerca de 95% de identidade de sequência com (a) uma molécula de ADN que codifica o mesmo polipéptido maduro que é codificado pelo ADNc da proteína humana na ATCC com o Depósito N°. 203966 (DNA84920-2614), ou (b) o complemento da molécula de ADN de (a). Numa concretização preferida, o ácido nucleico compreende um ADN que codifica o mesmo polipéptido maduro que é codificado pelo ADNc da proteína humana na ATCC com o Depósito N°. 203966 (DNA84920-2614).
Em ainda outro aspecto, a invenção refere-se a uma molécula de ácido nucleico isolada compreendendo (a) ADN que codifica um polipéptido possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 85% de identidade de sequência, mais preferivelmente pelo menos cerca de 90% de identidade de sequência, o mais preferivelmente pelo menos cerca de 95% de identidade de sequência, com a sequência de resíduos de aminoácido de cerca de 35 a cerca de 310, inclusive, da Figura 2 (SEQ ID NO:4), ou o complemento do ADN de (a).
Num aspecto específico, a invenção proporciona uma molécula de ácido nucleico isolada compreendendo ADN que codifica um polipéptido PRO4405, com ou sem a sequência de sinal N-terminal e/ou a metionina de iniciação, e suas variantes solúveis (i.e. domínio transmembranar eliminado ou inactivado), ou é complementar a essa molécula de ácido nucleico de codificação. O péptido de sinal foi identificado por tentativas como prolongando-se desde a posição de aminoácido 1 até cerca da posição de aminoácido 34 na sequência da Figura 2 (SEQ ID NO:4). O domínio transmembranar foi identificado por tentativas como prolongando-se desde cerca da posição de aminoácido 58 até cerca da posição de aminoácido 76 na sequência de aminoácidos de PRO4405 (Figura 2, SEQ ID NO: 4) e pode ser um domínio transmembranar de tipo II. 5 ΕΡ 1 621 619/ΡΤ
Noutra concretização, como definido nas reivindicações, a invenção proporciona polipéptido PRO4405 isolado codificado por qualquer das sequências de ácido nucleico isoladas atrás definidas.
Num aspecto especifico, a invenção proporciona o polipéptido PRO4405 de sequência nativa isolado que, numa concretização, inclui uma sequência de aminoácidos compreendendo os residuos 35 a 310 da Figura 2 (SEQ ID NO:4).
Noutro aspecto, a invenção refere-se a um polipéptido PRO4405 isolado, compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 85% de identidade de sequência, mais preferivelmente pelo menos cerca de 90% de identidade de sequência, o mais preferivelmente pelo menos cerca de 95% de identidade de sequência, com a sequência de residuos de aminoácido de 35 a cerca de 310, inclusive, da Figura 2 (SEQ ID NO:4).
Em ainda outro aspecto, a invenção refere-se a um polipéptido PRO4405 isolado, compreendendo a sequência de resíduos de aminoácido de 35 a cerca de 310, inclusive, da Figura 2 (SEQ ID NO:4).
Concretizações Adicionais
Noutras concretizações da presente invenção, a invenção proporciona vectores compreendendo ADN que codifica qualquer dos polipéptidos aqui descritos. São igualmente proporcionadas células hospedeiras compreendendo qualquer destes vectores. A titulo de exemplo, as células hospedeiras podem ser células de CHO, E. coli ou de levedura. É ainda proporcionado um processo para produzir qualquer dos polipéptidos aqui descritos que compreende a cultura de células hospedeiras sob condições adequadas para a expressão do polipéptido desejado e a recuperação do polipéptido desejado a partir da cultura celular.
Noutra concretização, a invenção proporciona moléculas quiméricas compreendendo qualquer dos polipéptidos aqui 6 ΕΡ 1 621 619/ΡΤ descritos fundido com um polipéptido ou uma sequência de aminoácidos heterólogos. Um exemplo de tais moléculas quiméricas compreende qualquer dos polipéptidos aqui descritos fundido com uma sequência de marcador epitópico ou uma região Fc de uma imunoglobulina.
Noutra concretização, a invenção proporciona um anticorpo que se liga especificamente a qualquer dos polipéptidos aqui descritos, atrás e adiante. Opcionalmente, o anticorpo é um anticorpo monoclonal, um anticorpo humanizado, um fragmento de anticorpo ou um anticorpo de cadeia única.
Noutras concretizações, a invenção proporciona uma molécula de ácido nucleico isolada compreendendo uma sequência de nucleótidos que codifica um polipéptido PRO.
Num aspecto, a molécula de ácido nucleico isolada compreende uma sequência de nucleótidos possuindo pelo menos cerca de 80% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 81% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 82% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 83% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 84% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 85% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 86% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 87% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 88% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 89% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 90% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 91% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 92% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 93% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 94% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 95% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca 7 ΕΡ 1 621 619/ΡΤ de 96% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 97% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 98% de identidade de sequência de ácido nucleico e alternativamente pelo menos cerca de 99% de identidade de sequência de ácido nucleico, com a sequência de ácido nucleico da Figura 1 (SEQ ID N0:3) ou a sua sequência de codificação de comprimento completo.
Noutro aspecto, a invenção refere-se a uma molécula de ácido nucleico isolada compreende uma sequência de nucleótidos possuindo pelo menos cerca de 80% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 81% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 82% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 83% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 84% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 85% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 86% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 87% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 88% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 89% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 90% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 91% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 92% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 93% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 94% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 95% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 96% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 97% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 98% de identidade de sequência de ácido nucleico e alternativamente pelo menos cerca de 99% de identidade de sequência de ácido nucleico, com o ADN da proteína humana depositado na ATCC em ATCC 203966. 8 ΕΡ 1 621 619/ΡΤ
Outro aspecto da invenção proporciona uma molécula de ácido nucleico isolada compreendendo uma sequência nucleotídica que codifica um polipéptido PRO que tem o dominio transmembranar eliminado ou o dominio transmembranar inactivado, ou é complementar a essa sequência nucleotídica de codificação, em que o(s) dominio(s) transmembranar(es) desse polipéptido são aqui revelados. Portanto, estão contemplados os domínios extracelulares solúveis dos polipéptidos PRO aqui descritos.
Noutra concretização, a invenção proporciona polipéptido PRO isolado codificado por qualquer das sequências de ácido nucleico isoladas atrás identificadas.
Num determinado aspecto, a invenção refere-se a um polipéptido PRO isolado, compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 80% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 81% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 82% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 83% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 84% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 85% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 86% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 87% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 88% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 89% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 90% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 91% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 92% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 93% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 94% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 95% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 96% de identidade de 9 ΕΡ 1 621 619/ΡΤ sequência de aminoácidos, alternativamente pelo menos cerca de 97% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 98% de identidade de sequência de aminoácidos e alternativamente pelo menos cerca de 99% de identidade de sequência de aminoácidos, com um polipéptido PRO possuindo uma sequência de aminoácidos de comprimento completo, como aqui revelado, uma sequência de aminoácidos a que falta o péptido de sinal, como aqui revelado, um domínio extracelular de uma proteína transmembranar, com ou sem o péptido e sinal, como aqui revelado, ou qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo, como aqui revelado.
Num outro aspecto, a invenção refere-se a um polipéptido PRO isolado compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 80% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 81% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 82% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 83% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 84% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 85% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 86% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 87% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 88% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 89% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 90% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 91% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 92% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 93% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 94% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 95% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 96% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 10 ΕΡ 1 621 619/ΡΤ 97% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 98% de identidade de sequência de aminoácidos e alternativamente pelo menos cerca de 99% de identidade de sequência de aminoácidos, com uma sequência de aminoácidos codificada por qualquer dos ADNc de proteina humana depositados na ATCC, como aqui revelado.
Num aspecto especifico, a invenção proporciona um polipéptido PRO isolado sem a sequência de sinal N-terminal e/ou a metionina de iniciação que é codificado por uma sequência de nucleótidos que codifica uma tal sequência de aminoácidos como aqui descrito acima. Os processos para a produção dos mesmos são aqui também descritos, em que esses processos compreendem a cultura de uma célula hospedeira compreendendo um vector que compreende a molécula de ácido nucleico de codificação apropriada sob condições adequadas para a expressão do polipéptido PRO e a recuperação do polipéptido PRO a partir da cultura celular.
Outro aspecto da invenção proporciona um polipéptido PRO isolado que tem o domínio transmembranar eliminado ou o domínio transmembranar inactivado. Estão igualmente aqui descritos processos para a sua produção, em que esses processos compreendem a cultura de uma célula hospedeira compreendendo um vector que compreende a molécula de ácido nucleico de codificação apropriada, sob condições adequadas para a expressão do polipéptido PRO e a recuperação do polipéptido PRO a partir da cultura celular.
Uma utilização da invenção refere-se a um método de identificação de agonistas ou antagonistas de um polipéptido PRO que compreende o contacto do polipéptido PRO com uma molécula candidata e a monitoração da actividade biológica mediada pelo referido polipéptido PRO. Preferivelmente, o polipéptido PRO é um polipéptido PRO nativo.
Uma aplicação da invenção refere-se a uma composição de matéria compreendendo um polipéptido PRO, em combinação com um transportador. Opcionalmente, o transportador é um transportador farmaceuticamente aceitável. 11 ΕΡ 1 621 619/ΡΤ
Outra concretização da presente invenção refere-se à utilização de um polipéptido PRO para a preparação de um medicamento útil no tratamento de uma condição que é responsiva ao polipéptido PRO.
BREVE DESCRIÇÃO DOS DESENHOS A Figura 1 mostra uma sequência de nucleótidos (SEQ ID NO: 3) de uma sequência de ADNc de PRO4405 nativa, em que SEQ ID NO:3 é um clone aqui designado por "DNA84920-2614". A Figura 2 mostra a sequência de aminoácidos (SEQ ID NO:4) derivada da sequência de codificação de SEQ ID NO:3 mostrada na Figura 1. DESCRIÇÃO DETALHADA DAS CONCRETIZAÇÕES PREFERIDAS I. Definições
Os termos "polipéptido PRO" e "PRO", como são aqui utilizados e quando imediatamente seguidos por uma designação numérica, referem-se a vários polipéptidos, em que a designação completa (i.e., PRO/número) se refere a sequências de polipéptidos especificas, como aqui descrito. Os termos "polipéptido PRO/número" e "PRO/número" em que o termo "número" é proporcionado como uma designação numérica, como aqui se utilizam, abrangem polipéptidos de sequência nativa e polipéptidos variantes (que serão aqui ainda definidos). Os polipéptidos PRO aqui descritos podem ser isolados a partir de uma variedade de fontes, tais como de tipos de tecidos humanos ou de outra fonte, ou preparados por métodos recombinantes ou sintéticos.
Um "polipéptido PRO de sequência nativa" compreende um polipéptido possuindo a mesma sequência de aminoácidos que o polipéptido PRO derivado da natureza correspondente. Estes polipéptidos PRO de sequência nativa podem ser isolados da natureza ou podem ser produzidos por meios recombinantes ou sintéticos. A expressão "polipéptido PRO de sequência nativa" abrange especificamente formas de ocorrência natural truncadas ou segregadas do polipéptido PRO especifico (e.g., uma sequência de domínio extracelular), formas variantes de 12 ΕΡ 1 621 619/ΡΤ ocorrência natural (e.g., formas originárias de splicing alternativo) e variantes alélicas de ocorrência natural do polipéptido. Em várias concretizações da invenção, os polipéptidos PRO de sequência nativa aqui revelados são polipéptidos de sequência nativa maduros ou de comprimento completo, compreendendo as sequências de aminoácidos de comprimento completo mostradas nas figuras em anexo. Os codões de inicio e de paragem estão mostrados em caracteres a negrito e sublinhados nas figuras. Contudo, embora o polipéptido PRO descrito nas figuras anexas esteja mostrado a começar com residuos de metionina aqui designados como posição de aminoácido 1 nas figuras, é conceptivel e possível que outros resíduos de metionina localizados quer a montante quer a jusante da posição de aminoácido 1 nas figuras possam ser empregues como resíduo de aminoácido de partida para os polipéptidos PRO. 0 "domínio extracelular" ou "ECD" de polipéptido PRO referem-se a uma forma do polipéptido PRO que está essencialmente isenta dos domínios transmembranares e citoplasmáticos. Vulgarmente, um ECD de polipéptido PRO terá menos de 1% destes domínios transmembranares e/ou citoplasmáticos e preferivelmente, terá menos de 0,5% destes domínios. Entender-se-á que quaisquer domínios transmembranares identificados para os polipéptidos PRO da presente invenção são identificados segundo critérios normalmente empregues na especialidade para a identificação deste tipo de domínios hidrófobos. Os limites exactos de um domínio transmembranar podem variar mas mais provavelmente em não mais de cerca de 5 aminoácidos em cada extremidade do domínio como inicialmente aqui identificado. Opcionalmente, portanto, um domínio extracelular de um polipéptido PRO que pode conter de cerca de 5 ou menos aminoácidos de cada lado do limite do domínio transmembranar/domínio extracelular como identificado nos Exemplos ou na descrição e estes polipéptidos, com ou sem o péptido de sinal associado, e um ácido nucleico que o codifica, estão contemplados pela presente invenção. A localização aproximada dos "péptidos de sinal" dos vários polipéptidos PRO aqui descritos está mostrada no presente fascículo e/ou nas figuras anexas. Note-se, contudo, 13 ΕΡ 1 621 619/ΡΤ que ο limite C-terminal de um péptido de sinal pode variar, mas o mais provavelmente em não mais do que cerca de 5 aminoácidos de cada lado do limite C-terminal do péptido de sinal como inicialmente aqui identificado, em que o limite C-terminal do péptido de sinal pode ser identificado segundo critérios normalmente empregues na especialidade para a identificação desse tipo de elemento de sequência de aminoácidos (e.g., Nielsen et ai., Prot. Enq. 10:1-6 (1997) e von Heinje et al., Nucl. Acids. Res. 14:4683-4690 (1986)). Além disso, é também reconhecido que, em alguns casos, a clivagem de uma sequência de sinal de um polipéptido segregado não é inteiramente uniforme, resultando em mais do que uma espécie segregadas. Estes polipéptidos maduros, em que o péptido de sinal é clivado em não mais do que cerca de 5 aminoácidos de cada lado do limite C-terminal do péptido de sinal como aqui identificado, e os polinucleótidos que os codificam, estão contemplados pela presente invenção.
Uma "variante de polipéptido PRO" ou "polipéptido PRO variante" significam um polipéptido PRO activo, como definido atrás ou adiante, possuindo pelo menos cerca de 80% de identidade de sequência de aminoácidos com uma sequência de um polipéptido PRO de sequência nativa de comprimento completo, como aqui revelado, uma sequência de um polipéptido PRO a que falta o péptido de sinal, como aqui revelado, um domínio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui revelado, ou qualquer outro fragmento de uma sequência de um polipéptido PRO de comprimento completo, como aqui revelado. Estas variantes de polipéptido PRO incluem, por exemplo, polipéptidos PRO em que um ou mais resíduos de aminoácido são adicionados, ou eliminados, nos terminais N ou C da sequência de aminoácidos nativa de comprimento completo. Vulgarmente, uma variante de polipéptido PRO terá pelo menos cerca de 80% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 81% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 82% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 83% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 84% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 85% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 14 ΕΡ 1 621 619/ΡΤ 86% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 87% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 88% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 89% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 90% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 91% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 92% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 93% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 94% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 95% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 96% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 97% de identidade de sequência de aminoácidos, alternativamente pelo menos cerca de 98% de identidade de sequência de aminoácidos e alternativamente pelo menos cerca de 99% de identidade de sequência de aminoácidos, com uma sequência de um polipéptido PRO de sequência nativa de comprimento completo, como aqui revelado, uma sequência de polipéptido PRO a que falta o péptido de sinal, como aqui revelado, um dominio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui revelado, ou qualquer outro fragmento especificamente definido de uma sequência de um polipéptido PRO de comprimento completo como aqui revelado. Vulgarmente, polipéptidos PRO variantes têm pelo menos cerca de 10 aminoácidos de comprimento, alternativamente pelo menos cerca de 20 aminoácidos de comprimento, alternativamente pelo menos cerca de 30 aminoácidos de comprimento, alternativamente pelo menos cerca de 40 aminoácidos de comprimento, alternativamente pelo menos cerca de 50 aminoácidos de comprimento, alternativamente pelo menos cerca de 60 aminoácidos de comprimento, alternativamente pelo menos cerca de 70 aminoácidos de comprimento, alternativamente pelo menos cerca de 80 aminoácidos de comprimento, alternativamente pelo menos cerca de 90 aminoácidos de comprimento, alternativamente pelo menos cerca de 100 aminoácidos de comprimento, alternativamente pelo menos cerca de 150 aminoácidos de comprimento, alternativamente pelo menos 15 ΕΡ 1 621 619/ΡΤ cerca de 200 aminoácidos de comprimento, alternativamente pelo menos cerca de 300 aminoácidos de comprimento, ou mais. A "percentagem (%) de identidade de sequência de aminoácidos" em relação a sequências de polipéptido PRO aqui identificadas define-se como a percentagem de resíduos de aminoácido numa sequência candidata que são idênticos aos residuos de aminoácido na sequência do polipéptido PRO específico, após alinhamento das sequências e introdução de hiatos, se necessário, para se atingir a percentagem máxima de identidade de sequência, e não considerando quaisquer substituições conservativas como parte da identidade de sequência. O alinhamento com o fim de determinar a percentagem de identidade de sequência de aminoácidos pode ser conseguido de várias maneiras que são do conhecimento dos peritos na especialidade, por exemplo, utilizando programas de computador disponíveis publicamente tais como os programas BLAST, BLAST-2, ALIGN ou Megalign (DNASTAR). Os peritos na especialidade podem determinar os parâmetros apropriados para medir o alinhamento, incluindo quaisquer algoritmos necessários para atingir o alinhamento máximo ao longo da totalidade do comprimento das sequências a comparar. Para os presentes fins, contudo, os valores de % de identidade de sequência de aminoácidos são gerados utilizando o programa de computador para comparação de sequências ALIGN-2, sendo que o código de fontes completo para o programa ALIGN-2 é proporcionado na Tabela 1 adiante. O programa de computador para comparação de sequências ALIGN-2 é da autoria de Genentech, Inc. e o código de fontes mostrado na Tabela 1 adiante foi depositado com a documentação para o utilizador no U.S. Copyright Office, Washington D.C., 20559, onde está registado com o U.S. Copyright Registration N°. TXU510087. O programa ALIGN-2 está disponível ao público através da Genentech, Inc., South San Francisco, Califórnia ou pode ser compilado a partir do código de fontes proporcionado na Tabela 1 adiante. O programa ALIGN-2 deve ser compilado para utilização num sistema operativo UNIX, preferivelmente digital UNIX V4.0D. Todos os parâmetros de comparação de sequências são estabelecidos pelo programa ALIGN-2 e não variam.
Em situações em que se emprega o ALIGN-2 para comparações de sequências de aminoácidos, a % de identidade de sequência 16 ΕΡ 1 621 619/ΡΤ de aminoácidos de, ou entre, uma determinada sequência de aminoácidos A com, contra, ou e, uma determinada sequência de aminoácidos B (que pode alternativamente ser fraseado como uma determinada sequência de aminoácidos A que possui ou compreende uma determinada % de identidade de sequência de aminoácidos com, ou contra, uma determinada sequência de aminoácidos B) é calculada como se segue:
100 vezes a fracção X/Y onde X é o número de residuos de aminoácido classificados como coincidências idênticas pelo programa para alinhamento de sequências ALIGN-2 no alinhamento do programa de A e B, e onde Y é o número total de resíduos de aminoácido em B. Notar-se-á que quando o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de identidade de sequência de aminoácidos entre A e B não será igual à % de identidade de sequência de aminoácidos entre B e A. Como exemplos de cálculos da % de identidade de sequência de aminoácidos utilizando este método, as Tabelas 2 e 3 demonstram como calcular a % de identidade de sequência de aminoácidos da sequência de aminoácidos designada "Proteína de Comparação" com a sequência de aminoácidos designada "PRO", em que "PRO" representa a sequência de aminoácidos de um polipéptido PRO hipotético de interesse, "Proteína de Comparação" representa a sequência de aminoácidos de um polipéptido contra o qual o polipéptido "PRO" de interesse está a ser comparado, e "X, "Y" e "Z" representam, cada um, diferentes resíduos de aminoácido hipotéticos. A menos que especificamente afirmado de outro modo, todos os valores de % de identidade de sequência de aminoácidos aqui utilizados são obtidos como descrito no parágrafo imediatamente anterior utilizando o programa de computador ALIGN-2. Contudo, os valores de % de identidade de sequência de aminoácidos podem também ser obtidos como descrito adiante utilizando o programa de computador wu-BLAST-2 (Altschul et al., Methods in Enzymology 266:460-480 (1996)). A maioria dos parâmetros de pesquisa do WU-BLAST-2 são regulados para os valores predeterminados. Os que não são regulados para os valores predeterminados, i.e., os parâmetros ajustáveis, são regulados com os seguintes valores: “overlap span" = 1, 17 ΕΡ 1 621 619/ΡΤ “overlâp fraction" = 0,125, "word. threshold" (T) = 11, e "scoring matrix" = BLOSUM62. Quando é empregue o WU-BLAST-2, um valor de % de identidade de sequência de aminoácidos é determinado dividindo (a) o número de residuos de aminoácido com coincidência idêntica entre a sequência de aminoácidos do polipéptido PRO de interesse possuindo uma sequência derivada do polipéptido PRO nativo e a sequência de aminoácidos de comparação de interesse (í.e., a sequência contra a qual o polipéptido PRO de interesse está a ser comparado que pode ser um polipéptido PRO variante) como determinado por WU-BLAST-2, por (b) o número total de residuos de aminoácido do polipéptido PRO de interesse. Por exemplo, na afirmação "um polipéptido compreendendo uma sequência de aminoácidos A que possui, ou possuindo, pelo menos 80% de identidade de sequência de aminoácidos com a sequência de aminoácidos B", a sequência de aminoácidos A é a sequência de aminoácidos de comparação de interesse e a sequência de aminoácidos B é a sequência de aminoácidos do polipéptido PRO de interesse. A percentagem de identidade de sequência de aminoácidos pode também ser determinada utilizando o programa para comparação de sequências NCBI-BLAST2 (Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997)). O programa para comparação de sequências NCBI-BLAST2 pode ser descarregado de http://www.ncbi.nlm.nih.gov ou obtido de outro modo junto do National Institute of Health, Bethesda, MD. O NCBI-BLAST2 utiliza vários parâmetros de pesquisa, em que todos os esses parâmetros de pesquisa são regulados para os valores predeterminados incluindo, por exemplo, “unmask" = “yes", “strand" = “all", "expected occurrences" = 10, "minimum low complexity lenght” = 15/5, "multi-pass e-value" = 0,01, "constant for multi-pass" = 25, “dropoff for final gapped alignment" = 25 e "scoring matrix" = BLOSUM62.
Em situações em que se emprega NCBI-BLAST2 para as comparações de sequências de aminoácidos, a % de identidade de sequência de aminoácidos de, ou entre, uma determinada sequência de aminoácidos A com, ou contra, ou e, uma determinada sequência de aminoácidos B (que pode alternativamente ser fraseado como uma determinada sequência de aminoácidos A que possui ou compreende uma determinada % de identidade de sequência de aminoácidos com, ou contra uma 18 ΕΡ 1 621 619/ΡΤ determinada sequência de aminoácidos B), é calculada como se segue:
100 vezes a fracção X/Y onde X é o número de resíduos de aminoácido classificados como coincidências idênticas pelo programa para alinhamento de sequências NCBI-BLAST2 no alinhamento do programa de A e B, e onde Y é o número total de resíduos de aminoácido em B. Notar-se-á que quando o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de identidade de sequência de aminoácidos entre A e B não será igual à % de identidade de sequência de aminoácidos entre B e A. "Polinucleótido variante de PRO" ou "sequência de ácido nucleico variante de PRO" significam uma molécula de ácido nucleico que codifica um polipéptido PRO activo, como definido adiante, e que possui pelo menos cerca de 80% de identidade de sequência de ácido nucleico com uma sequência de ácido nucleico que codifica uma sequência de polipéptido PRO de sequência nativa de comprimento completo, como aqui revelado, uma sequência de polipéptido PRO de sequência nativa de comprimento completo a que falta o péptido de sinal, como aqui revelado, um domínio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui revelado, ou qualquer outro fragmento de uma sequência de polipéptido PRO de comprimento completo, como aqui revelado. Vulgarmente, um polinucleótido variante de PRO terá pelo menos cerca de 80% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 81% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 82% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 83% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 84% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 85% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 86% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 87% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 88% de identidade de sequência de ácido nucleico, alternativamente 19 ΕΡ 1 621 619/ΡΤ pelo menos cerca de 89% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 90% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 91% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 92% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 93% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 94% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 95% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 96% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 97% de identidade de sequência de ácido nucleico, alternativamente pelo menos cerca de 98% de identidade de sequência de ácido nucleico e alternativamente pelo menos cerca de 99% de identidade de sequência de ácido nucleico, com uma sequência de ácido nucleico que codifica uma sequência de um polipéptido PRO de sequência nativa de comprimento completo, como aqui revelado, uma sequência de um polipéptido PRO de sequência nativa de comprimento completo a que falta o péptido de sinal, como aqui revelado, um domínio extracelular de um polipéptido PRO, com ou sem a sequência de sinal, como aqui revelado, ou qualquer outro fragmento de uma sequência de polipéptido PRO de comprimento completo, como aqui revelado. As variantes não abrangem a sequência de nucleótidos nativa.
Vulgarmente, os polinucleótidos variantes de PRO têm pelo menos cerca de 30 nucleótidos de comprimento, alternativamente pelo menos cerca de 60 nucleótidos de comprimento, alternativamente pelo menos cerca de 90 nucleótidos de comprimento, alternativamente pelo menos cerca de 120 nucleótidos de comprimento, alternativamente pelo menos cerca de 150 nucleótidos de comprimento, alternativamente pelo menos cerca de 180 nucleótidos de comprimento, alternativamente pelo menos cerca de 210 nucleótidos de comprimento, alternativamente pelo menos cerca de 240 nucleótidos de comprimento, alternativamente pelo menos cerca de 270 nucleótidos de comprimento, alternativamente pelo menos cerca de 300 nucleótidos de comprimento, alternativamente pelo menos cerca de 450 nucleótidos de comprimento, alternativamente pelo menos cerca de 20 ΕΡ 1 621 619/ΡΤ 600 nucleótidos de comprimento, alternativamente pelo menos cerca de 900 nucleótidos de comprimento, ou mais. A "percentagem (%) de identidade de sequência de ácido nucleico" em relação a sequências de ácido nucleico que codificam PRO aqui identificadas, define-se como a percentagem de nucleótidos numa sequência candidata que são idênticos aos nucleótidos na sequência de ácido nucleico de PRO de interesse, após alinhamento das sequências e introdução de hiatos, se necessário, para atingir a percentagem máxima de identidade de sequência. O alinhamento com o fim de determinar a percentagem de identidade de sequência de ácido nucleico pode ser conseguido de várias maneiras que são do conhecimento dos peritos na especialidade, por exemplo, utilizando os programas de computador publicamente disponíveis tais como os programas BLAST, BLAST-2, ALIGN ou Megalign (DNASTAR). Para os presentes fins, contudo, os valores de % de identidade de sequência de ácido nucleico são gerados utilizando o programa de computador para comparação de sequências ALIGN-2, sendo que o código de fontes completo para o programa ALIGN-2 proporcionado na Tabela I adiante. O programa de computador para comparação de sequências ALIGN-2 é da autoria de Genentech, Inc. e o código de fontes mostrado na Tabela 1 adiante foi depositado com documentação para o utilizador no U.S. Copyright Office, Washington D.C., 20559, onde está
registado com U.S. Copyright Registration No. TXU510087. O programa ALIGN-2 está disponível ao público através da Genentech, Inc., South San Francisco, Califórnia ou pode ser compilado a partir do código de fontes proporcionado na Tabela 1 adiante. O programa ALIGN-2 deve ser compilado para utilização num sistema operativo UNIX, preferivelmente digital UNIX V4.0D. Todos os parâmetros de comparação de sequências são estabelecidos pelo programa ALIGN-2 e não variam.
Em situações onde se emprega o ALIGN-2 para comparações de sequências de ácido nucleico, a % de identidade de sequência de ácido nucleico de, ou entre, uma determinada sequência de ácido nucleico C com, ou contra, ou e, uma determinada sequência de ácido nucleico D (que pode ser alternativamente fraseado como uma determinada sequência de ácido nucleico C que possui ou compreende uma determinada % de identidade de sequência de ácido nucleico com, ou contra, uma 21 ΕΡ 1 621 619/ΡΤ determinada sequência de ácido nucleico D) é calculada como se segue: 100 vezes a fracção w/z onde W é o número de nucleótidos classificados como coincidências idênticas pelo programa de alinhamento de sequências ALIGN-2 nesse alinhamento do programa entre C e D, e onde z é o número total de nucleótidos em D. Notar-se-á que quando o comprimento da sequência de ácido nucleico C não é igual ao comprimento da sequência de ácido nucleico D, a % de identidade de sequência de ácido nucleico entre C e D não será igual à % de identidade de sequência de ácido nucleico entre D e C. Como exemplos de cálculos da % de identidade de sequência de ácido nucleico, as Tabelas 4 e 5, demonstram como calcular a % de identidade de sequência de ácido nucleico da sequência de ácido nucleico designada "ADN de Comparação" com a sequência de ácido nucleico designada "ADN-PRO", em que "ADN-PRO" representa uma sequência de ácido nucleico que codifica PRO de interesse hipotética, "ADN de Comparação" representa a sequência de nucleótidos de uma molécula de ácido nucleico contra a qual a molécula de ácido nucleico "ADN-PRO" de interesse está a ser comparada, e "N", "L" e "V" representam, cada um, diferentes nucleótidos hipotéticos. A menos que especificamente afirmado de outro modo, todos os valores de % de identidade de sequência de ácido nucleico aqui utilizados são obtidos como descrito no parágrafo imediatamente anterior utilizando o programa de computador ALIGN-2. Contudo, os valores de % de identidade de sequência de ácido nucleico podem também ser obtidos como descrito adiante utilizando o programa de computador WU-BLAST-2 (Altschul et al., Methods in Enzymology 266:460-480 (1996)). A maioria dos parâmetros de pesquisa de WU-BLAST-2 são regulados para os valores predeterminados. Os que não são regulados para valores predeterminados, i.e., os parâmetros ajustáveis, são regulados para os valores que se seguem: "overlap span" = 1, "overlap fraction" = 0,125, “word threshold" (T) = 11, e "scoring matrix" = BLOSUM62. Quando se emprega o WU-BLAST-2, um valor de % de identidade de sequência de ácido nucleico é determinado dividindo (a) o número de nucleótidos com coincidência idêntica entre a sequência de ácido nucleico da 22 ΕΡ 1 621 619/ΡΤ molécula de ácido nucleico que codifica o polipéptido PRO de interesse possuindo uma sequência derivada da sequência de ácido nucleico que codifica o polipéptido PRO nativa e a molécula de ácido nucleico de comparação de interesse (i.e., a sequência contra a qual a molécula de ácido nucleico que codifica o polipéptido PRO de interesse está a ser comparada que pode ser um polinucleótido PRO variante) como determinado por WU-BLAST-2, por (b) o número total de nucleótidos da molécula de ácido nucleico que codifica o polipéptido PRO de interesse. Por exemplo, na afirmação "uma molécula de ácido nucleico isolada compreendendo uma sequência de ácido nucleico A que possui ou possuindo pelo menos 80% de identidade de sequência de ácido nucleico com a sequência de ácido nucleico B", a sequência de ácido nucleico A é a molécula de ácido nucleico de comparação de interesse e a sequência de ácido nucleico B é a sequência de ácido nucleico da molécula de ácido nucleico que codifica o polipéptido PRO de interesse. A percentagem de identidade de sequência de ácido nucleico pode também ser determinada utilizando o programa para comparação de sequências NCBI-BLAST2 (Altschul. et al., Nucleic Acids Res. 25:3389-3402 (1997)). O programa para comparação de sequências NCBI-BLAST2 pode ser descarregado de http://www.ncbi.nlm.nih.gov ou de outro modo obtido junto do National Institute of Health, Bethesda, MD. O NCBI-BLAST2 utiliza vários parâmetros de pesquisa, em que todos esses parâmetros de pesquisa são regulados para valores predeterminados incluindo, por exemplo, “unmask" = “yes", “strand" = “all", “expected occurrences" = 10, "minimum low complexity lenght" = 15/5, "multi-pass e-value" = 0,01, "constant for multi-pass" = 25, "dropoff for final gapped alignment" = 25 e “scoring matrix" = BLOSUM62.
Em situações em que se emprega o NCBI-BLAST2 para comparações de sequências, a % de identidade de sequência de ácido nucleico de, ou entre, uma determinada sequência de ácido nucleico C e, com, ou contra, uma determinada sequência de ácido nucleico D (que pode alternativamente ser fraseado como uma determinada sequência de ácido nucleico C que possui ou compreende uma determinada % de identidade de sequência de 23 ΕΡ 1 621 619/ΡΤ ácido nucleico com, ou contra, uma determinada sequência de ácido nucleico D) é calculada como se segue: 100 vezes a fracção W/z onde W é o número de nucleótidos classificados como coincidências idênticas pelo programa para alinhamento de sequências NCBI-BLAST2 nesse alinhamento do programa entre C e D, e onde Z é o número total de nucleótidos em D. Notar-se-á que quando o comprimento da sequência de ácido nucleico C não é igual ao comprimento da sequência de ácido nucleico D, a % de identidade de sequência de ácido nucleico entre C e D não será igual à % de identidade de sequência de ácido nucleico entre D e C.
Noutras concretizações, os polinucleótidos variantes de PRO são moléculas de ácido nucleico que codificam um polipéptido PRO activo e que são capazes de hibridar, preferivelmente sob condições rigorosas de hibridação e lavagem, com sequências de nucleótidos que codificam um polipéptido PRO de comprimento completo, como aqui revelado. Os polipéptidos PRO variantes podem ser aqueles que são codificados por um polinucleótido variante de PRO. O termo "positivos", no contexto da comparação de sequências realizada como atrás descrito, inclui resíduos nas sequências comparadas que não são idênticos mas possuem propriedades similares (e.g. em resultado de substituições conservativas, veja-se a Tabela 6 adiante). Para os presentes fins, o valor da % de positivos é determinado dividindo (a) o número de resíduos de aminoácido classificados como um valor positivo entre a sequência de aminoácidos do polipéptido PRO de interesse possuindo uma sequência derivada da sequência de polipéptido PRO nativa e a sequência de aminoácidos de comparação de interesse (i.e., a sequência de aminoácidos contra a qual a sequência do polipéptido PRO está a ser comparada) como determinado na matriz BLOSUM62 de WU-BLAST-2, por (b) o número total de resíduos de aminoácido do polipéptido PRO de interesse. A menos que especificamente afirmado de outro modo, o valor da % de positivos é calculado como descrito no parágrafo 24 ΕΡ 1 621 619/ΡΤ imediatamente anterior. Contudo, no contexto das comparações da identidade de sequências de aminoácidos realizadas como descrito para ALIGN-2 e NCBI-BLAST-2 atrás, inclui não apenas os residuos de aminoácido nas sequências comparadas que são idênticos, mas também aqueles que possuem propriedades similares. Os residuos de aminoácido que são classificados com um valor positivo para um resíduo de aminoácido de interesse são aqueles que são idênticos ao resíduo de aminoácido de interesse ou constituem uma substituição preferida (como definido na Tabela 6 adiante) do resíduo de aminoácido de interesse.
Para comparações de sequências de aminoácidos utilizando ALIGN-2 ou NCBI-BLAST2, o valor de % de positivos de, ou entre, uma determinada sequência de aminoácidos A e, com, ou contra, uma determinada sequência de aminoácidos B (que pode ser alternativamente fraseado como uma determina da sequência de aminoácidos A que possui ou compreende uma determinada % de positivos com, ou contra, uma determinada sequência de aminoácidos B) é calculada como se segue:
100 vezes a fracção X/Y onde X é o número de resíduos de aminoácido com uma classificação de valor de positivo como definida atrás pelo programa de alinhamento de sequências ALIGN-2 ou NCBI-BLAST2 nesse alinhamento do programa entre A e B, e onde Y é o número total de resíduos de aminoácido em B. Notar-se-á que quando o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de positivos entre A e B não será igual à % de positivos entre B e A. "Isolado", quando utilizado para descrever os vários polipéptidos aqui revelados, significa um polipéptido que foi identificado e separado e/ou recuperado a partir de, um componente do seu ambiente natural. Os componentes contaminantes do seu ambiente natural são materiais que poderiam tipicamente interferir com utilizações terapêuticas ou de diagnóstico, do polipéptido, e podem incluir enzimas, hormonas, e outros solutos proteináceos ou não proteináceos. Em concretizações preferidas, o polipéptido será purificado (1) até um grau suficiente para se obter pelo menos 25 ΕΡ 1 621 619/ΡΤ 15 resíduos de sequência de aminoácidos N-terminal ou interna utilizando um sequenciador de copo giratório, ou (2) até à homogeneidade por SDS-PAGE sob condições não redutoras ou redutoras utilizando coloração com azul de Coomassie ou, preferivelmente, com prata. 0 polipéptido isolado inclui o polipéptido in situ no interior de células recombinantes, pois pelo menos um componente do ambiente natural do polipéptido PRO não estará presente. Vulgarmente, contudo, o polipéptido isolado será preparado através de pelo menos um passo de purificação.
Um ácido nucleico que codifica um polipéptido PRO "isolado", ou outro ácido nucleico que codifica um polipéptido, é uma molécula de ácido nucleico que é identificada e separada de pelo menos uma molécula de ácido nucleico contaminante com a qual está vulgarmente associada na fonte natural do ácido nucleico que codifica o polipéptido. Uma molécula de ácido nucleico isolada que codifica um polipéptido está numa forma ou arranjo outros que não aqueles em que se encontra na natureza. As moléculas de ácido nucleico isoladas que codificam um polipéptido distinguem-se portanto da molécula de ácido nucleico específica que codifica um polipéptido como existe em células naturais. Contudo, uma molécula de ácido nucleico isolada que codifica um polipéptido inclui moléculas de ácido nucleico que codificam polipéptidos contidas em células que vulgarmente expressam o polipéptido onde, por exemplo, a molécula de ácido nucleico tem uma localização cromossómica diferente da que tem em células naturais. A expressão "sequências de controlo" refere-se a sequências de ADN necessárias para a expressão de uma sequência de codificação ligada operativamente num organismo hospedeiro particular. As sequências de controlo que são adequadas para procariotas, por exemplo, incluem um promotor, opcionalmente uma sequência operadora, e um local de ligação ao ribossoma. Sabe-se que as células eucariotas utilizam promotores, sinais de poliadenilação e potenciadores.
Um ácido nucleico está "ligado operativamente" quando está colocado numa relação funcional com outra sequência de ácido nucleico. Por exemplo, o ADN para uma pré-sequência ou 26 ΕΡ 1 621 619/ΡΤ comando de secreção está ligado operativamente a um ADN para um polipéptido se for expresso na forma de uma pré-proteína que participa na secreção do polipéptido; um promotor ou um potenciador estão ligados operativamente a uma sequência de codificação se afectam a transcrição da sequência; ou um local de ligação ao ribossoma está ligado operativamente a uma sequência de codificação se estiver posicionado de modo a facilitar a tradução. Geralmente, "ligado operativamente" significa que as sequências de adn a ligar são contíguas, e, no caso de um comando de secreção, contíguas e em fase de leitura. Contudo, os potenciadores não têm que ser contíguos. A ligação é conseguida por ligação em locais de restrição convenientes. Se estes locais não existirem, utilizam-se adaptadores ou ligantes oligonucleotídicos sintéticos de acordo com a prática convencional. 0 termo "anticorpo" é utilizado no sentido mais lato e cobre especificamente, por exemplo, anticorpos monoclonais anti-PRO simples (incluindo anticorpos agonistas, antagonistas e neutralizantes), composições de anticorpos anti-PRO com especificidade poliepitópica, anticorpos anti-PRO de cadeia única e fragmentos de anticorpos anti-PRO (veja-se adiante). A expressão "monoclonal anticorpo", como aqui se utiliza, refere-se a um anticorpo obtido a partir de uma população de anticorpos substancialmente homogéneos, i.e., os anticorpos individuais que constituem a população são idênticos excepto quanto a possíveis mutações de ocorrência natural que possam estar presentes em quantidades menores. 0 grau de "rigor" das reacções de hibridação é prontamente determinável por um perito na especialidade, e geralmente é um cálculo empírico dependente do comprimento da sonda, da temperatura de lavagem e da concentração de sais. Em geral, sondas mais longas requerem temperaturas mais elevadas para uma hibridação correcta, enquanto as sondas mais curtas necessitam de temperaturas mais baixas. A hibridação geralmente depende da capacidade do adn desnaturado para voltar a hibridar quando estão presentes cadeias complementares num ambiente abaixo da sua temperatura de fusão. Quanto maior o grau de homologia desejado entre a sonda e a sequência hibridável, mais elevada a temperatura relativa que se pode utilizar. Em resultado, segue-se que temperaturas 27 ΕΡ 1 621 619/ΡΤ relativas mais elevadas tenderão a tornar as condições reaccionais mais rigorosas, enquanto temperaturas mais baixas, menos rigorosas. Para detalhes e explicações adicionais sobre o rigor de reacções de hibridação, veja-se Ausubel et al., Current Protocols in Molecular Bioloqy, Wiley Interscience Publishers, (1995). "Condições rigorosas" ou "condições muito rigorosas", como aqui se define, podem ser identificadas como aquelas que: (1) empregam baixa força iónica e temperatura elevada para a lavagem, por exemplo cloreto de sódio 0,015 M/citrato de sódio 0,0015 M/dodecilsulfato de sódio a 0,1%, a 50°C; (2) empregam durante a hibridação um agente desnaturante, tal como formamida, por exemplo, formamida a 50% (v/v) com albumina sérica bovina a 0,1%/Ficoll a 0,1%/polivinilpirrolidona a 0,1%/tampão de fosfato de sódio 50 mM a pH 6,5 com cloreto de sódio 750 mM, citrato de sódio 75 mM a 42°C; ou (3) empregam formamida a 50%, SSC 5x (NaCl 0,75 M, citrato de sódio 0, 075 M), fosfato de sódio 50 mM (pH 6,8), pirofosfato de sódio a 0,1%, solução de Denhardt 5x, ADN de esperma de salmão tratado com ultra-sons (50 gg/ml), SDS a 0,1%, e sulfato de dextrano a 10% a 42°C, com lavagens a 42°C com SSC 0,2x (cloreto de sódio/citrato de sódio) e formamida a 50% a 55°C, seguidas por uma lavagem muito rigorosa consistindo em SSC 0,lx contendo EDTA a 55°C. "Condições moderadamente rigorosas" podem ser identificadas como descrito por Sambrook et al., Molecular
Cloning: A Laboratory Manual, New York: Cold Spring Harbor Press, 1989, e incluem a utilização de solução de lavagem e condições de hibridação (e.g., temperatura, força iónica e % de SDS) menos rigorosas do que as descritas acima. Um exemplo de condições moderadamente rigorosas é a incubação durante a noite a 37°C numa solução compreendendo: formamida a 20%, SSC 5x (NaCl 150 mM, citrato trissódico 15 mM), fosfato de sódio 50 mM (pH 7,6), solução de Denhardt 5x, sulfato de dextrano a 10%, e ADN de esperma de salmão desnaturado por corte a 20 mg/ml, seguida de lavagem dos filtros com SSC lx a cerca de 37-50°C. O perito saberá como ajustar a temperatura, a força iónica, etc. conforme necessário para acomodar factores como o comprimento da sonda e semelhantes. 28 ΕΡ 1 621 619/ΡΤ A expressão "marcado com epítopo", quando aqui se utiliza, refere-se a um polipéptido quimérico compreendendo um polipéptido PRO fundido com um "polipéptido marcador". 0 polipéptido marcador possui resíduos suficientes para proporcionar um epítopo contra o qual um anticorpo pode ser criado, e no entanto é suficientemente curto para não interferir com a actividade do polipéptido ao qual está fundido. 0 polipéptido marcador preferivelmente também é bastante único de modo a que o anticorpo não reaja de modo cruzado substancialmente com outros epítopos. Os polipéptidos marcadores adequados geralmente possuem pelo menos seis resíduos de aminoácido e usualmente entre cerca de 8 e 50 resíduos de aminoácido (preferivelmente, entre cerca de 10 e 20 resíduos de aminoácido).
Como aqui se utiliza, o termo "imunoadesina" designa moléculas semelhantes a anticorpos que combinam a especificidade de ligação de uma proteína heteróloga (uma "adesina") com as funções efectoras de domínios constantes de imunoglobulinas. Estruturalmente, as imunoadesinas compreendem uma fusão de uma sequência de aminoácidos com a especificidade de ligação desejada que é outra que não o reconhecimento do antigénio e o local de ligação de um anticorpo (i.e., é "heterólogo"), e uma sequência de domínio constante de imunoglobulina. A parte adesina de uma molécula de imunoadesina tipicamente é uma sequência de aminoácidos contígua compreendendo pelo menos o local de ligação de um receptor ou um ligando. A sequência de domínio constante de imunoglobulina na imunoadesina pode ser obtida a partir de qualquer imunoglobulina, tal como os subtipos lgG-1, IgG-2, IgG-3 ou IgG-4, IgA (incluindo IgA-1 e IgA-2), IgE, IgD ou igM. "Activo" ou "actividade", para os presentes fins, referem-se a forma(s) de um polipéptido PRO que retêm uma actividade biológica e/ou imunológica de PRO nativo ou de ocorrência natural, em que actividade "biológica" se refere a uma função biológica (quer inibidora, quer estimulante) causada por um PRO nativo ou de ocorrência natural, outra que não a capacidade de induzir a produção de um anticorpo contra um epítopo antigénico em posse de um PRO nativo ou de ocorrência natural e uma actividade "imunológica" se refere à 29 ΕΡ 1 621 619/ΡΤ capacidade de induzir a produção de um anticorpo contra um epitopo antigénico em posse de um PRO nativo ou de ocorrência natural. 0 termo "antagonista" é utilizado no sentido mais lato, e inclui qualquer molécula que parcial ou completamente bloqueia, inibe ou neutraliza uma actividade biológica de um polipéptido PRO nativo aqui revelado. De maneira similar, o termo "agonista" é utilizado no sentido mais lato e inclui qualquer molécula que imite uma actividade biológica de um polipéptido PRO nativo aqui revelado. As moléculas de agonistas ou antagonistas adequadas incluem especificamente anticorpos agonistas ou antagonistas ou fragmentos de anticorpos, fragmentos ou variantes de sequências de aminoácidos de polipéptidos PRO nativos, péptidos, oligonucleótidos anti-sentido, moléculas orgânicas pequenas, etc. Os métodos para a identificação de agonistas ou antagonistas de um polipéptido PRO podem compreender o contacto de um polipéptido PRO com uma molécula agonista ou antagonista candidata e a medição de uma alteração detectável numa ou mais actividades biológicas normalmente associadas ao polipéptido PRO. "Tratamento" refere-se tanto ao tratamento terapêutico como a medidas profilácticas ou preventivas, em que o objectivo é evitar ou retardar (diminuir) a condição ou desordem patológicas alvo. Aqueles que necessitam de tratamento incluem aqueles já com a desordem assim como aqueles que são propensos a ter a desordem ou aqueles em quem se pretende prevenir a desordem.
Administração "crónica" refere-se à administração do(s) agente (s) num modo continuo em oposição a um modo agudo, de modo a manter o efeito terapêutico (actividade) inicial durante um período de tempo prolongado. Administração "intermitente" é o tratamento que não é realizado consecutivamente, sem interrupção, mas é em vez disso de natureza cíclica. "Mamífero", para os fins de tratamento, refere-se a qualquer animal classificado como mamífero, incluindo seres humanos, animais domésticos e de criação, e animais de 30 ΕΡ 1 621 619/ΡΤ zoológico, de desporto ou de companhia, tais como cães, gatos, gado bovino, cavalos, ovelhas, porcos, cabras, coelhos, etc. Preferivelmente, o mamífero é o ser humano.
Administração "em combinação com" um ou mais outros agentes terapêuticos inclui a administração simultânea (em co-corrente) e consecutiva em qualquer ordem. "Transportadores", como aqui se utiliza, incluem transportadores, excipientes ou estabilizantes farmaceuticamente aceitáveis que não são tóxicos para a célula ou o mamífero que estão a ser a eles expostos, nas dosagens e concentrações empregues. Frequentemente, o transportador fisiologicamente aceitável é uma solução aquosa de pH tamponado. Os exemplos de transportadores fisiologicamente aceitáveis incluem tampões tais como fosfato, citrato e outros ácidos orgânicos; antioxidantes incluindo ácido ascórbico; polipéptido de baixo peso molecular (menos de cerca de 10 resíduos); proteínas, tais como albumina sérica, gelatina, ou imunoglobulinas; polímeros hidrófilos tais como polivinilpirrolidona; aminoácidos tais como glicina, glutamina, asparagina, arginina ou lisina; monossacáridos, dissacáridos, e outros hidratos de carbono incluindo glucose, manose ou dextrinas; agentes quelantes tais como EDTA; aldóis tais como manitol ou sorbitol; contra-iões formadores de sais tais como sódio; e/ou tensioactivos não iónicos tais como TM ΊΜ tween , polietilenoglicol (peg) e pluronics . "Fragmentos de anticorpo" compreendem uma porção de um anticorpo intacto, preferivelmente a região variável ou de ligação ao antigénio do anticorpo intacto. Os exemplos de fragmentos de anticorpo incluem fragmentos Fab, Fab', F(ab')2 e Fv; diacorpos; anticorpos lineares (Zapata et al., Protein Eng. 8(10): 1057-1062 [1995]); moléculas de anticorpo de cadeia única; e anticorpos multiespecíficos formados a partir de fragmentos de anticorpo.
A digestão por papaína de anticorpos produz dois fragmentos de ligação ao antigénio idênticos, denominados fragmentos "Fab", cada um com um único local de ligação ao antigénio, e um fragmento residual "Fc", uma designação que reflecte a capacidade para cristalizar prontamente. O 31 ΕΡ 1 621 619/ΡΤ tratamento com pepsina origina um fragmento F(ab')2 que possui dois locais de combinação com antigénio e é ainda capaz de ligar de modo cruzado o antigénio. "Fv" é o fragmento minimo de anticorpo que contém um local de reconhecimento e ligação ao antigénio completo. Esta região consiste num dimero de um domínio variável da cadeia leve e um da pesada em forte associação não covalente. É nesta configuração que as três CDR de cada domínio variável interactuam para definir um local de ligação ao antigénio sobre a superfície do dimero VH-VL. Colectivamente, as seis CDR conferem ao anticorpo especificidade de ligação ao antigénio. Contudo, mesmo um único domínio variável (ou metade de um Fv compreendendo apenas três CDR específicas para um antigénio) tem a capacidade de reconhecer e ligar o antigénio, embora com menor afinidade do que o local de ligação completo. 0 fragmento Fab também contém o domínio constante da cadeia leve e o primeiro domínio constante (CHl) da cadeia pesada. Os fragmentos Fab diferem dos fragmentos Fab' pela adição de alguns resíduos no terminal carboxi do domínio CHI da cadeia pesada incluindo uma ou mais cisteínas da região charneira do anticorpo. Fab'-SH é a designação aqui para um Fab' em que o(s) resíduo (s) de cisteína dos domínios constantes são portadores de um grupo tiol livre. Os fragmentos de anticorpo F(ab')2 originalmente eram produzidos na forma de pares de fragmentos Fab' que possuem cisteínas de charneira entre si. Outros acoplamentos químicos de fragmentos de anticorpo são também conhecidos.
As "cadeias leves" de anticorpos (imunoglobulinas) de qualquer espécie de vertebrado podem ser atribuídas a um de dois tipos claramente distintos, denominados capa e lambda, com base nas sequências de aminoácidos dos seus domínios constantes.
Dependendo da sequência de aminoácidos do domínio constante das suas cadeias pesadas, as imunoglobulinas podem ser atribuídas a diferentes classes. Existem cinco classes principais de imunoglobulinas: igA, igD, IgE, igG e IgM, e várias destas podem ser adicionalmente divididas em subclasses (isotipos), e.g., igGl, IgG2, lgG3, lgG4, IgA e IgA2. 32 ΕΡ 1 621 619/ΡΤ
Os fragmentos de anticorpo "Fv de cadeia única" ou "sFv" compreendem os domínios de anticorpo VH e VL, em que esses domínios estão presentes numa única cadeia polipeptídica. Preferivelmente, o polipéptido Fv compreende ainda um ligante polipeptídico entre os domínios VH e VL que permite que sFv forme a estrutura desejada para ligação ao antigénio. Para uma revisão de sFv, veja-se Pluckthun em The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994). 0 termo "diacorpos" refere-se a pequenos fragmentos de anticorpo com dois locais de ligação ao antigénio, fragmentos estes que compreendem um domínio variável da cadeia pesada (VH) ligado a um domínio variável da cadeia leve (VL) na mesma cadeia polipeptídica (VH-VL) . Utilizando um ligante que é demasiado curto para permitir o emparelhamento entre os dois domínios na mesma cadeia, os domínios são forçados a emparelhar com os domínios complementares de outra cadeia e criar dois locais de ligação ao antigénio. Os diacorpos são descritos mais completamente em, por exemplo, EP 404 097; WO 93/11161; e Hollinger et al., Proc. Natl. Acad. Sei. USA, 90:6444-6448 (1993).
Um anticorpo "isolado" é um anticorpo que foi identificado e separado e/ou recuperado de um componente do seu ambiente natural. Os componentes contaminantes do seu ambiente natural são materiais que interfeririam com as utilizações em diagnóstico ou terapêuticas do anticorpo, e podem incluir enzimas, hormonas e outros solutos proteináceos ou não proteináceos. Em concretizações preferidas, o anticorpo será purificado (1) até mais de 95% em peso de anticorpo como determinado pelo método de Lowry, e o mais preferivelmente mais de 99% em peso, (2) até um grau suficiente para obter pelo menos 15 resíduos de sequência de aminoácidos N-terminais ou internos utilizando um sequenciador de copo giratório; ou (3) até à homogeneidade por SDS-page sob condições redutoras ou não redutoras utilizando coloração com azul de Coomassie ou, preferivelmente, com prata. O anticorpo isolado inclui o anticorpo in situ no interior de células recombinantes pois pelo menos um componente do ambiente natural do anticorpo não 33 ΕΡ 1 621 619/ΡΤ estará presente. Vulgarmente, contudo, um anticorpo isolado será preparado através de pelo menos um passo de purificação. A palavra "marcador", quando aqui utilizada, refere-se a um composto ou composição detectáveis que é conjugado directa ou indirectamente ao anticorpo de modo a gerar um anticorpo "marcado". 0 marcador pode ser detectável por si próprio (e.g. marcadores radioisotópicos ou marcadores fluorescentes) ou, no caso de um marcador enzimático, pode catalisar uma alteração química de um composto ou composição substrato que é detectável.
Por "fase sólida" entenda-se uma matriz não aquosa à qual o anticorpo da presente invenção pode aderir. Os exemplos de fases sólidas aqui abrangidas incluem as que são formadas parcial ou totalmente por vidro (e.g., vidro de poro controlado), polissacáridos (e.g., agarose), poliacrilamidas, poliestireno, poli(álcool vinílico) e silicones. Em certas concretizações, dependendo do contexto, a fase sólida pode compreender o poço de uma placa de ensaio; em outras é uma coluna de purificação (e.g., uma coluna de cromatografia de afinidade). Este termo também inclui uma fase sólida descontínua de partículas discretas, como as descritas na Patente U.S. 4,275,149.
Um "lipossoma" é uma pequena vesícula composta por vários tipos de lípidos, fosfolípidos e/ou tensioactivos que é útil para a entrega de um fármaco (tal como um polipéptido PRO ou um seu anticorpo) a um mamífero. Os componentes do lipossoma são vulgarmente dispostos numa conformação em bicamada, similar ao arranjo lipídico das membranas biológicas.
Uma "molécula pequena" é definida aqui como possuindo um peso molecular abaixo de cerca de 500 Daltons. 34 ΕΡ 1 621 619/ΡΤ
Tabela 1 /* * * C-C increased from 12 to 15
* Z is average of EQ
* B is average of ND * maich with stop is _M; stop-stop = 0; I (joker) match = 0 */
Idefine _M -8 I* value of a match with a stop *1 int _day[26][26] = { /* ABCDEFGHIJKLMNOPQRSTUVWXYZ»/ /» A */ { 2, 0,-2, 0. 0,4. 1,-1.-1, 0,-1.-2.-1, 0,_M, 1, 0,-2. 1, 1, 0. 0.-6. 0.-3. 0}, /* B */ { 0. 3,-4, 3, 2,-5, 0, 1,-2, 0, 0,-3,-2, 2,_M,-1, 1, 0, 0, 0, 0,-2,-5, 0,-3, 1}, /* C */ {-2,-4,15,-5,-5,-4,-3,-3,-2, 0.-5,-6.-5,4.JM,-3,-5,4, 0,-2,0,-2,-8, 0, 0,-5}, /* D */ { 0, 3,-5, 4, 3,-6, 1, 1,-2, 0, 0.-4,-3. 2, M,-l, 2,-1, 0, 0, 0,-2,-7, 0,-4, 2}, /* E */ { 0, 2,-5, 3, 4,-5, 0, 1,-2, 0, 0,-3,-2, l,~M,-l, 2,-1, 0, 0, 0,-2,-7, 0,-4, 3}, /* F */ {-4,-5,-4,-6.-5. 9.-5,-2, 1, 0,-5. 2, 0,4,~M.-5,-5,4.-3.-3, 0,-1, 0. 0, 7,-5), /* G */ {1, 0,-3, 1, 0,-5, 5,-2,-3, 0,-2,4,-3, 0,_M,-l,-l,-3, 1, 0, 0,-1,-7, 0,-5, 0}, /* H */ {-1, 1,-3, 1, 1,-2,-2, 6,-2, 0, 0,-2,-2, 2,_M, 0, 3, 2,-1,-1, 0,-2,-3, 0, 0, 2}, /* 1 */ {-1 ,-2,-2,-2,-2. 1,-3,-2,5. 0,:2. 2, 2,-2,_M,-2,-2,-2,-l, 0, 0, 4,-5, 0,-1,-2}. /* J *1 { 0, 0. 0, 0, 0, 0. 0, 0, 0, 0, 0, 0, 0, 0,_M, 0, 0, 0, O, 0, 0, 0, 0, 0, 0, 0}, /* K »/ {-I. 0,-5,0, 0,-5,-2,0,-2,0,5.-3, 0, 1,_M,-1, 1, 3, 0, 0, 0,-2,-3,0,4, 0}, t* L *1 {-2.-3,-6,4.-3, 2,4,-2, 2. 0,-3, 6, 4,-3._M, 3.-2.-3,-3.-1.0, 2.-2, 0.-1.-2}, t* M */ {-1.-2,-5,-3,-2,0,-3,-2,2, 0, 0, 4,6,-2,~M,-2,-1, 0,-2,-1,0. 2,4, 0,-2,-1}. /* N */ { 0, 2,4, 2, 1,4, 0, 2,-2, 0, 1.-3.-2, 2,~M,-1, 1, 0, 1, 0, 0,-2,4, 0.-2, 1}, /*0*7 { M, M,_M._M,_M,_M,_M,_M,_M, Μ, Μ, M, M,_M, 0,_M,_M, M,_M, M,_M, M,_M._M._M,_M}, /* P */ {Ί,-Γ,-3,-1,-1,-5,-1,0,-2, 0,-1,-3,-2,-Γ, Μ, 6,’θ, 0, 1,0, 0,-1,-6, 0,-5~ 0}, /* Q */ { 0, 1,-5, 2, 2,-5,-1, 3,-2, 0, 1,-2,-1, 1,_M, 0, 4, 1,-1,-1,0,-2,-5, 0,4. 3}, /* d */ í_o λ -λ _ι .ι -Λ λ *> ,ο η a η λ sa λ ι £ λ _ι λ ο λ λ γλ — ' ν,->,V, J, «, V, ,, ν,-ί,, ν,-., ν_|, /*S */ {1,0, 0.0. 0,-3. 1.-1,-1,0,0.-3,-2. 1,_Μ, 1,-1, 0, 2, 1, 0,-1,-2.0,-3.0}. /* Τ */ { 1,0,-2,0,0,-3,0,-1,0,0,0,-1,-1,0, Μ, 0,-1,-1, 1,3,0,0,-5,0,-3,0}. /* U */ { ο, ο, ο, ο, ο, ο, ο, ο, ο, ο, ο, ο, ο, ο Jm. ο, ο, ο, ο, ο, ο, 0, 0.0,0.0}, /* V */ { 0,-2,-2,-2,-2.-1,-1,-2, 4, 0,-2, 2, 2,-27μ.-1,-2,-2,-1, 0, 0, 4,-6. 0.-2.-2}, r W V {-6,-5.-8,-7,-7, 0,-7,-3,-5, 0,-3.-2,4,4,“μ,-6,-5, 2,-2.-5, 0,-6,17, 0, 0,-6}, /* X */ { 0, 0, 0, 0, 0, Ο, 0, 0, 0. 0,0, Ο, 0,0,_Μ, 0, 0, 0, Ο, 0, 0, Ο, 0, 0, 0, 0}, /* Υ */ {-3,-3, 0,4,4, 7,-5,0,-1, 0,4,-1,-2,-2._Μ,-5,4,4,-3,-3. 0,-2, 0, 0,10,4}, Ι*ζ*1 { 0. 1,-5, 2. 3,-5, 0.2,-2,0. 0,-2,-1, 1,_Μ, 0. 3,0, Ο, 0, 0,2,-6, 0,4, 4} }; 35ΕΡ 1 621 619/ΡΤ /» */ linclude <stdio.h> linclude <ctype.h> Idefine MAXJMP Idefine MAXGAP #defíne JMPS Idefine MX #define DMAT #define DMIS #define DINSO #define DINS1 Idefine PINSO #define PINSl struct jmp { short }; 16 /* maxjumps in a diag */ 24 /* don't continue to penalize gaps larger than this */ 1024 /* max jmps in an path */ 4 /* save if there's at least MX-1 bases since last jmp */ 3 /* value of matching bases */ 0 /* penalty for mismatched bases */ 8 /* penalty for a gap */ 1 /* penalty per base */ 8 /* penalty for a gap */ 4 /* penalty per residue */ n[MAXJMP]; /* size of jmp (neg for dely) */ x[MAXJMP); /* base no. of jmp in seq x */ /* limits seq to 2Ί6 Ί */ unsigned short struct diag { int score; /* score at last jmp */ long offset: 1* offset of prev block *1 short ijmp; /* current jmp índex */ struct jmp jp; 1* list of jmps */ struct path { int spc; /* number of leading spaces */ short nfJMPS];/* size of jmp (gap) *1 }; int x[JMPS];/* loc of jmp (last elem before gap) */ char ♦ofile; f* output file name */ char *namex[2); /* seq names: getseqs() V char *prog; /* prog name for err msgs */ char *seqx[2); 1* seqs: getseqs() */ int d max; 1" best diag: nw() */ int dmaxO; I* fmal diag */ int dna; 1* set if dna: main() */ int endgaps; /* set if penalizing end gaps */ int gapx, gapy; /* total gaps in seqs */ int lenO, leni; /* seq lens '1 int ngapx, ngapy; 1* total size of gaps */ int smax; 1* max score: nwO */ — int *xbm; /* bitmap for matching */ long offset; /* current offset in jmp file */ struct diag *dx; 1* holds diagonais */ struct path pp[2]; 1* holds path for seqs */ char *calloc(), *mallocO, *index{), *strcpy(); char •getseqO, *g_calloc(); 36
ΕΡ 1 621 619/PT /* Needleman-Wunsch alignmem program * ____ . * usage: progs filei file2 * where filei and file2 are two dna or two protein sequences. * The sequences can be in upper- or lower-case an may contain ambiguity * Any littes beginning with or '<' are ignored * Max file length is 65535 (limited by unsigned short x in the jmp struct)
* A sequence with 1/3 or more of its elemems ACGTU is asSumed to be DNA * Output is in the file "align-out" * * The program may create a tmp file in /rmp to hold info about traceback. * Original version developed under BSD 4.3 on a vax 8650 *1 lindude ”nw.h" f/include ' day.lt' static _dbval[26] = { 1,14,2,13,0,0.4,11,0,0,12,0,3,15,0,0.0,5,6,8,8,7,9,0,10,0 }; static jtbval[26] = { 1, 21(1 < <(,D'-'A'))|(1 < <('N'-'A')). 4, 8, 16, 32,64, 128. 256. OxFFFFFFF. 1 < < 10, 1 < < 11, 1 < < 12, 1 < < 13, 1 < < 14, 1 < < 15, I < < 16, 1 < < 17. 1 < < 18, 1 < < 19, 1 < <20, 1 < <21, 1 < <22, 1 < <23, 1 < <24, 1 < <251(1 < <(Έ'-Ά'))|(1 < <rQ'-'A')) inain mainfac, av) int ac; char { prog = av[0]; íf (ac ! = 3) { fprintf(stderr,"usage: %s filei Íile2\n", prog); fpnntf(stderr, "where filei and file2 are two dna or two protein sequences.\n"), fprintf(stderr,The sequences can be in upper- or lower-caseVn"), fpríntf(stderr,"Any lirtes begmning with or ' <' areignoredln"), fprintf(stderr,"Output is in the file \”align.out\”\n”); exit(l): } namex[0] = av[l]; namexfl] = av[2): seqx[0] = getseq(namex[0], &len0); seqx[l] = getseq(namex(l), &lenl); xbm = (dna)? .dbval ; jtbval; endgaps =0; /* 1 to penalize endgaps */ ofile = "align.out"; /’ output file */ nw(): /* fill in the matrix, get the possible jmps */ readjmps(); /* get the actual jmps */ print(); /* print stats, alignment */ _ } cleanup(O); /* unlink any unp files */ 37
ΕΡ 1 621 619/PT /* do tbe alignmem. retum best score: main() * dna: values in Fitch and Smiiii, PNAS, 80, 1382-1386, 1983 * pro: PAM 230 values * When scores are equal, we prefer mismutchcs to any gap, prefer * a new gap to extending an ongoing gap, and prefer a gap in seqx * to a gap in seq y. */ nwO{ char int int int int int register registcr register register *ρχ, *py; *nddy, *dely; ndeix, deix; *tmp; mis; insO, insl; id; •colO, *coll; xx, yy; /* seqs and ptrs V /* keep track of dely *1 i~ keep uauk of deix */ I* for swapping rowO, rowl */ /* score for each type */ /* insertion penalties *1 I* diagonal index */ /* jrnp index */ /* score for curr, last row */ I* index inro seqs */ nw dx = (struct diag *)g_calloc("to get diags”, lenO+lenl + 1, sizeof(struct diag)). ndeiy = (int *}g_callocCto get ndely", lenl + 1, sizeof(int)); deiy — (ini *)g_caiioc("io get dely'', leni -ri, siáeof(iní)); colO = (int *)g_caUoc('to get colO", leni +1, sizeof(int>); coll = (int *)g_calloc(”to get coll", lenl+1, sizeof(int)); insO = (dna)? DINSO : P1NS0: insl = (dna)? DINSI : PINS1; sroax = -10000; ií (endgaps) { for (col0[0] = dely(0] = -insO, yy = 1; yy < ~ leni; yy+ +) { col0[yyj = dely[yyj = colO(yy-l] - insl; ndely[yy] = yy; > colOlO] = 0; Γ Waterman Buli Matli Biol 84 *1 } clsc for (yy = 1; yy < = leni; yy+ +) delyfyy] = -insO; 1* fili in maich matrix »/ for(px =- seqx[OJ. xx = 1; xx < = lenO; px + + , xx ++) { /* initialize ftrst entry in col */ if (endgaps) { íf (xx = = 1) co!l[0] ~ deix = (insO+insl); else coll[0] = deix = colOjO) - insl; odelx = xx; } else { coilfO] = 0; deix = -insO; ndelx = 0; } 38 38 ΕΡ 1 621 619/ΡΤ ..nw for (py = seqxflj, yy = 1; yy <= leni; py + +, yy++) { mis = colQ[yy-l]; if(dna) mis + = (xbm[*px-'A']&xbm[*py-’A’))? DMAT : DM1S; else mis + = _day[*px-'A')[*py-'A'); /* update penalty for del in x seq; * favor new del over ongong del * ignore MAXGAP if weighting endgaps *1 if (endgaps 11 ndely[yy] < MAXGAP) { if (co!0[yy] - insO > = deiylyy]) { delylyy] = colO(yy] - (insO+insl); ndelylyy] = 1; } else { dely[yy] -= insl; ndely[yy]+ + ; } } else { if (colOJyy] -'(insO+insl) > = delylyy]) { delylyy] = colO[yy] - (insO+insl); ndelylyy] = 1; } else ndely[yy]+ + ; } /* update penalty for del in y seq; * favor new del over ongong del *1 if (endgaps 11 ndelx < MAXGAP) { if (coll[yy-1) - insO > = delx) { delx = colllyy-1] - (insO+insl); ndelx = 1; } else { delx -= insl; ndelx+ + ; } } else { if (coll[yy-l) - (insO+insl) > = delx) { delx = colllyy-1] - (insO+insl); ndelx = 1; } else ndelx++; } /* pick the maximum score; we’re favoring * mis over any del and delx over dely *t 39 ΕΡ 1 621 619/ΡΤ ...nw id = xx-yy + leni -1; tf (mis > = delx && mis > = deiylyy]) collfyy) = mis: else if (delx > = dely[yy]) { colllyy] = delx: ij = dx[id}.ijmp; tf (dx[id].jp.n[0] &&. (!dna 11 (ndelx > = MAXJMP &.&. xx > dx[id]jpx[ij]+MX) || mis > dx[id],score+DLNSO)) { dx[id].ijmp+ + ; tf (++ij >= MAXJMP) { wriiejmps(id); ij - dx[id].ijmp = 0; dx[id].offsei = offsei; offset +=» sizeoffstruct jmp) + stfeoffoffset); } } dx[íd].jp.n[ij] = ndelx; - dx[id].jp.x[ijj = xx; dx[idJ.score = delx; } else { collfyy] = deiylyy]; ij = dxJidJ.ijmp;
if (dx|uj|.jp.n|0] && (!dna 11 (ndelylyy] > = MAX3MP && xx > dx[idj.jp.x[ij]+MX) 11 mis > dx[id].score+DlNSO)) { dx(id].ijmp+ + ; if( + +ij >= MAXJMP) { writejmpsfid); ij = dxlidj.ijmp = 0; dx[id].offset = offset; offset += sizeotfstruct jmp) + sixeof(offset); } } dxlid].jp.n[ij) =-ndelylyy]; dx[id].jp.x[ij] = xx; dx[id].score = deiylyy]; } if (xx = = lenO && yy < leni) { /* last col */ if (tndgaps) colllyy]-= insO+insl*(lenl-yy); if (coll[yy] > smax) { smax = coll[yy]; dmax = id; } } } if (endgaps && xx < lenO) col 1 [yy-1]-= insO+insl*(lenO-xx); ir(coll[yy-l] > smax) { smax = colllyy-1]; dmax = id; } } tmp = colO; colO = coll; coll = unp; } (void) freefíchar *)ndely); (void) free((char s)dely); (void) fres((char *)colO); (void) free((ctiar *)eoll); 40 ΕΡ 1 621 619/ΡΤ /* * * printO - only routine visible outside this module ............. * * static:
* getmatO - trace back best path, count matches: prirnO
* ,pr_align() - print alignment of described in array pQ: printO * duínpblockO - dump a block of lines with numbers, stars: pr_align0
* numsO - put out a number line: duínpblockO * putlinef) - put out a line (name, [num], seq. [num]): dumpblock()
* starsO - -put a line of stars: duínpblockO
* strinname^ — ririn anv nath and nre-íix from a senuame •I lindude 'nw.h"
Idefine SPC 3 . #defme PL1NE 256 /* maximum output line */ #define PSPC 3 /* space between name ot num and seq */ extern _day[26][26]; int olcn; FILE *fx: /* set output line length */ /* output file */ print() { int lx. ly, firstgap, lastgap; /* overlap */ if ((fx = fopen(ofile, "w”)) = = 0) { fprintf(s!derr,"%s: can't write Ss\n", prog, ofile); cleanup(l); } fprintf(fx, " < first sequence: %s (length = %d)Vn", namex[0], lenO); fj>rintf(fx, "<second sequence: %s (length = %d)\n", namex[I), leni); olen = 60; lx = lenO; ly = leni; firstgap = lastgap = 0; if (dmax < len) -1) { I* leading gap in x */ pp[0].spc = firstgap = leni - dmax - 1; ly -= pp[0].spc; ) else if (dmax > leni - I) { I* leading gap in y */ pp[l].spc = firstgap = dmax - (leni - 1); lx -= pp[l].spc; } ir (dmaxO < lenO - I) { /* trailing gap in x *! lastgap = lenO - dmaxO -1; lx -= lastgap; } else if (dmaxO > lenO - 1) {/* trailing gap in y */ lastgap = dmaxO - (lenO - 1); ly -= lastgap; } getmatOx, ly, firstgap, lastgap); } print prjlignQ; 41 ΕΡ 1 621 619/ΡΤ /* * trace back the best path, count matches */ static getmai(lx, ly, firstgap, lasigap) int lx, ly; Γ "core" (rainus endgaps) */ int firstgap. lastgap; /* leading trailing overlap */{ getmat int char double regisler register char nm, 10, il, sizO, sizl; outx[32); pct; nO, nl; «pQ, *ρΐ; /* get total matches. score */ iO = il = sizO = sizl = 0; pO = seqx[0] + pp[l).spc; pl = seqx[l] 4- pp[0].spc: nO = pp[[).spc + 1; nl = pp[0|.spc + 1; nm - 0: •bile.f *pu && *pi) { . if (sizfl) { pl+ + : nl + +;
SizO-;
J dse tf (sizl) { pO+-f; oO+ + ; sizl-; > dse { if (xbm|*pO-’A')&xbm[*pl-'A')) nm+ + ; if (nO+ + = = pp[0).x[i0)) sizO = ppll)].n[iO+ + ); if(nl + + == pp[l).x[il]) sizl = pp[l].n[il + +]; pO+ +; pi + + ; ! } /· pct homology: * if penalizing endgaps, base is the shorter seq * dse, knock off overhangs and lake shotter core ·/ if(endgaps) lx = (lenO < leni)? lenO ; leni; else
Ix = (lx. < ly)? lx : ly; pct = IOO,*(double)nm)(double)lx; fprintf(fx. "\n”); fprintfffx, “< %d match%s in an overlap of %d: %.2f percem similarityin". nm, (nm == 1)? ; "es". lx, pct); 42
ΕΡ 1 621 619/PT ...getmat fprintf(fx.' <gaps in first sequence: %d“, gapx); íf (gapx) {. (void) sprintf(outx, " (%d ®s%s)"; ngapx. (dna)? "baseVresidue", (ngapx = = 1)? fprintf(fx,'*s". oucx); fprimf(fx, ", gaps insecond sequence: %d", gapy); tf(gapy) { (void) sprimf(ouix, " (%d %s%s)\ ngapy, (dna)? "baseVresidue", (ngapy == 1)? ’":"s ); fprinrf(fx,’Ss", outx); } if (dna) fprintf(fx, "\n < score: %d(match = %d, mismaich = %d, gap penalty = %d + %d per base)\n", smax, DMAT, DM1S, DINSO, DINSL); elsc fprintf(dx, "\n< score. %d (Dayboff PAM 250 mauix, gap penalry = %ú + %ú per residue)\n\ smax, PINSO, PINS1); if(endgaps)
IprimRfx, " <endgaps penalized. left endgap: %d %s%s, righi endgap: %d %s%s\n", firstgap. (dm)? "base": "residue", (firstgap == 1)? *" : "s", lastgap, (dna)? "base" : "residue". (lastgap == 1)? "" : "s"); else } fprintf(fx, " < endgaps not penalizedNn"); static run; /* matches in core - for checking '1 static Imax; /* lengths of stripped file narres */ static ij(2); /* jmp index for a paih */ static nc[2); /* number at srart of currem line */ static ni(2); /* currem elem number - for gapping */ static 5izl2); static char *psf2J; /* p(r to currem element V static char *po[2]: !* ptr to nexi output char slot */ static char oulf2](P UNEJ; /» outpui line */ ‘ static char siar|P UNE]; /* sei by starsO *1 /* * prinl alignmcm of described in stnict paih pp[] */ pralign staric pr align() { int nn; I* char count */ inl more; register i: for (i = 0. Imax = 0; i < 2; i+ +) { nn = stripname(namex[i)); if (nn > lmax)
Imax = nn; nc|i] = 1; ni[i] = 1: siz|i] = ij[i] = 0; ps(i] = seqx(i|; po(i) = oui|i): / 43 ΕΡ 1 621 619/ΡΤ ...pralign for (ηη = nm = 0, more = I: more; ) { for (i = more = 0; i < 2; i+ +) { /* * do we have more of this sequence? */ if (!*ps[il) continue; more+ + ; if (pp[i].spc) { I* leading space *1 *po[i) + + = ' pp[i).spc~; } else if (siz[i]) { /* in a gap */ *po[i] + + = sizlU-; } etsc { /* we're putting a seq element *po[i] = *ps[i); if (islower(*ps[i])> *ps[i] = ioupper(*psfi]); po|i) + + ; ps[i| + + ; /* * are we at next gap for this seq? *1 if (ni[ij == pp[i].x[ij[i]]) { /♦ . * we need to merge all gaps * at this locaiion */ siz[i] = pp[i).n[ij[i] + +]; while(ni[il = = pp[i].x[ij[i)l) sii[i)+= pp[i].n[ij[i]++); } ni[i] + + ; } > ir i» -cnn = = olen 11 !more && nn) { (JumpblockO; for (i = 0; i < 2; i+ +) po[i] = out[i]; nn = 0; ' } > /*
* dump a bluck nt Imo. including mimhers. stars: pr_align() V static dumpblock dumpblockt) { rcgistcr i. for (i = 0; i < 2; i + +) *po[i]~ = *V0': 44 ΕΡ 1 621 619/ΡΤ ...dumpblock (void) putc('\n', fx): for (i = 0; i < 2; i + +) { if (*out[i) && (*oul[i) != ' ' 11 *(po(i]) !=')){ if(i == 0) nums(i);if(i == 0&&*oul[l)) SBrsOí putline(i); if(i == 0 && *out[l]) íprintfffx, star); if(i -= i) nuras(i); } } } /· * pvi oui a numher lme: dimipblockQ ·/ sutir numvlixl ini ix; < rtlir rrfirter rtftdcr char nums /* index in oui[] holding seq line */ nline[P_UNH]; i.j: *pn. ‘px, *py; for <po = aline, i = 0; i < lraax+P_SPC; i + + , pn++) •pn = ' for (i = nc|ix). py = ouifixj; *py; py+ + , pn++) { if(*py == ' ' 11 *py == *pn =. ’ else { if(i%10 == 0 II (i == I &&nc[ix) != I)){ j - (i < 0)? -i: i; for (px = pn; j; j /= 10, px-)*px = j%10 + Ό'; if (i < 0)*px = } ) “pn = ’\0'; nc(ix) = i: for (pn = nline; *pn; pn+ -h) (void) puic(*pn, fx); (void) purcOn', fx); /* * put oui a line (name, Inum], seq, [numl): dumpbloclc() */ -static pulline(ix) int ix: putiine { 45
ΕΡ 1 621 619/PT ...putline inl i; register char *px; for (px = namex[ix], i = 0; *px && *px != px+ + . i + +) (void) putc(*px, fx); for (; i < lmax+P_SPC; i++) (void)putcC fx); /* (hese count from 1: * ni[) is current elemem (from 1) * nc[) is number at stan of current line */ for (px = outfix); *px; px+ +) (void) puic(*px&0x7F, fx); (void) putc('\n', fx); } /* * put a line of stars (scqs always in out[0). out[ I)): dumpblock()
V sLatic starsO Stars { iot i;
register char *pQ, *pE cx· *PXI if (!*OUI|0) 11 (*out[0) = = ' && *(po[0]) == ' ') 11 !*out(l] |K*om|l] = = " && *(po[]J) == ")) relurn; px = star; for (i = Imax+PSPC; i; i--) »px+ + = ' for (pO = oui[0], pl = ouc[ I ]; *p0 && *pl;pO+ + ,pl + +){ if (isalpha(*pO) && isalpha(*pl)) { if (xbm[*pO-'A’)&xbm[*pl-'A')) { cx = *'; nm+ +; } else if (!dna && jJayl^pO^A^I^l-VA'! > 0) cx = V; else cx = ’ *: } cise cx = ' '; *px++ = cx; *px+ + = '\n'; •px = ’\0'; } /* * strip path or prefix from pn, return len; pr_align() *1 static
Stripname(pn) StrípnaiUC char *pn; /* file name (may be path) */ { register char *px, *py; py = 0; for (px = pn; *px; px + + ) if (*px == V) py - px + 1; if (py) (void) strcpytpn, py); relurn(strlenípn)); } 46 ΕΡ 1 621 619/ΡΤ I* * deanupO -· cleanup any απρ file * getseqO - read in seq, sei dna, len, maxlen * g_calloc() calloc() with error checkin * rradjmpsO - gei the good jmps, from tmp File if necessary * writejmpsO - write a filled array of jmps io a tmp file: nw() */ #indude "nw.h‘ #include < sys/flle.h > char *jname = "/tmp/homgXXXXXX"; /* tmp file for jmps */ FILE *fj; int cleanup(): long lseek(); /* cleanup tmp file */ /* * remove any imp file if we blow */ deanup(i) int i;{ if (0) (void) unlink(jname); exii(i);} cleanup /* * read. rctum pir to seq, sei dna, len. maxlen * sldp lincs sianing wiih ’. ' <', or ' > ’ * seq in upper or lower case V char
geiseq(file, len) char "file; int *len;{ char regisler char int RLE /* file name */ /* seq len */ linef 1024], *pseq; *px. *py: natgc, tlen; *fp· getseq if ((fp = fopenffile. V)) = = 0) { fprintf(stderr.'%s: can't read %s\n". prog, file); exil(l); r tlen = natgc = 0; while (fgetsfline, 1024, fp)) { if (*línc == 11 *line == '<’ 11 *line == '>') continue; for (px = line; *px != ’\n'; px + + ) if (isupper(*px) 11 islower(*px)) if ((pseq = malloc((unsigned)(ilen+6))) == 0) { fprimf{stderr,”%s: mallocf) failed to get %d bytes for %s\n". prog, tlen + 6, file); exil(l);} pseqlO) = pseqi 1 ] = pseqf2) = pseq[3] = '\0': 47
ΕΡ 1 621 619/PT ...getseq py = pseq + 4; *len = tlen: rewind(fp); while (fgeisfline, 1024, φ)) { if(*hne == || *iine == ’<' || «Une == '>') continue; for (px = line; «px != ’\n'; px++) { if (isupper(«px)) *py++ = *px; else if (islower(*px)) *py + + = toupper(*px); if (index(’ATGCU\*(py-l))) natgc + +; } } *py++ = '\0'; *py = '\0'; (void) fclose(fp); dna = natgc > (tlen/3); retum(pseq+4); } g_calloc char « g_calloc(msg, nx, SZ) char *msg; /* program, calling routine */ inl nx, sz; /* number and size of elements */ { char *px. *calloc(); if ((px = ca!loc((unsigned)nx, (unsigned)sz» = = 0) { if (*msg) { sz); φπηιϋ^ιάεπ·, ’%s: gcallocQ failed %s (n=%d, sz=%d)\n". prog. msg, nx. exit(l); } } retum(px); } /» * get final jmps from dxf] or imp file, set pp[], reset dmax; main() */ readjmps readjmps() { in< fd = -1; int siz, iO, il; register i, j, xx; f(fj){ (void) fclose(fj); if ((fd = open(jname, 0_RD0NLY. 0)) < 0) { φηΜ^ύητ. "%s: can't open() %s)n”, prog, jname); cleanup( 1); } } for (i = iO = il = 0, dmaxO = dmax, xx = lenO; ; i+ +) { while(I) { for (j = dx[dmax].ijmp; j > = 0 &.& dx[amax].jp.x[j] > = xx: j~) 48ΕΡ 1 621 619/ΡΤ .readjmps if (j < Ο && dx[dmax).offsel && fj) { (void) lseek(fd, dx[dmax].offset, 0); (void) read(fd, (char *)&dx[dmax].jp, sizeof(struct jmp)); (void) read(fd. (char *)&dx[dmax) .offsei, sizeof(dx|umax). offsei)); dx[dmaxj.ijmp = MAXJMP-I; } else break; if (i > = )MPS){ fprintf(stderr, "%s: too many gaps ín alignmeni\n", prog); cleanupd); } if(l> = 0){ siz = dx[dmax].jp.n[j]; xx = dx(dmax].jp.x[j); dmax + = siz; if (siz < 0) { /* gap in second seq */ pp[l].n[il] = -siz; xx + = siz; /* id = xx - yy + leni - 1 */ pp[l].x|il) = xx - dmax + leni-1; gapy ++; ngapy - = siz; /” ignore MAXGAP when doing endgaps */ siz = (-siz < MAXGAP 11 endgaps)? -siz : MAXGAP; il-f + ; } else if (siz > 0) { /* gap in first seq */ pp[0].n[i0] = siz; pp[0].x(i0] = xx; gapx + +; ngapx + = siz; /* ignore MAXGAP when doing endgaps */ siz = (siz < MAXGAP 11 endgaps)? siz ; MAXGAP; Í0+ + ; } } else break; } /* reverse lhe order of jmps */ for (j = 0, iO—; j < iO; j + +, iO—) { i = pp[0].n[j): pp[0).n[j] = pp[0].n[i0]; pp[0).n(i0] = í: i = pp[0).xUÍ; pp[0].x[j] = pp[0].x[iO]; pp[0).x[i0) = i; } for (j = 0. iI—; j < Π; j + +. il—) { i = pp[l).n[j]: pp[l).n[j] = pp[lj n[il]; pp[l).n[il] = i; i = ρρΠΙ.χϋ]·· ΡΡΠΙ.χϋΙ = PP[l]-x[il): pp[ij.x[ilj = i; } if (fd > = 0) (void) close(fd); (void) unlink(jname): 5 = 0; offsei = 0; } 49 ΕΡ 1 621 619/ΡΤ /* * write a fillcd jmp stnict offset of ibe prev one (if any): nw() ' */ writejmpsfix) inl writejmps { cbar ix;•mkiempO; if (mkrempfjnaiiuO < 0) { fpnnrffstderr, "%s: can't mkiempO %s\n", prog. jname): cleanup(l); } if ((fj = fopeo(jname, 'w')) = = 0) { fprimf(siderr, "%s: can't write %s\n”, prag, jname); exit(l); } } (void) fwrice((char *)&dx[ix).jp. sizeoffslruct jmp). 1. fj); 'void) fwrite((char *)&dx[ixj.offset, siieof(dx[ix).offset). 1, fj);
Tabela 2 PRO XXXXXXXXXXXXXXX (Comprimento = 15 aminoácidos)
Proteína de comparação XXXXXYYYYYYY (Comprimento = 12 aminoácidos) % de identidade de sequência de aminoácidos = (o número de resíduos de aminoácido com coincidência idêntica entre as duas sequências polipeptídicas como determinado por ALIGN-2) dividido por (o número total de resíduos de aminoácido do polipéptido PRO) = 5 dividido por 15 = 33,3%
Tabela 3 (Comprimento = 10 aminoácidos) (Comprimento = 15 aminoácidos)
PRO XXXXXXXXXX
Proteína de comparação XXXXXYYYYYYZZYZ % de identidade de sequência de aminoácidos = (o número de resíduos de aminoácido com coincidência idêntica entre as duas sequências polipeptídicas como determinado por ALIGN-2) dividido por (o número total de resíduos de aminoácido do polipéptido PRO) = 5 dividido por 10 = 50%
Tabela 4 ADN-PRO ADN de comparação NNNNNNNNNNNNNN (Comprimento = 14 nucleótidos) NNNNNNLLLLLLLLLL (Comprimento = 16 nucleótidos) % de identidade de sequência de ácido nucleico = (o número de nucleótidos com coincidência idêntica entre as duas sequências de ácido nucleico como determinado por ALIGN-2) dividido por (o número total de nucleótidos da sequência de ácido nucleico ADN-PRO) = 6 dividido por 14 = 42,9% 50 ΕΡ 1 621 619/ΡΤ
Tabela 5 50 ΕΡ 1 621 619/ΡΤ ADN-PRO ADN de comparação
NNNNNNNNNNNN
NNNNLLLW (Comprimento = 12 nucleótidos) (Comprimento = 9 nucleótidos) % de identidade de sequência de ácido nucleico = (o número de nucleótidos com coincidência idêntica entre as duas sequências de ácido nucleico como determinado por ALIGN-2) dividido por (o número total de nucleótidos da sequência de ácido nucleico ADN-PRO) = 4 dividido por 12 = 33,3% II. Composições s Métodos da invenção A. Polipéptidos PRO de Comprimento Completo A presente invenção proporciona sequências de nucleótidos pela primeira vez identificadas e isoladas que codificam polipéptidos referidos no presente pedido de patente como polipéptidos PRO. Em particular, foram identificados e isolados ADNc que codificam vários polipéptidos PRO, como descrito com mais detalhes nos Exemplos adiante. Note-se que as proteínas produzidas em ciclos de expressão separados podem ter diferentes números PRO mas o número UNQ é único para qualquer determinado ADN e a proteína codificada, e não serão alterados. Contudo, em nome da simplicidade, no presente fascículo a proteína codificada pelas moléculas de ácido nucleico nativas de comprimento completo aqui reveladas, assim como todos os outros homólogos nativos e variantes incluídos na definição de PRO, serão referidos como "PRO/número", independentemente da sua origem ou modo de preparação.
Como revelado nos Exemplos adiante, vários clones de ADNc foram depositados na ATCC. As sequências de nucleótidos reais desses clones podem ser prontamente determinadas por um perito por sequenciação do clone depositado utilizando métodos de rotina na especialidade. A sequência de aminoácidos prevista pode ser determinada a partir da sequência de nucleótidos utilizando conhecimentos de rotina. Para os polipéptidos PRO e ácidos nucleicos de codificação aqui descritos, a Requerente identificou o que se crê ser o quadro de leitura mais bem identificável com a informação sobre a sequência disponível na altura. 51 ΕΡ 1 621 619/ΡΤ
Polipéptidos PRQ4405 de Comprimento Completo
Tanto quanto se sabe, a sequência de DNA84920-2614 codifica um novo factor aqui designado por PRO4405; utilizando os programas de computador para alinhamento de sequências WU-BLAST2, foram reveladas identidades de sequência limitadas com proteínas conhecidas.
B. Variantes de Polipéptido PRO
Em adição aos polipéptidos PRO de sequência nativa de comprimento completo aqui descritos, está contemplado que possam ser preparadas variantes de PRO. As variantes de PRO podem ser preparadas introduzindo alterações de nucleótidos apropriadas no ADN do PRO, e/ou através de síntese do polipéptido PRO desejado. Os peritos na especialidade notarão que alterações de aminoácidos podem alterar processos pós-tradução do PRO, tais como a alteração do número ou da posição de locais de glicosilação ou a alteração de características de ancoragem à membrana.
As variações na sequência PRO nativa de comprimento completo ou em vários domínios do PRO aqui descritos, podem ser feitas, por exemplo, utilizando quaisquer das técnicas e orientações para mutações conservativas e não conservativas estabelecidas, por exemplo, na Patente U.S. 5,364,934. As variações podem ser uma substituição, deleção ou inserção de um ou mais codões que codificam o PRO que resultam numa alteração na sequência de aminoácidos do PRO comparativamente com a do PRO de sequência nativa. Opcionalmente, a variação é efectuada por substituição de pelo menos um aminoácido por qualquer outro aminoácido num ou mais dos domínios do PRO. Orientações para a determinação de que resíduo de aminoácido pode ser inserido, substituído ou eliminado sem afectar adversamente a actividade desejada, podem ser encontradas comparando a sequência do PRO com a de moléculas de proteína homólogas conhecidas e minimizando o número de alterações na sequência de aminoácidos efectuadas em regiões de homologia elevada. As substituições de aminoácidos podem ser o resultado da substituição de um aminoácido por outro aminoácido possuindo propriedades estruturais e/ou químicas similares, tais como a substituição de uma leucina por uma serina, í.e., 52 ΕΡ 1 621 619/ΡΤ substituições conservativas de aminoácidos. As inserções ou as deleções podem opcionalmente ser na gama de cerca de 1 a 5 aminoácidos. A variação permitida pode ser determinada fazendo sistematicamente inserções, deleções ou substituições de aminoácidos na sequência e testando as variantes resultantes quanto à actividade exibida pela sequência nativa de comprimento completo ou madura. São aqui proporcionados fragmentos de polipéptido PRO. Estes fragmentos podem ser truncados no terminal N ou no terminal C, ou podem ter falta de residuos internos, por exemplo, quando comparados com uma proteína nativa de comprimento completo. A certos fragmentos faltam residuos de aminoácido que não são essenciais para uma actividade biológica desejada do polipéptido PRO.
Os fragmentos PRO podem ser preparados por qualquer uma de várias técnicas convencionais. Os fragmentos peptídicos desejados podem ser quimicamente sintetizados. Uma abordagem alternativa envolve gerar fragmentos de PRO por digestão enzimática, e.g., por tratamento da proteina com uma enzima que se sabe clivar proteínas em locais definidos por resíduos de aminoácido particulares, ou por digestão do ADN com enzimas de restrição adequadas e isolamento do fragmento desejado. Ainda outra técnica adequada envolve o isolamento e a amplificação de um fragmento de ADN que codifica um fragmento polipeptídico desejado, por reacção em cadeia com polimerase (PCR). Os oligonucleótidos que definem os terminais desejados do fragmento de ADN são empregues nos iniciadores 5' e 3' na PCR. Preferivelmente, os fragmentos de polipéptido PRO partilham pelo menos uma actividade biológica e/ou imunológica com o polipéptido PRO nativo aqui revelado.
Em concretizações particulares, mostram-se na Tabela 6 substituições conservativas de interesse na coluna com o titulo de substituições preferidas. Se essas substituições resultarem numa alteração da actividade biológica, então são introduzidas alterações mais substanciais, denominadas substituições exemplificativas na Tabela 6, ou como adicionalmente descrito adiante em referência a classes de aminoácidos, e os produtos são pesquisados. 53 ΕΡ 1 621 619/ΡΤ
Tabela 6
Resíduo Original Substituições exemplificativas Substituições preferidas Ala (A) vai; leu; ile vai Arg (R) lys; gin; asn lys Asn (N) gin; his; lys; arg gin Asp (D) glu glu Cys (C) ser ser Gin (Q) asn asn Glu (E) asp asp Gly (G) pro; ala ala His (H) asn; gin; lys; arg arg He (I) leu; vai; met; ala; phe; norleucina leu Leu (L) norleucina; ile; vai; met; ala; phe ile Lys (K) arg; gin; asn arg Met (M) leu; phe; ile leu Phe (F) leu; vai; ile; ala; tyr leu Pro (P) ala ala Ser (S) thr thr Thr (T) ser ser Trp (W) tyr; phe tyr Tyr (Y) trp; phe; thr; ser phe Vai (V) ile; leu; met; phe; ala; norleucina leu
As modificações substanciais na função ou identidade imunológica do polipéptido PRO são realizadas seleccionando substituições que diferem significativamente no seu efeito sobre a manutenção (a) da estrutura do esqueleto do polipéptido na área da substituição, por exemplo, como uma conformação em folha ou helicoidal, (b) da carga ou da hidrofobicidade da molécula no local alvo, ou (c) o volume da cadeia lateral. Os resíduos de ocorrência natural dividem-se em grupos com base nas propriedades comuns das cadeias laterais: (1) hidrófobos: norleucina, met, ala, vai, leu, ile; (2) hidrófilos neutros: cys, ser, thr; (3) ácidos: asp, glu; (4) básicos: asn, gin, his, lys, arg; (5) residuos que influenciam a orientação da cadeia: gly, pro; e (6) aromáticos: trp, tyr, phe. 54 ΕΡ 1 621 619/ΡΤ
As substituições não conservativas implicarão a troca de um membro de uma destas classes por um de outra classe. Estes residuos substituídos também podem ser introduzidos em locais de substituição conservativa ou, mais preferivelmente, nos locais remanescentes (não conservados).
As variações podem ser feitas utilizando métodos conhecidos na especialidade tais como mutagénese mediada por oligonucleótidos (dirigida ao local), varrimento de alaninas e mutagénese por PCR. Mutagénese dirigida ao local [Cárter et ai., Nucl. Acids Res., 13:4331 (1986); Zoller et al., Nucl. Acids Res., _10:6487 (1987)], mutagénese por cassetes [Wells et al., Gene, 34:315 (1985)], mutagénese de selecção de restrição [Wells et al., Philos. Trans. R. Soc. London SerA, 317:415 (1986)] ou outras técnicas conhecidas, podem ser realizadas no ADN clonado para produzir o ADN de variantes de PRO. A análise por varrimento de aminoácidos também pode ser empregue para identificar um ou mais aminoácidos ao longo de uma sequência contígua. Entre os aminoácidos preferidos para o varrimento estão os aminoácidos neutros, relativamente pequenos. Estes aminoácidos incluem alanina, glicina, serina, e cisteína. A alanina é tipicamente um aminoácido preferido para varrimento entre este grupo porque elimina a cadeia lateral para além do carbono beta e é menos provável que altere a conformação da cadeia principal da variante [Cunningham e Wells, Science, 244: 1081-1085 (1989)]. A alanina é também tipicamente preferida porque é o aminoácido mais comum. Adicionalmente, encontra-se frequentemente tanto em posições expostas como ocultas [Creighton, The Proteins, (W.H. Freeman & Co., N.Y.); Chothia, J. Mol. Biol., 150:1 (1976)]. Se a substituição por alanina não originar quantidades adequadas de variante, pode ser utilizado um aminoácido isotérico.
C. Modificações de PRO
As modificações covalentes de PRO estão incluídas no âmbito da presente invenção. Um tipo de modificação covalente inclui a reacção de resíduos de aminoácido alvo de um polipéptido PRO com um agente orgânico de derivatização que é 55 ΕΡ 1 621 619/ΡΤ capaz de reagir com cadeias laterais seleccionadas ou os resíduos N- ou C-terminais do PRO. A derivatização com agentes bifuncionais é útil, por exemplo, para a reticulação de PRO numa matriz de suporte insolúvel em água ou numa superfície para utilização no método para purificação de anticorpos anti-PRO, e vice-versa. Os agentes de reticulação normalmente utilizados incluem, e.g., 1,1-bis(diazoacetil)-2-feniletano, glutaraldeído, ésteres de N-hidroxissuccinimida, por exemplo, ésteres com ácido 4-azidossalicílico, imidoésteres homobifuncionais, incluindo ésteres de dissuccinimidilo tais como 3,3'-ditiobis(succinimidilpropionato), maleimidas bifuncionais tais como bis-N-maleimido-1,8-octano e agentes tais como metil-3-[(p-azidofenil)ditio]propioimidato.
Outras modificações incluem desamidação de resíduos glutaminilo e asparaginilo nos correspondentes resíduos glutamilo e aspartilo, respectivamente, hidroxilação de prolina e lisina, fosforilação de grupos hidroxilo de resíduos serilo ou treonilo, metilação dos grupos a-amino das cadeias laterais de lisina, arginina e histidina [T.E. Creighton, Proteins: Structure and Molecular Properties, W.H. Freeman & Co., San Francisco, pp. 79-86 (1983)], acetilação da amina N-terminal e amidação de qualquer grupo carboxilo C-terminal.
Outro tipo de modificação covalente do polipéptido PRO incluída no âmbito da presente invenção compreende a alteração do padrão de glicosilação nativo do polipéptido. A "alteração do padrão de glicosilação nativo" significa, para os presentes fins, a eliminação de uma ou mais porções hidrato de carbono encontradas no PRO de sequência nativa (quer por remoção do local de glicosilação subjacente quer eliminando a glicosilação por meios químicos e/ou enzimáticos), e/ou adição de um ou mais locais de glicosilação que não estão presentes no PRO de sequência nativa. Em adição, a frase inclui alterações qualitativas na glicosilação das proteínas nativas, envolvendo uma alteração na natureza e proporções das várias porções hidrato de carbono presentes. A adição de locais de glicosilação ao polipéptido PRO pode ser conseguida alterando a sequência de aminoácidos. A alteração pode ser realizada, por exemplo, através da adição, ou substituição, de um ou mais resíduos de serina ou treonina 56 ΕΡ 1 621 619/ΡΤ no PRO de sequência nativa (para locais de glicosilação com ligação a 0). A sequência de aminoácidos de PRO pode opcionalmente ser alterada através de alterações ao nivel do adn, particularmente, por mutação do ADN que codifica o polipéptido PRO em bases pré-seleccionadas de modo que sejam gerados codões que se irão traduzir nos aminoácidos desejados.
Outro meio para aumentar o número de porções hidrato de carbono no polipéptido PRO é através de acoplamento quimico ou enzimático de glicósidos ao polipéptido. Estes métodos estão descritos na especialidade, e.g., em WO 87/05330 publicado em 11 de Setembro de 1987, e em Aplin e Wriston, CRC Crit. Rev. Biochem., pp. 259-306 (1981). A remoção de porções hidrato de carbono presentes no polipéptido PRO pode ser realizada quimicamente ou enzimaticamente ou por substituição mutacional de codões que codificam para residuos de aminoácido que servem como alvos de glicosilação. As técnicas de desglicosilação química são conhecidas na especialidade e estão descritas, por exemplo, por Hakimuddin, et al., Arch. Biochem. Biophys., 259:52 (1987) e por Edge et al.r Anal. Biochem., 118:131 (1981). A clivagem enzimática de porções hidrato de carbono nos polipéptidos pode ser conseguida utilizando uma variedade de endo- e exo-glicosidases como descrito por Thotakura et al., Meth.
Enzymol., 138:350 (1987).
Outro tipo de modificação covalente de PRO compreende a ligação do polipéptido PRO a um de uma variedade de polímeros não proteináceos, e.g., polietilenoglicol (PEG), polipropilenoglicol ou polioxialquilenos, da maneira descrita nas Patentes U.S. 4,640,835; 4,496,689; 4,301,144; 4,670,417; 4,791,192 ou 4,179,337. O PRO da presente invenção pode também ser modificado de maneira a formar uma molécula quimérica compreendendo o PRO fundido com outro polipéptido ou sequência de aminoácidos heterólogos.
Numa concretização, esta molécula quimérica compreende uma fusão do PRO com um polipéptido marcador que proporciona um epítopo ao qual um anticorpo anti-marcador se pode ligar 57 ΕΡ 1 621 619/ΡΤ selectivamente. Ο marcador epitópico é geralmente colocado no terminal amino ou carboxilo do PRO. A presença destas formas marcadas com epítopo do PRO pode ser detectada utilizando um anticorpo contra o polipéptido marcador. Também, proporcionar o marcador epitópico permite que o PRO seja prontamente purificado por purificação por afinidade utilizando um anticorpo anti-marcador ou outro tipo de matriz de afinidade que se ligue ao marcador epitópico. Vários polipéptidos marcadores e seus respectivos anticorpos são bem conhecidos na especialidade. Os exemplos incluem marcadores poli-histidina (poli-his) ou poli-histidina-glicina (poli-his-gly); o polipéptido marcador HA da gripe e o seu anticorpo 12CA5 [Field et al., Mol, Cell. Biol., 8_:2159-2165 (1988)]; o marcador c-myc e os seus anticorpos 8F9, 3C7, 6E10, G4, B7 e 9E10 [Evan et al., Molecular and Cellular Bioloqy, 5_: 3610—3616 (1985)]; e o marcador glicoproteina D (gD) do virus Herpes Simplex e o seus anticorpo [Paborsky et al., Protein Engineering, ^(6) :547-553 (1990)]. Outros polipéptidos marcadores incluem o péptido Flag [Hopp et al., BioTechnology, _6_: 1204—1210 (1988)]; o péptido epitópico KT3 [Martin et al., Science, 255:192-194 (1992)]; um péptido epitópico a-tubulina [Skinner et al., J. Biol. Chem., 266:15163-15166 (1991)]; e o marcador peptidico de proteína do gene 10 de T7 [Lutz-Freyermuth et al., Proc. Natl. Acad. Sei. USA, 87:6393-6397 (1990) ] .
Numa concretização alternativa, a molécula quimérica pode compreender uma fusão do PRO com uma imunoglobulina ou uma região particular de uma imunoglobulina. Para uma forma bivalente da molécula quimérica (também referida como uma "imunoadesina"), esta fusão pode ser com a região Fc de uma molécula de igG. As fusões de Ig preferivelmente incluem a substituição de uma forma solúvel (domínio transmembranar eliminado ou inactivado) de um polipéptido PRO em vez de pelo menos uma região variável no interior de uma molécula de Ig. Numa concretização particularmente preferida, a fusão de imunoglobulina inclui as regiões charneira, CH2 e CH3, ou charneira, CHI, CH2 e CH3 de uma molécula de IgGl. Para a produção de fusões de imunoglobulina veja-se também a Patente US 5,428,130 publicada em 27 de Junho, 1995. 58 ΕΡ 1 621 619/ΡΤ
D. Preparação de PRO A descrição que se segue refere-se principalmente à produção de PRO por cultura de células transformadas ou transfectadas com um vector contendo ácido nucleico de PRO. Está, evidentemente, contemplado que possam ser empregues métodos alternativos, que são bem conhecidos na especialidade, para preparar o PRO. Por exemplo, a sequência de PRO, ou suas porções, podem ser produzidas por síntese peptídica directa utilizando técnicas em fase sólida [veja-se, e.g., Stewan et ai., Solid-Phase Peptide Synthesis, W.H. FreemanCo., San Francisco, CA (1969); Merrifield, J. Am. Chem. Soc., 85:2149-2154 (1963)]. A síntese de proteínas in vítro pode ser realizada utilizando técnicas manuais ou automatizadas. A síntese automatizada pode ser realizada, por exemplo, utilizando um sintetizador Applied Biosystems Peptide
Synthesizer (Foster City, CA) utilizando as instruções do fabricante. As várias porções do PRO podem ser quimicamente sintetizadas separadamente e combinadas utilizando métodos químicos ou enzimáticos para produzir o PRO de comprimento completo.
1. Isolamento de ADN que codifica PRO 0 ADN que codifica o PRO pode ser obtido a partir de uma biblioteca de ADNc preparada a partir de tecido que se crê possuir o ARNm de PRO e expressá-lo a um nível detectável. Deste modo, ADN de PRO humano pode ser obtido convenientemente a partir de uma biblioteca de ADNc preparada a partir de tecido humano, tal como descrito nos Exemplos. O gene que codifica PRO pode também ser obtido a partir de uma biblioteca genómica ou por procedimentos sintéticos conhecidos (e.g., síntese automatizada de ácido nucleico).
As bibliotecas podem ser pesquisadas com sondas (tais como anticorpos contra o PRO ou oligonucleótidos de pelo menos cerca de 20-80 bases) desenhadas para identificar o gene de interesse ou a proteína por ele codificada. A pesquisa da biblioteca genómica ou de ADNc com a sonda seleccionada pode ser conduzida utilizando procedimentos Standard, tal como descrito em Sambrook et al., Molecular Cloning: A Laboratory Manual (New York: Cold Spring Harbor Laboratory Press, 1989). 59 ΕΡ 1 621 619/ΡΤ
Um meio alternativo para isolar o gene que codifica o PRO é utilizar a metodologia de PCR [Sambrook et al., supra; Dieffenbach et al., PCR Primer: A Laboratory Manual (Cold Spring Harbor Laboratory Press, 1995)].
Os Exemplos que se seguem descrevem técnicas para a pesquisa de uma biblioteca de ADNc. As sequências oligonucleotidicas seleccionadas como sondas deverão ter comprimento suficiente e ser suficientemente não ambíguas para que sejam minimizados os falsos positivos. 0 oligonucleótido é preferivelmente marcado de modo a poder ser detectado após hibridação com ADN na biblioteca a pesquisar. Os métodos de marcação são bem conhecidos na especialidade, e incluem a utilização de marcadores radioactivos como ATP marcado com P, biotimlaçao ou marcaçao enzimatica. As condições de hibridação, incluindo as de rigor moderado e as muito rigorosas, são proporcionadas em Sambrook et al., supra.
As sequências identificadas através destes métodos de pesquisa de bibliotecas podem ser comparadas e alinhadas com outras sequências conhecidas depositadas e disponíveis em bases de dados públicas tais como a GenBank ou outras bases de dados de sequências privadas. A identidade de sequência (quer ao nível dos aminoácidos quer dos nucleótidos) no interior de regiões definidas da molécula ou ao longo da totalidade da sequência, pode ser determinada utilizando métodos conhecidos na especialidade e como aqui descrito. 0 ácido nucleico possuindo a sequência de codificação da proteína pode ser obtido através da pesquisa de bibliotecas seleccionadas, genómicas ou de ADNc, utilizando a sequência de aminoácidos deduzida aqui revelada pela primeira vez, e, se necessário, utilizando procedimentos convencionais de alongamento de iniciadores como descrito em Sambrook et al., supra, para detectar precursores e processando os intermediários de ARNm que podem não ter sofrido transcrição inversa em ADNc. 2. Selecção e Transformação de Células Hospedeiras
As células hospedeiras são transfectadas ou transformadas com vectores de expressão ou clonagem aqui descritos para a 60 ΕΡ 1 621 619/ΡΤ produção de PRO e cultivadas em meios nutrientes convencionais modificados conforme apropriado para a indução de promotores, selecção de transformantes ou amplificação dos genes que codificam as sequências desejadas. As condições de cultura, tais como meios, temperatura, pH e semelhantes, podem ser seleccionadas pelo perito sem demasiada experimentação. Em geral, princípios, protocolos e técnicas práticas para maximizar a produtividade das culturas celulares podem ser encontrados em Mammalian Cell BioTechnology: a Practical Approach, M. Butler, ed. (IRL Press, 1991) e Sambrook et al., supra.
Os métodos de transfecção de células eucariotas e transformação de células procariotas são conhecidos das pessoas competentes na matéria, por exemplo, mediados por CaCl2, CaPCq, lipossomas e electroporação. Dependendo da célula hospedeira utilizada, a transformação é realizada utilizando técnicas Standard apropriadas para essas células. O tratamento com cálcio empregando cloreto de cálcio, como descrito em Sambrook et al., supra, ou a electroporação, são geralmente utilizados para procariotas. A infecção com Agrobacterium tumefadens é utilizada para a transformação de certas células vegetais, como descrito por Shaw et al., Gene, 23_:315 (1983) e WO 89/05859 publicado em 29 de Junho de 1989. Para células de mamífero sem estas paredes celulares, pode ser empregue o método de precipitação com fosfato de cálcio de Graham e van der Eb, Virology, 52:456-457 (1978). Aspectos gerais de transfecções em sistemas de células hospedeiras de mamífero foram descritos na Patente u.S. 4,399,216. As transformações em levedura são tipicamente realizadas de acordo com o método de Van Solingen et al., J. Bact., 130:946 (1977) e Hsiao et al., Proc. Natl. Acad. Sei. (USA), 76 :3829 (1979). Contudo, podem também ser utilizados outros métodos para a introdução de ADN em células, tais como por micro-injecção nuclear, electroporação, fusão de protoplastos bacterianos com células intactas, ou policatiões, e.g., polibreno, poliornitina. Para várias técnicas para a transformação de células de mamífero, veja-se Keown et al., Methods in Enzymology, 185:527-537 (1990) e Mansour et al.,
Nature, 336:348-352 (1988). 61 ΕΡ 1 621 619/ΡΤ
As células hospedeiras adequadas para clonagem ou expressão do ADN nos presentes vectores incluem células procariotas, de levedura ou eucariotas superiores. Os procariotas adequados incluem, mas não lhes estão limitados, eubactérias, tais como organismos Gram-negativos ou Gram-positivos, por exemplo, Enterobacteriaceae tais como E. coli. Várias estirpes de E. coli estão disponíveis ao público, tais como E. coli Kl2 estirpe MM294 (ATCC 31,446); E. coli X1776 (ATCC 31, 537); E. coli estirpe W3110 (ATCC 27.325) e K5 772 (ATCC 53,635). Outras células hospedeiras procariotas adequadas incluem Enterobacteriaceae tais como Escherichia. e.g., E. coli. Enterobacter, Erwinia, Klebsiella, Proteus, Salmonella, e.g., Salmonella typhimurium, Serratia, e.g., Serratia marcescans e Shigella, assim como Bacilli tais como B. subtilis e B. licheniformis (e.g., B. licheniformis 41P revelado em DD 266,710 publicado em 12 de Abril de 1989), Pseudomonas tais como P. aeruginosa e Streptomyces. Estes exemplos são ilustrativos e não limitantes. A estirpe W3110 é um hospedeiro particularmente preferido ou hospedeiro parental pois é uma estirpe hospedeira comum para fermentações de produtos de ADN recombinante. Preferivelmente, a célula hospedeira segrega quantidades mínimas de enzimas proteolíticas. Por exemplo, a estirpe W3110 pode ser modificada para efectuar uma mutação genética nos genes que codificam proteínas endógenas ao hospedeiro, incluindo os exemplos destes hospedeiros E. coli W3110 estirpe 1A2, que possui o genótipo completo tonA; E. coli W3110 estirpe 9E4, que possui o genótipo completo tonA ptr3; E. coli W3110 estirpe 27C7 (ATCC 55,244), que possui o genótipo completo tonA ptr3 phoA E15 (argF-lac) 169 degP ompT kan'; E. coli W3110 estirpe 37D6, que possui o genótipo completo tonA ptr3 phoA E15 (argF-lac) 169 degP ompT rbs7 ilvG kan'; E. coli W3110 estirpe 40B4, que é a estirpe 37D6 com uma mutação de deleção de degP não resistente a canamicina; e uma estirpe de E. coli possuindo protease periplasmática mutante revelada na Patente U.S. 4,946,783 publicada em 7 de Agosto de 1990. Alternativamente, são adequados métodos de clonagem in vitro, e.g., PCR ou outras reacções com ácido nucleico-polimerase.
Em adição aos procariotas, micróbios eucariotas tais como fungos filamentosos ou leveduras são hospedeiros de clonagem ou expressão adequados para vectores de codificação de PRO. A 62 ΕΡ 1 621 619/ΡΤ
Saccharomyces cerevisiae é um microorganismo hospedeiro eucariota inferior vulgarmente utilizado. Outros incluem Schizosaccharomyces pombe (Beach e Nurse, Nature, 290: 140 [1981]; EP 139383 publicado em 2 de Maio de 1985); hospedeiros Kluyveromyces (Patente U.S. 4,943,529; Fleer et al., Bio/Technology, 9:968-975 (1991)) tais como, e.g., K. lactis (MW98-8C, CBS683, CBS4574; Louvencourt et al., J. Bacteriol., 154(2):737-742 [1983]), K. fragilis (ATCC 12,424), K. bulgaricus (ATCC 16,045), K. wickeramii (ATCC 24,178), K. waltii (ATCC 56,500), K. drosophilarum (ATCC 36,906; Van den Berg et al., Bio/Technology, 8:135 (1990)), K. thermotolerans, e K. marxianus; yarrowia (EP 402226); Pichia pastoris (EP 183070; Sreekrishna et al., J. Basic Microbiol., 28:265-278 [1988]); Candida; Trichoderma reesia (EP 244,234); Neurospora crassa (Case et al., Proc. Natl, Acad. Sei. USA, 76:5259-5263 [1979]): Schwanniomyces tais como Schwanniomyces occidentalis (EP 394538 publicado em 31 de Outubro de 1990); e fungos filamentosos tais como, e.g., Neurospora, Penicillium, Tolypocladium (WO 91/00357 publicado em 10 de Janeiro de 1991), e hospedeiros Aspergillus tais como A. nidulans (Ballance et al., Biochem. Biophys. Res. Commun., 112:284-289 [1983]; Tilbum et al., Gene, 26:205-221 [1983]; Yelton et al., Proc. Natl. Acad. Sei. USA, 81: 1470-1474 [1984]) e A. niger (Kelly e Hynes, EMBO J., 4:475-479 [1985]). As leveduras metilotrópicas são aqui adequadas e incluem, mas não lhes estão limitadas, leveduras capazes de crescer em metanol seleccionadas dos géneros que consistem em Hansenula, Candida, Kloeckera, Pichia, Saccharomyces, Torulopsis e Rhodotorula. Uma listagem de espécies especificas que constituem exemplos desta classe de leveduras pode ser encontrada em C. Anthony, The Biochemistry of Metilotrophs, 269 (1982).
As células hospedeiras adequadas para a expressão de PRO glicosilado são derivadas de organismos pluricelulares. Os exemplos de células de invertebrados incluem células de insecto tais como Drosophila S2 e Spodoptera Sf9, bem como células vegetais. Os exemplos de linhas celulares hospedeiras de mamífero úteis incluem células de ovário de hamster chinês (CHO) e COS. Exemplos mais específicos incluem a linha CVl de rim de macaco transformada por SV40 (COS-7, ATCC CRL 1651); a linha de rim embrionário humano (células 293 ou 293 63 ΕΡ 1 621 619/ΡΤ subclonadas para crescimento em cultura em suspensão, Graham et al., J. Gen Virol., 36:59 (1977)); células de ovário de hamster chinês/-DHFR (CHO. Urlaub e Chasin, Proc. Natl. Acad. Sei. USA, 77:4216 (1980)); células de Sertoli de ratinho (TM4, Mather, Biol. Reprod., 23:243-251 (1980)); células de pulmão humano (W138, ATCC CCL 75); células de figado humano (Hep G2, HB 8065); e tumor mamário de ratinho (MMT 060562, ATCC CCL51). Considera-se que a selecção da célula hospedeira apropriada faz parte da perícia na especialidade. 3. Selecção e Utilização de um Vector Replicável O ácido nucleico (e.g., ADNc ou ADN genómico) que codifica PRO pode ser inserido num vector replicável para clonagem (amplificação do ADN) ou para expressão. Vários vectores estão disponíveis ao público. O vector pode, por exemplo, estar na forma de um plasmídeo, cosmídeo, partícula virai ou fago. A sequência de ácido nucleico apropriada pode ser inserida no vector através de uma variedade de procedimentos. Em geral, o ADN é inserido num local ou locais para endonucleases de restrição apropriados utilizando técnicas conhecidas na especialidade. Os componentes do vector incluem geralmente, mas não lhes estão limitados, um ou mais de entre uma sequência de sinal, uma origem de replicação, um ou mais genes marcadores, um elemento potenciador, um promotor e uma sequência de terminação da transcrição. A construção de vectores adequados contendo um ou mais destes componentes emprega técnicas Standard de ligação que são conhecidas dos peritos. O PRO pode ser produzido recombinantemente não apenas directamente, mas também na forma de um polipéptido de fusão com um polipéptido heterólogo, que pode ser uma sequência de sinal ou outro polipéptido possuindo um local de clivagem específico no terminal N da proteína ou do polipéptido maduros. Em geral, a sequência de sinal pode ser um componente do vector, ou pode fazer parte do ADN que codifica o PRO que é inserido no vector. A sequência de sinal pode ser uma sequência de sinal de procariota seleccionada, por exemplo, do grupo de comandos de fosfatase alcalina, penicilinase, Ipp ou enterotoxina estável ao calor II. Para secreção em leveduras, a sequência de sinal pode ser, e.g., o comando da invertase de 64 ΕΡ 1 621 619/ΡΤ levedura, ο comando do factor alfa (incluindo comandos de factor α de Saccharomyces e Kluyveromyces, este último descrito na Patente U.S. 5,010,182), ou o comando da fosfatase ácida, o comando da glucoamilase de C. albicans (EP 362179 publicado em 4 de Abril de 1990), ou o sinal descrito em WO 90/13646 publicado em 15 de Novembro de 1990. Na expressão em células de mamífero, podem-se utilizar sequências de sinal de mamífero para dirigir a secreção da proteína, tais como as sequências de sinal de polipéptidos segregados da mesma espécie ou de espécies relacionadas, bem como comandos de secreção virais.
Tanto os vectores de expressão como os de clonagem contêm uma sequência de ácido nucleico que permite que o vector replique numa ou mais células hospedeiras seleccionadas. Estas sequências são bem conhecidas para uma variedade de bactérias, leveduras e vírus. A origem de replicação do plasmídeo pBR322 é adequada para a maioria das bactérias Gram-negativas, a origem do plasmídeo 2μ é adequada para leveduras, e várias origens virais (SV40, polioma, adenovírus, VSV ou BPV) são úteis para vectores de clonagem em células de mamífero.
Os vectores de expressão e clonagem tipicamente conterão um gene de selecção, também denominado um marcador seleccionável. Os genes de selecção típicos codificam proteínas que (a) conferem resistência a antibióticos ou outras toxinas, e.g., ampicilina, neomicina, metotrexato ou tetraciclina, (b) complementam deficiências auxotróficas, ou (c) fornecem nutrientes críticos não disponíveis a partir dos meios complexos, e.g., o gene que codifica D-alanina-racemase para Bacilli.
Um exemplo de marcadores seleccionáveis adequados para células de mamífero são aqueles que permitem a identificação de células competentes para assimilar o ácido nucleico que codifica PRO, tais como DHFR ou timidina-quinase. Uma célula hospedeira apropriada quando é empregue DHFR do tipo selvagem é a linha de células de CHO deficientes em actividade de DHFR, preparada e propagada como descrito por Urlaub et al., Proc. Natl. Acad. Sei. USA, 77:4216 (1980). Um gene de selecção adequado para utilização em levedura é o gene trpl presente no plasmídeo YRp7 de levedura [Stinchcomb et al., Nature, 282:39 65 ΕΡ 1 621 619/ΡΤ (1979); Kingsman et al., Gene, 7:141 (1979); Tschemper et al., Gene, 10:157 (1980)]. O gene trpl proporciona um marcador de selecção para uma estirpe mutante de levedura a que falta a capacidade de crescer em triptofano, por exemplo, ATCC N°. 44076 ou PEP4-1 [Jones, Genetics, 85:12 (1977)].
Os vectores de expressão e clonagem usualmente contêm um promotor ligado operativamente à sequência de ácido nucleico que codifica PRO para dirigir a sintese de ARNm. Os promotores reconhecidos por uma variedade de potenciais células hospedeiras são bem conhecidos. Os promotores adequados para utilização com hospedeiros procariotas incluem os sistemas promotores de β-lactamase e lactose [Chang et al., Nature, 275:615 (1978); Goeddel et al., Nature, 281:544 (1979)], fosfatase alcalina, um sistema promotor de triptofano (trp) [Goeddel, Nucleic Acids Res., 8:4057 (1980); EP 36776], e promotores híbridos tais como o promotor tac [deBoer et al., Proc. Natl. Acad. Sei. USA, 80:21-25 (1983)]. Os promotores para utilização em sistemas bacterianos também conterão uma sequência de Shine-Dalgarno (S.D.) ligada operativamente ao ADN que codifica PRO.
Os exemplos de sequências promotoras adequadas para utilização com hospedeiros de levedura incluem os promotores para 3-fosfoglicerato-quinase [Hitzeman et al., J. Biol. Chem., 255:2073 (1980)] ou outras enzimas glicolíticas [Hess et al., J. Adv. Enzima Req., 7:149 (1968); Holland, Biochemistry, 17:4900 (1978)], tais como enolase, gliceraldeído-3-fosfato-desidrogenase, hexoquinase, piruvato-descarboxilase, fosfofrutoquinase, glucose-6-fosfato-isomerase, 3-fosfoglicerato-mutase, piruvato-quinase, triosefosfato-isomerase, fosfoglucose-isomerase e glucoquinase.
Outros promotores de levedura, que são promotores indutíveis possuindo a vantagem adicional de transcrição controlada pelas condições de crescimento, são as regiões promotoras para a álcool-desidrogenase 2, isocitocromo C, fosfatase ácida, enzimas degradativas associadas ao metabolismo do azoto, metalotioneína, gliceraldeído-3-fosfato-desidrogenase e enzimas responsáveis pela utilização da maltose e da galactose. Os vectores e promotores adequados 66 ΕΡ 1 621 619/ΡΤ para utilização na expressão em leveduras são adicionalmente descritos em EP 73657. A transcrição de PRO a partir de vectores em células hospedeiras de mamifero é controlada, por exemplo, por promotores obtidos dos genomas de vírus tais como poliomavírus, vírus fowlpox (UK 2,211,504 publicado em 5 de Julho de 1989), adenovírus (tais como Adenovírus 2), papilomavírus de bovino, vírus do sarcoma aviário, citomegalovírus, um retrovírus, vírus de hepatite B e Vírus Símio 40 (SV40), a partir de promotores de mamífero heterólogos, e.g., o promotor da actina ou um promotor de imunoglobulina, e a partir de promotores de choque por calor, desde que estes promotores sejam compatíveis com os sistemas de células hospedeiras. A transcrição de um ADN que codifica o PRO por eucariotas superiores pode ser aumentada inserindo uma sequência potenciadora no vector. Os potenciadores são elementos de ADN que actuam em eis, usualmente com cerca de 10 a 300 pb, que actuam sobre um promotor para aumentar a sua transcrição. Muitas sequências potenciadoras são actualmente conhecidas de genes de mamífero (globina, elastase, albumina, a-fetoproteína e insulina). Tipicamente, contudo, utilizar-se-á um potenciador de um vírus de célula eucariota. Os exemplos incluem o potenciador de SV40 no lado tardio da origem de replicação (pb 100-270), o potenciador do promotor precoce de citomegalovírus, o potenciador de polioma no lado tardio da origem de replicação e potenciadores de adenovírus. O potenciador pode ser unido com splicing no vector numa posição a 5' ou 3' da sequência de codificação de PRO, mas está preferivelmente localizado do lado 5' do promotor.
Os vectores de expressão utilizados em células hospedeiras eucariotas (células de levedura, de fungo, de insecto, de planta, animais, humanas ou células nucleadas de outros organismos pluricelulares) conterão também sequências necessárias para a terminação da transcrição e para estabilização do ARNm. Estas sequências estão vulgarmente disponíveis a partir das regiões não traduzidas a 5' e, ocasionalmente a 3', de ADN ou ADNc eucariotas ou virais. Estas regiões contêm segmentos de nucleótidos transcritos na 67 ΕΡ 1 621 619/ΡΤ forma de fragmentos poliadenilados na porção não traduzida do ARNm que codifica PRO.
Ainda outros métodos, vectores e células hospedeiras adequados para adaptação à síntese de PRO em cultura de células recombinantes de vertebrado, estão descritos em Gething et al., Nature, 293:620-625 (1981); Mantei et al.,
Nature, 281:40-46 (1979); EP 117060; e EP 117058. 4. Detecção de Amplificação/Expressão de Genes A amplificação e/ou expressão de genes podem ser medidas numa amostra directamente, por exemplo, por Southern blotting convencional, Northern blotting para quantificar a transcrição de ARNm [Thomas, Proc. Natl. Acad. Sei. USA, 77:5201-5205 (1980)], dot blotting (análise de ADN), ou hibridação ín situ, utilizando uma sonda apropriadamente marcada, baseada nas sequências aqui proporcionadas. Alternativamente, podem ser empregues anticorpos que podem reconhecer dúplices específicas, incluindo dúplices de ADN, dúplices de ARN e dúplices híbridas de ADN-ARN ou dúplices de ADN-proteína. Os anticorpos por sua vez podem ser marcados e o ensaio pode ser realizado onde a dúplex está ligada a uma superfície, de modo a que pela formação da dúplex na superfície, a presença de anticorpo ligado à dúplex possa ser detectada. A expressão de genes, alternativamente, pode ser medida por métodos imunológicos, tais como coloração imuno-histoquímica de células ou secções de tecidos e ensaio de culturas celulares ou de fluidos corporais, para quantificar directamente a expressão do produto génico. Os anticorpos úteis para coloração imuno-histoquímica e/ou ensaio de amostras de fluidos podem ser monoclonais ou policlonais, e podem ser preparados em qualquer mamífero. Convenientemente, os anticorpos podem ser preparados contra um polipéptido PRO de sequência nativa ou contra um péptido sintético baseado nas sequências de ADN aqui proporcionadas ou contra uma sequência exógena fundida com ADN de PRO e codificando um epítopo de anticorpo específico. 68 ΕΡ 1 621 619/ΡΤ 5. Purificação do Polipéptido
As formas de PRO podem ser recuperadas a partir do meio de cultura ou de lisados das células hospedeiras. Se estiver ligado à membrana, pode ser libertado da membrana utilizando uma solução de detergente adequado (e.g. Triton-X 100) ou por clivagem enzimática. As células empregues na expressão de PRO podem ser rompidas através de vários meios fisicos ou quimicos, tais como ciclos de congelação-descongelação, tratamento com ultra-sons, ruptura mecânica ou agentes de lise celular.
Pode-se desejar purificar o PRO a partir de proteínas ou polipéptidos de células recombinantes. Os procedimentos que se seguem são exemplos de procedimentos de purificação adequados: por fraccionamento numa coluna de permuta iónica; precipitação com etanol; HPLC de fase inversa; cromatografia sobre sílica ou numa resina de permuta catiónica tal como DEAE: cromatofocagem; SDS-PAGE; precipitação com sulfato de amónio; filtração em gel utilizando, por exemplo, Sephadex G-75; colunas de proteína A-Sepharose para remover contaminantes tais como IgG; e colunas quelantes de metais para ligar formas marcadas com epítopo do PRO. Vários métodos de purificação de proteínas podem ser empregues e esses métodos são conhecidos na especialidade e estão descritos por exemplo em Deutscher, Methods in Enzymology, 182 (1990); Scopes, Protein
Purification: Principies and Practice, Springer-Verlag, New York (1982). 0(s) passo(s) de purificação seleccionado(s) irão depender, por exemplo, da natureza do processo de produção utilizado e do PRO particular produzido.
E. Utilizações para PRO
As sequências de nucleótidos (ou seu complemento) que codificam PRO têm várias aplicações na especialidade da biologia molecular, incluindo utilizações como sondas de hibridação, em mapeamento de cromossomas e genes e na geração de ADN e ARN anti-sentido. O ácido nucleico de PRO também será útil para a preparação de polipéptidos PRO por técnicas recombinantes aqui descritas. 69 ΕΡ 1 621 619/ΡΤ Ο gene de PRO de sequência nativa, de comprimento completo, ou suas porções, podem ser utilizados como sondas de hibridação para uma biblioteca de ADNc para isolar o ADNc de PRO de comprimento completo ou para isolar ainda outros ADNc (por exemplo, os que codificam variantes de ocorrência natural de PRO ou PRO de outras espécies) que têm uma identidade de sequência desejada com a sequência de PRO nativa aqui revelada. Opcionalmente, o comprimento das sondas será de cerca de 20 a cerca de 50 bases. As sondas de hibridação podem ser derivadas de regiões pelo menos parcialmente novas da sequência de nucleótidos nativa de comprimento completo em que essas regiões podem ser determinadas sem demasiada experimentação ou de sequências genómicas incluindo promotores, elementos potenciadores e intrões de PRO de sequência nativa. A titulo de exemplo, um método de pesquisa compreenderá o isolamento da região de codificação do gene de PRO utilizando a sequência de ADN conhecida para sintetizar uma sonda seleccionada de cerca de 40 bases. As sondas de hibridação podem ser marcadas por uma variedade de marcadores, incluindo radionuclidos tais como 32P ou 35S, ou marcadores enzimáticos tais como fosfatase alcalina acoplada à sonda por via de sistemas de acoplamento avidina/biotina. As sondas marcadas possuindo uma sequência complementar à do gene de PRO da presente invenção podem ser utilizadas para pesquisar bibliotecas de ADNc humano, ADN genómico ou ARNm para determinar com que membros dessas bibliotecas a sonda híbrida. As técnicas de hibridação estão descritas com mais detalhes nos Exemplos adiante.
Quaisquer sequências de EST reveladas no presente pedido de patente podem ser similarmente empregues como sondas, utilizando os métodos aqui revelados.
Outros fragmentos úteis dos ácidos nucleicos de PRO incluem oligonucleótidos de sentido directo ou anti-sentido compreendendo uma sequência de ácido nucleico de cadeia simples (quer arn, quer ADN) capaz de se ligar a sequências alvo de ARNm de PRO (sentido directo) ou ADN de PRO (anti-sentido) . Os oligonucleótidos anti-sentido ou de sentido directo, de acordo com a presente invenção, compreendem um fragmento da região de codificação do ADN de PRO. Este fragmento geralmente compreende pelo menos cerca de 14 70 ΕΡ 1 621 619/ΡΤ nucleótidos, preferivelmente de cerca de 14 a 30 nucleótidos. A capacidade de derivar um oligonucleótido anti-sentido ou um de sentido directo, com base numa sequência de ADNc que codifica uma determinada proteína está descrita, por exemplo, em Stein e Cohen (Câncer Res. 48:2659, 1988) e van der Krol et al. (BioTechniques 6:958, 1988). A ligação de oligonucleótidos anti-sentido ou de sentido directo a sequências de ácido nucleico alvo resulta na formação de dúplices que bloqueiam a transcrição ou a tradução da sequência alvo através de um de vários meios, incluindo a degradação aumentada das dúplices, a terminação prematura da transcrição ou da tradução, ou por outros meios. Os oligonucleótidos anti-sentido podem assim ser utilizados para bloquear a expressão de proteínas PRO. Os oligonucleótidos anti-sentido ou de sentido directo compreendem ainda oligonucleótidos possuindo esqueletos de açúcar-fosfodiéster modificados (ou outras ligações de açúcares, tais como as descritas em wo 91/06629) e em que essas ligações de açúcares são resistentes a nucleases endógenas. Estes oligonucleótidos com ligações de açúcares resistentes são estáveis in vivo (i.e., capazes de resistir a degradação enzimática) mas retêm a especificidade da sequência para se poderem ligar a sequências de nucleótidos alvo.
Outros exemplos de oligonucleótidos de sentido directo ou anti-sentido incluem os oligonucleótidos que estão ligados covalentemente a porções orgânicas, tais como os descritos em WO 90/10048, e outras porções que aumentam a afinidade do oligonucleótido para com uma sequência de ácido nucleico alvo, tais como poli-(L-lisina). Adicionalmente, agentes intercalantes, tais como elipticina, e agentes alquilantes ou complexos metálicos, podem ser ligados a oligonucleótidos de sentido directo ou anti-sentido para modificar as especificidades de ligação do oligonucleótido anti-sentido ou de sentido directo para com a sequência de nucleótidos alvo.
Os oligonucleótidos anti-sentido ou de sentido directo podem ser introduzidos numa célula contendo a sequência de ácido nucleico alvo por qualquer método de transferência de genes, incluindo, por exemplo, transfecção de ADN mediada por CaP04, electroporação ou utilizando vectores de transferência 71 ΕΡ 1 621 619/ΡΤ de genes tais como o vírus de Epstein-Barr. Num procedimento preferido, um oligonucleótido anti-sentido ou de sentido directo é inserido num vector retroviral adequado. Uma célula contendo a sequência de ácido nucleico alvo é colocada em contacto com o vector retroviral recombinante, quer in vivo quer ex vivo. Os vectores retrovirais adequados incluem, mas não lhes estão limitados, os derivados dos retrovírus murinos M-MuLV, N2 (um retrovírus derivado de M-MuLV), ou os vectores de cópia dupla designados por DCT5A, DCT5B e DCT5C (veja-se WO 90/13641) .
Os oligonucleótidos de sentido directo ou anti-sentido também podem ser introduzidos numa célula contendo a sequência de nucleótidos alvo por formação de um conjugado com uma molécula de ligação a um ligando, como descrito em WO 91/04753. As moléculas de ligação a ligandos adequadas incluem, mas não lhes estão limitadas, receptores da superfície celular, factores de crescimento, outras citoquinas, ou outros ligandos que se ligam a receptores da superfície celular. Preferivelmente, a conjugação da molécula de ligação ao ligando não interfere substancialmente com a capacidade da molécula de ligação ao ligando se ligar à sua molécula ou receptor correspondentes, nem bloqueia a entrada do oligonucleótido de sentido directo ou anti-sentido ou da sua versão conjugada, na célula.
Alternativamente, um oligonucleótido de sentido directo ou um anti-sentido pode ser introduzido numa célula contendo a sequência de ácido nucleico alvo por formação de um complexo oligonucleótido-lípido, como descrito em WO 90/10448. O complexo oligonucleótido de sentido directo ou anti-sentido-lípido é preferivelmente dissociado no interior da célula através de uma lipase endógena.
As moléculas de ADN ou ARN anti-sentido ou de sentido directo têm geralmente pelo menos cerca de 5 bases de comprimento, cerca de 10 bases de comprimento, cerca de 15 bases de comprimento, cerca de 20 bases de comprimento, cerca de 25 bases de comprimento, cerca de 30 bases de comprimento, cerca de 35 bases de comprimento, cerca de 40 bases de comprimento, cerca de 45 bases de comprimento, cerca de 50 bases de comprimento, cerca de 55 bases de 72 ΕΡ 1 621 619/ΡΤ comprimento, cerca de 60 bases de comprimento, cerca de 65 bases de comprimento , cerca de 70 bases de comprimento, cerca de 75 bases de comprimento, cerca de 80 bases de comprimento, cerca de 85 bases de comprimento, cerca de 90 bases de comprimento, cerca de 95 bases de comprimento, cerca de 100 bases de comprimento, ou mais.
As sondas podem também ser empregues em técnicas de PCR para gerar um conjunto de sequências para identificação de sequências de codificação de PRO estreitamente relacionadas.
As sequências de nucleótidos que codificam um PRO podem também ser utilizadas para construir sondas de hibridação para mapeamento de genes que codificam esse PRO e para a análise genética de indivíduos com desordens genéticas. As sequências de nucleótidos aqui proporcionadas podem ser mapeadas num cromossoma e regiões especificas de um cromossoma utilizando técnicas conhecidas, tais como hibridação in situ, análise de ligação génica (linkage analysis) contra marcadores cromossómicos conhecidos e pesquisa de hibridação com bibliotecas.
Quando as sequências de codificação para PRO codificam uma proteína que se liga a outra proteína (por exemplo, quando o PRO é um receptor), o PRO pode ser utilizado em ensaios para identificar as outras proteínas ou moléculas envolvidas na interacção de ligação. Através destes métodos, podem ser identificados inibidores da interacção de ligação receptor/ligando. As proteínas envolvidas nestas interacções de ligação podem também ser utilizadas para pesquisar inibidores peptídicos ou de molécula pequena ou agonistas da interacção de ligação. Também, o PRO receptor pode ser utilizado para isolar ligando(s) correlacionados. Podem ser desenhados ensaios de pesquisa para encontrar compostos líder que imitam a actividade biológica de um PRO nativo ou um receptor para PRO. Estes ensaios de pesquisa incluirão ensaios susceptíveis de pesquisa de alto rendimento de bibliotecas químicas, o que os torna particularmente adequados para a identificação de candidatos a fármacos de molécula pequena. As moléculas pequenas contempladas incluem compostos sintéticos orgânicos ou inorgânicos. Os ensaios podem ser realizados numa variedade de formatos, incluindo ensaios de ligação proteína- 73 ΕΡ 1 621 619/ΡΤ proteína, ensaios de pesquisa bioquímica, imunoensaios e ensaios à base de células, que estão bem caracterizados na especialidade.
Os ácido nucleicos que codificam PRO ou suas formas modificadas podem também ser utilizados para gerar animais transgénicos ou "knock-out" que, por sua vez, são úteis no desenvolvimento e pesquisa de reagentes terapeuticamente úteis. Um animal transgénico (e.g., um ratinho ou rato) é um animal possuindo células que contêm um transgene, transgene este que foi introduzido no animal ou num ascendente do animal num estágio prenatal, e.g., estágio embrionário. Um transgene é um ADN que está integrado no genoma de uma célula a partir da qual se desenvolve o animal transgénico. Numa concretização, o ADNc que codifica PRO pode ser utilizado para clonar ADN genómico que codifica PRO de acordo com técnicas estabelecidas e as sequências genómicas podem ser utilizadas para gerar animais transgénicos que contêm células que expressam o ADN que codifica o PRO. Os métodos para gerar animais transgénicos, particularmente animais tais como ratinhos ou ratos, tornaram-se convencionais na especialidade e estão descritos, por exemplo, nas Patentes U.S. 4,736,866 e 4,870,009. Tipicamente, células particulares serão escolhidas como alvo para a incorporação do transgene de PRO com potenciadores específicos de tecidos. Os animais transgénicos que incluem uma cópia de um transgene que codifica PRO introduzidas na linha germinal do animal num estágio embrionário podem ser utilizados para examinar o efeito de expressão aumentada de ADN que codifica PRO. Estes animais podem ser utilizados como animais de teste para reagentes que se pensa conferirem protecção contra, por exemplo, condições patológicas associadas à sua sobre-expressão. De acordo com esta faceta da invenção, um animal é tratado com o reagente e uma incidência reduzida da condição patológica, comparada com a de animais não tratados portadores do transgene, indicaria uma potencial intervenção terapêutica para a condição patológica.
Alternativamente, homólogos não humanos de PRO podem ser utilizados para construir um animal "knock-out" relativamente a PRO que possui um gene codificador de PRO defectivo ou alterado em resultado de recombinação homóloga entre o gene 74 ΕΡ 1 621 619/ΡΤ endógeno que codifica PRO e o ADN genómico alterado que codifica PRO introduzido numa célula estaminal embrionária do animal. Por exemplo, ADNc que codifica PRO pode ser utilizado para clonar ADN genómico que codifica PRO de acordo com técnicas estabelecidas. Uma porção do ADN genómico que codifica PRO pode ser eliminada ou substituída por outro gene, tal como um gene codificando um marcador seleccionável que pode ser utilizado para monitorar a integração. Tipicamente, estão incluídas no vector várias quilobases de ADN flanqueador inalterado (em ambas as extremidades 5' e 3') [veja-se e.g., Thomas e Capecchi, Cell, 51:503 (1987) para uma descrição de vectores de recombinação homóloga]. O vector é introduzido numa linha de células estaminais embrionárias (e.g., por electroporação) e as células em que o ADN introduzido foi homologamente recombinado com o ADN endógeno são seleccionadas [veja-se e.g., Li et al., Cell, 69:915 (1992)]. As células seleccionadas são então injectadas num blastocisto de um animal (e.g., um ratinho ou rato) para formar quimeras de agregação [veja-se e.g., Bradley, em Teralocarcinomas and Embryonic Stem Cells: A Practical Approach, E.J. Robertson, ed. (IRL, Oxford, 1987), pp. 113-152]. Um embrião quimérico pode então ser implantado num animal hospedeiro fêmea pseudográvida adequada e o embrião é levado a termo para criar um animal "knock-out". A progénie portadora do ADN homologamente recombinado nas suas células germinais pode ser identificada por técnicas Standard e utilizada para criar animais em que todas as células do animal contêm o ADN homologamente recombinado. Os animais knock-out podem ser caracterizados por exemplo, pela sua capacidade de se defenderem contra certas condições patológicas e pelo seu desenvolvimento de condições patológicas devido à ausência do polipéptido PRO. O ácido nucleico que codifica os polipéptidos PRO pode também ser utilizado em terapia génica. Em aplicações de terapia génica, os genes são introduzidos em células de modo a conseguir a síntese in vivo de um produto genético terapeuticamente eficaz, por exemplo para substituição de um gene defectivo. A "terapia génica" inclui tanto a terapia génica convencional onde um efeito duradouro é conseguido através de um único tratamento, como a administração de agentes terapêuticos génicos, que envolve a administração de 75 ΕΡ 1 621 619/ΡΤ uma só vez ou repetida de um ADN ou ARNm terapeuticamente eficazes. Os ADN e ARN anti-sentido podem ser utilizados como agentes terapêuticos para o bloqueio da expressão de certos genes in vivo. Mostrou-se já que oligonucleótidos anti-sentido curtos podem ser importados pelas células onde actuam como inibidores, apesar das suas baixas concentrações intracelulares causadas pela sua restrita assimilação pela membrana celular. (Zamecnik et al., Proc. Natl. Acad. Sei. USA 83:4143-4146 [1986]). Os oligonucleótidos podem ser modificados para aumentar a sua assimilação, e.g. substituindo os seus grupos fosfodiéster negativamente carregados por grupos não carregados.
Existem uma variedade de técnicas disponíveis para a introdução de ácidos nucleicos em células viáveis. As técnicas variam dependendo de se o ácido nucleico é transferido para células de cultura in vitro, ou in vivo nas células do hospedeiro pretendido. As técnicas adequadas para a transferência de ácido nucleico para células de mamífero in vitro incluem a utilização de lipossomas, electroporação, micro-injecção, fusão celular, DEAE-dextrano, o método de precipitação com fosfato de cálcio, etc. As técnicas de transferência de genes in vivo presentemente preferidas incluem a transfecção com vectores virais (tipicamente retrovirais) e transfecção mediada por lipossomas de proteína do revestimento virai (Dzau et al., Trends in BioTechnology 11, 205-210 [1993]) . Em algumas situações é desejável proporcionar a fonte de ácido nucleico com um agente que tem como alvo células alvo, tal como um anticorpo específico para uma proteína de membrana da superfície celular ou para a célula alvo, um ligando para um receptor na célula alvo, etc. Quando são empregues lipossomas, podem ser utilizadas proteínas que se ligam a uma proteína de membrana da superfície celular associada a endocitose, para atingir e/ou facilitar a assimilação, e.g. proteínas da cápside ou seus fragmentos trópicos para um tipo de células em particular, anticorpos para proteínas que sofrem internalização em ciclos, proteínas que têm como alvo uma localização intracelular e aumentam a semivida intracelular. A técnica de endocitose mediada por receptores é descrita, por exemplo, por Wu et al., J. Biol, Chem. 262, 4429-4432 (1987); e Wagner et al., Proc.
Natl. Acad. Sei. USA 87, 3410-3414 (1990) . Para uma revisão de 76 ΕΡ 1 621 619/ΡΤ protocolos de marcação de genes e terapia génica veja-se Anderson et al., Science 256, 808-813 (1992).
Os polipéptidos PRO aqui descritos podem também ser empregues como marcadores de peso molecular para fins de electroforese de proteínas e as sequências de ácido nucleico isoladas podem ser utilizadas para a expressão recombinante desses marcadores.
As moléculas de ácido nucleico que codificam os polipéptidos PRO ou seus fragmentos aqui descritos são úteis para a identificação de cromossomas. A este respeito, existe uma necessidade crescente de identificar novos marcadores de cromossomas, pois estão actualmente disponíveis relativamente poucos reagentes marcadores para cromossomas, baseados nos actuais dados de sequências. Cada molécula de ácido nucleico de PRO da presente invenção pode ser utilizada como um marcador de cromossoma.
Os polipéptidos PRO e moléculas de ácido nucleico da presente invenção podem também ser utilizados para a tipificação de tecidos, em que os polipéptidos PRO da presente invenção podem ser expressos diferencialmente num tecido em comparação com outros. As moléculas de ácido nucleico de PRO serão úteis para gerar sondas para PCR, análise de Northern, análise de Southern e análise de Western.
Os polipéptidos aqui descritos podem também ser empregues como agentes terapêuticos. Os polipéptidos PRO da presente invenção podem ser formulados de acordo com métodos conhecidos para preparar composições farmaceuticamente úteis, em que o produto PRO é combinado em mistura com um veículo transportador farmaceuticamente aceitável. As formulações terapêuticas são preparadas para armazenagem misturando o ingrediente activo possuindo o grau desejado de pureza com transportadores, excipientes ou estabilizantes opcionais fisiologicamente aceitáveis (Remington's Pharmaceutical Sciences 16th edition, Osol, A. Ed. (1980)), na forma de formulações liofilizadas ou soluções aquosas. Os transportadores, excipientes ou estabilizantes aceitáveis não são tóxicos para os beneficiários nas dosagens e concentrações empregues, e incluem tampões tais como fosfato, citrato e 77 ΕΡ 1 621 619/ΡΤ outros ácidos orgânicos; antioxidantes incluindo ácido ascórbico; polipéptidos de baixo peso molecular (menos de cerca de 10 residuos); proteínas, tais como albumina sérica, gelatina ou imunoglobulinas; polímeros hidrófilos tais como polivinilpirrolidona, aminoácidos tais como glicina, glutamina, asparagina, arginina ou lisina; monossacáridos, dissacáridos e outros hidratos de carbono incluindo glucose, manose ou dextrinas; agentes quelantes tais como EDTA; aldóis tais como manitol ou sorbitol; contra-iões formadores de sais tais como sódio; e/ou tensioactivos não iónicos tais como TWEEN™, PLURONICS™ ou PEG.
As formulações para utilização para administração in vivo têm que ser estéreis. Isto consegue-se facilmente por filtração através de membranas de esterilização por filtração, antes ou após a liofilização e a reconstituição.
As presentes composições terapêuticas geralmente são colocadas num recipiente possuindo uma porta de acesso estéril, por exemplo, um saco ou frasco de solução intravenosa possuindo uma rolha perfurável com uma agulha de injecção hipodérmica. A via de administração é de acordo com métodos conhecidos, e.g. injecção ou infusão pelas vias intravenosa, intraperitoneal, intracerebral, intramuscular, intra-ocular, intra-arterial ou intralesional, administração tópica, ou por sistemas de libertação sustentada.
As dosagens e concentrações de fármaco desejadas das composições farmacêuticas da presente invenção podem variar dependendo da utilização particular pretendida. A determinação da dosagem ou via de administração apropriadas faz parte dos conhecimentos dos médicos. As experiências com animais proporcionam orientações fiáveis para a determinação das doses eficazes para terapia humana. O escalonamento inter-espécies das doses eficazes pode ser realizado seguindo os princípios estabelecidos por Mordenti, J. e Chappell, W. "The use of interspecies scaling in toxicokinetics" Em Toxicokinetics and New Drug Development, Yacobi et al., Eds., Pergamon Press, New
York 1989, pp. 42-96. 78 ΕΡ 1 621 619/ΡΤ
Quando é empregue a administração in vivo de um polipéptido PRO ou um seu agonista ou antagonista, as quantidades de dosagem normais podem variar de cerca de 10 ng/kg até 100 mg/kg de peso corporal de mamífero, ou mais, por dia, preferivelmente de cerca de 1 pg/kg/dia a 10 mg/kg/dia, dependendo da via de administração. É proporcionada na literatura orientação quanto às dosagens e métodos de entrega particulares; veja-se, por exemplo, Pat. U.S. 4,657,760; 5,206,344; ou 5,225,212. Antecipa-se que diferentes formulações serão eficazes para diferentes compostos de tratamento e diferentes desordens, que a administração dirigida a um órgão ou tecido, por exemplo, pode necessitar de uma entrega de uma maneira diferente daquela que é empregue para outro órgão ou tecido.
Quando se pretende a administração de libertação sustentada de um polipéptido PRO numa formulação com características de libertação adequadas para o tratamento de qualquer doença ou desordem que requer a administração do polipéptido PRO, está contemplada a microencapsulação do polipéptido PRO. A microencapsulação de proteínas recombinantes para libertação sustentada foi realizada com sucesso com hormona do crescimento humana (rhGH), interferão-(rhlFN-), interleucina-2 e MN rgpl20. Johnson et al., Nat. Med., 2:795-799 (1996); Yasuda, Biomed. Ther., 27:1221-1223 (1993); Hora et al.r Bio/Technology, 8:755-758 (1990);
Cleland, "Design and Production of Single Immunization Vaccines Using Polylactide Polyglycolide Microsphere Systems," em Vaccine Design: The Subunit and Adjuvant Approach, Powell e Newman, eds, (Plenum Press: New York, 1995), pp. 439-462; WO 97/03692, WO 96/40072, WO 96/07399; e Pat. U.S. 5,654,010.
As formulações de libertação sustentada destas proteínas foram desenvolvidas utilizando o polímero poli-ácido láctico-co-glicólico (PLGA) devido à sua biocompatibilidade e ampla gama de propriedades biodegradáveis. Os produtos da degradação do PLGA, os ácidos láctico e glicólico, podem ser rapidamente depurados no corpo humano. Adicionalmente, a degradabilidade deste polímero pode ser ajustada para desde meses a anos, dependendo do seu peso molecular e da sua composição. Lewis, "Controlled release of bioactive agents from lactide/glycolide polymer," em: M. Chasin e R. Langer (Eds.), Biodegradable 79 ΕΡ 1 621 619/ΡΤ
Polymers as Drug Delivery Systems (Mareei Dekker: New York, 1990), pp. 1-41. A presente invenção abrange métodos de pesquisa de compostos para identificar aqueles que imitam 0 polipéptido PRO (agonistas) ou previnem o efeito do polipéptido PRO (antagonistas) São desenhados ensaios de pesquisa para candidatos a fármacos antagonistas, para identificar compostos que se ligam ou complexam com os polipéptidos PRO codificados pelos genes aqui identificados, ou de outro modo interferem na interaeção dos polipéptidos codificados com outras proteínas celulares. Estes ensaios de pesquisa incluirão ensaios susceptíveis a pesquisa de alto rendimento de bibliotecas químicas, tornando-o que os torna particularmente adequados para a identificação de candidatos a fármacos de molécula pequena.
Os ensaios podem ser realizados numa variedade de formatos, incluindo ensaios de ligação proteína-proteína, ensaios bioquímicos de pesquisa, imunoensaios e ensaios à base de células, que estão bem caracterizados na especialidade.
Todos os ensaios para antagonistas têm em comum que exigem o contacto do fármaco candidato com um polipéptido PRO codificado por um ácido nucleico aqui identificado sob condições e durante um tempo suficientes para permitir que esses dois componentes interajam.
Em ensaios de ligação, a interaeção é a ligação e o complexo formado pode ser isolado ou detectado na mistura reaccional. Numa concretização particular, o polipéptido PRO codificado pelo gene aqui identificado ou o candidato a fármaco é imobilizado numa fase sólida, e.g., numa placa de microtítulo, por ligação covalente ou não covalente. A ligação não covalente geralmente é conseguida através do revestimento da superfície sólida com uma solução do polipéptido PRO e secagem. Alternativamente, um anticorpo imobilizado, e.g., um anticorpo monoclonal, específico para o polipéptido PRO a imobilizar pode ser utilizado para o ancorar a uma superfície sólida. O ensaio é realizado por adição do componente não imobilizado, que pode ser marcado através de um marcador detectável, ao componente imobilizado, e.g., a superfície 80 ΕΡ 1 621 619/ΡΤ revestida contendo ο componente ancorado. Quando a reacção está completa, os componentes que não reagiram são removidos, e.g., por lavagem, e os complexos ancorados à superfície sólida são detectados. Quando o componente originalmente não imobilizado possui um marcador detectável, a detecção de marcador imobilizado na superfície indica que ocorreu complexação. Quando o componente originalmente não imobilizado não possui um marcador, a complexação pode ser detectada, por exemplo, utilizando um anticorpo marcado que se liga especificamente ao complexo imobilizado.
Se o composto candidato interagir com, mas não se ligar a, um polipéptido PRO particular codificado por um gene aqui identificado, a sua interacção com esse polipéptido pode ser ensaiada por métodos bem conhecidos para a detecção de interacções proteína-proteína. Estes ensaios incluem abordagens tradicionais, tais como, e.g., ligação cruzada, co-imunoprecipitação e co-purificação através de gradientes ou colunas cromatográficas. Em adição, as interacções proteína-proteína podem ser monitoradas utilizando um sistema genético à base de leveduras descrito por Fields e colaboradores (Fields e Song, Nature (London), 340:245-246 (1989); Chien et al.r Proc. Natl. Acad. Sei. USA, 88:9578-9582 (1991)) como descrito por Chevray e Nathans, Proc. Natl. Acad. Sei. USA, 89: 5789-5793 (1991). Muitos activadores da transcrição, tais como GAL4 de levedura, consistem em dois domínios modulares fisicamente discretos, um actuando como o domínio de ligação a ADN, o outro funcionando como o domínio de activação da transcrição. O sistema de expressão em leveduras descrito nas publicações anteriores (genericamente referido como o "sistema de dois híbridos") tira vantagens desta propriedade, e emprega duas proteínas híbridas, uma em que a proteína alvo é fundida com o domínio de ligação a ADN de GAL4, e outra em que as proteínas de activação candidatas são fundidas ao domínio de activação. A expressão de um gene repórter GALl-lacZ sob o controlo de um promotor activado por GAL4 depende da reconstituição de actividade de GAL4 por via da interacção proteína-proteína. As colónias contendo os polipéptidos interactuantes são detectadas com um substrato cromogénico para a β-galactosidase. Um kit completo (MATCHMAKER™) para identificação de interacções proteína-proteína entre duas proteínas específicas utilizando a técnica dos dois híbridos 81 ΕΡ 1 621 619/ΡΤ está comercialmente disponível de Clontech. Este sistema pode também ser estendido ao mapeamento de domínios de proteínas envolvidos em interacções específicas de proteínas bem como para localizar exactamente resíduos de aminoácido que são cruciais para estas interacções.
Os compostos que interferem na interacção de um gene que codifica um polipéptido PRO aqui identificado com outros componentes intra- ou extracelulares podem ser testados como se segue: usualmente prepara-se uma mistura reaccional contendo o produto do gene e o componente intra- ou extracelular sob condições e durante um tempo que permitam a interacção e a ligação dos dois produtos. Para testar a capacidade de um composto candidato para inibir a ligação, a reacção é realizada na ausência e na presença do composto de teste. Em adição, pode ser adicionado um placebo numa terceira mistura reaccional, para servir como controlo positivo. A ligação (formação de complexo) entre o composto de teste e o componente intra- ou extracelular presente na mistura é monitorada como aqui descrito acima. A formação de complexo na reacção de controlo mas não na mistura reaccional contendo o composto de teste indica que o composto de teste interfere com a interacção entre o composto de teste e o seu parceiro reaccional.
Para ensaiar antagonistas, o polipéptido PRO pode ser adicionado a uma célula juntamente com o composto a pesquisar quanto a uma actividade particular, e a capacidade do composto inibir a actividade de interesse na presença do polipéptido PRO indica que o composto é um antagonista do polipéptido PRO. Alternativamente, os antagonistas podem ser detectados combinando o polipéptido PRO e um antagonista potencial com receptores de polipéptido PRO ligados a membranas ou receptores recombinantes sob condições apropriadas para um ensaio de inibição competitiva. 0 polipéptido PRO pode ser marcado, por exemplo por radioactividade, de modo que o número de moléculas de polipéptido PRO ligadas ao receptor pode ser utilizado para determinar a eficácia do antagonista potencial. 0 gene que codifica o receptor pode ser identificado por numerosos métodos conhecidos dos peritos na especialidade, por exemplo, rastreio de ligandos ("panning") e separação por FACS. Coligan et al., Current Protocols in Immun., 1(2): 82 ΕΡ 1 621 619/ΡΤ
Chapter 5 (1991). Preferivelmente, é empregue clonagem de expressão em que o ARN poliadenilado é preparado a partir de uma célula responsiva ao polipéptido PRO e uma biblioteca de ADNc criada a partir deste arn é dividida em conjuntos e utilizada para transfectar células COS ou outras células que não são responsivas ao polipéptido PRO. As células transfectadas que são crescidas em lâminas de vidro são expostas ao polipéptido PRO marcado. 0 polipéptido PRO pode ser marcado através de uma variedade de meios incluindo iodação ou inclusão de um local de reconhecimento para uma proteina-quinase especifica do local. Após fixação e incubação, as lâminas são submetidas a análise autorradiográfica. Os conjuntos positivos são identificados e são preparados subconjuntos que são re-transfectados utilizando um processo de nova pesquisa e formação de subconjuntos interactivo, eventualmente obtendo um único clone que codifica o receptor putativo.
Como abordagem alternativa para identificação de receptores, o polipéptido PRO marcado pode ser ligado por fotoafinidade a preparações de extractos ou membranas celulares que expressam a molécula do receptor. O material reticulado é resolvido por PAGE e exposto a filme de raio-X. 0 complexo marcado contendo o receptor pode ser excisado, resolvido em fragmentos peptídicos, e submetido a micro-sequenciação de proteínas. A sequência de aminoácidos obtida da micro-sequenciação seria utilizada para desenhar um conjunto de sondas oligonucleotídicas degeneradas para pesquisar uma biblioteca de ADNc para identificar o gene que codifica o receptor putativo.
Noutro ensaio para antagonistas, células de mamífero ou uma preparação de membrana, que expressam o receptor, seriam incubadas com polipéptido PRO marcado na presença do composto candidato. A capacidade do composto para melhorar ou bloquear esta interacção pode então ser medida.
Exemplos mais específicos de potenciais antagonistas incluem um oligonucleótido que se liga às fusões de imunoglobulina com polipéptido PRO, e, em particular anticorpos incluindo, sem limitação, anticorpos policlonais e monoclonais e fragmentos de anticorpo, anticorpos de cadeia 83 ΕΡ 1 621 619/ΡΤ única, anticorpos anti-idiotipicos e versões quiméricas ou humanizadas destes anticorpos ou fragmentos, bem como anticorpos e fragmentos de anticorpo humanos. Alternativamente, um potencial antagonista pode ser uma proteína estreitamente relacionada, por exemplo, uma forma mutada do polipéptido PRO que reconhece o receptor mas não confere efeito, inibindo desse modo competitivamente a acção do polipéptido PRO.
Outro potencial antagonista de polipéptido PRO é uma construção de ADN ou ARN anti-sentido preparada utilizando tecnologia anti-sentido, onde, e.g., uma molécula de ADN ou ARN anti-sentido actua para bloquear directamente a tradução de ARNm por hibridação com o ARNm alvo e evitando a tradução da proteína. A tecnologia anti-sentido pode ser utilizada para controlar a expressão génica através da formação de hélices triplas ou ADN ou ARN anti-sentido, ambos os métodos baseados na ligação de um polinucleótido a ADN ou ARN. Por exemplo, a porção de codificação a 5' da sequência do polinucleótido, que codifica os presentes polipéptidos PRO maduros, é utilizada para desenhar um oligonucleótido de ARN anti-sentido de cerca de 10 a 40 pares de bases de comprimento. Um oligonucleótido de ADN é desenhado para ser complementar à região do gene envolvida na transcrição (hélice tripla - veja-se Lee et al., Nucl. Acids Res., 6:3073 (1979); Cooney et al., Science, 241: 456 (1988); Dervan et al., Science, 251:1360 (1991)), desse modo evitando a transcrição e a produção do polipéptido PRO. O oligonucleótido de ARN anti-sentido híbrida com o ARNm in vivo e bloqueia a tradução da molécula de ARNm no polipéptido PRO (anti-sentido - Okano, Neurochem., 56:560 (1991);
Oligodeoxynucleotides as Anti-sense Inhibitors of Gene Expression (CRC Press: Boca Raton, FL, 1988). Os oligonucleótidos atrás descritos podem também ser entregues a células de modo a que o ADN ou ARN anti-sentido possam ser expressos in vivo para inibir a produção do polipéptido PRO. Quando se utiliza ADN anti-sentido, são preferidos os oligodesoxirribonucleótidos derivados do local de iniciação da tradução, e.g., entre cerca das posições -10 e +10 da sequência de nucleótidos do gene alvo.
Os antagonistas potenciais incluem pequenas moléculas que se ligam ao local activo, ao local de ligação ao receptor ou a 84 ΕΡ 1 621 619/ΡΤ factor de crescimento ou outro local de ligação relevante do polipéptido PRO, bloqueando assim a actividade biológica normal do polipéptido PRO. Os exemplos de pequenas moléculas incluem, mas não lhes estão limitados, pequenos péptidos ou moléculas semelhantes a péptidos, preferivelmente péptidos solúveis e compostos não peptidicos sintéticos orgânicos ou inorgânicos.
As ribozimas são moléculas de ARN enzimáticas capazes de catalisar a clivagem especifica de ARN. As ribozimas actuam por hibridação especifica de sequência com o ARN alvo complementar, seguida por clivagem endonucleolitica. Os locais específicos para clivagem por ribozimas no interior de um potencial ARN alvo podem ser identificados por técnicas conhecidas. Para mais detalhes veja-se, e.g., Rossi, Current Biology, 4:469-471 (1994), e a publicação do PCT WO 97/33551 (publicado em 18 de Setembro, 1997).
As moléculas de ácido nucleico em formação de hélice tripla utilizadas para inibir a transcrição deverão ser de cadeia simples e compostas por desoxinucleótidos. A composição de bases destes oligonucleótidos é desenhada de modo a promover a formação da hélice tripla por meio das regras de emparelhamento de bases de Hoogsteen, que geralmente requerem trechos dimensionáveis de purinas ou pirimidinas numa cadeia de uma dúplex. Para mais detalhes veja-se, e.g., a publicação de PCT WO 97/33551, supra.
Estas pequenas moléculas podem ser identificadas por qualquer um ou mais dos ensaios de pesquisa aqui discutidos acima e/ou através de quaisquer outras técnicas de pesquisa bem conhecidas dos peritos na especialidade.
As utilizações das moléculas aqui reveladas podem também ser baseadas nos resultados positivos de ensaios funcionais revelados e descritos adiante.
F. Anticorpos Anti-PRO A presente invenção proporciona ainda anticorpos anti-PRO. Os exemplos de anticorpos incluem anticorpos policlonais, monoclonais, humanizados, biespecíficos e heteroconjugados. 85 ΕΡ 1 621 619/ΡΤ 1. Anticorpos Policlonais os anticorpos anti-PRO podem compreender anticorpos policlonais. Os métodos de preparação de anticorpos policlonais são conhecidos dos peritos. Os anticorpos policlonais podem ser criados num mamífero, por exemplo, através de uma ou mais injecções de um agente imunizante e, se desejado, um adjuvante. Tipicamente, o agente imunizante e/ou adjuvante serão injectados no mamífero através de múltiplas injecções subcutâneas ou intraperitoneais. 0 agente imunizante pode incluir o polipéptido PRO ou uma sua proteína de fusão. Pode ser útil conjugar o agente imunizante com uma proteína que se sabe ser imunogénica no mamífero a imunizar. Os exemplos destas proteínas imunogénicas incluem, mas não lhes estão limitados, hemocianina de lapa Fissurella, albumina sérica, tiroglobulina bovina e inibidor de tripsina de soja. Os exemplos de adjuvantes que podem ser empregues incluem adjuvante completo de Freund e o adjuvante MPL-TDM (monofosforil-Lípido A, dicorinomicolato de trealose sintético). 0 protocolo de imunização pode ser seleccionado por um perito na especialidade sem demasiada experimentação. 2. Anticorpos monoclonais
Os anticorpos anti-PRO podem, alternativamente, ser anticorpos monoclonais. Os anticorpos monoclonais podem ser preparados utilizando métodos de hibridomas, tais como os descritos por Kohler e Milstein, Nature, 256:495 (1975). Num método de hibridoma, um ratinho, um hamster ou outro animal hospedeiro apropriado, é tipicamente imunizado com um agente imunizante para eliciar linfócitos que produzem ou são capazes de produzir anticorpos que se irão ligar especificamente ao agente imunizante. Alternativamente, os linfócitos podem ser imunizados in vitro. 0 agente imunizante incluirá tipicamente o polipéptido PRO ou uma sua proteína de fusão. Geralmente, são utilizados linfócitos do sangue periférico ("PBL") quando se pretendem células de origem humana, ou são utilizadas células do baço ou células dos nódulos linfáticos quando se pretendem fontes de mamífero não humano. Os linfócitos são então 86 ΕΡ 1 621 619/ΡΤ fundidos com uma linha de células imortalizada utilizando um agente de fusão adequado, tal como polietilenoglicol, para formar uma célula de hibridoma [Goding, Monoclonal Antibodies: Principies and Practice, Academic Press, (1986) pp. 59-103]. As linhas de células imortalizadas são usualmente células de mamífero transformadas, particularmente células de mieloma de origem em roedor, bovina e humana. Usualmente, são empregues linhas de células de mieloma de rato ou ratinho. As células de hibridoma podem ser cultivadas num meio de cultura adequado que preferivelmente contém uma ou mais substâncias que inibem o crescimento ou a sobrevivência das células imortalizadas não fundidas. Por exemplo, se as células parentais não possuem a enzima hipoxantina-guanina-fosforibosil-transferase (HGPRT ou HPRT), o meio de cultura para os hibridomas tipicamente incluirá hipoxantina, aminopterina e timidina ("meio HAT"), substâncias estas que impedem o crescimento de células deficientes em HGPRT.
As linhas células imortalizadas preferidas são aquelas que se fundem eficientemente, suportam a expressão estável e a nível elevado de anticorpo pelas células produtoras de anticorpo seleccionadas, e são sensíveis a um meio como o meio HAT. As linhas de células imortalizadas mais preferidas são as linhas de mieloma murino, que podem ser obtidas, por exemplo, a partir do Salk Institute Cell Distribution Center, San Diego, Califórnia e na American Type Cultura Collection, Manassas, Virgínia. Linhas de células de mieloma humano e heteromieloma de ratinho-humano também foram descritas para a produção de anticorpos monoclonais humanos [Kozbor, j. Immunol., 133:3001 (1984); Brodeur et ai., Monoclonal Antibody Production Techniques and Applications, Mareei Dekker, Inc., New York, (1987) pp. 51-63]. O meio de cultura em que as células de hibridoma são cultivadas pode então ser ensaiado quanto à presença de anticorpos monoclonais dirigidos contra PRO. Preferivelmente, a especificidade de ligação dos anticorpos monoclonais produzidos pelas células de hibridoma é determinada por imunoprecipitação ou através de um ensaio de ligação in vitro, tal como um radioimunoensaio (RIA) ou um ensaio imunoabsorvente com enzima ligada (ELISA). Estas técnicas e ensaios são conhecidos na especialidade. A afinidade de 87 ΕΡ 1 621 619/ΡΤ ligação do anticorpo monoclonal pode, por exemplo, ser determinada pela análise Scatchard de Munson e Poliard, Anal Biochem., 107:220 (1980).
Depois de identificadas as células de hibridoma desejadas, os clones podem ser subclonados por procedimentos de diluição limitante e crescidos por métodos Standard [Goding, supra]. Os meios de cultura adequados para este fim incluem, por exemplo, Meio de Eagle Modificado por Dulbecco e meio RPMI-1640. Alternativamente, as células de hibridoma podem ser crescidas in vivo na forma de ascites num mamífero.
Os anticorpos monoclonais segregados pelos subclones podem ser isolados ou purificados a partir do meio de cultura ou do fluido ascítico por procedimentos de purificação para imunoglobulinas convencionais tais como, por exemplo, cromatografia em proteína A-Sepharose, em hidroxilapatite, electroforese em gel, diálise ou cromatografia de afinidade.
Os anticorpos monoclonais podem também ser preparados por métodos de ADN recombinante, tais como os descritos na Patente U.S. 4,816,567. O ADN que codifica os anticorpos monoclonais da invenção pode ser facilmente isolado e sequenciado utilizando procedimentos convencionais (e.g., utilizando sondas oligonucleotídicas que são capazes de se ligar especificamente a genes que codificam as cadeias pesadas e leves de anticorpos murinos). As células de hibridoma da invenção servem como uma fonte preferida deste ADN. Uma vez isolado, o ADN pode ser colocado em vectores de expressão, que são então transfectados para células hospedeiras tais como células COS de símio, células de ovário de hamster chinês (CHO) ou células de mieloma que de outro modo não produzem a proteína imunoglobulina, para obter a síntese de anticorpos monoclonais nas células hospedeiras recombinantes. O ADN também pode ser modificado, por exemplo, substituindo pela sequência de codificação para domínios constantes de cadeia pesada e leve humanos no lugar das sequências homólogas de murino [Patente U.S. 4,816,567; Morrison et al., supra] ou por ligação covalente à sequência de codificação da imunoglobulina da totalidade ou parte da sequência de codificação para um polipéptido que não de imunoglobulina. Um tal polipéptido que não de imunoglobulina pode substituir os domínios constantes 88 ΕΡ 1 621 619/ΡΤ de um anticorpo da invenção, ou pode substituir os domínios variáveis de um local de combinação com o antigénio de um anticorpo da invenção para criar um anticorpo quimérico bivalente.
Os anticorpos podem ser anticorpos monovalentes. Os métodos para a preparação de anticorpos monovalentes são bem conhecidos na especialidade. Por exemplo, um método envolve a expressão recombinante de cadeia leve e cadeia pesada modificada de imunoglobulina. A cadeia pesada é truncada geralmente em qualquer ponto na região Fc de modo a evitar a reticulação da cadeia pesada. Alternativamente, os resíduos de cisteína relevantes são substituídos por outro resíduo de aminoácido ou são eliminados de modo a evitar a reticulação.
Os métodos in vítro são também adequados para a preparação de anticorpos monovalentes. A digestão de anticorpos para produzir seus fragmentos, particularmente, fragmentos Fab, pode ser realizada utilizando técnicas de rotina conhecidos na especialidade. 3. Anticorpos Humanos e Humanizados
Os anticorpos anti-PRO da invenção podem ainda compreender anticorpos humanizados ou anticorpos humanos. As formas humanizadas de anticorpos não humanos (e.g., murinos) são imunoglobulinas quiméricas, cadeias de imunoglobulina ou seus fragmentos (tais como Fv, Fab, Fab', F(ab')2 ou outras subsequências de ligação ao antigénio de anticorpos) que contêm a sequência mínima derivada de imunoglobulina não humana. Os anticorpos humanizados incluem imunoglobulinas humanas (anticorpo receptor) em que resíduos de uma região determinante de complementaridade (CDR) do receptor são substituídos por resíduos de uma CDR de uma espécie não humana (anticorpo dador) tal como ratinho, rato ou coelho, possuindo a especificidade, a afinidade e a capacidade desejadas. Em alguns casos, resíduos estruturais (Framework) de Fv da imunoglobulina humana são substituídos por resíduos correspondentes não humanos. Os anticorpos humanizados podem também compreender resíduos que não se encontram nem no anticorpo receptor nem nas sequências CDR ou Framework importadas. Em geral, o anticorpo humanizado compreenderá 89 ΕΡ 1 621 619/ΡΤ substancialmente a totalidade de pelo menos um, e tipicamente dois, domínios variáveis, em que a totalidade ou substancialmente a totalidade das regiões CDR correspondem às de uma imunoglobulina não humana e a totalidade ou substancialmente a totalidade das regiões FR são as da sequência de consenso de imunoglobulina humana. 0 anticorpo humanizado optimamente também compreenderá pelo menos uma porção de uma região constante de imunoglobulina (Fc), tipicamente a de uma imunoglobulina humana [Jones et al., Nature, 321:522-525 (1986); Riechmann et al., Nature, 332 :323-329 (1988); e Presta, Curr. Op. Struct. Biol., ,2:593-596 (1992)] .
Os métodos para anticorpos não humanos humanizados são bem conhecidos na especialidade. Geralmente, um anticorpo humanizado possui um ou mais resíduos de aminoácido introduzidos, de uma fonte que não é humana. Estes resíduos de aminoácido não humanos são frequentemente referidos como resíduos "importados", que são tipicamente tomados de um domínio variável "importado". A humanização pode ser essencialmente realizada segundo o método de Winter e colaboradores [Jones et al., Nature, 321:522-525 (1986); Riechmann et al., Nature, 332:323-327 (1988); Verhoeyen et ai., Science. 239:1534-1536 (1988)], substituindo pelas CDR ou sequências de CDR de roedores as sequências correspondentes de um anticorpo humano. Deste modo, estes anticorpos "humanizados" são anticorpos quiméricos (Patente U.S. 4,816,567), em que substancialmente menos do que um domínio variável humano intacto foi substituído pela sequência correspondente de uma espécie não humana. Na prática, os anticorpos humanizados são tipicamente anticorpos humanos em que alguns resíduos de CDR e possivelmente alguns resíduos de FR estão substituídos por resíduos de locais análogos em anticorpos de roedores.
Os anticorpos humanos podem também ser produzidos utilizando várias técnicas conhecidas na especialidade, incluindo bibliotecas de exibição em fagos [Hoogenboom e Winter, J. Mol. Biol., 227:381 (1991); Marks et al., J. Mol. Biol., 222:581 (1991)]. A técnicas de Cole et al. e Boerner et al. estão também disponíveis para a preparação de anticorpos monoclonais humanos (Cole et al., Monoclonal Antibodies and 90 ΕΡ 1 621 619/ΡΤ Câncer Therapy, Alan R. Liss, p. 77 (1985) e Boerner et al., J. Immunol., 147(1) : 86-95 (1991)]. Similarmente, os anticorpos humanos podem ser preparados introduzindo loci de imunoglobulina humana em animais transgénicos, e.g., ratinhos em que os genes de imunoglobulina endógenos foram parcial ou completamente inactivados. Por provocação, observa-se produção de anticorpo humano, que se assemelha de próximo àquele que é encontrado em seres humanos, em todos os aspectos, incluindo o rearranjo de genes, a montagem e o repertório de anticorpos. Esta abordagem é descrita, por exemplo, na Patente U.S. 5,545,807; 5,545,806; 5,569,825; 5,625,126; 5,633,425; 5,661,016, e nas seguintes publicações cientificas: Marks et al., Bio/Technoloqy 10, 779-783 (1992); Lonberg et al., Nature 368 856-859 (1994); Morrison, Nature 368, 812-13 (1994); Fishwild et al., Nature BioTechnoloqy 14, 845-51, (1996); Neuberger, Nature BioTechnology 14, 826 (1996); Lonberg e Huszar, Intern. Rev. Immunol. 13 65-93 (1995) . 4. Anticorpos Biespecíficos
Os anticorpos biespecíficos são anticorpos monoclonais, preferivelmente humanos ou humanizados, que possuem especificidades de ligação para pelo menos dois antigénios diferentes. No presente caso, uma das especificidades de ligação é para o PRO, a outra é para qualquer outro antigénio, e preferivelmente para uma proteína ou um receptor ou subunidade de receptor, da superfície celular.
Os métodos para a produção de anticorpos biespecíficos são conhecidos na especialidade. Tradicionalmente, a produção recombinante de anticorpos biespecíficos baseia-se na co-expressão de dois pares de cadeia pesada/cadeia leve de imunoglobulina, onde as duas cadeias pesadas possuem diferentes especificidades [Milstein e Cuello, Nature, 305:537-539 (1983)]. Devido à distribuição aleatória de cadeias pesadas e leves de imunoglobulina, estes hibridomas (quadromas) produzem uma mistura potencial de dez diferentes moléculas de anticorpo, das quais apenas uma possui a estrutura biespecífica correcta. A purificação da molécula correcta é usualmente realizada através de passos de cromatografia de afinidade. Procedimentos similares são 91 ΕΡ 1 621 619/ΡΤ revelados em WO 93/08829, publicado em 13 de Maio de 1993, e em Traunecker et al., EMBO J., 1_0:3655-3659 (1991).
Os domínios variáveis de anticorpos com as especificidades de ligação desejadas (locais de combinação anticorpo-antigénio) podem ser fundidos a sequências de domínio constante de imunoglobulina. A fusão preferivelmente é com um domínio constante de cadeia pesada de imunoglobulina, compreendendo pelo menos parte das regiões charneira, CH2 e CH3. Prefere-se ter a primeira região constante de cadeia pesada (CHI) contendo o local necessário para a ligação da cadeia leve presente em pelo menos uma das fusões. Os ADN que codificam as fusões de cadeia pesada de imunoglobulina e, se desejado, a cadeia leve de imunoglobulina, são inseridos em vectores de expressão separados, e são co-transfectados num organismo hospedeiro adequado. Para mais detalhes de como gerar anticorpos biespecíficos veja-se, por exemplo, Suresh et al., Methods in Enzymology, 121:210 (1986).
De acordo com outra abordagem descrita em WO 96/27011, a interface entre um par de moléculas de anticorpo pode ser manipulada para maximizar a percentagem de heterodímeros que são recuperados da cultura de células recombinantes. A interface preferida compreende pelo menos uma parte da região CH3 de um domínio constante de anticorpo. Neste método, uma ou mais cadeias laterais pequenas de aminoácidos da interface da primeira molécula de anticorpo são substituídas por cadeias laterais maiores (e.g. tirosina ou triptofano). "Cavidades" compensadoras de dimensão idêntica ou similar à(s) cadeia(s) lateral(ais) grande(s) são criadas na interface da segunda molécula de anticorpo substituindo cadeias laterais grandes de aminoácidos por pequenas (e.g. alanina ou treonina). Isto proporciona um mecanismo para aumentar o rendimento do heterodímero relativamente a outros produtos finais não desejados tais como homodímeros.
Os anticorpos biespecíficos podem ser preparados na forma de anticorpos de comprimento completo ou de fragmentos de anticorpo (e.g. anticorpos biespecíficos F(ab')2). As técnicas para gerar anticorpos biespecíficos a partir de fragmentos de anticorpo estão descritas na literatura. Por exemplo, podem-se preparar anticorpos biespecíficos utilizando ligação química. 92 ΕΡ 1 621 619/ΡΤ
Brennan et al., Science 229:81 (1985) descrevem um procedimento em que anticorpos intactos são proteoliticamente clivados para gerar fragmentos F(ab')2. Estes fragmentos são reduzidos na presença do agente complexante de ditiol, arsenito de sódio, para estabilizar ditiois vicinais e prevenir a formação de dissulfureto intermolecular. Os fragmentos Fab' gerados são então convertidos em derivados tionitrobenzoato (TNB). Um dos derivados Fab'-TNB é então reconvertido no Fab'-tiol por redução com mercaptoetilamina e é misturado com uma quantidade equimolar do outro derivado Fab'-TNB para formar o anticorpo biespecifico. Os anticorpos biespecificos produzidos podem ser utilizados como agentes para a imobilização selectiva de enzimas.
Os fragmentos Fab' podem ser directamente recuperados a partir de E. coli e acoplados quimicamente para formar anticorpos biespecificos. Shalaby et al., J. Exp. Med. 175:217-225 (1992) descrevem a produção de uma molécula de anticorpo biespecífico F(ab')2 completamente humanizado. Cada fragmento Fab foi segregado separadamente a partir de E. coli e submetido a acoplamento quimico directo in vitro para formar o anticorpo biespecífico. 0 anticorpo biespecífico assim formado era capaz de se ligar a células que sobre-expressam o receptor ErbB2 e células T humanas normais, assim como desencadear a actividade lítica de linfócitos citotóxicos humanos contra alvos de tumor da mama humano.
Foram também descritas várias técnicas para a produção e isolamento de fragmentos de anticorpos biespecificos directamente a partir da cultura de células recombinantes. Por exemplo, foram produzidos anticorpos biespecificos utilizando "fechos-de-correr" de leucinas. Kostelny et al., J. Immunol. 148(5):1547-1553 (1992). Os péptidos "fecho-de-correr" de leucinas das proteínas Fos e Jun foram ligados às porções Fab' de dois anticorpos diferentes por fusão de genes. Os homodímeros de anticorpos foram reduzidos na região charneira para formar monómeros e depois re-oxididados para formar os heterodímeros de anticorpos. Este método pode também ser utilizado para a produção de homodímeros de anticorpos. A tecnologia dos "diacorpos" descrita por Hollinger et al., Proc Natl. Acad. Sei. USA 90:6444-6448 (1993) proporcionou um mecanismo alternativo para a produção de fragmentos de 93 ΕΡ 1 621 619/ΡΤ anticorpos biespecíficos. Os fragmentos compreendem um domínio variável da cadeia pesada (VH) ligado a um domínio variável da cadeia leve (VL) através de um ligante que é demasiado curto para permitir o emparelhamento entre os dois domínios na mesma cadeia. Deste modo, os domínios VH e VL de um fragmento são forçados a emparelhar com os domínios VL e VH complementares de outro fragmento, formando desse modo dois locais de ligação ao antigénio. Foi também relatada outra estratégia para a produção de fragmentos de anticorpos biespecíficos utilizando dímeros de Fv de cadeia única (sFv). Veja-se Gruber et al., J. Immunol. 152:5368 (1994). Estão contemplados anticorpos com mais do que duas valências. Por exemplo, podem-se preparar anticorpos triespecíficos. Tun et al., J. Immunol. 147:60 (1991) .
Anticorpos biespecíficos exemplificativos podem ligar-se a dois epítopos diferentes num determinado polipéptido PRO da presente invenção. Alternativamente, uma braço anti-polipéptido PRO pode ser combinado com um braço que se liga a uma molécula desencadeadora num leucócito tal como uma molécula receptora de células T (e.g. CD2, CD3, CD28 ou B7), ou receptores Fc para IgG (FcyR), tais como Fc^RI (CD64), FcyRII (CD32) e FcYRIII (CD16) de modo a focar os mecanismos de defesa celular na célula que expressa o polipéptido PRO particular. Os anticorpos biespecíficos podem também ser utilizados para localizar agentes citotóxicos para células que expressam um polipéptido PRO particular. Estes anticorpos possuem uma braço de ligação a PRO e um braço que se liga a um agente citotóxico ou um quelante de radionuclidos, tal como EOTUBE, DPTA, DOTA ou TETA. Outro anticorpo biespecífico de interesse liga-se ao polipéptido PRO e liga-se ainda ao factor tissular (TF). 5. Anticorpos Heteroconjugados
Os anticorpos heteroconjugados estão também no âmbito da presente invenção. Os anticorpos heteroconjugados são compostos por dois anticorpos unidos covalentemente. Estes anticorpos foram, por exemplo, propostos para direccionar células do sistema imunitário para células indesejadas [Patente U.S. 4,676,980], e para o tratamento de infecção por HIV [WO 91/00360: WO 92/300373; EP 03089]. Está contemplado 94 ΕΡ 1 621 619/ΡΤ que os anticorpos possam ser preparados in vitro utilizando métodos conhecidos na química da síntese de proteínas, incluindo aqueles que envolvem agentes reticulantes. Por exemplo, podem ser construídas imunotoxinas utilizando uma reacção de permuta de dissulfureto ou por formação de uma ligação tioéter. Os exemplos de reagentes adequados para este fim incluem iminotiolato e metil-4-mercaptobutirimidato e os descritos, por exemplo, na Patente U.S. 4,676,980. 6. Manipulação da Função Efectora
Pode ser desejável modificar o anticorpo da invenção em relação à função efectora, de modo a aumentar, e.g., a eficácia do anticorpo no tratamento de cancro. Por exemplo, podem ser introduzidos resíduos de cisteína na região Fc, permitindo assim a formação de ligações dissulfureto intercadeias nesta região. O anticorpo homodimérico assim gerado pode ter capacidade de internalização melhorada e/ou morte celular mediada pelo complemento e citotoxicidade celular dependente de anticorpos (ADCC) aumentadas. Veja-se Caron et al., J. Exp Med., 176: 1191-1195 (1992) e Shopes, J. Immunol., 148: 2918-2922 (1992). Os anticorpos homodiméricos com actividade antitumoral aumentada podem também ser preparados utilizando reticulantes heterobifuncionais como descrito em Wolff et al. Câncer Research, 53: 2560-2565 (1993) . Alternativamente, um anticorpo pode ser manipulado de modo a possuir regiões Fc duplas e pode assim ter capacidades melhoradas de lise de complemento e ADCC. Veja-se Stevenson et al., Anti-Cancer Drug Design, 3: 219-230 (1989). 7. Imunoconjugados A invenção também se refere a imunoconjugados compreendendo um anticorpo conjugado com um agente citotóxico tal como um agente quimioterapêutico, uma toxina (e.g., uma toxina enzimaticamente activa de origem bacteriana, fúngica, vegetal ou animal, ou seus fragmentos), ou um isótopo radioactivo (i.e., um radioconjugado).
Os agentes quimioterapêuticos úteis na produção destes imunoconjugados foram acima descritos. As toxinas enzimaticamente activas e seus fragmentos que podem ser 95 ΕΡ 1 621 619/ΡΤ utilizados incluem a cadeia A da difteria, fragmentos activos não ligantes da toxina da difteria, cadeia A da exotoxina (de Pseudomonas aeruginosa), cadeia A da ricina, cadeia A da abrina, cadeia A da modecina, alfa-sarcina, proteínas de Aleurites fordii, proteínas diantina, proteínas de Phytolaca americana (PAPI, PAPII e PAP-S), inibidor de Momordica charantia, curcina, crotina, inibidor de Sapaonaria officinalis, gelonina, mitogelina, resrietocina, fenomicina, enomicina, e os tricotecenos. Estão disponíveis uma variedade de radionuclidos para a produção de anticorpos 919 191 191 QÍ1 radioconjugados. Os exemplos incluem Bi, I, In, Y e 186Re,
Os conjugados do anticorpo e do agente citotóxico são produzidos utilizando uma variedade de agentes de acoplamento de proteínas bifuncionais tais como propionato de N-succinimidil-3-(2-piridilditiol) (SPDP), iminotiolano (IT), derivados bifuncionais de imidoésteres (tais como adipimidato de dimetilo hcl), ésteres activos (tais como suberato de dissuccinimidilo), aldeídos (tais como glutaraldeido), compostos bis-azido (tais como bis(p-azidobenzoíl) hexanodiamina), derivados de bis-diazónio (tais como bis-(p-diazóniobenzoil)etilenodiamina), diisocianatos (tais como 2,6-diisocianato de tolieno), e compostos de flúor bis-activos (tais como 1,5-difluoro-2,4-dinitrobenzeno). Por exemplo, pode ser preparada uma imunotoxina de ricina como descrito em vitetta et al., Science, 238: 1098 (1987). O benzil-3-metil-1-isotiocianato de ácido dietilenotriaminopenta-acético (MX-DTPA) marcado com carbono-14 é um exemplo de agente quelante para conjugação de radionucleótidos ao anticorpo. Veja-se WO94/11026.
Noutra concretização, o anticorpo pode ser conjugado com um "receptor" (tal como estreptavidina) para utilização no pré-direccionamento para tumores em que o conjugado anticorpo-receptor é administrado ao paciente, seguido de remoção de conjugado não ligado da circulação utilizando um agente de depuração e depois administração de um "ligando" (e.g., avidina) que está conjugado a um agente citotóxico (e.g., um radionucleótido). 96 ΕΡ 1 621 619/ΡΤ 8. Imunolipossomas
Os anticorpos aqui revelados podem também ser formulados na forma de imunolipossomas: Lipossomas contendo o anticorpo são preparados por métodos conhecidos na especialidade, tal como descrito em Epstein et al., Proc. Natl. Acad. Sei. USA, 82: 3688 (1985); Hwang et al., Proc. Natl Acad. Sei. USA, 77: 4030 (1980); e nas Pat. U.S. 4,485,045 e 4,544,545. Lipossomas com tempo de circulação aumentado são revelados na Patente U.S. 5,013,556.
Lipossomas particularmente úteis podem ser gerados pelo método da evaporação em fase inversa com uma composição lipídica compreendendo fosfatidileolina, colesterol e fosfatidiletanolamina derivatizada com PEG (PEG-PE). Os lipossomas são extrudidos através de filtros de tamanho de poro definido para obter lipossomas com o diâmetro desejado. Fragmentos Fab' do anticorpo da presente invenção podem ser conjugados aos lipossomas como descrito em Martin et al., J. Biol, Chem,, 257: 286-288 (1982) através de uma reacção de interpermuta de dissulfureto. Um agente quimioterapêutico (tal como Doxorubicina) está opcionalmente contido no interior do lipossoma. Veja-se Gabizon et al., J. National Câncer Inst., 81(19) : 1484 (1989) . 9. Composições Farmacêuticas de Anticorpos
Os anticorpos que se ligam especificamente a um polipéptido PRO aqui identificado, assim como outras moléculas identificadas pelos ensaios de pesquisa aqui revelados acima, podem ser administrados para o tratamento de várias desordens na forma de composições farmacêuticas.
Se o polipéptido PRO for intracelular e forem utilizados anticorpos completos como inibidores, preferem-se anticorpos internalizantes. Contudo, também podem ser utilizados lipofecções ou lipossomas para entregar o anticorpo, ou um fragmento de anticorpo, nas células. Quando se utilizam fragmentos de anticorpo, prefere-se o menor fragmento inibidor que se liga especificamente ao dominio de ligação da proteina alvo. Por exemplo, com base nas sequências da região variável de um anticorpo, podem ser desenhadas moléculas peptídicas que 97 ΕΡ 1 621 619/ΡΤ retêm a capacidade de ligar a sequência da proteina alvo. Estes péptidos podem ser sintetizados quimicamente e/ou produzidos por tecnologia de ADN recombinante. Veja-se, e.g., Marasco et al., Proc. Natl. Acad. Sei. USA, 90: 7889-7893 (1993) . A formulação aqui pode também conter mais do que um composto activo conforme necessário para a indicação particular a tratar, preferivelmente aqueles com actividades complementares que não se afectam adversamente uns aos outros. Alternativamente, ou em adição, a composição pode compreender um agente que aumenta a sua função, tal como, por exemplo, um agente citotóxico, uma citoquina, um agente quimioterapêutico ou um agente inibidor do crescimento. Estas moléculas estão adequadamente presentes em combinação em quantidades que são eficazes para a finalidade pretendida.
Os ingredientes activos podem também ser aprisionados em microcápsulas preparadas, por exemplo, por técnicas de coacervação ou por polimerização interfacial, por exemplo, microcápsulas de hidroximetilcelulose ou gelatina e microcápsulas de poli(metacrilato de metilo), respectivamente, em sistemas de entrega de fármacos coloidais (por exemplo, lipossomas, microesferas de albumina, microemulsões, nanopartículas e nanocápsulas) ou em macroemulsões. Estas técnicas estão descritas em Remington's Pharmaceutical Sciences, supra.
As formulações a utilizar para administração in vivo têm que ser estéreis. Isto consegue-se facilmente por filtração através de membranas de esterilização por filtração.
Podem-se preparar preparações de libertação sustentada. Exemplos adequados de preparações de libertação sustentada incluem matrizes semi-permeáveis de polímeros sólidos hidrófobos contendo o anticorpo, matrizes estas que estão na forma de artigos conformados, e.g., filmes ou microcápsulas. Os exemplos de matrizes de libertação sustentada incluem poliésteres, hidrogéis (por exemplo, poli(metacrilato de 2-hidroxietilo), ou poli(álcool vinílico)), polilactidos (Pat. U.S. 3,773,919), copolímeros de ácido L-glutâmico e γ-etil-L-glutamato, etileno-acetato de vinilo não degradável, copolímeros de ácido láctico-ácido glicólico degradáveis tais como o LUPRON DEPOT (microesferas injectaveis compostas de 98 ΕΡ 1 621 619/ΡΤ copolímero de ácido láctico-ácido glicólico e acetato de leuprolida) e ácido poli-D-(-)-3-hidroxibutirico. Embora polímeros como etileno-acetato de vinilo e ácido láctico-ácido glicólico permitam a libertação de moléculas durante mais de 100 dias, certos hidrogéis libertam proteínas durante períodos de tempo mais curtos. Quando os anticorpos encapsulados permanecem no corpo durante muito tempo, podem desnaturar ou agregar-se em resultado de exposição a humidade a 37°C, resultando uma perda de actividade biológica e possíveis alterações na imunogenicidade. Podem ser deduzidas estratégias racionais para a estabilização dependendo do mecanismo envolvido. Por exemplo, quando se descobre que o mecanismo de agregação é a formação de ligações S-S intermoleculares através de interpermuta de tio-dissulfureto, a estabilização pode ser conseguida através da modificação dos resíduos sulfidrilo, liofilização a partir de soluções ácidas, controlo do teor de humidade, utilização de aditivos apropriados e desenvolvimento de composições de matrizes poliméricas específicas.
G. Utilizações para Anticorpos anti-PRO
Os anticorpos anti-PRO da invenção têm várias utilidades. Por exemplo, os anticorpos anti-PRO podem ser utilizados em ensaios de diagnóstico para PRO, e.g., detectando a sua expressão em células, tecidos ou soros específicos. Podem ser utilizadas várias técnicas de ensaio de diagnóstico conhecidas na especialidade, tais como ensaios de ligação competitiva, ensaios em sanduíche directos ou indirectos, ensaios de imunoprecipitação conduzidos em fases heterogéneas ou homogéneas [Zola, Monoclonal Antibodies: A Manual of
Techniques, CRC Press, Inc. (1987) pp. 147-158]. Os anticorpos utilizados nos ensaios de diagnóstico podem ser marcados com uma porção detectável. A porção detectável deverá ser capaz de produzir, quer directa ou indirectamente, um sinal detectável. Por exemplo, a porção detectável pode ser um radioisótopo, tal
R 14 R9 RS 19S como H, C, P, S ou I, um composto fluorescente ou quimioluminescente, tal como isotiocianato de fluoresceína, rodamina ou luciferina, ou uma enzima, tal como fosfatase alcalina, beta-galactosidase ou peroxidase de rábano. Qualquer método conhecido na especialidade para a conjugação do anticorpo à porção detectável pode ser empregue, incluindo os 99 ΕΡ 1 621 619/ΡΤ métodos descritos por Hunter et al., Nature, 144:945 (1962); David et al.r Biochemistry, 1_3 :1014 (1974); Pain et al., J. Immunol. Meth., _40_:219 (1981) ; e Nygren, J. Histochem. and Cytochem., 30_:407 (1982) .
Os anticorpos anti-PRO também são úteis para a purificação por afinidade de PRO a partir de uma cultura de células recombinantes ou fontes naturais. Neste processo, os anticorpos contra PRO são imobilizados num suporte adequado, tal como uma resina Sephadex ou um papel de filtro, utilizando métodos bem conhecidos na especialidade. 0 anticorpo imobilizado é então colocado em contacto com uma amostra contendo o PRO a purificar, e depois o suporte é lavado com um solvente adequado que irá remover substancialmente todo o material na amostra excepto o PRO, que fica ligado ao anticorpo imobilizado. Finalmente, o suporte é lavado com outro solvente adequado que irá libertar o PRO do anticorpo.
Os exemplos que se seguem são oferecidos para fins meramente ilustrativos, e não se pretende com eles limitar o âmbito da presente invenção de nenhuma maneira.
Todas as referências a patentes e literatura citadas no presente fascículo são aqui incorporadas por referência na sua totalidade.
EXEMPLOS
Os reagentes comercialmente disponíveis referidos nos exemplos foram utilizados de acordo com as instruções dos fabricantes a menos que indicado de outro modo. A fonte das células identificadas nos exemplos que se seguem, e em todo o fascículo, por números de acesso na ATCC é a American Type Cultura Collection, Manassas, VA. EXEMPLO 1: Pesquisa de Homologia de Domínios Extracelulares para Identificar Novos Polipéptidos e ADNc que os Codificam
As sequências de dominios extracelulares (ECD) (incluindo a sequência de sinal de secreção, se existir) de cerca de 950 proteínas segregadas conhecidas da base de dados pública Swiss-Prot foram utilizadas para pesquisar bases de dados de 100 ΕΡ 1 621 619/ΡΤ EST. As bases de dados de EST incluíam bases de dados públicas (e.g., Dayhoff, GenBank), e bases de dados particulares (e.g. LIFESEQ™, Incyte Pharmaceuticals, Paio Alto, CA) . A pesquisa foi realizada utilizando o programa de computador BLAST ou BLAST-2 (Altschul et al., Methods in Enzymology 266:460-480 (1996)) como comparação das sequências de proteínas ECD com uma tradução de 6 quadros das sequências de EST. As comparações com uma classificação BLAST de 70 (ou em alguns casos 90) ou mais, que não codificam proteínas conhecidas, foram agregadas e montadas em sequências de consenso de ADN com o programa "phrap" (Phil Green, University of Washington, Seattle, WA).
Utilizando esta pesquisa de homologia de domínios extracelulares, montaram-se sequências de consenso de ADN relativamente às outras sequências de EST identificadas utilizando o phrap. Em adição, as sequências de consenso de ADN obtidas eram frequentemente (mas não sempre) estendidas utilizando ciclos repetidos de BLAST ou BLAST-2 e phrap para estender a sequência de consenso tanto quanto possível utilizando as fontes de sequências de EST atrás discutidas.
Com base nas sequências de consenso obtidas como atrás descrito, foram então sintetizados oligonucleótidos que foram utilizados para identificar por PCR uma biblioteca de ADNc que continha a sequência de interesse e para utilização como sondas para isolar um clone da sequência de codificação de comprimento completo para um polipéptido PRO. Os iniciadores de PCR directos ou inversos variam geralmente de 20 a 30 nucleótidos e são frequentemente desenhados para originar um produto de PCR de cerca de 100-1000 pb de comprimento. As sequências das sondas têm tipicamente 40-55 pb de comprimento. Em alguns casos, são sintetizados oligonucleótidos adicionais quando a sequência de consenso é maior do que cerca de 1-1,5 kpb. De modo a pesquisar várias bibliotecas quanto a um clone de comprimento completo, o ADN das bibliotecas foi pesquisado por amplificação por PCR, como em Ausubel et al., Current Protocols in Molecular Biology, com o par de iniciadores de PCR. Utilizou-se então uma biblioteca positiva para isolar clones que codificam o gene de interesse utilizando o oligonucleótido sonda e um dos pares de iniciadores. 101 ΕΡ 1 621 619/ΡΤ
As bibliotecas de ADNc utilizadas para isolar os clones de ADNc foram construídas por métodos Standard utilizando reagentes comercialmente disponíveis tais como os da Invitrogen, San Diego, CA. O ADNc foi iniciado com oligo dT contendo um local NotI, ligado com terminações lisas a adaptadores Sall tratados com hemiquinase, clivado com NotI, apropriadamente dimensionado por electroforese em gel, e clonado numa orientação definida num vector de clonagem adequado (tal como pRKB ou pRKD; pRK5B é um precursor de pRK5D que não contém o local Sfil; veja-se, Holmes et al., Science, 253:1278-1280 (1991)) nos locais Xhol e NotI únicos. EXEMPLO 2: Isolamento de Clones de ADNc por Pesquisa com Amilase
1. Preparação da biblioteca de ADNc iniciada com oligo dT
Isolou-se ARNm de um tecido humano de interesse utilizando reagentes e protocolos da Invitrogen, San Diego, CA (Fast Track 2). Este ARN foi utilizado para gerar uma biblioteca de ADNc iniciada com oligo dT no vector pRK5D utilizando reagentes e protocolos da Life Technologies, Gaithersburg, MD (Super Script Plasmid System). Neste procedimento, o ADNc em cadeia dupla foi dimensionado para maior que 1000 pb e o ADNc ligado por Sall/Notl foi clonado no vector clivado com Xhol/Notl. O pRK5D é um vector de clonagem que possui um local de iniciação da transcrição de sp6 seguido por um local para a enzima de restrição Sfil precedendo os locais de clonagem de ADNc para Xhol/Notl. 2. Preparação da biblioteca de ADNc iniciada aleatoriamente
Gerou-se uma biblioteca de ADNc secundária de modo a representar preferencialmente as extremidades 5' dos clones de ADNc primários. Gerou-se ARN de Sp6 a partir da biblioteca primária (atrás descrita), e utilizou-se este ARN para gerar uma biblioteca de ADNc iniciada aleatoriamente no vector pSST-AMY.O utilizando reagentes e protocolos da Life Technologies (Super Script Plasmid System, referenciado a acima). Neste procedimento o ADNc em cadeia dupla foi dimensionado para 500-1000 pb, ligado com extremidades lisas a 102 ΕΡ 1 621 619/ΡΤ adaptadores NotI, clivado com SfiI, e clonado em vector clivado com Sfil/NotI. O pSST-AMY.O é um vector de clonagem que possui um promotor de álcool-desidrogenase de levedura precedendo os locais de clonagem de ADNc e a sequência de amilase de ratinho (a sequência madura sem o sinal de secreção) seguidos pelo terminador de álcool-desidrogenase de levedura, após os locais de clonagem. Assim, os ADNc clonados neste vector que são fundidos em enquadramento com a sequência da amilase levarão à secreção de amilase a partir de colónias de levedura apropriadamente transfectadas. 3. Transformação e Detecção O ADN da biblioteca descrita no parágrafo 2 acima foi
arrefecido em gelo ao qual foram adicionadas bactérias DH10B electrocompetentes (Life Technologies, 20 ml). A mistura de bactérias e vector foi então electroporada como recomendado pelo fabricante. Subsequentemente, adicionaram-se meios SOC (Life Technologies, 1 ml) e incubou-se a mistura a 37°C durante 30 minutos. Os transformantes foram então plaqueados sobre 20 placas de LB Standard de 150 mm contendo ampicilina e incubaram-se durante 16 horas (37°C). As colónias positivas foram raspadas das placas e o ADN foi isolado da pelete bacteriana utilizando protocolos Standard, e.g. gradiente de CsCl. O ADN purificado foi depois conduzido pelos protocolos de levedura seguintes.
Os métodos de levedura foram divididos em três categorias: (1) Transformação da levedura com o vector combinado plasmideo/ADNc; (2) Detecção e isolamento dos clones de levedura que segregam amilase; e (3) amplificação por PCR da inserção directamente da colónia de levedura e purificação do ADN para sequenciação e outras análises. A estirpe de levedura utilizada foi a HD56-5A (ATCC-90785). Esta estirpe tem o seguinte genótipo: MAT alfa, ura3-52, leu2-3, leu2-112, his3-ll, his3-15, MAL”, SUC+, GAL+. Preferivelmente, podem ser empregues os mutantes de levedura que têm vias pós-tradução deficientes. Estes mutantes podem ter alelos deficientes para translocação em sec71, secl2, sec62, sendo o mais preferido o sec71 truncado.
Alternativamente, antagonistas (incluindo nucleótidos anti- 103 ΕΡ 1 621 619/ΡΤ sentido e/ou ligandos) que interferem com a operação normal destes genes, outras proteínas implicadas nesta via pós-tradução (e.g., SEC61p, SEC72p, SEC62p, SEC63p, TDJlp ou SSAlp-4p) ou a formação de complexo destas proteínas, podem também ser empregues preferivelmente em combinação com a levedura que expressa amilase. A transformação foi realizada com base no protocolo delineado por Gietz et al., Nucl. Acid. Res., 20: 1425 (1992). As células transformadas foram então inoculadas a partir de ágar para caldo de meio complexo YEPD (100 ml) e crescidas durante a noite a 30°C. O caldo YEPD foi preparado como descrito em Kaiser et al.r Methods in Yeast Genetics, Cold Spring Harbor Press, Cold Spring Harbor, NY, p. 207 (1994). A cultura de uma noite foi então diluída para cerca de 2 x 106 células/ml (aprox. DC>6oo=0,l) com caldo YEPD fresco (500 ml) e novamente crescida até 1 x 107 células/ml (aprox. DC>6oo=0,4-0,5) .
As células foram então colhidas e preparadas para transformação por transferência para frascos de rotor GS3 num rotor Sorvai GS3 a 5 000 rpm durante 5 minutos, o sobrenadante foi rejeitado e depois foram ressuspensas em água estéril, e centrifugou-se novamente em tubos falcon de 50 ml a 3 500 rpm numa centrífuga Beckman GS-6KR. O sobrenadante foi rejeitado e as células foram subsequentemente lavadas com LiAc/TE (10 ml, Tris 10 mM-HCl, EDTA 1 mM, pH 7,5, Li2OOCCH3 100 mM) , e ressuspenderam-se em LiAc/TE (2,5 ml). A transformação ocorreu por mistura das células preparadas (100 μΐ) com ADN de testículos de salmão de cadeia simples recentemente desnaturado (Lofstrand Labs, Gaithersburg, MD) e transformação do ADN (1 pg, vol. <10 μΐ) em tubos de microcentrífuga. A mistura foi misturada
brevemente com vórtex, depois adicionaram-se PEG a 40%/TE (600 μΐ, polietilenoglicol-4000 a 40%, Tris 10 mM-HCl, EDTA 1 mM, Li2OOCCH3 100 mM, pH 7,5). Esta mistura foi suavemente misturada e incubada a 30°C enquanto agitando durante 30 minutos. As células foram então submetidas a um choque térmico a 42°C durante 15 minutos, e centrifugou-se o vaso reaccional numa microcentrífuga a 12 000 rpm durante 5-10 segundos, decantou-se e ressuspendeu-se em TE (500 μΐ, 104 ΕΡ 1 621 619/ΡΤ
Tris 10 mM-HCl, EDTA 1 mM, pH 7,5) seguindo-se nova centrifugação. As células foram então diluídas em TE (1 ml) e espalharam-se alíquotas (200 μΐ) sobre os meios selectivos previamente preparados em placas de crescimento (VWR) de 150 mm.
Alternativamente, em vez de múltiplas pequenas reacções, a transformação foi realizada utilizando uma única reacção em grande escala, em que as quantidades de reagentes foram aumentadas proporcionalmente em conformidade. O meio selectivo utilizado foi um ágar de dextrose completo sintético sem uracilo (SCD-Ura) preparado como descrito em Kaiser et al.r Methods in Yeast Genetics, Cold Spring Harbor Press, Cold Spring Harbor, NY, p. 208-210 (1994) . Os transformantes foram crescidos a 30°C durante 2-3 dias. A detecção de colónias que segregam amilase foi realizada incluindo amido vermelho no meio de crescimento selectivo. O amido foi acoplado ao corante vermelho (Reactive Red-120, Sigma) segundo o procedimento descrito por Biely et al., Anal. Biochem., 172:176.-179 (1988). O amido acoplado foi incorporado nas placas de ágar SCD-Ura numa concentração final de 0,15% (p/v), e foi tamponado com fosfato de potássio até um pH de 7,0 (50-100 mM de concentração final).
As colónias positivas foram recolhidas e riscadas em meio selectivo fresco (em placas de 150 mm) de modo a obter colónias individuais bem isoladas e identificáveis. As colónias individuais bem isoladas positivas para secreção de amilase foram detectadas por incorporação directa de amido vermelho em ágar SCD-Ura tamponado. As colónias positivas foram determinadas pela sua capacidade para clivar o amido resultando um halo límpido em torno da colónia positiva directamente visualizável.
4. Isolamento de ADN por Amplificação por PCR
Quando se isolou uma colónia positiva, recolheu-se uma porção da mesma através de um palito e diluiu-se em água estéril (30 μΐ) numa placa de 96 poços. Nesta altura, as 105 ΕΡ 1 621 619/ΡΤ colónias positivas eram congeladas e armazenadas para subsequente análise ou imediatamente amplificadas. Utilizou-se uma aliquota de células (5 μΐ) como molde para a reacção PCR num volume de 25 μΐ contendo: 0,5 μΐ de Klentaq (Clontech, Paio Alto, CA); 4,0 μΐ dos dNTP 10 mM (Perkin Elmer-Cetus) ; 2,5 μΐ de tampão Kentaq (Clontech); 0,25 μΐ de oligo 1 directo; 0,25 μΐ de oligo 2 inverso; 12,5 μΐ de água destilada. A sequência do oligonucleótido 1 directo era: 5'-TGTAAAACGACGGCCAGTTAAATAGACCTGCAATTATTAATCT-3' (SEQ ID NO:l) A sequência do oligonucleótido 2 inverso era: 5'-CAGGAAACAGCTATGACCACCTGCACACCTGCAAATCCATT-3' (SEQ ID NO:2) A PCR foi então realizada como se segue:
a. Desnaturação 92°C, 5 i ninutos b. 3 ciclos de: Desnaturação 92°C, 30 segundos Hibridação 59°C, 30 segundos Alongamento tO O O 60 segundos c. 3 ciclos de: Desnaturação 92°C, 30 segundos Hibridação 57°C, 30 segundos Alongamento 72°C, 60 segundos d. 25 ciclos de: Desnaturação 92°C, 30 segundos Hibridação 55°C, 30 segundos Alongamento 72 0 C, 60 segundos e. Manutenção 4 °C
As regiões sublinhadas dos oligonucleótidos hibridaram com a região promotora de ADH e a região de amilase, respectivamente, e amplificou-se uma região de 307 pb do vector pSST-AMY.O quando não estava presente a inserção. Tipicamente, os primeiros 18 nucleótidos da extremidade 5' destes oligonucleótidos continham locais de hibridação para iniciadores de sequenciação. Assim, o produto total da reacção PCR a partir de um vector vazio tinha 343 pb. Contudo, o ADNc fundido à sequência de sinal resultou em sequências de nucleótidos consideravelmente mais longas.
Após a PCR, examinou-se uma aliquota da mistura reaccional (5 μΐ) por electroforese em gel de agarose num gel 106 ΕΡ 1 621 619/ΡΤ de agarose a 1% utilizando um sistema tampão Tris-Borato-EDTA (TBE) como descrito por Sambrook et al.r supra. Os clones que resultam num único produto forte de PCR maior que 400 pb foram ainda analisados por sequenciação do ADN após purificação com uma coluna de limpeza 96 Qiaquick PCR clean-up (Qiagen Inc., Chatsworth. CA). EXEMPLO 3: Isolamento de Clones de ADNc utilizando Análise de Algoritmo de Sinais
Identificaram-se várias sequências de ácido nucleico que codificam polipéptidos aplicando um algoritmo de busca de sequências de sinal registado desenvolvido pela Genentech, Inc. (South San Francisco, CA) sobre EST assim como fragmentos de EST agrupados e montados de bases de dados públicas (e.g., GenBank) e/ou privadas (LIFESEQ®, Incyte Pharmaceuticals, Inc., Paio Alto, CA). O algoritmo para sequências de sinal calcula uma classificação para o sinal de secreção com base no carácter dos nucleótidos do ADN que rodeiam o primeiro, e opcionalmente o segundo, codões de metionina (ATG) na extremidade 5' da sequência ou fragmento de sequência em consideração. Os nucleótidos que se seguem ao primeiro ATG têm que codificar para pelo menos 35 aminoácidos não ambíguos sem quaisquer codões de paragem. Se o primeiro ATG tem os aminoácidos necessários, o segundo não é examinado. Se nenhum corresponde aos requisitos, a sequência candidata não é classificada. De modo a determinar se a sequência de EST contém uma sequência de sinal autêntica, o ADN e as sequências de aminoácidos correspondentes que rodeiam o codão ATG são classificados utilizando um conjunto de sete sensores (parâmetros de avaliação) que se sabe estarem associados aos sinais de secreção. A utilização deste algoritmo resultou na identificação de numerosas sequências de ácido nucleico que codificam polipéptidos. EXEMPLO 4: Isolamento de clones de ADNc que Codificam PRQ4405 Humano
Montou-se uma sequência de ADN de consenso relativamente a outras sequências de EST utilizando ciclos repetidos de BLAST e phrap. Esta sequência de consenso é aqui designada por "DNA80170". Com base na sequência de consenso DNA80170, 107 ΕΡ 1 621 619/ΡΤ sintetizaram-se oligonucleótidos: 1) para identificar por PCR uma biblioteca de ADNc que continha a sequência de interesse, e 2) para utilização como sondas para isolar um clone da sequência de codificação de comprimento completo para o PRO4405.
Sintetizaram-se os iniciadores de PCR (directo e inverso): iniciador de PCR directo: 5'-CGGGACTTTCGCTACCTGTTGC-3' (SEQ ID NO:5) e iniciador de PCR inverso: 5'-CATCATATTCCACAAAATGCTTTGGG-3'(SEQ ID NO:6).
Adicionalmente, construiu-se uma sonda de hibridação oligonucleotidica sintética a partir da sequência de consenso que tinha a seguinte sequência de nucleótidos sonda de hibridação: 5'-CCTTCGGGGATTCTTCCCGGCTCCCGTTCGTTCCTCTG-3' (SEQ ID NO:7).
De modo a pesquisar várias bibliotecas quanto a uma fonte de um clone de comprimento completo, o ADN das bibliotecas foi pesquisado por amplificação por PCR com o par de iniciadores de PCR atrás identificado. Utilizou-se então uma biblioteca positiva para isolar clones que codificam o gene de PRO4405 utilizando a sonda oligonucleotidica e um dos iniciadores de PCR. O ARN para a construção das bibliotecas de ADNc foi isolado a partir de rim fetal humano. A sequenciação do ADN dos clones isolados como descrito atrás originou a sequência de ADN de comprimento completo para PRO4405 (aqui designada por DNA84920-2614 [Figura 1, SEQ ID NO:3]; e a sequência da proteína derivada para PRO4405. A totalidade da sequência de codificação de PRO4405 é mostrada na Figura 1 (SEQ ID NO:3). O clone DNA84920-2614 contém um único quadro de leitura aberto com um aparente local de iniciação da tradução nas posições de nucleótido 79-81 e um codão de paragem aparente nas posições de nucleótido 1009-1011. O polipéptido precursor previsto tem 310 aminoácidos de comprimento. O clone DNA84920-2614 foi depositado na ATCC e 108 ΕΡ 1 621 619/ΡΤ foi-lhe atribuído ο η.°. de depósito ATCC 203966. A proteína PRO4405 de comprimento completo mostrada na Figura 2 tem um peso molecular estimado de cerca de 33 875 daltons e um pi de cerca de 7,08.
Uma análise da base de dados Dayhoff (versão 35.45 SwissProt 35), utilizando uma análise de alinhamento de sequências WU-BLAST2 da sequência de comprimento completo mostrada na Figura 2 (SEQ id NO:4), revelou homologia entre a sequência de aminoácidos de PRO4405 e as seguintes sequências Dayhoff (sequências e texto relacionado aqui incorporados): YA93_SCHPO, S62432, YIG2_YEAST, AC004472_3, AB004539_7, 564782, CELC27A 12_8, AF109219_1, AF086791_10 e P_W75859. EXEMPLO 5: Utilização de PRO como Sonda de hibridação O método seguinte descreve a utilização de uma sequência de nucleótidos que codifica PRO, como sonda de hibridação. O ADN compreendendo a sequência de codificação de PRO de comprimento completo ou maduro como aqui revelado, é empregue como sonda para pesquisar ADN homólogos (tais como os que codificam variantes de ocorrência natural de PRO) em bibliotecas de ADNc de tecido humano ou bibliotecas genómicas de tecido humano. A hibridação e a lavagem de filtros contendo os ADN de cada biblioteca são realizadas sob as seguintes condições muito rigorosas. A hibridação de sonda derivada de PRO radiomarcada aos filtros é realizada numa solução de formamida a 50%, SSC 5x, SDS a 0,1%, pirofosfato de sódio a 0,1%, fosfato de sódio 50 mM, pH 6,8, solução de Denhardt 2x e sulfato de dextrano a 10%, a 42°C durante 20 horas. A lavagem dos filtros é realizada com uma solução aquosa de SSC 0,lx e SDS a 0,1% a 42°C.
Os ADN possuindo uma identidade de sequência desejada com o ADN que codifica o PRO de sequência nativa de comprimento completo podem então ser identificados utilizando técnicas Standard conhecidas na especialidade. 109 ΕΡ 1 621 619/ΡΤ EXEMPLO 6: Expressão de PRO em E, coli
Este exemplo ilustra a preparação de uma forma não glicosilada de PRO por expressão recombinante em E. coli. A sequência de ADN que codifica PRO é inicialmente amplificada utilizando iniciadores de PCR seleccionados. Os iniciadores deverão conter locais para enzimas de restrição que correspondem aos locais para enzimas de restrição no vector de expressão seleccionado. Podem ser empregues uma variedade de vectores de expressão. Um exemplo de um vector adequado é o pBR322 (derivado de E. coli; veja-se Bolívar et al., Gene, 2_:95 (1977)) que contém genes para resistência a ampicilina e a tetraciclina. O vector é digerido com enzima de restrição e desfosforilado. As sequências amplificadas por PCR são então ligadas ao vector. O vector incluirá preferivelmente sequências que codificam para um gene de resistência a antibiótico, um promotor trp, um comando poli-his (incluindo os primeiros seis codões STH, a sequência poli-his, e um local de clivagem para enteroquinase), a região de codificação de PRO, o terminador de transcrição lambda e um gene argU. A mistura de ligação é então utilizada para transformar uma estirpe seleccionada de E. coli utilizando os métodos descritos em Sambrook et al., supra. Os transformantes são identificados pela sua capacidade de crescer em placas LB e são então seleccionadas as colónias resistentes ao antibiótico. O ADN plasmídico pode ser isolado e confirmado por análise de restrição e sequenciação do ADN.
Os clones seleccionados podem ser crescidos durante a noite em meio de cultura líquido tal como caldo LB suplementado com antibióticos. A cultura de uma noite pode ser subsequentemente utilizada para inocular uma cultura em maior escala. As células são então crescidas até uma densidade óptica desejada, durante o que o promotor de expressão é "ligado"·.
Após a cultura das células durante várias horas adicionais, as células podem ser colhidas por centrifugação. A pelete de células obtida através da centrifugação pode ser solubilizada utilizando vários agentes conhecidos na 110 ΕΡ 1 621 619/ΡΤ especialidade, e a proteína PRO solubilizada pode então ser purificada utilizando uma coluna quelante de metais sob condições que permitam a ligação forte da proteína. O PRO pode ser expresso em E. coli numa forma marcada com poli-His, utilizando o procedimento seguinte. O ADN que codifica PRO é inicialmente amplificado utilizando iniciadores de PCR seleccionados. Os iniciadores conterão locais para enzimas de restrição que correspondem aos locais para enzimas de restrição no vector de expressão seleccionado, e outras sequências úteis que proporcionam uma iniciação da tradução eficiente e fiável, uma rápida purificação numa coluna quelante de metais e a remoção proteolítica com enteroquinase. As sequências marcadas com poli-His, amplificadas por PCR, são então ligadas a um vector de expressão, que é utilizado para transformar um hospedeiro E. coli baseado na estirpe 52 (W3110 fuhA(tonA) lon galE rpoHts(htpRts) clpP(laclq). Os transformantes são primeiro crescidos em LB contendo 50 mg/ml de carbenicilina a 30°C com agitação até se atingir uma D.O.600 de 3-5. As culturas são então diluídas 50-100 vezes em meio CRAP (preparado misturando 3,57 g de (NH4)2S04, 0,71 g de citrato de sódio·2Η20, 1, 07 g de KC1, 5,36 g de extracto de levedura Difco, 5,36 g de hicase SF Sheffield em 500 mL de água, assim como MPOS 110 mM, pH 7,3, 0,55% (p/v) de glucose e MgSCú 7 mM) e crescidas durante aproximadamente 20-30 horas a 30°C com agitação. São removidas amostras para verificar a expressão por análise SDS-PAGE, e a cultura toda é centrifugada para sedimentar as células. As peletes de células são congeladas até à purificação e redobragem. A pasta de E. coli de fermentações de 0,5 a 1 L (peletes de 6-10 g) é ressuspensa em 10 volumes (p/v) em tampão de guanidina 7 M, Tris 20 mM, pH 8. Adicionam-se sulfito de sódio e tetrationato de sódio sólidos para perfazer concentrações finais de 0,1 M e 0,02 M, respectivamente, e a solução é agitada durante a noite a 4°C. Este passo resulta numa proteína desnaturada com resíduos de alquilcisteína bloqueados por sulfitolização. A solução é centrifugada a 40 000 rpm numa ultracentrífuga Beckman durante 30 min. O sobrenadante é diluído com 3-5 volumes de tampão da coluna de quelato de metais (guanidina 6 M, Tris 20 mM, pH 7,4) e filtrado através de filtros de 0,22 mícron para clarificação. O extracto 111 ΕΡ 1 621 619/ΡΤ clarificado é carregado numa coluna de quelante de metais Ni-NTA da Qiagen de 5 ml, equilibrada no tampão da coluna de quelato de metais. A coluna é lavada com tampão adicional contendo imidazole 50 mM (Calbiochem, qualidade Utrol), pH 7,4. A proteína é eluida com tampão contendo imidazole 250 mM. As fracções contendo a proteina desejada são reunidas e armazenadas a 4°C. A concentração de proteina é estimada através da sua absorvância a 280 nm utilizando o coeficiente de extinção calculado com base na sua sequência de aminoácidos.
As proteínas são redobradas diluindo a amostra lentamente em tampão de redobragem recentemente preparado consistindo em: Tris 20 mM, pH 8,6, NaCl 0,3 M, ureia 2,5 M, cisteína 5 mM, glicina 20 mM e EDTA 1 mM. Os volumes de redobragem são
escolhidos de modo a que a concentração final de proteina esteja entre 50 e 100 microgramas/ml. A solução de redobragem é agitada suavemente a 4°C durante 12-36 horas. A reacção de redobragem é extinta através da adição de TFA até uma concentração final de 0,4% (pH de aproximadamente 3). Antes de purificação adicional da proteina, a solução é filtrada através de um filtro de 0,22 micron e adiciona-se acetonitrilo até uma concentração final de 2-10%. A proteína redobrada é cromatografada numa coluna de fase inversa Poros Rl/H utilizando um tampão móvel de TFA a 0,1% com eluição com um gradiente de acetonitrilo de 10 a 80%. Alíquotas de fracções com absorvância A280 são analisadas em géis de SDS-poliacrilamida e as fracções contendo proteína redobrada homogénea são reunidas. Geralmente, as espécies redobradas correctamente da maioria das proteínas são eluídas com as concentrações mais baixas de acetonitrilo pois essas espécies são as mais compactas com os seus interiores hidrófobos escudados da interacção com a resina de fase inversa. As espécies agregadas são usualmente eluídas com as concentrações mais elevadas de acetonitrilo. Em adição à resolução das formas mal dobradas de proteínas das formas desejadas, o passo de fase inversa também remove a endotoxina das amostras.
As fracções contendo o polipéptido PRO dobrado desejado são reunidas e o acetonitrilo é removido utilizando uma corrente suave de azoto dirigida para a solução. As proteínas são formuladas em Hepes 20 mM, pH 6,8 com cloreto de sódio 112 ΕΡ 1 621 619/ΡΤ 0,14 Μ e manitol a 4% por diálise ou por filtração em gel utilizando resinas G25 Superfine (Pharmacia) equilibradas no tampão de formulação e são esterilizadas por filtração.
Muitos dos polipéptidos PRO revelados em WOOO/56889 foram expressos com sucesso como descrito atrás. EXEMPLO 7: Expressão de PRO em Células de Mamífero
Este exemplo ilustra a preparação de uma forma potencialmente glicosilada de PRO por expressão recombinante em células de mamífero. O vector, pRK5 (veja-se EP 307 247, publicado em 15 de Março de 1989), é empregue como vector de expressão. Opcionalmente, o ADN de PRO é ligado a pRK5 com enzimas de restrição seleccionadas para permitir a inserção do ADN de PRO utilizando métodos de ligação tal como descrito em Sambrook et ai., supra. O vector resultante é denominado pRK5-PRO.
Numa concretização, as células hospedeiras seleccionadas podem ser células 293. As células 293 humanas (ATCC CCL 1573) são crescidas até à confluência em placas de cultura de tecidos num meio como DMEM suplementado com soro fetal de vitelo e opcionalmente, componentes nutrientes e/ou antibióticos. Cerca de 10 pg de ADN de pRK5-PRO são misturados com cerca de 1 pg de ADN que codifica o gene de ARN de VA [Thimmappaya et al., Cell, 3^:543 (1982)] e dissolvidos em 500 μΐ de Tris 1 mM-HCl, EDTA 0,1 mM, CaCl2 0,227 Μ. A esta mistura adicionam-se, gota a gota, 500 pl de HEPES 50 mM (pH 7,35), NaCl 280 mM, NaPCh 1,5 mM e deixa-se formar um precipitado durante 10 minutos a 25°C. O precipitado é suspenso e adicionado às células 293 e deixa-se assentar durante cerca de quatro horas a 37°C. O meio de cultura é removido por aspiração e adicionam-se 2 ml de glicerol a 20% em PBS durante 30 segundos. As células 293 são então lavadas com meio isento de soro, adiciona-se meio fresco e incubam-se as células durante cerca de 5 dias.
Aproximadamente 24 horas depois das transfecções, o meio de cultura é removido e substituído por meio de cultura (sozinho) ou meio de cultura contendo 200 pCi/ml de 113 ΕΡ 1 621 619/ΡΤ 35S-cisteína e 200 pCi/ml de 35S-metionina. Após uma incubação de 12 horas, o meio condicionado é recolhido, concentrado num filtro rotativo e carregado num gel de SDS a 15%. O gel processado pode ser seco e exposto a filme durante um período de tempo seleccionado para revelar a presença de polipéptido PRO. As culturas contendo células transfectadas podem ser submetidas a incubação adicional (em meio isento de soro) e o meio é testado em bioensaios seleccionados.
Numa técnica alternativa, o PRO pode ser introduzido em células 293 transientemente utilizando o método do sulfato de dextrano descrito por Somparyrac et al., Proc. Natl. Acad. Sei., _1_2:7575 (1981). As células 293 são crescidas até à densidade máxima num balão rotativo e adicionam-se 700 vq de ADN de pRK5-PRO. As células são primeiro concentradas a partir do balão rotativo por centrifugação e lavadas com PBS. O precipitado de ADN-dextrano é incubado com a pelete de células durante quatro horas. As células são tratadas com glicerol a 20% durante 90 segundos, lavadas com meio de cultura de tecidos e reintroduzidas no balão rotativo contendo meio de cultura de tecidos, 5 pg/ml de insulina bovina e 0,1 pg/ml de transferrina bovina. Após cerca de quatro dias, o meio condicionado é centrifugado e filtrado para remover as células e detritos. A amostra contendo PRO expresso pode então ser concentrada e purificada por qualquer método seleccionado, tal como diálise e/ou cromatografia em coluna.
Noutra concretização, o PRO pode ser expresso em células CHO. O pRK5-PRO pode ser transfectado para células CHO utilizando reagentes conhecidos tais como CaP04 ou DEAE-dextrano. Como atrás descrito, as culturas celulares podem ser incubadas, e o meio substituído por meio de cultura (sozinho) ou meio contendo um marcador radioactivo como 35S-metionina. Após a determinação da presença de polipéptido PRO, o meio de cultura pode ser substituído por meio isento de soro. Preferivelmente, as culturas são incubadas durante cerca de 6 dias, e depois o meio condicionado é recolhido. O meio contendo o PRO expresso pode então ser concentrado e purificado por qualquer método seleccionado. O PRO marcado com epítopo pode também ser expresso em células CHO hospedeiras. O PRO pode ser subclonado a partir do 114 ΕΡ 1 621 619/ΡΤ vector pRK5. A inserção do subclone pode ser submetida a PCR para se fundir em enquadramento com um marcador epitópico seleccionado tal como um marcador poli-his num vector de expressão de baculovirus. A inserção de PRO marcado com poli-his pode então ser subclonada num vector dirigido por SV40 contendo um marcador de selecção tal como DHFR para a selecção de clones estáveis. Finalmente, as células CHO podem ser transfectadas (como atrás descrito) com o vector dirigido por SV40. Pode ser realizada marcação, como atrás descrito, para verificar a expressão. 0 meio de cultura contendo o PRO marcado com poli-His expresso pode então ser concentrado e purificado por qualquer método seleccionado, tal como por cromatografia de afinidade em Ni2+-quelato. 0 PRO pode também ser expresso em células CHO e/ou COS através de um procedimento de expressão transiente ou em células CHO através de outro procedimento de expressão estável. A expressão estável em células CHO é realizada utilizando o procedimento seguinte. As proteínas são expressas na forma de uma construção de igG (imunoadesina), em que as sequências de codificação para as formas solúveis (e.g. domínios extracelulares) das proteínas respectivas são fundidas com uma sequência da região constante de IgGl contendo os domínios charneira, CH2 e CH2 e/ou é uma forma marcada com poli-His.
Após a amplificação por PCR, os ADN respectivos são subclonados num vector de expressão em CHO utilizando técnicas Standard como descrito em Ausubel et ai., Current Protocols of Molecular Bioloqy, Unit 3.16, John Wiley and Sons (1997). Os vectores de expressão em CHO são construídos de forma a possuírem locais de restrição compatíveis a 5' e 3' do ADN de interesse para permitir o conveniente trânsito dos ADNc. 0 vector de expressão utilizado em células CHO é como descrito em Lucas et al., Nucl. Acids Res. 24:9 (1774-1779 (1996), e utiliza o promotor precoce/potenciador de SV40 para conduzir a expressão do ADNc de interesse e de di-hidrofolato-redutase (DHFR). A expressão de DHFR permite a selecção quanto a manutenção estável do plasmídeo após transfecção. 115 ΕΡ 1 621 619/ΡΤ
Doze microgramas do ADN plasmídico desejado são introduzidos em aproximadamente 10 milhões de células CHO utilizando reagentes de transfecção comercialmente disponíveis Superfect® (Qiagen), Dosper® ou Fugene® (Boehringer Mannheim). As células são crescidas como descrito em Lucas et al., supra. Aproximadamente 3 x 10~7 células são congeladas numa ampola para posterior crescimento e produção como adiante descrito.
As ampolas contendo o adn plasmídico são descongeladas por colocação num banho de água e agitadas com vórtex. O conteúdo é pipetado para um tubo de centrífuga contendo 10 mL de meio e centrifuga-se a 1000 rpm durante 5 minutos. O sobrenadante é aspirado e as células são ressuspensas em 10 mL de meio selectivo (PS20 filtrado por 0,2 pm com 5% de soro fetal bovino diafiltrado por 0,2 pm) . As células são então
divididas em alíquotas para um balão rotativo de 100 mL contendo 90 mL de meio selectivo. Após 1-2 dias, as células são transferidas para um balão rotativo de 250 mL cheio com 150 mL de meio de crescimento selectivo e incuba-se a 37°C. Após mais 2-3 dias, balões rotativos de 250 mL, 500 mL e 2000 mL são semeados com 3 x 105 células/mL. Os meios celulares são trocados por meios frescos por centrifugação e ressuspensão em meio de produção. Embora qualquer meio adequado para CHO possa ser empregue, pode-se utilizar um meio de produção descrito na Patente U.S. 5,122,469, publicada em 16 de Junho, 1992. Um balão rotativo de produção de 3L é semeado com 1,2 x 106 células/mL. No dia 0, determinam-se o número de células e o pH. No dia 1, o balão é amostrado e inicia-se a aspersão com ar filtrado. No dia 2, o balão é amostrado, a temperatura é desviada para 33°C, e adicionam-se 30 mL de glucose a 500 g/L e 0,6 mL de anti-espuma a 10% (e.g., emulsão de polidimetilsiloxano a 35%, Dow Corning 365 Medicai Grade Emulsion) . Ao longo de toda a produção, o pH é ajustado conforme necessário para o manter a cerca de 7,2. Após 10 dias, ou até a viabilidade descer abaixo de 70%, a cultura celular é colhida por centrifugação e filtração através de um filtro de 0,22 pm. O filtrado foi armazenado a 4°C ou imediatamente carregado em colunas para purificação.
Para as construções marcadas com poli-His, as proteínas são purificadas utilizando uma coluna de Ni-NTA (Qiagen). Antes da purificação, adiciona-se imidazole ao meio 116 ΕΡ 1 621 619/ΡΤ condicionado até uma concentração de 5 mM. 0 meio condicionado é bombeado para uma coluna de Ni-NTA de 6 ml equilibrada em tampão de Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazole 5 mM a um caudal de 4-5 ml/min. a 4°C. Após a carga, a coluna é lavada com tampão de equilíbrio adicional e a proteína é eluída com tampão de equilíbrio contendo imidazole 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada para um tampão de armazenagem contendo Hepes 10 mM, NaCl 0,14 M e manitol a 4%, pH 6,8, com uma coluna G25 Superfine (Pharmacia) de 25 ml e armazenada a -80°C.
As construções de imunoadesina (contendo Fc) são purificadas a partir do meio condicionado como se segue. O meio condicionado é bombeado para uma coluna de 5 ml de Proteína A (Pharmacia) que tinha sido equilibrada em tampão de fosfato de Na 20 mM, pH 6,8. Após a carga, a coluna é lavada extensamente com tampão de equilíbrio antes da eluição com ácido cítrico 100 mM, pH 3,5. A proteína eluída é imediatamente neutralizada por recolha de fracções de 1 ml para tubos contendo 275 pL de tampão Tris 1M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada para tampão de armazenagem como descrito atrás para as proteínas marcadas com poli-His. A homogeneidade é avaliada por géis de SDS-poliacrilamida e por sequenciação de aminoácidos N-terminal por degradação de Edman.
Muitos dos polipéptidos PRO revelados em wo 00/56889 foram expressos com sucesso como descrito atrás. EXEMPLO 8: Expressão de PRO em Levedura O método seguinte descreve a expressão recombinante de PRO em levedura.
Primeiro, constroem-se vectores de expressão em levedura para a produção intracelular ou secreção de PRO a partir do promotor ADH2/GAPDH. O ADN que codifica PRO e o promotor são inseridos em locais para enzimas de restrição adequados no plasmídeo seleccionado para dirigir a expressão intracelular directa de PRO. Para secreção, o ADN que codifica PRO pode ser clonado no plasmídeo seleccionado, juntamente com ADN que codifica o promotor ADH2/GAPDH, um péptido de sinal de PRO 117 ΕΡ 1 621 619/ΡΤ nativo ou outro péptido de sinal de mamífero, ou, por exemplo, uma sequência de sinal/comando de secreção do factor alfa de levedura ou de invertase e sequências ligantes (se necessárias) para a expressão de PRO. Células de levedura, tais como da estirpe de levedura AB110, podem então ser transformadas com os plasmideos de expressão descritos atrás e cultivadas em meios de fermentação seleccionados. Os sobrenadantes da levedura transformada podem ser analisados por precipitação com ácido tricloroacético a 10% e separação por SDS-PAGE, seguida por coloração dos géis com corante azul de Coomassie. O PRO recombinante pode subsequentemente ser isolado e purificado removendo as células de levedura do meio de fermentação por centrifugação e depois concentrando o meio utilizando filtros de cartucho seleccionados. O concentrado contendo PRO pode ainda ser purificado utilizando resinas de cromatografia em coluna seleccionadas.
Muitos dos polipéptidos PRO revelados em WO 00/56889 foram expressos com sucesso como atrás descrito. exemplo 9: Expressão de PRO em células de insecto infectadas com Baculovírus O método seguinte descreve a expressão recombinante de PRO em células de insecto infectadas com baculovírus. A sequência de codificação para PRO é fundida a montante de um marcador epitópico contido num vector de expressão de baculovírus. Estes marcadores epitópicos incluem marcadores poli-his e marcadores imunoglobulina (como regiões Fc de IgG). Podem ser empregues uma variedade de plasmideos, incluindo plasmideos derivados de plasmideos comercialmente disponíveis como o pVLl393 (Novagen). Resumidamente, a sequência de codificação de PRO ou a porção desejada da sequência de codificação de PRO tal como a sequência de codificação do domínio extracelular de uma proteína transmembranar ou a sequência de codificação da proteína madura se a proteína for extracelular, é amplificada por PCR com iniciadores complementares às regiões a 5' e 3'. O iniciador a 5' pode 118 ΕΡ 1 621 619/ΡΤ incorporar locais para enzimas de restrição flanqueadores (seleccionados) . 0 produto é então digerido com essas enzimas de restrição seleccionadas e subclonado no vector de expressão. 0 baculovirus recombinante é gerado por co-transfecção do plasmideo anterior e ADN de virus BaculoGold™ (Pharmingen) em células de Spodoptera frugiperda ("Sf9") (ATCC CRL 1711) utilizando lipofectina (comercialmente disponível de GIBCO-BRL) . Após 4-5 dias de incubação a 28°C, os virus libertados são recolhidos e utilizados para amplificações adicionais. A infecção virai e a expressão de proteína são realizadas como descrito por 0'Reilley et al., Baculovirus expression vectors: A Laboratory Manual, Oxford: Oxford University Press (1994). 0 Pro marcado com poli-his expresso pode então ser purificado, por exemplo, por cromatografia de afinidade em Ni2+-quelato como se segue. Os extractos são preparados a partir de células Sf9 infectadas com vírus recombinante como descrito por Rupert et al., Nature, 362:175-179 (1993). Resumidamente, as células Sf9 são lavadas, ressuspensas em tampão para ultra-sons (25 mL de Hepes, pH 7,9; MgCl2 12,5 mM; EDTA 0,1 mM; glicerol a 10%; NP-40 a 0,1%; KC1 0,4 M), e tratadas com ultra-sons duas vezes durante 20 segundos em gelo. O material tratado com ultra-sons é clarificado por centrifugação, e o sobrenadante é diluído 50 vezes em tampão de carga (fosfato 50 mM, NaCl 300 mM, glicerol a 10%, pH 7,8) e filtrado através de um filtro de 0,45 jm. Prepara-se uma coluna de agarose Ni2+-NTA (comercialmente disponível de Qiagen) com um volume de leito de 5 mL, lavada com 25 mL de água e equilibrada com 25 mL de tampão de carga. O extracto celular filtrado é carregado na coluna a 0,5 mL por minuto. A coluna é lavada até à linha de base de A280 com tampão de carga, ponto em que se inicia a recolha de fracções. Em seguida, a coluna é lavada com um tampão de lavagem secundário (fosfato 50 mM; NaCl 300 mM, glicerol a 10%, pH 6,0), que elui de forma não específica a proteína ligada. Depois de atingir novamente a linha de base de Α2βο, a coluna é desenvolvida com um gradiente de Imidazole de 0 a 500 mM no tampão de lavagem secundário. Recolhem-se fracções de um mL e analisam-se por SDS-PAGE e coloração com prata ou Western blot com Ni2+-NTA-conjugado a fosfatase alcalina (Qiagen). As fracções contendo 119 ΕΡ 1 621 619/ΡΤ ο PRO marcado com Hisio eluído são reunidas e dialisadas contra tampão de carga.
Alternativamente, a purificação do PRO marcado com igG (ou marcado com Fc) pode ser realizada utilizando técnicas de cromatografia conhecidas, incluindo por exemplo, cromatografia em coluna de Proteína A ou Proteína G.
Muitos dos polipéptidos PRO revelados em wo 00/56889 foram expressos com sucesso como descrito atrás.
EXEMPLO 10: Preparação de Anticorpos que Ligam PRO
Este exemplo ilustra a preparação de anticorpos monoclonais que podem ligar especificamente PRO.
As técnicas para a produção de anticorpos monoclonais são conhecidas na especialidade e estão descritas, por exemplo, em Goding, supra. Os imunogénios que podem ser empregues incluem PRO purificado, proteínas de fusão contendo PRO e células que expressam PRO recombinante na superfície celular. A selecção do imunogénio pode ser realizada pelo perito sem demasiada experimentação.
Ratinhos, tal como Balb/c, são imunizados com o imunogénio de PRO emulsionado em adjuvante completo de Freund e injectado subcutaneamente ou intraperitonealmente numa quantidade de 1-100 microgramas. Alternativamente, o imunogénio é emulsionado em adjuvante MPL-TDM (Ribi
Immunochemical Research, Hamilton, MT) e injectado na almofada das patas traseiras do animal. Os ratinhos imunizados recebem então reforços 10 a 12 dias mais tarde com imunogénio adicional emulsionado no adjuvante seleccionado. Posteriormente, durante várias semanas, os ratinhos podem também receber reforços com injecções de imunização adicionais. Podem ser obtidas amostras de soro periodicamente dos ratinhos por sangramento retro-orbital para testes em ensaios ELISA para detectar anticorpos anti-PRO.
Depois de se detectar um título adequado de anticorpos, os animais "positivos" para anticorpos podem ser injectados com uma injecção intravenosa final de PRO. Três a quatro dias 120 ΕΡ 1 621 619/ΡΤ mais tarde, os ratinhos são sacrificados e são recolhidas células do baço. As células do baço são então fundidas (utilizando polietilenoglicol a 35%) com uma linha celular de mieloma murino seleccionada tal como P3x63AgU.l, disponível de ATCC, N° . CRL 1597. As fusões geram células de hibridoma que podem então ser plaqueadas em placas de cultura de tecidos de 96 poços contendo meio HAT (hipoxantina, aminopterina e timidina) para inibir a proliferação de células não fundidas, híbridos de mieloma e híbridos de células de baço.
As células de hibridoma serão pesquisadas num ELISA quanto a reactividade contra PRO. A determinação de células de hibridoma "positivas" que segregam os anticorpos monoclonais desejados contra PRO faz parte do conhecimento dos peritos na especialidade.
As células de hibridoma positivas podem ser injectadas intraperitonealmente em ratinhos Balb/c singeneicos para produzir ascites contendo os anticorpos monoclonais anti-PRO. Alternativamente, as células de hibridoma podem ser crescidas em balões de cultura de tecidos ou frascos rolantes. A purificação dos anticorpos monoclonais produzidos nos ascites pode ser realizada utilizando precipitação com sulfato de amónio, seguida de cromatografia de exclusão em gel. Alternativamente, pode ser empregue cromatografia de afinidade baseada na ligação de anticorpo com proteína A ou proteína G. EXEMPLO 11: Purificação de Polipéptidos PRO Utilizando Anticorpos Específicos
Os polipéptidos PRO nativos ou recombinantes podem ser purificados através de uma variedade de técnicas Standard na especialidade da purificação de proteínas. Por exemplo, purifica-se pro-polipéptido PRO, polipéptido PRO maduro ou pre-polipéptido PRO por cromatografia de imunoafinidade utilizando anticorpos específicos para o polipéptido PRO de interesse. Em geral, constroi-se uma coluna de imunoafinidade por acoplamento covalente do anticorpo anti-polipéptido PRO a uma resina cromatográfica activada.
As imunoglobulinas policlonais são preparadas a partir de soros imunes quer por precipitação com sulfato de amónio quer 121 ΕΡ 1 621 619/ΡΤ por purificação em Proteína A imobilizada (Pharmacia LKB BioTechnology, Piscataway, N.J.)· Do mesmo modo, os anticorpos monoclonais são preparados a partir de fluido ascítico de ratinhos por precipitação com sulfato de amónio ou cromatografia em Proteína A imobilizada. A imunoglobulina parcialmente purificada é covalentemente ligada a uma resina cromatográfica tal como SEPHAROSE™ activada por CnBr (Pharmacia LKB BioTechnology). 0 anticorpo é acoplado à resina, a resina é bloqueada e a resina derivada é lavada de acordo com as instruções do fabricante.
Uma tal coluna de imunoafinidade é utilizada na purificação de polipéptido PRO preparando uma fracção das células contendo polipéptido PRO numa forma solúvel. Esta preparação é derivada por solubilização da célula completa ou de uma fracção subcelular obtida por centrifugação diferencial pela adição de detergente ou por outros métodos bem conhecidos na especialidade. Alternativamente, polipéptido PRO solúvel contendo uma sequência de sinal pode ser segregado em quantidade útil para o meio em que as células são crescidas.
Uma preparação contendo polipéptido PRO solúvel é passada através da coluna de imunoafinidade e a coluna é lavada sob condições que permitem a absorvência preferencial de polipéptido PRO (e.g., tampões de elevada força iónica na presença de detergente). Então, a coluna é eluída sob condições que rompem a ligação anticorpo/polipéptido PRO (e.g., um tampão de baixo pH tal como aproximadamente pH 2-3, ou uma elevada concentração de um caotropo tal como ureia ou ião tiocianato) e recolhe-se o polipéptido PRO. EXEMPLO 12: Pesquisa de Fármacos A presente invenção é particularmente útil para a pesquisa de compostos utilizando polipéptidos PRO ou seus fragmentos de ligação em qualquer uma de uma variedade de técnicas de pesquisa de fármacos. 0 polipéptido PRO ou fragmento empregues nestes testes podem estar livres em solução, afixados num suporte sólido, suportados numa superfície celular ou localizados intracelularmente. Um método de pesquisa de fármacos utiliza células hospedeiras eucariotas ou procariotas que são transformadas estavelmente com ácidos 122 ΕΡ 1 621 619/ΡΤ nucleicos recombinantes que expressam o polipéptido PRO ou o fragmento. Os fármacos são pesquisados contra essas células transformadas em ensaios de ligação competitiva. Estas células, quer na forma viável quer fixadas, podem ser utilizadas para ensaios de ligação Standard. Pode-se medir, por exemplo, a formação de complexos entre polipéptido PRO ou um fragmento e o agente a testar. Alternativamente, pode-se examinar a diminuição na formação de complexos entre o polipéptido PRO e a sua célula alvo ou receptores alvo, causada pelo agente a testar.
Assim, a presente invenção proporciona métodos de pesquisa para fármacos ou quaisquer outros agentes que possam afectar uma doença ou desordem associadas ao polipéptido PRO. Estes métodos compreendem o contacto de um tal agente com um polipéptido PRO ou seu fragmento e o ensaio (1) quanto à presença de um complexo entre o agente e o polipéptido PRO ou o fragmento, ou (ii) quanto à presença de um complexo entre o polipéptido PRO ou o fragmento e a célula, por métodos bem conhecidos na especialidade. Nestes ensaios de ligação competitiva, o polipéptido PRO ou o fragmento são tipicamente marcados. Após incubação adequada, o polipéptido PRO ou o fragmento livres são separados daqueles que estão presentes na forma ligada, e a quantidade de marcador livre ou não complexado é uma medida da capacidade do agente particular se ligar ao polipéptido PRO ou interferir com o complexo polipéptido PRO/célula.
Outra técnica para a pesquisa de fármacos proporciona uma pesquisa de alto rendimento para compostos possuindo afinidade de ligação adequada para com um polipéptido e está descrita com detalhes em WO 84/03564, publicado em 13 de Setembro, 1984. Resumidamente, grandes números de diferentes compostos de teste peptídicos pequenos são sintetizados sobre um substrato sólido, tal como pinos de plástico ou alguma outra superfície. Como aplicado a um polipéptido PRO, os compostos de teste peptídicos são feitos reagir com polipéptido PRO e lavados. O polipéptido PRO ligado é detectado por métodos bem conhecidos na especialidade. O polipéptido PRO purificado pode também ser utilizado para revestir directamente placas para utilização nas técnicas de pesquisa de fármacos atrás mencionadas. Em adição, podem-se utilizar anticorpos não 123 ΕΡ 1 621 619/ΡΤ neutralizantes para capturar o péptido e imobilizá-lo sobre o suporte sólido. A presente invenção também contempla a utilização de ensaios de pesquisa de fármacos competitivos em que anticorpos neutralizantes capazes de ligação ao polipéptido PRO competem especificamente com um composto de teste pela ligação ao polipéptido PRO ou a seus fragmentos. Desta maneira, os anticorpos podem ser utilizados para detectar a presença de qualquer péptido que partilhe um ou mais determinantes antigénicos com o polipéptido PRO. EXEMPLO 13: Desenho Racional de Fármacos 0 objectivo do desenho racional de fármacos consiste em produzir análogos estruturais de polipéptidos de interesse biologicamente activos (i.e., um polipéptido PRO) ou de moléculas pequenas com as quais interactuam, e.g., agonistas, antagonistas ou inibidores. Qualquer destes exemplos pode ser utilizado para desenhar fármacos que são formas mais activas ou estáveis do polipéptido PRO ou que aumentam ou interferem com a função do polipéptido PRO in vivo (c.f. Hodgson, Bio/Technology, 9: 19-21 (1991)).
Numa abordagem, a estrutura tridimensional do polipéptido PRO, ou de um complexo polipéptido PRO-inibidor, é determinada por cristalografia de raios-x, por modelação em computador ou, mais tipicamente, pela combinação das duas abordagens. Tanto o formato como as cargas do polipéptido PRO têm que ser determinadas para elucidar a estrutura e para determinar local(ais) activo(s) da molécula. Menos frequentemente, informação útil relativa à estrutura do polipéptido PRO pode ser obtida através de modelação baseada na estrutura de proteínas homólogas. Em ambos os casos, utiliza-se a informação estrutural relevante para desenhar moléculas análogas semelhantes a polipéptido PRO ou para identificar inibidores eficientes. Os exemplos úteis de desenho racional de fármacos podem incluir moléculas que têm actividade ou estabilidade melhoradas como mostrado por Braxton e Wells, Biochemistry, 3_1:7796 — 7801 (1992) ou que actuam como agonistas, inibidores, ou antagonistas de péptidos 124 ΕΡ 1 621 619/ΡΤ nativos como mostrado por Athauda et al., J. Biochem., 113:742-746 (1993). É também possível isolar um anticorpo específico do alvo, seleccionado por ensaio funcional, como descrito atrás, e depois resolver a sua estrutura cristalina. Esta abordagem, em princípio, produz uma estrutura nuclear de fármaco ("pharmacore") na qual se pode basear um subsequente desenho de fármacos. É possível circundar completamente a cristalografia da proteína gerando anticorpos anti-idiotípicos (anti-id) contra um anticorpo funcional, farmacologicamente activo. Tal como uma imagem no espelho de uma imagem no espelho, é de esperar que o local de ligação dos anti-id seja um análogo do receptor original. 0 anti-id pode então ser utilizado para identificar e isolar péptidos a partir de bancos de péptidos produzidos quimicamente ou biologicamente. Os péptidos isolados actuariam então como estrutura nuclear de fármaco.
Em virtude da presente invenção, podem ser tornadas disponíveis suficientes quantidades do polipéptido PRO para realizar estudos analíticos como a cristalografia de raios-x. Em adição, o conhecimento da sequência de aminoácidos do polipéptido PRO aqui proporcionada proporcionará orientação aos que empregam técnicas de modelação em computador em vez de, ou em adição a, cristalografia de raios-x. EXEMPLO 14: Ensaio de Re-diferenciação de Condrócitos (Ensaio 110)
Este ensaio mostra que certos polipéptidos da invenção actuam induzindo re-diferenciação de condrócitos, e portanto, espera-se que sejam úteis para o tratamento de várias desordens dos ossos e/ou da cartilagem tais como, por exemplo, lesões desportivas e artrite. O ensaio é realizado como se segue. Isolam-se condrócitos porcinos por digestão durante a noite com colagenase de cartilagem articular de articulações metacarpofalângicas de porcos fêmea de 4-6 meses de idade. As células isoladas são então semeadas a 25 000 células/cm2 em Ham F-12 contendo 10% de FBS e 4 pg/ml de gentamicina. O meio de cultura é trocado de três em três dias e as células são então semeadas em placas de 96 poços a 5 000 células/poço em 125 ΕΡ 1 621 619/ΡΤ 100 μΐ dos mesmos meios sem soro e adicionam-se 100 μΐ do polipéptido PRO de teste, estaurosporina 5 nM (controlo positivo) ou meio sozinho (controlo negativo) para originar um volume final de 200 μΐ/poço. Após 5 dias de incubação a 37°C, é obtida uma fotografia de cada poço e é determinado o estado de diferenciação dos condrócitos. Ocorre um resultado positivo no ensaio quando a re-diferenciação dos condrócitos é determinada como sendo mais semelhante ao controlo positivo do que ao controlo negativo. O polipéptido seguinte originou um teste positivo neste ensaio: PRO4405.
Depósito de Material
Os materiais seguintes foram depositados na American Type Cultura Collection, 12301 Parklawn Drive, Rockville, MD, EUA (ATCC):
Tabela 7
Material_N° de Dep. na ATCC_Data de Depósito DNA84920-2614 203966 27 de Abril, 1999
Estes depósitos foram realizados segundo as disposições do Tratado de Budapeste para o Reconhecimento Internacional do Depósito de Microorganismos para Efeitos do Procedimentos em Matéria de Patentes e seus Regulamentos (Tratado de Budapeste). Isto assegura a manutenção de uma cultura viável do depósito durante 30 anos desde a data do depósito. Os depósitos serão disponibilizados pela ATCC segundo os termos do Tratado de Budapeste, e sujeito a um acordo entre a Genentech, Inc. e a ATCC, que assegura a disponibilidade permanente e sem restrições da progénie da cultura do depósito ao público após a publicação da patente U.S. pertinente ou após disponíveis ao público qualquer pedido de patente U.S. ou estrangeira, aquele que primeiro acontecer, e assegura a disponibilidade da progénie a quem determinado pelo U.S. Commissioner of Patents and Trademarks estar para isso qualificado de acordo com 35 USC § 122 e as regras do Commissioner correspondentes (incluindo 37 CFR § 1.14 com particular referência para 886 OG 638). 126 ΕΡ 1 621 619/ΡΤ A cessionária do presente pedido de patente concordou que se uma cultura dos materiais depositados vier a morrer ou se perder ou for destruída quando cultivada sob condições adequadas, os materiais serão prontamente substituídos após notificação por outros iguais. A disponibilidade do material depositado não deve ser entendida como uma licença para a prática da invenção em contravenção dos direitos concedidos pela autoridade de qualquer governo de acordo com as suas leis sobre patentes. A descrição escrita anterior é considerada suficiente para permitir que um perito na especialidade ponha em prática a invenção. A presente invenção não deve ser limitada em âmbito pela construção depositada, pois a concretização depositada pretende ser uma mera ilustração de certos aspectos da invenção e outras construções que são funcionalmente equivalentes estão dentro do âmbito da presente invenção como definido nas reivindicações. 0 depósito de material não constitui uma admissão de que a presente descrição escrita é inadequada para permitir a prática de qualquer aspecto da invenção, incluindo o seu melhor modo, nem deve ser entendido como limitante do âmbito das reivindicações às ilustrações específicas que representa. De facto, várias modificações em adição às mostradas e descritas serão evidentes para os peritos na especialidade a partir da descrição e caiem no âmbito das reivindicações anexas. 127 ΕΡ 1 621 619/ΡΤ
Listagem de Sequências <110> Genentech, Inc.
<120> POLIPÉPTIDOS SEGREGADOS E TRANSMEMBRANARES E ÁCIDOS NUCLEICOS QUE OS CODIFICAM <140> EP 05011884.3 <141> 2000-03-01 <150> US 60/125,774 <151> 1999-03-23 <150> US 60/125,778 <151> 1999-03-23 <150> US 60/125,826 <151> 1999-03-24 <150> US 60/127,035 <151> 1999-03-31 <150> US 60/127,706 <151> 1999-04-05 <150> US 60/130,359 <151> 1999-04-21 <150> US 60/131,270 <151> 1999-04-27 <150> US 60/131,272 <151> 1999-04-27 <150> US 60/131,291 <151> 1999-04-27 <150> US 60/132,371 <151> 1999-05-04 <150> US 60/132,379 <151> 1999-05-04 <150> US 60/132,383 <151> 1999-05-04 <150> US 60/135,750 <151> 1999-05-25 <150> US 60/138,166 <151> 1999-06-08 <150> US 60/144,791 <151> 1999-07-20 <150> US 60/146,970 <151> 1999-08-03 128 ΕΡ 1 621 619/ΡΤ <15Ο> US 60/170,262 <151> 1999-12-09 <160> 7 <210> 1 <211> 43
< 212 > ADN <213> Sequência artificial < 2 2 Ο > <223> Sonda oligonucleotídica sintética < 4 0 0 > 1 tgtaaaacga cggccagtta aatagacctg caattattaa tct 43
<210> 2 <211> 41 <212> ADN <213> Sequência artificial < 2 2 0 > <223> Sonda oligonucleotídica sintética < 4 0 0 > 2 caggaaacag ctatgaccac ctgcacacct gcaaatccat t 41
<210> 3 <211> 2395 <212> ADN <213> Homo Sapiens < 4 0 0 > 3 cctggagccg gaagcgcggc tgcagcaggg cgaggctcca ggtggggtcg 50 gttccgcatc cagcctagcg tgtccacgat gcggctgggc tccgggacdt 100 tcgctacctg ttgcgtagcg atcgaggtgc tagggatcgc ggtcttcctt 150 c39ggattct tcccggctcc cgttcgttcc tctgccagag cggaacacgg 200 agcggagccc ccagcgcccg aaccctcggc tggagccagt tctaactgga 250 ccacgctgcc accacctctc ttcagtaaag ttgctattgt tctgatagat 300 gccttgagag atgattttgt gtttgggtca aagggtgtga aatttatgcc 3 50 ctacacaact taccttgtgg aaaaaggagc atctcacagt tttgtggctg 400 aagcaaagcc acctacagtt actatgcctc gaatcaaggc attgatgacg 450 gggagccttc ctggctttgt cgacgtcatc aggaacctca attctcctgc 500 actgctggaa gacagtgtga taagacaagc aaaagcagct ggaaaaagaa 550 129 ΕΡ 1 621 619/ΡΤ tagtctttta tggagatgaa acctgggtta aattattccc aaagoatttc 600 gtggaatatg atggaacaac ctcatttttc gtgtcagatt acacagaggt 650 ggataataat gtcacgaggc atttggacaa agtattaaaa agaggagatt 700 gggacatatt aatcctccac tacctggggc tggaccacat tggccacatt 750 tcagggccca acagccccct gattgggcag aagctgagcg agatggacag 800 cgtgctgatg aagatccaca cctcactgca gtcgaaggag agagagacgc 850 ctttâcccââ tttgetggtt ctttgtggtg accatggcat gtctgaãâcã 300 ggaagtcacg gggcctcctc caccgaggag gtgaatacac ctctgatttt 950 aatcagCtct gcgtttgaaa ggaaacccgg tgatatccga catccaaagc 1000 acgtccaata gacggatgtg gctgcgacac tggcgacagc acttggctta 1050 ccgattccaa aagacagtgt agggagcotc ctattcccag ttgtggaagg 1100 aagaccaatg agagagcagt tgagattttt acatttgaat acagtgcagc 1150 ttagtaaact gttgcaagag aatgtgccgt catatgaaaa agatcctggg 1200 tttgagcagt ttaaaatgtc agaaagattg catgggaact ggatcagact 1250 gtacttggag gaaaagcatt cagaagtcct attcaacctg ggctccaagg 1300 ttctcaggca gtacctggat gctctgaaga cgctgagctt gtccctgagt 1350 gcacaagtgg cccagttctc accctgctcc tgctcagcgt cccacaggca 1400 ctgcacagaa aggctgagct ggaagtccca ctgtcatcEc çtgggttttc 1450 tctgctcttt tatttggcga tcctggttct ttcggccgtt cacgtcattg 1500 tgtgcacctc agctgaaagt tcgtgctact tctgtggcct ctcgtggctg 1550 gcggcaggct gcctttcgtt taccagactc tggttgaaca ectggtgtgt 1600 gccaagtgct ggcagtgccc tggacagggg gcctcaggga aggacgtgga 1650 gcagccttat cccaggcctc tgggtgtccc gacacaggtg ttcacatctg 1700 tgctgtcagg tcagatgcct cagttcttgg aaagctaggt tcctgcgact 1750 gttaccaagg tgattgtaaa gagctggcgg tcacagagga acaagccccc 1800 cagctgaggg ggtgtgtgaa tcggacagcc tcccagcaga ggtgtgggag 1850 ctgcagctga gggaagaaga gacaatcggc ctggacactc aggagggtca 1900 aaaggagact tggtcgcacc actcatcctg ccacccccag aatgcatcct 1950 gcctcatcag gtccagatCt ctttccaagg cggacgttCt ctgttggaat 2000 tcttagtcct tggcctcgga caccttcatt cgttagctgg ggagtggtgg 2050 tgaggcagtg aagaagaggc ggaCggtcac actcagatcc acagagccca 2100 ggatcaaggg acccactgca gtggcagcag gactgttggg cccccacccc 2150 aaccctgcac agccctcatc ccctcttggc ttgagccgtc agaggccctg 2200 tgctgagtgt ctgaccgaga cactcacagc tttgtcatca gggcacaggc 2250 ttcctcggag ccaggatgat ctgtgccacg cttgcacctc gggcccatct 2300 gggctcatgc tctctctcct gctattgaat tagtacctag ctgcacacag 2350 tatgtagtta ccaaaagaat aaacggcaat aattgagaaa aaaaa 2395 EP 1 6 21 619/PT <210> 4 <211> 310 <212> PRT <213> Homo Sapiens < 4 0 0 > 4
Met Arg Leu Gly Ser Gly Thr Phe Ala Thr Cys Cys Val Ala Ile 1 5 10 15 Glu Vai Leu Gly Ile Ala Val Phe Leu Arg Gly Phe Phe Pro Ala 20 25 30 Pro Vai Arg Ser Ser Ala Arg Ala Glu His Gly Ala Glu Pro Pro 35 40 45 Ala Pro Glu Pro Ser Ala Gly Ala Ser Ser Asn Trp Thr Thr Leu 50 55 60 Pro Pro Pro Leu Phe Ser Lys Val Val Ile Val Leu Ile Asp Ala 65 70 75 Leu Arg Asp Asp Phe Val Phe Gly Ser Lys Gly Val Lys Phe Met SO 85 90 Pro Tyr Thr Thr Tyr Leu Val Glu Lys Gly Ala Ser His Ser Phe 95 100 105 Vai Ala Glu Ala Lys Pro Pro Thr Val Thr Met Pro Arg Ile Lys 110 115 120 Ala Leu Met Thr Gly Ser Leu pro Gly Phe Val Asp Val Ile Arg 125 130 135 Asn Leu Asn Ser Pro Ala Leu Leu Glu Asp Ser Val ile Arg Gin 140 145 150 Ala Lys Ala Ala Gly Lys Arg Ile Val Phe Tyr Gly Asp Glu Thr 155 160 165 Trp Vai Lys Leu Phe Pro Lys His Phe Val Glu Tyr Asp Gly Thr 170 175 180 Thr Ser Phe Phe Val Ser Asp Tyr Thr Glu Val Asp Asn Asn Val 185 190 195 Thr Arg His Leu Asp Lys Val Leu Lys Arg Gly Asp Trp Asp Ile 200 205 210 Leu Ile Leu His Tyr Leu Gly Leu Asp His Ile Gly His Ile Ser 215 220 225 Gly Pro Asn Ser Pro Leu Ile Gly Gin Lys Leu Ser Glu Met Asp 230 235 240 Ser Val Leu Met Lys Ile His Thr Ser Leu Gin Ser Lys Glu Arg 245 250 255 Glu Thr Pro Leu Pro Asn Leu Leu Val Leu Cys Gly Asp His Gly 260 265 270 Met Ser Glu Thr Gly Ser His Gly Ala Ser Ser Thr Glu Glu Val 275 280 285 Asn Thr Pro Leu Ile Leu Ile Ser Ser Ala Phe Glu Arg Lys Pro 290 295 300
Gly Asp Ile Arg His Pro Lys Hia Vai Gin 305 310 131 ΕΡ 1 621 619/ΡΤ
<210> 5 <211> 22 <212> ADN <213> Sequência artificial < 2 2 Ο > <223> Sonda oligonucleotidica sintética < 4 0 0 > 5 cgggactttc gctacctgtt gc 22
<210> 6 <211> 26 <212> ADN <213> Sequência artificial < 2 2 0 > <223> Sonda oligonucleotidica sintética < 4 0 0 > 6 catcatattc cacaaaatgc tttggg 26
<210> 7 <211> 38 <212> ADN <213> Sequência artificial < 2 2 0 > <223> Sonda oligonucleotidica sintética < 4 0 0 > 7 ccttcgggga ttcttcccgg ctcccgttcg ttcctctg 38
Lisboa

Claims (34)

  1. ΕΡ 1 621 619/ΡΤ 1/5 REIVINDICAÇÕES 1. Ácido nucleico isolado que: (i) codifica um polipéptido possuindo a sequência de aminoácidos mostrada na Fig.
  2. 2 (SEQ id N0:4), com ou sem a sequência de sinal e/ou a metionina de iniciação, opcionalmente com o dominio transmembranar eliminado ou inactivado; (ii) codifica um dominio extracelular do polipéptido possuindo a sequência de aminoácidos mostrada na Fig. 2 (SEQ ID NO:4), com ou sem a sequência de sinal; (iii) codifica um polipéptido possuindo pelo menos 80% de identidade de sequência de aminoácidos com o polipéptido de (i) ou o dominio extracelular de (ii), em que o polipéptido é capaz de induzir re-diferenciação de condrócitos; (iv) possui a sequência de ácido nucleico mostrada na Fig. 1 (SEQ ID NO:3); (v) possui a sequência de ácido nucleico da sequência de codificação de comprimento completo mostrada na Fig. 1 (SEQ ID NO:3); (vi) possui a sequência de codificação de comprimento completo da inserção (DNA84920-2614) contida em ATCC 203966; (vii) possui pelo menos 80% de identidade de sequência de ácido nucleico com o ácido nucleico de (iv), (v) ou (vi) e codifica um polipéptido capaz de induzir re-diferenciação de condrócitos; ou (viii) híbrida sob condições de hibridação e lavagem rigorosas com o complemento do ácido nucleico entre os nucleótidos 181 e 1008, inclusive, da Fig. 1 (SEQ ID NO:3) e codifica um polipéptido capaz de induzir re-diferenciação de condrócitos, em que a referida identidade de sequência é determinada utilizando o programa de computador ALIGN-2. 2. Ácido nucleico de acordo com a reivindicação 1, em que a referida sequência de sinal se estende dos aminoácidos 1 a 34. ΕΡ 1 621 619/ΡΤ 2/5
  3. 3. Ácido nucleico de acordo com a reivindicação 1 ou a reivindicação 2, em que o referido dominio transmembranar se estende dos aminoácidos 58 a 76.
  4. 4. Ácido nucleico de acordo com qualquer uma das reivindicações anteriores, em que o referido dominio extracelular se estende dos aminoácidos 77±5 a 310.
  5. 5. Ácido nucleico de acordo com qualquer uma das reivindicações anteriores , em que o nivel de identidade é 85%.
  6. 6. Ácido nucleico de acordo com qualquer uma das reivindicações anteriores , em que o nivel de identidade é 90%.
  7. 7. Ácido nucleico de acordo com qualquer uma das reivindicações anteriores , em que o nivel de identidade é 95%.
  8. 8. Ácido nucleico de acordo com qualquer uma das reivindicações anteriores , em que o nivel de identidade é 99%.
  9. 9. Vector compreendendo o ácido nucleico de acordo com qualquer uma das reivindicações 1 a 8.
  10. 10. Vector de acordo com a reivindicação 9 ligado operativamente a sequências de controlo reconhecidas por uma célula hospedeira transformada com o vector.
  11. 11. Célula hospedeira compreendendo o vector de acordo com a reivindicação 9 ou a reivindicação 10.
  12. 12. Célula hospedeira de acordo com a reivindicação 11, que é uma célula CHO.
  13. 13. Célula hospedeira de acordo com a reivindicação 11, que é uma E. coli.
  14. 14. Célula hospedeira de acordo com a reivindicação 11, que é uma célula de levedura.
  15. 15. Processo para a produção de um polipéptido compreendendo a cultura da célula hospedeira de acordo com qualquer uma das reivindicações 11 a 14 sob condições ΕΡ 1 621 619/ΡΤ 3/5 adequadas para a expressão do referido polipéptido, e a recuperação do referido polipéptido a partir da cultura celular.
  16. 16. Polipéptido isolado que: (i) possui a sequência de aminoácidos mostrada na Fig. 2 (SEQ ID NO:24), com ou sem a sequência de sinal e/ou a metionina de iniciação, opcionalmente com o domínio transmembranar eliminado ou inactivado; (ii) possui a sequência de aminoácidos do domínio extracelular do polipéptido mostrado na Fig.2 (SEQ ID N0:4), com ou sem a sequência de sinal; (iii) possui a sequência de aminoácidos codificada pela sequência de codificação de comprimento completo da inserção (DNA84920-2614) contida em ATCC 203966; ou (iv) possui pelo menos 80% de identidade de sequência de aminoácidos com a sequência de aminoácidos de (i), (ii) ou (iii), em que o polipéptido é capaz de induzir a re-diferenciação de condrócitos, em que a referida identidade de sequência é determinada utilizando o programa de computador ALIGN-2.
  17. 17. Polipéptido de acordo com a reivindicação 16, em que a referida sequência de sinal se estende dos aminoácidos 1 a 34.
  18. 18. Polipéptido de acordo com a reivindicação 16 ou a reivindicação 17, em que o referido domínio transmembranar se estende dos aminoácidos 58 a 76.
  19. 19. Polipéptido de acordo com qualquer uma das reivindicações 16 a 18, em que o referido domínio extracelular se estende dos aminoácidos 77±5 a 310.
  20. 20. Polipéptido de acordo com qualquer uma das reivindicações 16 a 19, em que o nível de identidade é 85%.
  21. 21. Polipéptido de acordo com qualquer uma das reivindicações 16 a 19, em que o nível de identidade é 90%. ΕΡ 1 621 619/ΡΤ 4/5
  22. 22. Polipéptido de acordo com qualquer uma das reivindicações 16 a 19, em que o nivel de identidade é 95%.
  23. 23. Polipéptido de acordo com qualquer uma das reivindicações 16 a 19, em que o nivel de identidade é 99%.
  24. 24. Molécula quimérica compreendendo um polipéptido de acordo com qualquer uma das reivindicações 16 a 23 fundida com uma sequência de aminoácidos heteróloga.
  25. 25. Molécula quimérica de acordo com a reivindicação 24, em que a referida sequência de aminoácidos heteróloga é uma sequência de marcador epitópico.
  26. 26. Molécula quimérica de acordo com a reivindicação 24, em que a referida sequência de aminoácidos heteróloga é uma região Fc de uma imunoglobulina.
  27. 27. Anticorpo que se liga especificamente a um polipéptido de acordo com qualquer uma das reivindicações 16 a 23.
  28. 28. Anticorpo de acordo com a reivindicação 27, que se liga especificamente a um polipéptido de acordo com a reivindicação 16, parte (i), (ii) ou (iii), ou com qualquer uma das reivindicações 17 a 19, na forma dependente.
  29. 29. Anticorpo de acordo com a reivindicação 27 ou a reivindicação 28, em que o referido anticorpo é um anticorpo monoclonal, um anticorpo humanizado ou um anticorpo de cadeia única.
  30. 30. Polipéptido de acordo com qualquer uma das reivindicações 16 a 23, para utilização num método de tratamento.
  31. 31. Polipéptido de acordo com a reivindicação 30, para utilização no tratamento de desordens dos ossos e/ou da cartilagem.
  32. 32. Polipéptido de acordo com a reivindicação 30, para utilização no tratamento de lesões desportivas ou artrite. ΕΡ 1 621 619/ΡΤ 5/5
  33. 33. Utilização de um polipéptido de acordo com qualquer uma das reivindicações 16 a 23 na preparação de um medicamento para o tratamento de desordens dos ossos e/ou da cartilagem.
  34. 34. Utilização de um polipéptido de acordo com qualquer uma das reivindicações 16 a 23 na preparação de um medicamento para o tratamento de lesões desportivas ou artrite. Lisboa, ΕΡ 1 621 619/ΡΤ 1/2 FIGURA 1 CCTGGAGCCGGAAGCGCGGCTGCAGCAGGGCGAGGCTCCAGGTGGGGTCGGTTCCGCATCCA gcctagcgtgtccacgatgcggctgggctccgggactttcgctacctgttgcgtagcgatcg AGGTGCTAGGGATCGCGGTCTTCCTTCGGGGATTCTTCCCGGCTCCCGTTCGTTCCTCTGCC AGAGCGGAACACGGAGCGGAGCCCCCAGCGCCCGAACCCTCGGCTGGAGCCAGTTCTAACTG GACCACGCTGCCACCACCTCTCTTCAGTAAAGTTGTTATTGTTCTGATAGATGCCTTGAGAG ATGATTTTGTGTTTGGGTCAAAGGGTGTGAAATTTATGCCCTACACAACTTACCTTGTGGAA AAAGGAGCATCTCACAGTTTTGTGGCTGAAGCAAAGCCACCTACAGTTACTATGCCTCGAAT CAAGGCATTGATGACGGGGAGCCTTCCTGGCTTTGTCGACGTCATCAGGAACCTCAATTCTC CTGCACTGCTGGAAGACAGTGTGATAAGACAAGCAAAAGCAGCTGGAAAAAGAATAGTCTTT TATGGAGATGAAACCTGGGTTAAATTATTCCCAAAGCATTTTGTGGAATATGATGGAACAAC CTCATTTTTCGTGTCAGATTACACAGAGGTGGATAATAATGTCACGAGGCATTTGGATAAAG TATTAAAAAGAGGAGATTGGGACATATTAATCCTCCACTACCTGGGGCTGGACCACATTGGC CACATTTCAGGGCCCAACAGCCCCCTGATTGGGCAGAAGCTGAGCGAGATGGACAGCGTGCT GATGAAGATCCACACCTCACTGCAGTCGAAGGAGAGAGAGACGCCTTTACCCAATTTGCTGG TTCTTTGTGGTGACCATGGCATGTCTGAAACAGGAAGTCACGGGGCCTCCTCCACCGAGGAG GTGAATACACCTCTGATTTTAATCAGTTCTGCGTTTGAAAGGAAACCCGGTGATATCCGACA TCCAAAGCACGTCCAATAGACGGATGTGGCTGCGACACTGGCGATAGCACTTGGCTTACCGA TTCCAAAAGACAGTGTAGGGAGCCTCCTATTCCCAGTTGTGGAAGGAAGACCAATGAGAGAG CAGTTGAGATTTTTACATTTGAATACAGTGCAGCTTAGTAAACTGTTGCAAGAGAATGTGCC GTCATATGAAAAAGATCCTGGGTTTGAGCAGTTTAAAATGTCAGAAAGATTGCATGGGAACT GGATCAGACTGTACTTGGAGGAAAAGCATTCAGAAGTCCTATTCAACCTGGGCTCCAAGGTT CTCAGGCAGTACCTGGATGCTCTGAAGACGCTGAGCTTGTCCCTGAGTGCACAAGTGGCCCA GTTCTCACCCTGCTCCTGCTCAGCGTCCCACAGGCACTGCACAGAAAGGCTGAGCTGGAAGT CCCACTGTCATCTCCTGGGTTTTCTCTGCTCTTTTATTTGGTGATCCTGGTTCTTTCGGCCG TTCACGTCATTGTGTGCACCTCAGCTGAAAGTTCGTGCTACTTCTGTGGCCTCTCGTGGCTG GCGGCAGGCTGCCTTTCGTTTACCAGACTCTGGTTGAACACCTGGTGTGTGCCAAGTGCTGG CAGTGCCCTGGACAGGGGGCCTCAGGGAAGGACGTGGAGCAGCCTTATCCCAGGCCTCTGGG TGTCCCGACACAGGTGTTCACATCTGTGCTGTCAGGTCAGATGCCTCAGTTCTTGGAAAGCT AGGTTCCTGCGACTGTTACCAAGGTGATTGTAAAGAGCTGGCGGTCACAGAGGAACAAGCCC CCCAGCTGAGGGGGTGTGTGAATCGGACAGCCTCCCAGCAGAGGTGTGGGAGCTGCAGCTGA GGGAAGAAGAGACAATCGGCCTGGACACTCAGGAGGGTCAAAAGGAGACTTGGTCGCACCAC TCATCCTGCCACCCCCAGAATGCATCCTGCCTCATCAGGTCCAGATTTCTTTCCAAGGCGGA CGTTTTCTGTTGGAATTCTTAGTCCTTGGCCTCGGACACCTTCATTCGTTAGCTGGGGAGTG GTGGTGAGGCAGTGAAGAAGAGGCGGATGGTCACACTCAGATCCACAGAGCCCAGGATCAAG GGACCCACTGCAGTGGCAGCAGGACTGTTGGGCCCCCACCCCAACCCTGCACAGCCCTCATC CCCTCTTGGCTTGAGCCGTCAGAGGCCCTGTGCTGAGTGTCTGACCGAGACACTCACAGCTT TGTCATCAGGGCACAGGCTTCCTCGGAGCCAGGATGATCTGTGCCACGCTTGCACCTCGGGC CCATCTGGGCTCATGCTCTCTCTCCTGCTATTGAATTAGTACCTAGCTGCACACAGTATGTA GTTACCAAAAGAATAAACGGCAATAATTGAGAAAAAAAA ΕΡ 1 621 619/ΡΤ 2/2 FIGURA 2 ></usr/seqdb2/sst/DNA/Dnaseqs,min/ss·ΟΝΑΘ 4 920 Xsubunit 1 of 1, 310 aa, 1 stop XMW: 33875, pi: 7.08, NX(S/T): 2 mrlgsgtfatccvaievlgiavflrgffpapvrssaraehgaeppapepsagassnwttlpp pifskvvivlidalrddfvfgskgvkfmpyttylvekgashsfvaeakpptvtmprikalmt G3LPGFVDVIRNLNSPALLEDSVIRQAKAAGKRIVFYGDETWVKLFPKHFVEYDGTTSFFVS DYTEVDNNVTRHLDKVLKRGDWDILILHYLGLDHIGHISGPNSPLIGQKLSEMDSVLMKIHT SLQSKERETPLPNLLVLCGDHGMSETGSHGASSTEEVNTPLILISSAFERKPGDIRHPKHVQ Características importantes da proteína: Péptido de sinal: Aminoácidos 1-34 Domínio transmembranar: Aminoácidos 58-76 Locais de N-glicosilação: Aminoácidos 56-60, 194-198 Locais de N-miristoílação: Aminoácidos 6-12, 52-58, 100-106, 125-131, 233-239, 270-276, 275-281, 278-284 Local de amidação: Aminoácidos 154-158 Sequência de fixação às células: aminoácidos 205-208
PT05011884T 1999-03-23 2000-03-01 Polipéptidos segregados e transmenbranares e ácidos nucleicos que os codificam PT1621619E (pt)

Applications Claiming Priority (16)

Application Number Priority Date Filing Date Title
US12577499P 1999-03-23 1999-03-23
US12577899P 1999-03-23 1999-03-23
US12582699P 1999-03-24 1999-03-24
US12703599P 1999-03-31 1999-03-31
US12770699P 1999-04-05 1999-04-05
US13035999P 1999-04-21 1999-04-21
US13127299P 1999-04-27 1999-04-27
US13127099P 1999-04-27 1999-04-27
US13129199P 1999-04-27 1999-04-27
US13238399P 1999-05-04 1999-05-04
US13237999P 1999-05-04 1999-05-04
US13237199P 1999-05-04 1999-05-04
US13575099P 1999-05-25 1999-05-25
US13816699P 1999-06-08 1999-06-08
US14479199P 1999-07-20 1999-07-20
US14697099P 1999-08-03 1999-08-03

Publications (1)

Publication Number Publication Date
PT1621619E true PT1621619E (pt) 2007-08-29

Family

ID=38175751

Family Applications (1)

Application Number Title Priority Date Filing Date
PT05011884T PT1621619E (pt) 1999-03-23 2000-03-01 Polipéptidos segregados e transmenbranares e ácidos nucleicos que os codificam

Country Status (5)

Country Link
EP (1) EP1621619B1 (pt)
AT (1) ATE363537T1 (pt)
DK (1) DK1621619T3 (pt)
ES (1) ES2288279T3 (pt)
PT (1) PT1621619E (pt)

Also Published As

Publication number Publication date
EP1621619A2 (en) 2006-02-01
ATE363537T1 (de) 2007-06-15
EP1621619A3 (en) 2006-02-08
EP1621619B1 (en) 2007-05-30
DK1621619T3 (da) 2007-10-01
ES2288279T3 (es) 2008-01-01

Similar Documents

Publication Publication Date Title
EP1210418B1 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same
JP4451059B2 (ja) 分泌及び膜貫通ポリペプチドとそれをコードする核酸
US20060073579A1 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same
EP2228446A1 (en) Secreted and transmembrane polypeptieds and nucleic acids encoding the same
US20060074033A1 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same
CA2378403A1 (en) Novel polynucleotides and method for the use thereof
EP1169442B1 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same
WO2000070050A1 (en) Compositions and methods for the treatment of immune related diseases
US7728108B2 (en) PRO1550 polypeptides
US7304136B2 (en) PRO4407 polypeptides
US20060073549A1 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same
WO2000068376A1 (en) Novel chimpanzee erythropoietin (chepo) polypeptides and nucleic acids encoding the same
US7795412B2 (en) Nucleic acids encoding PRO6308 polypeptides and related vectors and host cells
PT1621619E (pt) Polipéptidos segregados e transmenbranares e ácidos nucleicos que os codificam
US20020192752A1 (en) Compositions and methods for the treatment of immune related diseases
EP1300417B1 (en) Secreted and transmembrane polypeptide and nucleic acid encoding the same
CA2478369A1 (en) Novel polypeptides having sequence similarity to gdnfr and nucleic acids encoding the same
AU2003261484B2 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same
AU2005205755B2 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same
US20060051792A1 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same
CA2512479A1 (en) Secreted and transmembrane polypeptides and nucleic acids encoding the same