PT1623989E

PT1623989E - ''composições e métodos para o diagnóstico de tumores''

Info

Publication number: PT1623989E
Application number: PT05018355T
Authority: PT
Inventors: Avi J Ashkenazi; Robert M Pitti; Audrey Goddard; Kenneth J Hillan; James Pan; Colin K Watanabe; Victoria Smith; Paul J Godowski; Austin L Gurney; Scot A Masters; Margaret Ann Roy; Donna M Stone; William I Wood
Original assignee: Genentech Inc
Priority date: 1999-03-08
Filing date: 2000-02-11
Publication date: 2007-09-25
Also published as: CA2479511A1; DK1632499T3; WO2001053486A1; EP1626084A1; ES2290834T3; PT1626058E; JP2004229503A; ES2296029T3; EP1632499A2; CA2365610A1; JP2004229504A; AU2003200740B2; DK1623989T3; ATE364628T1; AU2003200740C1; ATE377025T1; ATE363489T1; CA2479476C; EP1632499B9; ATE380195T1

Description

ΕΡ 1 623 989/ΡΤ

DESCRIÇÃO "Composições e métodos para o diagnóstico de tumores"

Campo do invento 0 presente invento refere-se a composições e métodos para o diagnóstico e tratamento de tumor.

Antecedentes do invento

Os tumores malignos (cancros) são a segunda principal causa de morte nos Estados Unidos logo após as doenças cardíacas (Boring et al., CA Cancel J. Clin., 43:7 [1993]). 0 cancro caracteriza-se por um aumento do número de células anómalas ou neoplásicas derivadas de um tecido normal que proliferam para formar uma massa de tumor, pela invasão de tecidos adjacentes por essas células neoplásicas de tumor e pela geração de células malignas que eventualmente se espalharão através do sistema sanguíneo ou linfático para nódulos linfáticos locais e para localizações distantes (metástase). Num estado canceroso uma célula prolifera em condições sob as quais células normais não cresceriam. 0 cancro manifesta-se numa grande variedade de formas caracterizadas por diferentes graus de invasão e agressividade. A alteração da expressão génica está intimamente relacionada com o crescimento celular descontrolado e des-diferenciação que são caracteristicas comuns a todos os cancros. Verificou-se que os genomas de determinados tumores bem estudados apresentam expressão diminuída de genes recessivos, habitualmente referidos como genes de supressão de tumor, que funcionariam normalmente para evitar crescimento celular maligno e/ou sobre-expressão de determinados genes dominantes tal como oncogenes, que actuam na promoção de crescimento maligno. Cada uma destas alterações genéticas parece ser responsável pela importação de algumas das caracteristicas que, conjuntamente, representam o fenótipo neoplásico completo (Hunter, Cell, 6_4:1129 [1991] e Bishop, Cell, 64:235-248 [1991]); 2 ΕΡ 1 623 989/ΡΤ A amplificação génica constitui um mecanismo bem conhecido de sobre-expressão de genes (por exemplo, oncogene) em células de cancro. Esta consiste num processo em que se produzem cópias múltiplas de um gene especifico no cromossoma da célula ancestral. 0 processo envolve replicação não prevista da região do cromossoma incluindo o gene, seguida de recombinação dos segmentos replicados de volta para o cromossoma (Alitalo et al., Adv. Câncer Res., _47:235-281 [1986]). Pensa-se que a sobre-expressão do gene equivale a amplificação génica, ou seja, é proporcional ao número de cópias efectuadas.

Os proto-oncogenes que codificam factores de crescimento e receptores de factores de crescimento foram identificados como desempenhando papéis importantes na patogénese de várias malignidades humanas, incluindo cancro de mama. Por exemplo, revelou-se que o gene humano ErbB2 (erbB2, também conhecido como her2 ou c-erbB-2), que codifica um receptor de glicoproteina transmembranar de 185 kd (pl85HER2; HER2) relacionado com o receptor do factor de crescimento epidérmico EGFR), se encontra sobre-expresso em cerca de 25% a 30% em cancro de mama humano (Slamon et al., Science, 235:177-182 [1987]; Slamon et al., Science, 244:707-712 [1989]).

Relatou-se que a amplificação génica de um proto-oncogene é um evento tipicamente envolvido nas formas mais malignas de cancro e poderia funcionar como um elemento de previsão do desfecho clínico (Schwab et al., Genes Chromosomes Câncer, _1:181-193 [1990]; Alitalo et al., supra). Assim, a sobre-expressão de erbB2 é habitualmente encarada como um elemento de previsão de um prognóstico fraco, especialmente em doentes com doença primária que envolve nódulos linfáticos auxiliares (Slamon et al., [1987] e [1989], supra; Ravdin e Chamness, Gene, 159:19-27 [1995]; e Hynes e Stern, Biochim. Biophys. Acta, 1198:165-184 [1994]) e tem sido relacionado com a sensibilidade e/ou resistência a terapia hormonal e regimes quimioterapêuticos incluindo CMF (ciclofosfamida, metotrexato, e fluorouracilo) e antraciclinas (Baselga et al., Oncology, 11 (3 Supl):43-48 (1997]). Contudo, apesar da associação entre sobre-expressão de erbB2 e prognóstico fraco, a probabilidade de doentes positivos para HER2 responderem clinicamente a tratamento com taxanos foi mais de três vezes superior à de doentes negativos para HER2 (Ibid). Um anticorpo monoclonal 3 ΕΡ 1 623 989/ΡΤ recombinante humanizado anti-ErbB2 (anti-HER2) (uma versão humanizada do anticorpo 4D5 anti-ErbB2 murino, denominado rhuMAb HER2 ou Herceptin™) foi clinicamente activo em doentes com cancros de mama metastáticos que sobre-expressam ErbB2 e que tinham recebido terapia anticancerosa extensiva anterior. (Baselga et al., J. Clin. Oncol., 14:737-744 [1996]).

Tendo tal em consideração, existe interesse óbvio em identificar novos métodos e composições que sejam úteis para diagnóstico e tratamento de tumores que estão associados com amplificação génica.

Sumário do invento A. Concretizações 0 presente invento refere-se a composições e métodos para o diagnóstico e o tratamento de crescimento e proliferação de células neoplásicas em mamíferos, incluindo seres humanos. 0 presente invento baseia-se na identificação de genes que são amplificados no genoma de células tumorais. Espera-se que tal amplificação génica esteja associada com a sobre-expressão do produto génico e contribua para a tumorigénese. Assim, pensa-se que as proteínas codificadas pelos genes amplificados sejam alvos úteis para o diagnóstico e/ou tratamento (incluindo prevenção) de determinados cancros e possam actuar como elementos de previsão do prognóstico de tratamento de tumor.

Numa concretização, o presente invento refere-se a um anticorpo isolado que se liga a um polipéptido aqui designado como um polipéptido PRO ou PR07168. Num aspecto, o anticorpo isolado liga-se especificamente a um polipéptido PR07168. Noutro aspecto, o anticorpo induz a morte de uma célula que expressa um polipéptido PR07168. Muitas vezes a célula que expressa o polipéptido PR07168 é uma célula tumoral que sobre-expressa o polipéptido relativamente a uma célula normal do mesmo tipo de tecido. Ainda noutro aspecto, o anticorpo é um anticorpo monoclonal, que apresenta de preferência resíduos da região determinante de complementaridade (CDR) não humanos e resíduos da região de esqueleto (FR) humanos. 0 anticorpo pode ser marcado e pode ser imobilizado num suporte sólido. Ainda 4 ΕΡ 1 623 989/ΡΤ noutro aspecto, ο anticorpo é um fragmento de anticorpo, um anticorpo de cadeia simples ou um anticorpo humanizado que se liga, de preferência especificamente, a um polipéptido PR07168.

Noutra concretização, o invento refere-se a uma composição de matéria que inclui um anticorpo que se liga, de preferência especificamente, a um polipéptido PR07168 misturado com um transportador farmaceuticamente aceitável. Num aspecto, a composição de matéria inclui uma quantidade terapeuticamente eficaz do anticorpo. Noutro aspecto, a composição inclui um ingrediente activo adicional que pode, por exemplo, ser um anticorpo adicional ou um agente citotóxico ou quimioterapêutico. De preferência, a composição é estéril.

Numa outra concretização, o invento refere-se a moléculas de ácido nucleico isoladas que codificam anticorpos anti-PR07168 e vectores e células hospedeiras recombinantes incluindo essas moléculas de ácido nucleico.

Ainda numa outra concretização, o invento refere-se a um método para produzir um anticorpo anti-PR07168, em que o método inclui a cultura de uma célula hospedeira transformada com uma molécula de ácido nucleico que codifica o anticorpo em condições suficientes para permitir expressão do anticorpo e a recuperação do anticorpo a partir da cultura de células.

Numa outra concretização, o invento refere-se a uma molécula de ácido nucleico isolada que híbrida com uma molécula de ácido nucleico que codifica um polipéptido PR07168 ou o seu complemento. A molécula de ácido nucleico isolada é preferivelmente ADN, e a hibridação ocorre preferivelmente sob condições de hibridação e de lavagem rigorosas. Estas moléculas de ácido nucleico podem actuar como moléculas anti-sentido dos genes amplificados aqui identificados, que, por sua vez, podem ser úteis na modulação da transcrição e/ou tradução dos respectivos genes amplificados, ou como iniciadores anti-sentido em reacções de amplificação. Adicionalmente, estas sequências podem ser utilizadas como parte de uma ribozima e/ou de uma sequência em hélice tripla que, por sua vez, podem ser utilizadas na regulação dos genes amplificados. 5 ΕΡ 1 623 989/ΡΤ

Noutra concretização, ο invento proporciona um método para determinar a presença de um polipéptido PR07168 numa amostra que se suspeita conter um polipéptido PR07168, em que o método inclui expor a amostra a um anticorpo anti-PR07168 e determinar a ligação do anticorpo a um polipéptido PR07168 na amostra. Noutra concretização, o invento proporciona um método para determinar a presença de um polipéptido PR07168 numa célula, em que o método inclui expor a célula a um anticorpo anti-PR07168 e determinar a ligação do anticorpo à célula.

Ainda noutra concretização, o presente invento refere-se a um método de diagnóstico de tumor do pulmão num mamífero, incluindo detectar o nivel de expressão de um gene que codifica um polipéptido PR07168 (a) numa amostra de teste de células de tecido obtida de um mamífero e (b) numa amostra de controlo de células de tecido normal conhecido do mesmo tipo de células, em que um nivel de expressão mais elevado na amostra de teste comparativamente com a amostra de controlo é indicativo da presença de tumor no mamífero do qual se obtiveram as células do tecido de teste.

Noutra concretização, o presente invento refere-se a um método de diagnóstico de tumor do pulmão num mamífero, incluindo (a) por em contacto um anticorpo anti-PR07168 com uma amostra de teste de células de tecido obtidas do mamífero e (b) detectar a formação de um complexo entre o anticorpo anti-PR07168 e um polipéptido PR07168 na amostra de teste, em que a formação de um complexo é indicativa da presença de um tumor no referido mamifero. A detecção pode ser qualitativa ou quantitativa e pode ser efectuada em comparação com a monitorização de formação de complexo numa amostra de controlo de células de tecido normal conhecido do mesmo tipo de células. Uma maior quantidade de complexos formados na amostra de teste indica a presença de tumor no mamífero do qual se obtiveram as células de tecido de teste. 0 anticorpo transporta de preferência um marcador detectável. A formação de complexo pode ser monitorizada, por exemplo, por microscopia óptica, citometria de fluxo, fluorimetria ou outras técnicas conhecidas na especialidade. 6 ΕΡ 1 623 989/ΡΤ A amostra de teste é habitualmente obtida de um indivíduo que se suspeita ter crescimento ou proliferação de células neoplásicas (por exemplo, células cancerosas).

Noutra concretização, o presente invento refere-se a um kit de diagnóstico de cancro incluindo um anticorpo anti-PR07168 e um transportador (por exemplo, um tampão) numa embalagem adequada. 0 kit contém de preferência instruções para utilizar o anticorpo para detectar a presença de um polipéptido PR07168 numa amostra que se suspeita conter o mesmo. B. Concretizações adicionais

Noutras concretizações do presente invento, o invento proporciona uma molécula de ácido nucleico isolada incluindo uma sequência de nucleótidos que codifica um polipéptido PR07168.

Num aspecto, a molécula de ácido nucleico isolada compreende uma sequência nucleotídica possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91 % de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo 7 ΕΡ 1 623 989/ΡΤ menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência com (a) uma molécula de ADN que codifica um polipéptido PR07168 possuindo uma sequência de aminoácidos de comprimento completo como aqui se descreve, uma sequência de aminoácidos a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de uma proteína transmembranar, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo como aqui se descreve, ou (b) o complemento da molécula de ADN de (a).

Noutros aspectos, a molécula de ácido nucleico isolada compreende uma sequência nucleotídica possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91 % de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo 8 ΕΡ 1 623 989/ΡΤ menos cerca de 99% de identidade de sequência to (a) uma molécula de ADN compreendendo a sequência de codificação de um ADNc do polipéptido PR07168 de comprimento completo como aqui se descreve, a sequência de codificação de um polipéptido PR07168 a que falta o péptido de sinal como aqui se descreve, a sequência de codificação de um dominio extracelular de um polipéptido PR07168 transmembranar, com ou sem o péptido de sinal, como aqui se descreve ou a sequência de codificação de qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo como aqui se descreve, ou (b) o complemento da molécula de ADN de (a).

Num outro aspecto, o invento refere-se a uma molécula de ácido nucleico isolada compreendendo a sequência nucleotidica possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência to (a) uma molécula de ADN que codifica o mesmo polipéptido maduro que é codificado por qualquer dos ADNc de 9 ΕΡ 1 623 989/ΡΤ proteína humana depositado na ATCC como aqui se descreve, ou (b) o complemento da molécula de ADN de (a).

Outro aspecto do invento proporciona uma molécula de ácido nucleico isolada incluindo uma sequência de nucleótidos que codifica um polipéptido PR07168 que apresenta o domínio transmembranar eliminado ou o domínio transmembranar inactivado, ou é complementar a tal sequência de nucleótidos de codificação, em que o(s) domínio(s) transmembranar(es) de deste polipéptido são aqui revelados. Assim, encontram-se abrangidos domínios extracelulares solúveis dos polipéptidos PR07168 aqui descritos.

Outra concretização refere-se a fragmentos de uma sequência de codificação de um polipéptido PR07168, ou do seu complemento, que podem ser úteis como, por exemplo, sondas de hibridação, para fragmentos de codificação de um polipéptido PR07168 que podem codificar opcionalmente um polipéptido compreendendo um local de ligação para um anticorpo anti-PR07168 ou como sondas oligonucleotídicas anti-sentido. Estes fragmentos de ácido nucleico têm usualmente pelo menos cerca de 20 nucleótidos de comprimento, preferivelmente pelo menos cerca de 30 nucleótidos de comprimento, mais preferivelmente pelo menos cerca de 40 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 50 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 60 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 70 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 80 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 90 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 100 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 110 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 120 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 130 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 140 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 150 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 160 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 170 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 10 ΕΡ 1 623 989/ΡΤ 180 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 190 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 200 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 250 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 300 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 350 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 400 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 450 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 500 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 600 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 700 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 800 nucleótidos de comprimento, ainda mais preferivelmente pelo menos cerca de 900 nucleótidos de comprimento e ainda mais preferivelmente pelo menos cerca de 1000 nucleótidos de comprimento, em que, neste contexto, o termo "cerca de" significa o comprimento da sequência nucleotidica referenciada mais ou menos 10% desse comprimento referenciado. Note-se que podem ser determinados novos fragmentos de uma sequência nucleotidica que codifica o polipéptido PR07168 de forma rotineira efectuando o alinhamento da sequência nucleotidica que codifica o polipéptido PR07168 com outras sequências nucleotidicas conhecidas utilizando qualquer um dos vários de programas de alinhamento de sequências bem conhecidos e determinando quais o(s) fragmento(s) da sequência nucleotidica que codifica o polipéptido PR07168 são novos. Todas estas sequências nucleotidicas que codificam um polipéptido PR07168 estão aqui contempladas. Estão igualmente contemplados os fragmentos de polipéptidos PR07168 codificados por estes fragmentos de moléculas nucleotidicas, preferivelmente fragmentos de polipéptido PR07168 que compreendem um local de ligação para um anticorpo anti-PR07168. Ainda noutra concretização, o invento proporciona um polipéptido PR07168 isolado codificado por qualquer das sequências de ácido nucleico isoladas atrás identificadas.

Num determinado aspecto, o invento refere-se a um polipéptido PR07168 isolado, compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 80% de identidade de 11 ΕΡ 1 623 989/ΡΤ sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência com um polipéptido PR07168 possuindo uma sequência de aminoácidos de comprimento completo como aqui se descreve, uma sequência de aminoácidos a que falta o péptido de sinal como aqui se descreve, um dominio extracelular de uma proteína transmembranar, com ou sem o péptido de sinal, como aqui se descreve, ou qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo como aqui se descreve.

Num outro aspecto, o invento refere-se a um polipéptido PR07168 isolado compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 80% de identidade de sequência, preferivelmente pelo menos cerca de 81% de identidade de sequência, mais preferivelmente pelo menos cerca de 82% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 83% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 84% de identidade de 12 ΕΡ 1 623 989/ΡΤ sequência, ainda mais preferivelmente pelo menos cerca de 85% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 86% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 87% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 88% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 89% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 90% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 91% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 92% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 93% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 94% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 95% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 96% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 97% de identidade de sequência, ainda mais preferivelmente pelo menos cerca de 98% de identidade de sequência e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência com uma sequência de aminoácidos codificada por qualquer dos ADNc de proteína humana depositados na ATCC como aqui se descreve.

Num outro aspecto, o invento refere-se a um polipéptido PR07168 isolado compreendendo uma sequência de aminoácidos com uma pontuação de pelo menos cerca de 80% positivos, preferivelmente pelo menos cerca de 81% positivos, mais preferivelmente pelo menos cerca de 82% positivos, ainda mais preferivelmente pelo menos cerca de 83% positivos, ainda mais preferivelmente pelo menos cerca de 84% positivos, ainda mais preferivelmente pelo menos cerca de 85% positivos, ainda mais preferivelmente pelo menos cerca de 86% positivos, ainda mais preferivelmente pelo menos cerca de 87% positivos, ainda mais preferivelmente pelo menos cerca de 88% positivos, ainda mais preferivelmente pelo menos cerca de 89% positivos, ainda mais preferivelmente pelo menos cerca de 90% positivos, ainda mais preferivelmente pelo menos cerca de 91% positivos, ainda mais preferivelmente pelo menos cerca de 92% positivos, ainda mais preferivelmente pelo menos cerca de 93% positivos, ainda mais preferivelmente pelo menos cerca de 94% positivos, ainda mais preferivelmente pelo menos cerca de 95% positivos, ainda mais 13 ΕΡ 1 623 989/ΡΤ preferivelmente pelo menos cerca de 96% positivos, ainda mais preferivelmente pelo menos cerca de 97% positivos, ainda mais preferivelmente pelo menos cerca de 98% positivos e ainda mais preferivelmente pelo menos cerca de 99% positivos em comparação com a sequência de aminoácidos de um polipéptido PR07168 possuindo uma sequência de aminoácidos de comprimento completo como aqui se descreve, uma sequência de aminoácidos a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de uma proteína transmembranar, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento especificamente definido da sequência de aminoácidos de comprimento completo como aqui se descreve.

Num aspecto específico, o invento proporciona um polipéptido PR07168 isolado sem a sequência de sinal N-terminal e/ou a metionina de iniciação e é codificado por uma sequência de nucleótidos que codifica tal sequência de aminoácidos tal como aqui previamente descrito. Os processos para produzir aquele são também aqui descritos, em que esses processos incluem cultivar uma célula hospedeira incluindo um vector que inclui a molécula de ácido nucleico codificante apropriada em condições adequadas para expressão do polipéptido PR07168 e recuperação do polipéptido PR07168 da cultura de células.

Outro aspecto do invento proporciona um polipéptido PR07168 isolado que apresenta quer o domínio transmembranar eliminado quer o domínio transmembranar inactivado. São também aqui descritos processos para produzir aquele, em que esses processos incluem cultivar uma célula hospedeira incluindo um vector que inclui a molécula de ácido nucleico codificante apropriada, em condições adequadas para expressão do polipéptido PR07168 e recuperação do polipéptido PR07168 de uma cultura de células.

Noutras concretizações do presente invento, o invento proporciona vectores incluindo ADN que codificam qualquer dos polipéptidos aqui descritos. Proporcionam-se igualmente células hospedeiras incluindo qualquer de tais vectores. Como exemplo, as células hospedeiras podem ser células CHO, células de E. coli, de levedura ou de insecto infectadas por baculovírus. Proporciona-se adicionalmente um processo para 14 ΕΡ 1 623 989/ΡΤ produzir qualquer dos polipéptidos aqui descritos e inclui cultivar células hospedeiras em condições adequadas para expressão do polipéptido pretendido e recuperar o polipéptido pretendido da cultura de células.

Noutras concretizações, o invento proporciona moléculas quiméricas incluindo qualquer dos polipéptidos aqui descritos fundido com um polipéptido ou sequência de aminoácidos heteróloga. Constituem exemplos de tais moléculas quiméricas, entre outros, quaisquer dos polipéptidos aqui descritos fundidos com uma sequência de marcação de epitopo ou uma região Fc de uma imunoglobulina.

Ainda noutras concretizações, o invento proporciona sondas de oligonucleótidos úteis para isolar sequências de nucleótidos genómicas e de ADNc ou como sondas anti-sentido, em que essas sondas podem ser derivadas de qualquer das sequências de nucleótidos descritas acima ou adiante.

Descrição sucinta das figuras A figura 1 apresenta a sequência de nucleótidos (SEQ ID NO: 1) de um ADNc contendo uma sequência de nucleótidos que codifica PR07168 de sequência nativa, em que a sequência de nucleótidos (SEQ ID N0:1) é um clone aqui denominado como DNA102846-2742. Também se apresentam em tipo negrito e sublinhado as posições dos respectivos codões de iniciação e terminação. A figura 2 apresenta a sequência de aminoácidos (SEQ ID NO:2) de um polipéptido PR07168 de sequência nativa tal como derivado da sequência de codificação de SEQ ID NO:l apresentada na figura 1.

Descrição detalhada do invento I. Definições

As expressões "amplificação génica" e "duplicação génica" são utilizadas indiferentemente e referem-se a um processo pelo qual se formam cópias múltiplas de um gene ou fragmento de gene numa célula ou linha celular especificas. A região 15 ΕΡ 1 623 989/ΡΤ duplicada (uma porção de ADN amplificado) é muitas vezes denominada um "amplicão". Habitualmente, a quantidade do ARN mensageiro (ARNm) produzido, ou seja, o nível de expressão génica também aumenta proporcionalmente com o número de cópias efectuadas do gene especificamente expresso. "Tumor", tal como aqui utilizado, refere-se a todo o crescimento e proliferação de células neoplásicas, quer sejam malignas quer sejam benignas e a todas as células e tecidos pré-cancerosos e cancerosos.

As expressões "cancro" e "canceroso" referem-se ou descrevem a condição fisiológica em mamíferos que é caracterizada tipicamente por crescimento celular desregulado. Constituem exemplos de cancro, entre outros, carcinoma, linfoma, blastoma, sarcoma e leucemia. Constituem exemplos mais específicos de tais cancros, entre outros, cancro de mama, cancro de próstata, cancro de cólon, cancro de células escamosas, cancro de células pequenas do pulmão, cancro de células não pequenas do pulmão, cancro gastrointestinal, cancro pancreático, glioblastoma, cancro cervical, cancro dos ovários, cancro de fígado, cancro de bexiga, hepatoma, cancro colorrectal, carcinoma do endométrio, carcinoma das glândulas salivares, cancro de rim, cancro de fígado, cancro vulvar, cancro da tiróide, carcinoma hepático e vários tipos de cancro da cabeça e do pescoço. "Tratamento" é uma intervenção efectuada com o intuito de evitar o desenvolvimento ou alterar a patologia de uma doença. Assim, "tratamento" refere-se tanto a tratamento terapêutico e profiláctico como a medidas preventivas. Aqueles que têm necessidade de tratamento incluem os que já apresentam a doença assim como aqueles nos quais a doença deve ser evitada. No tratamento de tumor (por exemplo, cancro), um agente terapêutico pode diminuir directamente a patologia de células tumorais ou tornar as células tumorais mais susceptíveis a tratamento por outros agentes terapêuticos, por exemplo, radiação e/ou quimioterapia. A "patologia" do cancro inclui todos os fenómenos que comprometem o bem-estar do doente. Tal inclui, entre outros, crescimento celular anómalo ou descontrolado, metástase, 16 ΕΡ 1 623 989/ΡΤ interferência com ο funcionamento normal de células adjacentes, libertação de citoquinas ou outros produtos de excreção a niveis anómalos, supressão ou agravamento de resposta inflamatória ou imunológica, etc. "Mamífero" com objectivos de tratamento refere-se a qualquer animal classificado como um mamífero, incluindo humanos, animais domésticos e de quinta e animais de jardim zoológico, de desporto ou de companhia, tal como cães, cavalos, gatos, gado bovino, porcos, ovelhas, etc. De preferência o mamifero é humano. "Transportadores" tal como aqui utilizado inclui transportadores farmaceuticamente aceitáveis, excipientes ou estabilizantes que não são tóxicos para a célula ou mamifero que a eles é exposta às dosagens e concentrações utilizadas. Muitas vezes o transportador fisiologicamente aceitável é uma solução aquosa de pH tamponado. Constituem exemplos de transportadores fisiologicamente aceitáveis, entre outros, tampões tais como fosfato, citrato e outros ácidos orgânicos; antioxidantes incluindo ácido ascórbico; polipéptidos de baixo peso molecular (menos de cerca de 10 resíduos); proteínas, tal como albumina de soro, gelatina ou imunoglobulinas; polímeros hidrófilos tal como polivinilpirrolidona; aminoácidos tais como glicina, glutamina, asparagina, arginina ou lisina; monossacáridos, dissacáridos e outros hidratos de carbono incluindo glucose, manose ou dextrinas; agentes quelantes tais como EDTA; álcoois de açúcar tal como manitol ou sorbitol; contra-iões formadores de sais tal como sódio; e/ou tensioactivos não iónicos tais como TWEEN™, polietilenoglicol (PEG) e PLURONICS™. A administração "em combinação com" um ou mais agentes terapêuticos adicionais inclui administração simultânea (concomitante) e consecutiva em qualquer ordem. A expressão "agente citotóxico" tal como aqui utilizada refere-se a uma substância que inibe ou evita a função de células e/ou causa destruição de células. Pretende-se que a expressão inclua isotopos radioactivos (por exemplo, I , I , Y90 e Re186), agentes quimioterapêuticos e toxinas tais como 17 ΕΡ 1 623 989/ΡΤ toxinas activas enzimaticamente de origem bacteriana, fúngica, vegetal ou animal ou seus fragmentos.

Um "agente quimioterapêutico" é um composto químico útil para o tratamento de cancro. Constituem exemplos de agentes quimioterapêuticos, entre outros, adriamicina, doxorrubicina, epirrubicina, 5-fluorouracilo, arabinósido de citosina ("Ara-C"), ciclofosfamida, tiotepa, bussulfano, citoxina, taxóides, por exemplo, paclitaxel (Taxol, Bristol-Myers Squibb Oncology, Princeton, NJ) e doxetaxel (Taxotere, Rhone-

PoulencRorer, Antony, França), toxotere, metotrexato, cisplatina, melfalano, vinblastina, bleomicina, etoposido, ifosfamida, mitomicina C, mitoxantrona, vincristina, vinorrelbina, carboplatina, teniposido, daunomicina, carminomicina, aminopterina, dactinomicina, mitomicinas, esperamicinas (consultar patente U.S. n.° 4 675 187), 5-FU, β-tioguanina, β-mercaptopurina, actinomicina D, VP-16, clorambucilo, melfalano e outras mostardas de azoto relacionadas. Também se incluem nesta definição agentes hormonais que actuam para regular ou inibir a acção hormonal sobre os tumores tal como tamoxifeno e onapristona.

Um "agente inibidor do crescimento" quando aqui utilizado refere-se a um composto ou composição que inibe crescimento de uma célula, especialmente uma célula de cancro que sobre-expressa qualquer dos genes aqui identificados quer in vitro quer in vivo. Assim, o agente inibidor do crescimento é aquele que reduz significativamente a percentagem de células que sobre-expressam tais genes na fase S. Constituem exemplos de agentes inibidores do crescimento, entre outros, agentes que bloqueiam a progressão do ciclo celular (num ponto diferente da fase S), tal como agentes que induzem paragem em Gl e paragem na fase M. Os bloqueadores de fase M típicos incluem as vincas (vincristina e vinblastina), taxol e inibidores de topo II tais como doxorrubicina, epirrubicina, daunorrubicina, etoposido e bleomicina. Os agentes que param Gl também provocam paragem de fase S, por exemplo, agentes alquilantes de ADN tais como tamoxifeno, prednisona, dacarbazina, mecloretamina, cisplatina, metotrexato, 5-fluorouracilo e ara-C. Pode consultar-se informação adicional em The Molecular Basis of Câncer, Mendelsohn e Israel, ed., capítulo 1, intitulado "Cell cycle regulation, oncogens, and 18 ΕΡ 1 623 989/ΡΤ antineoplastic drugs" por Murakami et al., (WB Saunders: Philadelphia, 1995), especialmente a p. 13. A "doxorrubicina" é um antibiótico de antraciclina. A denominação química completa da doxorrubicina é (8S-cis)-10-[(3-amino-2,3,6-tridesoxi-a-L-lixo-hexapiranosil)oxi]-7,8,9,10-tetra-hidro-6,8,ll-tri-hidroxi-8-(hidroxiacetil)-1-metoxi-5,12-naftacenodiona. A expressão "citoquina" é uma expressão genérica para proteínas libertadas por uma população de células que actuam noutra célula como mediadores intercelulares. Constituem exemplos de tais citoquinas, as linfoquinas, as monoquinas e as hormonas polipeptídicas tradicionais. Incluem-se nas citoquinas a hormona do crescimento tal como a hormona do crescimento humana, N-metionil-hormona do crescimento humana e hormona do crescimento bovina; hormona paratiróide; tiroxina; insulina; pró-insulina; relaxina; pró-relaxina; hormonas de glicoproteína tal como hormona folículo estimulante (FSH), hormona estimuladora da tiróide (TSH) e hormona luteinizante (LH); factor de crescimento hepático, factor de crescimento de fibroblastos; prolactina; lactogénio da placenta; factor de necrose tumoral α e β; substância inibidora mulleriana; péptido associado a gonadotrofina de ratinho; inibina; activina; factor de crescimento endotelial vascular; integrina; trombopoietina (TPO); factores de crescimento de nervos tais como NGF-β; factor de crescimento de plaquetas; factores de crescimento de transformação (TGF) tais como TGF-a e TGF-β; factor de crescimento do tipo insulina I e II; eritropoietina (EPO); factores osteoindutores; interferões tais como interferão α, β e γ; factores estimulantes de colónias (CSF) tais como CSF de macrófagos (M-CSF); CSF de granulócitos-macrófagos (GM-CSF); e CSF de granulócitos (G-CSF); interleucinas (IL) tais como IL-1, IL-la, IL-2, IL-3, IL-4, IL-5, IL6, IL-7, IL-8, IL-9, IL-11, IL-12; um factor de necrose tumoral tal como TNF-α ou TNF-β; e outros factores polipeptídicos incluindo lif e ligando kit (KL). Tal como aqui utilizada, o termo citoquina inclui proteínas de fontes naturais ou de cultura de células recombinantes e equivalentes biologicamente activos de citoquinas de sequência nativa. 19 ΕΡ 1 623 989/ΡΤ A expressão "pró-fármaco" tal como utilizada neste pedido refere-se a um precursor ou uma forma derivada de uma substância farmaceuticamente activa que é menos citotóxica para células tumorais comparativamente com o fármaco progenitor e é capaz de ser activada enzimaticamente ou convertida na forma progenitora, mais activa. Consultar, por exemplo, Wilman, "Prodrugs in Câncer Chemotherapy", Biochemical Society Transactions, L4: 375-382, 615th Meeting, Belfast (1986) e Stella et al.r "Prodrugs: A Chemical Approach to Targeted Drug Delivery", Directed Drug Delivery, Borchardt et al, (ed.), p. 147-267, Humana Press (1985). Os "pró-fármacos" deste invento incluem, entre outros, pró-fármacos contendo fosfato, pró-fármacos contendo tiofosfato, pró-fármacos contendo sulfato, pró-fármacos contendo péptidos, pró-fármacos com modificação em D-aminoácidos, pró-fármacos glicosilados, pró-fármacos contendo β-lactama, pró-fármacos contendo fenoxiacetamina opcionalmente substituídos ou pró-fármacos contendo fenilacetamida opcionalmente substituídos, pró-fármacos de 5-fluorocitosina e outros pró-fármacos de 5-fluorouridina que podem ser convertidos no fármaco livre citotóxico mais activo. Constituem exemplos de fármacos citotóxicos que podem ser derivatizados para uma forma de pró-fármaco para utilização neste invento, entre outros, os agentes quimioterapêuticos descritos acima.

Uma "quantidade eficaz" de um polipéptido aqui revelado ou de um seu antagonista, em referência a inibição de crescimento celular neoplásico, crescimento tumoral ou crescimento de células de cancro, é uma quantidade capaz de inibir em alguma extensão o crescimento de células alvo. A expressão inclui uma quantidade capaz de evocar um efeito inibidor do crescimento, citostático e/ou citotóxico e/ou de apoptose das células alvo. Uma "quantidade eficaz" de um antagonista de polipéptido PRO com o objectivo de inibir crescimento celular neoplásico, crescimento tumoral ou crescimento de célula de cancro, pode ser determinada empiricamente e de um modo rotineiro.

Uma "quantidade terapeuticamente eficaz", em referência ao tratamento de tumor, refere-se a uma quantidade capaz de evocar um ou mais dos seguintes efeitos: (1) inibição, em alguma extensão, de crescimento tumoral incluindo abrandar o crescimento e parar completamente o crescimento; (2) redução 20 ΕΡ 1 623 989/ΡΤ do número de células tumorais; (3) redução das dimensões do tumor; (4) inibição (ou seja, redução, abrandamento ou paragem completa) de infiltração de células tumorais em órgãos periféricos; (5) inibição (ou seja, redução, abrandamento ou paragem completa) de metástase; (6) aumento da resposta imunitária antitumoral, que pode, embora não obrigatoriamente, resultar na regressão ou rejeição do tumor; e/ou (7) alivio, em alguma extensão, de um ou mais sintomas associados com a doença. Uma "quantidade terapeuticamente eficaz" de antagonista de um polipéptido PRO com objectivos de tratamento de tumor pode ser determinada empiricamente e de um modo rotineiro.

Uma "quantidade inibidora do crescimento" de um antagonista PRO é uma quantidade capaz de inibir o crescimento de uma célula, especialmente tumor, por exemplo, célula de cancro quer in vitro quer in vivo. Uma "quantidade inibidora do crescimento" de um antagonista PRO com o objectivo de inibir crescimento celular neoplásico pode ser determinada empiricamente e de um modo rotineiro.

Uma "quantidade citotóxica" de um antagonista PRO é uma quantidade capaz de causar destruição de uma célula, especialmente uma célula tumoral, por exemplo, de cancro, quer in vitro quer in vivo. Uma "quantidade citotóxica" de um antagonista PRO com o objectivo de inibir crescimento celular neoplásico pode ser determinada empiricamente e de um modo rotineiro.

As expressões "polipéptido PRO" e "PRO" tal como aqui utilizadas e quando imediatamente seguidas por uma designação numérica referem-se a vários polipéptidos em que a designação completa (ou seja, PRO/número) se refere a sequências polipeptidicas especificas tal como aqui descritas. As expressões "polipéptido PRO/número" e "PRO/número" em que a expressão "número" é proporcionada, como uma designação numérica real, tal como aqui utilizadas, abrangem polipéptidos de sequência nativa e variantes de polipéptidos (que são aqui adicionalmente definidos). Os polipéptidos PRO aqui descritos podem ser isolados de várias fontes, tal como de tipos de tecido humano ou de outra fonte ou preparados por métodos recombinantes ou sintéticos. 21 ΕΡ 1 623 989/ΡΤ

Um "polipéptido PRO de sequência nativa" inclui um polipéptido apresentando a mesma sequência de aminoácidos que o polipéptido PRO correspondente derivado da natureza. Tais polipéptidos PRO de sequência nativa podem ser isolados da natureza ou podem ser produzidos por meios recombinantes ou sintéticos. A expressão "polipéptido PRO de sequência nativa" abrange especificamente formas de ocorrência natural truncadas ou excretadas do polipéptido PRO especifico (por exemplo, uma sequência de domínio extracelular), formas variantes de ocorrência natural (por exemplo, formas de splicing alternativo) e variantes alélicas de ocorrência natural do polipéptido. Em várias concretizações do invento, os polipéptidos PRO de sequência nativa aqui revelados são polipéptidos de sequência nativa madura ou de comprimento completo incluindo as sequências de aminoácidos de comprimento completo apresentadas nas figuras anexas. Os codões de iniciação e de terminação são apresentados a negrito e sublinhados nas figuras. Contudo, apesar de se apresentarem os polipéptidos PRO revelados nas figuras anexas como começando com resíduos de metionina aqui designados como posição de aminoácido 1 nas figuras, é provável e possível que outros resíduos de metionina localizados quer a montante quer a jusante da posição de aminoácido 1 nas figuras possam ser utilizados como o resíduo de aminoácido iniciador para os polipéptidos PRO. 0 "domínio extracelular" ou "ECD" do polipéptido PRO refere-se a uma forma do polipéptido PRO que se encontra essencialmente isenta dos domínios transmembranar e citoplasmático. Habitualmente, o ECD de um polipéptido PRO terá menos de 1% de tais domínios transmembranares e/ou citoplasmáticos e de preferência terá menos que 0,5% de tais domínios. Entender-se-á que quaisquer domínios transmembranares identificados para os polipéptidos PRO do presente invento são identificados de acordo com os critérios rotineiramente utilizados na especialidade para identificar esse tipo de domínios hidrófobos. As fronteiras exactas de um domínio transmembranar podem variar mas muito provavelmente não variarão mais de cerca de 5 aminoácidos em qualquer das extremidades do domínio tal como aqui inicialmente identificado. Opcionalmente, e consequentemente, um domínio 22 ΕΡ 1 623 989/ΡΤ extracelular de um polipéptido PRO pode conter desde cerca de 5 ou menos aminoácidos em qualquer dos lados do limite do dominio transmembranar/dominio extracelular tal como identificado nos exemplos ou descrição e tais polipéptidos com ou sem o péptido de sinal associado e os ácidos nucleicos que os codificam, encontram-se abrangidos pelo presente invento.

As localizações aproximadas dos "péptidos de sinal" dos diferentes polipéptidos PRO aqui revelados apresentam-se no presente fascículo e/ou nas figuras anexas. Note-se, contudo, que o limite C-terminal de um péptido de sinal pode variar mas muito provavelmente não variará mais de cerca de 5 aminoácidos em qualquer dos lados do limite C-terminal do péptido de sinal tal como inicialmente aqui identificado, em que o limite C-terminal do péptido de sinal pode ser identificado de acordo com os critério rotineiramente utilizados na especialidade para identificar esse tipo de elemento de sequência de aminoácidos (por exemplo, Nielsen et al., Prot. Enq., 10:1-6 (1997) e von Heinje et al., Nucl. Acids Res., 14:4683-4690 (1986)). Além disso, reconhece-se igualmente que nalguns casos a clivagem de uma sequência de sinal de um polipéptido excretado não é inteiramente uniforme, resultando em mais de uma espécie excretada. Esses polipéptidos maduros, em que o péptido de sinal é clivado num intervalo não superior a cerca de 5 aminoácidos de qualquer dos lados do limite C-terminal do péptido de sinal tal como aqui identificado e os polinucleótidos que os codificam, encontram-se abrangidos pelo presente invento. "Variante de polipéptido PRO" significa um polipéptido PRO activo tal como definido atrás ou adiante possuindo pelo menos cerca de 80% de identidade de sequência de aminoácidos com uma sequência de um polipéptido PRO de sequência nativa de comprimento completo como aqui se descreve, uma sequência de um polipéptido PRO a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento de uma sequência de um polipéptido PRO de comprimento completo como aqui se descreve. Estas variantes de polipéptido PRO incluem, por exemplo, polipéptidos PRO em que um ou mais resíduos de aminoácido são adicionados, ou eliminados, no terminal N ou C da sequência de aminoácidos 23 ΕΡ 1 623 989/ΡΤ nativa de comprimento completo. Vulgarmente, uma variante de polipéptido PRO terá pelo menos cerca de 80% de identidade de sequência de aminoácidos, preferivelmente pelo menos cerca de 81% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 82% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 83% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 84% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 85% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 86% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 87% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 88% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 89% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 90% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 91% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 92% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 93% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 94% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 95% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 96% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 97% de identidade de sequência de aminoácidos, mais preferivelmente pelo menos cerca de 98% de identidade de sequência de aminoácidos e o mais preferivelmente pelo menos cerca de 99% de identidade de sequência de aminoácidos com uma sequência de um polipéptido PRO de sequência nativa de comprimento completo como aqui se descreve, uma sequência de um polipéptido PRO a que falta o péptido de sinal como aqui se descreve, um dominio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento especificamente definido de uma sequência de um polipéptido PRO de comprimento completo como aqui se descreve. Vulgarmente, os polipéptidos PRO variantes têm pelo menos cerca de 10 aminoácidos de comprimento, frequentemente pelo menos cerca de 20 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 30 aminoácidos de 24 ΕΡ 1 623 989/ΡΤ comprimento, mais frequentemente pelo menos cerca de 40 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 50 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 60 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 70 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 80 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 90 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 100 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 150 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 200 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 300 aminoácidos de comprimento, ou mais.

Tal como apresentado adiante, a tabela 1 proporciona o código de fonte completo para o programa de computador de comparação de sequências ALIGN-2. Este código de fonte pode ser rotineiramente compilado para utilização num sistema operativo UNIX para proporcionar o programa de computador de comparação de sequências ALIGN-2.

Adicionalmente, as tabelas 2A-2D apresentam exemplos hipotéticos para utilização do método descrito adiante para determinar a % de identidade de sequência de aminoácidos (tabelas 2A-2B) e a % de identidade de sequências de ácidos nucleicos (tabelas 2C-2D) utilizando o programa de computador de comparação de sequências align-2, em que "PRO" representa a sequência de aminoácidos de um polipéptido PRO hipotético de interesse. "Proteína de comparação" representa a sequência de aminoácidos de um polipéptido contra a qual se compara o polipéptido "PRO" de interesse, "PRO-ADN" representa uma sequência de ácido nucleico de interesse que codifica PRO hipotético. "ADN de comparação" representa a sequência de nucleótidos de uma molécula de ácido nucleico contra a qual se compara a molécula de ácido nucleico "PRO-ADN" de interesse, "X", "Y" e "Z" representam, cada um, resíduos de aminoácido hipotéticos diferentes e "N", "L" e "V" representam, cada um, nucleótidos hipotéticos diferentes. 25

ΕΡ 1 623 989/PT

Tabela 1 /* * * C-C increased from 12 to 15

* Zis avcrage of EQ

* B is average of ND * match with stop is M; stop-stop = 0; J (joker) match = 0 */ tfdeTme _M -8 /* valuc of a match with a stop */ int day[26][26] = { /* A~B CDEFGHIJKLMNOPQRSTUVWXYZ*/ /* A */ { 2, 0,-2. 0, 0,-4, 1,-1,-1, 0,-),-2,-1, 0, Μ, 1, 0,-2, 1.1, 0,0,-6, 0,-3, 0}, /* B */ { 0, 3,-4, 3, 2,-5,0, 1.-2, 0, 0,-3,-2, 2,'tó,-l, 1, 0, 0, 0, 0,-2,-5, 0.-3, )>, /* C *1 {-2,-4,15,.5,-5,-4,-3,-3,-2, 0,-5,-6.-5,47 M.-3,-5,-4, 0,-2,0,-2,-8, 0, 0,-5), /* D */ { 0, 3,-5, 4, 3,-6, 1, 1,-2, 0, 0,-4,-3, 2, M,-l, 2,-1, 0, 0, 0,-2,-7, 0,4, 2}, /* E */ { 0, 2,-5, 3, 4,-5,0, 1,-2, 0,0,-3,-2, 1,'M,-1,2,-1, 0, 0, 0,-2,-7, 0,-4, 3}, I* F *1 {-4,-5,4,-6,-5, 9,-5,-2, 1, 0,-5, 2, 0,4,'m,-5,-5,4,-3,-3, 0,-1, 0, 0, 7,-5}, /* G */ { 1.0,-3, 1, 0,-5, 5,-2,-3, 0,-2,-4,-3, 0."m.-1,-I.-3. 1.0, 0,-1,-7, 0,-5, 0>, /* H */ {-1, 1,-3, 1, 1,-2,-2, 6,-2, 0.0,-2,-2, 2,'m, 0. 3, 2,-1,-1, 0,-2,-3, 0, 0, 2}, /* I */ {-1,-2,-2,-2,-2, 1,-3,-Z. 5, 0,-2, 2, 2,-2, M,-2,-2,-2,-1,0, 0, 4,-5, 0,-1,-2}. 1*1*1 {o, o, o, o, o, o, o, o, o, o, o; o, o, o, m, o, o, o, o, o. o, o, o, o, o, o}, l* K *1 (-1,0,-5.0, 0,-5,-2, 0,-2, 0, 5,-3,0, i7m,-1, 1, 3,0, 0, 0,-2,-3,0,-4,0}, /* L */ {-2,-3,-6,4,-3, 2,4,-2,2, 0,-3, 6,4,-3, M,-3,-2,-3,-3,-1, 0, 2,-2,0,-1,-2}. I* M ·/ {-1,-2,-5,-3,-2,0.-3,-2,2, 0,0, 4,6,-2, Μ,-2,-1, 0,-2,-1,0. 2,4.0.-2.-1}, /* N */ { 0.2,4, 2, 1,4, O, 2,-2, 0, 1,-3,-2.2.*Μ.·1.1, 0, 1, 0, 0,-2,4, 0,-2, 1}, 1*0*1 {_M, Μ. Μ, Μ, Μ, M,_M, Μ, M, M,_M, 0,_M,_M,_M._M,_M,_M,_M,_M,_M,_M,_M}, /♦ P +/ { 1,-Γ,-3,4,4,-5,4. 0.-2, 0,-f,·-3,-2,-1, Μ, 6,’θ, 0, 1,0,0.-C-6, 0,-5, 0}7 /* Q */ { 0,1,-5, 2. 2,-5,-1, 3,-2, O, 1,-2,-1, 1, M, 0,4, 1,4,4, 0,-2,-5, 0,4, 3}, I* R */ {-2, 0,4,-1,-1,4,-3, 2,-2, 0, 3,-3, 0, 0,'m, 0, 1, 6, 0,-1, 0,-2, 2, 0,4, 0}, /* S *1 { 1, 0, 0. 0, 0,-3, 1,4.4, 0, 0,-3,-2,1,_M, 1,4, 0, 2, 1, 0,-1,-2, 0.-3, 0}, 1*1*1 { 1, 0,-2, 0, 0,-3, 0,-1, 0, 0, 0,-1,-1, 0. M, 0,4,4, 1, 3, 0, 0,-5, 0,-3, 0}, /* U */ { 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0,jd, 0,0. 0. 0. 0. 0,0. 0, 0, 0, 0}, /* V */ { 0,-21-2,-2,-2,4,-1,-2, 4, 0,-2, 2, 2,-2, M,-!,-2,-2,-l, 0.0, 4,-6, 0.-2.-2}, I* W */ {-6,-5.-8,-7,-7, 0,-7,-3,-5, 0,-3,-2,-4,4,_M,-6,-5, 2,-2,-5,0,-6,17, 0,0,-6}, /* X */ { 0.0, 0, 0, 0, 0, O, 0, 0, 0, 0, 0,0. 0, M, 0,0,0,0. 0,0, 0. 0, 0, 0. 0}, I* Y *1 {-3,-3, 0,4,4, 7,-5, 0,-1, 0,4,-1,-2,-27 M,-5,4,4,-3,-3,0,-2, 0,0.10,4}, /* Z */ { 0,1,-5, 2. 3,-5, 0, 2,-2, 0. 0,-2,-1, 1,~M, 0, 3, 0, 0,0, 0,-2,-6, 0.4, 4} }; 26 26ΕΡ 1 623 989/ΡΤ I* ·/ linclude <stdio.h> linclude <ctype.h> #dcfine MAXJMP 16 /* maxjumpsinadiag */ tfdefinc MAXGAP 24 /* don't continue to penalize gaps larger than this */ //'define JMPS 1024 /* max jmps in an path *1 ffdefine MX 4 1· save if there's at least MX-1 bases since last jmp *1 ídefine DMAT 3 /* value of matching bases */ Idefine D MIS 0 /* penalty for mismatched bases */ #define DINSO 8 1* penatty for a gap *1 ádefine D1NS1 I 1* penalty per base */ Idcfine PINSO 8 /* penalty for a gap *1 #define PINSl 4 1* penalty per residue *1 struct jmp { short njMAXJMP); /* sizeofjrop (neg for dely) */ unsigned short x[MAXJMP]; /* base no. of jmp in seq x */ !* limits seq to 2“16 -1 */ struct diag { int score; /* score at last jmp */ lODg offset: /♦ offset of prev block */ short ijmp; /* currenl jmp índex *1 }; struct jmp jp; /* list of jmps */ struct path { int spc; /* number of leading spaces */ short n[JMPS];/* size of jmp (gap) */ }; int x[JMPS];/· loc of jmp (last elem before gap) */ char •ofilc; /* output file name ♦/ char 'narnex(2j; /* seq naraes: getseqsO */ char ‘prog; /* prog name for err msgs *1 char *seqx[2j; /* seqs: getseqsO */ int dmax; /* best diag: nwO */ int dmaxO; f* final diag */ int dna; /* set if dna; maíaO */ int endgaps; r sei if penaiizing ênd gaps *' int gapx, gapy; /* total gaps in seqs *1 int lenO. leni; /* seq lens */ int ngapx, ngapy; /* total size of gaps */ int smax; /* max score: nwO */ int •xbm; /* bitmap for matching */ iong offset; /* currenl offset in jmp file */ struct diag *dx; /* holds diagonais */ struct path ppPl; /* holds path far seqs */ char •cailocO. *malloc(), ‘indexO. *strcpyO; char ♦getseqQ, *g_callocO; 27 ΕΡ 1 623 989/ΡΤ /* Needleroan-Wunsch alignment program * * usage: progs filei file2 * where filei and file2 are two dna or two proiein sequences. * The sequences cao be in upper- or lower-case an may contain ambiguity * Any lines beginning wilh ' or ' <' are ignored * Max file length is 65535 (limited by unsigned sbort x in lhe jmp struct)

* A sequence with 1/3 or more of its elements ACGTU is assumed to be DNA * Output is in the file "align.out" * * The program may create a tmp file in /tmp to hold info about traceback. * Original version developed under BSD 4.3 on a vax 8650 */ #include "nw.h" ffindude "day.h" static _dbval[26] = {

static _pbval[26] = { 1, 2|(1< < <('N'-'A')), 4, 8, 16, 32, 64, 128, 256, OxFFFFFFF, 1<<10, 1<<U, 1 < < 12, 1<<13, 1<<14, 1 < < 15, 1 < < 16, 1 < <17, lcc 18, I < < 19, 1<<20, 1< <21, 1 c <22, 1 < <23,1 < <24, 1< <25|(1< <('E’-'A'))|(l< <('Q'-'A')) main(ac, av) main int char { ac; *avQ; prog = av[0]; if (ac ! = 3) { fprintffslderr,"usage: %s filei filelin”, prog); fprintf(stderr,"where ftlel and file2 are two dna or two protein sequencesAn'); fprintf(stderr, "The sequences can be in upper- or lower-casein"); fprintffslderr,"Any lines beginning with or' <' are ígnoredin"); fprintffstderr,"Output is in Ibe Tile \"align.out\"\n"); exit(l);} namex[0j — av[lj; namex(lj = av[2]; seqx(0] = getseq(namex[0), &len0); seqx[l] = getseq(namex[l], &lenl); xbm = (dna)? _dbval: jtbval; endgaps = 0; /· 1 to penalize endgaps */ ofile = "align.out"; I* output file */ nv/0; /* fill in the matrix, get the possible jmps *1 readjmpsO; I* get the actual jmps ♦/ printO; /* print stats, ajignment */ } cleanup(O); /* unlink any tmp files */ 28 ΕΡ 1 623 989/ΡΤ

/* do lhe aligaraent, return best score: raainO * dna·. values in Fitch and Smith, PNAS. 80. 1382-1386,1983 * pro: PAM 2S0 values * Wben scores are equal, we prefer mismatches to any gap, prefer

* a new gap to extending an ongoing gap, and prefer a gap in seqx * to a gap in seq y. V mvO { char *p*. 'py; 1* seqs and ptrs */ int ndely, *dely; 1* keep track of dely *1 int ndelx, delx; /* keep track of delx *1 int *tmp; 1* for swapping rowO, rowl */ int mis; /* score for each type *1 ínt insO, insl; t* insertion pcnalties */ register id; 1· diagonal índex */ register ϋ: /* jmp índex *1 register *co!0, *coII; /* score for curr. last row */ register xx, yy; /* índex into seqs V dx = (struct diag *)g_caIloc("to get diags", lenO+lenl + 1, s!zeof(struct diag)); ndcly = fmt *)g_callocCto get ndety", lenl + 1, sizeof(int)); dely = (int *)g_calIoc(”to get dely”, leni +1, sizeof(int)); colO = (int *)g_calloc("to get colO", lenl + 1, sizeofòat)); coll = (int *)g calloc("togetcoH", lenl + 1, sizcof(int»; insO = (dna)? DÍNS0 : PINSO; insl = (dna)? DINS1 : PINS1; smax = -10000; if (endgaps) { for (col0(0) = dely[0] = -insO, yy = 1; yy < = leni; yy + +) { eoI0(yy] = delylyy] = colO[yy-l) - insl; ndelyiyy] = yy; } col0[0] = 0; /* Waterman Buli Math Biol 84 */ } elsc for (yy = 1; yy < = leni; yy++) delylyy] = -insO;

I* fill in match matrix V for (px = seqx[0], xx = I; xx < = lenO; px+ + , xx++) {

/* initialize first entry in col V if (endgaps) { ií (xx = = i) coll[0] = delx = -(insO+insl); else col 1 [0] = delx = col0[0] - insl; ndelx = xx; } else { col 1(0] = 0; delx = -insO; ndelx = 0; } 29 ΕΡ 1 623 989/ΡΤ .nw for (py = seqx[l], yy = 1; yy < = leni; py+ + , yy++) { mis = coI0[yy-l]; if (dna) mis += (xbm[*px-'A,)&xbm[*py-'A,])7 DMAT : DMIS; cise mis += _day[*px-'A'][*py-'A']; I* update penalty for del in x seq; * favor new del over ongong del * ignore MAXGAP if weighting endgaps */

If (endgaps j j náeiyíyyj < MAXGAP) {

If (colO[yy) - insO > = dely[yy]) { delyfyy] = colO[yy] - (insO+insl); ndelyfyy] = 1; } else { dely[yy] -= insl; ndely[yy] ++; } } else { if (colO(yy] · (insO+insl) > = delylyy)) { dely[yyj - colO(yy] - (insO+insl); ndely[yy] = 1; } else ndely[yy] + +; } /* updaíe penalty for del in y seq; * favor new del over ongong del *1 1Γ (endgaps 11 ndelx < MAXGAP) { if (coll[yy-l] - insO > = delx) { delx = coll(yy-l] - (insO+insl); ndelx = 1; } else { delx -= insl; ndelx++; } } else { if (coll[yy-l] - (insO+insl) > = delx) { delx = co! 1 [yy-1 ] - (insO+insl); ndelx = 1; ) else ndelx++; } /* pick the maximum score; we're favoring * mis over any del and delx over dely */ 30 ΕΡ 1 623 989/ΡΤ ..nw id = xx - yy + leni -1; lf (mis > = delx && mis > = delyfyy]) coll[yy) = mis; else if (delx > = delylyy]) { cd 1 [yy] - delx; ij = dx[id].ijmp; if (dx[id].jp.n[0] && (Idna 11 (ndelx > = MAXJMP &&xx > dx[id].jp.x[ij]+MX) 11 mis > dxfidj.score+DtNSO)) { dx[id).ijmp++; if(++ij > = MAXJMP) { writejmps(id); ij = dx[id].ijmp - 0; dx[id).ofíse[ = offset; offset + = sizeof(stnjct jmp) + sizeoffofFset);} > dx[id].jp.n[ij] - ndelx; dxfid] .jp.x[tj] = xx; dx[id].scare = delx;} else { coll[yy] = delylyy]; ij - dx[id].ijmp; if (dx[id].jp.n[0] && (idna i | (ndelyfyy] > - MAXJMP && xx > dx[id]jp.x(íj]+MX) 11 mis > dx[id).score+DINSO)) { dx[idj.ijmp+ + ; if (+ + ij MAXJMP) { writejmps(id); ij = dxpdj.ijmp = 0; dx[id),offset = offset; offset + - sizeof(struc* jmp) + sizeof(offset); } dx[id].jp.n[ij] = -ndelylyyj; dx[id].jp.xlij] = xx; dxlidj.score = delylyyj; if (xx = = lenO && yy c leni) { /* last col V if (endgaps) col I [yy] -= insO+insl*(lenl-yy); if (coll[yy] > smax) { smax = colllyy]; dmax = id:}}} if (endgaps && xx < lenQ) colllyy-Ι] — insO+insl*(ie.n.O‘Xx); If (coll[yy-l] > smax) { smax = coll[yy-l]; dmax - id; } tmp = coIO; colO = coll; coll = tmp;} (void) £tee((char *)ndely); (vold) freeftchar *)dely); (void) free((char *)colO); (void) lfee((char *)coll); } 31 31 ΕΡ 1 623 989/ΡΤ /* * * printO - only rontine visible outside ihis module * * siaiic:

* getmatO - trace back besl path, counl matches: printO

* pr alignO - priut alignment of described in array pQ: printO

* dumpbloekO -dump a blockof lines with numbers. stars: pr_alignO

* num$0 — put out a mimber line: dumpbloekO

* putlineO - put out a line (name, [num], seq, [num]): dumpbloekO

* SfarsO - -nu! Ά linft Of StifS! dUTTí^blOçkO * stripnameO - strip any path and prefix from a scqname */ tândude "nw.h* ifdefue SPC 3 #define P UNE 256 I* maximum output line */ tfdefine P SPC 3 /* space between name or num and seq */ extern day[2d][26]; int olen; /* set output line length *! FILE »fx; 1* output file */ printO Pr>nt { int Ix, ly, firstgap, lastgap; /* ovcrlap */ if <(fx = fopetitofile, "w”)) = = 0) { fprintfijsrderr, ” %s: cant write %s\n", prog, ofile); cleanup(l); } fprinrfffbc, " < first sequence: %s (lenglh - %d)\n". namex[0], lenO); lprintf(fx, ”<second sequence: %s (lengtli = %d)\n", narnex[l], leni); olen = 60;

Ix = lenO; ly e leni; firstgap = lastgap = 0; if (dmax < leni - 1) { /* leading gap in x */ pp[0].spc = firstgap = leni - dmax -1; ly -- pp[0].spc; } else if (dmax > leni -1) { /* leading gap in y */ pp[I].spc = firstgap - dmax - (leni -1); lx-= pp[lj.spc; }

If (dniaxO < lenO 1) 1 /* íidiling gãp iu x *' lastgap = lenO - dmaxO -1, lx-= lastgap; } else if (dmaxO > lenO -!){/* trailing gap in y V lastgap = dmaxO - (lenO -1); ly -= lastgap; } getmat(lx, ly, firstgap, lastgap); pr_alignO; ) 32 ΕΡ 1 623 989/ΡΤ I* * trace back the best path, count matches »/ stalic gewiat(lx, ly, firstgap, lastgap) int Ix, ly; /* int firstgap, lastgap; /* { ‘ core" (minus endgaps) */ leading traUing overlap */ getmat int char double register register char nm, iO, il, sizt), sizl; Outx[32J; pcU nO, nl; *pO, *pl; I* get total matches, score */ iO = il = sizO = sizl = 0; pO = seqx[0] + pp[l].spc; pl = seqxjl] + pp[0].spc; oO = pp[l].spc + 1; nl = ppfOJ.spc + 1; nm = 0; while ( *p0 && *pl) { if(sizO){ pl + +; nl ++; sizO-; } else if (sizl) { p0+ + ; n0+ + ; sizl-; ) else { if (xbm[*pO-'A']&xbm[,pl-'A']) nm++; if(nO++ - - pp[0].x[i0]} sizO = pp[0].n[i0++]; if (nl + + = = pp[l].x[il]) sizl = pp[l]n[il + +]; p0++; pl + +; } > /* pet homology: * if penalizing endgaps, base is the shorter seq

* else, knock o ff overhangs and take shorter core V if (endgaps) lx = (lenO < leni)? lenO; leni; else lx - (lx < ly)7 lx ; ly; pet = 100.*(double)nm/(double)lx; fprinrf(fx, "\n"); fprintf(fx,'< %d match%s in an overlapof %d: %.2fpercentsímílarity\n*, nm, (nm == 1)? "" : "es", lx, pet); 33 ΕΡ 1 623 989/ΡΤ fprintRfx, "<gaps in first sequente: %d", gapx); if (gapx) { (void) sprintf(outx, " (%d %s%s)", ngapx, (dna)? "base":"residue", (ngapx == 1)? fprintf(fx,"?6s", outx); ...getmat fprinlf(fx,", gaps in second sequente: %d", gapy); if(gapy) { (void) sprintf(outx, ” (%d %s%s)", ngapy, (dna)? "base":"residue", (ngapy = = 1)? ”":"s"); fprintf(fx,"%s", outx);} if (dna) iprintf(fx, ”\n<score: %d (match = %d, mismatch = %d, gap penalty = %d + Síd per base)\n”, smax, DMAT, DMIS, DINSO, DINS1); else fprintf(fx, ”\n<score: %d (DayhoffPAM 250 matrix, gap penalty = %& + %dper residue)\n", smax, PINSO, PINS1); if (endgaps) fjprintf(fx, '<endgaps penalized. left endgap: 5td %s*s, right endgap: %d %s%s\n”, firstgap, (dna)? "base": “residue”, (firstgap == 1)? lastgap, (dna)? "base": “residue", (lastgap == 1)? ” : "s”): else fprmtf(íx, ”<endgaps not penalizedtn"); static static static static Static static static char static char static char static char nm; lmax;m\ nc(2]; ni[2); siz(2]; •psPl;VPl; out(2][P_LINE]; star[P_LINE): /* matches in core ~ for checking */ )* lengths of slripped file names */ /* jmp index for a path */ /* numbcr at start of current Une */ I* current elem number - for gapping */ /* ptr to current element */ /* ptr to next output char slot */ /* output line */ /* set by starsQ */ /* * print alignment of described in Street path ppQ */ static pr alignO Γ int nn; /* char count */ ini more; register i; for (i = 0, lmax = 0; i < 2; i++) { nn = 5tripname(namex[i]); if (nn > lmax) lmax = nn; ne[i) = 1; ni[i] = 1; sizfij = ij[i] = 0; psp] *=> seqx[i]; po[i) = out(i];} pr_align 34 ΕΡ 1 623 989/ΡΤ ...pralign for (nn = nm = 0, more = 1; more;) { for (i = more = 0; i < 2; i++) { /* * do we havc more of this sequence?

V if(!*ps[i]) continue; more++; if (pp[i] .spc) { /* leading space *1 *po[i]4 4 = ’ ppfl.spc-; } élse if (siz[i]) { /* in a gap */ *po[i]++- = sizfl]-; > else { /*we'reputtmga scqelcmeni */ *po['] = *ps[>);

IfOslOwerf^psti])) *ps[ij = toupper(*ps[i]); po(H + +; ps(i]4+; /* * are we at next gap for this seq? */ if (nifi) = = pp[i].x[ij[il]> { /* * we need to merge all gaps * at this iocation */ sii[i] = pp[i].n[ij[i] + +J; while (nifij == pp[i].x[ijí'H) sii[i) 4 = pp[i].n[ij[i]++); } ni[i| + +; } 5 ir(++nn == olsn 11 Imore && nn) { dumpblockO; for(i = 0; i < 2; i++) po|i] — out[i}; nn = 0; í } /* * dump a block of lines, induding numbers, stars: pr alignO */ static dumpblock

dumpblockO { register i; for (i = 0; i < 2; i++) *po[i]~ = '\o'; 35 ΕΡ 1 623 989/ΡΤ ...durapblock (vold) pu!c('\n', fx); for (i = 0; i < 2; i+ +) { lf (*out[i) && (*out[i) !» " 11 *(po[i]) !='’)){ if (i = = 0) nums(i); if (i = = 0&&*out[lj) starsOi putline(i); if (i = = 0 && *oui[l)) fprintfffx, sLar); if(i==i) mims(Í); } } } /·

* put out a numbcr line: dumpblockO */ static nums(ix) □ums 1 int ΐχ; /* index in outQ holding seq line */ l char nltne[P_LINE]; rcgisíer j; regfster char *pn, *px, *py; for (pn = nline, i ; = 0; i < lmax+P__SPC; i+-r, pn+-r) *pn ® ' ' ; for (i * nc[ix], py = out[ix); *py; py++, pn++) { lf(‘py = = ' 'll*py == rpn = 1 else { if(i%10==0 || (i == 1 && nc[ix] != 1)){ j = (i < 0)? -i: i; for (px - pn; j; j /= 10, px--) *px = j%10 + '0'; if fi < 0) *px = } elsc *pn = ’ > } *pn = '\0'; ncfixj = i; for (pn = nline; *pn; pn++) (void) putc(*pn, fx); (void)putc('\n', fx); } /*

* put out a line (name, [num), seq, [num]): dumpblocltO V startc pmline(ix) putline int ix; { 36 ΕΡ 1 623 989/ΡΤ ...putline int i; register char *px; for (px = namex[ix], i = 0; *px && *px px+ +, i+ +) (void) putc(*px, fx); for (; i < iraax+PSPC; i++) (void) putc(' fx); /* these count from 1: * niO is current element (from 1) * ncQ is number at start of curtem line *1 for (px = oul[ix]; *px; px++) (void) putc(*px&0x7F, fx); (void) putc('\n', fx); } /* * pui a line of stars (seqs always in out[0], out[l]): dumpblockO *1 static starsO stars { int i; register char *p0, *pl, cx, *px; if (!*out[0] 11 (*out[0] =="&& *(po[0]) == ") 11 !*ouitl] 11 (*out[l] ==’*&& *(po[l}) = ='*)) returti; px = star; for (i = imax+P SPC; i;»~) *px+ + = ' for (pO = out[0], pl = oul[l]; *pO && *pl; p0+ + , pl + +) { iF (isalpha(*p0) &&. isalpha(+pl)) { ΙΓ (xbm[*pO-,A'I&xbm[*pl-'A']) { cx = **'; nm+ +; } else if (!dna && _day[*pO-,A‘l[*pl-'A'] > 0) cx * V; else CX e ’ } else cx = ' *px++ = cx; } *px+ + = V; *px = '\0'; } I·

* strip path or prefix from pn, return len; pralignO V static stripname strip name(pn) char *pn; I* file name (may be path) */ { register char *px, *py; py =0; for (px = pn; *px; px+ +) if (*px == T) py = px + 1; if(py) (void) strcpy(pn, py); return(strlen(pn)); } 37 ΕΡ 1 623 989/ΡΤ ι· * cleanupO - cleanup any unp file * getseqO - read in seq, set dna, len. maxlen * g callocO - callocO with error chcckin * readjmpsO - get the good jmps, from tmp file if necessary * writejmpsO - wri(6 a filled array of jmps lo a tmp file: tiwO */ íinclude "nw.h" #mcludc <sys/file.h> .l._ _ w ww··. LUlU 'JlidUIC — / ιιιψι IIUmgA-tV/W\/WV , FILE *lj; int cleanupO; long IseekO, /* * remove any tmp file if we blow */ cleanup(i) int i;{ (void) unlinkGname); exit(i).} /* cleanup tmp file */ cleanup /* * read, return pir (o seq, set dna, len, maxlen φ skip lines staning with or '>’ * seq in upper or lower case *1 char *

getseq(file, len) char ♦file; int *len;{ char registcr char Int FILE /* file name */ /* seq len */ line(l024], *pseq;*ρχ, *py; natgc, tlen; *fp·. getseq if ((fp = fopen(file, "r")) == 0) { fprintf(slderr,"»s: can't read %s\n”, prog, file); exil(l);} tlen = natgc - 0; whiie (ígeis(iinc, 1024, fp)) { if (*line == V j | *line == ' <' | j *line == '>') continue; for (px = line; ®px != '\n'; px++) if (isupper(*px) || islower(*px)) if ((pseq = malloc((unsÍgned)(tlen+6))) = = 0) { fprintf(stdetT,"®s: mallocO failed to get %d bytes for %s\n", prog, tlen+6, file); exit(l); } pseq [0] = pseq[l] = pseq [2) = pseq [3) = '10'; 38 ΕΡ 1 623 989/ΡΤ ...getseq py = pseq + 4; *len = tlen; rewind(fp); wtile (fgels(line, 1024, (p)) { if(*lifle == || *line =»'<' 11 *line == '>') continue; for (px = fine; *px != ’\n'; px++) {

If (isupper(*px)) *py+ + — *px; elsc if (islower(*px)) *py++ = toupper(*px); if (index("ATGCU",*(py-I))) natgc++; > } *py++ = ’\0'; *py = '\0‘; (void) ftlose(ip); doa = natgc > (tlen/3); return(pseq+4); } g_caUoc char * g_calloc(msg, nx, sz) char *msg; /* program, calling routine *i int nxT sz; í* number and size of elemenls */ { char *px. *calloc0; nx, sz); if ((px = calloc((unsigned)nx, (unsigned)sz)) = = 0) { if (*msg) { fprintf(stderr, "%s: gcallocO failed Ss (n=%d, si=%d)\n\ prog, msg, exit(i); } } reíurn(px); } /* * gei fina! jmps írorn dxQ onp file, sei ppQ, reset ciinax: mainO */ readjmps

readjmpsO { int fd — -1; int six, iO.il; register i, j, xx;

If (6) { (void) fclose(fj); if ((fd = open(jname, 0_RD0NLY, 0)) < 0) { fprintf(stderr, ” can'topenO %s\n”, prog, jname); cleanup(l); } } for (i = iO = il = 0. dmaxO = dmax, xx = ienO;; i+ +) { while (1) { for (| = dx[dmax].ijmp; j > = 0 && dx[dmax).jp.xD] > = xx; j-) 39 39 ΕΡ 1 623 989/ΡΤ ...readjmps if (j < Ο && dx[dmax].offsci && (j) { (void) lseek(fd, dx[dmax].offset, 0); (vold) read(fd. (char *)&dx[dmax].jp, sizeof(struci jrap)); (void) read(fd, (char *)&dx[dinax].offset, sizeof(dx[dmax).offset)); dx[dmax].ijmp = MAXIMP-1; } else break; } if(i > = JMPS){ iprintf(stderr, "%s: too many gaps in aligrunentin", prog); cleanup(l); } if(j > = 0) { siz = dx(draax).jp.n[j]; xx = dx(dmax].jp.x[jj; droax + = siz; if (siz < 0) { /* gap in second seq */ pp[l).n[il] = -siz; xx + = siz;

/* id = xx - yy + leni -1 V pp[l].x(il] = xx - dmax + leni -1; gapy++; ngapy -= siz; I* ignore MAXGAP when doing endgaps */ siz = ( siz < MAXGAP 11 endgaps)? -siz : MAXGAP; il + + ; } else if (siz > 0) { /* gap in first seq */ pp[0].n[i0] = siz; ρρ[0].χ(ί0] = xx; gapx+ + ; ngapx += siz; I* ignore MAXGAP when doing endgaps */ siz = (siz < MAXGAP 11 endgaps)? siz : MAXGAP; iO-M-; } } /* reverse the order of jmps */ for (j = 0, i0~; j < iO; j++, i0~) { i - pp[0).n[j]; pp(0].n[i] = pp[OJ.n[iO]; pp[0].n(iO] = i; i = PP[0].xD); ppioj.xQ] = pp[0].x[i0]; pp[0].x[iO) = i; } for (j = 0, il—; j < il; j++, íl-) { i = pp[l].nD); pp[l].n[j] = pp[l)-n[il]; ρρ[1).η[ί1) = i; i = pp[l).x[j]; pp[l] x[j] = pp[l) x[il]: = ‘1 } if (W > = 0) (void) close(fd); (void) unlink(jname); fi = 0; offset = 0; } (5) { 40 ΕΡ 1 623 989/ΡΤ ι·

* «τίκ a filled jmp siruw offset of the prev one (if any): nwO */ writejmps(Íx) Int ix; { char ‘mktempO; *r (!<!){ if (mktemp(jname) < 0) { fprintffstdcrr, "96s: can't mktempO %s\n“, prog, jname); cleamip(l); } if ((fj = fopen(jname, "w")) == 0) { fprintf(stderr, "%s: can't write %s\n", prog, jname); exit(l); ) } (void) fwrite((ehar *)&dx[ix].jp, sbeoffstruct jmp), 1, fj); (void) fwrite((char »)&dxIix].offset, sizeof(dx[ix],offset), 1, fj); writejmps

Tabela 2A PRO XXXXXXXXXXXXXXX (Comprimento = 15 aminoácidos) Proteína de comparação XXXXXYYYYYYY (Comprimento = 12 aminoácidos) % de identidade de sequência de aminoácidos = (o número de resíduos de aminoácidos idênticos e na mesma posição entre as duas sequências de polipéptidos tal como determinado por ALIGN-2) a dividir por (o número total de resíduos de aminoácidos do polipéptido PRO) = 5 a dividir por 15 = 33,3%

Tabela 2B PRO XXXXXXXXXX (Comprimento = = 10 aminoácidos) Proteína de comparação XXXXXYYYYYYZZYZ (Comprimento = = 15 aminoácidos) % de identidade de sequência de aminoácidos = (o número de resíduos de aminoácidos idênticos e na mesma posição entre as duas sequências de polipéptidos tal como determinado por ALIGN-2) a dividir por (o número total de resíduos de aminoácidos do polipéptido PRO) = 5 a dividir por 10 = 50%

Tabela 2C PRO-ADN NNNNNNNNNNNNNN (Comprimento = 14 nucleótidos) ADN de comparação NNNNNNLLLLLLLLLL (Comprimento = 16 nucleótidos) % de identidade da sequência de ácido nucleico = (o número de nucleótidos idênticos e na mesma posição entre as duas sequências de ácido nucleico tal como determinado por ALIGN-2) a dividir por (o número total de nucleótidos da sequência de ácido nucleico PRO-ADN) = 6 a dividir por 14 = 42,9% 41 ΕΡ 1 623 989/ΡΤ

Tabela 2D PRO-ADN ΝΝΝΝΝΝΝΝΝΝΝΝ (Comprimento = 12 nucleótidos) ADN de comparação NNNNLLLW (Comprimento = 9 nucleótidos) % de identidade de sequência de ácido nucleico = (o número de nucleótidos idênticos e na mesma posição entre as duas sequências de ácido nucleico tal como determinado por ALIGN-2) a dividir por (o número total de nucleótidos da sequência de ácido nucleico PRO-ADN) = 4 a dividir por 12 = 33,3%

Define-se "percentagem (%) de identidade de sequência de aminoácidos" relativamente às sequências de polipéptido PRO aqui identificadas, como a percentagem de residuos de aminoácidos numa sequência candidata que são idênticos aos residuos de aminoácidos numa sequência PRO após alinhamento de sequências e introdução de hiatos, caso necessário, para atingir a máxima percentagem de identidade de sequências e não considerando quaisquer substituições conservativas como parte da identidade de sequência. 0 alinhamento com objectivos de determinar a percentagem de identidade de sequência de aminoácidos pode ser obtido de vários modos que se encontram abrangidos pela perícia na especialidade, por exemplo, utilizando programas de computador disponíveis ao público tais como os programas BLAST, BLAST-2, ALIGN, ALIGN-2 ou Megalign (DNASTAR). Os peritos na especialidade podem determinar os parâmetros apropriados para medir o alinhamento, incluindo quaisquer algoritmos necessários para atingir o alinhamento máximo ao longo do comprimento total das sequências em comparação. Para os presentes objectivos, contudo, os valores de % de identidade de sequência de aminoácidos obtêm-se tal como descrito adiante utilizando o programa de computador de comparação de sequências ALIGN-2, em que o código de fonte completo para o programa ALIGN-2 é proporcionado na tabela 1. 0 programa de computador de comparação de sequências ALIGN-2 tem como autor Genentech, Inc. e o código de fonte apresentado na tabela 1 foi apresentado com documentação para o utilizador no gabinete de direitos de autor dos E.U.A. ("U.S. Copyright Office"), Washington D.C., 20559, onde se encontra registado com o número de registo US Copyright Registration, TXU510087. O programa ALIGN-2 está disponível ao público através de Genentech, Inc., South San Francisco, Califórnia ou pode ser compilado a partir do código de fonte proporcionado na 42 ΕΡ 1 623 989/ΡΤ tabela 1. Ο programa ALIGN-2 deve ser compilado para utilização num sistema operativo UNIX, de preferência UNIX V4.0D digital. Todos os parâmetros de comparação de sequências são estabelecidos pelo programa align-2 e não variam.

Para os presentes objectivos, a % de identidade de sequência de aminoácidos de uma determinada sequência de aminoácidos A relativamente, com ou contra uma determinada sequência de aminoácidos B (que pode ser alternativamente denominada como uma determinada sequência de aminoácidos A que apresenta ou inclui uma determinada % de identidade de sequência de aminoácidos relativamente, com ou contra uma determinada sequência de aminoácidos B), calcula-se como se segue:

100 vezes a fracção X/Y em que X é o número de resíduos de aminoácidos pontuados como correspondências idênticas pelo programa de alinhamento de sequências ALIGN-2 no alinhamento efectuado por esse programa de A e B e em que Y é o número total de resíduos de aminoácidos em B. Considerar-se-á que nos casos em que o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de identidade de sequência de aminoácidos de A relativamente a B não será igual à % de identidade de sequência de aminoácidos de B relativamente a A. Como exemplos de cálculos de % de identidade de sequência de aminoácidos, as tabelas 2A-2B demonstram como calcular a % de identidade de sequência de aminoácidos da sequência de aminoácidos designada "proteína de comparação" relativamente à sequência de aminoácidos designada "PRO".

Salvo especificado em contrário, todos os valores de % de identidade de sequência de aminoácidos aqui utilizados são obtidos e descritos como descrito acima utilizando o programa de computador de comparação de sequências ALIGN-2. Contudo, a % de identidade de sequência de aminoácidos pode também ser determinada utilizando o programa de comparação de sequências NCBI-BLAST2 (Altschul et ai., Nucleic Acids Res., 25:3389-3402 (1997)). O programa de comparação de sequências NCBI-BLAST2 pode ser obtido em http://www.ncbi.nlm.nih.gov. NCBI-BLAST2 43 ΕΡ 1 623 989/ΡΤ utiliza vários parâmetros de busca, em que todos esses parâmetros de busca estão estabelecidos em valores por defeito incluindo, por exemplo, "unmask = yes", "strand = all", "expected occurrences = 10", "minimum low complexity length = 15/5", "multi-_pass e-_value = 0.01", "constant for multi-_pass = 25", "dropoff for final gapped alignment = 25" e "scoring matrix = BLOSUM62".

Nas situações em que se utiliza NCBI-BLAST2 para comparações de sequências de aminoácidos, a % de identidade de sequência de aminoácidos de uma determinada sequência de aminoácidos A relativamente, com ou contra uma determinada sequência de aminoácidos B (que pode ser alternativamente denominada como uma determinada sequência de aminoácidos A que apresenta ou inclui uma determinada % de identidade de sequência de aminoácidos relativamente, com ou contra uma determinada sequência de aminoácidos B), calcula-se como se segue:

100 vezes a fracção X/Y em que X é o número de resíduos de aminoácidos pontudos como correspondências idênticas pelo programa de alinhamento de sequências NCBI-BLAST2 no alinhamento efectuado por esse programa de A e B e em que Y é o número total de resíduos de aminoácidos em B. Considerar-se-á que nos casos em que o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de identidade de sequência de aminoácidos de A relativamente a B não será igual à % de identidade de sequência de aminoácidos de B relativamente a A.

Adicionalmente, a % de identidade de sequência de aminoácidos pode também ser determinada utilizando o programa de computador WU-BLAST-2 (Altschul et ai., Methods in Enzymology, 266:460-480 (1996)). A maioria dos parâmetros de busca WU-BLAST-2 são estabelecidos em valores por defeito. Os parâmetros não estabelecidos em valores por defeito, ou seja, os parâmetros ajustáveis, são colocados nos seguintes valores: "overlap span = 1", "overlap fraction = 0.125", "word threshold (T) =11", e "scoring matrix = BLOSUM62". Para os presentes objectivos, o valor da % de identidade de sequência 44 ΕΡ 1 623 989/ΡΤ de aminoácidos é determinado pela divisão de (a) o número de resíduos de aminoácidos com correspondência idêntica entre a sequência de aminoácidos do polipéptido PRO de interesse apresentando a sequência derivada do polipéptido PRO nativo e a sequência de aminoácidos de interesse de comparação (ou seja, a sequência contra a qual se está a comparar o polipéptido PRO de interesse que pode ser um polipéptido PRO variante) tal como determinado por WU-BLAST-2, por (b) o número total de resíduos de aminoácidos do polipéptido PRO de interesse. Por exemplo, na expressão "um polipéptido incluindo uma sequência de aminoácidos A que apresenta ou apresentando pelo menos 80% de identidade de sequência de aminoácidos relativamente à sequência de aminoácidos B", a sequência de aminoácidos A é a sequência de aminoácidos de comparação de interesse e a sequência de aminoácidos B é a sequência de aminoácidos do polipéptido PRO de interesse. "Variante de polipéptido PRO" ou "sequência de ácido nucleico de variante de PRO" significam uma molécula de ácido nucleico que codifica um polipéptido PRO activo tal como definido adiante e que possui pelo menos cerca de 80% de identidade de sequência de ácido nucleico com uma sequência de ácido nucleico que codifica uma sequência de um polipéptido PRO de sequência nativa de comprimento completo como aqui se descreve, uma sequência de um polipéptido PRO de sequência nativa de comprimento completo a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de um polipéptido PRO, com ou sem o péptido de sinal, como aqui se descreve ou qualquer outro fragmento de uma sequência de um polipéptido PRO de comprimento completo como aqui se descreve. Vulgarmente, um polinucleótido variante PRO terá pelo menos cerca de 80% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 81% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 82% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 83% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 84% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 85% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 86% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 87% de identidade de 45 ΕΡ 1 623 989/ΡΤ sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 88% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 89% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 90% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 91% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 92% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 93% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 94% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 95% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 96% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 97% de identidade de sequência de ácido nucleico, mais preferivelmente pelo menos cerca de 98% de identidade de sequência de ácido nucleico e ainda mais preferivelmente pelo menos cerca de 99% de identidade de sequência de ácido nucleico com a sequência de ácido nucleico que codifica uma sequência de um polipéptido PRO de sequência nativa de comprimento completo como aqui se descreve, uma sequência de um polipéptido PRO de sequência nativa de comprimento completo a que falta o péptido de sinal como aqui se descreve, um domínio extracelular de um polipéptido PRO, com ou sem a sequência de sinal, como aqui se descreve ou qualquer outro fragmento de uma sequência de um polipéptido PRO de comprimento completo como aqui se descreve. As variantes não abrangem a sequência nucleotídica nativa.

Vulgarmente, os polinucleótidos variantes PRO têm pelo menos cerca de 30 nucleótidos de comprimento, frequentemente pelo menos cerca de 60 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 90 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 120 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 150 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 180 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 210 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 240 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 270 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 300 nucleótidos de comprimento, mais 46 ΕΡ 1 623 989/ΡΤ frequentemente pelo menos cerca de 450 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 600 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 900 nucleótidos de comprimento, ou mais. A "percentagem (%) de identidade de sequência de ácido nucleico" relativamente às sequências de ácidos nucleicos que codificam o polipéptido PRO aqui identificadas, define-se como a percentagem de nucleótidos numa sequência candidata que é idêntica aos nucleótidos numa sequência de ácido nucleico que codifica um polipéptido PRO após alinhamento de sequências e introdução de hiatos, caso necessário, para obter a percentagem máxima de identidade de sequência. O alinhamento com objectivos de determinar a percentagem de identidade de sequência de ácido nucleico pode ser conseguido de vários modos que se encontram abrangidos pela pericia na especialidade, por exemplo, utilizando os programas de computador disponíveis ao público tais como os programas BLAST, BLAST-2, ALIGN, ALIGN-2 OU Megalign (DNASTAR). Os peritos na especialidade podem determinar os parâmetros apropriados para medir o alinhamento incluindo quaisquer algoritmos necessários para obter o alinhamento máximo ao longo do comprimento total das sequências a comparar. Para os presentes objectivos, contudo, os valores de % de identidade de sequência de ácido nucleico obtêm-se como descrito adiante utilizando o programa de computador de comparação de sequências align-2, em que o código de fonte completo para o programa ALIGN-2 é proporcionado na tabela 1. O programa de computador de comparação de sequências ALIGN-2 tem como autor Genentech, Inc. e o código de fonte apresentado na tabela 1 foi apresentado com a documentação para o utilizador no gabinete de direitos de autor dos E.U.A. ("U.S. Copyright Office"), Washington D.C., 20559, onde se encontra registado com o número de registo de US Copyright Registration, TXU510087. O programa ALIGN-2 está disponível ao público através de Genentech, Inc., South San Francisco, Califórnia ou pode ser compilado a partir do código de fonte proporcionado na tabela 1. O programa ALIGN-2 deve ser compilado para utilização num sistema operativo UNIX, de preferência UNIX V4.0D digital. Todos os parâmetros de comparação de sequências estão estabelecidos pelo programa ALIGN-2 e não variam. 47 ΕΡ 1 623 989/ΡΤ

Para os presentes objectivos, a % de identidade de sequência de ácido nucleico de uma determinada sequência de ácido nucleico C relativamente, com ou contra uma determinada sequência de ácido nucleico D (que pode ser alternativamente denominada como uma determinada sequência de ácido nucleico C que apresenta ou inclui uma determinada % de identidade de sequência de ácido nucleico relativamente, com ou contra uma determinada sequência de ácido nucleico D), calcula-se como se segue:

100 vezes a fracção W/Z em que W é o número de nucleótidos pontuados como correspondências idênticas pelo programa de alinhamento de sequências ALIGN-2 no alinhamento efectuado por esse programa de C e D e em que Z é o número total de nucleótidos em D. Considerar-se-á que nos casos em que o comprimento da sequência de ácido nucleico C não é igual ao comprimento da sequência de ácido nucleico D, a % de identidade de sequência de ácido nucleico de C relativamente a D não será igual à % de identidade de sequência de ácido nucleico de D relativamente a C. Como exemplos de cálculo da % de identidade de sequência de ácido nucleico, as tabelas 2C-2D demonstram como calcular a % de identidade de sequência de ácido nucleico da sequência de ácido nucleico designada como "ADN de comparação" relativamente à sequência de ácido nucleico designada como "PRO-ADN".

Salvo especificado em contrário, todos os valores de % de identidade de sequência de ácido nucleico aqui utilizados são obtidos como descrito acima utilizando o programa de computador de comparação de sequências ALIGN-2. Contudo, a % identidade de sequência de ácido nucleico pode também ser determinada utilizando o programa de comparação de sequências NCBI-BLAST2 (Altschul et al., Nucleic Acids Res., 25:3389-3402 (1997)). O programa de comparação de sequências NCBI-BLAST2 pode ser obtido de http://www.ncbi.nlm.nih.gov. NCBI-BLAST2 utiliza vários parâmetros de busca, em que todos esses parâmetros de busca estão estabelecidos em valores por defeito incluindo, por exemplo, "unmask = yes", "strand = all", "expected occurrences =10", "minimum low complexity length =15/5", "multi-_pass e-_value = 0.01", "constant for multi- 48 ΕΡ 1 623 989/ΡΤ _pass = 25", "dropoff for final gapped alignment = 25" e "scoring matrix = BLOSUM62".

Nas situações em que se utiliza NCBI-BLAST2 para comparações de sequências, a % de identidade de sequência de ácido nucleico de uma dada sequência de ácido nucleico C relativamente, com ou contra uma determinada sequência de ácido nucleico D (que pode ser alternativamente denominada como uma determinada sequência de ácido nucleico C que apresenta ou inclui uma determinada % de identidade de ácidos nucleicos relativamente, com ou contra uma determinada sequência de ácido nucleico D) calcula-se como se segue:

100 vezes a fracção W/Z em que W é o número de nucleótidos pontuados como correspondências idênticas pelo programa de alinhamento de sequências NCBI-BLAST2 no alinhamento efectuado por esse programa de C e D e em que Z é o número total de nucleótidos em D. Considerar-se-á que nos casos em que o comprimento da sequência de ácido nucleico C não é igual ao comprimento da sequência de ácido nucleico D, a % de identidade de ácidos nucleicos de C relativamente a D não será igual à % de identidade de sequência de ácido nucleico de D relativamente a C.

Adicionalmente, os valores de % de identidade de sequência de ácido nucleico podem também ser determinados utilizando o programa de computador WU-BLAST-2 (Altschul et al., Methods in Enzymology, 266:460-480 (1996)). A maioria dos parâmetros de busca WU-BLAST-2 são estabelecidos em valores por defeito. Os parâmetros não colocados em valores por defeito, ou seja, os parâmetros ajustáveis, são estabelecidos nos seguintes valores: "overlap span = 1", "overlap fraction = 0.125", "word threshold (T) = 11" e "scoring matrix = BLOSUM62". Para os presentes objectivos, o valor da % de identidade de sequência de ácido nucleico é determinado por divisão de (a) o número de nucleótidos com correspondência idêntica entre a sequência de ácido nucleico da molécula de ácidos nucleicos que codifica o polipéptido PRO de interesse apresentando uma sequência derivada dos ácidos nucleicos que codificam a sequência do polipéptido PRO nativo e a comparação da molécula de ácido 49 ΕΡ 1 623 989/ΡΤ nucleico de interesse (ou seja, a sequência contra a qual se está a comparar a molécula de ácido nucleico que codifica o polipéptido PRO de interesse que pode ser um polinucleótido PRO variante) tal como determinado por wu-BLAST-2, por (b) o número total de nucleótidos da molécula de ácido nucleico que codifica o polipéptido PRO de interesse. Por exemplo, na expressão "uma molécula de ácido nucleico isolada incluindo uma sequência de ácido nucleico A que apresenta ou apresentando pelo menos 80% de identidade de sequência de ácido nucleico com a sequência de ácido nucleico B", a sequência de ácido nucleico A é a molécula de ácido nucleico de interesse de comparação e a sequência de ácido nucleico B é a sequência de ácido nucleico da molécula de ácido nucleico que codifica o polipéptido PRO de interesse.

Noutras concretizações, os polinucleótidos PRO variantes são moléculas de ácido nucleico que codificam um polipéptido PRO activo e que são capazes de hibridar, de preferência sob condições de hibridação e lavagem rigorosas, com sequências de nucleótidos que codificam o polipéptido PRO de comprimento completo apresentado na figura 2 (SEQ ID NO:2), Figura 4 (SEQ ID NO: 4), Figura 6 (SEQ ID NO:6), Figura 8 (SEQ ID NO:8). Figura 10 (SEQ ID NO: 10), Figura 12 (SEQ ID NO: 12). Figura 14 (SEQ ID NO: 14), Figura 16 (SEQ ID NO:16). Figura 18 (SEQ ID NO: 18). Figura 20 (SEQ ID NO:20), Figura 22 (SEQ ID NO:22), Figura 24 (SEQ ID NO:24). Figura 26 (SEQ ID NO:26), ou Figura 28 (SEQ ID NO:28), Figura 30 (SEQ ID NO:30), Figura 32 (SEQ ID NO: 32), Figura 34 (SEQ ID NO:34), Figura 36 (SEQ ID NO:36), Figura 38 (SEQ ID NO:38), Figura 40 (SEQ ID NO:40),

Figura 42 (SEQ ID NO:42), Figura 44 (SEQ ID NO:44), Figura 46 (SEQ ID NO: 46) . Figura 48 (SEQ ID NO:48), Figura 50 (SEQ ID NO:50), Figura 52 (SEQ ID NO:52), Figura 54 (SEQ ID NO:54),

Figura 56 (SEQ ID NO:56), Figura 58 (SEQ ID NO:58), Figura 60 (SEQ ID NO: 60), Figura 62 (SEQ ID NO:62). Figura 64 (SEQ ID NO:64), Figura 66 (SEQ ID NO:66), Figura 68 (SEQ ID NO:68) ou Figura 70 (SEQ ID NO:70), respectivamente. Os polipéptidos PRO variantes podem ser aqueles que são codificados por um polinucleótido PRO variante. O termo "positivos", no contexto de comparações de identidade de sequência de aminoácidos efectuadas como descrito acima, inclui resíduos de aminoácidos nas sequências 50 ΕΡ 1 623 989/ΡΤ comparadas que são, não apenas idênticos, mas também aqueles que apresentam propriedades semelhantes. Os resíduos de aminoácido que pontuam um valor positivo com um residuo de aminoácido de interesse são aqueles que são quer idênticos ao residuo de aminoácido de interesse quer uma substituição preferida (tal como definido na tabela 3 adiante) do residuo de aminoácido de interesse.

Para os presentes objectivos, o valor de % de positivos de uma determinada sequência de aminoácidos A relativamente, com ou contra uma determinada sequência de aminoácidos B (que pode ser alternativamente denominada como uma determinada sequência de aminoácidos A que apresenta ou inclui uma determinada % de positivos relativamente, com ou contra uma determinada sequência de aminoácidos B), calcula-se como se segue:

100 vezes a fracção X/Y em que x é o número de resíduos de aminoácidos pontuados como um valor positivo tal como definido acima pelo programa de alinhamento de sequências ALIGN-2 no alinhamento efectuado por esse programa de A e B e em que Y é o número total de resíduos de aminoácidos em B. Considerar-se-á que nos casos em que o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de positivos de A relativamente a B não será igual à % de positivos de B relativamente a A. "Isolados", quando utilizado para descrever os diferentes polipéptidos aqui revelados, significa um polipéptido que foi identificado e separado e/ou recuperado de uma componente do seu ambiente natural. De preferência, o polipéptido isolado está isento de qualquer associação com todas as componentes com as quais se encontra naturalmente associado. As componentes contaminantes do seu ambiente natural são materiais que interfeririam tipicamente com utilizações em diagnóstico ou terapêuticas para o polipéptido e podem incluir enzimas, hormonas e outros solutos proteináceos ou não proteináceos. Em concretizações preferidas, o polipéptido será purificado (1) até um grau suficiente para obter pelo menos 15 resíduos da sequência de aminoácidos N-terminais ou internos por utilização de um sequenciador de copo rotativo, 51 ΕΡ 1 623 989/ΡΤ ou (2) até à homogeneidade por SDS-PAGE sob condições não redutoras ou redutoras utilizando coloração com azul de Coomassie ou, de preferência, com prata. 0 polipéptido isolado inclui polipéptido in situ no interior de células recombinantes, dado que não estará presente pelo menos uma componente do ambiente natural de PRO. Habitualmente, contudo, o polipéptido isolado será preparado através de pelo menos uma etapa de purificação.

Uma molécula de ácido nucleico "isolada" que codifica um polipéptido PRO ou uma molécula de ácido nucleico "isolada" que codifica um anticorpo anti-PRO, é uma molécula de ácido nucleico que é identificada e separada de pelo menos uma molécula de ácido nucleico contaminante com a qual se encontra habitualmente associada na origem natural dos ácidos nucleicos que codificam PRO ou dos ácidos nucleicos que codificam o anti-PRO. De preferência, os ácidos nucleicos isolados encontram-se isentos de associação com todas as componentes com as quais se encontram naturalmente associados. Uma molécula de ácido nucleico que codifica PRO isolado ou uma

molécula de ácido nucleico que codifica um anti-PRO encontra-se numa forma ou ambiente distinto dos encontrados na natureza. As moléculas de ácido nucleico isoladas distinguem-se portanto da molécula de ácido nucleico que codifica PRO ou da molécula de ácido nucleico que codifica anti-PRO tal como ocorre em células naturais. Contudo, uma molécula de ácido nucleico isolada que codifica um polipéptido PRO ou um anticorpo anti-PRO inclui moléculas de ácido nucleico PRO e moléculas de ácido nucleico anti-PRO contidas em células que habitualmente expressam polipéptidos PRO ou expressam anticorpos anti-PRO em que, por exemplo, a molécula de ácido nucleico ocorre numa localização cromossómica diferente da das células naturais. A expressão "sequências de controlo" refere-se a sequências de ADN necessárias para a expressão de uma sequência de codificação ligada operativamente num organismo hospedeiro especifico. As sequências de controlo que são adequadas para procariotas, por exemplo, incluem um promotor, opcionalmente uma sequência de operador e um local de ligação ao ribossoma. Sabe-se que as células eucarióticas utilizam promotores, sinais de poliadenilação e potenciadores. 52 ΕΡ 1 623 989/ΡΤ Ο ácido nucleico encontra-se "ligado operativamente" quando está colocado numa relação funcional com outra sequência de ácido nucleico. Por exemplo, o ADN para uma pré-sequência ou um comando de excreção encontra-se ligado operativamente ao ADN para um polipéptido se é expresso como uma pré-proteina que participa na excreção do polipéptido; um promotor ou potenciador encontra-se ligado operativamente a uma sequência de codificação se afecta a transcrição da sequência; ou um local de ligação ao ribossoma encontra-se ligado operativamente a uma sequência de codificação se está posicionado de modo a facilitar a tradução. De um modo geral, "ligado operativamente" significa que as sequências de ADN a ser ligadas são contíguas e no caso de um comando de excreção, contíguas e em quadro de leitura. Contudo, os potenciadores não têm que ser contíguos. A ligação consegue-se por ligação em locais de restrição convenientes. Se tais locais não existirem, os adaptadores ou ligantes de oligonucleótidos sintéticos são utilizados de acordo com a prática convencional. 0 termo "anticorpo" utiliza-se no seu sentido mais abrangente e abrange especificamente, por exemplo, anticorpos monoclonais anti-PR07168 simples (incluindo anticorpos antagonistas e neutralizantes), composições de anticorpo anti-PR07168 com especificidade poliepitópica, anticorpos anti-PR07168 de cadeia simples e fragmentos de anticorpos anti-PR07168 (consultar adiante). A expressão "anticorpo monoclonal" tal como aqui utilizada refere-se a um anticorpo obtido de uma população de anticorpos substancialmente homogénea, ou seja, os anticorpos individuais que constituem a população são idênticos excepto relativamente a possíveis mutações de ocorrência natural que podem estar presentes em quantidades insignificantes. 0 "rigor" das reacções de hibridação é facilmente determinado pelo perito na especialidade e geralmente é um cálculo empírico dependente do comprimento da sonda, temperatura de lavagem e concentração de sal. De um modo geral, sondas mais longas requerem temperaturas mais elevadas para hibridação adequada, enquanto que sondas mais curtas necessitam de temperaturas mais baixas. A hibridação 53 ΕΡ 1 623 989/ΡΤ geralmente depende da capacidade do ADN desnaturado tornar a hibridar com cadeias complementares que estão presentes num ambiente abaixo da sua temperatura de fusão. Quanto maior o grau de homologia pretendida entre a sonda e a sequência a hibridar, maior a temperatura relativa que pode ser utilizada. Em resultado, temperaturas relativas mais altas tenderão a tornar as condições reaccionais mais rigorosas, enquanto que temperaturas mais baixas fazem-no em menor escala. Para detalhes adicionais e explicação do rigor das reacções de hibridação, consultar Ausubel et ai., Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995). "Condições rigorosas" ou "condições altamente rigorosas", tal como aqui definidas, podem ser identificadas como aquelas que (1) utilizam força iónica baixa e temperatura elevada para lavagem, por exemplo cloreto de sódio 0,015 M/citrato de sódio 0,0015 M/dodecilssulfato de sódio a 0,1% a 50°C; (2) utilizam durante a hibridação um agente desnaturante, tal como formamida, por exemplo, formamida a 50% (v/v) com albumina sérica bovina a 0,1%/Ficoll a 0,1%/polivinilpirrolidona a 0,1%/tampão de fosfato de sódio 50 mM a pH 6,5 com cloreto de sódio 750 mM, citrato de sódio 75 mM a 42°C; ou (3) utilizam formamida a 50%, SSC 5x (NaCl 0,75 M, citrato de sódio 0, 075 M), fosfato de sódio 50 mM (pH 6,8), pirofosfato de sódio a 0,1%, solução de Denhardt 5x, ADN de esperma de salmão tratado com ultra-sons (50 pg/ml), SDS a 0,1% e sulfato de dextrano a 10% a 42°C, com lavagens a 42°C com SSC 0,2x (cloreto de sódio/citrato de sódio) e formamida a 50% a 55°C, seguido por uma lavagem de rigor elevado consistindo em SSC 0,lx contendo EDTA a 55°C. "Condições moderadamente rigorosas" podem ser identificadas como descrito por Sambrook et al., Molecular Cloning: A Laboratory Manual, New York: Cold Spring Harbor Press, 1989 e incluem a utilização de solução de lavagem e condições de hibridação (por exemplo, temperatura, força iónica e % de SDS) menos rigorosas que as descritas acima. Constitui um exemplo de condições moderadamente rigorosas a incubação durante a noite a 37°C numa solução contendo: formamida a 20%, SSC 5x (NaCl 150 mM, citrato trissódico 15 mM), fosfato de sódio 50 mM (pH 7,6), solução de Denhardt 5x, sulfato de dextrano a 10% e ADN de esperma de salmão 54 ΕΡ 1 623 989/ΡΤ cortado e desnaturado a 20 mg/ml, seguido de lavagem dos filtros com SSC lx a cerca de 35°C-50°C. O perito na especialidade reconhecerá como ajustar a temperatura, a força iónica, etc. conforme necessário para acomodar factores tais como comprimento da sonda e semelhantes. A expressão "marcado com epitopo" quando aqui utilizada refere-se a um polipéptido quimérico incluindo um polipéptido PR07168 fundido a um "polipéptido marcador". O polipéptido marcador tem resíduos suficientes para proporcionar um epitopo contra o qual pode ser desenvolvido um anticorpo, mas é suficientemente curto de modo a não interferir com a actividade do polipéptido com o qual se encontra fundido. O polipéptido marcador é de preferência também geralmente único de modo a que o anticorpo não apresente reactividade cruzada substancial com outros epitopos. Geralmente os polipéptidos marcadores têm pelo menos seis resíduos de aminoácidos e têm geralmente entre cerca de 8 a 50 resíduos de aminoácidos (de preferência, entre cerca de 10 a 20 resíduos de aminoácidos). "Activo" ou "actividade" para os presentes objectivos refere-se a forma(s) dos polipéptidos PR07168 que retêm uma actividade/propriedade biológica e/ou imunológica de um polipéptido PR07168 nativo ou de ocorrência natural, em que actividade "biológica" se refere a uma função (quer de inibição quer de estimulação) causada por um polipéptido PR07168 nativo ou de ocorrência natural diferente da capacidade para induzir a produção de um anticorpo contra um epitopo antigénico apresentado por um polipéptido PR07168 nativo ou de ocorrência natural e uma actividade "imunológica" refere-se à capacidade de induzir a produção de um anticorpo contra um epitopo antigénico apresentado por um polipéptido PR07168 nativo ou de ocorrência natural. "Actividade biológica" no contexto de um anticorpo ou outra molécula antagonista que pode ser identificada pelos ensaios de rastreio aqui revelados (por exemplo, uma molécula pequena orgânica ou inorgânica, péptido, etc.) utiliza-se para referir a capacidade de tais moléculas ligarem ou se complexarem com os polipéptidos codificadas pelos genes amplificados aqui identificados, ou que interfere de outro modo com a interacção dos polipéptidos codificados com outras 55 ΕΡ 1 623 989/ΡΤ proteínas celulares ou interfere de outro modo com a transcrição ou tradução de um polipéptido PR07168. Constitui uma actividade biológica preferida a inibição do crescimento de uma célula tumoral alvo. Constitui outra actividade biológica preferida a actividade citotóxica que resulta na morte de uma célula tumoral alvo. A expressão "actividade biológica" no contexto de um polipéptido PR07168 significa a capacidade de um polipéptido PR07168 induzir crescimento celular neoplásico ou crescimento celular descontrolado. A expressão "actividade imunológica" significa reactividade cruzada imunológica com pelo menos um epítopo de um polipéptido PR07168. "Reactividade imunológica cruzada" tal como aqui utilizada significa que o polipéptido candidato é capaz de inibir competitivamente a actividade biológica qualitativa de um polipéptido PR07168 apresentando esta actividade, com anti-soros policlonais desenvolvidos contra o polipéptido PR07168 activo conhecido. Tais anti-soros preparam-se de modo convencional por injecção de cabras ou coelhos, por exemplo, por via subcutânea com o análogo activo conhecido em adjuvante completo de Freund seguido de injecção intraperitoneal ou subcutânea de reforço em meio incompleto de Freund. A reactividade cruzada imunológica é de preferência "específica", o que significa que a afinidade de ligação da molécula que apresenta reactividade cruzada imunológica (por exemplo, anticorpo) identificada, relativamente ao polipéptido PR07168 correspondente, é significativamente superior (de preferência pelo menos cerca de 2 vezes, com maior preferência pelo menos cerca de 4 vezes, ainda com maior preferência pelo menos cerca de 8 vezes, com a maior preferência pelo menos cerca de 10 vezes mais elevada) do que a afinidade de liqação dessa molécula relativamente a qualquer outro polipéptido nativo conhecido.

Define-se aqui uma "molécula pequena" como apresentando um peso molecular inferior a cerca de 500 Dalton. 56 ΕΡ 1 623 989/ΡΤ "Anticorpos" (Ab) e "imunoglobulinas" (Ig) são glicoproteínas apresentando as mesmas características estruturais. Enquanto que os anticorpos apresentam especificidade de ligação a um antigénio especifico, as imunoglobulinas incluem tanto anticorpos como outras moléculas do tipo dos anticorpos que são isentas de especificidade antigénica. Os polipéptidos deste último tipo são, por exemplo, produzidos a níveis reduzidos pelo sistema linfático e a níveis aumentados pelos mielomas. A expressão "anticorpo" é utilizada no seu sentido mais lato e abrange especificamente, entre outros, anticorpos monoclonais intactos, anticorpos policlonais, anticorpos multiespecíficos (por exemplo, anticorpos biespecíficos) formados a partir de pelo menos dois anticorpos intactos e fragmentos de anticorpo desde que apresentem a actividade biológica pretendida. "Anticorpos nativos" e "imunoglobulinas nativas" são habitualmente glicoproteínas heterotetraméricas com cerca de 150 000 dalton, compostas por duas cadeias leves (L) idênticas e duas cadeias pesadas (H) idênticas. Cada cadeia leve encontra-se ligada a uma cadeia pesada por uma ligação dissulfureto covalente, sendo que o número de ligações dissulfureto varia entre as cadeias pesadas de diferentes isotipos de imunoglobulinas. Cada cadeia pesada e leve apresenta igualmente pontes de dissulfureto regularmente espaçadas. Cada cadeia pesada apresenta numa das extremidades um domínio variável (VH) seguido por vários domínios constantes. Cada cadeia leve apresenta um domínio variável (Vi) numa das extremidades e um domínio constante na sua outra extremidade; o domínio constante da cadeia leve está alinhado com o primeiro domínio constante da cadeia pesada e o domínio variável da cadeia leve está alinhado com o domínio variável da cadeia pesada. Pensa-se que determinados resíduos de aminoácidos formam uma interface entre os domínios variáveis de cadeia leve e de cadeia pesada. A expressão "variável" refere-se ao facto de determinadas porções dos domínios variáveis apresentarem grandes diferenças de sequência entre anticorpos e serem utilizadas na ligação e especificidade de cada anticorpo em particular relativamente ao seu antigénio específico. Contudo, a variabilidade não se encontra uniformemente distribuída ao longo dos domínios 57 ΕΡ 1 623 989/ΡΤ variáveis dos anticorpos. Encontra-se concentrada em três segmentos denominados regiões determinantes da complementaridade (CDR) ou regiões hipervariáveis tanto nos dominios variáveis de cadeia leve como de cadeia pesada. As porções mais altamente conservadas dos dominios variáveis denominam-se regiões de esqueleto (FR). Cada um dos dominios variáveis das cadeias pesada e leve nativas inclui quatro regiões FR, que adoptam de um modo geral uma configuração em folha β ligadas por três CDR que formam ansas que ligam a estrutura em folha β e nalguns casos fazem parte dessa estrutura. As CDR em cada cadeia mantêm-se juntas e muito próximas pelas regiões FR e juntamente com as CDR da outra cadeia contribuem para a formação do local de ligação de antigénios de anticorpos (consultar Kabat et al.r NIH Publ. N° 91-3242, Vol. I, páginas 647-669 (1991)). Os dominios constantes não estão directamente envolvidos na ligação de um anticorpo a um antigénio mas apresentam diferentes funções efectoras tais como participação do anticorpo em toxicidade celular dependente de anticorpo. A expressão "região hipervariável" quando aqui utilizada refere-se aos residuos de aminoácidos de um anticorpo que são responsáveis por ligação de antigénio. A região hipervariável inclui residuos de aminoácidos de uma "região determinante da complementaridade" ou "CDR" (ou seja, residuos 24-34 (Ll), 50-56 (L2) e 89-97 (L3) no domínio variável da cadeia leve e 31-35 (Hl), 50-65 (H2) e 95-102 (H3) no domínio variável da cadeia pesada; Kabat et al., Sequences of Proteins of Immunological Interest, 5a Ed. Public Health Service, National Institute of Health, Bethesda, Maryland [1991]) e/ou os resíduos de uma "ansa hipervariável" (ou seja, resíduos 26-32 (Ll), 50-52 (L2) e 91-96 (L3) no domínio variável de cadeia leve e 26-32 (Hl), 53-55 (H2) e 96-101 (H3) no domínio variável de cadeia pesada; Clothia e Lesk, J. Mol. Biol., 196:901-917 [1987]). Resíduos de "esqueleto" ou "FR" são os resíduos de domínio variável diferentes dos resíduos de região hipervariável tal como aqui definidos. "Fragmentos de anticorpos" incluem uma porção de um anticorpo intacto, de preferência a região de ligação ao antigénio ou região variável do anticorpo intacto. Constituem exemplos de fragmentos de anticorpos, entre outros, fragmentos 58 ΕΡ 1 623 989/ΡΤ

Fab, Fab', F(ab')2 e Fv; diacorpos; anticorpos lineares (Zapata et ai., Protein Eng., 8(10) : 1057-1062 [1995]); moléculas de anticorpo de cadeia simples; e anticorpos multiespecificos formados a partir de fragmentos de anticorpos. A digestão de anticorpos com papaina produz dois fragmentos de ligação de antigénio idênticos, denominados fragmentos "Fab", cada um com um único local de ligação de antigénio e um fragmento "Fc" residual cujo nome reflecte a sua capacidade para cristalizar facilmente. O tratamento com pepsina origina um fragmento F(ab')2 que apresenta dois locais de combinação de antigénio e ainda é capaz de reticular com antigénio. "Fv" é o fragmento de anticorpo mínimo que contém um local de reconhecimento e ligação ao antigénio. Esta região consiste de um dímero de um domínio variável de cadeia pesada e outro de cadeia leve em forte associação não covalente. É nesta configuração que as três CDR de cada domínio variável interagem para definir um local de ligação de antigénio à superfície do dímero VH-VL. Conjuntamente, as seis CDR conferem especificidade de ligação de antigénio ao anticorpo. Contudo, mesmo apenas um domínio variável (ou metade de um Fv incluindo apenas três CDR específicas para um antigénio) tem a capacidade de reconhecer e ligar antigénio apesar de o fazer com afinidade reduzida relativamente ao local de ligação de comprimento completo. O fragmento Fab contém também o domínio constante da cadeia leve e o primeiro domínio constante (CHI) da cadeia pesada. Os fragmentos Fab diferem de fragmentos Fab' por adição de alguns resíduos no terminal carboxilo do domínio de cadeia pesada CHI incluindo uma ou mais cisteínas da região de charneira do anticorpo. Fab'-SH é a designação aqui utilizada para Fab' em que o(s) resíduo (s) de cisteína dos domínios constantes apresentam um grupo tiol livre. Produziram-se originalmente fragmentos de anticorpo F(ab')2 como pares de fragmentos Fab' que apresentam cisteínas de charneira entre si. São igualmente conhecidos outros acoplamentos químicos de fragmentos de anticorpo. 59 ΕΡ 1 623 989/ΡΤ

As "cadeias leves" de anticorpos (imunoglobulinas) de quaisquer espécies de vertebrados podem ser atribuídas a um ou dois tipos nitidamente diferentes denominados capa (k) e lambda (λ), com base nas sequências de aminoácido dos seus dominios constantes.

Dependendo da sequência de aminoácidos do domínio constante das suas cadeias pesadas, as imunoglobulinas podem ser atribuídas a diferentes classes. Existem cinco classes principais de imunoglobulinas: IgA, IgD, IgE, IgG e IgM e várias de entre estas podem ser adicionalmente divididas em subclasses (isotipos), por exemplo, igGl, lgG2, lgG3, lgG4, IgA e IgA2. Os domínio constantes de cadeia pesada que correspondem a diferentes classes de imunoglobulinas denominam-se α, δ, ε, γ e μ, respectivamente. As estruturas de subunidade e as configurações tridimensionais das diferentes classes de imunoglobulinas são bem conhecidas. A expressão "anticorpo monoclonal" tal como aqui utilizada refere-se a um anticorpo obtido de uma população substancialmente homogénea de anticorpos, ou seja, os anticorpos individuais que fazem parte da população são idênticos excepto relativamente a possíveis mutações de ocorrência natural que possam estar presentes em pequenas quantidades. Os anticorpos monoclonais são altamente específicos, sendo dirigidos contra um único local antigénico. Além disso, contrariamente às preparações de anticorpos convencionais (policlonais) que incluem tipicamente anticorpos diferentes dirigidos contra determinantes (epítopos) diferentes, cada anticorpo monoclonal é dirigido contra um único determinante no antigénio. Além da sua especificidade, os anticorpos monoclonais são vantajosos por serem sintetizados pela cultura de hibridomas, não contaminados por outras imunoglobulinas. 0 adjectivo "monoclonal" indica o carácter do anticorpo como sendo obtido de uma população substancialmente homogénea de anticorpos e não deve ser encarado como requerendo a produção do anticorpo por qualquer método em particular. Por exemplo, os anticorpos monoclonais a utilizar de acordo com o presente invento podem ser produzidos pelo método do hibridoma, pela primeira vez descrito por Kohler et al., Nature, 256:495 [1975], ou podem ser produzidos por métodos de ADN recombinante (consultar, por exemplo, 60 ΕΡ 1 623 989/ΡΤ patente U.S. η.° 4 816 567). Os "anticorpos monoclonais" podem ser também isolados de bibliotecas de anticorpos sobre fagos utilizando as técnicas descritas em Clackson et al., Nature, 352:624-628 [1991] e Marks et al., J. Mol. Biol., 222:581-597 (1991), por exemplo.

Os presentes anticorpos monoclonais incluem especificamente anticorpos "quiméricos" (imunoglobulinas) nos quais uma parte da cadeia pesada e/ou leve é idêntica ou homóloga às sequências correspondentes em anticorpos derivados de uma espécie em particular ou pertencentes a uma classe ou subclasse particular de anticorpo, enquanto que a(s) cadeia(s) restante(s) são idênticas ou homólogas às sequências correspondentes em anticorpos derivados de outra espécie ou pertencentes a outra classe ou subclasse de anticorpos, assim como fragmentos de tais anticorpos desde que apresentem a actividade biológica pretendida (patente U.S. n.° 4 816 567; Morrison et al., Proc. Natl. Acad. Sei. USA, 81:6851-6855 [1984]) .

Formas "humanizadas" de anticorpos não humanos (por exemplo, murinos) são imunoglobulinas quiméricas, cadeias de imunoglobulina ou seus fragmentos (tais como Fv, Fab, Fab', F(ab')2 ou outras subsequências de ligação de antigénio de anticorpos) que contêm uma sequência mínima derivada de imunoglobulina não humana. Na sua maioria, os anticorpos humanizados são imunoglobulinas humanas (anticorpo recebedor) nas quais se substituíram resíduos de uma CDR do recebedor por resíduos de uma CDR de uma espécie não humana (anticorpo dador) tal como ratinho, rato ou coelho apresentando a especificidade, afinidade e capacidade pretendidas. Nalguns casos, substituem-se resíduos Fv FR de imunoglobulina humana pelos correspondentes resíduos não humanos. Além disso, os anticorpos humanizados podem incluir resíduos que não existem nem no anticorpo recebedor nem nas sequências de CDR ou de esqueleto FR importadas. Estas modificações são efectuada para refinar e maximizar adicionalmente o desempenho do anticorpo. De um modo geral, o anticorpo humanizado incluirá substancialmente todos e pelo menos um e tipicamente dois, domínio variáveis nos quais todas ou substancialmente todas as regiões CDR correspondem às de uma imunoglobulina não humana e todas ou substancialmente todas as regiões FR são as de uma 61 ΕΡ 1 623 989/ΡΤ sequência de imunoglobulina humana. O anticorpo humanizado incluirá optimamente também pelo menos uma porção de uma região constante de imunoglobulina (Fc), tipicamente a de uma imunoglobulina humana. Para pormenores adicionais consultar Jones et al., Nature, 321:522-525 (1986); Reichmann et al., Nature, 332:323-329 [1988]; e Presta, Curr. Op. Struct. Biol., 2_: 593—596 (1992). 0 anticorpo humanizado inclui um anticorpo PRIMATIZED™ em que a região de ligação ao antigénio do anticorpo é derivada de um anticorpo produzido por imunização de macacos Macaque com o antigénio de interesse.

Fragmentos de anticorpo "Fv em cadeia simples" ou "sFv" incluem os domínios VH e VL de anticorpo em que esses domínios estão presentes numa única cadeia polipeptídica. De preferência, o polipéptido Fv inclui adicionalmente um ligante polipeptídico entre os domínios VH e VL que permite que sFv forme a estrutura pretendida para ligação do antigénio. Para uma revisão de sFv consultar Pluckthun em The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg e Moore ed., Springer-Verlag, New York, p. 269-315 (1994). A expressão "diacorpos" refere-se a fragmentos de anticorpo pequenos com dois locais de ligação de antigénio em que os fragmentos incluem um domínio variável de cadeia pesada (VH) ligado a um domínio variável de cadeia leve (VL) na mesma cadeia polipeptídica (VH-VL) . Utilizando um ligante que é demasiado curto para permitir emparelhamento entre os dois domínios da mesma cadeia, forçam-se os domínios a emparelhar com os domínios complementares de outra cadeia e a criar dois locais de ligação de antigénio. Descrevem-se diacorpos em maior detalhe em, por exemplo, EP 404 097; WO 93/11161; e Hollinger et al., Proc. Natl. Acad. Sei. USA, 90:6444-6448 (1993) .

Um anticorpo "isolado" é aquele que foi identificado e separado e/ou recuperado de uma componente do seu ambiente natural. As componentes contaminantes do seu ambiente natural são materiais que interferiram com utilizações do anticorpo em diagnóstico ou terapêutica e podem incluir enzimas, hormonas e outro solutos proteináceos ou não proteináceos. Em concretizações preferidas, o anticorpo será purificado (1) até mais de 95% em peso de anticorpo tal como determinado pelo 62 ΕΡ 1 623 989/ΡΤ método de Lowry e com maior preferência até mais de 99% em peso, (2) até um grau suficiente para obter pelo menos 15 resíduos da sequência de aminoácidos N-terminais ou internos por utilização de um sequenciador de copo rotativo, ou (3) até à homogeneidade por SDS-PAGE em condições redutoras ou não redutoras utilizando coloração com azul de Coomassie ou, de preferência, com prata. 0 anticorpo isolado inclui o anticorpo in situ no interior de células recombinantes dado que não estará presente pelo menos uma componente do ambiente natural do anticorpo. Habitualmente, contudo, o anticorpo isolado será preparado através de pelo menos uma etapa de purificação. A expressão "marcador" quando aqui utilizada refere-se a um composto ou composição detectável que está directa ou indirectamente conjugado com o anticorpo de modo a gerar um anticorpo "marcado". 0 marcador pode ser detectável por si próprio (por exemplo, marcadores radioisotópicos ou marcadores fluorescentes) ou, no caso de um marcador enzimático, pode catalisar alteração química de um composto ou composição substrato que é detectável. Os radionuclidos que podem servir como marcadores detectáveis incluem, por exemplo, 1-131, 1-123, 1-125, Y-90, Re-188, Re-186, At-211, Cu-67, Bi-212 e

Pd-109. 0 marcador pode também ser uma entidade não detectável tal como uma toxina. "Fase sólida" significa uma matriz não aquosa à qual o anticorpo do presente invento pode aderir. Constituem exemplos de fases sólidas aqui abrangidas, entre outras, as formadas parcial ou inteiramente por vidro (por exemplo, vidro de porosidade controlada), polissacáridos (por exemplo, agarose), poliacrilamidas, poliestireno, poli(álcool vinílico) e silicones. Em determinadas concretizações, dependendo do contexto, a fase sólida pode incluir o poço de uma placa de ensaio; noutras é uma coluna de purificação (por exemplo, uma coluna de cromatografia de afinidade). Esta expressão também inclui uma fase sólida descontínua de partículas discretas, tal como as descritas na patente U.S. n.° 4 275 149.

Um "lipossoma" é uma vesícula pequena composta por diferentes tipos de lípidos, fosfolípidos e/ou tensioactivos que é útil para entregar um fármaco (tal como um polipéptido 63 ΕΡ 1 623 989/ΡΤ PR07168 ou um anticorpo deste e opcionalmente um agente quimioterapêutico) a um mamífero. As componentes do lipossoma são habitualmente dispostas numa formação em bicamadas semelhante ao arranjo de lípidos das membranas biológicas.

Tal como aqui utilizada, a expressão "imunoadesina" designa moléculas do tipo anticorpo que combinam a especificidade de ligação de uma proteína heteróloga (uma "adesina") com as funções de efector dos domínios constantes de imunoglobulina. Estruturalmente, as imunoadesinas incluem uma fusão de uma sequência de aminoácidos com a especificidade de ligação pretendida que é diferente do local de reconhecimento e ligação de antigénio de um anticorpo (ou seja, é "heteróloga") e de uma sequência de domínio constante de uma imunoglobulina. A parte adesina de uma molécula de imunoadesina é tipicamente uma sequência de aminoácidos contígua incluindo pelo menos o local de ligação de um receptor ou de um ligando. A sequência de domínio constante de imunoglobulina da imunoadesina pode ser obtida de qualquer imunoglobulina tal como os subtipos IgG-1, IgG-2, IgG-3 ou IgG-4, IgA (incluindo IgA-1 e IgA-2), IgE, IgD ou IgM. II. Composições e métodos do invento A. Polipéptidos PR07168 de comprimento completo 0 presente invento proporciona a sequências de nucleótidos que codificam polipéptidos, identificadas e isoladas pela primeira vez, que se referem no presente pedido como PR07168. Nomeadamente, identificou-se e isolou-se ADNc que codifica polipéptidos PR07168, como descrito com mais detalhes nos exemplos adiante. Note-se que se podem atribuir números PRO diferentes a proteínas produzidas em ciclos de expressão independentes mas o número UNQ é único para qualquer ADN determinado e proteína codificada e não será alterado. Contudo, com vista a simplificar, no presente fascículo as proteínas codificadas pelas sequências de ácidos nucleicos aqui reveladas assim como todos os homólogos e variantes nativos adicionais incluídos na definição de PR07168 acima, serão referidos como "PR07168" independentemente da sua origem ou modo de preparação. 64 ΕΡ 1 623 989/ΡΤ

Tal como revelado nos exemplos adiante, os clones de ADNc foram depositados na ATCC, com a excepção dos clones conhecidos: DNA30869, DNA34405, DNA36995, DNA43320, DNA38649, DNA5 6505, DNA48303, DNA50798, DNA66489, DNA80896, DNA96791, e DNA58725. A sequência de nucleótidos real dos clones pode ser facilmente determinada pelo perito na especialidade por sequenciação do clone depositado utilizando métodos rotineiros na especialidade. As sequências de aminoácidos previstas podem ser determinadas a partir das sequências de nucleótidos utilizando práticas correntes. Para os polipéptidos PR07168 e ácidos nucleicos codificantes aqui descritos, os requerentes identificaram o que se pensam serem os quadros de leitura mais bem identificáveis a partir da informação de sequência então disponível. B. Variantes de PR07168

Além do PR07168 de sequência nativa de comprimento completo aqui descrito, considera-se que se podem preparar variantes de PR07168. As variantes de PR07168 podem ser preparadas por introdução das alterações apropriadas de nucleótidos no ADN de PR07168 e/ou por síntese do polipéptido PR07168 pretendido. Os peritos na especialidade avaliarão quais as alterações de aminoácidos que podem alterar processos pós-tradução de PR07168 tal como a mudança do número ou posição de locais de glicosilação ou alteração das características de ancoragem à membrana.

Podem efectuar-se variações no PR07168 de sequência nativa de comprimento completo ou em vários domínios dos PR07168 aqui descritos, por exemplo, utilizando qualquer das técnicas e orientações para mutações conservativas e não conservativas apresentadas, por exemplo, na patente U.S. n.° 5 364 934. As variações podem ser uma substituição, deleção ou inserção de um ou mais codões que codificam o PR07168 que resultam numa alteração da sequência de aminoácidos de PR07168 comparativamente com a sequência de PR07168 nativa. Opcionalmente a variação é por substituição de pelo menos um aminoácido por qualquer outro aminoácido em um ou mais domínios do PR07168. Podem encontrar-se orientações relativas à determinação de qual o resíduo de aminoácido que pode ser inserido, substituído ou eliminado sem afectar de modo adverso 65 ΕΡ 1 623 989/ΡΤ a actividade pretendida por comparação da sequência do PR07168 com a de moléculas de proteínas homólogas conhecidas e minimização do número de alterações de sequências de aminoácidos efectuadas em regiões de homologia elevada. As substituições de aminoácidos podem ser o resultado de substituir um aminoácido por outro aminoácido apresentando propriedades estruturais e/ou químicas semelhantes, tais como a substituição de uma leucina por uma serina, ou seja, substituições de aminoácidos conservativas. As inserções ou deleções podem opcionalmente ser efectuadas na gama entre cerca de 1 a 5 aminoácidos. As variações permitidas podem ser determinadas fazendo sistematicamente inserções, deleções ou substituições de aminoácidos na sequência e ensaiando as variantes resultantes quanto à actividade apresentada pela sequência nativa madura ou de comprimento completo.

Proporcionam-se aqui fragmentos de polipéptido PR07168. Tais fragmentos podem ser truncados no terminal N ou no terminal C ou podem apresentar falta de resíduos internos, por exemplo, quando comparados com uma proteína nativa de comprimento completo. Determinados fragmentos apresentam falta de resíduos de aminoácidos que não são essenciais para uma actividade biológica pretendida do polipéptido PR07168.

Os fragmentos de PR07168 podem ser preparados por qualquer de várias técnicas convencionais. Os fragmentos peptídicos pretendidos podem ser sintetizados quimicamente. Uma abordagem alternativa envolve a geração de fragmentos PR07168 por digestão enzimática, por exemplo, por tratamento da proteína com uma enzima que se sabe que cliva proteínas em locais definidos por determinados resíduos de aminoácidos ou por digestão do ADN com enzimas de restrição adequadas e isolamento do fragmento pretendido. Ainda outra técnica adequada envolve isolamento e amplificação de um fragmento de ADN que codifica um fragmento polipeptídico pretendido através de reacção em cadeia com polimerase (PCR). Nos iniciadores 5' e 3' da PCR utilizam-se oligonucleótidos que definem os terminais pretendidos do fragmento de ADN. De preferência, os fragmentos de polipéptido PR07168 partilham pelo menos uma actividade biológica e/ou imunológica com o polipéptido PR07168 nativo. 66 ΕΡ 1 623 989/ΡΤ

Em concretizações particulares, apresentam-se substituições conservativas de interesse na tabela 3 sob o titulo de substituições preferidas. Se tais substituições resultarem numa alteração da actividade biológica, então introduzem-se alterações mais substanciais, denominadas exemplos de substituições na tabela 3 ou tal como adicionalmente descrito adiante em referência a classes de aminoácidos e rastreiam-se os produtos.

Tabela 3

Resíduo Original Exemplos de substituições Substituições preferidas Ala (A) vai; leu; ile vai Arg (R) lys; gin; asn lys Asn (N) gin; his; lys; arg gin Asp (D) glu glu Cys (C) ser ser Gin (Q) asn asn Glu (E) asp asp Gly (G) pro; ala ala His (H) asn; gin; lys; arg arg He (I) leu; vai; met; ala; phe; norleucina leu Leu (L) norleucina; ile; vai; met; ala; phe ile Lys (K) arg; gin; asn arg Met (M) leu; phe; ile leu Phe (F) leu; vai; ile; ala; tyr leu Pro (P) ala ala Ser (S) thr thr Thr (T) ser ser Trp (W) tyr; phe tyr Tyr (Y) trp; phe; thr; ser phe Vai (V) ile; leu; met; phe; ala; norleucina leu

Obtêm-se modificações substanciais de função ou de identidade imunológica do polipéptido por selecção de substituições que diferem significativamente relativamente ao seu efeito de manter (a) a estrutura do esqueleto do polipéptido na área da substituição, por exemplo, como uma 67 ΕΡ 1 623 989/ΡΤ conformação em folha ou em hélice, (b) a carga ou hidrofobicidade da molécula no local alvo, ou (c) a generalidade da cadeia lateral. Os resíduos de ocorrência natural dividem-se em grupos com base em propriedades comuns das cadeias laterais: (1) hidrófobos: norleucina, met, ala, vai, leu, ile; (2) hidrófilos neutros: cys, ser, thr; (3) ácidos: asp, glu; (4) básicos: asn, gin, his, lys, arg; (5) resíduos que influenciam a orientação da cadeia: gly, pro; e (6) aromáticos: trp, tyr, phe.

As substituições não conservativas implicarão trocar um membro de uma destas classes por outro de outra classe. Tais resíduos substituídos podem ser introduzidos nos locais de substituição conservativa ou, com maior preferência, nos locais restantes (não conservados).

As variações podem ser efectuadas utilizando métodos conhecidos na especialidade tais como mutagénese mediada por oligonucleótidos (dirigida ao local), varrimento de alanina e mutagénese por PCR. Pode efectuar-se mutagénese dirigida ao local [Cárter et ai., Nucl. Acids Res., 13g4331 (1986); Zoller et al., Nucl. Acids Res., 1():6487 (1987)], mutagénese com cassete [Wells et al., Gene, 34:315 (1985)], mutagénese com selecção por restrição [Wells et al., Philos. Trans. R. Soc. London SerA, 317:415 (1986)] ou outras técnicas conhecidas sobre o ADN clonado para produzir o ADN variante de PR07168.

Pode também utilizar-se varrimento de análise de aminoácidos para identificar um ou mais aminoácidos ao longo de uma sequência não contígua. Entre os aminoácidos preferidos para varrimento incluem-se os aminoácidos neutros e

relativamente pequenos. Tais aminoácidos incluem alanina, glicina, serina e cisteína. A alanina é tipicamente um aminoácido preferido para rastreio neste grupo porque elimina a cadeia lateral para além do carbono beta e é menos provável que altere a conformação da cadeia principal da variante [Cunningham e Wells, Science, 244: 1081-1085 (1989)]. A alanina é também tipicamente preferida porque não é o 68 ΕΡ 1 623 989/ΡΤ aminoácido mais comum. Além disso, encontra-se frequentemente tanto em posições enterradas como expostas [Creighton, The Proteins, (W.H. Freeman & Co., New York); Chothia, J. Mol. Biol., 150:1 (1976)]. Se a substituição com alanina não proporcionar quantidades adequadas de variante, pode utilizar-se um aminoácido isotérico. C. Modificações de PR07168

As modificações covalentes de PR07168 estão incluídas no âmbito deste invento. Um tipo de modificação covalente inclui fazer reagir resíduos de aminoácido alvo de um polipéptido PR07168 com um agente de derivatização orgânico que é capaz de reagir com cadeias laterais seleccionadas ou com os resíduos do terminal N ou do terminal C do PR07168. A derivatização com agentes bifuncionais é útil, por exemplo, para reticulação de PR07168 com uma matriz de suporte ou superfície insolúveis em água para utilização no método para purificar anticorpos anti-PR07168 e vice-versa. Os agentes de reticulação habitualmente utilizados incluem, por exemplo, 1,1-bis(diazoacetil)-2-feniletano, glutaraldeído, ésteres de N-hidroxissuccinimida, por exemplo, ésteres com ácido 4-azidossalicílico, imidoésteres homobifuncionais, incluindo ésteres dissuccinimidilo tais como 3,3'-ditiobis(succinimidil-propionato), maleimidas bifuncionais tais como bis-N-maleimido-1,8-octano e agentes tais como metil-3-[(p-azidofenil)ditio]propioimidato.

Outras modificações incluem desaminação de resíduos glutaminilo e asparaginilo aos resíduos glutamilo e aspartilo correspondentes, respectivamente, hidroxilação de prolina e lisina, fosforilação de grupos hidroxilo de resíduos serilo ou treonilo, metilação de grupos α-amino de cadeias laterais de lisina, arginina e histidina [T.E. Creighton, Proteins: Structure and Molecular Properties, W.H. Freeman & Co., San Francisco, p. 79-86 (1983)], acetilação da amina do terminal N e amidação de qualquer grupo carboxilo do terminal C.

Outro tipo de modificação covalente do polipéptido PR07168 abrangida pelo âmbito do presente invento, compreende alterar o padrão de glicosilação nativo do polipéptido. Pretende-se que "alterar o padrão de glicosilação nativo" para os 69 ΕΡ 1 623 989/ΡΤ presentes objectivos, signifique eliminar uma ou mais porções hidrato de carbono presentes na sequência PR07168 nativa (quer por remoção do local de glicosilação subjacente quer por deleção da glicosilação por meios químicos e/ou enzimáticos) e/ou adicionar um ou mais locais de glicosilação que não se encontram presentes na sequência PR07168 nativa. Adicionalmente, a expressão inclui mudanças qualitativas na glicosilação das proteínas nativas, envolvendo uma alteração da natureza e proporções das diferentes porções hidrato de carbono presentes. A adição de locais de glicosilação ao polipéptido PR07168 pode obter-se por alteração da sequência de aminoácidos. A alteração pode ser efectuada, por exemplo, pela adição de, ou substituição por, um mais resíduos de serina ou treonina no PR07168 de sequência nativa (para locais de glicosilação ligada a 0) . A sequência de aminoácidos de PR07168 pode ser opcionalmente alterada através de mudanças ao nível do ADN, nomeadamente por mutação do ADN que codifica o polipéptido PR07168 em bases pré-seleccionadas de modo a que sejam gerados codões que se traduzirão nos aminoácidos pretendidos.

Outro meio de aumentar o número de porções hidrato de carbono no polipéptido PR07168 é por acoplamento químico ou enzimático de glicósidos ao polipéptido. Tais métodos são descritos na especialidade, por exemplo, em WO 87/05330 publicado a 11 de Setembro de 1987 e em Aplin e Wriston, CRC Crit Rev. Biochem,, p. 259-306 (1981). A remoção de porções hidrato de carbono presentes no polipéptido PR07168 pode ser obtida química ou enzimaticamente ou por substituição por mutação de codões que codificam resíduos de aminoácidos que servem como alvos para glicosilação. São conhecidas na especialidade técnicas de desglicosilação química e descrevem-se, por exemplo, em Hakimuddin, et al., Arch. Biochem. Biophys., 259:52 (1987) e em Edge et al., Anal. Biochem., 118:131 (1981). A clivagem enzimática de porções hidrato de carbono em polipéptidos pode ser obtida por utilização de várias endoglicosidases e exoglicosidases tal como descritas por Thotakura et al., Meth. Enzymol., 138:350 (1987). 70 ΕΡ 1 623 989/ΡΤ

Outro tipo de modificação covalente de PR07168 inclui ligar o polipéptido PR07168 a um de entre vários polímeros não proteináceos, por exemplo, polietilenoglicol (PEG), polipropilenoglicol, ou polioxialquilenos do modo estabelecido nas patentes U.S. n.° 4 640 835; 4 496 689; 4 301 144; 4 670 417; 4 791 192 ou 4 179 337. O PR07168 do presente invento pode também ser modificado de modo a formar uma molécula quimérica incluindo PR07168 fundido a outro polipéptido ou sequência de aminoácidos heterólogos.

Numa concretização, estas moléculas quiméricas podem incluir uma fusão do PR07168 com um polipéptido marcador que proporciona um epítopo ao qual se pode ligar selectivamente um anticorpo anti-marcador. O marcador epitópico é geralmente colocado no terminal amino ou carboxilo do PR07168. A presença destas formas do PR07168 com marcador epitópico pode ser detectada utilizando um anticorpo contra o polipéptido marcador. Igualmente, a dotação com o marcador epitópico permite que o PR07168 seja facilmente purificado por purificação de afinidade utilizando um anticorpo anti-marcador ou outro tipo de matriz de afinidade que se liga ao marcador epitópico. São bem conhecidos na especialidade vários polipéptidos marcadores e seus respectivos anticorpos.

Constituem exemplos, entre outros, marcadores poli-histidina (poli-His) ou poli-histidina-glicina (poli-His-gly); o polipéptido marcador flu HA e o seu anticorpo 12CA5 [Field et al.f Mol. Cell. Biol , 8_: 2159—2165 (1988)]; o marcador c-myc e os seus anticorpos 8F9, 3C7, 6E10, G4, B7 e 9E10 [Evan et al., Molecular and Cellular Biology, 5_: 3610—3616 (1985)]; e o marcador da glicoproteína D (gD) do vírus Herpes Simplex e o seu anticorpo [Paborsky et al., Protein Engineering, 3(6):547-553 (1990)]. Outros marcadores polipeptídicos incluem o péptido Flag [Hopp et al., BioTechnology,6:1204-1210 (1988)]; o péptido epitópico KT3 [Martin et al., Science, 255:192-194 (1992)]; um péptido epitópico de α-tubulina [Skinner et al., J. Biol. Chem,, 266:15163-15166 (1991)]; e o marcador epitópico da proteína 10 do gene T7 [Lutz-Freyermuth et al., Proc. Natl. Acad. Sei. USA, 87:6393-6397 (1990)]. 71 ΕΡ 1 623 989/ΡΤ

Numa concretização alternativa, a molécula quimérica pode incluir uma fusão do PR07168 com uma imunoglobulina ou com uma região particular de uma imunoglobulina. Para uma forma bivalente da molécula quimérica (também referida como uma "imunoadesina"), uma tal fusão poderia ser com a região Fc de uma molécula de IgG. As fusões de Ig preferidas incluem a substituição de uma forma solúvel (domínio transmembranar eliminado ou inactivado) de um polipéptido PR07168 no lugar de pelo menos uma região variável no interior de uma molécula de Ig. Numa concretização especialmente preferida, a fusão de imunoglobulina inclui as regiões de charneira, CH2 e CH3 ou as regiões de charneira, CHl, CH2 e CH3 de uma molécula de igGl. Para a produção de fusões de imunoglobulina consultar igualmente a patente US n.° 5 428 130 concedida a 27 de Junho de 1995. D. Preparação de polipéptidos PRQ7168 A descrição adiante refere-se principalmente à produção de PR07168 por cultura de células transformadas ou transfectadas com um vector contendo ácido nucleico de PR07168. Considera-se obviamente que se podem utilizar métodos alternativos, que são conhecidos na especialidade, para preparar o PR07168. Por exemplo, a sequência de PR07168, ou suas porções, podem ser produzidas por síntese peptídica directa utilizando técnicas de fase sólida [consultar, por exemplo, Stewart et al., Solid-Phase Peptide Synthesis, w.H. Freeman Co., San Francisco, CA (1969); Merrifield, J, Am. Chem, Soc,, _85_: 2149-2154 (1963)].

Pode efectuar-se a síntese de proteínas in vitro utilizando técnicas manuais ou por meios automáticos. A síntese automatizada pode ser obtida, por exemplo, utilizando um sintetizador de péptidos da Applied Biosystems (Foster City, Califórnia) utilizando as instruções do fabricante. Várias porções do PR07168 podem ser sintetizadas quimicamente em separado e combinadas utilizando métodos químicos ou enzimáticos para produzir o PR07168 de comprimento completo. a. Isolamento de ADN que codifica um polipéptido PR07168

Pode obter-se ADN que codifica PR07168 a partir de uma biblioteca de ADNc preparada a partir de tecido que se pensa apresentar ARNm de PR07168 e expressá-lo a um nível 72 ΕΡ 1 623 989/ΡΤ detectável. Consequentemente, pode obter-se convenientemente ADN de PR07168 humano a partir de uma biblioteca de ADNc preparada a partir de tecido humano, tal como descrito nos exemplos. Pode também obter-se o gene que codifica PR07168 a partir de uma biblioteca genómica ou por síntese de oligonucleótidos.

As bibliotecas podem ser rastreadas com sondas (tais como anticorpos contra o polipéptido PR07168 ou oligonucleótidos com pelo menos cerca de 20-80 bases) concebidas para identificar o gene de interesse ou a proteína por ele codificada. O rastreio da biblioteca de ADNc ou genómica com a sonda seleccionada pode ser efectuada utilizando procedimentos padrão, tal como os descritos em Sambrook et ai., Molecular Cloning: A Laboratory Manual (New York: Cold Spring Harbor Laboratory Press, 1989). A utilização da metodologia de PCR é um modo alternativo de isolar o gene que codifica PR07168 [Sambrook et al., supra; Dieffenbach et al., PCR Primer: A Laboratory Manual (Cold Spring Harbor Laboratory Press, 1995)] .

Os exemplos adiante descrevem técnicas para rastreio de uma biblioteca de ADNc. As sequências de oligonucleótidos seleccionadas como sondas devem apresentar comprimento suficiente e devem ser suficientemente não ambíguas de modo a minimizar falsos positivos. O oligonucleótido é de preferência marcado de modo a poder ser detectado por hibridação com adn da biblioteca que está a ser rastreada. São bem conhecidos na especialidade métodos de marcação e incluem a utilização de marcadores radioactivos tais como ATP marcado com 32P, biotinilação ou marcação com enzima. Proporcionam-se as condições de hibridação, incluindo rigor moderado e rigor elevado, em Sambrook et al., supra.

As sequências identificadas em tais métodos de rastreio de biblioteca podem ser comparadas e alinhadas com outras sequências conhecidas depositadas e disponíveis em bases de dados públicas tais como GenBank ou outras bases de dados de sequências privadas. Pode determinar-se identidade de sequência (ao nível de aminoácido ou de nucleótido) no interior de regiões definidas da molécula ou ao longo da 73 ΕΡ 1 623 989/ΡΤ sequência de comprimento completo, utilizando métodos conhecidos na especialidade e tal como aqui descritos.

Podem obter-se ácidos nucleico apresentando sequências de codificação de proteina por rastreio de bibliotecas de ADNc ou genómicas seleccionadas utilizando a sequência de aminoácidos deduzida aqui revelada pela primeira vez e se necessário, utilizando procedimentos convencionais de extensão de iniciadores tal como descrito em Sambrook et al., supra, para detectar precursores e intermediários de processamento de ARNm que podem não ter sido submetidos a transcrição inversa para ADNc. b. Selecção e transformação de células hospedeiras

Transfectam-se ou transformam-se células hospedeiras com vectores de expressão ou clonagem aqui descritos para produção de PR07168 e cultiva-se em meio nutriente convencional modificado conforme apropriado para induzir promotores, seleccionar transformantes ou amplificar os genes que codificam as sequências pretendidas. As condições de cultura tais como meio, temperatura, pH e semelhantes podem ser seleccionadas pelo perito na especialidade sem experiências desnecessárias. De um modo geral, podem encontrar-se princípios, protocolos e técnicas práticas para maximizar a produtividade de culturas de células em Mammalian Cell Biotechnology: a Practical Approach, M. Butler, ed. (IRL

Press, 1991) e Sambrook et al., supra.

Os métodos de transfecção de células eucarióticas e transformação de células procarióticas são conhecidos do perito na especialidade, por exemplo, CaCl2, CaP04, mediada por lipossomas e electroporação. Dependendo da célula hospedeira utilizada, efectua-se transformação utilizando técnicas padrão apropriadas para tais células. Utiliza-se geralmente tratamento com cálcio que utiliza cloreto de cálcio, tal como descrito em Sambrook et al., supra, ou electroporação para procariotas. Utiliza-se infecção com Agrobacterium tumefaciens para transformação de determinadas células de planta, tal como descrita por Shaw et al., Gene, _23:315 (1983) e WO 89/05859 publicado a 29 de Junho de 1989. Para células de mamífero sem tais paredes celulares, pode 74 ΕΡ 1 623 989/ΡΤ utilizar-se ο método de precipitação com fosfato de cálcio de Graham e van der Eb, Virology, 52:456-457 (1978). Descreveram-se aspectos gerais de transfecções para sistema hospedeiro de células de mamífero na patente U.S. n.° 4 399 216. As transformações para levedura são tipicamente efectuadas de acordo com o método de Van Solingen et ai., J. Bact., 130:946 (1977) e Hsiao et ai., Proc. Natl. Acad. Sei. (USA), 7_6_;3829 (1979). Contudo, podem utilizar-se outros métodos para introduzir ADN em células, tais como por micro-injecção nuclear, electroporação, fusão de protoplasto bacteriano com células intactas ou policatiões, por exemplo, polibreno, poliornitina. Para diferentes técnicas para transformar células de mamífero, consultar, Keown et ai., Methods in Enzymology, 185:527-537 (1990) e Mansour et ai., Nature, 336:348-352 (1988).

As células hospedeiras adequadas para clonagem ou expressão do ADN nos vectores aqui referidos, incluem células de procariotas, levedura ou eucariotas superiores. Constituem procariotas adequados, entre outros, eubactérias, tais como organismos Gram-negativos ou Gram-positivos, por exemplo, Enterobacteriaceae tal como E. coli. Diferentes estirpes de E. coli encontram-se disponíveis ao público, tal como E. coli K12 estirpe MM294 (ATCC 31 446); E. coli X1776 (ATCC 31 537); E. coli estirpe W3110 (ATCC 27 325) e E. coli estirpe K5 772 (ATCC 53 635). Constituem outras células hospedeiras procarióticas adequadas, entre outras, Enterobacteriaceae tais como Escherichia, por exemplo, E. coli, Enterobacter, Erwinia, Klebsiella, Proteus, Salmonella, por exemplo, Salmonella typhimurium, Serratia, por exemplo, Serratia marcescans, e Shigella, assim como bacilos tais como B. subtilis e B. licheniformis (por exemplo, B. licheniformis 41P revelado em DD 266 710 publicado a 12 de Abril de 1989), Pseudomonas tal como P. aeruginosa e Streptomyces. Estes exemplos são ilustrativos e não limitativos. A estirpe W3110 constitui um hospedeiro ou hospedeiro parental particularmente preferido porque é uma estirpe hospedeira comum para fermentações de produtos de ADN recombinante. De preferência, a célula hospedeira excreta quantidades mínimas de enzimas proteolíticas. Por exemplo, a estirpe W3110 pode ser modificada para efectuar uma mutação genética nos genes que codificam proteínas endógenas ao hospedeiro, incluindo os 75 ΕΡ 1 623 989/ΡΤ exemplos de tais hospedeiros, entre outros, E. coli W3110 estirpe 1A2, que apresenta o genótipo completo tonA; E. coli W3110 estirpe 9E4, que apresenta o genótipo completo tonA ptr3; E. coli W3110 estirpe 27C7 (ATCC 55 244), que apresenta o genótipo completo tonA ptr3 phoA E15 (argF-lac)169 degP onepT kanr; E. coli W3110 estirpe 37D6, que apresenta o genótipo completo tonA ptr3 phoA E15 (argF-lac) 169 degP ompT rbsl ilvG kanr; E. coli W3110 estirpe 40B4, que é uma estirpe 37D6 com uma mutação de deleção degP com resistência não canamicina; e uma estirpe E. coli apresentando protease periplasmática mutante revelada na patente U.S. n.° 4 946 783 concedida a 7 de Agosto de 1990. Alternativamente, são adequados métodos in vitro de clonagem, por exemplo, PCR ou outras reacções de polimerização de ácidos nucleicos.

Além de procariotas, também micróbios eucarióticos tais como fungos filamentosos ou leveduras, são hospedeiros de clonagem ou expressão adequados para vectores de PR07168. A Saccharomyces cerevisiae é um microrganismo hospedeiro eucariota inferior habitualmente utilizado. Outros incluem Schizosaccharomyces pombe (Beach e Nurse, Nature, 290: 140 [1981]; EP 139 383 publicado a 2 de Maio de 1985); hospedeiros de Kluyveromyces (patente U.S. n.° 4 943 529; Fleer et al., Bio/Technology, 9:968-975 (1991)) tal como, por exemplo, K. lactis (MW98-8C, CBS683, CBS4574; Louvencourt et al., J.

Bacteriol., 737 [1983]). K. fragilis (ATCC 12 424), K. bulgaricus (ATCC 16 045), K. wickeramii (ATCC 24 178), K. waltii (ATCC 56 500), K. drosophilarum (ATCC 36 906; Vanden Berg et al., Bio/Technology, 8_:135 (1990)), K. thermotolerans e K. marxianus; yarrowia (EP 402 226); Pichia pastoris (EP 183 070; Sreekrishna et al., J. Basic Microbiol., 28:265-278 [1988]); Candida·, Trichoderma reesia (EP 244 234);

Neurospora crassa (Case et al., Proc. Natl. Acad. Sei. USA, 7_6:5259-5263 [1979]); Schwanniomyces tal como Schwanniomyces occidentalís (EP 394 538 publicado a 31 de Outubro de 1990); e fungos filamentosos tais como, por exemplo, Neurospora, Penicillium, Tolypocladium (WO 91/00357 publicado a 10 de Janeiro de 1991), e hospedeiros de Aspergillus tais como A. nidulans (Ballance et al., Biochem. Biophys. Res. Commun, 112:284-289 [1983]; Tilburn et al., Gene, 26:205-221 [1983]; Yelton et al., Proc. Natl. Acad. Sei. USA, 81:1470-1474 (1984)) e A. niger (Kelly e Hynes, EMBO J., _4:475-479 [1985]). 76 ΕΡ 1 623 989/ΡΤ São aqui adequadas leveduras metilotróficas e incluem, entre outras, leveduras capazes de crescer em metanol seleccionadas dos géneros que consistem de Hansenula, Candida, Kloeckera, Pichia, Saccharomyces, Torulopsis e Rhodotorula. Pode encontrar-se uma listagem de espécies especificas que constituem exemplos desta classe de leveduras em C. Anthony, The Biochemistry of Methylotrophs, 269 (1982) .

As células hospedeiras adequadas para a expressão de PR07168 glicosilado são derivadas a partir de organismos pluricelulares. Constituem exemplos de células de invertebrados, entre outras, células de insectos tais como Drosophila S2 e Spodoptera Sf9, assim como células de planta. Constituem exemplos de linhas celulares de mamífero hospedeiras, entre outras, células de ovário de hamster chinês (CHO) e células COS. Constituem exemplos mais específicos, entre outros, linha CVl de rim de macaco transformada com SV40 (COS-7, ATCC CRL 1651) ; linha de rim embrionário humano (células 293 ou 293 subclonadas para crescimento em cultura em suspensão, Graham et al., J. Gen. Virol., 36_:59 (1977)); células de ovário de hamster chinês/-DHFR (CHO), Urlaub e Chasin, Proc. Natl. Acad. Sei. USA, 1J_:A216 (1980)); células de Sertoli de ratinho (TM4, Mather, Biol. Reprod., 23:243-251 (1980)); células de pulmão humano (W138, ATCC CCL 75); células de figado humano (Hep G2, HB 8065); e tumor de mama de ratinho (MMT 060562, ATCC CCL51). Considera-se que a selecção da célula hospedeira apropriada se encontra abrangida pela pericia na especialidade. c. Selecção e utilização de um vector replicável O ácido nucleico (por exemplo, ADNc ou ADN genómico) que codifica PR07168 pode ser inserido num vector replicável para clonagem (amplificação do ADN) ou para expressão. Encontram-se disponíveis ao público vários vectores. O vector pode, por exemplo, estar sob a forma de um plasmideo, cosmideo, partícula virai ou fago. A sequência de ácido nucleico apropriada pode ser inserida no vector através de vários procedimentos. De um modo geral, insere-se o ADN em local(ais) apropriado(s) de uma endonuclease de restrição utilizando técnicas conhecidas na especialidade. As componentes do vector incluem geralmente, entre outras, uma ou mais sequências de 77 ΕΡ 1 623 989/ΡΤ sinal, uma origem de replicação, um ou mais genes marcadores, um elemento potenciador, um promotor e uma sequência de terminação de transcrição. A construção de vectores adequados contendo uma ou mais dessas componentes utiliza técnicas de ligação padrão que são conhecidas do perito na especialidade. 0 PR07168 pode ser produzido de modo recombinante não apenas directamente mas também na forma de um polipéptido de fusão com um polipéptido heterólogo, que pode ser uma sequência de sinal ou outro polipéptido apresentando um local de clivagem especifico no terminal N da proteina madura ou do polipéptido. De um modo geral, a sequência de sinal pode ser uma componente do vector ou pode ser uma parte do ADN de PR07168 que é inserida no vector. A sequência de sinal pode ser uma sequência de sinal procariótica seleccionada, por exemplo, do grupo de comandos de fosfatase alcalina, penicilinase, Ipp ou enterotoxina II estável ao calor. Para excreção de levedura a sequência de sinal pode ser, por exemplo, o comando de invertase de levedura, o comando de factor alfa (incluindo os comandos de factor α de Saccharomyces e Kluyveromyces, o último descrito em patente U.S. n.° 5 010 182) ou comando de fosfatase ácida, comando de glucoamilase de C. albicans (EP 362 179 publicado a 4 de Abril de 1990) ou a sequência de sinal descrita em WO 90/13646 publicado a 15 de Novembro de 1990. Para a expressão de células de mamífero, podem utilizar-se sequências de sinal de mamífero para dirigir a excreção da proteína, tais como sequências de sinal de polipéptidos excretados da mesma espécie ou de espécies relacionadas assim como comandos de excreção virais.

Ambos os vectores de expressão e clonagem contêm uma sequência de ácido nucleico que permite que o vector se replique em uma ou mais células hospedeiras seleccionadas. Tais sequências são bem conhecidas para várias bactérias, leveduras e vírus. A origem de replicação do plasmídeo pBR322 é adequada para a maioria das bactérias Gram-negativas, a origem de plasmídeo 2μ é adequada para levedura e diferentes origens de replicação virai (SV40, polioma, adenovírus, VSV ou BPV) são úteis para vectores de clonagem em células de mamífero. 78 ΕΡ 1 623 989/ΡΤ

Os vectores de expressão e clonagem conterão tipicamente um gene de selecção também denominado um marcador seleccionável. Os genes de selecção tipicos codificam proteinas que (a) conferem resistência a antibióticos ou outras toxinas, por exemplo, ampicilina, neomicina, metotrexato ou tetraciclina, (b) complementam deficiências auxotróficas, ou (c) fornecem nutrientes criticos não disponíveis a partir de meios complexos, por exemplo, o gene que codifica D-alanina racemase para bacilos.

Constituem um exemplo de marcadores de selecção adequados para células de mamífero, os que permitem a identificação de células competentes para assimilar o ácido nucleico de PR07168, tal como DHFR ou timidina-quinase. Constitui uma célula hospedeira apropriada quando se utiliza DHFR de tipo selvagem a linha celular CHO deficiente em actividade DHFR, preparada e propagada tal como descrito por Urlaub et ai., Proc. Natl. Acad. Sei. USA, 1J_:4216 (1980). Constitui um gene de selecção adequado para utilização em levedura, o gene trpl presente no plasmideo de levedura YRp7 [Stinchcomb et al., Nature, 282:39 (1979); Kingsman et al., Gene, ]_:141 (1979);

Tschemper et al., Gene, 1():157 (1980)]. O gene trpl proporciona um marcador de selecção para uma estirpe mutante de levedura que não apresenta a capacidade de crescer em triptofano, por exemplo, ATCC n.° 44076 ou PEP4-1 [Jones,

Genetics, 85_:12 (1977)].

Os vectores de expressão e clonagem contêm habitualmente um promotor ligado operativamente à sequência de ácido nucleico de PR07168 para dirigir a síntese de ARNm. São bem conhecidos promotores reconhecidos por várias células hospedeiras potenciais. Os promotores adequados para utilização com hospedeiros procarióticos incluem os sistemas promotores da β-lactamase e da lactose [Chang et al., Nature, 275:615(1978); Goeddel et al., Nature, 281:544 (1979)], da fosfatase alcalina, um sistema promotor do triptofano (trp) [Goeddel, Nucleic Acids Res., 8_:4057 (1980); EP 36 776] e promotores híbridos tais como o promotor tac [deBoer et al., Proc. Natl. Acad. Sei. USA, 8_0:21-25 (1983)]. Os promotores para utilização em sistemas bacterianos conterão também uma sequência de Shine-Dalgarno (S.D.) ligada operativamente ao ADN que codifica PR07168. 79 ΕΡ 1 623 989/ΡΤ

Os exemplos de sequências promotoras adequadas para utilização com hospedeiros de levedura incluem os promotores para 3-fosfoglicerato-quinase [Hitzeman et al., J. Biol. Chem., 255:2073 (1980)] ou outras enzimas glicoliticas [Hess et ai., J. Adv. Enzyme Reg., Ί_; 14 9 (1968); Holland, Biochemistry, 1_7:4900 (1978)], tal como enolase, gliceraldeido-3-fosfato-desidrogenase, hexoquinase, piruvato-descarboxilase, fosfofrutoquinase, glucose-6-fosfato-isomerase, 3-fosfoglicerato-mutase, piruvato-quinase, triosefosfato-isomerase, fosfoglucose-isomerase e glucoquinase.

Outros promotores de levedura, que são promotores indutiveis apresentando a vantagem adicional da transcrição ser controlada pelas condições de crescimento, são as regiões promotoras para álcool desidrogenase 2, isocitocromo C, fosfatase ácida, enzimas de degradação associadas com o metabolismo do azoto, metalotioneina, gliceraldeído-3-fosfato-desidrogenase e enzimas responsáveis pela utilização de maltose e galactose. Descrevem-se adicionalmente vectores e promotores adequados para utilização em expressão em levedura em EP 73 657. A transcrição de PR07168 a partir de vectores em células hospedeiras de mamífero é controlada, por exemplo, por promotores obtidos a partir de genomas de vírus tais como vírus do polioma, vírus da varíola aviária (UK 2 211 504 publicado a 5 de Julho de 1989), adenovírus (tal como Adenovírus 2), vírus do papiloma bovino, vírus do sarcoma aviário, citomegalovírus, um retrovírus, vírus de hepatite B e vírus símio 40 (SV40), de promotores de mamífero heterólogos, por exemplo, o promotor de actina ou um promotor de imunoglobulina e de promotores de choque térmico, desde que tais promotores sejam compatíveis com os sistemas da célula hospedeira. A transcrição de um ADN que codifica o PR07168 por eucariotas superiores pode ser aumentada pela inserção no vector de uma sequência potenciadora. Os potenciadores são elementos de ADN actuantes em eis habitualmente com cerca de 10 a 300 pb, que actuam num promotor para aumentar a sua 80 ΕΡ 1 623 989/ΡΤ transcrição. São actualmente conhecidas muitas sequências potenciadoras de genes de mamífero (globina, elastase, albumina, α-fetoproteína e insulina). Tipicamente, contudo, utilizar-se-á um potenciador de um vírus de célula eucariótica. Os exemplos incluem o potenciador de SV40 do lado tardio da origem de replicação (pb 100-270), o potenciador do promotor precoce de citomegalovírus, o potenciador de polioma do lado tardio da origem de replicação e potenciadores de adenovírus. O potenciador pode sofrer splicing no vector numa posição 5' ou 3' relativamente à sequência de codificação do PR07168, mas localiza-se de preferência num local a 5' do promotor.

Os vectores de expressão utilizados em células hospedeiras eucarióticas (células de levedura, fungo, insecto, planta, animal, humano ou células nucleadas de outros organismos pluricelulares) conterão igualmente sequências necessárias para terminação de transcrição e para estabilização de ARNm. Tais sequências estão habitualmente disponíveis a partir das regiões não traduzidas a 5' e ocasionalmente a 3' de ADN ou ADNc eucariótico ou virai. Estas regiões contêm segmentos de nucleótidos transcritos como fragmentos poliadenilados na porção não traduzida do ARNm que codifica PR07168.

Descrevem-se ainda outros métodos, vectores e células hospedeiras adequados para adaptação à síntese de PR07168 em cultura de células de vertebrado recombinantes em Gething et al., Nature, 293:620-625 (1981); Mantei et al.r Nature, 281:40-46 (1979); EP 117 060; e EP 117 058. d. Detecção de amplificação/expressão qénica A amplificação e/ou expressão génica pode ser medida numa amostra directamente, por exemplo, por hibridação de Southern convencional, hibridação de Northern para quantificar a transcrição de ARNm [Thomas, Proc. Natl, Acad. Sei. USA, 22:5201-5205 (1980)], hibridação "dot blot" (análise de adn) , ou hibridação in situ utilizando uma sonda adequadamente marcada com base nas sequências aqui proporcionadas. Alternativamente, podem utilizar-se anticorpos que podem reconhecer cadeias duplas específicas, incluindo cadeias duplas de ADN, cadeias duplas de ARN e cadeias duplas híbridas 81 ΕΡ 1 623 989/ΡΤ ADN-ARN ou cadeias duplas ADN-proteína. Os anticorpos podem por sua vez ser marcados e o ensaio pode ser efectuado no local em que a cadeia dupla se encontra ligada a uma superfície, de modo a que após formação de uma cadeia dupla na superfície se possa detectar a presença de um anticorpo ligado à cadeia dupla.

Alternativamente, a expressão génica pode ser medida por métodos imunológicos, tal como coloração imuno-histoquímica de células ou secções de tecido e ensaio de cultura de células ou fluidos corporais para quantificar directamente a expressão de produto génico. Os anticorpos úteis para coloração imuno-histoquímica e/ou ensaio de fluidos de amostra podem ser quer monoclonais quer policlonais e podem ser preparado em qualquer mamífero. Convenientemente, os anticorpos podem ser preparados contra um polipéptido PR07168 de sequência nativa ou contra um péptido sintético baseado nas sequências de ADN aqui proporcionadas ou contra uma sequência exógena fundida com ADN de PR07168 e codificando para um epítopo de anticorpo específico. e. Purificação do polipéptido

Podem recuperar-se formas de PR07168 do meio de cultura ou de Usados da célula hospedeira. Se estiverem ligadas à membrana podem ser libertadas da membrana utilizando uma solução de detergente adequada (por exemplo, Triton-x 100) ou por clivagem enzimática. As células utilizadas para expressão de PR07168 podem ser rompidas por diferentes meios físicos ou químicos tais como ciclos de congelamento-descongelamento, tratamento com ultra-sons, ruptura mecânica ou agentes de lise de células.

Pode pretender-se purificar PR07168 a partir de proteínas ou polipéptidos de células recombinantes. Os seguintes procedimentos constituem exemplos de procedimentos de purificação adequados: fraccionamento numa coluna de permuta iónica; precipitação com etanol; HPLC em fase inversa; cromatografia em sílica ou numa resina de permuta catiónica tal como DEAE; cromatofocagem; SDS-PAGE; precipitação com sulfato de amónio; filtração em gel utilizando, por exemplo, Sephadex G-75; colunas de proteína A-Sepharose para remover 82 ΕΡ 1 623 989/ΡΤ contaminantes tais como igG; e colunas quelantes de metais para ligar formas marcadas com epitopo do PR07168. Podem utilizar-se diferentes métodos de purificação de proteínas e tais métodos são conhecidos na especialidade e estão descritos por exemplo em Deutscher, Methods in Enzymology, 182 (1990);

Scopes, Protein Purification: Principies and Practice, Springer-Verlag, New York (1982). A(s) etapa(s) de purificação seleccionada(s) dependerão, por exemplo, da natureza do processo de produção utilizado e do PR07168 particular produzido. E. Amplificação de genes que codificam polipéptidos PR07168 em células tumorais e linhas celulares O presente invento baseia-se na identificação e caracterização de genes que são amplificados em determinadas células de cancro. O genoma de organismos procarióticos e eucarióticos está sujeito a dois requisitos aparentemente contraditórios. Um é a preservação e propagação do ADN como informação genética na sua forma original para garantir herança estável através de várias gerações. Por outro lado, as células ou organismos devem ser capazes de se adaptarem de modo a resistirem a alterações ambientais. Os mecanismos de adaptação podem incluir modificações qualitativas ou quantitativas do material genético. As modificações qualitativas incluem mutações de adn nas quais sequências de codificação são alteradas o que resulta numa proteína estrutural e/ou funcionalmente diferente. A amplificação génica é uma modificação quantitativa pela qual o número real de sequências de codificação de comprimento completo, ou seja, de genes, aumenta, o que leva a um número aumentado de moldes disponíveis para transcrição, um número aumentado de produtos de transcrição para traduzir e por último a uma abundância aumentada da proteína que é codificada pelo gene amplificado. O fenómeno de amplificação génica e os seus mecanismos subjacentes têm sido investigados in vitro em vários sistemas de cultura procarióticos e eucarióticos. O exemplo melhor caracterizado de amplificação génica envolve a cultura de células eucarióticas num meio contendo concentrações variáveis 83 ΕΡ 1 623 989/ΡΤ do fármaco citotóxico metotrexato (MTX). MTX é um análogo do ácido fólico e interfere com a síntese de ADN por bloqueio da enzima di-hidrofolato-redutase (DHFR). Durante a exposição inicial a concentrações baixas de MTX a maioria das células (>99,9%) morrerá. Um pequeno número de células sobrevive e são capazes de crescer em concentrações crescentes de MTX através da produção de grandes quantidades de ARN e proteína DHFR. A base desta sobre-produção é a amplificação do gene DHFR único. As cópias adicionais do gene encontram-se sob a forma de cópias extracromossómicas sob a forma de cromossomas pequenos e supranumerários (diminutos duplos) ou como cópias cromossómicas integradas. A amplificação génica encontra-se mais habitualmente no desenvolvimento de resistência a fármacos citotóxicos (antibióticos para bactérias e agentes quimioterapêuticos para células eucarióticas) e transformação neoplásica. A transformação de uma célula eucariótica como um evento espontâneo ou devido a um insulto virai ou químico/ambiental está tipicamente associada a alterações do material genético dessa célula. Uma das alterações genéticas mais comummente observadas em malignidades humanas consiste em mutações da proteína p53. p53 controla a transição de células de uma fase estacionária (Gl) para replicativa (S) e evita esta transição na presença de danos do ADN. Noutras palavras, uma das principais consequências da desactivação de mutações p53 é a acumulação e propagação de danos de ADN, ou seja, alterações genéticas. Constituem tipos vulgares de alterações genéticas em células neoplásicas, além de mutações pontuais, amplificações e alterações estruturais grosseiras tais como translocações. A amplificação de sequências de ADN pode indicar um requisito funcional especifico tal como ilustrado no sistema experimental DHFR. Assim, a amplificação de determinados oncogenes em malignidades indica um efeito causador desses genes no processo de transformação maligna e manutenção do fenótipo transformado. Estudos recentes têm apoiado esta hipótese. Por exemplo, revelou-se que a proteina bcl-2 era amplificada em determinados tipos de linfoma não Hodgkin. Esta proteina inibe a apoptose e leva à acumulação progressiva de células neoplásicas. Tem-se verificado que membros da família 84 ΕΡ 1 623 989/ΡΤ génica de receptores de factores de crescimento são amplificados em vários tipos de cancros o que sugere que a sobre-expressão desses receptores pode fazer com que as células neoplásicas sejam menos susceptíveis a quantidades limitantes de factor de crescimento disponível. Constituem exemplos, entre outros, a amplificação de um receptor de androgénio no cancro da próstata recorrente durante terapia de privação de androgénio e a amplificação do homólogo do receptor de factor de crescimento ERB2 em cancro da mama. Por último, os genes envolvidos em sinalização intracelular e controlo da progressão do ciclo celular podem sofrer amplificação durante transformação maligna. Tal é ilustrado pela amplificação dos genes bcl-I e ras em diferentes neoplasmas epiteliais e linfóides.

Estes estudos anteriores ilustram a possibilidade de efectuar identificação de sequências de ADN amplificadas em neoplasmas, dado que esta abordagem pode identificar genes importantes para transformação maligna. 0 caso de ERB2 também demonstra a possibilidade de o fazer de um ponto de vista terapêutico, dado que as proteínas de transformação podem representar alvos novos e específicos para terapia de tumor.

Podem utilizar-se várias técnicas diferentes para demonstrar sequências genómicas amplificadas. A análise citogenética clássica das preparações de cromossoma preparadas a partir de células de cancro é adequada para identificar alterações estruturais grosseiras, tal como translocações, deleções e inversões. As regiões genómicas amplificadas podem apenas ser visualizadas caso envolvam regiões extensas com número de cópias elevado ou estejam presentes como material extra-cromossómico. Apesar da citogenética ter sido a primeira técnica que demonstrou uma associação consistente de alterações cromossómicas especificas com neoplasmas específicos, não é adequada para a identificação e isolamento de sequências de ADN manipuláveis. A técnica mais recentemente desenvolvida de hibridação genómica comparativa (CGH) ilustrou o fenómeno amplamente difundido de amplificação genómica em neoplasmas. Os ADN de tumor e normal são hibridados simultaneamente com metafases de células normais e o genoma completo pode ser rastreado por análise de imagem para sequências de ADN que se encontram presentes no tumor com uma 85 ΕΡ 1 623 989/ΡΤ frequência aumentada. (W093/18 186; Gray et al., Radiation Res., 137:275-289 [1994]). Como um método de rastreio, este tipo de análise revelou um número elevado de amplicões (uma extensão de ADN amplificado) recorrentes em vários neoplasmas humanos. Apesar de CGH ser mais sensível do que a análise citogenética clássica para a identificação de extensões amplificadas de ADN, aquela técnica não permite uma identificação e isolamento rápidos de sequências de codificação no interior do amplicão por técnicas de genética molecular padrão.

Os métodos mais sensíveis para detectar amplificação génica são os ensaios baseados na reacção de polimerização em cadeia (PCR). Estes ensaios utilizam uma quantidade muito pequena de ADN de tumor como material de partida, são extremamente sensíveis, proporcionam ADN que é passivel de análise posterior tal como sequenciação e são adequados para análise de elevada quantidade e rendimento.

Os ensaio acima mencionados não são mutuamente exclusivos, mas são frequentemente utilizados em combinação para identificar amplificações em neoplasmas. Enquanto que a análise citogenética e CGH representam métodos de rastreio para analisar o genoma completo para regiões amplificadas, os ensaios baseados em PCR são mais adequados para identificação final de sequências de codificação, ou seja, genes em regiões amplificadas.

De acordo com o presente invento tais genes têm sido identificados por PCR quantitativo (S. Gelmini et al., Clin. Chem., 43_:752 [1997]) por comparação de ADN proveniente de vários tumores primários, incluindo tumor de mama, pulmão, cólon, próstata, cérebro, figado, rim, pâncreas, baço, timo, testículos, ovário, útero, etc. ou linhas celulares de tumor com ADN recolhido de dadores saudáveis. Efectuou-se PCR quantitativo utilizando um instrumento TaqMan™ (ABI). Conceberam-se iniciadores e sondas fluorigénicas específicas de gene com base nas sequências de codificação dos ADN.

As linhas de células de carcinoma do pulmão humano incluem A549 (SRCC768), Calu-1 (SRCC769), Calu-6 (SRCC770), H157 (SRCC771), H441 (SRCC772), H460 (SRCC773), SKMES-1 (SRCC774), 86 ΕΡ 1 623 989/ΡΤ SW900 (SRCC775) , Η522 (SRCC832),e Η810 (SRCC833) , todas disponíveis na ATCC. As células de tumor do pulmão humano primário usualmente derivam de adenocarcinomas, carcinomas de células escamosas, carcinomas de células grandes, carcinomas de células não pequenas, carcinomas de células pequenas, e carcinomas bronco-alveolares, e incluem, por exemplo, SRCC724 (adenocarcinoma, abreviado para "AdenoCa")(LTl), SRCC725 (carcinoma de células escamosas, abreviado para "SqCCa)(LTla), SRCC726 (adenocarcinoma)(LT2), SRCC727 (adenocarcinoma)(LT3), SRCC728 (adenocarcinoma)(LT4), SRCC729 (carcinoma de células escamosas)(LT6), SRCC730 (adeno/carcinoma de células escamosas) (LT7), SRCC731 (adenocarcinoma) (LT9), SRCC732 (carcinoma de células escamosas)(LT10), SRCC733 (carcinoma de células escamosas)(LT11), SRCC734 (adenocarcinoma)(LT12), SRCC735 (adeno/carcinoma de células escamosas)(LT13), SRCC736 (carcinoma de células escamosas)(LT15), SRCC737 (carcinoma de células escamosas)(LT16), SRCC738 (carcinoma de células escamosas)(LT17), SRCC739 (carcinoma de células escamosas)(LT18), SRCC740 (carcinoma de células escamosas) (LT19), SRCC741 (carcinoma de células do pulmão, abreviado para "LCCa")(LT21), SRCC811 (adenocarcinoma)(LT22), SRCC825 (adenocarcinoma)(LT8), SRCC886 (adenocarcinoma)(LT25), SRCC887 (carcinoma de células escamosas) (LT26), SRCC888 (adeno-BAC carcinoma) (LT27), SRCC889 (carcinoma de células escamosas) (LT28), SRCC890 (carcinoma de células escamosas) (LT29), SRCC891 (adenocarcinoma) (LT30), SRCC892 (carcinoma de células escamosas) (LT31), SRCC894 (adenocarcinoma) (LT33). Estão também incluídos os tumores do pulmão humanos designados por SRCC1125 [HF-000631], SRCC1127 [HF-000641] , SRCC1129 [HF-000643], SRCC1133 [HF-000840], SRCC1135 [HF-000842], SRCC1227 [HF-001291], SRCC1229 [HF-001293], SRCC1230 [HF-001294] , SRCC1231 [HF-001295], SRCC1232 [HF-001296], SRCC1233 [HF-001297], SRCC1235 [HF-001299] e SRCC1236 [HF-001300] .

As linhas de células de cancro do cólon incluem, por exemplo, as linhas de células da ATCC SW480 (adenocarcinoma, SRCC776). SW620 (metástases nos nódulos linfáticos do adenocarcinoma do cólon, SRCC777), Colo320 (carcinoma, SRCC778), HT29 (adenocarcinoma, SRCC779), HM7 (uma variante produtor de mucina com alto rendimento da linha de células de adenocarcinoma do cólon da ATCC, SRCC780, obtida do Dr. Robert 87 ΕΡ 1 623 989/ΡΤ

Warren, UCSF), CaWiDr (adenocarcinoma, SRCC781 HCT116 (carcinoma, SRCC782), SKCOl (adenocarcinoma, SRCC783), SW403 (adenocarcinoma, SRCC784), LS174T (carcinoma, SRCC785), Colo205 (carcinoma, SRCC828), HCT15 (carcinoma, SRCC829), HCC2998 (carcinoma, SRCC830), e KM12 (carcinoma, SRCC831) . Os tumores do cólon primários incluem os adenocarcinomas do cólon designados por CT2 (SRCC742), CT3 (SRCC743), CT8 (SRCC744), CT10 (SRCC745), CT12 (SRCC746) , CT14 (SRCC747), CT15 (SRCC748), CT16 (SRCC749) , CT17 (SRCC750), CTl (SRCC751) , CT4 (SRCC752) , CT5 (SRCC753), CT6 (SRCC754) , CT7 (SRCC755), CT9 (SRCC756), CT11 (SRCC757), CT18 (SRCC758) , CT19 (adenocarcinoma, SRCC906), CT20 (adenocarcinoma, SRCC907), CT21 (adenocarcinoma, SRCC908), CT22 (adenocarcinoma, SRCC909), CT23 (adenocarcinoma, SRCC910), CT24 (adenocarcinoma, SRCC911), CT25 (adenocarcinoma, SRCC912), CT26 (adenocarcinoma, SRCC913), CT27 (adenocarcinoma, SRCC914), CT28 (adenocarcinoma, SRCC915), CT29 (adenocarcinoma, SRCC916), CT30 (adenocarcinoma, SRCC917), CT31 (adenocarcinoma, SRCC918), CT32 (adenocarcinoma, SRCC919), CT33 (adenocarcinoma, SRCC920), CT35 (adenocarcinoma, SRCC921), e CT36 (adenocarcinoma, SRCC922). Estão também incluídos centros de tumor do cólon humanos designados SRCC1051 [HF-000499], SRCC1052 [HF-000539], SRCC1053 [HF-000575], SRCC1054 [HF-000698], SRCC1059 [HF-000755], SRCC1060 [HF-000756], SRCC1142 [HF-000762], SRCC1144 [HF-000789], SRCC1146 [HF-000795] e SRCC1148 [HF-000811].

As linhas de células de carcinoma da mama humano incluem, por exemplo, HBL100 (SRCC759), MB435s (SRCC760), T47D (SRCC761), MB468 (SRCC762), MB175 (SRCC763), MB361 (SRCC764), BT20 (SRCC765), MCF7 (SRCC766) e SKBR3 (SRCC767), e o centro de tumor da mama humano designado SRCC1057 [HF-000545]. Estão também incluídos os tumores da mama humanos designados por SRCC1094, SRCC1095, SRCC1096, SRCC1097, SRCC1098, SRCC1099, SRCC1100, SRCC1101 e o tumor mama-met-pulmão-NS humano designado por SRCC893 [LT32].

Os tumores do recto humanos incluem SRCC981 [HF-000550] e SRCC982 [HF-000551]. 88 ΕΡ 1 623 989/ΡΤ

Os centros de tumor do rim humano incluem SRCC989 [HF-000611] e SRCC1014 [HF-000613]. 0 centro de tumor dos testículos humano inclui SRCC1001 [HF-000733] e a margem de tumor dos testículos SRCC999 [HF-000716] .

Os tumores da paratiróide humanos incluem SRCC1002 [HF — 000831] e SRCC1003 [HF-000832] .

Os tumores dos nódulos linfáticos humanos incluem SRCC1004 [HF-000854], SRCC1005 [HF-000855] eSRCC1006 [HF-000856]. F. Distribuição tissular

Os resultados dos presentes ensaios de amplificação génica podem ser verificados por estudos adicionais, tal como, por determinação de expressão de ARNm em diferentes tecidos humanos.

Tal como referido acima, pode medir-se amplificação génica e/ou expressão génica em diferentes tecidos por hibridação de Southern convencional, hibridação de Northern para quantificar a transcrição de ARNm (Thomas, Proc. Natl. Acad. Sei. USA, 7_7;5201-5205 [1980]), hibridação dot blot (análise de ADN) ou hibridação in situ utilizando uma sonda adequadamente marcada com base nas sequências aqui proporcionadas. Alternativamente, podem utilizar-se anticorpos que podem reconhecer cadeias duplas específicas, incluindo cadeias duplas de ADN, cadeias duplas de ARN e cadeias duplas híbridas ADN-ARN ou cadeias duplas ADN-proteína. A expressão génica em diferentes tecidos pode ser alternativamente medida por métodos imunológicos tais como coloração imuno-histoquímica de secções de tecido e ensaio de cultura de células ou fluidos corporais, para quantificar directamente a expressão de produto génico. Os anticorpos úteis para coloração imuno-histoquímica e/ou ensaio de fluidos de amostra podem ser quer monoclonais quer policlonais e podem ser preparados em qualquer mamífero. Convenientemente, os anticorpos podem ser preparados contra uma sequência de polipéptido PR07168 nativa ou contra um péptido sintético 89 ΕΡ 1 623 989/ΡΤ baseado nas sequências de ADN aqui proporcionadas ou contra uma sequência exógena fundida com a sequência de ADN de PR07168 e que codifica para um epitopo de anticorpo especifico. Proporcionam-se aqui adiante técnicas gerais para gerar anticorpos e protocolos especiais para hibridação de Northern e hibridação in situ. G. Mapeamento de cromossomas

Se a amplificação de um determinado gene é funcionalmente relevante, então esse gene deve ser mais amplificado do que as regiões genómicas vizinhas que não são importantes para a sobrevivência do tumor. Para ensaiar esta hipótese o gene pode ser mapeado num cromossoma especifico, por exemplo, por análise de híbrido de radiação. 0 nível de amplificação é então determinado na localização identificada e na região genómica vizinha. A amplificação selectiva ou preferencial numa região genómica para a qual o gene foi mapeado é consistente com a possibilidade da amplificação génica observada promover crescimento ou sobrevivência de tumor. 0 mapeamento de cromossoma inclui tanto mapeamento de esqueleto como de epicentro. Para detalhes adicionais consultar, por exemplo, Stewart et al., Genome Research, 1_\A22-A33 (1997). H. Estudos de ligação de anticorpos

Os resultados do estudo de amplificação génica podem ser adicionalmente verificados por estudos de ligação de anticorpo nos quais se ensaia a capacidade de anticorpos anti-PR07168 inibirem a expressão de polipéptidos PR07168 em células tumorais (cancro). Os exemplos de anticorpos incluem anticorpos policlonais, monoclonais, humanizados, biespecíficos e heteroconjugados cuja preparação será aqui descrita adiante.

Os estudos de ligação de anticorpos podem ser efectuados segundo qualquer método de ensaio conhecido, tal como ensaios de ligação competitiva, ensaios em sanduíche directos ou indirectos e ensaios de imunoprecipitação. Zola, Monoclonal Antibodies: A Manual of Techniques, p. 147-158 (CRC Press,

Inc., 1987). 90 ΕΡ 1 623 989/ΡΤ

Os ensaios de ligação competitiva baseiam-se na capacidade de um padrão marcado competir com o analito da amostra de teste relativamente a ligação com uma quantidade limitada de anticorpo. A quantidade de proteína alvo (codificada por um gene amplificado numa célula tumoral) na amostra de teste é inversamente proporcional à quantidade de padrão que se liga aos anticorpos. Para facilitar a determinação da quantidade de padrão que se liga, os anticorpos são de preferência insolubilizados antes ou após a competição de modo a que o padrão e o analito que estão ligados aos anticorpos possam ser convenientemente separados do padrão e analito que permanecem não ligados.

Os ensaios em sanduíche envolvem a utilização de dois anticorpos sendo cada um capaz de se ligar a uma porção imunogénica ou epítopo diferentes da proteína a detectar. Num ensaio em sanduíche o analito da amostra de teste liga-se a um primeiro anticorpo que está imobilizado num suporte sólido e seguidamente liga-se um segundo anticorpo ao analito, formando assim um complexo tripartido insolúvel. Consultar, por exemplo, patente U.S. n.° 4 376 110. O segundo anticorpo pode estar ele próprio marcado com uma porção detectável (ensaio em sanduíche directo) ou pode ser medido utilizando um anticorpo anti-imunoglobulina que está marcado com uma porção detectável (ensaio em sanduíche indirecto). Por exemplo, um ensaio ELISA consiste num tipo de ensaio em sanduíche em que a porção detectável é uma enzima.

Para imuno-histoquímica, a amostra de tumor pode ser fresca ou congelada ou pode estar embebida em parafina e fixada com um conservante tal como formalina, por exemplo. I. Ensaios de tumores baseados em células

Os ensaios baseados em células e modelos animais para tumores (por exemplo, cancros) podem ser utilizados para verificar as revelações do ensaio de amplificação génica e compreender adicionalmente a relação entre os genes aqui identificados e o desenvolvimento e patogénese do crescimento celular neoplásico. O papel de produtos génicos aqui identificados no desenvolvimento e patologia de tumor ou cancro pode ser ensaiado utilizando células de tumor primário 91 ΕΡ 1 623 989/ΡΤ ou linhas celulares que se identificaram como capazes de amplificar os presentes genes. Tais células incluem, por exemplo, células de cancro de mama, cólon e pulmão e as linhas celulares referidas acima.

Numa abordagem diferente, células de um tipo celular que se sabe estar envolvido num tumor especifico são transfectadas com os presentes ADNc e analisa-se a capacidade destes ADNc induzirem crescimento excessivo. Constituem células adequadas, entre outras, por exemplo, células de linhas tumorais estáveis tais como a linha celular B104-1-1 (linha celular estável NIH-3T3 transfectada com o proto-oncogene neu) e células NIH-3T3 transfectadas com ras que podem ser transfectadas com o gene pretendido e monitorizadas relativamente a crescimento tumorigénico. Tais linhas celulares transfectadas podem então ser utilizadas para ensaiar a capacidade de anticorpos policlonais ou monoclonais ou composições de anticorpos inibirem crescimento celular tumorigénico exercendo actividades citostática ou citotóxica sobre o crescimento das células transformadas ou mediando citotoxicidade celular dependente de anticorpo (ADCC). As células transfectadas com as sequências de codificação dos genes aqui identificados podem ser adicionalmente utilizadas para identificar candidatos a fármacos para o tratamento de cancro.

Adicionalmente, podem utilizar-se culturas primárias derivadas de tumores em animais transgénicos (tal como descrito adiante) nos presentes ensaios baseados em células, apesar de se preferirem linhas celulares estáveis. São bem conhecidas na especialidade técnicas para derivar linhas celulares continuas a partir de animais transgénicos (consultar, por exemplo, Small et al., Mol, Cell. Biol., 5:642-648 [1985]). J. Modelos animais

Podem utilizar-se vários modelos animais bem conhecidos para entender adicionalmente o papel dos genes aqui identificados no desenvolvimento e patogénese de tumores e para ensaiar a eficácia de agentes terapêuticos candidatos, incluindo anticorpos e outros antagonistas dos polipéptidos nativos, incluindo antagonistas de moléculas pequenas. A 92 ΕΡ 1 623 989/ΡΤ natureza ίη vivo de tais modelos torna-os adequados para previsão de respostas em doentes humanos. Os modelos animais de tumores e cancros (por exemplo, cancro de mama, cancro de cólon, cancro de próstata, cancro de pulmão, etc.) incluem animais (transgénicos) tanto não recombinantes como recombinantes. Os modelos animais não recombinantes incluem, por exemplo, roedores, por exemplo, modelos murinos. Tais modelos podem ser gerados introduzindo células tumorais em ratinhos singenésicos utilizando técnicas padrão, por exemplo, injecção subcutânea, injecção na veia da cauda, implante no baço, implante intraperitoneal, implante sob a cápsula renal ou implante "Orthopin", por exemplo, células de cancro de cólon implantadas em tecido de cólon. (Consultar, por exemplo, publicação PCT n.° WO 97/33551, publicado a 18 de Setembro de 1997).

Provavelmente, a espécie animal mais habitualmente utilizada em estudos oncológicos é a de ratinhos imunodeficientes, em particular, ratinhos nus. A observação que ratinhos nus com hipoplasia/aplasia podem funcionar com sucesso como hospedeiros de xenoenxertos de tumores humanos, levou à vulgarização da sua utilização com este objectivo. 0 gene nu autossómico recessivo foi introduzido num grande número de estirpes recombinantes diferentes de ratinhos nus, incluindo, por exemplo, ASW, A/He, AKR, BALB/c, B10.LP, C17, C3H, C57BL, C57, CBA, DBA, DDD, I/st, NC, NFR, NFS, NFS/N, nzb, NZC, NZW, P, RIU e S JL. Além disso, têm-se criado e utilizado uma grande variedade de outros animais com deficiências imunológicas herdadas, diferentes de ratinhos nus, como recebedores de xenoenxertos de tumor. Para detalhes adicionais consultar, por exemplo, The Nude Mouse in Oncoloqy Research, E. Boven e B. Winograd, ed., CRC Press, Inc., 1991.

As células introduzidas em tais animais podem ser derivadas de linhas celulares conhecidas de tumor/cancro, tal como qualquer das linhas celulares de tumor descritas acima e por exemplo, a linha celular B104-1-1 (linha celular NIH-3T3 estável transfectada com o proto-oncogene neu); células NIH-3T3 transfectadas com ras; Caco-2 (ATCC HTB-37); uma linha celular de adenocarcinoma de cólon humano moderadamente bem diferenciada de grau II, HT-29 (ATCC HTB-38) ou de tumores e cancros. Podem obter-se amostras de tumores ou células de 93 ΕΡ 1 623 989/ΡΤ cancro a partir de doentes submetidos a intervenção cirúrgica, utilizando condições padrão envolvendo congelamento e armazenagem em azoto liquido (Karmali et al., Br. J. Câncer, 48: 689-696 [1983]) .

Podem introduzir-se células tumorais em animais, tal com ratinhos nus, através de vários procedimentos. 0 espaço subcutâneo (s.c.) do ratinho é muito adequado para implante de tumor. Os tumores podem ser transplantados s.c. como blocos sólidos, como biópsias efectuadas com agulha por utilização de uma troca ou como suspensões celulares. Para implante de bloco sólido ou de troca, introduzem-se fragmentos de tecido de tumor de tamanho adequado no espaço s.c.. As suspensões celulares são preparadas de fresco a partir de tumores primários ou linhas celulares de tumor estáveis e injectadas por via subcutânea. As células tumorais podem também ser injectadas como implantes subdérmicos. Nesta localização, deposita-se o inoculo entre a parte inferior do tecido conjuntivo dérmico e o tecido s.c.. Boven e Winograd (1991), supra.

Podem gerar-se modelos animais de cancro de mama, por exemplo, por implante de células de neuroblastoma de rato (das quais se isolou inicialmente o oncogene neu) ou de células NIH-3T3 transformadas com neu em ratinhos nus, essencialmente como descrito por Drebin et al., PNAS USA, 83:9129-9133 (1986) .

De igual modo, podem gerar-se modelos animais de cancro de cólon por passagem de células de cancro de cólon para animais, por exemplo, ratinhos nus, levando ao aparecimento de tumores nesses animais. Descreveu-se um modelo de transplante ortotópico de cancro de cólon humano em ratinhos nus, por exemplo, em Wang et al., Câncer Research, 54:4726-4728 (1994) e Too et al., Câncer Research, 55:681-684 (1995). Este modelo baseia-se no denominado "METAMOUSE" vendido por AntiCancer, Inc., (San Diego, Califórnia).

Os tumores que ocorrem em animais podem ser removidos e cultivados in vitro. As células das culturas in vitro podem então ser passadas para animais. Tais tumores podem servir como alvos para ensaio posterior ou rastreio de fármacos. 94 ΕΡ 1 623 989/ΡΤ

Alternativamente, os tumores que resultam da passagem podem ser isolados e o ARN de células pré-passagem e de células isoladas após um ou mais ciclos de passagem pode ser analisado relativamente a expressão diferencial de genes de interesse. Tais técnicas de passagem podem ser efectuadas com quaisquer linhas celulares conhecidas de tumor ou cancro.

Por exemplo, Meth A, CMS4, CMS5, CMS21 e WEHI-164 são fibrossarcomas induzidos quimicamente em ratinhos fêmea balb/c (DeLeo et al., J. Exp, Med,, 146:720 [1977]), que proporcionam um sistema modelo altamente controlado para estudo de actividades antitumorais de diferentes agentes (Palladino et al., J. Immunol, 138:4023-4032 [1987]). Sucintamente, propagam-se células tumorais in vitro em cultura de células. Antes da injecção nos animais, lavam-se as linhas celulares e suspendem-se em tampão a um densidade celular de cerca de 10xl06 a 10xl07 células/ml. Os animais são então infectados por via subcutânea com 10 a 100 μΐ da suspensão celular, decorrendo uma a três semanas até aparecimento de um tumor.

Adicionalmente, o carcinoma de Lewis de pulmão (3LL) de ratinho, que é um dos tumores experimentais mais amplamente estudado, pode ser utilizado como modelo de tumor para investigação. A eficácia neste modelo de tumor foi correlacionada com efeitos benéficos no tratamento de doentes humanos diagnosticados com carcinoma de células pequenas do pulmão (SCCL). Este tumor pode ser introduzido em ratinhos normais por injecção de fragmentos de tumor de um ratinho afectado ou de células mantidas em cultura (Zupi et al., Br. J. Câncer, _41:supl. 4:309 [1980]) e a evidência experimental indica que podem ser iniciados tumores a partir de injecção de apenas uma célula e que uma grande proporção de células infectadas de tumor sobrevive. Para informação adicional sobre este modelo de tumor consultar Zacharski, Haemostasis, 16:300-320 [1986]).

Um modo de avaliar a eficácia de um composto de teste num modelo animal ou num tumor implantado consiste em medir a dimensão do tumor antes e após tratamento. Tradicionalmente, a dimensão de tumores implantados tem sido medida com uma craveira em duas ou três dimensões. A medição limitada a duas dimensões não reflecte rigorosamente a dimensão do tumor sendo 95 ΕΡ 1 623 989/ΡΤ que esta é habitualmente convertida no volume correspondente utilizando uma fórmula matemática. Contudo, a medição das dimensões do tumor é muito pouco rigorosa. Os efeitos terapêuticos de um fármaco candidato podem ser melhor descritos como atraso de crescimento e atraso de crescimento especifico induzidos pelo tratamento. Outra variável importante na descrição do crescimento do tumor é o tempo de duplicação do volume do tumor. Encontram-se igualmente disponíveis programas de computador para o cálculo e descrição de crescimento de tumor, tal como o programa relatado por

Rygaard e Spang-Thomsen, Proc. 6th Int Workshop on Immune-Deficient Animais. Wu e Sheng ed., Basileia, 1989, 301.

Note-se contudo que necrose e respostas inflamatórias a seguir ao tratamento podem resultar de facto num aumento das dimensões do tumor, pelo menos inicialmente. Consequentemente, estas alterações devem ser cuidadosamente monitorizadas através de uma combinação de um método morfométrico e de análise de citometria de fluxo.

Modelos animais recombinantes (transgénicos) podem ser manipulados por introdução da porção de codificação dos genes aqui identificados no genoma de animais de interesse utilizando técnicas padrão para produção de animais transgénicos. Os animais que podem servir como um alvo para manipulação transgénica incluem, entre outros, ratinhos, ratos, coelhos, porquinhos-da-india, ovelhas, cabras, porcos e primatas não humanos, por exemplo, babuinos, chimpanzés e macacos. Constituem técnicas conhecidas na especialidade para introduzir um transgene em tais animais, entre outras, micro-injecção pró-nucleica (Hoppe e Wanger, patente U.S. n.° 4 873 191); transferência génica para linhas germinais mediada por retrovirus (por exemplo, Van der Putten et ai., Proc. Natl. Acad. Sei. USA, 82^:6148-615 [1985]); ter como alvo genes em células estaminais embrionárias (Thompson et al., Cell, _56:313-321 [1989]); electroporação de embriões (Lo, Mol. Cell Biol., _3:1803-1814 [1983]); transferência génica mediada por esperma (Lavitrano et al., Cell, 57_:717-73 [1989]). Para uma revisão, consultar, por exemplo, patente U.S. n.° 4 736 866.

Para os objectivos do presente invento constituem animais transgénicos, entre outros, os que transportam o transgene apenas em parte das suas células ("animais mosaico"). O 96 ΕΡ 1 623 989/ΡΤ transgene pode ser integrado quer como um transgene único quer como concatâmeros, por exemplo, estruturas em tandem cabeça-com-cabeça ou cabeça-com-cauda. A introdução selectiva de um transgene num tipo de célula especifico é também possível seguindo, por exemplo, a técnica de Lasko et al., Proc. Natl. Acad. Sei. USA, 89:6232-636(1992). A expressão do transgene em animais transgénicos pode ser monitorizada por técnicas padrão. Por exemplo, pode utilizar-se análise de hibridação de Southern ou amplificação por PCR para verificar a integração do transgene. 0 nível de expressão de ARNm pode então ser analisado utilizando técnicas tais como hibridação in situ, análise de hibridação de Northern, PCR ou imunocitoquímica. Os animais são posteriormente analisados relativamente a sinais de desenvolvimento de tumor ou cancro.

Alternativamente, podem construir-se animais "knock out" que apresentam deficiente ou alterado, um gene que codifica um polipéptido PR07168 aqui identificado, em resultado de recombinação homóloga entre o gene endógeno que codifica o polipéptido e o ADN genómico que codifica o mesmo polipéptido introduzido numa célula embrionária do animal. Por exemplo, pode utilizar-se ADNc que codifica um polipéptido PR07168 para clonar ADN genómico que codifica esse polipéptido de acordo com técnicas estabelecidas. Uma porção do ADN genómico que codifica um polipéptido PR07168 particular pode ser eliminada ou substituída por outro gene, tal como um gene que codifica um marcador seleccionável que pode ser utilizado para monitorizar integração. Tipicamente, incluem-se no vector várias quilobases de ADN flanqueador não alterado (tanto na extremidade 5' com na extremidade 3') [consultar, por exemplo, Thomas e Capecchi, Cell, 51_:503 (1987) para uma descrição de vectores de recombinação homóloga]. Introduz-se o vector numa linha celular estaminal embrionária (por exemplo, por electroporação) e seleccionam-se células nas quais o ADN introduzido se recombinou de modo homólogo com o ADN endógeno [consultar, por exemplo, Li et al., Cell, 619:915 (1992)]. As células seleccionadas são então injectadas num blastocisto de um animal (por exemplo, um ratinho ou rato) para formar quimeras de agregação [consultar, por exemplo, Bradley em Teratocarcinomas and Embryonic Stem Cells: A Practical Approach, E. j. Robertson, ed. (IRL, Oxford, 1987), p. 113- 97 ΕΡ 1 623 989/ΡΤ 152]. Pode então implantar-se um embrião quimérico num animal hospedeiro fêmea pseudo-grávida adequada e o embrião pode ser levado a termo para criar um animal "knock out". Pode identificar-se uma descendência que apresenta o adn recombinado de modo homólogo nas suas células germinais através de técnicas padrão e utilizadas para criar animais nos quais todas as células do animal contêm o ADN recombinado de modo homólogo. Podem então caracterizar-se os animais "knock out" por exemplo, através da sua capacidade de se defenderem contra determinadas condições patológicas e pelo seu desenvolvimento de condições patológicas devidas à ausência do polipéptido PR07168. A eficácia de anticorpos que se ligam especificamente aos polipéptidos aqui identificados e a outros fármacos candidatos pode ser também ensaiada no tratamento de tumores animais espontâneos. Constitui um alvo adequado para tais estudos o carcinoma de células escamosas (SCC) oral felino. 0 SCC oral felino é um tumor maligno altamente invasivo que constitui a malignidade oral mais comum em gatos, sendo responsável por mais de 60% dos tumores orais relatados nesta espécie. Raramente forma metástases para locais distantes, apesar desta reduzida incidência de metástases poder ser meramente um reflexo dos tempos de sobrevivência curtos dos gatos com este tumor. Estes tumores não são habitualmente passíveis de cirurgia, principalmente devido à anatomia da cavidade oral felina. Presentemente não existe tratamento eficaz para este tumor. Antes da entrada para o presente estudo, cada gato sujeita-se a um exame clínico completo, biopsia e é submetido a tomografia axial computorizada (TAC). Os gatos nos quais se diagnosticam tumores de células escamosas orais sublinguais são excluídos do presente estudo. A língua pode então paralisar em resultado de tal tumor e mesmo se o tratamento matar o tumor os animais podem não ser capazes de se alimentar sozinhos. Cada gato é tratado repetidamente ao longo de um período de tempo. Tirar-se-ão diariamente fotografias dos tumores durante o período de tratamento e a cada reverificação subsequente. Após o tratamento submete-se cada gato a uma nova TAC. Cada TAC e radiografia torácica é avaliada de 8 em 8 semanas daí em adiante. Os dados são avaliados relativamente a diferenças em sobrevivência, resposta e toxicidade comparativamente com grupos de controlo. Uma resposta positiva 98 ΕΡ 1 623 989/ΡΤ pode requerer evidência de regressão de tumor, de preferência com melhoria da qualidade de vida e/ou aumento da esperança de vida.

Adicionalmente, podem também ensaiar-se outros tumores animais espontâneos tais como fibrossarcoma, adenocarcinoma, linfoma, condroma, leiomiossarcoma de cães, gatos e babuínos. De entre estes, o adenocarcinoma da mama de cães e gatos é um modelo preferido dado que o seu aparecimento e comportamento são muito semelhantes aos dos humanos. Contudo, a utilização deste modelo limita-se à rara ocorrência deste tipo de tumor em animais. K. Ensaios de rastreio para candidatos a fármacos

Os ensaios de rastreio para candidatos a fármacos concebem-se para identificar compostos que se ligam ou complexam com os polipéptidos codificados pelos genes aqui identificados ou que interferem de outro modo com a interacção dos polipéptidos codificados com outras proteínas celulares. Tais ensaios de rastreio incluirão ensaios passíveis de rastreio de elevada quantidade e rendimento de bibliotecas de compostos químicos, tornando-os particularmente adequados para identificar candidatos a fármacos de moléculas pequenas. Encontram-se abrangidas moléculas pequenas tais como compostos orgânicos ou inorgânicos sintéticos incluindo péptidos, de preferência péptidos solúveis, fusões (poli)péptido-imunoglobulina e em particular anticorpos incluindo, entre outros, anticorpos policlonais e monoclonais e fragmentos de anticorpo, anticorpos de cadeia simples, anticorpos anti-idiotípicos e versões quiméricas ou humanizadas de tais anticorpos ou fragmentos assim como anticorpos e fragmentos de anticorpos humanos. Os ensaios podem ser efectuados em diferentes formatos incluindo ensaios de ligação proteína-proteína, ensaios de rastreio bioquímico, imunoensaios e ensaios baseados em células, que se encontram bem caracterizados na especialidade.

Todos os ensaios têm em comum o facto de necessitarem de contacto entre o fármaco candidato e um polipéptido codificado por ácido nucleico aqui identificado em condições e durante um 99 ΕΡ 1 623 989/ΡΤ intervalo de tempo suficiente para permitir que essas duas componentes interajam.

Em ensaios de ligação, a interacção é ligação e o complexo formado pode ser isolado ou detectado na mistura reaccional. Numa concretização especifica, o polipéptido codificado pelo gene aqui identificado ou o fármaco candidato é imobilizado numa fase sólida, por exemplo, numa placa de microtitulação, por ligações covalentes ou não covalentes. A ligação não covalente é geralmente obtida por revestimento da superfície sólida com uma solução do polipéptido e secagem. Alternativamente, pode utilizar-se um anticorpo imobilizado, por exemplo, um anticorpo monoclonal especifico para o polipéptido a imobilizar para o ancorar a uma superfície sólida. 0 ensaio é efectuado por adição da componente não imobilizada, que pode ser marcada por um marcador detectável, à componente imobilizada, por exemplo, a superfície revestida contendo a componente ancorada. Quando a reacção se completa, removem-se as componentes que não reagiram, por exemplo, por lavagem e detectam-se os complexos ancorados à superfície sólida. Quando a componente originalmente não imobilizada transporta um marcador detectável a detecção de marcador imobilizado à superfície indica que ocorreu complexação. Nos casos em que a componente originalmente não imobilizada não transporta um marcador pode detectar-se complexação, por exemplo, utilizando um anticorpo marcado que liga especificamente o complexo imobilizado.

Se o composto candidato interage sem se ligar a um polipéptido PR07168 particular codificado por um gene aqui identificado, a sua interacção com esse polipéptido pode ser ensaiada com métodos bem conhecidos de detecção de interacções proteína-proteína. Tais ensaios incluem abordagens tradicionais tais como reticulação, co-imunoprecipitação e co-purificação através de gradientes ou colunas cromatográficas. Adicionalmente, podem monitorizar-se interacções proteína-proteína utilizando um sistema genético baseado em levedura descrito por Fields e colaboradores [Fields e Song, Nature, 340:245-246 (1989); Chien et al., Proc. Natl. Acad. Sei. USA, 88: 9578-9582 (1991)] tal como revelado por Chevray e Nathans, Proc. Natl. Acad. Sei. USA, 8_9:5789-5793 (1991)]. Muitos activadores de transcrição, tal como GAL4 de levedura, 100 ΕΡ 1 623 989/ΡΤ consistem de dois domínios modulares fisicamente discretos actuando um deles como domínio de ligação de ADN enquanto que o outro funciona como domínio de activação de transcrição. O sistema de expressão de levedura descrito nas publicações acima (referido de um modo geral como "sistema de dois híbridos") aproveita esta propriedade e utiliza duas proteínas híbridas, uma em que a proteína alvo se encontra fundida com o domínio de ligação de ADN de GAL4 e outra na qual se fundem proteínas de activação candidatas com o domínio de activação. A expressão de um gene repórter GALl-lacZ sob o controlo de um promotor activado por GAL4 depende da reconstituição de actividade GAL4 através de interacção proteína-proteína. Detectam-se colónias contendo polipéptidos em interacção com um substrato cromogénico para β-galactosidase. Encontra-se comercialmente disponível de Clontech um kit completo (MATCHMAKER™) para identificar interacções proteína-proteína entre duas proteínas específicas utilizando a técnica de dois híbridos. Este sistema pode também ser estendido ao mapeamento de domínios de proteína envolvidos em interacções específicas de proteína assim como para identificar resíduos de aminoácidos que são cruciais para essas interacções.

Os compostos que interferem com a interacção de um gene que codifica PR07168, aqui identificado, e outras componentes intracelulares ou extracelulares podem ser ensaiados da seguinte forma: usualmente prepara-se uma mistura reaccional contendo o produto do gene amplificado e a componente intracelular ou extracelular sob condições e durante um período de tempo que permita a interacção e ligação dos dois produtos. Para ensaiar a capacidade do composto de teste para inibir ligação, corre-se a reacção na ausência e na presença do composto de teste. Adicionalmente, pode adicionar-se um placebo a uma terceira mistura reaccional, para servir como um controlo positivo. A ligação (formação de complexo) entre o composto de teste e a componente intracelular ou extracelular presente na mistura é monitorizada tal como aqui descrito acima. A formação de um complexo na(s) reacção(ões) de controlo mas não na mistura reaccional contendo o composto de teste indica que o composto de teste interfere com a interacção do composto de teste com o seu parceiro reaccional. 101 ΕΡ 1 623 989/ΡΤ

Um antagonista potencial de polipéptido PR07168 é uma construção de ARN ou ADN anti-sentido preparada utilizando tecnologia anti-sentido em que, por exemplo, uma molécula de ARN ou de adn anti-sentido actua para bloquear directamente a tradução de ARNm por hibridação a ARNm alvo e evitando a tradução da proteina. A tecnologia anti-sentido pode ser utilizada para controlar a expressão génica através de formação de hélice tripla ou ADN ou ARN anti-sentido, em que ambos os métodos se baseiam na ligação de um polinucleótido a ADN ou ARN. Por exemplo, a porção de codificação a 5' da sequência polinucleotidica, que aqui codifica o polipéptido PR07168 maduro, é utilizada para conceber um oligonucleótido de ARN anti-sentido de cerca de 10 a 40 pares de bases de comprimento. Concebe-se um oligonucleótido de ADN de modo a ser complementar a uma região do gene envolvida em transcrição (hélice tripla - consultar Lee et al., Nucl. Acids Res., 6_:3073 (1979); Cooney et al., Science, 241: 456 (1988); Dervan et al., Science, 251:1360 (1991)), evitando assim a

transcrição e a produção do polipéptido PR07168. O oligonucleótido de ARN anti-sentido híbrida com o ARNm in vivo e bloqueia a tradução da molécula de ARNm no polipéptido PR07168 (anti-sentido - Okano, Neurochem., _56:560 (1991);

Oligodeoxynucleotides as Anti-sense Inhibitors of Gene

Expression (CRC Press: Boca Raton, FL, 1988). Os oligonucleótidos descritos acima podem também ser entregues a células de modo que o ARN ou ADN anti-sentido possa ser expresso in vivo para inibir a produção do polipéptido PR07168. Quando se utiliza ADN anti-sentido, preferem-se oligodesoxirribonucleótidos derivados do local de iniciação de tradução, por exemplo, entre cerca de -10 e +10 posições da sequência de nucleótidos do gene alvo.

As moléculas de ARN ou ADN anti-sentido têm, em geral, pelo menos cerca de 5 bases de comprimento, cerca de 10 bases de comprimento, cerca de 15 bases de comprimento, cerca de 20 bases de comprimento, cerca de 25 bases de comprimento, cerca de 30 bases de comprimento, cerca de 35 bases de comprimento, cerca de 40 bases de comprimento, cerca de 45 bases de comprimento , cerca de 50 bases de comprimento, cerca de 55 bases de comprimento, cerca de 60 bases de comprimento, cerca de 65 bases de comprimento, cerca de 70 bases de comprimento, cerca de 75 bases de comprimento, 102 ΕΡ 1 623 989/ΡΤ cerca de 80 bases de comprimento, cerca de 85 bases de comprimento, cerca de 90 bases de comprimento, cerca de 95 bases de comprimento, cerca de 100 bases de comprimento, ou mais.

As ribozimas são moléculas de ARN enzimáticas capazes de catalisar a clivagem especifica de ARN. As ribozimas actuam por hibridação especifica de sequência a ARN alvo complementar, seguida por clivagem endonucleolitica. Podem identificar-se locais de clivagem por ribozima específicos dentro de um ARN alvo potencial por técnicas conhecidas. Para mais detalhes consultar, por exemplo, Rossi, Current Biology, _4:469—471 (1994) e publicação PCT N.° WO 97/33551 (publicado a 18 de Setembro de 1997) .

As moléculas de ácido nucleico em formação em hélice tripla utilizadas para inibir transcrição devem ser em cadeia simples e compostas por desoxinucleótidos. A composição em bases destes oligonucleótidos é concebida de modo a promover a formação de hélice tripla através das regras de emparelhamento de bases de Hoogsteen, que em geral requerem extensões de tamanho considerável de purinas ou pirimidinas numa das cadeias de uma cadeia dupla. Para detalhes adicionais consultar, por exemplo, publicação PCT N.° WO 97/33551, supra.

Estas moléculas pequenas podem ser identificadas por qualquer um ou mais dos ensaios de rastreio aqui discutidos acima e/ou por quaisquer outras técnicas de rastreio bem conhecidas dos peritos na especialidade. L.

As moléculas anti-sentido e de ribozima, moléculas em hélice tripla, etc., inibem a expressão e/ou a actividade do produto génico alvo.

Por exemplo, as moléculas de ARN anti-sentido e de ARN actuam para bloquear directamente a tradução de ARNm por hibridação ao ARNm alvo e evitando a tradução proteína. Quando se utiliza ADN anti-sentido, são preferidos oligodesoxirribonucleótidos derivados do local de iniciação de 103 ΕΡ 1 623 989/ΡΤ tradução, por exemplo, entre cerca de -10 e +10 posições da sequência de nucleótidos de gene alvo.

As ribozimas são moléculas de arn enzimáticas capazes de catalisar a clivagem específica de ARN. As ribozimas actuam por hibridação específica de sequência ao ARN alvo complementar, seguida por clivagem endonucleolítica. Podem identificar-se locais de clivagem de ribozima específicos dentro de um arn alvo potencial utilizando técnicas conhecidas. Para mais detalhes consultar, por exemplo, Rossi, Current Biology, _4:469—471 (1994) e publicação PCT N.° WO 97/33551 (publicado a 18 de Setembro de 1997) .

As moléculas de ácido nucleico em formação de hélice tripla utilizadas para inibir transcrição devem ser em cadeia simples e compostas de desoxinucleótidos. A composição de bases destes oligonucleótidos é concebida de forma a promover a formação de hélice tripla através das regras de emparelhamento de bases de Hoogsteen, que requerem em geral extensões de tamanho considerável de purinas ou pirimidinas numa cadeia de uma hélice dupla. Para detalhes adicionais consultar, por exemplo, publicação PCT N.° WO 97/33551, supra.

Estas moléculas podem ser identificadas por qualquer dos ensaios de rastreio aqui discutidos acima ou qualquer combinação destes e/ou por qualquer outra técnica de rastreio bem conhecida dos peritos na especialidade. M. Anticorpos 1. Anticorpos policlonais São conhecidos dos peritos na especialidade métodos de preparação de anticorpos policlonais. Os anticorpos policlonais podem ser desenvolvidos num mamífero, por exemplo, por uma ou mais injecções de um agente de imunização e, caso pretendido, um adjuvante. Tipicamente, o agente de imunização e/ou adjuvante será injectado no mamífero por injecções subcutâneas ou intraperitoneais múltiplas. O agente de imunização pode incluir o polipéptido PR07168 ou uma sua proteína de fusão. Pode ser útil conjugar o agente de imunização a uma proteína que se sabe que é imunogénica no 104 ΕΡ 1 623 989/ΡΤ mamífero a ser imunizado. Constituem exemplos de tais proteínas imunogénicas, entre outras, hemocianina de lapa gigante, albumina de soro, tiroglobulina bovina e inibidor de tripsina de soja. Constituem exemplos de adjuvantes que podem ser utilizados, entre outros, adjuvante completo de Freund e adjuvante MPL-TDM (monofosforil-Lípido A, dicorinomicolato de trealose sintético). O protocolo de imunização pode ser seleccionado por um perito na especialidade sem experiências desnecessárias. 2. Anticorpos monoclonais

Os anticorpos anti-PR07168 podem, alternativamente, ser anticorpos monoclonais. Os anticorpos monoclonais podem ser preparados utilizando métodos de hibridoma, tais como os descritos por Kohler e Milstein, Nature, 256:495 (1975). Num método de hibridoma imuniza-se tipicamente um ratinho, hamster ou outro animal hospedeiro adequado com um agente de imunização para desencadear linfócitos que produzem ou são capazes de produzir anticorpos que se ligarão especificamente ao agente de imunização. Alternativamente, os linfócitos podem ser imunizados in vitro. O agente de imunização incluirá tipicamente o polipéptido PR07168, incluindo fragmentos, ou uma proteína de fusão de tal proteína ou um seu fragmento. Em geral, utilizam-se linfócitos de sangue periférico ("PBL") caso se pretendam células de origem humana, ou utilizam-se células de baço ou células de nódulos linfáticos caso se pretendam fontes de mamífero não humano. Os linfócitos são então fundidos com uma linha celular imortalizada utilizando um agente de fusão adequado, tal como polietilenoglicol, para formar uma célula de hibridoma [Goding, Monoclonal Antibodies: Principies and Practice, Academic Press, (1986) p. 59-103]. As linhas celulares imortalizadas são usualmente células de mamífero transformadas, nomeadamente células de mieloma de origem de roedor, bovina e humana. Usualmente, utilizam-se linhas celulares de rato ou ratinho. As células de hibridoma podem ser cultivadas num meio de cultura adequado que de preferência contém uma ou mais substâncias que inibem o crescimento ou sobrevivência das células imortalizadas não fundidas. Por exemplo, se as células parentais não contiverem a enzima 105 ΕΡ 1 623 989/ΡΤ hipoxantina-guanina-fosforribosil-transferase (HGPRT ou HPRT), o meio de cultura para hibridomas incluirá tipicamente hipoxantina, aminopterina e timidina ("meio HAT"), substâncias que evitam o crescimento de células deficientes em HGPRT.

As linhas celulares imortalizadas preferidas são as que se fundem eficazmente, suportam expressão estável em niveis elevados de anticorpo pelas células produtoras de anticorpo seleccionadas e são sensiveis a um meio, tal como meio HAT. Constituem linhas celulares imortalizadas mais preferidas as linhas de mieloma murino, que podem ser obtida, por exemplo, de Salk Institute Cell Distribution Center, San Diego, Califórnia e de American Type Culture Collection (ATCC), Manassas, Virgínia. Foram também descritas linhas celulares de mieloma humano e de heteromieloma ratinho-humano para a produção de anticorpos monoclonais humanos [Kozbor, J. Immunol., 133:3001 (1984); Brodeur et al., Monoclonal Antibodies Production Techniques and Applications, Mareei Dekker, Inc., New York, (1987) p. 51-63]. O meio de cultura no qual se cultivam as células de hibridoma pode então ser ensaiado para a presença de anticorpos monoclonais dirigidos contra PR07168. De preferência, determina-se a especificidade de ligação de anticorpos monoclonais produzidos pelas células de hibridoma por imunoprecipitação ou por um ensaio de ligação in vitro, tal como radioimunoensaio (RIA) ou um ensaio de imunoabsorção ligado a enzima (ELISA). Tais técnicas e ensaios são conhecidos na especialidade. A afinidade de ligação do anticorpo monoclonal pode, por exemplo, ser determinada pela análise de Scatchard de Munson e Pollard, Anal. Biochem., 107:220 (1980) .

Após terem sido identificadas as células de hibridoma pretendidas, os clones podem ser subclonados por procedimentos de diluição limitante e cultivados por métodos padrão [Goding, supra] . Constituem meios de cultura adequados para este objectivo, entre outros, por exemplo, meio Eagle modificado de Dulbecco e meio RPMI-1640. Alternativamente, as células de hibridoma podem ser cultivadas in vivo como ascites num mamífero. 106 ΕΡ 1 623 989/ΡΤ

Os anticorpos monoclonais excretados pelos subclones podem ser isolados ou purificados do meio de cultura ou fluido de ascites por procedimentos de purificação de imunoglobulina convencionais tais como, por exemplo, proteína A-Sepharose, cromatografia em hidroxilapatite, electroforese em gel, diálise ou cromatografia de afinidade.

Os anticorpos monoclonais podem também ser preparados por métodos de adn recombinante, tais como os descritos em Patente U.S. N.° 4 816 567. O ADN que codifica os anticorpos monoclonais do invento pode ser facilmente isolado e sequenciado utilizando procedimentos convencionais (por exemplo, por utilização de sondas de oligonucleótido que são capazes de se ligar especificamente a genes que codificam as cadeias pesada e leve de anticorpos murinos). As células de hibridoma do invento servem como fonte preferida de tal ADN. Uma vez isolado, o ADN pode ser colocado em vectores de expressão, que são então transfectados para células hospedeiras tais como células COS de símio, células de ovário de hamster chinês (CHO) ou células de mieloma que de outra forma não produzem proteína imunoglobulina, para obter a síntese de anticorpos monoclonais nas células hospedeiras recombinantes. Os ADN podem também ser modificados, por exemplo, por substituição da sequência de codificação para domínios constantes de cadeia pesada e leve humana em vez das sequências homólogas murinas [Patente U.S. N.° 4 816 567;

Morrison et al., supra] ou por ligação covalente à sequência de codificação de imunoglobulina de toda ou parte da sequência de codificação para um péptido não imunoglobulina. Tal péptido não imunoglobulina pode ser substituído pelos domínios constantes de um anticorpo do invento ou pode ser substituído pelos domínios variáveis de um local de combinação de antigénio de um anticorpo do invento para criar um anticorpo bivalente quimérico.

Os anticorpos podem ser anticorpos monovalentes. São bem conhecidos na especialidade métodos para preparar anticorpos monovalentes. Por exemplo, um método envolve a expressão recombinante de cadeia leve e cadeia pesada modificada de imunoglobulina. A cadeia pesada é, em geral, truncada em qualquer ponto na região Fc de modo a evitar reticulação da cadeia pesada. Alternativamente, substituem-se os resíduos de 107 ΕΡ 1 623 989/ΡΤ cisteína relevantes por outro resíduo de aminoácido ou são eliminados para evitar reticulação. São também adequados métodos in vitro para preparar anticorpos monovalentes. Pode efectuar-se digestão de anticorpos para produzir os seus fragmentos, nomeadamente fragmentos Fab, utilizando técnicas de rotina conhecidas na especialidade. 3. Anticorpos humanos e humanizados

Os anticorpos anti-PR07168 podem adicionalmente incluir anticorpos humanizados ou anticorpos humanos. As formas humanizadas de anticorpos não humanos (por exemplo, murinos) são imunoglobulinas quiméricas, cadeias de imunoglobulina ou seus fragmentos (tais como Fv, Fab, Fab', F(ab')2 ou outras subsequências de ligação de antigénio de anticorpos) que contêm uma sequência mínima derivada de imunoglobulina não humana. Os anticorpos humanizados incluem imunoglobulinas humanas (anticorpo recebedor) em que os resíduos de uma região determinante de complementaridade (CDR) do recebedor são substituídos pelos resíduos de uma CDR de uma espécie não humana (anticorpo dador) tal como ratinho, rato ou coelho apresentando a especificidade, afinidade e capacidade pretendidas. Em alguns casos, substituem-se resíduos do esqueleto Fv da imunoglobulina humana pelos resíduos não humanos correspondentes. Os anticorpos humanizados podem também incluir resíduos que não se encontram no anticorpo recebedor, nem nas sequências CDR ou de esqueleto importadas. Em geral, o anticorpo humanizado incluirá substancialmente todos de pelo menos um e tipicamente dois domínios variáveis de comprimento completo, nos quais todas ou substancialmente todas as regiões CDR correspondem às da imunoglobulina não humana e todas ou substancialmente todas as regiões FR são as de uma sequência de consenso de uma imunoglobulina humana. O anticorpo humanizado incluirá optimamente também pelo menos uma porção de uma região constante de imunoglobulina (Fc), tipicamente a de uma imunoglobulina humana [Jones et al., Nature, 321:522-525 (1986); Riechmann et al., Nature, 332:323-329 (1988); e Presta, Curr. Op. Struct. Biol,, 2^:593-596 (1992)] . 108 ΕΡ 1 623 989/ΡΤ São bem conhecidos na especialidade métodos para humanizar anticorpos não humanos. Em geral, um anticorpo humanizado tem um ou mais residuos de aminoácidos introduzidos, de uma fonte que não é humana. Estes residuos de aminoácido não humanos são usualmente denominados residuos de "importação", que são tipicamente obtidos de um domínio variável de "importação". A humanização pode ser essencialmente efectuada seguindo o método de Winter e colaboradores [Jones et al., Nature, 321:522-525 (1986); Riechmann et al., Nature, 332:323-327 (1988); Verhoeyen et al., Science, 239:1534-1536 (1988)), por substituição por CDR ou sequências de CDR de roedor as sequências correspondentes de um anticorpo humano. Assim, estes anticorpos "humanizados" são anticorpos quiméricos (Patente U.S. N.° 4 816 567), em que substancialmente menos de um domínio variável intacto foi substituído pela sequência correspondente de uma espécie não humana. Na prática, os anticorpos humanizados são tipicamente anticorpos humanos em que alguns resíduos de CDR e possivelmente alguns resíduos de FR são substituídos por resíduos de locais análogos em anticorpos de roedor.

Os anticorpos humanos podem também ser produzidos utilizando várias técnicas conhecidas na especialidade, incluindo bibliotecas de disposição de fagos [Hoogenboom e Winter, J. Mol. Biol., 227:381 (1991); Marks et al., J. Mol. Biol. 222:581 (1991)]. As técnicas de Cole et al. e Boerner et al. estão também disponíveis para a preparação de anticorpos monoclonais humanos (Cole et al., Monoclonal Antibodies and Câncer Therapy, Alan R. Liss, p. 77 (1985) e Boerner et al., J. Immunol., 147(1):86-95 (1991)]. De igual modo, podem ser preparados anticorpos humanos por introdução de locais de imunoglobulina humana em animais transgénicos, por exemplo, ratinhos nos quais os gene de imunoglobulina endógenos foram parcial ou completamente inactivados. Após provocação, observa-se produção de anticorpo humano, que é muito semelhante ao observado em humanos em todos os sentidos, incluindo rearranjo de gene, montagem e reportório de anticorpo. Esta abordagem é descrita, por exemplo, em Patentes U.S. N.° 5 545 807; 5 545 806; 5 569 825; 5 625 126; 5 633 425; 5 661 016 e nas seguintes publicações científicas: Marks et al., Bio/Technoloqy, 10^:779-783 (1992); Lonberg et al.,

Nature, 368:856-859 (1994); Morrison, Nature, 368:812-13 109 ΕΡ 1 623 989/ΡΤ (1994); Fishwild et al., Nature Biotechnology, 14:845-51 (1996); Neuberger, Nature Biotechnology, 1__4:826 (1996);

Lonberg e Huszar, Intern. Rev. Immunol., _13_: 65—93 (1995). 5 . Anticorpos biespecíficos

Os anticorpos biespecíficos são anticorpos monoclonais, de preferência humanos ou humanizados, que apresentam especificidades de ligação para pelo menos dois antigénios diferentes. No presente caso, uma das especificidades de ligação é para com o PR07168 e a outra é para com qualquer outro antigénio e de preferência para com uma proteína ou receptor ou subunidade de receptor de superfície celular. São conhecidos na especialidade métodos para preparar anticorpos biespecíficos. Tradicionalmente, a produção recombinante de anticorpos biespecíficos baseia-se na co-expressão de dois pares de cadeia pesada/cadeia leve de imunoglobulina, em que as duas cadeias pesadas têm especificidades diferentes (Milstein e Cuello, Nature, 305:537-539 [1983]). Dada a distribuição aleatória de cadeias pesada e leve de imunoglobulina, estes hibridomas (quadromas) produzem uma mistura potencial de dez moléculas de anticorpo diferentes, das quais só uma tem a estrutura biespecifica correcta. A purificação da molécula correcta é usualmente conseguida por etapas de cromatografia de afinidade. Revelam-se procedimentos semelhantes em WO 93/08829, publicado a 13 de Maio de 1993 e em Traunecker et al., EMBO J., 10:3655-3659 (1991) .

Os domínios variáveis de anticorpo com as especificidades de ligação pretendidas (locais de combinação anticorpo-antigénio) podem ser fundidos a sequências de domínio constante de imunoglobulina. A fusão é, de preferência, com um domínio constante de cadeia pesada de imunoglobulina, incluindo pelo menos parte das regiões de charneira, CH2 e CH3. É preferível ter a primeira região constante de cadeia pesada (CHI) contendo o local necessário para a ligação a cadeia leve presente em pelo menos uma das fusões. Os ADN que codificam as fusões de cadeia pesada de imunoglobulina e, caso se pretenda, a cadeia leve de imunoglobulina, são inseridos em vectores de expressão separados e são co-transfectados para um 110 ΕΡ 1 623 989/ΡΤ organismo hospedeiro adequado. Para mais detalhes sobre geração de anticorpos biespecificos consultar, por exemplo, Suresh et al., Methods in Enzymoloqy, 121:210 (1986).

De acordo com outra abordagem descrita em WO 96/27011, a interface entre um par de moléculas de anticorpo pode ser manipulada para maximizar a percentagem de heterodimeros que se recuperam da cultura de células recombinantes. A interface preferida inclui pelo menos uma parte da região CH3 de um domínio constante de anticorpo. Neste método, substituem-se uma ou mais cadeias laterais pequenas de aminoácidos da interface da primeira molécula de anticorpo por cadeias laterais maiores (por exemplo, tirosina ou triptofano). Criam-se "cavidades" de compensação de tamanho idêntico ou semelhante à(s) cadeia(s) lateral(is) grande(s) na interface da segunda molécula de anticorpo por substituição de cadeias laterais grandes de aminoácidos por cadeias mais pequenas (por exemplo, alanina ou treonina). Tal proporciona um mecanismo para aumentar o rendimento do heterodímero relativamente a produtos secundários indesejáveis, tal como homodímeros.

Podem preparar-se anticorpos biespecificos como anticorpos de comprimento completo ou fragmentos de anticorpo (por exemplo, anticorpos biespecificos F(ab')2). Foram descritas na literatura técnicas para gerar anticorpos biespecificos a partir de fragmentos de anticorpo. Por exemplo, podem preparar-se anticorpos biespecificos utilizando ligação química. Brennan et al., Science, 229:81 (1985) descrevem um procedimento em que se clivam proteoliticamente anticorpos intactos para gerar fragmentos F(ab')2- Estes fragmentos são reduzidos na presença do agente de complexação de ditiol, arsenieto de sódio, para estabilizar ditióis vizinhos e evitar a formação de dissulfureto intermolecular. Os fragmentos Fab' gerados são então convertidos aos derivados tionitrobenzoato (TNB). Um dos derivados Fab'-TNB é então reconvertido ao Fab'-tiol por redução com mercaptoetilamina e misturado com uma quantidade equimolar do outro derivado Fab'-TNB para formar o anticorpo biespecifico. Os anticorpos biespecificos produzidos podem ser utilizados como agentes para a imobilização selectiva de enzimas. 111 ΕΡ 1 623 989/ΡΤ

Os fragmentos Fab' podem ser recuperados directamente de E. coli e acoplados quimicamente para formar anticorpos biespecíficos. Shalaby et al., J. Exp. Med., 175:217-225 (1992) descrevem a produção de uma molécula de anticorpo biespecífico F(ab')2 completamente humanizada. Cada fragmento Fab' foi excretado separadamente de E. coli e sujeito a acoplamento químico directo in vitro para formar o anticorpo biespecífico. 0 anticorpo biespecífico assim formado foi capaz de se ligar a células que sobre-expressam o receptor ErbB2 e a células T humanas normais, bem como desencadear a actividade lítica de linfócitos citotóxicos humanos contra alvos de tumor de mama humanos.

Foram também descritas várias técnicas para preparar e isolar fragmentos de anticorpo biespecíficos directamente de cultura de células recombinantes. Por exemplo, produziram-se anticorpos biespecíficos utilizando cremalheiras de leucina. Kostelny et al., J. Immunol., 148(5):1547-1553 (1992). Ligaram-se os péptidos de cremalheira de leucina das proteínas Fos e Jun a porções Fab' de dois anticorpos diferentes através de fusão génica. Reduziram-se os homodímeros de anticorpo na região de charneira para formar monómeros e seguidamente re-oxidaram-se para formar os heterodímeros de anticorpo. Este método pode também ser utilizado para a produção de homodímeros de anticorpo. A tecnologia de "diacorpo" descrita por Hollinger et al., Proc. Natl. Acad. Sei. USA, 90:6444-6448 (1993) proporcionou um mecanismo alternativo para preparar fragmentos de anticorpo biespecíficos. Os fragmentos incluem um domínio variável de cadeia pesada (VH) ligado a um domínio variável de cadeia leve (Vl) através de um ligante que é demasiado curto para permitir emparelhamento entre os dois domínios na mesma cadeia. Assim, os domínios VH e VL de um fragmento são forçados a emparelhar com os domínios VL e VH complementares de outro fragmento, formando assim dois locais de ligação de antigénio. Foi também relatada outra estratégia para preparar fragmentos de anticorpo biespecíficos por utilização de dímeros Fv de cadeia simples (sFv). Consultar, Gruber et al., J. Immunol., 152:5368 (1994).

Estão contemplados anticorpos com mais de duas valências. Por exemplo, podem preparar-se anticorpos triespecíficos. Tutt et al., J. Immunol., 147:60 (1991). 112 ΕΡ 1 623 989/ΡΤ

Os anticorpos biespecíficos exemplificativos podem ligar-se a dois epitopos diferentes num determinado polipéptido. Alternativamente, pode combinar-se um braço anti-polipéptido com um braço que liga uma molécula desencadeadora num leucócito, tal como uma molécula de receptor de célula T (por exemplo, CD2, CD3, CD28 ou B7) ou receptores Fc para igG (FcyR), tal como FcyRI (CD64), FcyRII (CD32) e FcyRIII (CD16) de modo a focar os mecanismos de defesa para a célula que expressa o polipéptido determinado. Os anticorpos biespecíficos podem ser também utilizados para localizar agentes citotóxicos em células que expressam um polipéptido determinado. Estes anticorpos possuem um braço de ligação ao polipéptido e um braço que liga um agente citotóxico ou um quelante de radionuclidos, tal como EOTUBE, DPTA, DOTA ou TETA. Outro anticorpo biespecífico de interesse liga o polipéptido e liga adicionalmente o factor tissular (TF). 6. Anticorpos heteroconjugados

Os anticorpos heteroconjugados são compostos de dois anticorpos ligados covalentemente. Tais anticorpos foram, por exemplo, propostos para dirigir ao alvo células do sistema imunitário para células indesejáveis [Patente U.S. N.° 4 676 980] e para tratamento de infecção por VIH [WO 91/00360; WO 92/200373; EP 03089]. Considera-se que os anticorpos podem ser preparados in vitro utilizando métodos conhecidos em química de síntese de proteínas, incluindo os que envolvem agentes de reticulação. Por exemplo, podem construir-se imunotoxinas utilizando uma reacção de permuta de dissulfureto ou por formação de uma ligação tioéter. Constituem exemplos de reagentes adequados para este objectivo, entre outros, iminotiolato e metil-4-mercaptobutirimidato e os revelados, por exemplo, em Patente U.S. N.° 4 676 980. 7. Manipulação da função efectora

Pode ser desejável modificar o anticorpo do invento relativamente à função efectora, por exemplo. Por exemplo, pode(m) introduzir-se resíduo(s) de cisteína na região Fc, permitindo assim formação de ligação dissulfureto intercadeia nesta região. O anticorpo homodimérico assim gerado pode ter 113 ΕΡ 1 623 989/ΡΤ capacidade de internalização melhorada e/ou morte celular mediada por complemento e citotoxicidade celular dependente de anticorpo (ADCC) melhoradas. Consultar, Caron et al., J. Exp. Med., 176:1191-1195 (1992) e Shopes, J. Immunol., 148:2918- 2922 (1992) . Podem também preparar-se anticorpos homodiméricos com actividade antitumoral aumentada utilizando agentes de reticulação heterobifuncionais, tal como descrito em Wolff et al., Câncer Research 53:2560-2565 (1993). Alternativamente, pode manipular-se um anticorpo que tem regiões Fc duplas e pode portanto apresentar capacidades de lise de complemento e ADCC melhoradas. Consultar, Stevenson et al., Anti-Cancer Drug Design, 3:219-230 (1989). 8. Imunoconjugados

Podem preparar-se imunoconjugados incluindo um anticorpo conjugado a um agente citotóxico, tal como um agente quimioterapêutico, uma toxina (por exemplo, uma toxina activa enzimaticamente de origem bacteriana, fúngica, vegetal ou animal ou seus fragmentos, ou uma toxina de molécula pequena) ou um isótopo radioactivo (ou seja, um radioconjugado).

Foram descritos acima agentes quimioterapêuticos úteis na geração de tais imunoconjugados. Constituem toxinas de proteína enzimaticamente activas e seus fragmentos que podem ser utilizadas, entre outras, cadeia A de difteria, fragmentos activos não ligantes de toxina de difteria, toxina da cólera, toxina botulínica, cadeia A de exotoxina (de Pseudomonas aeruginosa), cadeia A de ricina, cadeia A de abrina, cadeia A de modecina, alfa-sarcina, proteínas de Aleurites fordii, proteínas de diantina, proteínas de Phytolaca americana (PAPI, PAPII e PAP-S), inibidor de Momordica charantia, curcina, crotina, inibidor de Sapaonarla officinalis, gelonina, saporina, mitogelina, restrictocina, fenomicina, enomicina e os tricotecenos. As toxinas de molécula pequena incluem, por exemplo, caliqueamicinas, maitansinóides, palitoxina e CC1065. Encontram-se disponíveis vários radionuclidos para a produção de anticorpos radioconjugados. Constituem exemplos, entre o,,4-„o,- 212-0 · 131 x 131 x„ 90v „ 186χ,„ outros, Bi, I, In, Y e Re.

Os conjugados do anticorpo e agente citotóxico são preparados utilizando vários agentes de acoplamento de 114 ΕΡ 1 623 989/ΡΤ proteína bifuncionais, tais como N-succinimidil-3-(2-piridilditiol)propionato (SPDP), iminotiolano (IT), derivados bifuncionais de imidoésteres (tal como adipimidato de dimetilo HCL), ésteres activos (tal como suberato de dissuccinimidilo), aldeídos (tal como glutaraldeído), compostos bis-azido (tal como bis(p-azidobenzoíl)hexanodiamina), derivados bis-diazónio (tal como bis-(p-diazónio-benzoíl)etilenodiantina), diisocianatos (tal como 2,6-diisocianato de tolueno) compostos de flúor bis-activos (tal como 1,5-difluoro-2,4- dinitrobenzeno). Por exemplo, pode ser preparada uma imunotoxina de ricina tal como descrito em Vitetta et al., Science, 238:1098 (1987). Constitui um exemplo de agente quelante para a conjugação de radionucleótidos ao anticorpo, o ácido l-isotiocianatobenzil-3-metildietilenotriaminopenta-acético (MX-DTPA) marcado com carbono-14. Consultar WO94/11026.

Noutra concretização, o anticorpo pode ser conjugado a um "receptor" (tal como estreptavidina) para utilização em pré-localização ao alvo de tumor em que o conjugado anticorpo-receptor é administrado ao doente, seguido de remoção do conjugado não ligado de circulação utilizando um agente de depuração e seguidamente administração de um "ligando" (por exemplo, avidina) que está conjugado a um agente citotóxico (por exemplo, um radionucleótido). 9. Imunolipossornas

Os anticorpos aqui revelados podem também ser formulados como imunolipossomas. Os lipossomas contendo o anticorpo são preparados por métodos conhecidos na especialidade, tal como descrito em Epstein et al.f Proc. Natl. Acad. Sei. USA, 8_2 :3688 (1985); Hwang et al., Proc. Natl. Acad. Sei. USA, 77:4030 (1980); e Patentes U.S. N.° 4 485 045 e 4 544 545. Revelam-se lipossomas com tempo de circulação aumentado em Patente U.S. N.° 5 013 556.

Podem gerar-se lipossomas particularmente úteis pelo método de evaporação de fase reversa com uma composição de lípido incluindo fosfatidileolina, colesterol e fosfatidiletanolamina derivatizada com PEG (PEG-PE).

Extrudem-se os lipossomas através de filtros de tamanho de 115 ΕΡ 1 623 989/ΡΤ poro definido para obter lipossomas com o diâmetro pretendido. Podem conjugar-se aos lipossomas fragmentos Fab' do anticorpo do presente invento tal como descrito em Martin et al.r J. Biol. Chem., 257:286-288 (1982) através de uma reacção de permuta de dissulfureto. 0 lipossoma contém no seu interior opcionalmente um agente quimioterapêutico (tal como doxorrubicina). Consultar, Gabizon et al., J. National Câncer Inst81(19) :1484 (1989) . Q. Diagnóstico e prognóstico de tumores

Enquanto as proteínas de superfície celular, tal como receptores de crescimento sobre-expressos em determinados tumores são alvos excelentes para candidatos a fármacos ou tratamento de tumores (por exemplo, cancro), as mesmas proteínas juntamente com proteínas excretadas codificadas pelos genes amplificados em células tumorais podem ser utilizadas adicionalmente no diagnóstico e prognóstico de tumores. Por exemplo, os anticorpos dirigidos contra os produtos de proteína de genes amplificados em células tumorais podem ser utilizados como diagnóstico ou prognóstico de tumor.

Por exemplo, os anticorpos, incluindo fragmentos de anticorpo, podem ser utilizados para detectar qualitativa ou quantitativamente a expressão de proteínas codificadas pelos genes amplificados ("produtos génicos marcadores"). 0 anticorpo é de preferência equipado com um marcador detectável, por exemplo, um marcador fluorescente e pode monitorar-se a ligação por microscopia óptica, citometria de fluxo, fluorimetria ou outras técnicas bem conhecidas na especialidade. Estas técnicas são particularmente adequadas, se o gene amplificado codifica uma proteína de superfície celular, por exemplo, um factor de crescimento. Tais ensaios de ligação são efectuados essencialmente tal como descrito na secção 5 acima. A detecção in si tu da ligação de anticorpo aos produtos do gene marcador pode ser efectuada, por exemplo, por imunofluorescência ou microscopia imunoelectrónica. Com este objectivo, remove-se um espécime histológico do doente e aplica-se a este um anticorpo marcado, de preferência por sobreposição do anticorpo numa amostra biológica. Este 116 ΕΡ 1 623 989/ΡΤ procedimento também permite determinar a distribuição do produto de gene marcador no tecido examinado. Será aparente aos peritos na especialidade que se encontra facilmente disponível uma larga gama de métodos histológicos para detecção in situ.

Os seguintes exemplos apresentam-se com fins meramente ilustrativos e não pretendem de modo algum limitar o âmbito do presente invento.

EXEMPLOS

Os reagentes disponíveis comercialmente referidos nos exemplos foram utilizados de acordo com as instruções do fabricante, salvo indicação em contrário. A fonte das células identificadas nos seguintes exemplos e ao longo do fascículo pelos números de acesso ATCC é a American Type Culture Collection, 10801 University Blvd., Manassas, VA 20110-2209. Todos os depósitos originais referidos no presente pedido foram feitos segundo estipulado no Tratado de Budapeste sobre o Reconhecimento Internacional do Depósito de Microrganismos para Efeitos do Procedimento em Matéria de Patentes e seus Regulamentos (Tratado de Budapeste). Tal assegura a manutenção de uma cultura viável do depósito durante 30 anos a partir da data do depósito. O depósito será disponibilizado pela ATCC segundo os termos do Tratado de Budapeste e sujeito a acordo entre a Genentech, inc. e a ATCC, que assegura a disponibilidade permanente e não restrita da progénie da cultura em depósito ao público após concessão da patente norte-americana pertinente e após disponíveis ao público quaisquer pedidos de patente norte-americana ou estrangeira, o que ocorrer primeiro, e assegura a disponibilidade da progénie a quem for determinado pelo U.S. Commissioner of Patents and Trademarks ter esse direito de acordo com 35 USC § 122 e as regras do Commissioner daí decorrentes (incluindo 37 CFR §1.14, com especial referência a 886 OG 638).

Salvo indicação em contrário, o presente invento utiliza procedimentos padrão de tecnologia de ADN recombinante, tal como descrito aqui acima e nos seguintes livros: Sambrook et al., Molecular Cloninq: A Laboratory Manual, Cold Spring Harbor Press, New York, 1989; Ausubel et al., Current 117 ΕΡ 1 623 989/ΡΤ

Protocols in Molecular Bioloqy, Green Publishing Associates and Wiley Interscience, New York, 1989; Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press, inc., New York, 1990; Harlow et al., Antibodies: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, 1988; Gait, Oligonucleotide Synthesis, IRL Press, Oxford, 1984; R.I. Freshney, Animal Cell Culture, 1987; Coligan et al., Current Protocols in Immunology, 1991. EXEMPLO 1

Rastreio de homologia de domínio extracelular para identificar novos polipéptidos e ADNc que os codificam

As sequências do domínio extracelular (ECD) (incluindo a sequência de sinal de excreção, caso exista) de cerca de 950 proteínas excretadas conhecidas da base de dados pública Swiss-Prot foram utilizadas para busca em base de dados EST. As bases de dados EST incluíram bases de dados públicas (por exemplo, Dayhoff, GenBank) e bases de dados registadas (por exemplo LIFESEQ®, Incyte Pharmaceuticals, Paio Alto, Califórnia). A busca foi efectuada utilizando o programa de computador BLAST ou BLAST-2 (Altschul et al., Methods in Enzymology, 266:460-480 (1996)) como uma comparação das sequências de proteínas ECD com uma tradução de 6 quadros das sequências EST. As comparações com uma pontuação BLAST de 70 (ou em alguns casos 90) ou superior que não codificam proteínas conhecidas foram agrupadas e montadas em sequências de ADN de consenso com o programa "phrap" (Phil Green, University of Washington, Seattle, Washington).

Utilizando este rastreio de homologia de domínio extracelular, as sequências de ADN de consenso foram montadas relativamente a outras sequências EST identificadas utilizando phrap. Além disso, as sequências de ADN de consenso obtidas foram frequentemente (mas nem sempre) estendidas utilizando ciclos repetidos de BLAST ou BLAST-2 e phrap para estender a sequência de consenso o mais possível utilizando as fontes de sequências EST discutidas acima.

Com base nas sequências de consenso obtidas como descrito acima, sintetizaram-se então oligonucleótidos e utilizaram-se 118 ΕΡ 1 623 989/ΡΤ para identificar por PCR uma biblioteca de ADNc que continha a sequência de interesse e para utilização como sondas para isolar um clone da sequência de codificação de comprimento completo de um polipéptido PRO. Os iniciadores de PCR directos e inversos têm, em geral, de 20 a 30 nucleótidos e são frequentemente concebidos para darem um produto de PCR de cerca de 100-1000 pb de comprimento. As sequências sonda têm tipicamente 40-55 pb de comprimento. Em alguns casos, sintetizam-se oligonucleótidos adicionais quando a sequência de consenso é maior do que cerca de 1-1,5 kpb. De modo a rastrear várias bibliotecas para um clone completo, rastreou-se o ADN das bibliotecas por amplificação por PCR, tal como em Ausubel et al.r Current Protocols in Molecular Biology, com o par de iniciadores de PCR. Utilizou-se então uma biblioteca positiva para isolar clones que codificam o gene de interesse, utilizando o oligonucleótido sonda e um dos pares de iniciadores.

As bibliotecas de ADNc utilizadas para isolar os clones de ADNc foram construídas por métodos padrão utilizando reagentes disponíveis comercialmente, tal como os de Invitrogen, San Diego, CA. O ADNc foi iniciado com oligo dT contendo um local Notl, ligado com extremidades lisas a adaptadores hemiquinase Sall, clivados com Notl, ajustou-se o tamanho para ficar adequado para electroforese e clonou-se numa orientação definida para um vector de clonagem adequado (tal como pRKB ou pRKD; pRK5B é um precursor de pRK5D que não contém o local Sfil; consultar, Holmes et al., Science, 253:1278-1280 (1991)) nos locais Xhol e Notl únicos. EXEMPLO 2

Isolamento de clones de ADNc utilizando análise de algoritmo de sinal

Identificaram-se várias sequências de ácido nucleico que codificam polipéptidos, por aplicação de um algoritmo de busca de sequência de sinal registado desenvolvido por Genentech, Inc., (South San Francisco, CA) nas EST, bem como fragmentos EST agrupados e montados de bases de dados públicas (por exemplo, GenBank) e/ou privadas (LIFESEQ®, Incyte Pharmaceuticals, inc., Paio Alto, CA). O algoritmo de 119 ΕΡ 1 623 989/ΡΤ sequências de sinal calcula uma pontuação de sinal de excreção com base no carácter dos nucleótidos do ADN que circundam o primeiro e opcionalmente o segundo codão de metionina (ATG) na extremidade 5' da sequência ou do fragmento de sequência em consideração. Os nucleótidos a seguir ao primeiro ATG devem codificar pelo menos 35 aminoácidos não ambíguos sem quaisquer codões de paragem. Se o primeiro ATG tem os aminoácidos necessários, o segundo não é examinado. Se nenhum deles cumprir os requisitos, a sequência candidata não é pontuada. De modo a determinar se a sequência EST contém uma sequência de sinal autêntica, os ADN e as sequências de aminoácidos correspondentes que circundam o codão ATG são pontuados utilizando um conjunto de sete sensores (parâmetros de avaliação) que se sabe estarem associados a sinais de excreção. A utilização deste algoritmo resultou na identificação de numerosas sequências de ácido nucleico que codificam polipéptido. EXEMPLO 3

Isolamento de clones de ADNc que codificam PR07168 humano

Identificou-se o DNA102846-2742 por aplicação do algoritmo de busca de sequências de sinal privado descrito no exemplo 2 acima. A utilização do algoritmo para sequências de sinal descrito acima permitiu a identificação de uma sequência de agrupamentos de EST da base de dados LIFESEQ®, Incyte Pharmaceuticals, Paio Alto, CA, aqui designada como CLU122441. Esta sequência de agrupamento de EST foi então comparada com várias bases de dados de marcadores de sequências expressos (EST) que incluem bases de dados de EST públicas (por exemplo, GenBank) e uma base de dados de ADN de EST privada (LIFESEQ®, Incyte Pharmaceuticals, Paio Alto, CA) para identificar homologias existentes. A busca de homologia foi efectuada utilizando o programa de computador BLAST ou BLAST2 (Altshul et ai., Methods in Enzymology, 266:460-480 (1996)). As comparações que resultaram numa pontuação BLAST de 70 (ou em alguns casos 90) ou superior que não codificam proteínas conhecidas foram agrupadas e montadas numa sequência de ADN de consenso com o programa "phrap" (Phil Green, University of Washington, Seattle, Washington). A sequência de consenso assim obtida é aqui designada por DNA57953. 120 ΕΡ 1 623 989/ΡΤ

Dada a homologia de sequências verificada entre a sequência DNA57953 e a sequência EST de Incyte abrangida pelo clone n.° 4181351 da base de dados lifeseq®, incyte Pharmaceuticals, Paio Alto, CA, adquiriu-se o clone n.° 4181351 e obteve-se e sequenciou-se a inserção de ADNc. A sequência desta inserção de ADNc apresenta-se na figura 35 (SEQ ID NO:35) e é aqui denominada como DNA102846-2742. A sequência de codificação completa de DNA102846-2742 está incluída na figura 35 (SEQ ID NO:35). O clone DNA102846-2742 contém um único quadro de leitura aberta com um local de iniciação de tradução aparente nas posições de nucleótidos 23-25 e terminando no codão de paragem nas posições de nucleótidos 2540-2542 (figura 35) . O precursor do polipeptídico previsto tem um comprimento de 839 aminoácidos (figura 36; SEQ ID NO:36). A proteína PR07168 de comprimento completo apresentada na figura 36 tem um peso molecular estimado de cerca de 87 546 dalton e um pi de cerca de 4,84. A análise da sequência de PR07168 de comprimento completo apresentada na figura 36 (SEQ ID NO:36) evidencia a presença de uma variedade de domínios polipeptídicos importantes, em que as localizações apresentadas para esses domínios polipeptídicos importantes são aproximadamente as descritas acima. A análise da sequência de PR07168 de comprimento completo apresentada na figura 36 evidencia a presença do seguinte: um péptido de sinal de cerca do aminoácido 1 a cerca do aminoácido 25; um domínio transmembranar de cerca do aminoácido 663 3. cerca do aminoácido 686; locais de glicosilaçãc i em N de cerca do aminoácido 44 a cerca do aminoácido 48, de cerca do aminoácido 140 a cerca do aminoácido 144, de cerca do aminoácido 198 a cerca do aminoácido 202, de cerca do aminoácido 297 a cerca do aminoácido 301, de cerca do aminoácido 308 a cerca do aminoácido 312, de cerca do aminoácido 405 a cerca do aminoácido 409 e de cerca do aminoácido 520 a cerca do aminoácido 524; locais de fixação de glicosaminoglicano de cerca do aminoácido 490 a cerca do aminoácido 494, de cerca do aminoácido 647 a cerca do aminoácido 651 e de cerca do aminoácido 813 a cerca do aminoácido 817; um local de fosforilação por proteína-quinase dependente de AMPc e GMPc de cerca do aminoácido 655 a cerca do aminoácido 659; locais de 121 ΕΡ 1 623 989/ΡΤ fosforilação por tirosina-quinase de cerca do aminoácido 154 a cerca do aminoácido 163 e de cerca do aminoácido 776 a cerca do aminoácido 783 ; locais de N-miristoílação de cerca do aminoácido 57 a cerca do aminoácido 63, de cerca do aminoácido 102 a cerca do aminoácido 108, de cerca do aminoácido 255 a cerca do aminoácido 261, de cerca do aminoácido 294 a cerca do aminoácido 300, de cerca do aminoácido 366 a cerca do aminoácido 372, de cerca do aminoácido 426 a cerca do aminoácido 432, de cerca do aminoácido 441 a cerca do aminoácido 447, de cerca do aminoácido 513 a cerca do aminoácido 519, de cerca do aminoácido 517 a cerca do aminoácido 523, de cerca do aminoácido 530 a cerca do aminoácido 536, de cerca do aminoácido 548 a cerca do aminoácido 554, de cerca do aminoácido 550 a cerca do aminoácido 556, de cerca do aminoácido 581 a cerca do aminoácido 587, de cerca do aminoácido 592 a cerca do aminoácido 598, de cerca do aminoácido 610 a cerca do aminoácido 616, de cerca do aminoácido 612 a cerca do aminoácido 618, de cerca do aminoácido 623 a cerca do aminoácido 629, de cerca do aminoácido 648 a cerca do aminoácido 654, de cerca do aminoácido 666 a cerca do aminoácido 672, de cerca do aminoácido 667 a cerca do aminoácido 673, de cerca do aminoácido 762 a cerca do aminoácido 768, de cerca do aminoácido 763 a cerca do aminoácido 769, de cerca do aminoácido 780 a cerca do aminoácido 786, de cerca do aminoácido 809 a cerca do aminoácido 815, de cerca do aminoácido 821 a cerca do aminoácido 827 e de cerca do aminoácido 833 a cerca do aminoácido 839; e uma assinatura de domínio repetido extracelular de caderinas de cerca do aminoácido 112 a cerca do aminoácido 123. 0 clone DNA102846-2742 foi depositado na ATCC em 17 de Agosto, 1999, e foi-lhe atribuído o n.° de depósito na ATCC PTA-545.

Uma análise da base de dados Dayhoff (versão 35.45 SwissProt 35), utilizando uma análise de alinhamento de sequências WU-BLAST2 da sequência de comprimento completo apresentada na figura 36 (SEQ ID NO:36) evidenciou identidade de sequências entre a sequência de aminoácidos de PR07168 e as seguintes sequências Dayhoff: CELT22Dl_9/· B48013, AF100960_1, MUC2_HUMAN, PRP3_M0USE, S53363, A39066, HUMSPRPA_1, AF053091_1 e S80905 1. 122 ΕΡ 1 623 989/ΡΤ EXEMPLO 4

Amplificação génica

Este exemplo demonstra que os genes que codificam PR07168 são amplificados no genoma de determinados cancros e/ou linhas celulares de pulmão, cólon e/ou mama humanos. A amplificação está associada à sobre-expressão do produto génico, indicando que os polipéptidos podem ser alvos úteis para intervenção terapêutica em determinados cancros, tais como cancro do cólon, do pulmão, da mama e outros. Os agentes terapêuticos podem tomar a forma de antagonistas dos polipéptidos PR07168, por exemplo, anticorpos quiméricos murino-humano, humanizados ou humanos contra um polipéptido PR07168. 0 material de partida para o rastreio foi ADN genómico isolado de vários cancros. 0 ADN é quantificado precisamente, por exemplo, fluorimetricamente. Como um controlo negativo, isolou-se ADN de células de dez indivíduos saudáveis normais que foram agrupadas e utilizadas como controlos de ensaio para a cópia do gene em indivíduos saudáveis (não apresentado). Utilizou-se o ensaio de 5' nuclease (por exemplo, TaqMan™) e PCR quantitativo em tempo real (por exemplo, ABI Prizm 7700 Sequence Detection System™ (Perkin Elmer, Applied Biosystems Division, Foster City, CA) ) para encontrar genes potencialmente amplificados em determinados cancros. Os resultados foram utilizados para determinar se o ADN que codifica PR07168 está sobre-representado em qualquer dos cancros primários ou linhas celulares de cancro de pulmão ou cólon ou linhas celulares de cancro de mama que foram rastreadas. Os cancros de pulmão primários foram obtidos de indivíduos com tumores do tipo e no estádio indicados na tabela 6. Foi apresentada aqui acima uma explicação das abreviaturas utilizadas para a designação dos tumores primários apresentados na tabela 6 e os tumores primários e linhas celulares referidos ao longo deste exemplo.

Os resultados de TaqMan™ são apresentados em unidades delta (Δ) Ct. Uma unidade corresponde a 1 ciclo de PCR ou aproximadamente uma amplificação de 2 vezes relativamente ao normal, duas unidades correspondem a amplificação de 4 vezes, 123 ΕΡ 1 623 989/ΡΤ 3 unidades a amplificação de 8 vezes e assim sucessivamente. A quantificação foi obtida utilizando iniciadores e uma sonda fluorescente TaqMan™ derivada do gene que codifica PR07168. As regiões de PR07168 que mais provavelmente contêm sequências de ácido nucleico únicas e que têm menor probabilidade de ter removido os intrões por splicing são preferidas para derivação do iniciador e da sonda, por exemplo, regiões não traduzidas a 3'. As sequências para os iniciadores e sondas (directo, inverso e sonda) utilizadas para a análise de amplificação do gene de PR07168 foram as seguintes: PR07168 (DNA102846-2742): 102846.tm.fl: 5 ' -GAGCCGGTGGTCTCAAAC-3' (SEQ ID NO:3) 102846.tm.pl: 5 ' -CCGGGGGTCCTAGTCCCCTTC-3 ' (SEQ ID NO:4) 102846.tm.rl: 5-TITACTGCTGCGCTCCAA-3 ' (SEQ ID NO:5) A reacção de ensaio de 5' nuclease é uma técnica baseada em PCR fluorescente que utiliza a actividade da 5' exonuclease da enzima ADN polimerase Taq para monitorizar a amplificação em tempo real. Utilizaram-se dois oligonucleótidos iniciadores para gerar um amplicão tipico de uma reacção de PCR. Concebe-se um terceiro oligonucleótido, ou sonda, para detectar a sequência de nucleótidos localizada entre os dois iniciadores de PCR. A sonda não é extensível pela enzima ADN polimerase Taq e é marcada com um corante fluorescente repórter e um corante de extinção de fluorescência. Qualquer emissão do corante repórter induzida por laser é extinta pelo corante de extinção quando os dois corantes se localizam perto um do outro, tal como estão na sonda. Durante a reacção de amplificação, a enzima ADN polimerase Taq cliva a sonda de uma forma dependente do molde. Os fragmentos de sonda resultantes dissociam em solução e o sinal do repórter libertado está livre do efeito de extinção do segundo fluoróforo. Liberta-se uma molécula de corante repórter por cada nova molécula sintetizada e a detecção do corante repórter não extinto proporciona a base para interpretação quantitativa dos dados.

O procedimento de 5' nuclease é efectuado num dispositivo de PCR quantitativo em tempo real, tal como o ABI Prism 7700TM 124 ΕΡ 1 623 989/ΡΤ

Sequence Detection. 0 sistema consiste de um termociclador, um laser, uma câmara de dispositivo de carga acoplada (CCD) e um computador. 0 sistema amplifica amostras num formato de 96 poços num termociclador. Durante a amplificação, recolhe-se o sinal fluorescente induzido por laser em tempo real através de cabos de fibra óptica para todos os 96 poços e detecta-se na CCD. 0 sistema inclui utilitário de computador para operar o instrumento e para analisar os dados.

Os dados do ensaio de 5' nuclease são inicialmente expressos como Ct ou o ciclo limiar. Este é definido como o ciclo no qual o sinal do repórter se acumula acima do nivel de base de fluorescência. Utilizam-se os valores de ACt como medida quantitativa do número relativo de cópias iniciais de uma determinada sequência alvo numa amostra de ácido nucleico, quando comparando resultados de ADN de cancro com resultados de ADN humano normal. A tabela 6 descreve o estádio, estádio τ e estádio N de vários tumores primários que foram utilizados para rastrear os compostos PR07168 do invento.

Tabela 6

Perfis de Tumores Primários do Pulmão e do Cólon Tumor Primário Estádio Outro Estádio Estádio Dukes Estádio T Estádio N Tumor do pulmão humano AdenoCa (SRCC724) [LT1] IIA TI NI Tumor do pulmão humano SqCCa (SRCC725) [LTla] IIB T3 NO Tumor do pulmão humano AdenoCa (SRCC726) [LT2] IB T2 NO Tumor do pulmão humano AdenoCa (SRCC727) [LT3] II IA TI N2 Tumor do pulmão humano AdenoCa (SRCC728) [LT4] IB T2 NO Tumor do pulmão humano SqCCa (SRCC729) [LT6] IB T2 NO Tumor do pulmão humano Aden/SqCCa (SRCC730) [LT7] IA TI NO Tumor do pulmão humano AdenoCa (SRCC731) [LT9] IB T2 NO 125 ΕΡ 1 623 989/ΡΤ

Perfis de Tumores Primários do Pulmão e do Cólon Tumor Primário Estádio Outro Estádio Estádio Dukes Estádio T Estádio N Tumor do pulmão humano SqCCa (SRCC732) [LT10] IIB T2 NI Tumor do pulmão humano SqCCa (SRCC733) [LTll] I IA TI NI Tumor do pulmão humano AdenoCa (SRCC734) [LT12] IV T2 NO Tumor do pulmão humano AdenoSqCCa (SRCC735)[LT13] IB T2 NO Tumor do pulmão humano SqCCa (SRCC736) [LT15] IB T2 NO Tumor do pulmão humano SqCCa (SRCC737) [LT16] IB T2 NO Tumor do pulmão humano SqCCa (SRCC738) [LT17] IIB T2 NI Tumor do pulmão humano SqCCa (SRCC739) [LT18] IB T2 NO Tumor do pulmão humano SqCCa (SRCC740) [LT19] IB T2 NO Tumor do pulmão humano LCCa (SRCC741) [LT21] IIB T3 NI Pulmão humano AdenoCa (SRCC811) [LT22] IA TI NO Cólon humano AdenoCa (SRCC742) [CT2] Ml D pT 4 NO Cólon humano AdenoCa (SRCC743) [CT3] B pT3 NO Cólon humano AdenoCa (SRCC 744) [CT8] B T3 NO Cólon humano AdenoCa (SRCC745) [CT10] A pT2 NO Cólon humano AdenoCa (SRCC746) [CT12] MO, RI B T3 NO Cólon humano AdenoCa (SRCC747) [CT14] pMO, RO B pT3 pNO Cólon humano AdenoCa (SRCC748) [CT15] Ml, R2 D T4 N2 Cólon humano AdenoCa (SRCC749) [CT16] pMO B pT3 pNO Cólon humano AdenoCa (SRCC750) [CT17] Cl pT3 pNl Cólon humano AdenoCa (SRCC751) [CT1] MO, RI B pT3 NO 126 ΕΡ 1 623 989/ΡΤ

Perfis de Tumores Primários do Pulmão e do Cólon Tumor Primário Estádio Outro Estádio Estádio Dukes Estádio T Estádio N Cólon humano AdenoCa (SRCC752) [CT4 ] B pT3 MO Cólon humano AdenoCa (SRCC753) [CT5] G2 Cl pT3 pNO Cólon humano AdenoCa (SRCC754) [CT6] pMO, RO B pT3 pNO Cólon humano AdenoCa (SRCC755) [CT7] G1 A pT2 pNO Cólon humano AdenoCa (SRCC756) [CT9] G3 D pT4 pN2 Cólon humano AdenoCa (SRCC757) [CT11] B T3 N0 Cólon humano AdenoCa (SRCC758) [CT18] MO, RO B pT3 pNO

Preparação de ADN:

Preparou-se ADN a partir de linhas celulares em cultura, tumores primários e sangue humano normal. 0 isolamento foi efectuado utilizando kit de purificação, conjunto de tampão e protease e todos de Qiagen, de acordo com as instruções do fabricante e a descrição adiante.

Lise da cultura celular.

Lavaram-se as células e trataram-se com tripsina a uma concentração de 7,5 x 108 por ponta e sedimentaram-se por centrifugação a 1000 rpm durante 5 minutos a 4°C, seguido por lavagem mais uma vez mais com 1/2 volume de PBS e nova centrifugação. Lavaram-se os sedimentos uma terceira vez, recolheram-se as células em suspensão e lavaram-se 2x com PBS. As células foram então suspensas em 10 ml de PBS. Equilibrou-se tampão Cl a 4°C. Diluiu-se protease n.° 19155 de Qiagen em 6,25 ml de água duplamente destilada (ddH20) fria para uma concentração final de 20 mg/ml e equilibrou-se a 4°C. Preparou-se 10 ml de tampão G2 por diluição de solução-mãe de ARNase A de Qiagen (100 mg/ml) para uma concentração final de 200 yg/ml. 127 ΕΡ 1 623 989/ΡΤ

Adicionaram-se então tampão Cl (10 ml, 4°C) e ddH20 (40 ml, 4°C) a 10 ml de suspensão celular, misturou-se por inversão e incubou-se em gelo durante 10 minutos.

Sedimentaram-se os núcleos celulares por centrifugação num rotor de cesto basculante Beckman a 2500 rpm a 4°C durante 15 minutos. Rejeitou-se o sobrenadante e suspenderam-se os núcleos num vórtex para 2 ml de tampão Cl (a 4°C) e 6 ml de ddH20, seguido por uma segunda centrifugação a 4°C a 2500 rpm durante 15 minutos. Os núcleos foram então ressuspensos no tampão residual utilizando 200 μΐ por ponta. Adicionou-se tampão G2 (10 ml) aos núcleos em suspensão enquanto se aplicava um vórtex suave. Após finalizar a adição de tampão, aplicou-se vórtex vigoroso durante 30 segundos. Adicionou-se protease de Qiagen (200 μΐ, preparada como indicado acima) e incubou-se a 50°C durante 60 minutos. A incubação e centrifugação foram repetidas até os lisados estarem límpidos (por exemplo, incubando 30-60 minutos adicionais, sedimentar a 3000 x g durante 10 min., 4°C).

Preparação e lise da amostra de tumor humano sólido:

Pesaram-se as amostras de tumor e colocaram-se em tubos cónicos de 50 ml e colocaram-se em gelo. O processamento foi limitado a não mais de 250 mg de tecido por preparação (1 ponta/preparação). Preparou-se de novo a solução de protease por diluição em 6,25 ml de ddH20 fria para uma concentração final de 20 mg/ml e armazenou-se a 4°C. Preparou-se tampão G2 (20 ml) por diluição de ADNase A para uma concentração final de 200 mg/ml (a partir de solução-mãe 100 mg/ml) . Homogeneizou-se o tecido de tumor em 19 ml de tampão G2 durante 60 segundos com a ponta grande do homogeneizador numa hotte de fluxo laminar TC de modo a evitar inalação dos aerossóis e manteve-se à temperatura ambiente. Entre amostras, limpou-se o homogeneizador por rotação a 2x 30 segundos cada, em 2 L de ddH20, seguido por tampão G2 (50 ml). Caso ainda houvesse tecido na ponta do gerador, o aparelho era desmontado e lavado.

Adicionou-se protease de Qiagen (preparada como indicado acima, 1,0 ml), seguido por vórtex e incubação a 50°C durante 3 horas. Repetiram-se a incubação e centrifugação até os lisados estarem límpidos (por exemplo, incubação adicional de 30-60 minutos, sedimentação a 3000 x g durante 10 min., 4°C). 128 ΕΡ 1 623 989/ΡΤ

Preparação e lise de sangue humano:

Obteve-se sangue de voluntários saudáveis utilizando protocolos de agente infeccioso padrões e citrado para amostras de 10 ml por ponta. Preparou-se de novo protease de Qiagen por diluição para 6,25 ml de ddH20 fria para uma concentração final de 20 mg/ml e armazenou-se a 4°C. Preparou-se tampão G2 por diluição de ARNase A para uma concentração final de 200 pg/ml a partir de solução-mãe a 100 mg/ml. Colocou-se o sangue (10 ml) num tubo cónico de 50 ml e adicionaram-se 10 ml de tampão Cl e 30 ml de ddH20 (ambos previamente equilibrados a 4°C) e misturaram-se as componentes por inversão e mantiveram-se em gelo durante 10 minutos. Sedimentaram-se os núcleos com um rotor de cesto basculante Beckman a 2500 rpm, 4°C durante 15 minutos e rejeitou-se o sobrenadante. Suspenderam-se os núcleos com um vórtex em 2 ml de tampão Cl (4°C) e 6 ml de ddH20 (4°C) . Repetiu-se o vórtex até o sedimento estar branco. Os núcleos foram então suspensos no tampão residual utilizando uma ponta de 200 μΐ. Adicionou-se tampão G2 (10 ml) aos núcleos em suspensão enquanto se aplicava um vórtex suave seguido por vórtex vigoroso durante 30 segundos. Adicionou-se protease de Qiagen (200 μΐ) e incubou-se a 50°C durante 60 minutos. Repetiram-se a incubação e centrifugação até os lisados estarem límpidos (por exemplo, incubação adicional durante 30-60 minutos, sedimentação a 3000x g durante 10 min., 4°C) .

Purificação dos lisados límpidos: (1) Isolamento de ADN qenómico:

Equilibrou-se ADN genómico (1 amostra por preparação em ponta maxi) com 10 ml de tampão QBT. Equilibrou-se tampão de eluição QF a 50°C. As amostras foram sujeitas a vórtex durante 30 segundos, seguidamente carregadas para pontas equilibradas e despejadas por gravidade. Lavaram-se as pontas com 2 x 15 ml de tampão QC. Eluiu-se o ADN para tubos Corex de 30 ml silanizados, autoclavados com 15 ml de tampão QF (50°C). Adicionou-se isopropanol (10,5 ml) a cada amostra, cobriram-se os tubos com parafina e misturaram-se por inversão repetida até o ADN precipitar. Sedimentaram-se as amostras por centrifugação no rotor SS-34 a 15 000 rpm durante 10 minutos a 129 ΕΡ 1 623 989/ΡΤ 4°C. Marcou-se a localização do sedimento, rejeitou-se o sobrenadante e adicionou-se 10 ml de etanol a 70% (4°C) . Sedimentaram-se novamente as amostras por centrifugação no rotor SS-34 10 000 rpm durante 10 minutos a 4°C. Marcou-se a localização do sedimento e rejeitou-se o sobrenadante. Colocaram-se os tubos de lado num tabuleiro de secagem e secaram-se durante 10 minutos a 37°C, tendo o cuidado de não secar as amostras em demasia.

Após secagem, dissolveram-se os sedimentos em 1,0 ml de TE (pH 8,5) e colocaram-se a 50°C durante 1-2 horas. Mantiveram-se as amostras durante a noite a 4°C à medida que continuava a dissolução. Transferiu-se então a solução de ADN para tubos de 1,5 ml com uma agulha de calibre 26 numa seringa de tuberculina. Repetiu-se a transferência 5x de modo a cortar o ADN. Colocaram-se então as amostras a 50 °C durante 1-2 horas. (2) Quantificação de ADN genómico e preparação para ensaio de amplificação génica:

Quantificaram-se os níveis de ADN em cada tubo por espectrofotometria A26o/A28o padrão numa diluição 1:20 (5 μΐ de ADN + 95 μΐ de ddH20) utilizando cuvetes de quartzo de 0,1 ml no espectrof otómetro Beckman DU640. As razões A260/A28o estiveram na gama de 1,8-1,9. Diluiu-se então cada amostra de ADN adicionalmente até aproximadamente 200 ng/ml em TE (pH 8,5). Quando o material original estava altamente concentrado (cerca de 700 ng/μΐ), colocou-se o material a 50°C durante várias horas até ressuspender. A quantificação fluorimétrica de ADN foi então efectuada no material diluído (20-600 ng/ml) utilizando as orientações do fabricante, modificadas como descrita adiante. Tal foi efectuado deixando aquecer um fluorímetro Hoeffer DyNA Quant 200 durante cerca de 15 minutos. Diluiu-se a solução de trabalho de corante Hoechst (n.° H33258, 10 μΐ, preparado a menos de 12 horas da utilização) para 100 ml de tampão lx TNE. Encheu-se uma cuvete de 2 ml com a solução de fluorímetro, colocou-se na máquina e ajustou-se a máquina a zero. Adicionou-se pGEM 3Zf( + ) (2 μΐ, lote n.° 360851026) a 2 ml de solução de fluorímetro e calibrou-se a 200 unidades. 130 ΕΡ 1 623 989/ΡΤ

Ensaiou-se então 2 μΐ de ADN pGEM 3Zf (+) adicionais e a leitura confirmou 400 +/- 10 unidades. Leu-se então cada amostra pelo menos em triplicado. Quando se verificou que 3 amostras estavam dentro do intervalo de 10% umas das outras, efectuou-se a sua média e utilizou-se este valor como o valor de quantificação. A concentração determinada fluorimetricamente foi então utilizada para diluir cada amostra a 10 ng/μΐ em ddH20. Tal foi efectuado simultaneamente em todas as amostras molde para um ensaio de placa TaqMan™ único e com material suficiente para efectuar 500-1000 ensaios. Ensaiaram-se as amostras em triplicado com iniciadores Taqman™ e sondou-se tanto B-actina como GAPDH numa placa única com ADN humano normal e controlos sem molde. Utilizaram-se as amostras diluídas desde que o valor de CT de ADN humano normal subtraído do ADN de teste fosse +/- 1 Ct. O ADN genómico de lote qualificado diluído foi armazenado em alíquotas de 1,0 ml a -80°C. As alíquotas que foram utilizadas subsequentemente no ensaio de amplificação génica foram armazenadas a 4°C. Cada alíquota de 1 ml é suficiente para 8-9 placas ou 64 ensaios.

Ensaio de amplificação génica:

Os compostos do invento foram rastreados nos seguintes tumores primários e os valores de ACt resultantes apresentam-se na tabela 7.

Tabela 7

Valores de ACt no tumor primário do pulmão e do cólon e em modelos de linhas celulares Tumor Primário PR07168 HF-000631 1, 43 HF-000641 - HF-000643 - HF-000840 2,65 HF-000842 1, 73 HBL100 - MB435S - T47D - MB468 - MB175 - 131 ΕΡ 1 623 989/ΡΤ

Valores de ACt no tumor primário do pulmão e do cólon e em modelos de linhas celulares Tumor Primário PR07168 MB361 - BT20 - MCF7 - SKBR3 - PR07168 (DNA102846-2742):

Os valores de ACt para DNA102846-2742 em vários tumores apresentam-se na tabela 7B. Utilizou-se tipicamente um ACt >1 como valor limiar para pontuação de amplificação, já que isso representa uma duplicação de cópias do gene. A tabela 7B indica que ocorreu amplificação significativa de ácido nucleico de DNA102846-2742 que codifica PR07168 em tumores de pulmão primários: HF-000631, HF-000840 e HF-000842.

Dado que a amplificação de DNA102846-2742 ocorre em vários tumores, é altamente provável que desempenhe um papel significativo na formação ou crescimento de tumor. Como resultado, será de esperar que antagonistas (por exemplo, anticorpos) dirigidos contra a proteína codificada por DNA102846-2742 (PR07168) sejam úteis em terapia contra o cancro, papel significativo na formação ou crescimento de tumor. Como resultado, será de esperar que antagonistas (por exemplo, anticorpos) dirigidos contra a proteína codificada por DNA97003-2649 (PRO4980) sejam úteis em terapia contra o cancro. EXEMPLO 5

Hibridação in situ A hibridação in situ é uma técnica potente e versátil para a detecção e localização de sequências de ácido nucleico dentro de células ou preparações de tecidos. Pode ser útil, por exemplo, para identificar locais de expressão génica, analisar a distribuição de transcrição nos tecidos, identificar e localizar infecção virai, seguir alterações em síntese de ARNm específico e auxiliar em mapeamento de cromossomas. 132 ΕΡ 1 623 989/ΡΤ A hibridação in situ foi efectuada seguindo uma versão optimizada do protocolo de Lu e Gillett, Cell Vision, _1:169 — 176(1994), utilizando ribossondas marcadas com 33P geradas por PCR. Sucintamente, seccionaram-se tecidos humanos fixados com formalina e embebidos em parafina, desparafinizaram-se, desproteinaram-se em proteinase K (20 g/ml) durante 15 minutos a 37°C e processaram-se adicionalmente para hibridação in situ tal como descrito por Lu e Gillett, supra. Gerou-se uma ribossonda anti-sentido marcada com (33-P)UTP a partir de um produto de PCR e hibrida-se a 55°C durante a noite. Mergulharam-se as lâminas em emulsão de traçador nuclear Kodak NTB2™ e expõe-se durante 4 semanas.

Sintese de 33P-Ribossonda

Liofilizaram-se num Speed-Vac 6,0 μΐ (125 mCi) de 33P-UTP (Amersham BF 1002, SA<2000 Ci/mmol). Para cada tubo contendo o 33P-UTP seco adicionaram-se os seguintes ingredientes: 20 μΐ de 5x tampão de transcrição 1.0 μΐ de DTT (100 mM) 2.0 μΐ de mistura NTP (2,5 mM: 10 μΐ cada de GTP, CTP e ATP, todos 10 mM + 10 μΐ H20) 1.0 μΐ de UTP (50 μΜ) 1.0 μΐ de RNAsin 1.0 μΐ de molde de ADN (1 pg) 1.0 μΐ de H20 1.0 μΐ de ARN polimerase (para produtos de PCR T3= AS, T7= S, usualmente)

Incubaram-se os tubos a 37°C durante uma hora.

Adicionou-se um total de 1,0 μΐ de RQ1 ADNase, seguido por incubação a 37°C durante 15 minutos. Adicionou-se um total de 90 μΐ de TE (Tris 10 mM, pH 7,6/EDTA 1 mM, pH 8,0) e pipetou-se a mistura para papel DE81. A solução restante foi carregada numa unidade de filtração MICROCON-50™ e centrifugada utilizando o programa 10 (6 minutos). Inverteu-se a unidade de filtração para um segundo tubo e centrifugou-se utilizando o programa 2 (3 minutos). Após a centrifugação de recuperação final, adicionou-se um total de 100 μΐ de TE, seguidamente pipetou-se 1 μΐ do produto final em papel DE81 e contou-se em 6 ml de BIOFLUOR II™. 133 ΕΡ 1 623 989/ΡΤ

Correu-se a sonda num gel de TBE/ureia. Adicionou-se um total de 1-3 μΐ da sonda ou 5 μΐ de ARN Mrk III a 3 μΐ de tampão de carga. Após aquecimento a 95°C num bloco de aquecimento durante três minutos, colocou-se o gel imediatamente em gelo. Lavaram-se os poços do gel e carregou-se a amostra e correu-se a 180-250 volts durante 45 minutos. Embrulhou-se o gel em pelicula plástica (marca SARAN™) e expôs-se a pelicula xar com um monitor intensificador num congelador a -70°C durante uma hora até durante a noite.

Hibridação com 33P A. Pré-tratamento de secções congeladas

Removeram-se as lâminas do congelador, colocam-se em tabuleiros de alumínio e descongelam-se à temperatura ambiente durante 5 minutos. Colocaram-se os tabuleiros num incubador a 55°C durante cinco minutos para reduzir a condensação. Fixaram-se as lâminas durante 10 minutos em paraformaldeído a 4% em gelo numa hotte e lavaram-se com SSC 0,5x durante 5 minutos, à temperatura ambiente (25 ml SSC 20x + 975 ml SQ H20) . Após desproteinação em proteinase K a 0,5 pg/ml durante 10 minutos a 37°C (12,5 μΐ de solução-mãe a 10 mg/ml em 250 ml de tampão ARNase isento de ARNase pré-aquecido), lavaram-se as secções com SSC 0,5x durante 10 minutos à temperatura ambiente. Desidrataram-se as secções em etanol a 70%, 95% e 100%, 2 minutos cada. B. Pré-tratamento de secções embebidas em parafina

Desparafinizaram-se as lâminas, colocaram-se em SQ H20 e enxaguaram-se duas vezes com SSC 2x à temperatura ambiente, durante 5 minutos de cada vez. Desproteinaram-se as secções em proteinase K 20 pg/ml (500 μΐ de 10 mg/ml em 250 ml de tampão ARNase isento de ARNase, 37°C, 15 minutos) para tecido de embrião humano ou 8x proteinase K (100 μΐ em 250 ml de tampão ARNase, 37°C, 30 minutos) para tecidos em formalina.

Efectuaram-se uma lavagem subsequente com SSC 0,5x e desidratação tal como descrito acima. 134 ΕΡ 1 623 989/ΡΤ C. Pré-hibridação

Colocaram-se as lâminas numa caixa de plástico forrada com papel de filtro de saturado com tampão de caixa (SSC 4x, formamida a 50%) . Cobriu-se o tecido com 50 μΐ de tampão de hibridação (3,75 g de sulfato de dextrano + 6 ml SQ H20), sujeitou-se a vórtex e aqueceu-se no microondas durante 2 minutos com a tampa solta. Após arrefecer em gelo, adicionou-se 18,75 ml de formamida, 3,75 ml de SSC 20x e 9 ml de SQ H20 e sujeitou-se bem o tecido a vórtex e incubou-se a 42°C durante 1-4 horas. D. Hibridação

Aqueceu-se a 95°C durante 3 minutos, 1,0 x 106 cpm de sonda e 1,0 μΐ de ARNt (50 mg/ml solução-mãe) por lâmina. Arrefeceram-se as lâminas em gelo e adicionaram-se 48 μΐ de tampão de hibridação por lâmina. Após vórtex, adicionaram-se 50 μΐ de mistura 33P a 50 μΐ de pré-hibridação na lâmina. Incubaram-se as lâminas durante a noite a 55°C. E. Lavagens A lavagem foi efectuada durante 2x 10 minutos com SSC 2x, EDTA à temperatura ambiente (400 ml de SSC 20x + 16 ml de EDTA 0,25 M, Vf=4L), seguido por tratamento com ARNase a 37°C durante 30 minutos (500 μΐ de 10 mg/ml em 250 ml de tampão ARNase = 20 pg/ml). Lavaram-se as lâminas 2 x 10 minutos com SSC 2x, EDTA à temperatura ambiente. As condições de rigor da lavagem foram as seguintes: 2 horas a 55°C, SSC 0,lx, EDTA (20 ml SSC 20x + 16 ml EDTA, Vf=4L). EXEMPLO 6

Utilização de PR07168 como sonda de hibridação O seguinte método descreve a utilização de uma sequência de nucleótidos que codifica um polipéptido PR07168 como uma sonda de hibridação.

Pode utilizar-se ADN incluindo a sequência de codificação de um polipéptido PR07168 de comprimento completo ou maduro, tal como aqui revelado e/ou seus fragmentos, como sonda para rastrear ADN homólogo (tal como os que codificam variantes de 135 ΕΡ 1 623 989/ΡΤ ocorrência natural de PR07168 em bibliotecas de ADNc de tecido humano ou bibliotecas genómicas de tecido humano. A hibridação e a lavagem de filtros contendo qualquer das bibliotecas de ADN é efectuada sob as seguintes condições de elevado rigor. A hibridação da sonda derivada de PR07168 marcada radioactivamente é efectuada numa solução de formamida a 50%, SSC 5x, SDS a 0,1%, pirofosfato de sódio a 0,1%, fosfato de sódio 50 mM, pH 6,8, solução de Denhardt 2x e sulfato de dextrano a 10% a 42°C durante 20 horas. A lavagem dos filtros é efectuada numa solução aquosa de SSC 0,lx e SDS a 0,1% a 42°C.

Pode então ser identificado o ADN com a identidade de sequência pretendida com o ADN que codifica a sequência nativa de comprimento completo de PR07168, utilizando técnicas padrão conhecidas na especialidade. EXEMPLOS 7

Expressão de polipéptidos PR07168 em E. coli

Este exemplo ilustra a preparação de uma forma não glicosilada de PR07168 por expressão recombinante em E. coli. A sequência de ADN que codifica o polipéptido PRO de interesse é inicialmente amplificada utilizando iniciadores de PCR seleccionados. Os iniciadores devem conter locais de enzima de restrição que correspondem aos locais de enzima de restrição do vector de expressão seleccionado. Podem ser utilizados vários vectores de expressão. Constitui um exemplo de um vector adequado pBR322 (derivado de E. coli; consultar Bolívar et al., Gene, 2:95 (1977)) que contém genes para resistência a ampicilina e tetraciclina. O vector é digerido com enzima de restrição e desfosforilado. Ligam-se então as sequências amplificadas por PCR ao vector. O vector incluirá, de preferência, sequências que codificam um gene de resistência a antibiótico, um promotor trp, um comando poli-His (incluindo os primeiros seis codões STII, sequência poli-His e local de clivagem de enteroquinase), a região de codificação de PR07168, o terminador de transcrição lambda e um gene argU. 136 ΕΡ 1 623 989/ΡΤ A mistura de ligação é então utilizada para transformar uma estirpe de E. coli seleccionada utilizando os métodos descritos em Sambrook et al., supra. Identificam-se os transformantes pela sua capacidade de crescer em placas lb e seleccionam-se colónias resistentes a antibióticos. 0 ADN de plasmideo pode ser isolado e confirmado por análise de restrição e sequenciação de ADN.

Podem cultivar-se clones seleccionados durante a noite em meio de cultura liquido, tal como meio LB suplementado com antibióticos. A cultura durante a noite pode ser subsequentemente utilizada para inocular uma cultura em maior escala. Cultivam-se então as células até uma densidade óptica pretendida, durante a qual a expressão de promotor é iniciada.

Após cultura das células durante mais algumas horas, as células podem ser recolhidas por centrifugação. 0 sedimento celular obtido na centrifugação pode ser solubilizado utilizando vários agentes conhecidos na especialidade e a proteína PR07168 solubilizada pode ser então purificada utilizando uma coluna quelante de metais, em condições que permitem ligação forte da proteína. A proteína PRO pode ser expressa em E. coli numa forma marcada com poli-His, utilizando o seguinte procedimento. 0 ADN que codifica PRO é inicialmente amplificado utilizando iniciadores de PCR seleccionados. Os iniciadores contêm locais para enzimas de restrição adequados que correspondem aos locais de enzimas de restrição no vector de expressão seleccionado e outras sequências úteis para um início de tradução fiável e eficiente, uma purificação rápida numa coluna de quelação de metal e uma remoção proteolítica com enteroquinase. Ligam-se então as sequências amplificadas por PCR marcadas com poli-His, num vector de expressão, que é utilizado para transformar um hospedeiro E. coli com base na estirpe 52 (W3110 fuhA(tonA) lon galE rpoHts(htpRts) clpP(lacIq). Crescem-se os transformantes primeiro em LB contendo carbenicilina a 50 mg/ml a 30°C, com agitação, até se atingir uma D.O. de 3-5 a 600 nm. Diluem-se então as culturas 50-100 vezes em meio CRAP (preparado por mistura de 3,57 g de (NH4)2S04, 0,71 g de citrato de sódio-2H20, 1, 07 g de KC1, 5,36 g de extracto de levedura Difco, 5,36 g de hycase SF de 137 ΕΡ 1 623 989/ΡΤ

Sheffield em 500 ml de água, bem como MPOS 110 mM, pH 7,3, glucose a 0,55% (p/v) e MgSCh 7 mM) e crescem-se durante aproximadamente 20-30 horas a 30°C com agitação. Removem-se as amostras para verificar a expressão por SDS-page e centrifuga-se a cultura em bruto para sedimentar as células. Congelam-se os sedimentos de células até purificação e re-dobragem.

Ressuspende-se a pasta de E. colí de fermentações de 0,5 a 1 L (sedimentos de 6-10 g) em 10 volumes (p/v) em tampão de guanidina 7 M, Tris 20 mM, pH 8. Adiciona-se sulfito de sódio sólido e tetrationato de sódio para obter concentrações finais de 0,1 M e 0,02 M, respectivamente, e agita-se a solução durante a noite a 4°C. Esta etapa resulta numa proteína desnaturada com todos os resíduos de cisteína bloqueados por sulfitação. Centrifuga-se a solução a 40 000 rpm numa ultracentrífuga Beckman durante 30 min. Dilui-se o sobrenadante com 3-5 volumes de tampão de coluna de quelação de metal (guanidina 6 M, Tris 20 mM, pH 7,4) e filtra-se através de filtros de 0,22 micra para clarificar. O extracto clarificado é carregado para uma coluna de quelação de metais Qiagen Ni2+-NTA de 5 ml equilibrada no tampão de coluna de quelação de metal. Lava-se a coluna com tampão adicional contendo imidazole 50 mM (Calbiochem, grau Utrol), pH 7,4. Eluem-se as proteínas com tampão contendo imidazole 250 mM. Recolhem-se conjuntamente as fracções que contêm a proteína pretendida e armazenam-se a 4°C. Estima-se a concentração de proteína através da sua absorvância a 280 nm, utilizando o coeficiente de extinção calculado com base na sua sequência de aminoácidos. A proteína é re-dobrada por diluição lenta da amostra para tampão de re-dobragem preparado recentemente que consiste de: Tris 20 mM, pH 8,6, NaCl 0,3 M, ureia 2,5 M, cisteína 5 mM, glicina 20 mM e EDTA 1 mM. Os volumes de re-dobragem são seleccionados de modo a que a concentração final de proteína esteja entre 50 a 100 microgramas/ml. Agita-se suavemente a solução de re-dobragem a 4°C durante 12-36 horas. Pára-se a reacção de re-dobragem por adição de TFA para uma concentração final de 0,4% (pH aproximadamente igual a 3). Antes de purificação adicional da proteína, filtra-se a solução através de um filtro de 0,22 micra e adiciona-se acetonitrilo para uma 138 ΕΡ 1 623 989/ΡΤ concentração final de 2-10%. Sujeita-se a proteína re-dobrada a cromatografia numa coluna de fase reversa Poros Rl/H utilizando um tampão móvel de TF A a 0,1% com eluição com um gradiente de acetonitrilo de 10 a 80%. Analisam-se as alíquotas de fracções com absorvância A2so em géis de SDS poliacrilamida e recolhem-se conjuntamente as fracções contendo proteína re-dobrada homogénea. Em geral, as espécies com re-dobragem adequado da maioria das proteínas são eluídas às concentrações mais baixas de acetonitrilo, dado que essas espécies são as mais compactas com os seus interiores hidrófobos protegidos de interacção com a resina de fase reversa. As espécies agregadas são usualmente eluídas a concentrações de acetonitrilo mais elevadas. Além de resolver as formas com dobragem incorrecto das proteínas relativamente à forma pretendida, a etapa de fase reversa também remove endotoxina das amostras.

As fracções contendo a proteína PRO dobrada pretendida são agrupadas e remove-se o acetonitrilo utilizando uma corrente suave de azoto dirigida para a solução. As proteínas são formuladas em Hepes 20 mM, pH 6,8 com cloreto de sódio 0,14 M e manitol a 4% por diálise ou por filtração em gel utilizando resinas G25 Superfina (Pharmacia) equilibradas em tampão de formulação e esterilizadas por filtração. EXEMPLO 8

Expressão de PR07168 em células de mamífero

Este exemplo ilustra a preparação de uma forma potencialmente glicosilada de PR07168 por expressão recombinante em células de mamífero. O vector, pRK5 (consultar EP 307 247, publicado a 15 de Março de 1989), é utilizado como o vector de expressão. Opcionalmente, liga-se o ADN de PR07168 a pRK5 com enzimas de restrição seleccionadas para permitir inserção do ADN de PR07168 utilizando métodos de ligação, tal como descrito em Sambrook et ai., supra. O vector resultante é denominado pRK5-PR07168. 139 ΕΡ 1 623 989/ΡΤ

Numa concretização, as células hospedeiras seleccionadas podem ser células 293. Cultivam-se células 293 humanas (ATCC CCL 1573) até à confluência em placas de cultura de tecidos em meio tal como dmem suplementado com soro fetal de vitelo e opcionalmente, componentes nutrientes e/ou antibióticos. Mistura-se cerca de 10 pg de ADN de pRK5-PR07168 com cerca de 1 pg de ADN que codifica o gene VA RNA [Thimmappaya et al. , Cell, 3JL:543 (1982)] e dissolve-se em 500 pl de Tris-HCl 1 mM, edta 0,1 mM, CaCl2 0,227 Μ. A esta mistura adiciona-se, gota a gota, 500 pl de HEPES 50 mM (pH 7,35), NaCl 280 mM. NaP04 1,5 mM e deixa-se formar um precipitado durante 10 minutos a 25°C. Suspende-se o precipitado e adiciona-se a células 293 e permite-se sedimentar durante cerca de quatro horas a 37°C. Aspira-se o meio de cultura e adiciona-se 2 ml de glicerol a 20% em PBS durante 30 segundos. Lavam-se então as células 293 com meio isento de soro, adiciona-se meio fresco e incubam-se as células durante cerca de 5 dias.

Aproximadamente 24 horas após as transfecções, remove-se o meio de cultura e substitui-se por meio de cultura (sozinho) ou meio de cultura contendo 35S-cisteína 200 pCi/ml e 35S-metionina 200 pCi/ml. Após uma incubação de 12 horas, recolhe-se o meio condicionado, concentrado num filtro giratório e carrega-se para um gel de SDS a 15%. O gel processado pode ser seco e exposto a película durante um periodo seleccionado para revelar a presença do polipéptido PR07168. As culturas contendo células transfectadas podem ser sujeitas a incubação adicional (em meio isento de soro) e o meio é ensaiado em bioensaios seleccionados.

Numa técnica alternativa, pode introduzir-se ADN de PR07168 em células 293 transientemente utilizando o método do sulfato de dextrano descrito por Somparyrac et al., Proc. Natl. Acad. Sei., _1_2:7575 (1981). Cultivam-se as células 293 até densidade máxima num balão rotativo e adiciona-se 700 pg de ADN de PRK5-PR07168. As células são primeiro concentradas a partir do balão rotativo por centrifugação e lavam-se com PBS. Incuba-se o precipitado de ADN-dextrano no sedimento celular durante quatro horas. Tratam-se as células com glicerol a 20% durante 90 segundos, lavam-se com meio de cultura de tecidos e re-introduzem-se no balão rotativo contendo meio de cultura de tecidos, insulina bovina a 5 pg/ml e transferrina bovina a 140 ΕΡ 1 623 989/ΡΤ 0,1 pg/ml. Após cerca de quatro dias, o meio condicionado é centrifugado e filtrado para remover células e resíduos. A amostra contendo o PR07168 expresso pode então ser concentrada e purificada por qualquer método seleccionado, tal como diálise e/ou cromatografia em coluna.

Noutra concretização, o PR07168 pode ser expresso em células CHO. O vector pRK5-PR07168 pode ser transfectado para células CHO utilizando reagentes conhecidos, tais como CaP04 ou DEAE-dextrano. Tal como descrito acima, as culturas celulares podem ser incubadas e o meio substituído com meio de cultura (sozinho) ou meio contendo um marcador radioactivo, tal como 35S-metionina. Após determinar a presença do polipéptido PR07168, o meio de cultura pode ser substituído por meio isento de soro. De preferência, as culturas são incubadas durante cerca de 6 dias e seguidamente recolhe-se o meio condicionado. O meio contendo o PR07168 expresso pode então ser concentrado e purificado por qualquer método seleccionado.

Pode também expressar-se o PR07168 marcado com epítopo em células hospedeiras CHO. O PR07168 pode ser subclonado do vector pRK5. A inserção do subclone pode ser sujeita a PCR para fundir em enquadramento com um marcador epitópico seleccionado, tal como um marcador poli-His, num vector de expressão de baculovírus. A inserção de PR07168 marcada com poli-His pode então ser subclonada num vector dirigido por SV40 contendo um marcador de selecção, tal como DHFR para selecção de clones estáveis. Finalmente, as células CHO podem ser transfectadas (tal como descrito acima) com o vector dirigido por SV40. A marcação pode ser efectuada, tal como descrito acima, para verificar expressão. O meio de cultura contendo o PR07168 marcado com poli-His expresso pode então ser concentrado e purificado por qualquer método seleccionado, tal como por cromatograf ia de afinidade em Ni2+-quelato. A expressão em células CHO e/ou COS pode também ser conseguida por um procedimento de expressão transiente. A proteína PRO pode ser expressa em células CHO através de um procedimento de expressão estável ou por um procedimento transiente. A expressão estável em células CHO é efectuada utilizando o seguinte procedimento. As proteínas são expressas 141 ΕΡ 1 623 989/ΡΤ numa construção de igG (imunoadesina), nas quais as sequências de codificação para as formas solúveis (por exemplo, domínios extracelulares) das proteínas respectivas foram fundidas a uma sequência de região constante de igGl contendo os domínios de charneira, CH2 e CH2 e/ou numa forma marcada com poli-His.

Após amplificação por PCR, os ADN respectivos são subclonados para um vector de expressão CHO utilizando técnicas padrão, tal como descrito em Ausubel et al., Current Protocols of Molecular Biology, Unidade 3.16, John Wiley and Sons (1997) . Os vectores de expressão CHO são construídos de modo a terem locais de restrição 5' e 3' compatíveis com o ADN de interesse, para permitir a manipulação adequada de ADNc. 0 vector utilizado para expressão em células CHO é tal como descrito em Lucas et al., Nucl. Acids Res., 24:9 (1774-1779 (1996) e utiliza o promotor/potenciador precoce de SV40 para dirigir a expressão do ADNc de interesse e di-hidrofolato redutase (DHFR). A expressão de DHFR permite a selecção para manutenção estável do plasmídeo após transfecção.

Introduz-se doze miligramas do ADN de plasmídeo pretendido em aproximadamente 10 milhões de células CHO utilizando reagentes de transfecção Superfect® (Qiagen), Dosper® ou Fugene® (Boehringer Mannheim) comercialmente disponíveis. Cultivam-se as células tal como descrito em Lucas et al., supra. Congelam-se aproximadamente 3 x 107 numa ampola para cultura adicional e produção, tal como descrito adiante.

Descongelam-se as ampolas contendo o ADN de plasmídeo colocando-as num banho de água e mistura-se por vórtex. Pipeta-se o conteúdo para um tubo de centrífuga contendo 10 ml de meio e centrifuga-se a 1000 rpm durante 5 minutos. Aspira-se o sobrenadante e ressuspendem-se as células em 10 ml de meio selectivo (filtrado por PS20 de 0,2 pm com soro bovino fetal diafiltrado por 0,2 pm a 5%). As células são então divididas em alíquotas para um balão rotativo de 100 ml contendo 90 ml de meio selectivo. Após 1-2 dias, transferem-se as células para um balão rotativo de 250 ml contendo 150 ml de meio de cultura selectivo e incuba-se a 37°C. Após mais 2-3 dias, inoculam-se balões rotativos de 250 ml, 500 ml e 2000 ml com 3 x 105 células/ml. O meio celular é permutado com meio fresco por centrifugação e ressuspensão em meio de 142 ΕΡ 1 623 989/ΡΤ produção. Embora possa ser utilizado qualquer meio de CHO adequado, prefere-se um meio de produção descrito na Patente US N.° 5 122 469, concedida a 16 de Junho de 1992. Inocula-se um balão rotativo de produção de 3 L a 1,2 x 106 células/ml. No dia 0, determina-se o número de células e o pH. No dia 1, amostra-se o balão rotativo e inicia-se a aspersão com ar filtrado. No dia 2, amostra-se o balão rotativo, muda-se a temperatura para 33°C e adiciona-se 30 ml de glucose a 500 g/L e 0,6 ml de anti-espuma a 10% (por exemplo, emulsão de polidimetilsiloxano a 35%, Dow Corning 365 emulsão de grau médico). Ao longo da produção, ajusta-se o pH como necessário para mantê-lo a cerca de 7,2. Após 10 dias, ou até a viabilidade atingir um valor inferior a 70%, recolhe-se o meio de cultura por centrifugação e filtra-se através de um filtro de 0,22 pm. O filtrado é armazenado a 4°C ou carregado imediatamente em colunas para purificação.

Para as construções marcadas com poli-His, as proteínas são purificadas utilizando uma coluna ní2+-nta (Qiagen). Antes de purificação, adiciona-se imidazole ao meio condicionado a uma concentração de 5 mM. Bombeia-se o meio condicionado para uma coluna de Ni2+-NTA de 6 ml equilibrada em tampão Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazole 5 mM, a um caudal de 4-5 ml/min. a 4°C. Após carga, lava-se a coluna com tampão de equilíbrio adicional e elui-se a proteína com tampão de equilíbrio contendo imidazole 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada para um tampão de armazenagem contendo Hepes 10 mM, NaCl 0,14 Me manitol a 4%, pH 6,8, com uma coluna de 25 ml de G25 Superfina (Pharmacia) e armazenada a -80°C.

As construções de imunoadesina (contendo Fc) são purificadas do meio condicionado da seguinte forma. Bombeia-se 0 meio condicionado para 5 ml de coluna de Proteína A (Pharmacia) que foi equilibrada em tampão Na fosfato 20 mM, pH 6,8. Após carga, lava-se a coluna extensivamente com tampão de equilíbrio antes de eluir com ácido cítrico 100 mM, pH 3,5. Neutraliza-se a proteína eluída imediatamente por recolha de fracções de 1 ml para tubos contendo 275 μΐ de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada para tampão de armazenamento tal como descrito acima para as proteínas marcadas com poli-His. Avalia-se a 143 ΕΡ 1 623 989/ΡΤ homogeneidade em géis de SDS-poliacrilamida e por sequenciação dos aminoácidos N-terminais por degradação de Edman. EXEMPLO 9

Expressão de PR07168 em levedura 0 seguinte método descreve expressão recombinante de PR07168 em levedura.

Primeiro, constroem-se vectores de expressão de levedura para produção intracelular ou excreção de PR07168 a partir do promotor ADH2/GAPDH. 0 ADN que codifica PR07168 e o promotor é inserido em locais de enzimas de restrição adequados no plasmideo seleccionado para dirigir a expressão intracelular de PR07168. Para excreção, pode clonar-se ADN que codifica PR07168 no plasmideo seleccionado, conjuntamente com ADN que codifica o promotor ADH2/GAPDH, um péptido de sinal de PR07168 nativo ou outro péptido de sinal de mamífero ou, por exemplo, uma sequência de sinal/comando de factor alfa de levedura ou de excreção de invertase e sequências ligantes (caso necessário) para expressão de PR07168.

As células de levedura, tal como levedura estirpe AB110, podem ser então transformadas com os plasmídeos de expressão descritos acima e cultivadas em meio de fermentação seleccionado. Os sobrenadantes de levedura transformados podem ser analisados por precipitação com ácido tricloroacético a 10% e separação por SDS-PAGE, seguido de coloração dos géis com corante azul de Coomassie. O PR07168 recombinante pode subsequentemente ser isolado e purificado por remoção das células de levedura a partir do meio de fermentação por centrifugação e seguidamente concentrando o meio utilizando filtros de cartucho seleccionados. O concentrado contendo PR07168 pode ser purificado adicionalmente utilizando resinas de cromatografia em coluna seleccionadas. 144 ΕΡ 1 623 989/ΡΤ EXEMPLO 10

Expressão de PRQ7168 em células de insecto infectadas com baculovírus O seguinte método descreve expressão recombinante em células de insecto infectadas com baculovirus. A sequência de codificação para PR07168 é fundida a montante de um marcador epitópico contido dentro de um vector de expressão de baculovirus. Tais marcadores epitópicos incluem marcadores poli-His e marcadores de imunoglobulina (tal como regiões Fc de igG). Podem ser utilizados vários plasmideos, incluindo plasmideos derivados de plasmideos disponíveis comercialmente, tal como pVLl393 (Novagen). Sucintamente, a sequência de codificação de PR07168 ou a porção pretendida da sequência de codificação de PR07168 [tal como a sequência que codifica o domínio extracelular de uma proteína transmembranar ou a sequência que codifica a proteína madura caso o proteína seja extracelular] é amplificada por PCR com iniciadores complementares a regiões 5' e 3'. O iniciador 5' pode incorporar locais de enzima de restrição flanqueadores (seleccionados). O produto é então digerido com essas enzimas de restrição seleccionadas e subclonado para o vector de expressão.

Gera-se o baculovírus recombinante por co-transfecção do plasmídeo acima e ADN de vírus BaculoGold™ (Pharmingen) para células Spodoptera frugiperda ("Sf9") (ATCC CRL 1711) utilizando Lipofectine (disponível comercialmente de GIBCO-BRL). Após 4-5 dias de incubação a 28°C, recolhem-se os vírus libertados e utilizam-se para amplificações adicionais. A infecção virai e expressão de proteína são efectuadas tal como descrito por O'Reilley et al., Baculovirus expression vectors: A Laboratory Manual, Oxford: Oxford University Press (1994). O PR07168 marcado com poli-His expresso pode então ser purificado, por exemplo, por cromatografia de afinidade de Ni2+-quelato, tal como se segue. Preparam-se os extractos a partir de células Sf9 infectadas com vírus recombinantes, tal como descrito por Rupert et al., Nature, 362:175-179 (1993).

Sucintamente, lavam-se as células Sf9, ressuspendem-se em tampão de ultra-sons (25 ml de Hepes, pH 7,9; MgCl2 12,5 mM; EDTA 0,1 mM; glicerol a 10%; NP-40 a 0,1%; KC1 0,4 M) e 145 ΕΡ 1 623 989/ΡΤ trataram-se duas vezes com ultra-sons durante 20 segundos em gelo. Clarificam-se os resultantes por centrifugação e dilui-se o sobrenadante 50 vezes em tampão de carga (fosfato 50 mM, NaCl 300 mM, glicerol a 10%, pH 7,8) e filtra-se através de um filtro de 0,45 pm. Prepara-se uma coluna de Ni2+-NTA agarose (disponível comercialmente de Qiagen) com um volume de leito de 5 ml, lava-se com 25 ml de água e equilibra-se com 25 ml de tampão de carga. Carrega-se o extracto celular filtrado para a coluna a 0,5 ml por minuto. Lava-se a coluna até A2so igual ao da linha de base com tampão de carga, ponto no qual se inicia a recolha de fracções. Seguidamente, lava-se a coluna com um tampão de lavagem secundário (fosfato 50 mM; NaCl 300 mM, glicerol a 10%, pH 6,0), que elui proteína ligada não especificamente. Após atingir novamente um A28o idêntico ao da linha de base, desenvolve-se a coluna com um gradiente de imidazole de 0 a 500 mM no tampão de lavagem secundário. Recolhem-se fracções de um ml e analisam-se por SDS-PAGE e coloração com prata ou hibridação de Western com ní2+-nta conjugado a fosfatase alcalina (Qiagen) . Agrupam-se as fracções contendo PR07168 marcado com HislO eluidas, respectivamente, e dialisadas contra tampão de carga.

Alternativamente, a purificação do PR07168 marcado com igG (ou marcado com Fc) pode ser efectuada utilizando técnicas de cromatografia conhecidas, incluindo por exemplo, cromatografia em coluna de Proteína A ou proteína G.

Embora a expressão seja de facto efectuada numa escala de 0,5-2 L, pode ser facilmente efectuada em preparações em maior escala (por exemplo, 8 L). As proteínas são expressas como uma construção IgG (imunoadesina), na qual a região extracelular da proteína está fundida a uma sequência de região constante de igGl contendo os domínios de charneira, CH2 e CH3 e/ou em formas marcadas com poli-His.

Após amplificação por PCR, as sequências de codificação respectivas são subclonadas para um vector de expressão de baculovírus (pb.PH.IgG para fusões IgG e pb.PH.His.c para proteínas marcadas com poli-His) e co-transfectam-se o vector e ADN de baculovírus Baculogold® (Pharmingen) para células 105 de Spodoptera frugiperda ("Sf9") (ATCC CRL 1711), utilizando Lipofectine (Gibco BRL). pb.PH.IgG e pb.PH.His são 146 ΕΡ 1 623 989/ΡΤ modificações do vector de expressão de baculovírus pVLl393 disponível comercialmente (Pharmingen), com regiões de poliligante modificadas de modo a incluir sequências de marcador His ou Fc. Cultivam-se as células em meio tnm-fh de Hink suplementado com FBS a 10% (Hyclone) . Incubam-se as células durante 5 dias a 28°C. Recolhe-se o sobrenadante e utiliza-se subsequentemente para a primeira amplificação virai, infectando células Sf9 em meio TNM-FH de Hink suplementado com FBS a 10% a uma multiplicidade de infecção (MOI) de aproximadamente 10. Incubam-se as células durante 3 dias a 28°C. Recolhe-se o sobrenadante e determina-se a expressão de construções no vector de expressão de baculovírus por ligação em lote de 1 ml de sobrenadante a 25 ml de pérolas de Ni2+-NTA (QIAGEN) para proteínas marcadas com histidina ou pérolas Proteína A-Sepharose CL-4B (Pharmacia) para proteínas marcadas com IgG, seguido por análise por SDS-PAGE, por comparação com um padrão de proteína de concentração conhecida por coloração com azul de Coomassie. O sobrenadante da primeira amplificação virai é utilizado para infectar uma cultura em frasco giratório (500 ml) de células Sf9 cultivadas em meio ESF-921 (Expression Systems LLC) a uma MOI de aproximadamente 0,1. Incubam-se as células durante 3 dias a 28°C. Recolhe-se o sobrenadante e filtra-se. Repete-se a ligação em lote e a análise por SDS-PAGE, como necessário, até se confirmar expressão da cultura em frasco giratório.

Recolhe-se o meio condicionado das células transfectadas (0,5 a 3 L) por centrifugação para remover as células e filtra-se através de filtros de 0,22 micra. Para as construções marcadas com poli-His, purifica-se a construção de proteína utilizando uma coluna de Ni2+-NTA (Qiagen). Antes de purificação, adiciona-se imidazole ao meio condicionado até uma concentração de 5 mM. Bombeia-se o meio condicionado para uma coluna de Ni2+-NTA de 6 ml equilibrada em tampão Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazole 5 mM a um caudal de 4-5 ml/min. a 4°C. Após carga, lava-se a coluna com tampão de equilíbrio adicional e elui-se a proteína com tampão de equilíbrio contendo imidazole 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada para um tampão de armazenagem contendo Hepes 10 mM, NaCl 0,14 Me manitol a 4%, 147 ΕΡ 1 623 989/ΡΤ ρΗ 6,8, com uma coluna G25 Superfina (Pharmacia) de 25 ml e armazenada a -80°C.

As construções de proteínas de imunoadesina (contendo Fc) são purificadas do meio condicionado da seguinte forma. Bombeia-se o meio condicionado para uma coluna de Proteína A (Pharmacia) de 5 ml que foi equilibrada em tampão Na fosfato 20 mM, pH 6,8. Após carga, lava-se a coluna extensamente com tampão de equilíbrio antes de eluição com ácido cítrico 100 mM, pH 3,5. A proteína eluída é neutralizada imediatamente por recolha de fracções de 1 ml para tubos contendo 275 ml de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada para tampão de armazenagem, tal como descrito acima para as proteínas marcadas com poli-His. Verifica-se a homogeneidade das proteínas por electroforese em gel de SDS poliacrilamida (PEG) e sequenciação de aminoácidos do terminal N por degradação de Edman.

Alternativamente, pode ser utilizado um procedimento de baculovírus modificado, incorporando células high 5. Neste procedimento, amplifica-se o ADN que codifica a sequência pretendida com sistemas adequados, tal como Pfu (Stratagene), ou fundida a montante (a 5' de) de um marcador epitópico contido num vector de expressão de baculovírus. Tais marcadores de epítopo incluem marcadores poli-His e marcadores de imunoglobulina (tal como regiões Fc de igG) . Podem ser utilizados vários plasmídeos, incluindo plasmídeos derivados de plasmídeos disponíveis comercialmente, tal como plEl-1 (Novagen). Os vectores plEl-1 e plEl-2 são concebidos para expressão constitutiva de proteínas recombinantes do promotor iel de baculovírus em células de insecto transformadas estavelmente. Os plasmídeos diferem apenas na orientação dos locais de clonagem múltipla e contêm todas as sequências promotoras que se sabe serem importantes para expressão de gene mediada por iel em células de insecto não infectadas, bem como o elemento potenciador hr5. pIEl-1 e pIEl-2 incluem o local de iniciação de tradução e podem ser utilizados para produzir proteínas de fusão. Sucintamente, a sequência pretendida ou a porção da sequência pretendida (tal como a sequência que codifica o domínio extracelular de uma proteína transmembranar) é amplificada por PCR com iniciadores complementares às regiões 5' e 3'. O iniciador 5' pode incorporar locais de enzima de restrição flanqueadores 148 ΕΡ 1 623 989/ΡΤ (seleccionados). Ο produto é então digerido com estas enzimas de restrição seleccionadas e subclonado para o vector de expressão. Por exemplo, os derivados de pIEl-1 podem incluir a região Fc de igG humana (pb.PH.igG) ou um marcador a jusante (a 3' de) de 8 histidinas (pb.PH.His) da sequência pretendida. De preferência, a construção de vector é sequenciada para confirmação.

Cultivam-se células high 5 até uma confluência de 50% nas condições 27°C, sem CO2, sem penicilina/estreptamicina. Para cada placa de 150 mm, mistura-se 30 pg de vector baseado em pIE contendo a sequência com 1 ml de meio Ex-Cell (Meio: Ex-Cell 401 + 1/100 L-Glu JRH Biosciences N.° 14401-78P (nota: este meio é sensível à luz)) e num tubo separado, mistura-se 100 μΐ de CellFectin (CellFECTIN (GibcoBRL N.° 10362-010) (sujeito a vórtex para misturar)) com 1 ml de meio Ex-Cell. Combinam-se as duas soluções e deixa-se incubar à temperatura ambiente durante 15 minutos. Adiciona-se 8 ml de meio Ex-Cell a 2 ml de mistura de ADN/CellFECTlN e despeja-se em células high 5 que foram lavadas uma vez com meio Ex-Cell. A placa é então incubada às escuras durante 1 hora à temperatura ambiente. Seguidamente, aspira-se a mistura ADN/CellFECTIN e lavam-se as células uma vez com Ex-Cell para remover o excesso de CellFECTlN, adiciona-se 30 ml de meio Ex-Cell fresco e incubam-se as células durante 3 dias a 28°C. Recolhe-se o sobrenadante e determina-se a expressão da sequência no vector de expressão de baculovírus por ligação em lote de 1 ml de sobrenadante a 25 ml de pérolas de Ni2+-NTA (QIAGEN) para proteínas marcadas com histidina ou pérolas de Proteína A-Sepharose CL-4B (Pharmacia) para proteínas marcadas com IgG, seguido por análise por SDS-PAGE comparando com padrão de proteína de concentração conhecida por coloração com azul de Coomassie.

Recolhe-se o meio condicionado das células transfectadas (0,5 a 3 L) por centrifugação para remover células e filtra-se através de filtros de 0,22 micra. Para as construções marcadas com poli-His, a proteína incluindo a sequência é purificada utilizando uma coluna de Ni2+-NTA (Qiagen) . Antes de purificação, adiciona-se imidazole ao meio condicionado até uma concentração de 5 mM. Bombeia-se o meio condicionado para uma coluna de Ni2+-NTA de 6 ml equilibrada em tampão Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazole 5 mM, a um 149 ΕΡ 1 623 989/ΡΤ caudal de 4-5 ml/min. a 48°C. Após carga, lava-se a coluna com tampão de equilíbrio adicional e elui-se a proteína com tampão de equilíbrio contendo imidazole 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada para tampão de armazenagem contendo Hepes 10 mM, NaCl 0,14 Me manitol a 4%, pH 6,8, com uma coluna G25 Superfina (Pharmacia) de 25 ml e armazena-se a -80°C.

As construções de proteínas de imunoadesinas (contendo Fc) são purificadas a partir de meio condicionado, da seguinte forma. Bombeia-se o meio condicionado para uma coluna de Proteína A (Pharmacia) de 5 ml que tinha sido equilibrada em Na fosfato 20 mM, pH 6,8. Após carga, lava-se a coluna extensamente com tampão de equilíbrio antes de eluir com ácido cítrico 100 mM, pH 3,5. A proteína eluída é neutralizada imediatamente por recolha de fracções de 1 ml para tubos contendo 275 ml de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada para tampão de armazenagem, tal como descrito acima para as proteínas marcadas com poli-His. A homogeneidade da sequência é avaliada por géis de SDS poliacrilamida e sequenciação dos aminoácidos N-terminais por degradação de Edman e outros procedimentos analíticos, tal como pretendido ou necessário. EXEMPLOS 11

Preparação de anticorpos que ligam PR07168

Este exemplo ilustra a preparação de anticorpos monoclonais que podem ligar PR07168 especificamente. São conhecidas na especialidade técnicas para a produção de anticorpos monoclonais e são descritas, por exemplo, em Goding, supra. Os imunogénios que podem ser utilizados incluem proteínas de fusão de PR07168 purificadas contendo PR07168 e células que expressam PR07168 recombinante na superfície celular. A selecção do imunogénio pode ser feita pelo perito na especialidade sem experiências desnecessárias.

Imunizam-se ratinhos, tal como Balb/c, com o imunogénio PR07168 emulsionado em adjuvante completo de Freund e injecta-se subcutânea ou intraperitonealmente numa quantidade de 1-100 microgramas. Alternativamente, emulsiona-se o 150 ΕΡ 1 623 989/ΡΤ imunogénio em adjuvante MPL-TDM (Ribi Immunochemical Research, Hamilton, MT) e injecta-se nas almofadas da pata posterior do animal. Os ratinhos imunizados recebem então reforços 10 a 12 dias mais tarde com imunogénio adicional emulsionado no adjuvante seleccionado. Seguidamente, durante várias semanas, os ratinhos podem também receber reforços com injecções de imunização adicionais. Podem obter-se amostras de soro dos ratinhos periodicamente por sangramento retro-orbital para ensaiar em ensaios ELISA para detectar anticorpos anti-PR07168.

Após se detectar um titulo de anticorpo adequado, os animais "positivos" para anticorpos podem ser injectados com uma injecção intravenosa final de PR07168. Três a quatro dias mais tarde, sacrificam-se os ratinhos e recolhem-se as células de baço. As células de baço são então fundidas (utilizando polietilenoglicol a 35%) com uma linha celular de mieloma murino seleccionada tal como P3X63AgU.l, disponível de ATCC, N.° CRL 1597. As fusões geram células de hibridoma que podem ser então plaqueadas em placas de cultura de tecidos de 96 poços contendo meio HAT (hipoxantina, aminopterina e timidina) para inibir a proliferação de células não fundidas, híbridos de mieloma e híbridos de células de baço.

As células de hibridoma serão rastreadas num ELISA quanto a reactividade contra PR07168. A determinação de células de hibridoma "positivas" que excretam os anticorpos monoclonais contra PR07168 pretendidos está dentro da perícia na especialidade.

As células de hibridoma positivas podem ser injectadas intraperitonealmente em ratinhos Balb/c singénicos para produzir ascites contendo os anticorpos monoclonais anti-PR07168. Alternativamente, as células de hibridoma podem ser crescidas em balões de cultura de tecidos ou frascos giratórios. A purificação dos anticorpos monoclonais produzidos nas ascites pode ser efectuada utilizando precipitação com sulfato de amónio, seguido por cromatografia de exclusão em gel. Alternativamente, pode utilizar-se cromatografia de afinidade com base na ligação de anticorpo a proteína A ou proteína G. 151 ΕΡ 1 623 989/ΡΤ

Depósito de material:

Os seguintes materiais foram depositados em American Type Culture Collection, 10801 University Blvd., Manassas, Virginia 20110-2209, EUA (ATCC):

Material N.° de depósito Data de depósito

ATCC DNA102846-2742 PTA-545 17 de Agosto de 1999

Estes depósitos foram efectuados segundo os termos do "Tratado de Budapeste sobre o Reconhecimento Internacional do Depósito de Microorganismos para Efeitos do Procedimento em Matéria de Patentes" e seus Regulamentos (Tratado de Budapeste). Tal assegura a manutenção de uma cultura viável do depósito durante 30 anos a partir da data de depósito. O depósito será disponibilizado pela ATCC segundo os termos do Tratado de Budapeste e sujeito a um acordo entre a Genentech, Inc. e a ATCC, que assegura a disponibilidade permanente e não restrita da progénie da cultura do depósito ao público após concessão da patente norte-americana pertinente ou após disponíveis ao público quaisquer pedidos de patente norte-americana ou estrangeira, o que ocorrer primeiro, e assegura a disponibilidade da progénie a quem determinado pelo U.S. Commissioner of Patents and Trademarks com esse direito de acordo com 35 U.S.C. §122 e as regras do Commissioner daí decorrentes (incluindo 37 C.F.R. §1.14 com particular referência a 886 OG 638). O cessionário do presente pedido de patente concordou que, caso uma cultura dos materiais depositados morra ou se perca ou seja destruída quando cultivada em condições adequadas, os materiais serão prontamente substituídos após notificação, por outros equivalentes. A disponibilidade do material depositado não deve ser entendida como uma permissão para a prática do invento em contravenção dos direitos concedidos pela autoridade de qualquer governo de acordo com as suas leis relativas a patentes. O fascículo aqui escrito é considerada suficiente para permitir que um perito na especialidade ponha em prática o invento. O presente invento não está limitado no seu âmbito 152 ΕΡ 1 623 989/ΡΤ pela construção depositada, dado que a concretização depositada se destina unicamente a ilustração de determinados aspectos do invento e quaisquer construções que sejam equivalentes funcionalmente encontram-se no âmbito deste invento. 0 depósito de material aqui não constitui uma admissão de que a descrição escrita aqui contida é inadequada para permitir a prática de qualquer aspecto do invento, incluindo o seu melhor modo, nem deve ser interpretada como limitante do âmbito das reivindicações às ilustrações especificas que representa. De facto, várias modificações do invento para além das que foram apresentadas e descritas serão evidentes aos peritos na especialidade a partir da descrição anterior e caem no âmbito das reivindicações anexas.

Anexo <110> Genentech, Inc.

<120> COMPOSIÇÕES E MÉTODOS PARA O TRATAMENTO DE TUMORES <130> CMD/FP6297303 <140> EP 05018355.7 <141> 2000-02-11 <150> PCT/US00/03565 < 151> 2000-02-11 <150> PCT/US99/05028 <151> 1999-03-08 < 150> US 60/123,972 < 151> 1999-03-11 < 150> US 60/133,459 < 151> 1999-05-11 <150> PCT/US99/12252 < 151> 1999-06-02 <150> US 60/140,650 <151> 1999-06-22 < 150> US 60/140,653 <151> 1999-06-22 <150> US 60/144,758 <151> 1999-07-20 <150> US 60/145,698 <151> 1999-07-26 <150> US 60/146,222 153 ΕΡ 1 623 989/ΡΤ < 151 > 1999-07-28 < 15 0 > US 60/149,395 < 151 > 1999-08-17 < 15 0 > US 60/151,689 < 151 > 1999-08-31 < 15 0 > PCT/US99/20111 < 151 > 1999-09-01 Λ Ο LO \—1 V PCT/US99/21090 < 151 > 1999-09-15 < 15 0 > PCT/US99/28313 < 151 > 1999/11/30 Λ Ο LO \—1 V PCT/US99/28301 < 151 > 1999-12-01 Λ Ο LO \—1 V PCT/US99/28634 < 151 > 1999-12-01 Λ Ο LO \—1 V PCT/US00/00219 < 151 > 2000-01-05 <16 0> 5 <210> 1 <211> 3316 < 212 > ADN < 213 > Homo sapiens < 4 Ο Ο > 1 154

ΕΡ 1 623 989/PT ctgccaggtg acagccgcca agatggggtc ttgggccctg ctgtggcctc 50 ccctgctgtt caccgggctg ctcgtccgac ccccggggac catggcccag 100 gcccagtact gctctgtgaa caaggacatc tttgaagtag aggagaacac 150 aaatgtcacc gagccgctgg tggacatcca cgtcccggag ggccaggagg 200 tgaccctcgg agccttgtcc accccctttg catttcggat ccagggaaac 250 cagctgtttc tcaacgtgac tcctgattac gaggagaagt cactgcttga 300 ggctcagctg ctgtgtcaga gcggaggcac attggtgacc cagctaaggg 350 tgttcgtgtc agtgctggac gtcaatgaca atgcccccga attccccttt 400 aagaccaagg agataagggt ggaggaggac acgaaagtga actccaccgt 450 catccctgag acgcaactgc aggctgagga ccgcgacaag gacgacattc 500 tgttctacac cctccaggaa atgacagcag gtgccagtga ctacttctcc 550 ctggtgagtg taaaccgtcc cgccctgagg ctggaccggc ccctggactt 600 ctacgagcgg ccgaacatga ccttctggct gctggtgcgg gacactccag 650 gggagaatgt ggaacccagc cacactgcca ccgccacact agtgctgaac 700 gtggtgcccg ccgacctgcg gcccccgtgg ttcctgccct gcaccttctc 750 agatggctac gtctgcattc aagctcagta ccacggggct gtccccacgg 800 ggcacatact gccatctccc ctcgtcctgc gtcccggacc catctacgct 850 gaggacggag accgcggcat caaccagccc atcatctaca gcatctttag 900 gggaaacgtg aatggtacat tcatcatcca cccagactcg ggcaacctca 950 CCÇuÇíÇCCâÇ gagtgtcccc artrrprahna ccttccttct nr*t-nnt*naar» 1000 ggccaacagg ccgaccttgc ccgctactca gtgacccagg tcaccgtgga 1050 ggctgtggct gcggccggga gcccgccccg cttcccccag agcctgtatc 1100 gtggcaccgt ggcgcgtggc gctggagcgg gcgttgtggt caaggatgca 1150 gctgcccctt ctcagcctct gaggatccag gctcaggacc cggagttctc 1200 ggacctcaac tcggccatca catatcgaat taccaaccac tcacacttcc 1250 1 623 989 /PT 155 ggatggaggg agaggttgtg ctgaccacca ccacactggc acaggcggga 1300 gccttctacg cagaggttga ggcccacaac acggtgacct ctggcaccgc 1350 aaccacagtc attgagatac aagtttccga acaggagccc ccctccacag 1400 aggctggagg aacaactggg ccctggacca gcaccacttc cgaggtcccc 1450 agaccccctg agccctccca gggaccctcc acgaccagct ctgggggagg 1500 cacaggccct catccaccct ctggcacaac tctgaggcca ccaacctcgt 1550 ccacacccgg ggggcccccg ggtgcagaaa acagcacctc ccaccaacca 1600 gccactcccg gtggggacac agcacagacc ccaaagccag gaacctctca 1650 gccgatgccc cccggtgtgg gaaccagcac ctcccaccaa ccagccacac 1700 ccagtggggg cacagcacag accccagagc caggaacctc tcagccgatg 1750 ccccccagta tgggaaccag cacctcccac caaccagcca cacccggtgg 1800 çggcacagca cagaccccag aggcaggaac ctctcagccg atgccccccg 1850 gtatgggaac cagcacctcc caccaaccaa ccacacccgg tgggggcaca 1900 gcacagaccc cagagccagg aacctctcag ccgatgcccc tcagcaagag 1950 caccccatct tcaggtggcg gcccctcgga ggacaagcgc ttctcggtgg 2000 tggatatggc ggccctgggc ggggtgctgg gtgcgctgct gctgctggct 2050 ctccttggcc tcgccgtcct tgtccacaag cactatggcc cccggctcaa 2100 gtgctgctct ggcaaagctc cggagcccca gccccaaggc tttgacaacc 2150 f* <" i"· ► λ a/vΛa - ccccagcccc 22ΛΛ acgcacgacc ccaagcccgc ggaggcaccg atgcccgcag agcccgcacc 2250 ccccggccct gcctccccag gcggtgcccc tgagcccccc gcagcggccc 2300 gagctggcgg aagccccacg gcggtgaggt ccatcctgac caaggagcgg 2350 cggccggaçg gcgggtacaa ggccgtctgg tttggcgagg acatcgggac 2400 ggaggcagac gtggtcgttc tcaacgcgcc caccctggac gtggatggcg 2450 ccagtgactc cggcagcggc gacgagggcg agggcgcggg gaggggtggg 2500 ggtccctacg atgcacccçg tggtgatgac tcctacatct aagtggcccc 2550 tccaccctct cccccagccg cacgggcact ggaggtctcg ctcccccagc 2600 ctccgacccg aggcagaata aagcaaggct cccgaaaccc aggccatggc 2650 gtggggcagg cgcgtgggtc cctgggggcc ccattcactc agtcccctgt 2700 cgtcattagc gcttgagccc aggtgtgcag atgaggcggt gggtctggcc 2750 156 ΕΡ 1 623 989/ΡΤ acgctgtccc caccccaagg ctgcagcact tcccgtaaac cacctgcagt 2800 gcccgccgcc ttcccgaggc tctgtgccag ctagtctggg aagttcctct 2850 cccgctctaa ccacagcccg aggggggctc ccctcccccg acctgcacca 2900 gagatctcag gcacccggct caactcagac ctcccgctcc cgaccctaca 2950 cagagattgc ctggggaggc tgaggagccg atgcaaaccc ecaaggegac 3000 gcacttggga gccggtggtc tcaaacacct gccgggggtc ctagtcccct 3050 tctgaaatct acatgcttgg gttggagcgc agcagtaaac accctgccca 3100 gtgacctgga ctgaggcgcg ctgggggtgg gtgcgccgtg tggcctgagc 3150 aggagccaga ccaggaggcc taggggtgag agacacattc ccctcgctgc 3200 tcccaaagcc agagcccagg ctgggcgccc atgcccagaa ccatcaaggg 3250 atcccttgcg gcttgtcagc actttcccta atggaaatac accattaatt 3300 cctttccaaa tgtttt 3316 < 210 > 2 <211> 839

< 212 > PRT <213> Homo sapiens < 4 O O > 2

Met Gly Ser Trp Ala Leu Leu Trp Pro Pro Leu Leu Phe Thr Gly 1 5 10 15 Leu Leu Vai Arg Pro Pro Gly Thr Met Ala Gin Ala Gin Tyr Cys 20 25 30 Ser Vai Asn Lys Asp Ile Phe Glu Vai Glu Glu Asn Thr Asn Vai 35 40 45 Thr Glu Pro Leu Vai Asp He His Vai Pro Glu Gly Gin Glu Vai 50 55 60 Thr Leu Gly Ala Leu Ser Thr Pro Phe Ala Phe Arg Ile Gin Gly 65 70 75 Asa Gin Leu Phe Leu Asn Vai Thr Pro Asp Tyr Glu Glu Lys Ser 80 85 90 Leu Leu Glu Ala Gin Leu Leu Cys Gin Ser Gly Gly Thr Leu Vai 95 100 105 Thr Gin Leu Arg Vai Phe Vai Ser Vai Leu Asp Vai Asn Asp Asn 110 115 120 Ala Pro Glu Phe Pro Phe Lys Thr Lys Glu Ile Arg Vai Glu Glu 125 130 135 Asp Thr Lys Vai Asn Ser Thr Vai Ile Pro Glu Thr Gin Leu Gin 140 145 150 157

ΕΡ 1 623 989/PT

Ala Glu Asp Arg Asp Lys Asp Asp Ile Leu Phe Tyr Thr Leu Gin 155 160 165 Glu Met Thr Ala Gly Ala Ser Asp Tyr Phe Ser Leu Val Ser Val 170 175 180 Asn Arg Pro Ala Leu Arg Leu Asp Arg Pro Leu Asp Phe Tyr Glu 185 190 195 Arg Pro Asn Met Thr Phe Trp Leu Leu Val Arg Asp Thr Pro Gly 200 205 210 Glu Asn Vai Glu Pro Ser His Thr Ala Thr Ala Thr Leu Val Leu 215 220 225 Asn Vai Vai Pro Ala Asp Leu Arg Pro Pro Trp Phe Leu Pro Cys 230 235 240 Thr Phe Ser Asp Gly Tyr Vai Cys Ile Gin Ala Gin Tyr His Gly 245 250 255 Ala Vai Pro Thr Gly His Ile Leu Pro Ser Pro Leu val Leu Arg 260 265 270 Pro Gly Pro Ile Tyr Ala Glu Asp Gly Asp Arg Gly Ile Asn Gin 275 280 285 Pro Ile Ile Tyr Ser Ile Phe Arg Gly Asn Val Asn Gly Thr Phe 290 295 300 Ile Ile His Pro Asp Ser Gly Asn Leu Thr Val Ala Arg Ser Val 305 310 315 Pro Ser Pro Met Thr Phe Leu Leu Leu Val Lys Gly Gin Gin Ala 320 325 330 Asp Leu Ala Arg Tyr Ser Val Thr Gin Val Thr Val Glu Ala Val 335 340 345 Ala Ala Ala Gly Ser Pro Pro Arg Phe Pro Gin Ser Leu Tyr Arg 350 355 360 Gly Thr Vai Ala Arg Gly Ala Gly Ala Gly Val Val val Lys Asp 365 370 375 Ala Ala Ala Pro Ser Gin Pro Leu Arg Ile Gin Ala Gin Asp Pro 380 385 390 Glu Phe Ser Asp Leu Asn Ser Ala Ile Thr Tyr Arg Ile Thr Asn 395 400 405 His Ser His Phe Arg Met Glu Gly Glu Val Val Leu Thr Thr Thr 410 415 420 Thr Leu Ala Gin Ala Gly Ala Phe Tyr Ala Glu Val Glu Ala His 425 430 435 Asn Thr Vai Thr Ser Gly Thr Ala Thr Thr Val Ile Glu Ile Gin 440 445 450

Vai Ser Glu Gin Glu Pro Pro Ser Thr Glu Ala Gly Gly Thr Thr 158 ΕΡ 1 623 989/ΡΤ 455 460 465 Gly Pro Trp Thr Ser Thr Thr Ser Glu Vai Pro Arg Pro Pro Glu 470 475 480 Pro Ser Gin Gly Pro Ser Thr Thr Ser Ser Gly Gly Gly Thr Gly 485 490 495 Pro His Pro Pro Ser Gly Thr Thr Leu Arg Pro Pro Thr Ser Ser 500 505 510 Thr Pro Gly Gly Pro Pro Gly Ala Glu Asn Ser Thr Ser His Gin 515 520 525 Pro Ala Thr Pro Gly Gly Asp Thr Ala Gin Thr Pro Lys Pro Gly 530 535 540 Thr Ser Gin Pro Met Pro Pro Gly Vai Gly Thr Ser Thr Ser His 545 550 555 Gin Pro Ala Thr Pro Ser Gly Gly Thr Ala Gin Thr Pro Glu Pro 560 565 570 Gly Thr Ser Gin Pro Met Pro Pro Ser Met Gly Thr Ser Thr Ser 575 580 585 His Gin Pro Ala Thr Pro Gly Gly Gly Thr Ala Gin Thr Pro Glu 590 595 600 Ala Gly Thr Ser Gin Pro Met Pro Pro Gly Met Gly Thr Ser Thr 605 610 615 Ser His Gin Pro Thr Thr Pro Gly Gly Gly Thr Ala Gin Thr Pro 620 625 630 Glu Pro Gly Thr Ser Gin Pro Met Pro Leu Ser Lys Ser Thr Pro 635 640 645 Ser Ser Gly Gly Gly Pro Ser Glu Asp Lys Arg Phe Ser Vai Vai 650 655 660 Asp Met Ala Ala Leu Gly Gly Vai Leu Gly Ala Leu Leu Leu Leu 665 670 675 Ala Leu Leu Gly Leu Ala Vai Leu Vai His Lys His Tyr Gly Pro 680 685 690 Arg Leu Lys Cys Cys Ser Gly Lys Ala Pro Glu Pro Gin Pro Gin 695 700 705 Gly Phe Asp Asn Gin Ala Phe Leu Pro Asp His Lys Ala Asn Trp 710 715 720 Ala Pro Vai Pro Ser Pro Thr His Asp Pro Lys Pro Ala Glu Ala 725 730 735 Pro Met Pro Ala Glu Pro Ala Pro Pro Gly Pro Ala Ser Pro Gly 740 745 750

Gly Ala Pro Glu Pro Pro Ala Ala Ala Arg Ala Gly Gly Ser Pro 755 760 765 159 ΕΡ 1 623 989/ΡΤ

Thr Ala Vai Arg Ser lie Leu Thr Lys Glu Arg Arg Pro Glu Gly 770 775 780 Gly Tyr Lys Ala Vai Trp Phe Gly Glu Asp Ile Gly Thr Glu Ala 785 790 795 Asp Vai Vai Vai Leu Asn Ala Pro Thr Leu Asp Vai Asp Gly Ala 800 805 810 Ser Asp Ser Gly Ser Gly Asp Glu Gly Glu Gly Ala Gly Arg Gly 815 820 825 Gly Gly Pro Tyr Asp Ala Pro Gly Gly Asp Asp Ser Tyr Ile 830 835

<210> 3 <211> 18 <212> ADN <213> Sequência artificial <22 0> <223> Sonda oligonucleotidica sintética. < 4 0 0 > 3 gagccggtgg tctcaaac 18

<210> 4 <211> 21 <212> ADN <213> Sequência artificial < 2 2 0 > <223> Sonda oligonucleotidica sintética. < 4 0 0 > 4 ccgggggtcc tagtcccctt c 21

<210> 5 <211> 18 <212> ADN <213> Sequência artificial < 2 2 0 > <223> Sonda oligonucleotidica sintética. < 4 0 0 > 5 tttactgctg cgctccaa 18

Lisboa

Claims

ΕΡ 1 623 989/ΡΤ 1/8 REIVINDICAÇÕES 1. Ácido nucleico isolado que: (a) codifica um polipéptido que possui pelo menos 80% de identidade de sequência de aminoácidos com: (i) a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), (ii) a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, (iii) o dominio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), com o péptido de sinal, (iv) o dominio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, ou (v) a sequência de aminoácidos codificada pela sequência de codificação de PR07168 de comprimento completo de DNA102846-2742, depositada na ATCC com o número de acesso PTA-545; ou (b) possui pelo menos 80% de identidade de sequência de ácido nucleico com: (i) a sequência nucleotidica apresentada na Figura 1 (SEQ ID NO:1), (ii) a sequência de codificação de PR07168 de comprimento completo da sequência nucleotidica apresentada na Figura 1 (SEQ ID NO:l), (iii) a sequência de codificação de PR07168 de comprimento completo de DNA102846-2742, depositada na ATCC com o número de acesso PTA-545, (iv) a sequência da Figura 1 (SEQ ID NO:l) que codifica a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, (v) a sequência da Figura 1 (SEQ ID NO:l) que codifica o dominio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), com o péptido de sinal, ou (vi) a sequência da Figura 1 (SEQ ID NO:l) que codifica o domínio extracelular da sequência de aminoácidos ΕΡ 1 623 989/ΡΤ 2/8 apresentada na Figura 2 (SEQ ID N0:2), sem o péptido de sinal, em que a referida identidade de sequências de ácido nucleico ou de aminoácidos é determinada utilizando o programa de computador ALIGN-2.
2. Ácido nucleico de acordo com a reivindicação 1, em que o nivel de identidade é de pelo menos 90%.
3. Ácido nucleico de acordo com a reivindicação 2, em que o nivel de identidade é de pelo menos 95%.
4. Ácido nucleico de acordo com a reivindicação 3, que: (a) codifica um polipéptido que possui: (i) a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), (ii) a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, (iii) o dominio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), com o péptido de sinal, (iv) o dominio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, ou (v) a sequência de aminoácidos codificada pela sequência de codificação de PR07168 de comprimento completo de DNA102846-2742, depositada na ATCC com o número de acesso PTA-545; ou (b) possui: (i) a sequência nucleotidica apresentada na Figura 1 (SEQ ID NO:1), (ii) a sequência de codificação de comprimento completo da sequência nucleotidica apresentada na Figura 1 (SEQ ID NO:1), (iii) a sequência de codificação de PR07168 de comprimento completo de DNA102846-2742, depositada na ATCC com o número de acesso PTA-545, ΕΡ 1 623 989/ΡΤ 3/8 (iv) a sequência da Figura 1 (SEQ ID N0:1) que codifica a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, (v) a sequência da Figura 1 (SEQ ID N0:1) que codifica o dominio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID N0:2), com o péptido de sinal, ou (vi) a sequência da Figura 1 (SEQ ID N0:1) que codifica o dominio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID N0:2), sem o péptido de sinal.
5. Ácido nucleico de acordo com qualquer das reivindicações anteriores, em que o péptido de sinal consiste nos aminoácidos números 1 a 25±5 da Figura 2 (SEQ ID NO:2).
6. Ácido nucleico de acordo com qualquer das reivindicações anteriores, em que o dominio extracelular com o péptido de sinal consiste nos resíduos 1 a 662±5 da Figura 2 (SEQ ID NO:2), ou em que o domínio extracelular sem o péptido de sinal consiste nos resíduos 26±5 a 662±5 da Figura 2 (SEQ ID NO:2).
7. Vector compreendendo o ácido nucleico de acordo com qualquer das reivindicações anteriores.
8. Vector de acordo com a reivindicação 7 operativamente ligado a sequências de controlo reconhecidas por uma célula hospedeira transformada com o vector.
9. Célula hospedeira compreendendo o vector de acordo com a reivindicação 8.
10. Célula hospedeira de acordo com a reivindicação 9, em que a referida célula é uma célula CHO, uma célula de E. coli, uma célula de levedura ou uma célula de insecto infectada com baculovírus.
11. Processo para produção de um polipéptido PR07168 compreendendo a cultura da célula hospedeira de acordo com a reivindicação 10 sob condição adequadas para a expressão do ΕΡ 1 623 989/ΡΤ 4/8 referido polipéptido e a recuperação do referido polipéptido a partir da cultura celular.
12. Polipéptido isolado possuindo pelo menos 80% de identidade de sequência de aminoácidos com: (i) a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), (ii) a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, (iii) o domínio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), com o péptido de sinal, (iv) o dominio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, ou (v) a sequência de aminoácidos codificada pela sequência de codificação de PR07168 de comprimento completo de DNA102846-2742, depositada na ATCC com o número de acesso PTA-545, em que a referida identidade de sequências de ácido nucleico ou de aminoácidos é determinada utilizando o programa de computador ALIGN-2.
13. Polipéptido de acordo com a reivindicação 12, em que o nível de identidade é de pelo menos 90%.
14. Polipéptido de acordo com a reivindicação 13, em que o nível de identidade é de pelo menos 95%.
15. Polipéptido de acordo com a reivindicação 14, que possui: (i) a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), (ii) a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, (iii) o domínio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), com o péptido de sinal, ΕΡ 1 623 989/ΡΤ 5/8 (iv) ο domínio extracelular da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2), sem o péptido de sinal, ou (v) a sequência de aminoácidos codificada pela sequência de codificação de PR07168 de comprimento completo de DNA102846-2742, depositada na ATCC com o número de acesso PTA-545.
16. Polipéptido de acordo com qualquer uma das reivindicações 12 a 15, em que o péptido de sinal consiste nos aminoácidos números 1 a 25±5 da Figura 2 (SEQ ID NO:2).
17. Polipéptido de acordo com qualquer uma das reivindicações 12 a 16, em que o domínio extracelular com o péptido de sinal consiste nos resíduos 1 a 662±5 da Figura 2 (SEQ ID NO:2) ou em que o domínio extracelular sem o péptido de sinal consiste nos resíduos 26±5 a 662±5 da Figura 2 (SEQ ID NO:2).
18. Molécula quimérica compreendendo um polipéptido de acordo com qualquer uma das reivindicações 12 a 17.
19. Molécula quimérica de acordo com a reivindicação 18, em que a referida sequência de aminoácidos heteróloga é uma sequência marcadora epitópica ou uma região Fc de uma imunoglobulina.
20. Anticorpo que se liga especif icamente a um polipéptido de acordo com a reivindicação 15.
21. Anticorpo de acordo com a reivindicação 20, em que o referido anticorpo é um anticorpo monoclonal, um anticorpo humanizado ou um anticorpo de cadeia simples.
22. Anticorpo de acordo com a reivindicação 20, que é um anticorpo monoclonal compreendendo uma região determinante de complementaridade (CDR) não humana ou uma região de esqueleto (FR) humana.
23. Anticorpo de acordo com a reivindicação 20, que está marcado. ΕΡ 1 623 989/ΡΤ 6/8
24. Anticorpo de acordo com a reivindicação 20, que é um fragmento de anticorpo ou um anticorpo de cadeia simples.
25. Molécula de ácido nucleico isolada que codifica o anticorpo de acordo com a reivindicação 20.
26. Vector compreendendo a molécula de ácido nucleico de acordo com a reivindicação 25.
27. Célula hospedeira compreendendo o vector de acordo com a reivindicação 26.
28. Método para produção de um anticorpo que se liga a um polipéptido de acordo com a reivindicação 15, o referido método compreendendo a cultura da célula hospedeira de acordo com a reivindicação 27 sob condições suficientes para permitir a expressão do referido anticorpo e a recuperação do referido anticorpo a partir da cultura celular.
29. Molécula de ácido nucleico isolada que hibrida sob condições de hibridação e de lavagem rigorosas com uma sequência de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 6, ou o seu complemento, em que as condições rigorosas são as seguintes: (i) hibridação a 42°C em formamida a 50% com tampão de BSA a 0,1%/Ficoll a 0,1%/polivinilpirrolidona a 0,1%/fosfato de sódio 50 mM a pH 6,5 com cloreto de sódio 750 mM, citrato de sódio 75 mM, seguida de lavagem a 50°C com cloreto de sódio 0,015 M/citrato de sódio 0,00015 M/dodecilsulfato de sódio a 0,1%; ou (ii) hibridação a 42°C em formamida a 50%, SSC 5x, fosfato de sódio 50 mM, pirofosfato de sódio a 0,1%, solução de Denhardt 5x, ADN de esperma de salmão tratado com ultra-sons (50 μρ/ιηΐ), SDS a 0,1% e sulfato de dextrano a 10%, seguida de lavagens a 55°C a 42C com SSC 0,2x e formamida a 50%, seguidas por uma lavagem a 55°C com SSC 0,lx contendo edta.
30. Método para determinação da presença de um polipéptido de acordo com qualquer uma das reivindicações 12 a 17 numa amostra que se suspeita que contenha o referido polipéptido, o referido método compreendendo a exposição da ΕΡ 1 623 989/ΡΤ 7/8 amostra a um anticorpo de acordo com a reivindicação 20 e a determinação da ligação do referido anticorpo ao referido polipéptido na referida amostra.
31. Método de acordo com a reivindicação 30, em que a referida amostra compreende uma célula que se suspeita que contenha o referido polipéptido.
32. Método de acordo com a reivindicação 31, em que a referida célula é uma célula cancerosa.
33. Método de diagnóstico de tumor do pulmão num mamífero, o referido método compreendendo a detecção do nível de expressão de um gene que codifica um polipéptido de acordo com qualquer uma das reivindicações 12 a 17 (a) numa amostra de teste de células de tecido obtidas do mamífero, e (b) numa amostra de controlo de células de tecido normal conhecidas do mesmo tipo celular, em que um maior nível de expressão na amostra de teste, comparativamente com a amostra de controlo, é indicador da presença de tumor no mamífero do qual se obtiveram as células de tecido de teste.
34. Método de diagnóstico de tumor do pulmão num mamífero, o referido método compreendendo (a) o contacto de um anticorpo de acordo com a reivindicação 20 com uma amostra de teste de células de tecido obtidas do mamífero, e (b) a detecção da formação de um complexo entre o referido anticorpo e um polipéptido de acordo com qualquer uma das reivindicações 12 a 17 na amostra de teste, em que a formação de um complexo é indicadora da presença de um tumor no referido mamífero.
35. Método de acordo com a reivindicação 34, em que o referido anticorpo é marcado de forma detectável.
36. Método de acordo com a reivindicação 33, em que a referida amostra de teste de células de tecido é obtida de um indivíduo que se suspeita que tenha crescimento ou proliferação de células neoplásicas. ΕΡ 1 623 989/ΡΤ 8/8
37. Kit de diagnóstico de cancro compreendendo um anticorpo de acordo com a reivindicação 20 e um transportador numa embalagem adequada.
38. Kit de acordo com a reivindicação 37, que inclui adicionalmente instruções para a utilização do referido anticorpo para detectar a presença de um polipéptido de acordo com qualquer uma das reivindicações 12 a 17, numa amostra que se suspeita que contenha o mesmo.
39. Método para identificação de um composto que inibe a expressão de um polipéptido de acordo com qualquer uma das reivindicações 12 a 17 em células que expressam o referido polipéptido, em que o referido método compreende o contacto das referidas células com um composto candidato e a determinação se a expressão do referido polipéptido é inibida.
40. Método de acordo com a reivindicação 39, em que o referido composto candidato é um oligonucleótido anti-sentido. Lisboa,