PT1328621E - 13245, uma nova proteína cinase humana de tipo distrofia miotónica e suas utilizações - Google Patents

13245, uma nova proteína cinase humana de tipo distrofia miotónica e suas utilizações Download PDF

Info

Publication number
PT1328621E
PT1328621E PT01985157T PT01985157T PT1328621E PT 1328621 E PT1328621 E PT 1328621E PT 01985157 T PT01985157 T PT 01985157T PT 01985157 T PT01985157 T PT 01985157T PT 1328621 E PT1328621 E PT 1328621E
Authority
PT
Portugal
Prior art keywords
cell
polypeptide
nucleic acid
glu
leu
Prior art date
Application number
PT01985157T
Other languages
English (en)
Inventor
Rosana Kapeller-Libermann
Original Assignee
Bayer Healthcare Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayer Healthcare Ag filed Critical Bayer Healthcare Ag
Publication of PT1328621E publication Critical patent/PT1328621E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

1
DESCRIÇÃO "13245, UMA NOVA PROTEÍNA CINASE HUMANA DE TIPO DISTROFIA MIOTÓNICA E SUAS UTILIZAÇÕES"
ANTECEDENTES DA INVENÇÃO A fosforilação de proteínas, por exemplo em resíduos serina, treonina e tirosina, é um mecanismo regulador chave para uma diversidade de processos celulares. A fosforilação de proteínas é influenciada principalmente por enzimas de dois tipos, nomeadamente proteína cinases (PKs) e proteína fosfatases (PPs). As PKs catalisam a adição de uma unidade fosfato a um resíduo de aminoácido da proteína (geralmente um resíduos de serina, treonina ou tirosina) e as PPs catalisam a eliminação de tais unidades. As actividades catalíticas das PKs e PPs são, por sua vez, influenciadas pelo estado da célula e do meio ambiente em que ela se encontra.
As PKs de tipo distrofia miotónica (MDPKs) estão associadas à modulação da morfologia, forma e contractilidade celular. Também se sabe que as MDPKs modulam a actividade dos canais de sódio controlados por tensão do músculo-esquelético, mas não os canais de sódio controlados por tensão do músculo cardíaco. As MDPKs têm assim um papel numa variedade de distúrbios degenerativos musculares e outros distúrbios músculo-esqueléticos incluindo, por exemplo, distrofia muscular (MD) de vários tipos (por exemplo, MD de Duchenne, MD da cintura dos membros, MD de Becker, MD facio-escapulo-humeral, miopatia mitocondrial e miopatia congénita) e distrofias miotónicas (por exemplo, doença de Steinert e doença de Thomsen). 2
Foram descritas muitas MDPKs (ver, por exemplo, Zhao et al. 1997. The Journal of Biological Chemistry, 272:10013 e Bush et al. 2000, Biochemistry, 39:8489.) e julga-se que existam muitas mais. Tendo em consideração a disseminação e natureza critica das actividades da MDPK nos processos fisiológicos normais e patológicos, existe uma necessidade para a identificação de outros membros desta família de proteínas. A presente invenção satisfaz esta necessidade ao proporcionar uma nova MDPK humana.
SUMÁRIO DA INVENÇÃO A presente invenção baseia-se, em parte, na descoberta de um movo gene que codifica uma MDPK, em que o gene é aqui referido como "13245". A sequência de nucleótidos de um ADNc que codifica o 13245 é mostrada na SEQ ID N°. 1, e a sequência de aminoácidos de um polipéptido de 13245 é mostrada na SEQ ID N°. 2. Além disso, a sequência de nucleótidos da região de codificação é representada na SEQ ID N°, 3 .
Consequentemente, num aspecto, a invenção apresenta uma molécula de ácido nucleico que codifica uma proteína ou polipéptido 13245, por exemplo, uma parte biologicamente activa da proteína 13245. Numa forma de realização preferida a molécula de ácido nucleico isolada codifica um polipéptido com a sequência de aminoácidos SEQ ID N°. 2. Noutras formas de realização, a invenção proporciona moléculas de ácido nucleico 13245 isoladas com a sequência de nucleótidos de qualquer uma das SEQ ID N°, 1 e 3.
Ainda noutras formas de realização, a invenção proporciona moléculas de ácido nucleico que têm sequências que são essencialmente idênticas (por exemplo, variantes 3 alélicas naturais) a uma sequência de nucleótidos de qualquer uma das SEQ ID N°. 1 e 3. Noutras formas de realização, a invenção proporciona uma molécula de ácido nucleico a qual hibridiza em condições rigorosas de hibridização com uma molécula de ácido nucleico possuindo uma sequência compreendendo a sequência de nucleótidos de qualquer uma das SEQ ID N°. 1 e 3, em que o ácido nucleico codifica uma proteína 13245 inteira ou um fragmento activo desta.
Num aspecto relacionado, a invenção proporciona ainda construções de ácido nucleico que incluem uma molécula de ácido nucleico 13245 aqui descrita. Em determinadas formas de realização, as moléculas de ácido nucleico da invenção estão operacionalmente ligadas a sequências reguladoras nativas ou heterólogas. Também estão incluídos vectores e células hospedeiras contendo as moléculas de ácido nucleico 13245 da invenção, por exemplo, vectores e células hospedeiras adequadas para produzir moléculas de ácido nucleico 13245 e polipéptidos.
Noutro aspecto relacionado, a invenção proporciona fragmentos de ácidos nucleicos adequados como iniciadores ou sondas de hibridização para detecção de ácidos nucleicos que codificam a 13245.
Ainda noutro aspecto relacionado são proporcionadas moléculas de ácido nucleico isoladas que são antimensageiras para uma molécula de ácido nucleico que codifica a 13245.
Noutro aspecto, a invenção apresenta polipéptidos 13245, e os fragmentos biologicamente activos ou 4 antigénicos destes que são úteis, por exemplo, como reagentes ou alvos em ensaios aplicáveis ao tratamento e diagnóstico de distúrbios mediados ou relacionados com a 13245 (por exemplo, distúrbios mediados pela mdpk como os aqui descritos). Noutra forma de realização, a invenção proporciona polipéptidos 13245 com actividade proteína cinase. Os polipéptidos preferidos sãos as proteína 13245 incluindo pelo menos um domínio pcinase e possuindo preferencialmente uma actividade da 13245, por exemplo, uma actividade da 13245 como aqui descrita. Os polipéptidos preferidos são proteínas 13245 incluindo pelo menos um domínio CNH e pelo menos um domínio pcinase. Outros polipéptidos preferidos são proteínas 13245 incluindo pelo menos um domínio CNH, pelo menos um domínio pcinase, pelo menos um domínio de ligação éster de forbol/diacilglicerol, pelo menos um domínio PH, e pelo menos um domínio de fecho de leucina.
Noutras formas de realização, a invenção proporciona polipéptidos 13245, por exemplo, um polipéptido 13245 com a sequência de aminoácidos mostrada na SEQ ID N°. 2, uma sequência de aminoácidos que é essencialmente idêntica à sequência de aminoácidos mostrada na SEQ ID N°. 2, ou uma sequência de aminoácidos codificada por uma molécula de ácido nucleico com uma sequência de nucleótidos a qual hibridiza em condições rigorosas de hibridização com uma molécula de ácido nucleico compreendendo a sequência de nucleótidos de qualquer uma das SEQ ID N°. 1 e 3, em que o ácido nucleico codifica uma proteína 13245 inteira ou um fragmento activo desta. 5
Num aspecto relacionado, a invenção proporciona ainda construções de ácido nucleico que incluem uma molécula de ácido nucleico 13245 aqui descrita.
Num aspecto relacionado, a invenção proporciona polipéptidos 13245 ou fragmentos operacionalmente ligados a polipéptidos não-13245 para formar proteínas de fusão.
Noutro aspecto, a invenção apresenta anticorpos e seus fragmentos de ligação de antigénio, que reagem, ou mais preferencialmente, se ligam especificamente a polipéptidos 13245.
Noutro aspecto, a invenção proporciona métodos de rastreio de compostos que modulam a expressão ou actividade dos polipéptidos ou ácidos nucleicos 13245.
Ainda noutro aspecto, a invenção proporciona um processo para modular a expressão ou actividade do polipéptido ou ácido nucleico 13245, por exemplo, utilizando os compostos seleccionados. Em determinadas formas de realização, os métodos envolvem o tratamento de condições relacionadas com a actividade ou expressão aberrante dos polipéptidos ou ácidos nucleicos 13245, tais como condições envolvendo a fosforilação aberrante ou deficiente de proteínas ou a regulação aberrante ou deficiente de processos celulares (por exemplo, sinalização celular aberrante ou deficiente ou função muscular aberrante ou deficiente). A invenção também proporciona ensaios para determinar a actividade ou a presença ou ausência de polipéptidos ou moléculas de ácido nucleico 13245 numa amostra biológica, incluindo para diagnóstico de doenças. 6
Noutro aspecto a invenção proporciona ensaios para determinar a presença ou ausência de uma alteração genética num polipéptido ou molécula de ácido nucleico 13245, incluindo para diagnóstico de doenças. A invenção também inclui um método para modular a capacidade de uma célula para catalisar a interconversão das formas fosforilada e desfosforilada de uma proteina GTPase. 0 método compreende modular a actividade da proteina 13245 na célula. A actividade da proteina 13245 pode ser modulada inibindo a expressão do gene da 13245 na célula, por exemplo administrando à célula um oligonucleótido antimensageiro o qual hibridiza em condições rigorosas com um transcrito (por exemplo, um ARNm) do gene da 13245, um oligonucleótido antimensageiro o qual hibridiza em condições rigorosas com um polinucleótido com a sequência de nucleótidos SEQ ID N°. 1, ou um oligonucleótido antimensageiro o qual hibridiza em condições rigorosas com um polinucleótido com a sequência de nucleótidos SEQ ID N°. 3. Alternativamente, a actividade da proteina 13245 pode ser inibida sem afectar de modo significativo a expressão do gene da 13245 na célula. Por exemplo, a actividade da proteina 13245 pode ser inibida administrando à célula um agente que iniba uma actividade da proteina 13245, tal como um anticorpo que se liga especificamente à proteina 13245. Num aspecto relacionado, a actividade da 13245 pode ser modulada intensificando a expressão do 13245 na célula. Por exemplo, a expressão de 13245 numa célula pode ser intensificado administrando à célula um agente que aumente a expressão de 13245, tal como um vector de expressão que codifica a proteina 13245. 7 A invenção inclui ainda um método para avaliar se um composto de ensaio é útil para modular pelo menos um fenómeno seleccionado do grupo consistindo de (1) interconversão das formas fosforilada e desfosforilada de um resíduo de serina, treonina ou tirosina de uma proteína GTPase; (2) contractilidade celular; (3) crescimento celular; (4) condutividade celular; (5) entrada de uma célula no ciclo celular; (6) progressão de uma célula através do ciclo celular; (7) mitogénese; (8) metabolismo celular; (9) transcrição de genes; (11) citocinese; (12) forma celular; (13) movimento celular; (14) integração de um genoma virai no genoma de uma célula hospedeira; (15) conservação de um genoma virai no genoma de uma célula hospedeira; (16) uma alteração citológica numa célula hospedeira infectada por vírus; (17) produção virai numa célula hospedeira infectada por vírus; (18) interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; e (19) encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus. 0 método compreende: a) adicionar o composto de ensaio a uma primeira composição compreendendo um polipéptido que tem uma sequência de aminoácidos pelo menos 90% idêntica à SEQ ID N°. 2 e que exibe uma actividade 13245; e b) comparar a actividade 13245 na primeira composição e na segunda composição que é essencialmente idêntica à primeira composição excepto que ela não compreende o composto de ensaio.
Uma diferença na actividade 13245 nas primeira e segunda composições é uma indicação de que o composto de ensaio é útil para modular o fenómeno. 8 A invenção também inclui outro método para avaliar se um composto de ensaio é útil para modular pelo menos um fenómeno seleccionado do grupo consistindo de (1) interconversão das formas fosforilada e desfosforilada de um residuo de serina, treonina ou tirosina de uma proteína GTPase; (2) contractilidade celular; (3) crescimento celular; (4) condutividade celular; (5) entrada de uma célula no ciclo celular; (6) progressão de uma célula através do ciclo celular; (7) mitogénese; (8) metabolismo celular; (9) transcrição de genes; (11) citocinese; (12) forma celular; (13) movimento celular; (14) integração de um genoma virai no genoma de uma célula hospedeira; (15) conservação de um genoma virai no genoma de uma célula hospedeira; (16) uma alteração citológica numa célula hospedeira infectada por vírus; (17) produção virai numa célula hospedeira infectada por vírus; (18) interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; e (19) encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus. Este método compreende: a) adicionar o composto de ensaio a uma primeira composição compreendendo uma célula a qual compreende um ácido nucleico que codifica um polipéptido que tem uma sequência de aminoácidos pelo menos 90% idêntica à SEQ ID N°. 2 e que exibe uma actividade 13245; e b) comparar a actividade 13245 na primeira composição e na segunda composição que é essencialmente idêntica à primeira composição excepto que ela não compreende o composto de ensaio. 9
Uma diferença na actividade 13245 nas primeira e segunda composições é uma indicação de que o composto de ensaio é útil para modular o fenómeno.
Os compostos identificados utilizando estes métodos podem ser utilizados para preparar uma composição farmacêutica para modular o fenómeno, por exemplo combinando-os com um veiculo farmaceuticamente aceitável. Estas composições podem ser utilizadas para modular o fenómeno num ser humano. A invenção inclui outro método para identificar um composto útil para modular pelo menos um fenómeno seleccionado do grupo consistindo de (1) interconversão das formas fosforilada e desfosforilada de um resíduo de serina, treonina ou tirosina de uma proteína GTPase; (2) contractilidade celular; (3) crescimento celular; (4) condutividade celular; (5) entrada de uma célula no ciclo celular; (6) progressão de uma célula através do ciclo celular; (7) mitogénese; (8) metabolismo celular; (9) transcrição de genes; (11) citocinese; (12) forma celular; (13) movimento celular; (14) integração de um genoma virai no genoma de uma célula hospedeira; (15) conservação de um genoma virai no genoma de uma célula hospedeira; (16) uma alteração citológica numa célula hospedeira infectada por vírus; (17) produção virai numa célula hospedeira infectada por vírus; (18) interacção de um virião com uma membrana de uma célula hospedeira infectada por virus; e (19) encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus. Este método compreende: 10 a) por em contacto o composto de ensaio e um polipéptido seleccionado do grupo consistindo de i) um polipéptido que é codificado por uma molécula de ácido nucleico compreendendo uma fracção possuindo uma sequência de nucleótidos a qual é pelo menos 90% idêntica a uma das SEQ ID N°. 1 e 3; e ii) um fragmento de um polipéptido possuindo uma sequência de aminoácidos compreendendo uma SEQ ID N°. 2, em que o fragmento compreende pelo menos 25 resíduos de aminoácidos contíguos da SEQ ID N°. 2 ou uma célula que expressa o polipéptido; e b) determinar se o polipéptido se liga ao composto de ensaio. A ligação entre o polipéptido e o composto de ensaio é uma indicação de que o composto de ensaio é útil para modular o fenómeno.
Outras particularidades e vantagens da invenção tornar-se-ão evidentes a partir da descrição pormenorizada que se segue, e das reivindicações.
DESCRIÇÃO ABREVIADA DAS FIGURAS A Figura 1 representa uma sequência de ADNc (SEQ ID N°. 1) e a sequência de aminoácidos prevista (SEQ ID N°. 2) da 13245 humana. A grelha de leitura aberta iniciada por metionina da 13245 humana (sem as regiões não traduzidas 5' e 3') começa no nucleótido 19 da SEQ ID N°, 1, e a região de codificação (não incluindo o códão finalizador; mostrado 11 na SEQ ID N°. 3) prolonga-se através do nucleótido 6178 da SEQ ID N°. 1. A Figura 2 representa um perfil de hidropatia da 13245 humana. Os residuos relativamente hidrófobos são mostrados acima da linha horizontal a tracejado e os residuos relativamente hidrófobos encontram-se abaixo da linha horizontal a tracejado. Os resíduos de cisteína (cys) são indicados por linhas verticais curtas abaixo do perfil de hidropatia. São indicados os números correspondentes à sequência de aminoácidos da 13245 humana. Os polipéptidos da invenção incluem fragmentos que incluem: a totalidade ou parte de uma sequência hidrófoba, isto é, uma sequência acima da linha a tracejado, por exemplo, a sequência próxima dos resíduos 195-210 da SEQ ID N°. 2; a totalidade ou parte de uma sequência hidrófila, isto é, uma sequência abaixo da linha a tracejado, por exemplo, a sequência dos resíduos 455-475 da SEQ ID N°. 2; uma sequência que inclui um resíduo de cisteína; ou um sítio de glicosilação. A Figura 3 é um alinhamento de uma sequência de aminoácidos (SEQ ID N°. 2) de 13245, citron cinase de interacção rho/rac murina ("AAC72823"; GENBANK® n° de registo AAC72823; SEQ ID N°. 4), citron-K cinase murina ("AAC27933"; GENBANK® n° de registo AAC27933; SEQ ID N° . 5), proteína citron murina ("P49025"; GENBANK® n° de registo P49025; SEQ ID N°. 6) e proteína citron humana ("014578"; GENBANK® n° de registo 014578; SEQ ID N°. 7). O alinhamento foi feito utilizando o software Multalin versão 5.4.1 utilizando o quadro de comparação de símbolos blosum62, uma ponderação de lacunas de 12 e uma ponderação do comprimento de lacuna de 2. 12
DESCRIÇÃO PORMENORIZADA A sequência de ADNc 13245 humano (Figura 1; SEQ ID N°. 1), a qual tem aproximadamente 6575 resíduos de nucleótidos de comprimento incluindo regiões não traduzidas, contém uma sequência de codificação prevista iniciada com metionina com cerca de 6160 resíduos de nucleótidos, excluindo o códão de terminação (isto é, os resíduos de nucleótidos 19-6178 da SEQ ID N°. 1; também mostrados na SEQ ID N°. 3). A sequência de codificação codifica uma proteína com 2053 aminoácidos com a sequência de aminoácidos SEQ ID N°. 2. A 13245 humana contém as regiões seguintes ou outras particularidades estruturais: um domínio pcinase previsto (PF00069) próximo dos resíduos de aminoácidos 97-360 da SEQ ID N°. 2, um domínio proteína cinase C terminal previsto nos resíduos 361-390 da SEQ ID N°. 2, uma sequência indicativa de sítio activo de proteína cinase de serina/treonina nos resíduos 217-229 da SEQ ID N°. 2, um domínio de fecho de leucinas previsto nos resíduos 838-859, 975-996, 1041-1062 e 1143-1164 da SEQ ID N°. 2, uma sequência indicativa de subdomínio de carbamoil-fosfato sintase prevista nos resíduos 1156-1163 da SEQ ID N°. 2, um domínio de ligação éster de forbol/diacilglicerol previsto nos resíduos 1389-1437 da SEQ ID N°. 2, um domínio de homologia de Pleckstrin esperado (PH) nos resíduos 1470-1525 da SEQ ID N°. 2, e um domínio CNH previsto nos resíduos 1568-1865 da SEQ ID N°. 2.
A proteína 13245 humana tem sítios de N-glicosilação previstos (Número de entrada Pfam PS00001) por volta dos resíduos de aminoácidos 819-822, 1571-1574, 1694-1697, 1717-1720 e 2026-2029 da SEQ ID N°. 2; sítios de fosforilação de proteína cinase dependentes de cAMP-/cGMP 13 previstos (Número de entrada Pfam PS00004) por volta dos resíduos de aminoácidos 78-81, 477-480, 579-582, 601-604, 680-683, 1322-1325 e 1366-1369 da SEQ ID N° . 2; sítios de fosforilação de proteína cinase C previstos (Número de entrada Pfam PS00005) por volta dos resíduos de aminoácidos 93-95 , 248-250, 308-310, 378-380, 487- 489, 498-500, 516- 518, 546-548, 577-579, 824-826, 872-874 , 1025-1027, 1033- 1035, 1096-1098, 1144-1146, 1170-1172, 1215-1217, 1268- 1270, 1314-1316, 1335-1337, 1363-1365, 1376-1378, 1542- 1544, 1724-1726, 1892-1894, 1910-1912, 1963-1965 e 1977- 1979 da SEQ ID N°. 2; sítios de fosforilação de caseína cinase II previstos (Número de entrada Pfam PS00006) localizados por volta dos resíduos de aminoácidos 83-86 93-96, 140- 143, 361-364, 381-384, 386-389, 410- -413, 436 439, 445-448, 480-483, 487-490, 501 -504, 529-532 , 867-870 908-911, 935-938, 940- 943, 973-976, 1015-1018, 1025-1028 1046-4049, 1081-1084, 1142-1145, 1170-1173, 1218-1221 1308-1311, 1314-1317, 1370-1373, 1736-1739, 1794-1797 1864-1867, 1882-1885, 1904-1907, 1964-1967 e 2012-2015 da SEQ ID N°. 2; um sítio de fosforilação de tirosina cinase previstos nos resíduos 741-747 da SEQ ID N°. 2; sítios de N-miristoilação previstos (Número de entrada Pfam PS00008) por volta dos resíduos de aminoácidos 50-5, 1202-1207, 1532-1537, 1584-1589, 1675-1680 e 1999-2004 da SEQ ID N° . 2; um sítio de amidação previsto (Número de entrada Pfam PS00009) por volta dos resíduos de aminoácidos 134-136 da SEQ ID N°. 2. e
Para uma informação geral relativamente aos identificadores PFAM, números de identificação do domínio de prefixo PS e prefixo PF, ver Sonnhammer et al. (1997, Protein 28:405-420) 14 http://www.psc.edu/general/software/packages/pfam/pfam.html A proteína 13245 contém um número significativo de características estruturais em comum com membros da família MDPK. 0 termo "família" quando se refere às moléculas de proteína e de ácido nucleico da invenção significa duas ou mais moléculas de proteínas ou de ácido nucleico possuindo um domínio ou motivo estrutural comum e possuindo homologia suficiente na sequência de aminoácidos ou de nucleótidos como aqui definida. Tais membros da família podem ser naturais ou não naturais e podem ser da mesma espécie ou de espécies diferentes. Por exemplo, uma família pode conter uma primeira proteína de origem humana assim como outras proteínas diferentes de origem humana, ou alternativamente, podem conter homólogos de origem não humana, por exemplo, proteínas MDPK de qualquer espécie descrita na técnica. Os membros de uma família também podem ter características funcionais comuns.
Um polipéptido 13245 pode incluir um domínio pcinase. Como aqui utilizado, o termo "domínio pcinase" refere-se a um domínio de proteína possuindo uma sequência de aminoácidos de cerca de 200-300 resíduos de aminoácidos de comprimento, preferencialmente, pelo menos cerca de 225-300 aminoácidos, mais preferencialmente de cerca de 264 resíduos de aminoácidos e tem uma estria de resíduos para o alinhamento da sequência ao domínio pcinase (HMM) de pelo menos 100 ou maior, preferencialmente 150 ou maior, e mais preferencialmente 200 ou maior. Ao domínio pcinase foi atribuída a entrada PFAM PF00069 (http: //genorne.wust. 1.edu/Pf am/html) . 15
Um polipéptido 13245 pode incluir um domínio pcinase. Como aqui utilizado, o termo "domínio CNH" refere-se a um domínio de proteína possuindo uma sequência de aminoácidos de cerca de 250-350 resíduos de aminoácidos de comprimento, preferencialmente, pelo menos cerca de 275-325 aminoácidos, mais preferencialmente cerca de 298 resíduos de aminoácidos e tem uma estria de resíduos para o alinhamento da sequência ao domínio pcinase (HMM) de pelo menos 100 ou maior, preferencialmente 200 ou maior e mais preferencialmente 300 ou maior. Ao domínio pcinase foi atribuída a entrada PFAM PF00780 (http://genome.wustl.edu/Pfamhtml).
Numa forma de realização preferida, o polipéptido ou proteína 13245 tem um domínio pcinase ou uma região a qual inclui pelo menos cerca de 200-300, mais preferencialmente cerca de 225-300 ou 264 resíduos de aminoácidos e tem pelo menos cerca de 60%, 70%, 80%, 90%, 95%, 99% ou 100% de homologia com um domínio pcinase, por exemplo, o domínio pcinase da 13245 humana (por exemplo, resíduos 97-360 da SEQ ID N° . 2) .
Noutra forma de realização preferida, o polipéptido ou proteína 13245 tem um domínio CNH ou uma região a qual inclui pelo menos cerca de 250-350, mais preferencialmente cerca de 275-325 ou 298 resíduos de aminoácidos e tem pelo menos cerca de 60%, 70%, 80%, 90%, 95%, 99% ou 100% de homologia com um domínio CNH, por exemplo, o domínio CNH da 13245 humana (por exemplo, os resíduos 1568-1865 da SEQ ID N°. 2) .
Para identificar a presença de um domínio pcinase ou CNH num receptor de 13245, a sequência de aminoácidos da 16 proteína é investigada contra uma base de HMMs (por exemplo, o banco de dados Pfam, release 2.1) utilizando os parâmetros por defeito (http://www.sanger.ac.uk/Software/Pfa/H_search). Por exemplo, o programa hmmsf, o qual está disponível como parte do pacote HMMER de programas de pesquisa, é um programa por defeito específico para família par o PF00069 ou PF00780 e uma classificação de 100 é a classificação limiar para determinar uma identificação com sucesso. Por exemplo, utilizando o software ORFAnalyzer identificou-se um perfil de domínio pcinase na sequência de aminoácidos da SEQ ID N°. 2 (por exemplo, aminoácidos 53-303 da SEQ ID N°. 2) . Em conformidade encontra-se dentro do âmbito da invenção uma proteína 13245 possuindo pelo menos cerca de 60-70%, mais preferencialmente cerca de 70-80% ou cerca de 80-90% de homologia com o perfil do domínio pcinase ou com o perfil do domínio CNH da 13245 humana.
Embora não se fique limitado por qualquer teoria de funcionamento particular, julga-se que a proteína 13245 seja, pelo menos numa forma de realização, uma proteína da membrana nuclear possuindo o seu terminal carboxilo orientado dentro do envelope nuclear. Nesta forma de realização, a proteína 13245 é capaz de transmitir informação de sinalização do citoplasma para o núcleo, através da qual pode, por exemplo, ser regulada a transcrição de genes.
Numa forma de realização da invenção, um polipéptido 13245 inclui pelo menos um domínio pcinase. Noutra forma de realização, o polipéptido 13245 inclui pelo menos um domínio pcinase e pelo menos um domínio CNH. As moléculas de 13245 da presente invenção podem incluir ainda um ou 17 mais dos domínios e sítios de N-glicosilação, fosforilação de proteína cinase dependente de cAMP/cGMP, fosforilação de proteína cinase C, fosforilação de caseína cinase II, fosforilação de tirosina cinase, N-miristoilação, amidação, fecho de leucina, sítio activo de proteína cinase de serina/treonina, assinatura de subdomínio de carbamoil-fosfato sintase, domínio terminal de proteína cinase C de ligação a éster de forbol/diacilglicerol e homologia de Pleckstrin aqui descritos, e preferencialmente compreende a maior parte ou a totalidade destes.
Como se mostra na Figura 3, a proteína 13245 apresenta uma homologia de sequência significativa com várias proteínas relacionadas com a proteína citron, a qual se sabe que interage com enzimas GTPase da família Rho. Estas GTPases incluem, por exemplo, Rho-A, -B e -C, Rac-1 e -2, e CDC42. Estas GTPases regulam a estrutura celular, incluindo a forma celular, contracção celular, movimento celular, distribuição das proteínas estruturais (por exemplo, actina) dentro da célula, formação de adesões focais, citocinese e divisão celular. Sabe-se também que estas GTPases modulam a expressão de genes de um modo dependente da fosforilação. As proteínas que são capazes de interagir, catalisar a interconversão de isoformas fosforiladas e não fosforiladas da Rho da GTPase, ou ambas, são adequadas para modular estes processos celulares. A ocorrência de pcinase, pcinase_C, uma assinatura da região proteína cinase de ligação ao ATP, uma assinatura de sítio activo de proteína cinase de serina/treonina, um sítio de fosforilação de tirosina cinase, sítios múltiplos de fosforilação potencial e semelhança com proteínas citron indica que a proteína 13245 é capaz de interagir com Rho 18 GTPases e catalisar a interconversão das suas formas fosforilada e não fosforilada. A aptidão da 13245 para modular o estado de fosforilação das Rho GTPases indica que a 13245 é adequada para modular uma ou mais da forma celular, contracção celular, movimento celular, distribuição de proteínas estruturais (por exemplo, actina) no interior da célula, formação de adesões focais, citocinese e divisão celular nas células em que ela é expressada. Além disso, estas características indicam que a proteína 13245 está envolvida em distúrbios nos quais um ou mais destes processos são aberrantes. As moléculas 13245 aqui descritas podem ser por conseguinte utilizadas para prever, diagnosticar, inibir, prevenir, aliviar ou curar estes distúrbios. Exemplos de distúrbios nos quais um ou mais destes processos são aberrantes incluem tumorigénese, crescimento de tumores, metástase tumoral e infecção virai de uma célula. A expressão da 13245 é maior em células de sangue periférico do que em muitos outros tipos de células, e observa-se uma expressão intensificada da 13245 em células infectadas pelo HIV-1, incluindo células da linha celular CCRF que foram infectadas pelo vírus. As células infectadas pelo HIV-1 sofrem várias alterações morfológicas e o padrão de expressão de genes nas células infectadas pelo HIV-1 difere do padrão observado em células não infectadas do mesmo tipo. Estas observações indicam que a 13245 tem um papel nos efeitos da infecção pelo HIV-1 nas células hospedeiras (por exemplo, nas células mononucleares sanguíneas periféricas). A modulação da expressão ou da actividade da 13245, ou de ambas em células infectadas pelo HIV-1 pode modular os processos listados acima, aliviando ou invertendo desse modo os efeitos da infecção pelo HIV-1. 19 A título de exemplo as moléculas de 13245 aqui descritas podem ser utilizadas para inibir a inserção do genoma do HIV-1 no genoma da célula hospedeira, inibir ou inverter a conservação do genoma do hiv-1 no genoma da célula hospedeira, inibir ou inverter as alterações citológicas induzidas pela infecção pelo HIV-1, inibir a produção do vírus HIV-1 em células infectadas, inibir a interacção de viriões de HIV-1 com a membrana citoplasmática da célula hospedeira, inibir a encapsulação de partículas de vírus HIV-1 em partes da membrana da célula hospedeira ou inibir a libertação do vírus HIV-1 a partir das células infectadas. As moléculas de 13245 podem, por conseguinte, ser utilizadas para tratar indivíduos que estejam infectados pelo HIV-1 (por exemplo, indivíduos afectados pelo síndrome da imunodeficiência adquirida) ou com outros virus patogénicos ou para inibir a transmissão do vírus de um indivíduo para outro.
Uma vez que os polipéptidos 13245 da invenção podem modular as actividades mediadas pela 13245, eles podem ser utilizados para desenvolver novos agentes de diagnóstico e terapêuticos para distúrbios mediados ou relacionados com a 13245, como se descreve abaixo.
Como aqui utilizada, uma "actividade 13245," "actividade biológica de 13245" ou "actividade funcional de 13245," refere-se a uma actividade exercida por uma molécula de proteína, polipéptido ou ácido nucleico 13245, por exemplo, numa célula responsiva a 13245 ou num substrato de 13245 (por exemplo, um substrato de proteína tal como uma proteína do canal de sódio controlado por tensão do músculo-esquelético) como determinado in vivo ou in vitro. Numa forma de realização, uma actividade 13245 é 20 uma actividade directa, tal como a associação com uma molécula alvo da 13245. Uma "molécula alvo" ou "parceiro de ligação" de uma proteína 13245 é uma molécula (por exemplo, uma proteína ou um ácido nucleico) com o qual a proteína 13245 se liga ou interage na natureza. Numa forma de realização ilustrativa, uma tal molécula alvo é um receptor 13245. Uma actividade 13245 também pode ser uma actividade indirecta, tal como uma actividade de sinalização celular mediada por interacção da proteína 13245 com um receptor da 13245.
Prevê-se que as moléculas 13245 da presente invenção possuam actividades biológicas semelhantes aos membros da família da MDPK. Por exemplo, as proteínas 13245 da presente invenção podem ter uma ou mais das actividades seguintes: (1) catalisar a formação de uma ligação covalente dentro ou entre um resíduo de aminoácido e uma unidade fosfato; (2) modular a contractilidade celular; (3) modular o crescimento celular; (4) modular a condutividade celular; (5) modular a entrada de uma célula no ciclo celular; (6) modular a progressão de uma célula através do ciclo celular; (7) modular a mitogénese; (8) modular o metabolismo celular; (9) modular a transcrição de genes; (10) catalisar a interconversão das formas fosforilada e não fosforilada de uma GTPase, tal como uma Rho GTPase; (11) modular a citocinese; (12) modular a forma celular; 21 (13) modular o movimento celular (por exemplo, metástase tumoral); (14) modular a integração de um genoma virai no genoma de uma célula hospedeira; (15) modular a conservação de um genoma virai no genoma de uma célula hospedeira; (16) modular as alterações citológicas numa célula hospedeira infectada por vírus; (17) modular a produção virai numa célula hospedeira infectada por virus; (18) modular a interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; e (19) modular a encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus.
Assim, as moléculas 13245 aqui descritas podem actuar como novos alvos de diagnóstico e agentes terapêuticos para prognosticar, diagnosticar, prevenir, inibir, aliviar ou curar distúrbios relacionados com a MDPK.
Outras actividades, como descritas abaixo, incluem a capacidade para modular o funcionamento, sobrevivência, morfologia, proliferação e/ou diferenciação de células de tecidos nos quais se encontram expressadas as moléculas 13245. Assim, as moléculas de 13245 podem actuar como novos alvos de diagnóstico e agentes terapêuticos para controlar distúrbios que envolvam actividades aberrantes destas células.
As moléculas de 13245 também podem actuar como novos alvos de diagnóstico e agentes terapêuticos para controlar vários distúrbios, incluindo distúrbios do músculo- 22 esquelético (por exemplo, distrofias musculares e miotónicas como descritas aqui e na técnica). A proteína 13245, seus fragmentos e derivados, e outras variantes da sequência na SEQ ID N°. 2 daquela são colectivamente referidos como "polipéptidos ou proteínas da invenção" ou "polipéptidos ou proteínas 13245". As moléculas de ácido nucleico que codificam tais polipéptidos ou proteínas são colectivamente referidas como "ácidos nucleicos da invenção" ou "ácidos nucleicos 13245." Moléculas 13245 refere-se a ácidos nucleicos, polipéptidos e anticorpos de 13245.
Como aqui utilizado, o termo "molécula de ácido nucleico" inclui moléculas de ADN (por exemplo, um ADNc ou ADN genómico) e moléculas de ARN (por exemplo, um ARNm) e análogos do ADN ou ARN gerado, por exemplo, pela utilização de análogos de nucleótidos. A molécula de ácido nucleico pode ser de cadeia simples ou cadeia dupla, mas é preferencialmente ADN de cadeia dupla. 0 termo "molécula de ácido nucleico isolada ou purificada" inclui moléculas de ácido nucleico que são separadas de outras moléculas de ácido nucleico que estão presentes na fonte natural do ácido nucleico. Por exemplo, no que se refere ao ADN genómico, o termo "isolado" inclui moléculas de ácido nucleico que são separadas do cromossoma com o qual o ADN genómico está naturalmente associado. Preferencialmente, um ácido nucleico "isolado" está livre das sequências que flanqueiam naturalmente o ácido nucleico (isto é, sequências localizadas nas extremidades 5' e/ou 3' do ácido nucleico) no ADN genómico do organismo do qual o ácido nucleico é proveniente. Por exemplo, em várias formas 23 de realização, a molécula de ácido nucleico isolada pode conter menos do que cerca de 5 quilobases, 4 quilobases, 3 quilobases, 2 quilobases, 1 quilobase, 0,5 quilobase ou 0,1 quilobase das sequências de nucleótidos 5' e/ou 3' que flanqueiam naturalmente a molécula de ácido nucleico no ADN qenómico da célula de onde é proveniente o ácido nucleico. Além disso, uma molécula de ácido nucleico "isolada", tal como uma molécula de ADNc, pode estar consideravelmente livre de outro material celular, ou meio de cultura quando produzida por técnicas recombinantes, ou consideravelmente livre de precursores químicos ou outras substâncias químicas quando sintetizado por via química.
Como aqui utilizado, o termo "hibridiza em condições rigorosas" descreve condições para hibridização e lavagem. As condições rigorosas são conhecidas dos especialistas na técnica e podem ser encontradas em referências disponíveis (por exemplo, Current Protocols in Molecular Biology, John wiley & Sons, N.Y., 1989, 6.3.1-6.3.6) . Nessa referência são descritos métodos aquosos e não aquosos, podendo ser utilizado qualquer um deles. Um exemplo preferido de condições de hibridização rigorosas é a hibridização em 6x cloreto de sódio/citrato de sódio (SSC) a cerca de 45 °C, seguida de uma ou mais lavagens em 0,2x SSC, 0.1% (p/v) de SDS a 50 °C. Outro exemplo de condições rigorosas de hibridização é a hibridização em 6x SSC a cerca de 45 °C, seguida de uma ou mais lavagens em 0,2x SSC, 0,1% (p/v) SDS a 55 °C. Um outro exemplo de condições de hibridização rigorosas é a hibridização em 6x SSC a cerca de 45 °C, seguida de uma ou mais lavagens em 0,2x SSC, 0,1% (p/v) de SDS a 60 °C. Preferencialmente, condições de hibridização rigorosas são hibridização em 6x SSC a cerca de 45 °C, 24 seguida de uma ou mais lavagens em 0,2x SSC, 0,1% (p/v) de SDS a 65 °C. Em particular, as condições rigorosas preferidas (e as condições que deveriam ser utilizadas se o praticante não tiver a certeza das condições que deveriam ser aplicadas para determinar se uma molécula está dentro de uma limitação de hibridização da invenção) são 0,5 molar de fosfato de sódio, 7% (p/v) de SDS a 65 °C, seguida de uma ou mais lavagens a 0,2x SSC, 1% (p/v) de SDS a 65 °C. Preferencialmente, uma molécula de ácido nucleico isolada da invenção que hibridiza em condições rigorosas na sequência da SEQ ID N°. 1 ou SEQ id N°. 3, corresponde a uma molécula de ácido nucleico natural.
Como aqui utilizado, uma molécula de ácido nucleico "natural" refere-se a uma molécula de ARN ou adn com a sequência de nucleótidos que ocorre na natureza (por exemplo, codifica a proteína natural).
Como aqui utilizado, os termos "gene" e "gene recombinante" referem-se a moléculas de ácido nucleico que incluem uma grelha de leitura aberta que codifica uma proteína 13245, preferencialmente uma proteína 13245 mamífera, podendo incluir ainda sequências reguladoras não codificadoras e intrões.
Um polipéptido ou proteína "isolado" ou "purificado" está consideravelmente livre de material celular ou de outras proteínas contaminantes de fonte celular ou tecidular a partir da qual a proteína é proveniente, ou consideravelmente livre de precursores químicos ou outras substâncias químicas quando sintetizada por via química. Numa forma de realização, a linguagem "consideravelmente livre" significa preparação da proteína 13245 com menos do 25 que cerca de 30%, 20%, 10% e mais preferencialmente 5% (em peso seco), de outras proteínas que não a proteína 13245 (também aqui referida como uma "proteína contaminante"), ou de precursores químicos ou de substâncias químicas não 13245. Quando a proteína 13245 ou uma parte biologicamente activa desta é produzida recombinantemente, ela também está preferencialmente livre de meio de cultura, isto é, o meio de cultura representa menos do que cerca de 20%, mais preferencialmente menos do que cerca de 10% e muito preferencialmente menos do que cerca de 5% do volume da preparação proteica. A invenção inclui preparações isoladas ou purificadas de pelo menos 0,01, 0,1, 1,0 e 10 miligrama em peso seco.
Um resíduo de aminoácido "não essencial" é um resíduo que pode ser alterado na sequência de tipo selvagem da 13245 (por exemplo, a sequência de qualquer uma das SEQ ID N°. 1 e 3) sem anular ou, mais preferencialmente, sem alterar consideravelmente uma actividade biológica, enquanto um resíduo de aminoácido "essencial" origina uma tal alteração. Por exemplo, prevê-se que os resíduos de aminoácidos que são conservados entre os polipéptidos da presente invenção, por exemplo, os presentes no domínio pcinase sejam particularmente não adequados para serem alterados.
Uma "substituição conservativa de aminoácido" é uma na qual o resíduo de aminoácido está substituído por um resíduo de aminoácido possuindo uma cadeia lateral semelhante. As famílias de resíduos de aminoácidos possuindo cadeias laterais semelhantes foram definidas na técnica. Estas famílias incluem aminoácidos com cadeias laterais básicas (por exemplo, lisina, arginina, 26 histidina), cadeias laterais ácidas (por exemplo, ácido aspártico, ácido glutâmico), cadeias laterais polares não carregadas (por exemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, cisteína), cadeias laterais não polares (por exemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptofano), cadeias laterais ramificadas na posição beta (por exemplo, treonina, valina, isoleucina) e cadeias laterais aromáticas (por exemplo, tirosina, fenilalanina, triptofano, histidina). Assim, um resíduo de aminoácido previsivelmente não essencial numa proteína 13245 está preferencialmente substituído por outro resíduo de aminoácido da mesma familia de cadeias laterais. Alternativamente, noutra forma de realização, podem ser introduzidas aleatoriamente mutações ao longo de toda ou de parte da sequência de codificação da 13245, tal como por mutagénese de saturação e os mutantes resultantes podem ser rastreados para actividade biológica 13245 para identificar mutantes que conservam actividade. Após mutagénese da SEQ ID N°. 1 ou 3, pode expressar-se a proteína codificada de modo recombinante e determinar-se a actividade da proteína.
Como aqui utilizada, uma "parte biologicamente activa" de uma proteína 13245 inclui um fragmento de uma proteína 13245 que participa numa interacção entre uma molécula 13245 e uma molécula não 13245. As partes biologicamente activas de uma proteína 13245 incluem péptidos compreendendo sequências de aminoácidos suficientemente homólogas ou provenientes da sequência de aminoácidos da proteína 13245, por exemplo, a sequência de aminoácidos mostrada na SEQ ID N°. 2, a qual inclui menos aminoácidos do que as proteínas 13245 inteiras e exibe pelo menos uma actividade de uma proteína 13245. Tipicamente, as partes 27 biologicamente activas compreendem um domínio ou motivo com pelo menos uma actividade da proteína 13245, por exemplo, um domínio ou motivo capaz de catalisar uma actividade aqui descrita, tal como a adição covalente de uma unidade fosfato a um resíduo aminoácido da proteína (por exemplo, a um grupo hidroxilo de serina ou treonina).
Uma parte biologicamente activa de uma proteína 13245 pode ser um polipéptido com por exemplo, 10, 25, 50, 100, 200, 300, ou 400, 500, 1000, 1500, ou 2000 ou mais aminoácidos de comprimento. As partes biologicamente activas de uma proteína 13245 podem ser utilizadas como alvos para desenvolver agentes que modulam uma actividade mediada pela 13245, por exemplo, uma actividade biológica aqui descrita.
Os cálculos de homologia ou identidade de sequência entre sequências (os termos são aqui utilizados alternativamente) são realizados do seguinte modo.
Para determinar a percentagem de identidade de duas sequências de aminoácidos, ou de duas sequências de ácido nucleico, as sequências são alinhadas para efeitos de uma comparação óptima (por exemplo, pode introduzir-se lacunas em uma ou em ambas de uma primeira e segunda sequências de aminoácidos ou ácidos nucleicos para alinhamento óptimo e as sequências não homólogas podem ser ignoradas para efeitos de comparação). Numa forma de realização preferida, o comprimento de uma sequência de referência alinhada para efeitos de comparação é pelo menos de 30%, preferencialmente pelo menos 40%, mais preferencialmente pelo menos 50%, ainda mais preferencialmente pelo menos 60% e ainda mais preferencialmente pelo menos 70%, 80%, 90%, 28 100% do comprimento da sequência de referência (por exemplo, quando se alinha uma segunda sequência com a sequência de aminoácidos 13245 da SEQ ID N°. 2, 100 residuos de aminoácidos, estão alinhados preferencialmente pelo menos 200, 300, 400, 500, 1000, 1500, ou 2000 ou mais residuos de aminoácidos). Os residuos de aminoácidos ou nucleótidos nas posições de aminoácido ou posições de nucleótido correspondentes são depois comparados. Quando uma posição na primeira sequência está ocupada pelo mesmo resíduo de aminoácido ou nucleótido que na posição correspondente na segunda sequência, então as moléculas são idênticas nessa posição (como aqui utilizado "identidade" de aminoácido ou ácido nucleico é equivalente a "homologia" de aminoácido ou ácido nucleico) . A percentagem de identidade entre as duas sequências é uma função do número de posições idênticas partilhadas pelas sequências, tendo em consideração o número de lacunas e o comprimento de cada lacuna, que tem de ser introduzida para alinhamento óptimo das duas sequências. A comparação das sequências e a determinação da percentagem de identidade entre duas sequências pode ser conseguida utilizando um algoritmo matemático. Numa forma de realização preferida, a percentagem de identidade entre duas sequências de aminoácidos é determinada utilizando o algoritmo de Needleman et al. (1970, J. Mol. Biol. 48:444-453) o qual foi incorporado no programa GAP no pacote de software GCG (disponível de http://www.gcg.com), utilizando uma matriz BLOSUM 62 ou uma matriz PAM250, e uma ponderação de lacuna de 16, 14, 12, 10, 8, 6 ou 4 e uma ponderação de comprimento de 1, 2, 3, 4, 5 ou 6. Ainda noutra forma de realização preferida, a percentagem de identidade entre duas sequências de nucleótidos é determinada utilizando o 29 programa GAP no pacote de software GCG (disponível em http://www.gcg.com), utilizando uma matriz NWSgapdna.CMP e uma ponderação de lacuna de 40, 50, 60, 70 ou 80 e uma ponderação de comprimento de 1, 2, 3, 4, 5 ou 6. Um conjunto particularmente preferido de parâmetros (e aquele que deveria ser utilizado se o utilizador tiver dúvidas sobre os parâmetros a aplicar para determinar se uma molécula está dentro de uma limitação de identidade ou homologia de sequência da invenção) é uma matriz de classificação BLOSUM 62 com uma penalização de lacuna de 12, uma penalização prolongada de lacuna de 4 e uma penalização de desvio da grelha de lacuna de 5. A percentagem de identidade entre duas sequências de aminoácidos ou nucleótidos pode ser determinada utilizando o algoritmo de Meyers et al. (1989, CABIOS, 4:11-17) a qual foi incorporada no programa ALIGN (versão 2.0), utilizando um quadro de ponderação de resíduos PAM120, uma penalização de comprimento de lacuna de 12 e uma penalização de lacuna de 4.
As sequências de ácido nucleico e proteína aqui descritas podem ser utilizadas como uma "sequência de interrogação" para realizar uma pesquisa contra banco de dados públicos, por exemplo, para identificar outros membros da família ou sequências relacionadas. Estas pesquisas podem ser realizadas utilizando os programas NBLAST e XBLAST (versão 2.0) de Altschul, et al. (1990, J. Mol. Biol. 215:403-410). As pesquisas de nucleótidos BLAST podem ser realizadas com o programa NBLAST, classificação = 100, comprimento da palavra = 12 para se obter sequências de nucleótidos homólogas às moléculas de ácido nucleico 13245 da invenção. As pesquisas de proteína BLAST podem ser 30 realizadas com o programa XBLAST, classificação = 50, comprimento da palavra = 3 para se obter sequências de aminoácidos homólogas às moléculas de proteína 13245 da invenção. Para obter alinhamentos com lacunas para efeitos de comparação, pode utilizar-se BLAST com lacunas como descrito em Altschul et al. (1997, Nucl. Acids Res. 25:3389-3402). Quando se utiliza programas BLAST e BLAST com lacunas, pode utilizar-se os parâmetros por defeito dos respectivos programas (por exemplo, XBLAST e NBLAST). Ver <http://www.ncbi.nlm.nih.gov>. A "expressão errónea ou aberrante," como aqui utilizada, refere-se a um padrão não natural de expressão de genes, ao nível do ARN ou da proteína. Ela inclui: a expressão a níveis não naturais, isto é, expressão excessiva ou expressão insuficiente; um padrão de expressão que difere do natural em termos do tempo ou fase ao qual o gene é expressado, por exemplo, expressão aumentada ou diminuída (relativamente à natural) num período ou etapa de desenvolvimento predeterminada; um padrão de expressão que difere do natural em termos de expressão diminuída (relativamente à natural) num predeterminado tipo de célula ou tipo de tecido; um padrão de expressão que difere do natural em termos do tamanho da excisão-união, sequência de aminoácidos, modificação pós-tradução ou actividade biológica do polipéptido expressado; um padrão de expressão que difere do natural em termos do efeito de um estímulo ambiental ou estímulo extracelular na expressão do gene, por exemplo, um padrão de expressão aumentada ou diminuída (relativamente à natural) na presença de um aumento ou diminuição na força do estímulo. 31 "Indivíduo," como aqui utilizado, pode referir-se a um mamífero, por exemplo, um ser humano, ou a um modelo experimental ou animal ou patológico. 0 indivíduo também pode ser um animal não humano, por exemplo, um cavalo, vaca, cabra ou outro animal doméstico.
Uma "preparação purificada de células," como aqui utilizada, refere-se, no caso de células vegetais ou animais, a uma preparação in vitro de células e não a uma planta ou um animal inteiro intacto. No caso de células cultivadas ou células microbianas, ela consiste de uma preparação com pelo menos 10%, e mais preferencialmente, 50% de células do indivíduo. Vários aspectos da invenção são descritos a seguir em mais pormenor.
Moléculas de ácido nucleico isoladas
Num aspecto, a invenção proporciona, uma molécula de ácido nucleico isolada ou purificada que codifica um polipéptido 13245 aqui descrito, por exemplo, uma proteína 13245 inteira ou um fragmento desta, por exemplo, uma parte biologicamente activa da proteína 13245. Também está incluído um fragmento de ácido nucleico adequado para ser utilizado como uma sonda de hibridização, a qual pode ser utilizada, por exemplo, para identificar uma molécula de ácido nucleico que codifica um polipéptido da invenção, ARNm da 13245, e fragmentos adequados para serem utilizados como iniciadores, por exemplo, iniciadores de PCR para a amplificação ou mutação de moléculas de ácido nucleico.
Numa forma de realização, uma molécula de ácido nucleico isolada da invenção inclui a sequência de 32 nucleótidos mostrada na SEQ ID N°. 1, ou uma fracção desta. Numa forma de realização, a molécula de ácido nucleico inclui sequências que codificam a proteína 13245 humana (isto é, "a região de codificação," dos nucleótidos 19-6178 da SEQ ID N°. 1), assim como as sequências 5' não traduzidas (nucleótidos 1-18 da SEQ ID N°. 1) ou sequências 3' não traduzidas (nucleótidos 6179-6575 da SEQ ID N°. 1). Alternativamente, a molécula de ácido nucleico pode incluir apenas a região de codificação da SEQ ID N°. 1 (por exemplo, nucleótidos 19-6178, correspondentes à SEQ ID N°. 3) e, por exemplo, sem as sequências de flanqueamento que acompanham normalmente a sequência objecto. Noutra forma de realização, a molécula de ácido nucleico codifica uma sequência correspondente à proteína de 2053 resíduos de aminoácidos da proteína da SEQ ID N°. 2.
Noutra forma de realização, uma molécula de ácido nucleico isolada da invenção inclui uma molécula de ácido nucleico a qual é um complemento da sequência de nucleótidos mostrada em qualquer uma das SEQ ID N°. 1 e 3, e uma fracção de qualquer uma destas sequências. Noutras formas de realização, a molécula de ácido nucleico da invenção é suficientemente complementar à sequência de nucleótidos mostrada em qualquer uma das SEQ ID N°. 1 e 3 pelo que ela pode hibridizar com um ácido nucleico possuindo aquela sequência, formando desse modo uma cadeia dupla estável.
Numa forma de realização, uma molécula de ácido nucleico isolada da invenção inclui a sequência de nucleótidos a qual é pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% ou mais homóloga ao comprimento total da sequência 33 de nucleótidos mostrada em qualquer uma das SEQ ID N°. 1 e 3, ou uma fracção, preferencialmente do mesmo comprimento, de qualquer uma destas sequências de nucleótidos.
Fragmentos do ácido nucleico 13245
Uma molécula de ácido nucleico da invenção pode incluir apenas uma fracção da sequência de ácido nucleicos de uma das SEQ ID N°. 1 e 3. Por exemplo, uma tal molécula de ácido nucleico pode incluir um fragmento que pode ser utilizado como uma sonda ou iniciador ou um fragmento que codifica uma fracção de uma proteína 13245, por exemplo, uma fracção imunogénica ou biologicamente activa de uma proteína 13245. Um fragmento pode compreender nucleótidos correspondentes aos resíduos 97-360 da SEQ ID N°. 2, que codificam um domínio pcinase da 13245 humana, ou aos resíduos 1568-1865 da SEQ ID N°. 2, que codificam um domínio CNH da 13245 humana. A sequência de nucleótidos determinada a partir da clonagem do gene da 13245 facilita a geração de sondas e iniciadores para serem utilizados na identificação e/ou clonagem de outros membros da família 13245, ou seus fragmentos, assim como homólogos da 13245, ou seus fragmentos, de outras espécies.
Noutra forma de realização, um ácido nucleico inclui uma sequência de nucleótidos que inclui parte, ou a totalidade, da região de codificação e prolonga-se ao longo de qualquer uma (ou de ambas) as regiões não codificadoras 5' ou 3'. Outras formas de realização incluem um fragmento que inclui a sequência de nucleótidos que codifica um fragmento de aminoácido aqui descrito. Os fragmentos de ácidos nucleicos podem codificar um domínio ou sítio específico aqui descrito ou fragmentos destes, em 34 particular os fragmentos destes com pelo menos cerca de 250 aminoácidos de comprimento. Os fragmentos incluem também sequências de ácido nucleicos correspondentes às sequências de aminoácidos especificas descritas acima ou os seus fragmentos. Os fragmentos de ácidos nucleicos não deveriam ser interpretados como abrangendo os fragmentos que possam ter sido descritos antes da invenção.
Um fragmento de ácido nucleico pode incluir uma sequência correspondente a um domínio, região ou sítio funcional aqui descrito. Um fragmento de ácido nucleico também pode incluir um ou mais domínios, regiões ou sítios funcionais aqui descritos. São proporcionados sondas e iniciadores de 13245. Tipicamente uma sonda/iniciador é um oligonucleótido isolado ou purificado. O oligonucleótido inclui tipicamente uma região de sequência de nucleótidos que hibridiza em condições rigorosas em pelo menos cerca de 7, 12 ou 15, preferencialmente cerca de 20 ou 25, mais preferencialmente cerca de 30, 35, 40, 45, 50, 55, 60, 65 ou 75 nucleótidos consecutivos de uma sequência mensageira ou antimensageira de qualquer uma das SEQ ID N°. 1 e 3, ou uma variante alélica natural ou mutante de qualquer uma das SEQ ID N°. 1 e 3 .
Numa forma de realização preferida o ácido nucleico é uma sonda a qual tem pelo menos 5 ou 10, e menos do que 200, mais preferencialmente menos do que 100, ou menos do que 50, pares de bases de comprimento. Ele deveria ser idêntico, ou diferir em 1, ou menos do que 5 ou 10 bases, de uma sequência aqui divulgada. Se for necessário alinhamento para esta comparação as sequências deveriam ser 35 alinhadas para homologia máxima. As sequências desligadas de delecções ou inserções, ou sem correspondência, são consideradas diferenças.
Uma sonda ou iniciador pode ser proveniente de uma cadeia mensageira ou antimensageira de um ácido nucleico que codifica um domínio pcinase por volta dos resíduos de aminoácidos 97 até 360 da SEQ ID N°. 2 ou o domínio CNH previsto por volta dos resíduos de aminoácidos 1568 até 1865 da SEQ ID N°. 2.
Noutra forma de realização é proporcionado um conjunto de iniciadores, por exemplo, iniciadores adequados para serem utilizados num PCR, o qual pode ser utilizado para amplificar uma região seleccionada de uma sequência 13245. Os iniciadores deveriam ter pelo menos 5, 10 ou 50 pares de bases de comprimento e menos do que 100, ou menos do que 200, pares de bases de comprimento. Os iniciadores deveriam ser idênticos, ou diferir numa base de uma sequência aqui descrita ou de uma variante natural. São proporcionados iniciadores adequados para amplificar a totalidade ou uma fracção de qualquer uma das regiões seguintes: por exemplo, um ou mais domínios pcinase e o domínio CNH previsto, como definidos acima relativamente à SEQ ID N°. 2.
Um fragmento de ácido nucleico pode codificar uma região portadora de um determinante antigénico de um polipéptido aqui descrito.
Um fragmento de ácido nucleico que codifica uma "parte biologicamente activa de um polipéptido 13245" pode ser preparada isolando uma fracção da sequência de nucleótidos de qualquer uma das SEQ ID N°. 1 e 3, que codifica um 36 polipéptido possuindo uma actividade biológica 13245 (por exemplo, as actividades biológicas das proteínas 13245 aqui descritas), expressando a parte codificada da proteína 13245 (por exemplo, por expressão recombinante in vitro) e avaliando a actividade da parte codificada da proteína 13245. Por exemplo, um fragmento de ácido nucleico que codifica uma parte biologicamente activa da 13245 inclui um domínio pcinase, por exemplo, os resíduos de aminoácidos 97 até 360 da SEQ ID N°. 2, ou um domínio CNH, por exemplo, os resíduos de aminoácidos 1568 até 1865 da SEQ ID N°, 2. Um fragmento de ácido nucleico que codifica uma parte biologicamente activa de um polipéptido 13245 pode compreender uma sequência de nucleótidos que tem um comprimento superior a 25 ou mais nucleótidos.
Numa forma de realização, um ácido nucleico inclui um que tem uma sequência de nucleótidos que tem um comprimento superior a 260, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 2000, 2500, 3000, 4000, 5000 ou 6000 ou mais nucleótidos e que hibridiza em condições rigorosas de hibridização com uma molécula de ácido nucleico possuindo uma sequência de qualquer uma das SEQ ID N°. 1 e 3 .
Variantes do Ácido Nucleico 13245 A invenção abrange ainda moléculas de ácido nucleico possuindo uma sequência que difere da sequência de nucleótidos mostrada em qualquer uma das SEQ ID N°. 1 e 3. Tais diferenças podem ser atribuídas à degeneração do código genético (isto é, diferenças que resultam num ácido nucleico que codifica as mesmas proteínas 13245 que aquelas codificadas por uma sequência de nucleótidos aqui 37 descrita). Noutra forma de realização, uma molécula de ácido nucleico isolada da invenção codifica uma proteína possuindo uma sequência de aminoácidos que difere em pelo menos 1, mas em menos do que 5, 10, 20, 50 ou 100, residuos de aminoácidos da SEQ ID N°. 2. Se for necessário proceder a alinhamento para esta comparação as sequências deverão ser alinhadas para máxima homologia. Sequências desligadas de delecções ou inserções, ou sem correspondência, são consideradas diferenças.
Os ácidos nucleicos do inventor podem ser escolhidos por terem códãos, os quais são preferidos, ou não preferidos, para um sistema de expressão particular. Por exemplo, o ácido nucleico pode ser um no qual pelo menos um códão, e preferencialmente pelo menos 10% ou 20% dos códãos foram alterados pelo que a sequência é optimizada para expressão em células de E. coli, levedura, humanas, de insecto ou CHO.
As variantes de ácido nucleico podem ser naturais, tais como as variantes alélicas (mesmo locus), homólogas (locus diferente) e ortólogas (organismo diferente) ou podem ser não naturais. As variantes não naturais podem ser preparadas por técnicas de mutagénese, incluindo as aplicadas a polinucleótidos, células ou organismos. As variantes podem conter substituições, delecções, inversões e inserções de nucleótidos. A variação pode ocorrer em qualquer uma ou em ambas as regiões de codificação e não codificação. As variações podem produzir substituições conservadoras e não conservadoras de aminoácidos (como comparado no produto codificado). 38
Numa forma de realização preferida, o ácido nucleico tem uma sequência que difere de qualquer uma das SEQ ID N°. 1 e 3, por exemplo, como se segue: em pelo menos um, mas menos do que 10, 20, 30 ou 40, residuos de nucleótidos; ou em pelo menos um mas menos do que 1%, 5%, 10% ou 20% dos residuos de nucleótidos no ácido nucleico objecto. Se necessário, para esta análise as sequências deveriam ser alinhadas para máxima homologia. Sequências desligadas de delecções ou inserções, ou sem correspondência, são consideradas diferenças.
As variantes ortólogas, homólogas e alélicas podem ser identificadas utilizando métodos conhecidos na técnica. Estas variantes compreendem uma sequência de nucleótidos que codifica um polipéptido que é 50%, pelo menos cerca de 55%, tipicamente pelo menos cerca de 70-75%, mais tipicamente pelo menos cerca de 80-85% e muito tipicamente pelo menos cerca de 90-95% ou mais idêntica à uma sequência de nucleótidos mostrada em qualquer uma das SEQ ID N°. 1 e 3, ou um fragmento de qualquer uma destas sequências. Tais moléculas de ácido nucleico podem ser prontamente identificadas como sendo capazes de hibridizar em condições rigorosas, numa sequência de nucleótidos mostrada em qualquer uma das SEQ ID N°. 1 e 3, ou um fragmento de qualquer uma destas sequências. As moléculas de ácido nucleico correspondentes às variantes ortólogas, homólogas e alélicas dos ADNc da 13245 da invenção podem ser ainda isoladas mapeando ao mesmo cromossoma ou locus que o gene da 13245.
As variantes preferidas incluem aquelas que estão correlacionadas com qualquer uma das actividades biológicas da 13245 aqui descritas, por exemplo, catalisar a formação 39 de uma ligação covalente entre um resíduo de aminoácido de uma proteína (por exemplo, um resíduo de serina ou treonina) e uma unidade fosfato.
As variantes alélicas da 13245 (por exemplo, 13245 humana) incluem proteínas funcionais e não funcionais. As variantes alélicas funcionais são sequências de aminoácidos naturais variantes da proteína 13245 dentro de uma população que conserva a capacidade para mediar qualquer uma das actividades biológicas da 13245 aqui descritas.
As variantes alélicas funcionais conterão tipicamente apenas substituições conservadoras de um ou mais aminoácidos da SEQ ID N°. 2, ou a substituição, delecção ou inserção de resíduos não críticos em regiões não críticas da proteína. As variantes alélicas não funcionais são sequências de aminoácidos naturais variantes da proteína 13245 (por exemplo, 13245 humana) dentro de uma população que não tem a capacidade para mediar qualquer uma das actividades biológicas da 13245 aqui descritas. As variantes alélicas não funcionais conterão tipicamente uma substituição, uma delecção ou inserção não conservadora, ou a truncagem prematura de uma sequência de aminoácidos da SEQ ID N°. 2, ou a substituição, inserção ou delecção em resíduos críticos ou regiões críticas da proteína.
Além disso, as moléculas de ácido nucleico que codificam outros membros da família 13245 e que têm, deste modo, uma sequência de nucleótidos que difere das sequências 13245 de qualquer uma das SEQ ID N°. 1 e 3 estão dentro do âmbito da invenção. 40
Moléculas de Ácido Nucleico Antimensageiro, Ribozimas e Moléculas de Ácido Nucleico 13245 Modificadas
Noutro aspecto, a invenção caracteriza, uma molécula de ácido nucleico isolada que é antimensageiro para a 13245. Um ácido nucleico "antimensageiro" pode incluir uma sequência de nucleótidos que é complementar a um ácido nucleico "mensageiro" que codifica uma proteína, por exemplo, complementar da cadeia de codificação de uma molécula de ADNc de dupla cadeia ou complementar a uma sequência de ARNm. O ácido nucleico antimensageiro pode ser complementar a uma cadeia de codificação da 13245 inteira ou apenas a uma fracção desta (por exemplo, a região de codificação da 13245 humana correspondente à SEQ ID N°. 3). Noutra forma de realização, a molécula de ácido nucleico antimensageiro é antimensageira para uma "região não codificadora" da cadeia de codificação de uma sequência de nucleótidos que codifica a 13245 (por exemplo, as regiões 5' e 3' não traduzidas).
Um ácido nucleico antimensageiro pode ser concebido de modo a ser complementar a toda a região de codificação do ARNm da 13245, mas mais preferencialmente é um oligonucleótido que é antimensageiro para apenas uma fracção da região codificadora e não codificadora do ARNm da 13245. Por exemplo, o oligonucleótido antimensageiro pode ser complementar à região que circunda o sítio de início da translação do ARNm da 13245, por exemplo, entre as regiões -10 e +10 da sequência de nucleótidos do gene alvo de interesse. Um oligonucleótido antimensageiro pode ter um comprimento de, por exemplo, cerca de 7, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75 ou 80 ou mais resíduos de nucleótidos. 41
Um ácido nucleico antimensageiro da invenção pode ser construído utilizando síntese química e reacções de ligação enzimática utilizando procedimentos conhecidos na técnica. Por exemplo, um ácido nucleico antimensageiro (por exemplo, um oligonucleótido antimensageiro) pode ser quimicamente sintetizado utilizando nucleótidos naturais ou nucleótidos modificados de modo variado concebidos para aumentar a estabilidade biológica das moléculas ou para aumentar a estabilidade física da cadeia dupla formada entre os ácidos nucleicos antimensageiro e mensageiro pode utilizar-se, por exemplo, nucleótidos derivados de fosforotioato e substituídos com acridina. 0 ácido nucleico antimensageiro também pode ser produzido biologicamente utilizando um vector de expressão no qual foi subclonado um ácido nucleico numa orientação antimensageira (isto é, o ARN transcrito a partir do ácido nucleico inserido terá uma orientação antimensageira para um ácido nucleico alvo de interesse, descrito em mais pormenor na subsecção seguinte) .
As moléculas de ácido nucleico antimensageiro da invenção são tipicamente administradas a um indivíduo (por exemplo, por injecção directa num tecido) ou são geradas in situ de modo a que elas hibridizem ou se liguem ao ARNm e/ou ADN genómico celular que codifica uma proteína 13245 para desse modo inibir a expressão da proteína, por exemplo, inibindo a transcrição e/ou tradução. Alternativamente, as moléculas de ácido nucleico antimensageiro podem ser modificadas para atingir células seleccionadas e depois administradas de modo sistémico. Para administração sistémica, as moléculas antimensageiras podem ser modificadas de modo a que se liguem especificamente aos receptores ou antigénios expressados 42 numa superfície celular seleccionada, por exemplo, ligando as moléculas de ácido nucleico antimensageiro a péptidos ou anticorpos que se ligam aos receptores da superfície celular ou antigénios. The moléculas de ácido nucleico antimensageiro também podem ser administradas a células utilizando os vectores aqui descritos. Para se conseguir concentrações intracelulares suficientes das moléculas antimensageiras são preferidas construções de vectores nas quais a molécula de ácido nucleico antimensageiro é colocada sob o controlo de um promotor pol II ou pol III forte.
Ainda noutra forma de realização, a molécula de ácido nucleico antimensageiro da invenção é uma molécula de ácido nucleico alfa-anomérico. Uma molécula de ácido nucleico alfa-anomérico forma híbridos de cadeia dupla específicos com ARN complementar nos quais, contrariamente às unidades beta habituais, as cadeias ficam paralelas uma à outra (Gaultier et al., 1987, Nucl. Acids. Res. 15:6625-6641). A molécula de ácido nucleico antimensageiro também pode compreender um 2'-o-metilribonucleótido (Inoue et al., 1987, Nucl. Acids Res. 15:6131-6148) ou um análogo ARN-ADN quimérico (Inoue et al., 1987, FEBS Lett. 215:327-330).
Ainda noutra forma de realização, um ácido nucleico antimensageiro da invenção é uma ribozima. Uma ribozima possuindo especificidade para um ácido nucleico que codifica a 13245 pode incluir uma ou mais sequências complementares a uma sequência de nucleótidos de um ADNc da 13245 aqui descrito (isto é, SEQ ID N°. 1 ou SEQ ID N°. 3), e uma sequência possuindo uma sequência catalítica conhecida responsável pela clivagem do ARNm (ver, por exemplo, Patente U.S. número 5 093 246 ou Haselhoff et al. 43 (1988, Nature 334:585-591). Por exemplo pode construir-se um derivado de um ARN de Tetrahymena L-19 IVS no qual uma sequência de nucleótidos do sitio activo é complementar a uma sequência de nucleótidos a ser clivada num ARNm que codifica a 13245 (por exemplo, Patente U.S. número 4 987 071; e Patente U.S. número 5 116 742). Alternativamente, pode utilizar-se o ARNm da 13245 para seleccionar um ARN catalítico possuindo uma actividade ribonuclease específica a partir de um conjunto de moléculas de ARN (por exemplo, Bartel et al., 1993, Science 261:1411-1418). A expressão do gene da 13245 pode ser inibida orientando sequências de nucleótidos complementares para a região reguladora da 13245 (por exemplo, o promotor e/ou intensificadores da 13245) para formar estruturas triplas em hélice que impedem a transcrição do gene da 13245 em células alvo (Helene, 1991, Anticancer Drug Des. 6:569-584; Helene, et al., 1992, Ann. N.Y. Acad. Sei. 660:27-36; Maher, 1992, Bioassays 14:807-815). As sequências potenciais que podem ser seleccionadas como alvo para a formação de hélices triplas podem ser aumentadas criando uma molécula de ácido nucleico designada de "dupla mudança". As moléculas de dupla mudança são sintetizadas de um modo alternado de 5' para 3', 3' para 5', pelo que elas hibridizam com um primeira cadeia da hélice dupla e depois com a outra, eliminando a necessidade de estar presente uma sequência de purinas ou pirimidinas numa das cadeias de uma hélice dupla. A invenção também proporciona iniciadores oligonucleótidos e moléculas sonda marcados de modo detectável. Tipicamente, estas marcações são 44 quimioluminescentes, fluorescentes, radioactivas, ou calorimétricas.
Uma molécula de ácido nucleico 13245 pode ser modificada na unidade de base, unidade de açúcar ou cadeia de fosfato para melhorar, por exemplo, a estabilidade, hibridização ou solubilidade da molécula. Por exemplo, a cadeia de desoxirribose fosfato das moléculas de ácido nucleico podem ser modificadas para gerar ácidos nucleicos peptidicos (Hyrup et al., 1996, Bioorg. Med. Chem. 4:5-23). Como aqui utilizado, os termos "ácido nucleico peptidico" (ANP) refere-se a um ácido nucleico mimético, por exemplo, um ADN mimético, no qual a cadeia de desoxirribose fosfato está substituída por uma cadeia pseudopeptídica em que são retidas apenas as quatro nucleobases naturais. A cadeia neutra de um ANP pode permitir uma hibridização específica com ADN e ARN em condições de baixa força iónica. A síntese de oligómeros de ANP pode ser realizada utilizando protocolos correntes de síntese de péptidos em fase sólida como descrito em Hyrup et al. (1996, supra; Perry-OKeefe et al., Proc. Natl. Acad. Sei. USA 93:14670-14675).
Os ANP de moléculas de ácido nucleico 13245 podem ser utilizados em aplicações de terapia e diagnóstico. Por exemplo, os ANP podem ser utilizados como agentes antimensageiros ou antigénicos para modulação da expressão de genes específica para a sequência, por exemplo, induzindo a transcrição ou parando a tradução ou inibindo a replicação. Os ANP de moléculas de ácido nucleico 13245 também podem ser utilizados na análise de mutações de pares de bases simples num gene, (por exemplo, fixação por PCR orientada por ANP); como 'enzimas de restrição artificiais' quando utilizados em combinação com outras enzimas, (por 45 exemplo, SI nucleases, como descrito em Hyrup et al., 1996, supra); ou como sondas ou iniciadores para sequenciação ou hibridização de ADN (Hyrup et al., 1996, supra; Perry-OKeefe, supra).
Noutras formas de realização, o oligonucleótido pode incluir outros grupos ligados tais como péptidos (por exemplo, para detectar receptores de célula hospedeira in vivo) ou agentes que facilitem o transporte através da membrana da célula (por exemplo, Letsinger et al., 1989, Proc. Natl. Acad. Sei. USA 86:6553-6556; Lemaitre et al., 1987, Proc. Natl. Acad. Sei. USA 84:648-652; PCT número de publicação WO 88/09810) ou da barreira hematoencefálica (ver, por exemplo, PCT número de publicação WO 89/10134) . Além disso, os oligonucleótidos podem ser modificados com agentes de clivagem activados por hibridização (por exemplo, Krol et al., 1988, Bio-Techniques 6:958-976) ou agentes de intercalação (por exemplo, Zon, 1988, Pharm. Res. 5:539-549). Para este fim, o oligonucleótido pode ser conjugado a outra molécula, (por exemplo, um péptido, um agente de reticulação activado por hibridização, agente de transporte ou agente de clivagem activado por hibridização). A invenção também inclui moléculas iniciadoras e sondas de oligonucleótidos de tipo baliza molecular possuindo pelo menos uma região que é complementar a um ácido nucleico 13245 da invenção, duas regiões complementares, uma possuindo um fluoróforo e a outra possuindo um desactivador, pelo que a baliza molecular é útil para quantificar a presença do ácido nucleico da 13245 da invenção numa amostra. Ácidos nucleicos de tipo baliza molecular são descritos, por exemplo, nas Patente U.S. 46 número 5 854 033, Patente U.S. número 5 866 336 e Patente U.S. número 5 876 930.
Polipéptidos 13245 isolados
Noutro aspecto, a invenção caracteriza, uma proteína 13245 isolada, ou fragmento, por exemplo, uma parte biologicamente activa, para ser utilizada como imunogénios ou antigénios para aumentar ou testar (ou, duma maneira mais geral, para ligar) anticorpos anti-13245. A proteína 13245 pode ser isolada de fontes celulares ou tecidulares utilizando técnicas correntes de purificação de proteínas. A proteína 13245 ou os seus fragmentos podem ser produzidos por técnicas de ADN recombinante ou sintetizadas quimicamente.
Os polipéptidos da invenção incluem aqueles que resultam da existência de genes múltiplos, eventos de transcrição alternativos, eventos de excisão-união de ARN alternativos e eventos de tradução e pós-tradução alternativos. O polipéptido pode ser expressado em sistemas, por exemplo, células cultivadas, que originam essencialmente as mesmas modificações pós-tradução presentes quando o polipéptido é expressado numa célula nativa ou em sistemas que resultam na alteração ou omissão de modificações pós-tradução, por exemplo, glicosilação ou clivagem, presentes quando expressadas numa célula nativa.
Numa forma de realização preferida, um polipéptido 13245 tem uma ou mais das características seguintes: 47 (1) ele catalisa a formação de uma ligação covalente dentro ou entre um resíduo de aminoácido e uma unidade fosfato; (2) ele modula a contractilidade celular; (3) ele modula o crescimento celular; (4) ele modula a condutividade celular; (5) ele modula a entrada de uma célula no ciclo celular; (6) ele modula a progressão de uma célula através do ciclo celular; (7) ele modula a mitogénese; (8) ele modula o metabolismo celular; e (9) ele modula a transcrição de genes; (10) ele catalisa a interconversão das formas fosforilada e não fosforilada de uma GTPase, tal como uma Rho GTPase; (11) ele modula a citocinese; (12) ele modula a forma celular; (13) ele modula o movimento celular (por exemplo, metástase tumoral); (14) ele modula a integração de um genoma virai no genoma de uma célula hospedeira; (15) ele modula a conservação de um genoma virai no genoma de uma célula hospedeira; (16) ele modula as alterações citológicas numa célula hospedeira infectada por vírus; (17) ele modula a produção virai numa célula hospedeira infectada por vírus; (18) ele modula a interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; (19) ele modula a encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus 48 (20) ele tem um peso molecular, composição de aminoácidos ou outras características físicas de uma proteína 13245 da SEQ ID N°. 2; (21) ele tem uma semelhança de sequência global (identidade) de pelo menos 60-65%, preferencialmente pelo menos 70%, mais preferencialmente pelo menos 75, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99% ou mais, com uma porção da SEQ ID N°. 2; (22) ele tem um domínio CNH o qual é preferencialmente cerca de 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% ou mais, idêntico aos resíduos de aminoácidos 1568-1865 da SEQ ID N°. 2; ou (23) ele tem pelo menos um domínio pcinase o qual é preferencialmente cerca de 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% ou mais, idêntico aos resíduos de aminoácidos 97-360 da SEQ ID N°. 2.
Numa forma de realização preferida, a proteína 13245 ou o fragmento desta apenas difere de modo não substancial, ou não difere de todo, da sequência correspondente na SEQ ID N°, 2. Numa forma de realização, ela difere em pelo menos um, mas em menos do que 15, 10 ou 5 resíduos de aminoácidos. Noutra, ela difere da sequência correspondente na SEQ ID N°, 2 em pelo menos um resíduo, mas menos do que 20%, 15%, 10% ou 5% dos resíduos diferem da sequência correspondente na SEQ ID N°. 2 (se esta comparação requerer alinhamento as sequências deverão ser alinhadas para máxima homologia. Sequências desligadas de delecções ou inserções, ou sem correspondência, são consideradas diferenças). As diferenças são, preferencialmente, diferenças ou alterações em resíduos de aminoácidos não essenciais ou envolvem uma substituição conservadora de um resíduo por outro. Numa 49 forma de realização preferida as diferenças não estão nos resíduos 97-360 ou 1568-1865 da SEQ ID N°. 2.
Outras formas de realização incluem a proteína que tem uma ou mais alterações na sequência de aminoácidos, em relação à SEQ ID N°. 2 (por exemplo, uma alteração num resíduo de aminoácido que não é essencial para a actividade). Estas proteínas 13245 diferem na sequência de aminoácidos da SEQ ID N°. 2, mantendo contudo a actividade biológica.
Numa forma de realização, a proteína inclui uma sequência de aminoácidos pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% ou mais homóloga à SEQ ID N°. 2. É proporcionada uma proteína 13245 ou fragmento o qual tem uma sequência de aminoácidos que difere da SEQ ID N°. 2 em uma ou ambas as regiões correspondentes aos resíduos 1-96, 361-1567, e 1866-2053 da SEQ ID N°, 2 em pelo menos um, mas em menos do que 15, 10 ou 5 resíduos de aminoácidos, mas a qual não difere da SEQ ID N°. 2 na região correspondente aos resíduos 97-360 e 1568-1865 da SEQ ID N°. 2 (se esta comparação requerer alinhamento as sequências deverão ser alinhadas para máxima homologia. Sequências desligadas de delecções ou inserções, ou sem correspondência, são consideradas diferenças). Nalgumas formas de realização a diferença é num residuo não essencial ou é uma substituição conservadora, enquanto noutras a diferença é num resíduo essencial ou é uma substituição não conservadora. 50
Uma parte biologicamente activa de uma proteina 13245 deveria incluir o domínio pcinase da 13245, o domínio CNH da 13245 ou ambos. Além disso, outras partes biologicamente activas, nas quais são eliminadas outras regiões da proteina, podem ser preparadas por técnicas recombinantes e avaliadas em relação a uma ou mais das actividades funcionais da proteina 13245 nativa.
Numa forma de realização preferida, a proteina 13245 tem uma sequência de aminoácidos SEQ ID N° . 2. Noutras formas de realização, a proteina 13245 é essencialmente idêntica à SEQ ID N°. 2. Ainda noutra forma de realização, a proteina 13245 é essencialmente idêntica à SEQ ID N°. 2 e conserva a actividade funcional da proteína da SEQ ID N°. 2.
Proteínas Quiméricas ou de Fusão da 13245
Noutro aspecto, a invenção proporciona proteínas quiméricas ou de fusão da 13245. Como aqui utilizado, uma "proteína quimérica" ou "proteína de fusão" da 13245 inclui um polipéptido 13245 ligado a um polipéptido não 13245. Um "polipéptido não 13245" refere-se a um polipéptido possuindo uma sequência de aminoácidos correspondente a uma proteina que é essencialmente não homóloga à proteína 13245, por exemplo, uma proteina que é diferente da proteína 13245 e que é proveniente do mesmo ou de um organismo diferente. O polipéptido 13245 da proteína de fusão pode corresponder à totalidade ou a uma fracção, por exemplo, um fragmento aqui descrito de uma sequência de aminoácidos da 13245. Numa forma de realização preferida, a proteina de fusão da 13245 inclui pelo menos uma ou mais partes biologicamente activas de uma proteina 13245. O 51 polipéptido não 13245 pode estar fundido à extremidade amino ou carboxilo do polipéptido 13245. A proteina de fusão pode incluir uma unidade que tem uma afinidade elevada para um ligando. Por exemplo, a proteina de fusão pode ser uma proteina de fusão GST-13245 na qual as sequências da 13245 estão fundidas à extremidade carboxilo das sequências GST. Estas proteínas de fusão podem facilitar a purificação de 13245 recombinante. Alternativamente, a proteína de fusão pode ser uma proteína 13245 contendo uma sequência de sinalização heteróloga na sua extremidade amino. Em determinadas células hospedeiras (por exemplo, células hospedeiras de mamífero), a expressão e/ou secreção de 13245 pode ser aumentada através da utilização de uma sequência de sinalização heteróloga.
As proteínas de fusão podem incluir a totalidade ou uma parte de uma proteína sérica, por exemplo, uma região constante de igG ou albumina sérica humana.
As proteínas de fusão da 13245 da invenção podem ser incorporadas em composições farmacêuticas e administradas a um indivíduo in vivo. As proteínas de fusão da 13245 podem ser utilizadas para afectar a biodisponibilidade de um substrato da 13245. As proteínas de fusão da 13245 podem ser úteis terapeuticamente para o tratamento de distúrbios provocados, por exemplo, por (i) modificação aberrante ou mutação de um gene que codifica uma proteína 13245; (ii) desregulação do gene da 13245; e (iii) modificação pós-tradução aberrante de uma proteína 13245.
Além disso, as proteínas de fusão da 13245 da invenção podem ser utilizadas como imunogénios para produzir 52 anticorpos anti-13245 num indivíduo, para purificar ligandos da 13245 e em ensaios de rastreio para identificar moléculas que inibem a interacção da 13245 com um substrato da 13245.
Estão comercialmente disponíveis vectores de expressão que já codificam uma unidade de fusão (por exemplo, um polipéptido de GST). Um ácido nucleico que codifica a 13245 pode ser clonado num tal vector de expressão de modo a que a unidade de fusão esteja ligado na grelha à proteína 13245.
Variantes of Proteínas 13245
Noutro aspecto, a invenção também visa uma variante de um polipéptido 13245, por exemplo, que funciona como um agonista (mimético) ou como um antagonista. As variantes da proteína 13245 podem ser gerados por mutagénese, por exemplo, mutação de ponto discreto, a inserção ou delecção de sequências ou a truncagem de uma proteína 13245. Um agonista das proteínas 13245 podem conservar essencialmente as mesmas, ou um subconjunto, das actividades biológicas da forma natural de uma proteína 13245. Um antagonista de uma proteína 13245 pode inibir uma ou mais das actividades da forma natural da proteína 13245, por exemplo, modulando competitivamente uma actividade mediada pela 13245 de uma proteína 13245. Assim, efeitos biológicos específicos podem ser viabilizados por tratamento com uma variante de função limitada. Preferencialmente, o tratamento de um indivíduo com uma variante possuindo um subconjunto das actividades biológicas da forma natural da proteína tem menos efeitos secundários num indivíduo em relação ao tratamento com a forma natural da proteína 13245. 53
As variantes de uma proteína 13245 podem ser identificadas por bibliotecas combinatórias de rastreio de mutantes, por exemplo, mutantes de truncagem, de uma proteína 13245 para actividade agonista ou antagonista.
Pode utilizar-se bibliotecas de fragmentos, por exemplo, fragmentos amino-terminais, carboxilo-terminais ou internos, de uma sequência de codificação da proteína 13245 para gerar uma população variada de fragmentos para rastreio e selecção subsequente de variantes de uma proteína 13245.
As variantes nos quais se adiciona ou elimina um resíduo de cisteína ou nos quais se adiciona ou elimina um resíduo glicosilado são particularmente preferidas.
Os métodos para rastrear produtos génicos de bibliotecas combinatórias preparadas por mutações pontuais ou truncagem, e para rastrear bibliotecas de ADNc para produtos génicos possuindo uma propriedade seleccionada. A mutagénese conjunta recorrente (REM), uma técnica que intensifica a frequência de mutantes funcionais nas bibliotecas, pode ser utilizada em combinação com os ensaios de rastreio para identificar variantes da 13245 (Arkin et al., 1992, Proc. Natl. Acad. Sei. USA 89:7811-7815; Delgrave et al., 1993, Protein Engr. 6:327-331).
Os ensaios com base em células podem ser explorados para analisar uma biblioteca 13245 variada. Por exemplo pode transfectar-se uma biblioteca de vectores de expressão numa linha celular, por exemplo, uma linha celular, a qual responde correntemente à 13245 de um modo dependente do 54 substrato. As células transfectadas são depois postas em contacto com 13245 e o efeito da expressão do mutante na sinalização pelo substrato da 13245 pode ser detectado, por exemplo, medindo alterações no crescimento celular e/ou actividade enzimática. 0 ADN de plasmideo pode ser depois recuperado das células que aprovem para inibição, ou alternativamente, potenciação da sinalização pelo substrato da 13245, e os clones individuais são adicionalmente caracterizados.
Noutro aspecto, a invenção apresenta um método para preparar um polipéptido 13245, por exemplo, um péptido possuindo uma actividade não natural, por exemplo, um antagonista, agonista ou superagonista de um polipéptido 13245 natural, por exemplo, um polipéptido 13245 natural. 0 método inclui: alterar uma sequência de um polipéptido 13245, por exemplo, alterando a sequência, por exemplo, por substituição ou delecção de um ou mais resíduos de uma região, um domínio ou resíduo não conservado aqui descrito, e testando o polipéptido alterado em relação à actividade desejada.
Noutro aspecto, a invenção apresenta um método para preparar um fragmento ou análogo de um polipéptido 13245 uma actividade biológica de um polipéptido 13245 natural. 0 método inclui: alterar a sequência, por exemplo, por substituição ou delecção de um ou mais resíduos, de um polipéptido 13245, por exemplo, alterar uma sequência de uma região, um domínio ou resíduo não conservado aqui descrito, e testando o polipéptido alterado em relação à actividade desejada.
Anticorpos Anti-13245 55
Noutro aspecto, a invenção proporciona um anticorpo anti-13245. 0 termo "anticorpo" como aqui utilizado refere-se a uma molécula de imunoglobulina ou uma parte imunologicamente activa desta, isto é, uma parte de ligação ao antigénio. Exemplos de partes imunologicamente activas de moléculas de imunoglobulina incluem os fragmentos F(ab) e F(ab')2 que podem ser produzidos tratando o anticorpo com uma enzima tal como pepsina. 0 anticorpo pode ser um anticorpo policlonal, monoclonal, recombinante, por exemplo, quimérico ou humanizado, totalmente humano, não humano, por exemplo, murino, ou de cadeia simples. Numa forma de realização preferida, ele tem uma função efectora e pode fixar o complemento. 0 anticorpo pode ser acoplado a uma toxina ou agente de imagiologia.
Uma proteína 13245 inteira ou, um fragmento peptídico antigénico da 13245, pode ser utilizado como um imunogénio ou pode ser utilizado para identificar anticorpos anti-13245 preparados com outros imunogénios, por exemplo, células, preparações de membranas e semelhantes. 0 péptido antigénico da 13245 deveria incluir pelo menos 8 resíduos de aminoácidos da sequência de aminoácidos mostrada na SEQ ID N°. 2 e abrange um determinante antigénico da 13245. Preferencialmente, o péptido antigénico inclui pelo menos 10 resíduos de aminoácidos, mais preferencialmente pelo menos 15 resíduos de aminoácidos, ainda mais preferencialmente pelo menos 20 resíduos de aminoácidos e muito preferencialmente pelo menos 30 resíduos de aminoácidos. 56
Os fragmentos de 13245 que incluem os resíduos em torno de 195-210 da SEQ ID N°. 2 podem ser utilizados para preparar anticorpos, por exemplo, para serem utilizados como imunogénios ou para caracterizar a especificidade de um anticorpo, contra regiões hidrófobas da proteína 13245. De modo semelhante, um fragmento de 13245 que inclua os resíduos em torno de 455-475 da SEQ ID N°. 2 pode ser utilizado para preparar um anticorpo contra uma região hidrófila da proteína 13245. São proporcionados anticorpos reactivos ou específicos para qualquer uma destas regiões, ou outras regiões ou domínios aqui descritos.
Os determinantes antigénicos preferidos abrangidos pelo péptido antigénico são regiões da 13245 que estão localizadas na superfície da proteína, por exemplo, regiões hidrófilas, assim como regiões com elevada antigenicidade. Por exemplo, pode utilizar-se uma análise de probabilidade de Emini da superfície da sequência da proteína 13245 humana para determinar as regiões que têm uma probabilidade particularmente elevada de estarem localizadas na superfície da proteína 13245 e que têm assim a probabilidade de constituir resíduos da superfície úteis para a produção de anticorpos dirigidos.
Numa forma de realização preferida o anticorpo liga um determinante antigénico em qualquer domínio ou região nas proteínas 13245 aqui descritas.
Anticorpos quiméricos, humanizados, mas muito preferencialmente, totalmente humanos são desejados para aplicações que incluem administração repetida, por exemplo, 57 tratamento terapêutico (e algumas aplicações em diagnóstico) de doentes humanos. 0 anticorpo anti-13245 pode ser um anticorpo de cadeia simples. Um anticorpo de cadeia simples (scFV) pode ser manipulado (por exemplo, Colcher et al., 1999, Ann. N.Y. Acad. Sei. 880:263-280; Reiter, 1996, Clin. Câncer Res. 2:245-252). O anticorpo de cadeia simples pode ser dimerizado ou multimerizado para gerar anticorpos multivalentes possuindo especificidades para vários determinantes antigénicos da mesma proteína 13245 alvo.
Numa forma de realização preferida, o anticorpo tem uma capacidade reduzida ou não tem capacidade para ligar um receptor Fc. Por exemplo, ele pode ser um isotipo, subtipo, fragmento ou outro mutante, que não tem a capacidade para se ligar a um receptor Fc, por exemplo, ele pode ter uma região de ligação ao receptor Fc mutada ou eliminada.
Um anticorpo anti-13245 (por exemplo, anticorpo monoclonal) pode ser utilizado para isolar a 13245 por técnicas correntes, tais como cromatografia de afinidade ou imunoprecipitação. Além disso, um anticorpo anti-13245 pode ser utilizado para detectar a proteína 13245 (por exemplo, numa lisado celular ou sobrenadante celular) para avaliar a abundância e padrão de expressão da proteína. Os anticorpos anti-13245 podem ser utilizados diagnosticamente para monitorizar os níveis de proteína no tecido como parte de um procedimento de ensaio clínico, por exemplo, para determinar a eficácia de um dado regímen de tratamento. A detecção pode ser facilitada acoplando (isto é, ligando fisicamente) o anticorpo a uma substância detectável (isto é, marcação de anticorpo). Exemplos de substâncias 58 detectáveis incluem várias enzimas, grupos prostéticos, materiais fluorescentes, materiais luminescentes, materiais bioluminescentes e materiais radioactivos. Exemplos de enzimas adequadas incluem peroxidase de rábano-silvestre, fosfatase alcalina, beta-galactosidase ou acetilcolinesterase; exemplos de complexos de grupos prostéticos adequados incluem estreptavidina/biotina e avidina/biotina; exemplos materiais fluorescentes adequados incluem umbeliferona, fluoresceina, isotiocianato de fluoresceina, rodamina, diclorotriazinilamina fluoresceina, cloreto de dansilo ou ficoeritrina; um exemplo de um material luminescente inclui o luminol; exemplos de materiais bioluminescentes incluem luciferase, luciferina e aquorina, e exemplos de materiais radioactivos adequados incluem 125I, 131I, 35S ou 3H.
Vectores de Expressão Recombinantes, Células Hospedeiras e Células Geneticamente Manipuladas
Noutro aspecto, a invenção inclui, vectores, preferencialmente vectores de expressão, contendo um ácido nucleico que codifica um polipéptido aqui descrito. Como aqui utilizado, o termo "vector" refere-se a uma molécula de ácido nucleico capaz de transportar outro ácido nucleico ao qual ele foi ligado e pode incluir um plasmideo, cosmideo ou vector virai. 0 vector pode ser capaz de replicação autónoma ou ele pode ser integrado num ADN hospedeiro. Os vectores virais incluem, por exemplo, retrovirus deficientes em replicação, adenovirus e virus adeno-associados.
Um vector pode incluir um ácido nucleico da 13245 numa forma adequada para expressão do ácido nucleico numa célula 59 hospedeira. Preferencialmente, o vector de expressão recombinante inclui uma ou mais sequências reguladoras ligadas funcionalmente à sequência de nucleico a ser expressada. 0 termo "sequência reguladora" inclui promotores, intensificadores e outros elementos de controlo da expressão (por exemplo, sinais de poliadenilação). As sequências reguladoras incluem aquelas que orientam a expressão constitutiva de uma sequência de nucleótidos, assim como sequências reguladoras e/ou induzidas especificas em relação ao tecido. A concepção de um vector de expressão pode depender de factores tais como a escolha da célula hospedeira a ser transformada, o nivel de expressão da proteína desejada e semelhantes. Os vectores de expressão da invenção podem ser introduzidos em células hospedeiras para desse modo produzir proteínas ou polipéptidos, incluindo proteínas ou polipéptidos de fusão, codificados por ácidos nucleicos como aqui descritos (por exemplo, proteínas 13245, formas mutantes de proteínas 13245, proteínas de fusão e semelhantes).
Os vectores de expressão recombinantes da invenção podem ser concebidos para a expressão de proteínas 13245 em células procariotas e eucariotas. Por exemplo, os polipéptidos da invenção podem ser expressados em células de E. coli, insecto (por exemplo, utilizando vectores de expressão de baculovírus), células de levedura ou células de mamíferos. As células hospedeiras adequadas são discutidas mais pormenorizadamente em Goeddel (1990, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego). Alternativamente, o vector de expressão recombinante pode ser transcrito e traduzido in vitro, por exemplo utilizando sequências reguladoras do promotor T7 e T7 polimerase. 60 A expressão de proteínas em procariotas é muito frequentemente realizada em E. coli com vectores contendo promotores constitutivos ou induzidos a orientar a expressão das proteínas de fusão ou não fusão. Os vectores de fusão adicionam um número de aminoácidos a uma proteína ali codificada, geralmente à extremidade amino da proteína recombinante. Estes vectores de fusão servem tipicamente para três fins: 1) para aumentar a expressão da proteína recombinante; 2) para aumentar a solubilidade da proteína recombinante; e 3) para ajudar a purificação da proteína recombinante actuando como um ligando na purificação por afinidade. Frequentemente, introduz-se um sítio de clivagem proteolítica na junção da unidade de fusão e a proteína recombinante para permitir a separação da proteína recombinante da unidade de fusão após a purificação da proteína de fusão. Estas enzimas, e as suas sequências de reconhecimento, incluem o Factor Xa, trombina e enterocinase. Os vectores de fusão para expressão típicos incluem pGEX (Pharmacia Biotech Inc; Smith et al., 1988, Gene 67:31-40), pMAL (New England Biolabs, Beverly, MA) e pRIT5 (Pharmacia, Piscataway, NJ) os quais fundem glutationa S-transferase (GST), proteína de ligação de maltose E ou proteína A, respectivamente, à proteína recombinante alvo.
As proteínas de fusão purificadas podem ser utilizadas em ensaios de actividade de 13245, (por exemplo, os ensaios directos ou ensaios competitivos descritos em pormenor abaixo), ou para gerar anticorpos específicos para as proteínas 13245. Numa forma de realização preferida, a proteína de fusão expressada num vector de expressão retroviral da presente invenção pode ser utilizada para infectar células de medula óssea que são subsequentemente 61 transplantadas em receptores irradiados. A patologia do indivíduo receptor é depois examinada após um período de tempo suficiente (por exemplo, seis semanas).
Para maximizar a expressão da proteína recombinante em E. coli, a proteína é expressada numa estirpe bacteriana hospedeira com uma capacidade reduzida para clivar proteoliticamente a proteína recombinante (Gottesman, 1990, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, 119-128). Outra estratégia consiste em alterar a sequência de ácido nucleico do ácido nucleico a ser inserido num vector de expressão para que os códãos individuais para cada aminoácido sejam aqueles preferencialmente utilizados em E. coli (Wada et al., 1992, Nucl. Acids Res. 20:2111-2118). Uma tal alteração das sequências de ácido nucleico da invenção podem ser realizadas por técnicas correntes de síntese de ADN. O vector de expressão de 13245 pode ser um vector de expressão em levedura, um vector para expressão em células de insecto, por exemplo, um vector de expressão de baculovírus, ou um vector adequado para expressão em células de mamíferos.
Quando utilizado em células de mamíferos, as funções de controlo do vector de expressão são frequentemente fornecidas por elementos reguladores virais. Por exemplo, os promotores virais geralmente utilizados são provenientes de polioma, adenovírus 2, citomegalovírus e vírus simiano 40 (SV40).
Noutra forma de realização, o vector de expressão mamífero recombinante é capaz de orientar a expressão do 62 ácido nucleico preferencialmente num tipo de célula particular (por exemplo, são utilizados elementos reguladores específicos em relação ao tecidos para expressar o ácido nucleico). Os exemplos não restritivos de promotores adequados específicos em relação ao tecido incluem o promotor de albumina (especifico para o fígado; Pinkert et al., 1987, Genes Dev. 1:268-277), promotores específicos para tecidos linfóides (Calame et al., 1988, Adv. Immunol. 43:235-275), em particular promotores para os receptores das células T (Winoto et al., 1989, EMBO J. 8:729-733) e imunoglobulinas (Banerji et al., 1983, célula 33:729-740; Queen et al., 1983, célula 33:741-748), promotores específicos para neurónios (por exemplo, o promotor de neurofilamentos; Byrne et al., 1989, Proc. Natl. Acad. Sei. USA 86:5473-5477), promotores específicos para o pâncreas (Edlund et al., 1985, Science 230:912-916) e promotores específicos para a glândula mamária (por exemplo, promotor de soro de leite; Patente U.S. número 4 873 316 e Pedido de Patente Europeia com o número de publicação 264 166). Também estão abrangidos os promotores regulados +pelo desenvolvimento, por exemplo, os promotores Hox murinos (Kessel et al., 1990, Science 249:374-379) e o promotor de alfa-fetoproteína (Campes et al., 1989, Genes Dev. 3:537-546). A invenção proporciona ainda um vector de expressão recombinante compreendendo uma molécula de ADN da invenção clonada num vector de expressão numa orientação antimensageira. Pode escolher-se sequências reguladoras (por exemplo, promotores e/ou intensificadores virais) ligadas operacionalmente a um ácido nucleico clonado na orientação antimensageira as quais orientam a expressão constitutiva específica para o tipo de célula ou tecido de 63 ARN antimensageiro numa diversidade de tipos de células. 0 vector de expressão antimensageiro pode estar na forma de um plasmídeo, fagemideo ou virus atenuado recombinante. Para uma discussão sobre a regulação da expressão de genes utilizando genes antimensageiros, ver Weintraub, H. et al. (1986, Trends Genet. IrReview).
Noutro aspecto a invenção proporciona uma célula hospedeira a qual inclui uma molécula de ácido nucleico aqui descrito, por exemplo, uma molécula de ácido nucleico 13245 num vector de expressão recombinante ou sequências contendo uma molécula de ácido nucleico 13245 a qual lhe permite recombinar homologamente num sitio especifico do genoma da célula hospedeira. Os termos "célula hospedeira" e "célula hospedeira recombinante" são aqui utilizados de modo intermutável. Estes termos referem-se não só à célula objecto particular, mas também à descendência ou descendência potencial de uma tal célula. Uma vez que determinadas modificações podem ocorrer em gerações seguintes devido a mutação ou influências ambientais, uma tal descendência pode, de facto, não ser idêntica à da célula parental, mas estão incluídas dentro do âmbito do termo como aqui utilizado.
Uma célula hospedeira pode ser qualquer célula procariota ou eucariota. Por exemplo, uma proteína 13245 pode ser expressada em células bacterianas tais como E. coli, células de insecto, células de levedura ou mamífero (tais como as células de ovário de hamster chinês (CHO)) ou células COS. Outras células hospedeiras adequadas são conhecidas dos especialistas na técnica. 64 0 ADN vectorial pode ser introduzido nas células hospedeiras via técnicas de transformação ou transfecção convencionais. Como aqui utilizado, os termos "transformação" e "transfecção" destinam-se a referir uma variedade de técnicas reconhecidas na matéria para introduzir ácido nucleico estanho (por exemplo, ADN) numa célula hospedeira, incluindo co-precipitação com fosfato de cálcio ou cloreto de cálcio, transfecção mediada por DEAE-dextrano, lipofecção ou electroporação. A célula hospedeira da invenção pode ser utilizada para produzir (isto é, expressar) uma proteína 13245. Consequentemente, a invenção proporciona ainda métodos para produzir uma proteína 13245 utilizando as células hospedeiras da invenção. Numa forma de realização, o método inclui cultivar a célula hospedeira da invenção (na qual foi introduzido um vector de expressão recombinante que codifica uma proteína 13245) num meio adequado de modo a ser produzida uma proteína 13245. Noutra forma de realização, o método inclui ainda isolar uma proteína 13245 do meio ou da célula hospedeira.
Noutro aspecto, a invenção caracteriza, uma célula ou uma preparação purificada de células que incluem um transgene de 13245, ou o qual então expressa inadequadamente a 13245. A preparação de células pode consistir de células humanas ou não humanas, por exemplo, células de roedores, por exemplo, células de ratinho ou ratazana, células de coelho ou células de porco. Em formas de realização preferidas, a célula ou células incluem um transgene da 13245, por exemplo, uma forma heteróloga de uma 13245, por exemplo, um gene proveniente de seres humanos (no caso de uma célula não humana). 0 transgene de 65 13245 pode ser inadequadamente expressado, por exemplo, expressado em excesso ou expressado por defeito. Noutras formas de realização preferidas, a célula ou células incluem um gene que expressa inadequadamente uma 13245 endógena, por exemplo, um gene cuja expressão está comprometida, por exemplo, anulada. Estas células podem servir como um modelo para estudar distúrbios que estão relacionados com alelos de 13245 mutados ou inadequadamente expressos ou para serem utilizadas no rastreio de fármacos.
Noutro aspecto, a invenção inclui, uma célula humana, por exemplo, uma célula estaminal hematopoiética, transformada com o ácido nucleico que codifica um polipéptido 13245 objecto.
Também são proporcionadas células, preferencialmente células humanas, por exemplo, células hematopoiéticas ou de fibroblasto humanas, nas quais uma 13245 endógena está sob o controlo de uma sequência reguladora que geralmente não controla a expressão do gene endógeno da 13245. As caracteristicas de expressão de um gene endógeno numa célula, por exemplo, uma linha celular ou microrganismo, podem ser modificadas inserindo um elemento regulador de ADN heterólogo no genoma da célula de modo a que o elemento regulador inserido esteja ligado operacionalmente ao gene endógeno da 13245. Por exemplo, um gene endógeno da 13245 que está "transcricionalmente silencioso," por exemplo, que não é normalmente expressado, ou expressado apenas a niveis muito baixos, pode ser activado inserindo um elemento regulador que seja capaz de promover a expressão de um produto génico normalmente expressado nessa célula. Pode utilizar-se técnicas tais como recombinação homóloga orientada para inserir o ADN heterólogo como descrito (por 66 exemplo, Patente U.S. número 5 272 071; PCT número de publicação WO 91/06667).
Animais Transgénicos A invenção proporciona animais transgénicos não humanos. Estes animais são úteis para estudar a função e/ou actividade de uma proteína 13245 e para identificar e/ou avaliar moduladores da actividade da 13245. Como aqui utilizado, um "animal transgénico" é um animal não humano, preferencialmente um mamífero, mais preferencialmente um roedor tal como uma ratazana ou ratinho, no qual uma ou mais células do animal incluem um transgene. Outros exemplos de animais transgénicos incluem primatas não humanos, ovelhas, cães, vacas, cabras, galinhas, anfíbios e semelhantes. Um transgene é ADN exógeno ou um rearranjo, por exemplo, uma delecção de ADN cromossómico endógeno, o qual está preferencialmente integrado ou ocorre no genoma das células de um animal transgénico. Um transgene pode orientar a expressão de um produto génico codificado em um ou mais tipos de células ou tecidos do animal transgénico, noutros transgenes, por exemplo, uma anulação, reduz a expressão. Assim, um animal transgénico pode ser um no qual um gene endógeno da 13245 foi alterado, por exemplo, por recombinação homóloga entre os genes endógenos e uma molécula de ADN exógeno introduzida numa célula do animal (por exemplo, uma célula embrionária do animal, antes do desenvolvimento do animal).
As sequências intrónicas e os sinais de poliadenilação também podem ser incluídos no transgene para aumentar a eficiência de expressão do transgene. Uma sequência(s) reguladora específica em relação ao tecido pode ser 67 operacionalmente ligada a um transgene da invenção para orientar a expressão de uma proteína 13245 para células particulares. Um animal criador transgénico pode ser identificado com base na presença de um transgene da 13245 no seu genoma e/ou expressão de ARNm de 13245 nos tecidos ou células dos animais. Em seguida pode utilizar-se um animal criador transgénico para procriar mais animais portadores do transgene. Além disso, os animais transgénicos portadores de um transgene que codifica uma proteína 13245 podem ser ainda procriados com outros animais transgénicos portadores de outros transgenes.
As proteínas ou os polipéptidos 13245 podem ser expressados em animais ou plantas transgénicos, por exemplo, um ácido nucleico que codifica a proteína ou polipéptido pode ser introduzido no genoma de um animal. Em formas de realização preferidas o ácido nucleico está colocado sob o controlo de um promotor específico em relação ao tecido, por exemplo, um promotor específico para o leite ou ovo, e recuperado do leite ou ovos produzidos pelo animal. Os animais adequados são ratinhos, porcos, vacas, cabras e ovelhas. A invenção também inclui uma população de células de um animal transgénico, como se discute, por exemplo, abaixo.
Utilizações
As moléculas de ácido nucleico, proteínas, homólogos de proteína e anticorpos aqui descritos podem ser utilizados em um ou mais dos métodos seguintes: a) ensaios de rastreio; b) medicina preditiva (por exemplo, ensaios de 68 diagnóstico, ensaios de prognóstico, ensaios clínicos de monitorização e farmacogenética); e c) métodos de tratamento (por exemplo, terapêutico e profiláctico) . As moléculas de ácido nucleico isoladas da invenção podem ser utilizadas, por exemplo, para expressar uma proteína 13245 (por exemplo, via um vector de expressão recombinante numa célula hospedeira em aplicações de terapia de genes), para detectar um ARNm de 13245 (por exemplo, numa amostra biológica), para detectar uma alteração genética num gene da 13245 e para modular a actividade da 13245, como se descreve mais abaixo. As proteínas 13245 podem ser utilizadas para tratar distúrbios caracterizados pela produção insuficiente ou excessiva de um substrato da 13245 ou produção de inibidores da 13245. Além disso, as proteínas 13245 podem ser utilizadas para rastrear substratos naturais da 13245, para rastrear fármacos ou compostos que modulam a actividade da 13245, assim como para tratar distúrbios caracterizados pela produção insuficiente ou excessiva da proteína 13245 ou produção de formas da proteína 13245 que têm uma actividade diminuída, aberrante ou indesejada relativamente à proteína 13245 de tipo selvagem. Distúrbios ilustrativos incluem aqueles nos quais a fosforilação da proteína é aberrante (por exemplo, distrofias musculares e miotónicas). Além do mais, os anticorpos anti-13245 da invenção podem ser utilizados para detectar e isolar proteínas 13245, regular a biodisponibilidade de proteínas 13245 e modular a actividade da 13245. É proporcionado um método de avaliar um composto em relação à capacidade para interagir, por exemplo, ligar-se, a um polipéptido 13245 objecto. 0 método inclui: por o composto em contacto com o polipéptido 13245 objecto; e 69 avaliar a capacidade do composto para interagir, por exemplo, ligar-se ou formar um complexo, com o polipéptido 13245 objecto. Este método pode ser realizado in vitro, por exemplo, num sistema sem células, ou in vivo, por exemplo, num ensaio de armadilha de interacção de duplo híbrido. Este método pode ser utilizado para identificar moléculas naturais que interagem com um polipéptido 13245 objecto. Ele também pode ser utilizado para encontrar inibidores naturais ou sintéticos de um polipéptido 13245 objecto. Os métodos de rastreio são discutidos em mais pormenor abaixo.
Ensaios de Rastreio A invenção proporciona métodos de rastreio (também aqui referidos como "ensaios") para identificar moduladores, isto é, compostos ou agentes candidatos ou de ensaio (por exemplo, proteínas, péptidos, miméticos de péptidos, peptóides, moléculas pequenas ou outros fármacos) que se ligam às proteínas 13245, têm um efeito estimulador ou inibidor, por exemplo, na expressão da 13245 ou actividade da 13245, ou têm um efeito estimulador ou inibidor, por exemplo, na expressão ou actividade de um substrato da 13245. Os compostos assim identificados podem ser utilizados para modular a actividade de produtos génicos alvo (por exemplo, genes da 13245) num protocolo terapêutico, para aprofundar a função biológica do produto génico alvo ou para identificar compostos que destroem as interacções normais do gene alvo.
Numa forma de realização, a invenção proporciona ensaios para rastrear candidatos ou compostos de ensaio que são substratos de uma proteína ou polipéptido 13245 ou uma parte biologicamente activa deste. Noutra forma de 70 realização, a invenção proporciona ensaios para rastrear candidatos ou compostos de ensaio que se ligam to ou modulam a actividade de uma proteína ou polipéptido 13245 ou uma parte biologicamente activa deste.
Os compostos de ensaio da presente invenção podem ser obtidos utilizando qualquer uma das numerosas abordagens dos métodos de bibliotecas combinatórias conhecidos na técnica, incluindo: bibliotecas biológicas; bibliotecas de peptóides (bibliotecas de moléculas possuindo as funcionalidades de péptidos, mas com uma nova cadeia não peptídica que são resistentes à degradação enzimática mas os quais mesmo assim permanecem activos; por exemplo, Zuckermann et al., 1994, J. Med. Chem. 37:2678-2685); bibliotecas em solução ou em fase sólida paralela abordadas espacialmente; métodos de bibliotecas sintéticas que requerem desconvolução; o método de biblioteca 'uma-esfera um-composto'; e métodos de bibliotecas sintéticas utilizando selecção por cromatografia de afinidade. As abordagens de biblioteca biológica e biblioteca de peptóides estão restringidas às bibliotecas de péptidos, enquanto as restantes quatro abordagens são aplicáveis a bibliotecas de compostos de péptidos, oligómeros não peptidicos ou moléculas pequenas (Lam, 1997, Anticancer Drug Des. 12:145).
Foram descritos exemplos de métodos para a síntese de bibliotecas moleculares (por exemplo, DeWitt et al., 1993, Proc. Natl. Acad. Sei. USA 90:6909; Erb et al., 1994, Proc. Natl. Acad. Sei. USA 91:11422; Zuckermann et al., 1994, J. Med. Chem. 37:2678; Cho et al., 1993, Science 261:1303; Carrell et al., 1994, Angew. Chem. Int. Ed. Engl. 33:2059; 71
Carell et al., 1994, Angew. Chem. Int. Ed. Engl. 33:2061; e Gallop et al., 1994, J. Med. Chem. 37:1233).
As bibliotecas de compostos podem ser apresentadas em solução (por exemplo, Houghten, 1992, Biotechniques 13:412-421), ou em esferas (Lam, 1991, Nature 354:82-84), chips (Fodor, 1993, Nature 364:555-556), bactérias (Patente U.S. número 5 223 409), esporos (Patente U.S. número 5 223 409), plasmideos (Cull et al., 1992, Proc. Natl. Acad. Sei. USA 89:1865-1869) ou em fagos (Scott et al., 1990, Science 249:386-390; Devlin, 1990, Science 249:404-406; Cwirla et al., 1990, Proc. Natl. Acad. Sei. USA 87:6378-6382; Felici, 1991, J. Mol. Biol. 222:301-310; Patente U.S. número 5 223 409) .
Numa forma de realização, um ensaio é um ensaio à base de células no qual se faz contactar uma célula que expressa uma proteína 13245 ou uma parte biologicamente activa desta com um composto de ensaio e determina-se a capacidade do composto de ensaio para modular a actividade da 13245. A determinação da capacidade do composto de ensaio para modular a actividade da 13245 pode ser efectuada monitorizando, por exemplo, alterações na actividade enzimática. A célula pode ser, por exemplo, de origem mamifera.
Também se pode avaliar a capacidade do composto de ensaio para modular a ligação da 13245 a um composto, por exemplo, um substrato da 13245, ou para se ligar à 13245. Isto pode ser conseguido, por exemplo, acoplando o composto, por exemplo, o substrato, com um radioisótopo ou etiqueta enzimática de modo a que a ligação do composto, por exemplo, o substrato, à 13245 possa ser determinada 72 detectando o composto marcado, por exemplo, substrato, num complexo. Alternativamente, a 13245 podia ser acoplada com um radioisótopo ou etiqueta enzimática para monitorizar a capacidade de um composto de ensaio para modular a ligação da 13245 a um substrato da 13245 num complexo. Por exemplo, os compostos (por exemplo, substratos da 13245) podem ser marcados com I, S, C ou H, quer directa ou directamente, e o radioisótopo detectado por contagem directa da emissão radioactiva ou por contagem de cintilação. Alternativamente, os compostos podem ser marcados enzimaticamente, por exemplo, com peroxidase de rábano-silvestre, fosfatase alcalina ou luciferase, e a etiqueta enzimática detectada por determinação da conversão de um substrato apropriado no produto.
Pode avaliar-se a capacidade de um composto (por exemplo, um substrato da 13245) para interagir com a 13245 com ou sem marcação de qualquer um dos interactuantes. Por exemplo pode utilizar-se um microfisiómetro para detectar a interacção de um composto com a 13245 sem a marcação de qualquer um dos compostos ou da 13245 (McConnell et al., 1992, Science 257:1906-1912). Como aqui utilizado, um "microfisiómetro" (por exemplo, citossensor) é um instrumento analítico que mede a velocidade à qual uma célula acidifica o seu ambiente utilizando um sensor potenciométrico sensível à luz (LAPS). As alterações nesta velocidade de acidificação podem ser utilizadas como um indicador da interacção entre um composto e 13245.
Ainda noutra forma de realização é proporcionado um ensaio sem células no qual se faz contactar uma proteína 13245 ou uma parte biologicamente activa desta com um composto de ensaio e se avalia a capacidade do composto de 73 ensaio para ligar-se à proteina 13245 ou a uma parte biologicamente activa desta. As partes biologicamente activas preferidas das proteínas 13245 a serem utilizadas nos ensaios da presente invenção incluem fragmentos que participam em interacções com moléculas não 13245, por exemplo, fragmentos com probabilidades elevadas de superfície.
Pode utilizar-se formas solúveis e/ou ligadas à membrana de proteínas isoladas (por exemplo, proteínas 13245 ou partes biologicamente activas destas) nos ensaios sem células da invenção. Quando são utilizadas formas ligadas à membrana da proteína pode ser desejável utilizar um agente de solubilização. Exemplos de tais agentes de solubilização incluem detergentes não iónicos tais como n-octilglicósido, n-dodecilglicósido, n-dodecilmaltósido, octanoil-N-metilglucamida, decanoil-N-metilglucamida, Triton® X-100, Triton® X-114, Thesit®, Isotridecilpoli(éter de etileno glicol)n, 3-{(3-colamidopropil)dimetilaminio}-propanossulfonato (CHAPS), 3—{(3— colamidopropil)dimetilaminio}-2-hidroxi-l-propanossulfonato (CHAPSO) ou N-dodecil-N,N-dimetil-3-amonio-l-propanossulfonato.
Os ensaios sem células envolvem a preparação de uma mistura reaccional da proteína do gene alvo e o composto de ensaio em condições e durante um período de tempo suficiente para permitir que os dois componentes interajam e se liguem, formando assim um complexo que pode ser retirado e/ou detectado. A interacção entre duas moléculas também pode ser detectada, por exemplo, utilizando transferência de energia 74 de fluorescência (FET; por exemplo, Patente U.S. número 5 631 169; Patente U.S. número 4 868 103). Selecciona-se uma etiqueta fluorofora de modo a que a energia fluorescente emitida pela primeira molécula doadora seja absorvida por uma etiqueta fluorescente de uma segunda molécula 'aceitadora', a qual é por sua vez capaz de emitir fluorescência devido à energia absorvida. Alternativamente, a molécula proteica 'doadora' pode utilizar simplesmente a energia fluorescente natural de resíduos de triptofano. São escolhidas etiquetas que emitem comprimentos de onda diferentes de luz, de modo a que a etiqueta molecular 'aceitadora' possa ser diferenciada do 'doador'. Uma vez que a eficiência da transferência de energia entre as etiquetas está relacionada com a distância que separa as moléculas, a relação espacial entre as moléculas pode ser avaliada. Numa situação em que ocorra ligação entre as moléculas, a emissão de fluorescência da etiqueta molecular 'aceitadora' no ensaio deverá ser máxima. Um evento de ligação FET pode ser convenientemente medido através de meios de detecção fluorimétrica correntes bem conhecidos na técnica (por exemplo, utilizando a fluorímetro).
Noutra forma de realização, a determinação da capacidade da proteína 13245 para se ligar a uma molécula alvo pode ser conseguida utilizando análise de interacção biomolecular em tempo real (BIA; por exemplo, Sjolander et al., 1991, Anal. Chem. 63:2338-2345; Szabo et al., 1995, Curr. Opin. Struct. Biol. 5:699-705). A "Ressonância de Plasmão de Superfície" (SPR) ou "BIA" detecta interacções bioespecíficas em tempo real, sem a marcação de qualquer um dos interactuantes (por exemplo, BIAcore). Alterações na massa na superfície de ligação (indicadora de um evento de ligação) resultam em alterações do índice de refracção da 75 luz na proximidade da superfície (o fenómeno óptico de SPR), resultando num sinal detectável que pode ser utilizado como uma indicação de reacções em tempo real entre moléculas biológicas.
Numa forma de realização, o produto génico alvo ou a substância de ensaio é ancorada a uma fase sólida. Os complexos de produto génico alvo/composto de ensaio ancorados na fase sólida podem ser detectados no final da reacção. Preferencialmente, o produto génico alvo pode ser ancorado a uma superfície sólida e o composto de ensaio (o qual não está ancorado) pode ser marcado, quer directa ou indirectamente, com as etiquetas detectáveis aqui discutidas.
Pode pretender-se imobilizar a 13245, um anticorpo anti-13245 ou a sua molécula alvo para facilitar a separação de formas complexadas de formas não complexadas de uma ou de ambas as proteínas, assim como proceder à automatização do ensaio. A ligação de um composto de ensaio a uma proteína 13245, ou a interacção de uma proteína 13245 com uma molécula alvo na presença ou ausência de um composto candidato, pode ser realizada em qualquer recipiente adequado para conter os reagentes. Exemplos de tais recipientes incluem placas microtítulo, tubos de ensaio e tubos de micro-centrífuga. Numa forma de realização pode ser proporcionada uma proteína de fusão que adiciona um domínio que permite que uma ou ambas as proteínas se liguem a uma matriz. Por exemplo as proteínas de fusão glutationa-S-transferase/13245 ou as proteínas de fusão glutationa-S-transferase/alvo podem ser adsorvidas em esferas de glutationa Sepharose™ (Sigma Chemical, St. Louis, MO) ou placas microtítulo derivatizadas com 76 glutationa, as quais são depois combinadas com o composto de ensaio ou o composto de ensaio e a proteína alvo ou proteína 13245 não adsorvida, e a mistura incubada em condições que conduzam à formação do complexo (por exemplo, em condições fisiológicas de sal e pH). Após incubação, as esferas ou os poços da placa microtítulo são lavados para eliminar quaisquer componentes não ligados, a matriz é imobilizada no caso de esferas, o complexo determinado quer directa ou indirectamente, por exemplo, como se descreveu acima. Alternativamente, os complexos podem ser dissociados da matriz e o nível de ligação ou actividade da 13245 determinado utilizando técnicas correntes.
Outras técnicas para imobilizar uma proteína 13245 ou uma molécula alvo nas matrizes incluem a utilização da conjugação de biotina e estreptavidina. Pode preparar-se proteína 13245 ou moléculas alvo biotiniladas a partir de biotin-N-hidroxi-succinimida utilizando técnicas conhecidos na matéria (por exemplo, estojo de biotinilação, Pierce Chemicals, Rockford, IL) e imobilizadas nos poços de placas de 96 poços revestidas com estreptavidina (Pierce Chemical).
Para realizar o ensaio, adiciona-se o componente não imobilizado à superfície revestida contendo o componente ancorado. Uma vez concluída a reacção, elimina-se os componentes que não reagiram (por exemplo, por lavagem) em condições tais para que quaisquer complexos formados permaneçam imobilizados na superfície do sólido. A detecção de complexos ancorados na superfície sólida pode ser efectuada de um certo número de modos. Nos casos em que o componente previamente não imobilizado está pré-marcado, a detecção de etiqueta imobilizada na superfície indica que 77 se formaram complexos. Nos casos em que o componente previamente não imobilizado não está pré-marcado pode utilizar-se uma etiqueta indirecta para detectar complexos ancorados na superfície; por exemplo, utilizando um anticorpo marcado específico para o componente imobilizado (o anticorpo, por sua vez, pode estar marcado directamente ou marcado indirectamente, por exemplo, com uma etiqueta de anticorpo anti-Ig).
Numa forma de realização, este ensaio é realizado utilizando anticorpos que reagem com a proteína 13245 ou moléculas alvo mas que não interferem com a ligação da proteína 13245 à sua molécula alvo. Tais anticorpos podem ser ligados aos poços da placa, e o alvo ou proteína 13245 não ligado retido nos poços por conjugação com o anticorpo. Os métodos para detectar tais complexos, para além dos descritos acima para os complexos imobilizados em GST, incluem a imunodetecção de complexos utilizando anticorpos que reagem com a proteína 13245 ou a molécula alvo, assim como ensaios enzimáticos que assentam na detecção de uma actividade enzimática associada à proteína 13245 ou à molécula alvo.
Alternativamente pode realizar-se ensaios sem células numa fase líquida. Num tal ensaio, os produtos reaccionais são separados de componentes que não reagiram, por qualquer uma de um número de técnicas correntes, incluindo, mas não se limitando a: centrifugação diferencial (por exemplo, Rivas et al., 1993, Trends Biochem. Sei. 18:284-287); cromatografia (por exemplo, cromatografia de filtração em gel ou cromatografia de permuta iónica); electroforese (por exemplo, Ausubel et al., eds., 1999, Current Protocols in Molecular Biology, J. Wiley, New York); e imunoprecipitação 78 (por exemplo, Ausubel, supra) . Tais resinas e técnicas cromatográficas são conhecidas de um especialista na técnica (por exemplo, Heegaard, 1998, J. Mol. Recognit. 11:141-148; Hage et al.r 1997, J. Chromatogr. B Biomed. Sei. Appl. 699:499-525). Além disso também se pode utilizar convenientemente transferência de energia fluorescente, como se descreveu aqui, para detectar a ligação sem qualquer purificação adicional do complexo a partir da solução.
Numa forma de realização preferida, o ensaio inclui fazer contactar a proteina 13245 ou uma parte biologicamente activa desta com um composto conhecido que se liga à 13245 para formar uma mistura de ensaio, fazer contactar a mistura de ensaio com um composto de ensaio e determinar a capacidade do composto de ensaio para interagir com uma proteína 13245, em que a determinação da capacidade do composto de ensaio para interagir com uma proteína 13245 inclui a determinação da capacidade do composto de ensaio para se ligar preferencialmente à 13245 ou a uma parte biologicamente activa desta, ou para modular a actividade de uma molécula alvo, relativamente ao composto conhecido.
Os produtos génicos alvos da invenção podem interagir, in vivo, com uma ou mais macromoléculas celulares ou extracelulares, tais como proteínas. Para os efeitos desta discussão, tais macromoléculas celulares ou extracelulares são aqui referidas como "parceiros de ligação." Os compostos que destroem tais interaeções podem ser úteis na regulação da actividade do produto génico alvo. Tais compostos podem incluir, mas não se limitam a moléculas tais como anticorpos, péptidos e moléculas pequenas. Os 79 genes/produtos alvo preferidos para utilização nesta forma de realização são os genes da 13245 aqui identificados. Numa forma de realização alternativa, a invenção proporciona métodos para determinar a capacidade do composto de ensaio para modular a actividade de uma proteína 13245 através da modulação da actividade de um efector a jusante de uma molécula alvo da 13245. Por exemplo, pode determinar-se a actividade da molécula efectora num alvo apropriado ou pode determinar-se a ligação do efector a um alvo apropriado, como se descreveu anteriormente.
Para identificar compostos que interferem com a interacção entre o produto génico alvo e o(s) seu(s) parceiro (s) de ligação celular ou extracelular, prepara-se uma mistura reaccional contendo o produto génico alvo e o parceiro de ligação, em condições e por um período de tempo suficiente, para permitir que os dois produtos formem um complexo. Para testar um agente inibidor, a mistura reaccional é proporcionada na presença e ausência do composto de ensaio. 0 composto de ensaio pode ser inicialmente incluido na mistura reaccional ou pode ser adicionado numa altura posterior à adição do gene alvo e do seu parceiro de ligação celular ou extracelular. Incuba-se mistura reaccionais de controlo sem o composto de ensaio ou com um placebo. Em seguida detecta-se a formação de quaisquer complexos entre o produto génico alvo e o parceiro de ligação celular ou extracelular. A formação de um complexo na reacção de controlo, mas não na mistura reaccional contendo o composto de ensaio, indica que o composto interfere com a interacção do produto génico alvo e o parceiro de ligação interactivo. Adicionalmente, a formação de complexo nas misturas reaccionais contendo o 80 composto de ensaio e o produto génico alvo normal também pode ser comparada com a formação de complexo nas misturas reaccionais contendo o composto de ensaio e o produto génico alvo mutante. Esta comparação pode ser importante naqueles casos em que se pretende identificar compostos que destroem as interacções de produtos génicos alvos mutantes mas não os normais.
Estes ensaios podem ser realizados num formato heterogéneo ou homogéneo. Os ensaios heterogéneos envolvem a ancoragem do produto génico alvo ou do parceiro de ligação numa fase sólida, e a detecção de complexos ancorados na fase sólida no final da reacção. Nos ensaios homogéneos, a totalidade da reacção é transportada numa fase líquida. Em qualquer uma das abordagens, a ordem de adição dos reagentes pode ser modificado para se obter informações diferentes sobre os compostos a serem testados. Por exemplo, os compostos de ensaios podem interferir com a interacção entre os produtos génicos alvos e os parceiros de ligação, por exemplo, por competição, podem ser identificados realizando a reacção na presença da substância de ensaio. Alternativamente, os composto de ensaios que destroem complexos pré-formados, por exemplo, compostos com constantes de ligação mais elevadas que retiram um dos componentes do complexo, podem ser testados adicionando o composto de ensaio à mistura reaccional depois de se terem formado os complexos. Os vários formatos são descritos a seguir de modo abreviado.
Num sistema de ensaio heterogéneo, o produto génico alvo ou o parceiro de ligação celular ou extracelular interactivo, é ancorado numa superfície sólida (por exemplo, uma placa microtítulo), enquanto a espécie não 81 ancorada é marcada directa ou indirectamente. A espécie ancorada pode ser imobilizada por ligações não covalentes ou covalentes. Alternativamente, pode utilizar-se um anticorpo imobilizado específico para a espécie a ser ancorada para ancorar a espécie à superfície sólida.
Para realizar o ensaio, o parceiro da espécie imobilizada é exposto à superfície revestida com ou sem o composto de ensaio. Uma vez concluída a reacção, os componentes que não reagiram são eliminados (por exemplo, por lavagem) permanecendo quaisquer complexos formados imobilizados na superfície sólida. Nos casos em que a espécie não imobilizada está pré-marcada, a detecção de etiqueta imobilizada na superfície indica que se formaram complexos. Nos casos em que a espécie não imobilizada não está pré-marcada pode utilizar-se uma etiqueta indirecta para detectar complexos ancorados na superfície; por exemplo, utilizando um anticorpo marcado específico para a espécie inicialmente não imobilizada (o anticorpo, por sua vez, pode ser marcado directamente ou marcado indirectamente com, por exemplo, um anticorpo anti-Ig marcado). Dependendo da ordem de adição dos componentes reaccionais pode detectar-se os compostos de ensaio que inibem a formação do complexo ou que destroem complexos pré-formados.
Alternativamente, a reacção pode ser realizada numa fase líquida na presença ou ausência do composto de ensaio, os produtos reaccionais separados dos componentes que não reagiram e os complexos detectados; por exemplo, utilizando um anticorpo imobilizado específico para um dos componentes de ligação para ancorar quaisquer complexos formados em solução e um anticorpo marcado específico para o outro 82 parceiro para detectar complexos ancorados. Mais uma vez, dependendo da ordem de adição dos reagentes à fase liquida pode identificar-se os composto de ensaio que inibem o complexo ou que destroem complexos pré-formados.
Numa forma de realização alternativa da invenção pode utilizar-se um ensaio homogéneo. Por exemplo, prepara-se um complexo pré-formado do produto génico alvo e do parceiro de ligação celular ou extracelular interactivo em que estão marcados os produtos génicos alvos ou os seus parceiros de ligação, mas o sinal gerado pela etiqueta é anulado devido à formação do complexo (por exemplo, Patente U.S. número 4 109 496 que utiliza esta abordagem para imunoensaios). A adição de uma substância de ensaio que compete e desaloja uma das espécies do complexo pré-formado resultará na geração de um sinal superior ao nível de base. Deste modo pode identificar-se substâncias de ensaio que destroem a interacção produto génico alvo-parceiro de ligação.
Ainda noutro aspecto, as proteínas 13245 podem ser utilizadas como "proteínas isco" num ensaio de duplo híbrido ou ensaio de triplo híbrido (por exemplo, Patente U.S. número 5 283 317; Zervos et al., 1993, Cell 72:223-232; Madura et al., 1993, J. Biol. Chem. 268:12046-12054; Bartel et al., 1993, Biotechniques 14:920-924; Iwabuchi et al., 1993, Oncogene 8:1693-1696; PCT número de publicação WO 94/10300), para identificar outras proteínas que se liguem ou interactuem com a 13245 ("proteínas de ligação à 13245" ou "13245-bp") e estejam envolvidas na actividade da 13245. Estas 13245-bp podem ser activadoras ou inibidoras de sinais das proteínas 13245 ou alvos da 13245, por exemplo, como elementos a jusante de um percurso de sinalização mediado pela 13245. 83 0 sistema de duplo híbrido baseia-se na natureza modular da maior parte dos factores de transcrição, a qual consiste de domínios separados de ligação de ADN e activação. Abreviadamente, o ensaio utiliza duas construções de ADN diferentes. Numa construção, o gene que codifica uma proteína 13245 é fundido com um gene que codifica o domínio de ligação de ADN de um factor de transcrição conhecido (por exemplo, GAL- •4) . Na outra construção funde-se uma sequência de ADN, . de uma biblioteca de sequências de ADN, que codifica uma proteína não identificada ("presa" ou "amostra") com um gene que codifica o domínio de activação do factor de transcrição conhecido. (Alternativamente, a proteína 13245 pode ser fundida com o domínio activador). Se as proteínas "isco" e "presa" forem capazes de interactuar in vivo formando um complexo dependente de 13245, os domínios de ligação de ADN e activação do factor de transcrição aproximam-se um do outro. Esta proximidade permite a transcrição de um gene relator (por exemplo, LacZ) que está operacionalmente ligado a um sítio regulador da transcrição que reage ao factor de transcrição. Pode detectar-se a expressão do gene relator e isolar-se as colónias celulares contendo o factor de transcrição funcional e utilizar-se as mesmas para se obter o gene clonado que codifica a proteína que interage com a proteína 13245.
Noutra forma de realização são identificados moduladores da expressão da 13245. Por exemplo, faz-se contactar uma mistura de células ou sem células com um composto candidato e avalia-se a expressão do ARNm ou proteína 13245 em relação ao nível de expressão do ARNm ou proteína 13245 na ausência do composto candidato. Quando a 84 expressão do ARNm ou proteína 13245 é superior na presença do composto candidato do que na sua ausência, o composto candidato é identificado como um estimulador da expressão do ARNm ou proteína 13245. Alternativamente, quando a expressão do ARNm ou proteína 13245 é menor (isto é, menor de modo estatisticamente significativo) na presença do composto candidato do que na sua ausência, o composto candidato é identificado como um inibidor da expressão do ARNm ou proteína 13245. 0 nível de expressão do ARNm ou proteína 13245 pode ser determinado por métodos aqui descritos para detectar o ARNm ou proteína 13245.
Noutro aspecto, a invenção relaciona-se com uma combinação de dois ou mais dos ensaios aqui descritos. Por exemplo, pode identificar-se um agente modular utilizando um ensaio à base de células ou sem células e confirmar-se a capacidade do agente para modular a actividade de uma proteína 13245 in vivo, por exemplo, num animal tal como um modelo animal da patologia.
Esta invenção relaciona-se ainda com novos agentes identificados pelos ensaios de rastreio descritos acima. Por conseguinte, está dentro do âmbito desta invenção utilizar ainda um agente identificado do modo aqui descrito (por exemplo, um agente de modulação da 13245, uma molécula de ácido nucleico antimensageiro da 13245, um anticorpo específico para a 13245 ou um parceiro de ligação da 13245) num modelo animal apropriado para determinar a eficácia, toxicidade, efeitos secundários ou mecanismo de acção, do tratamento com um tal agente. Além do mais, os novos agentes identificados pelos ensaios de rastreio descritos acima podem ser utilizados para tratamentos como aqui descritos. 85
Ensaios de Detecção
Pode utilizar-se partes ou fragmentos das sequências de ácido nucleico aqui identificadas como reagente polinucleótidos. Por exemplo, estas sequências podem ser utilizadas para: (i) mapear os respectivos genes num cromossoma, por exemplo, para localizar regiões do gene associadas à patologia genética ou para associar a 13245 com um doença; (ii) identificar um indivíduo de uma amostra biológica diminuta (tipo tecido); e (iii) auxiliar na identificação forense de uma amostra biológica. Estas aplicações são descritas nas subsecções abaixo.
Mapeamento de Cromossomas
As sequências de nucleótidos da 13245 ou partes daquela podem ser utilizadas para mapear a localização dos genes da 13245 num cromossoma. Este processo é chamado mapeamento de cromossoma. 0 mapeamento de cromossoma é útil para correlacionar as sequências da 13245 com os genes associados à doença.
Abreviadamente, os genes da 13245 podem ser mapeados nos cromossomas preparando iniciadores de PCR (preferencialmente com 15-25 pares de bases de comprimento) da sequência de nucleótidos da 13245 (por exemplo, SEQ ID N°. 1 ou SEQ id N°. 3). Estes iniciadores podem ser depois utilizados para rastreio por PCR de híbridos de célula somáticas contendo cromossomas humanos individuais. Apenas aqueles híbridos que contêm o gene humano correspondente às sequências da 13245 produzirão um fragmento amplificado. 86
Um painel de híbridos de células somáticas no qual cada linha de células contém um único cromossoma humano ou um número pequeno de cromossomas humanos, e um conjunto completo de cromossomas de ratinho, pode permitir um mapeamento fácil de genes individuais para cromossomas humanos específicos (DEustachio et al., 1983, Science 220:919-924) .
Pode utilizar-se outras estratégias de mapeamento por exemplo, hibridização in situ como descrito em (Fan et al., 1990, Proc. Natl. Acad. Sei. USA 87:6223-6227), pré-rastreio com cromossomas marcados classificados por caudal e pré-selecção por hibridização a bibliotecas de ADNc específicas para cromossomas para mapear a 13245 em termos de localização cromossómica. A hibridização in situ de fluorescência (FISH) de uma sequência de ADN numa dispersão cromossómica de metafase pode ser ainda utilizada para proporcionar uma localização cromossómica precisa num passo. A técnica FISH pode ser utilizada com uma sequência de ADN tão curta como 500 ou 600 bases. No entanto, os clones maiores do que 1000 bases têm uma probabilidade superior de se ligarem a uma localização cromossómica única com uma intensidade de sinal suficiente para detecção simples. Preferencialmente serão suficientes 1000 bases, e mais preferencialmente 2000 bases, para se obter bons resultados num período de tempo resultado. Para uma revisão sobre a FISH, ver Verma et al. (1988, Human Chromosomes: A Manual of Basic Techniques, Pergamon Press, New York).
Os reagentes para mapeamento de cromossomas podem ser utilizados individualmente para marcar um cromossoma único 87 ou um sítio único desse cromossoma ou pode utilizar-se painéis de reagentes para preparar sítios múltiplos e/ou cromossomas múltiplos. Os reagentes correspondentes a regiões não codificadoras dos genes são tipicamente preferidos para efeitos de mapeamento. As sequências de codificação têm maior probabilidade de serem conservadas dentro de famílias de genes, aumentando assim a probabilidade de hibridizações cruzadas durante o mapeamento cromossómico.
Uma vez mapeada uma sequência numa localização cromossómica precisa, a posição física de uma sequência no cromossoma pode ser relacionada com os dados do mapa genético (estes dados encontram-se, por exemplo, em V. McKusick, Mendelian Inheritance in Man, acessível em linha através de Johns Hopkins University Welch Medicai Library). A relação entre um gene e uma doença, mapeada à mesma região cromossómica, pode ser depois identificada através de análise de correlação (co-hereditariedade de genes fisicamente adjacentes), como descrito em (por exemplo, Egeland et al., 1987, Nature, 325:783-787).
Além do mais pode determinar-se as diferenças nas sequências de ADN entre indivíduos afectados e não afectados por uma doença associada ao gene da 13245. Se for observada uma mutação em alguns ou em todos os indivíduos afectados que não está presente em nenhum dos indivíduos não afectados, então a mutação é provavelmente o agente causador da doença particular. A comparação de indivíduos afectados e não afectados envolvem geralmente uma primeira pesquisa de alterações estruturais nos cromossomas, tais como delecções ou translocações, que sejam evidentes a partir das dispersões de cromossoma ou detectáveis 88 utilizando PCR com base nessa sequência de ADN. Em última instância pode efectuar-se uma sequenciação completa dos genes de vários indivíduos para confirmar a presença de uma mutação e para distinguir mutações de polimorfismos.
Tipagem de Tecido
As sequências de 13245 podem ser utilizadas para identificar indivíduos de amostras biológicas utilizando, por exemplo, polimorfismo de restrição de comprimento de fragmento (RFLP). Nesta técnica, o ADN genómico de um indivíduo é digerido com uma ou mais enzimas de restrição, os fragmentos separados, por exemplo, numa transferência de Southern e explorados para produzir bandas para identificação. As sequências da presente invenção são úteis como marcadores adicionais de ADN para RFLP (descrito na Patente U.S. número 5 272 057).
Além disso, as sequências da presente invenção também podem ser utilizadas para determinar a sequência de ADN base-a-base efectiva de partes seleccionadas de um genoma de um indivíduo. Assim, a sequência de nucleótidos da 13245 aqui descrita pode ser utilizada para preparar iniciadores de PCR homólogos às extremidades 5' e 3' da sequência. Estes iniciadores podem ser depois utilizados para amplificar um ADN de um indivíduo e depois sequenciá-lo. Painéis das sequências correspondentes de ADN de indivíduos, preparadas deste modo, podem fornecer identificações individuais únicas, já que cada indivíduo terá um conjunto único de tais sequências de ADN devido a diferenças alélicas. 89 A variação alélica ocorre em alguma extensão nas regiões de codificação destas sequências, e em maior extensão nas regiões não codificadoras. Cada uma das sequências aqui descritas pode ser utilizada, em certa medida, como um padrão contra o qual se pode comparar o ADN um indivíduo para efeitos de identificação. Uma vez que ocorre um maior número de polimorfismos nas regiões não codificadoras, são necessárias menos sequências para diferenciar indivíduos. As sequências não codificadoras da SEQ ID N°. 1 podem proporcionar uma identificação individual positiva com um painel de, eventualmente, 10 até 1000 iniciadores cada um dos quais produzem uma sequência amplificada não codificadora de 100 bases. Se foram utilizadas sequências de codificação esperadas, tais como as na SEQ ID N°. 3, um número mais apropriado de iniciadores para identificação individual positiva seria de 500-2000.
Se for utilizado um painel de reagentes das sequências de nucleótido da 13245 aqui descritas para gerar uma base de dados para identificação única de um indivíduo, aqueles mesmos reagentes podem ser depois utilizados para identificar tecido desse indivíduo. Utilizando a base de dados de identificação única pode efectuar-se uma identificação positiva do indivíduo, vivo ou morto, a partir de amostras de tecido extremamente pequenas.
Utilização de Sequências Parciais da 13245 em Biologia Forense
As técnicas de identificação com base em ADN também podem ser utilizadas em biologia forense. Para efectuar uma tal identificação pode utilizar-se tecnologia de PCR para 90 amplificar sequências de ADN retiradas de amostras biológicas muito pequenas tais como tecidos, por exemplo, cabelo ou pele, ou fluidos orgânicos, por exemplo, sangue, saliva ou sémen presente no local do crime. A sequência amplificada pode ser depois comparada com um padrão, permitindo desse modo identificar a origem da amostra biológica.
As sequências da presente invenção podem ser utilizadas para proporcionar reagentes polinucleótidos, por exemplo, iniciadores de PCR, orientados para locais específicos do genoma humano, os quais podem melhorar a fiabilidade das identificações forenses com base em ADN, por exemplo, ao proporcionar outro "marcador de identificação" (isto é, outra sequência de ADN que é única para um indivíduo particular). Como mencionado acima, a informação da sequência de nucleótidos efectiva pode ser utilizada para identificação como uma alternativa precisa a padrões obtidos para fragmentos gerados por enzimas de restrição. As sequências orientadas para regiões não codificadoras da SEQ ID N°. 1 (por exemplo, fragmentos possuindo um comprimento de pelo menos 20 resíduos de nucleótidos, preferencialmente pelo menos 30 resíduos de nucleótidos) são particularmente apropriadas para esta utilização.
As sequências de nucleótidos da 13245 aqui descritas podem ser ainda utilizadas para proporcionar reagentes polinucleótidos, por exemplo, sondas marcadas ou que podem ser marcadas as quais podem ser utilizadas, por exemplo, numa técnica de hibridização in situ, para identificar um tecido específico, por exemplo, um tecido contendo células hematopoiéticas. Isto pode ser muito útil em casos em que o 91 patologista forense é habilitado com um tecido de origem desconhecida. Os painéis de tais sondas da 13245 podem ser utilizados para identificar tecidos por espécies e/ou por tipo de órgão.
De um modo semelhante, estes reagentes, por exemplo, iniciadores ou sondas da 13245 podem ser utilizados para rastrear culturas de tecidos para a presença de contaminação (isto é, para rastrear para a presença de uma mistura de vários tipos de células numa cultura).
Medicina Preditiva A presente invenção também se relaciona com a área da medicina preditiva na qual são utilizados ensaios de diagnóstico, ensaios de prognóstico e ensaios clínicos de monitorização para efeitos de prognóstico (preditivo) para desse modo tratar um indivíduo.
Duma maneira geral, a invenção proporciona um método para determinar se um indivíduo está em risco de sofrer de um distúrbio relacionado com uma lesão ou com a expressão inadequada de um gene que codifica um polipéptido da 13245.
Tais distúrbios incluem, por exemplo, um distúrbio associado à expressão inadequada de um polipéptido da 13245, por exemplo, um distúrbio imune ou um distúrbio neoplásico. 0 método inclui uma ou mais dos seguintes: (i) detectar, num tecido do indivíduo, a presença ou ausência de uma mutação que afecta a expressão do gene da 92 13245, ou detectar a presença ou ausência de uma mutação numa região que inclui controlos da expressão do gene, por exemplo, uma mutação na região de controlo em 5'; (ii) detectar, num tecido do indivíduo, a presença ou ausência de uma mutação que altera a estrutura do gene da 13245; (iii) detectar, num tecido do indivíduo, a expressão inadequada do gene da 13245 ao nível do ARNm, por exemplo, detectar um nível não natural de ARNm; e (iv) detectar, num tecido do indivíduo, a expressão inadequada do gene ao nível da proteína, por exemplo, detectar um nível não natural de um polipéptido da 13245.
Em formas de realização preferidas o método inclui: verificar a existência de pelo menos um de: uma delecção de um ou mais nucleótidos do gene da 13245; uma inserção de um ou mais nucleótidos no gene, uma mutação pontual, por exemplo, uma substituição de um ou mais nucleótidos do gene, um rearranjo cromossómico macroscópico do gene, por exemplo, uma translocação, inversão ou delecção.
Por exemplo, a detecção de lesão genética pode incluir: (i) proporcionar uma sonda/iniciador incluindo um oligonucleótido contendo uma região da sequência de nucleótidos a qual hibridiza numa sequência mensageira ou antimensageira da SEQ ID N°. 1, ou de mutantes naturais desta, ou sequências de flanqueamento 5' ou 3' naturalmente associadas ao gene da 13245; (ii) expor a sonda/iniciador ao ácido nucleico do tecido; e detectar a presença ou ausência da lesão genética por hibridização da sonda/iniciador no ácido nucleico, por exemplo, por hibridização in situ. 93
Em formas de realização preferidas, a detecção da expressão inadequada inclui verificar a existência de pelo menos um de: uma alteração no nível de um transcrito de ARN mensageiro do gene da 13245; a presença de um padrão de excisão-união não natural de um transcrito de ARN mensageiro do gene; ou um nível não natural de ARN ou proteína 13245.
Os métodos da invenção podem ser utilizados para rastreio pré-natal ou para determinar se um descendente de um indivíduo estará em risco de sofrer de um distúrbio.
Em formas de realização preferidas, o método inclui a determinação da estrutura de um gene da 13245, em que uma estrutura anormal é indicadora de risco para o distúrbio.
Em formas de realização preferidas, o método inclui fazer contactar uma forma de amostra do indivíduo com um anticorpo para a proteína ou um ácido nucleico da 13245, a qual hibridiza especificamente com o gene. Estas e outras formas de realização são discutidas abaixo.
Ensaios de diagnóstico e prognóstico A presença, nivel ou ausência da proteína ou ácido nucleico da 13245 numa amostra biológica pode ser avaliada obtendo uma amostra biológica de um indivíduo teste e pondo a amostra biológica em contacto com um composto ou um agente capaz de detectar a proteína 13245 ou ácido nucleico (por exemplo, ARNm, ADN genómico) que codifica a proteína 13245 de modo a que a presença da proteína ou ácido nucleico da 13245 é detectada na amostra biológica. 0 termo "amostra biológica" inclui tecidos, células e fluidos 94 biológicos isolados do indivíduo, assim como tecidos, células e fluidos presentes no indivíduo. Uma amostra biológica preferida é o soro. 0 nível de expressão do gene da 13245 pode ser medido de um certo número de maneiras, incluindo, mas não se limitando a: medir o ARNm codificado pelos genes da 13245; medir a quantidade de proteína codificada pelos genes da 13245; ou medir a actividade da proteína codificada pelos genes da 13245. 0 nível de ARNm correspondente ao gene da 13245 numa célula pode ser determinado em formatos in situ e in vitro. 0 ARNm isolado pode ser utilizado em ensaios de hibridização ou amplificação que incluem, mas não se limitam a, análise de Southern ou Northern, análise por reacção em cadeia da polimerase e matrizes de sondas. Um método de diagnóstico preferido para a detecção de níveis de ARNm envolve pôr em contacto o ARNm isolado com uma molécula de ácido nucleico (sonda) que possa hibridizar no ARNm codificado pelo gene a ser detectado. A sonda de ácido nucleico pode ser, por exemplo, um ácido nucleico 13245 integral, tal como o ácido nucleico da SEQ ID N°. 1, ou uma parte deste, tal como um oligonucleótido com pelo menos 7, 15, 30, 50, 100, 250 ou 500 nucleótidos de comprimento e suficiente para hibridizar especificamente em condições rigorosas no ARNm ou ADN genómico da 13245. Outras sondas adequadas para serem utilizadas nos ensaios de diagnóstico são aqui descritas.
Num formato, o ARNm (ou ADNc) é imobilizado numa superfície e posto em contacto com as sondas, por exemplo analisando o ARNm isolado num gel de agarose e transferindo o ARNm do gel para uma membrana, tal como nitrocelulose. Num formato alternativo, as sondas são imobilizadas numa 95 superfície e o ARNm (ou ADNc) é posto em contacto comas sondas, por exemplo, numa matriz de chip de genes bidimensional. Um especialista na técnica pode adaptar métodos de detecção de ARNm conhecidos para serem utilizados na detecção do nível de ARNm codificado pelo gene da 13245s. 0 nível de ARNm muna amostra que é codificado pelo 13245 pode ser avaliado por amplificação de ácido nucleico, por exemplo, por RT-PCR (Patente U.S. número 4 683 202), reacção em cadeia da ligase (Barany, 1991, Proc. Natl. Acad. Sei. USA 88:189-193), replicação de sequência auto-sustentada (Guatelli et al., 1990, Proc. Natl. Acad. Sei. USA 87:1874-1878), sistema de amplificação transcricional (Kwoh et al., 1989, Proc. Natl. Acad. Sei. USA 86:1173- 1177), Q-Beta Replicase (Lizardi et al., 1988,
Bio/Technology 6:1197), replicação em círculo contínuo (Patente U.S. número 5 854 033) ou qualquer outro método de amplificação de ácido nucleico, seguido da detecção das moléculas amplificadas utilizando técnicas conhecidas na matéria. Como aqui utilizado, iniciadores de amplificação são definidos como sendo um par de moléculas de ácido nucleico que podem emparelhar com as regiões 5' ou 3' de um gene da 13245 (cadeias mais e menos, respectivamente, ou vice-versa) e contêm uma região curta no meio. Em geral, os iniciadores de amplificação têm desde cerca de 10 até 30 nucleótidos de comprimento e flanqueiam uma região com cerca de 50 até 200 nucleótidos de comprimento. Em condições apropriadas e com reagentes apropriados, estes iniciadores permitem a amplificação de uma molécula de ácido nucleico compreendendo uma sequência de nucleótidos entre os iniciadores. 96
Para métodos in situ, uma amostra de células ou tecido pode ser preparada/processada e imobilizada num suporte, tipicamente uma lâmina de vidro, e depois posta em contacto com uma sonda que pode hibridizar no ARNm que codifica o gene da 13245 a ser analisado.
Noutra forma de realização, os métodos incluem ainda pôr em contacto uma amostra de controlo com um composto ou agente capaz de detectar ARNm da 13245, ou ADN genómico, e comparar a presença de ARNm ou ADN genómico da 13245 na amostra de controlo com a presença de ARNm ou ADN genómico da 13245 na amostra de ensaio.
Pode utilizar-se uma diversidade de métodos para determinar o nível de proteína codificada pelo 13245. Em geral, estes métodos incluem pôr em contacto um agente que se liga selectivamente à proteína, tal como um anticorpo, com uma amostra para avaliar o nível de proteína na amostra. Numa forma de realização preferida, o anticorpo é portador de uma etiqueta detectável. Os anticorpos podem ser policlonais, ou mais preferencialmente, monoclonais. Pode utilizar-se um anticorpo intacto, ou um fragmento deste (por exemplo, Fab ou F(ab')2). 0 termo "marcado," no que se refere à sonda ou anticorpo pretende abranger marcação directa da sonda ou anticorpo por acoplamento (isto é, ligação física) de uma substância detectável à sonda ou anticorpo, assim como a marcação indirecta da sonda ou anticorpo por reactividade com uma substância detectável. Aqui são proporcionados exemplos de substâncias detectáveis.
Os métodos de detecção podem ser utilizados para detectar a proteína 13245 numa amostra biológica in vitro 97 assim como in vivo. As técnicas para detecção in vitro da proteína 13245 incluem ensaios de imunoabsorção enzimática (ELISAs), imunoprecipitações, imunofluorescência, imunoensaio enzimático (EIA), radioimunoensaio (RIA) e análise por transferência de Western. As técnicas para detecção in vivo da proteína 13245 incluem introduzir num indivíduo um anticorpo anti-13245 marcado. Por exemplo, o anticorpo pode estar marcado com um marcador radioactivo cuja presença e localização num indivíduo pode ser detectado por técnicas de imagiologia correntes.
Noutra forma de realização, os métodos incluem ainda pôr em contacto a amostra de controlo com um composto ou agente capaz de detectar a proteína 13245, e comparar a presença da proteína 13245 na amostra de controlo com a presença da proteína 13245 na amostra de ensaio. A invenção também inclui estojos para detectar a presença de 13245 numa amostra biológica. Por exemplo, o estojo pode incluir um composto ou agente capaz de detectar a proteína ou ARNm da 13245 numa amostra biológica e um padrão. 0 composto ou agente pode ser embalado numa recipiente adequado. 0 estojo pode compreender ainda instruções para utilização do estojo para detectar proteína ou ácido nucleico da 13245.
Para estojos à base de anticorpo, o estojo pode incluir: (1) um primeiro anticorpo (por exemplo, ligado a um suporte sólido) o qual se liga a um polipéptido correspondente a um marcador da invenção; e, opcionalmente, (2) um segundo anticorpo diferente o qual se liga ao polipéptido ou ao primeiro anticorpo e está conjugado com um agente detectável. 98
Para estojos à base de oligonucleótido, o estojo pode incluir: (1) um oligonucleótido, por exemplo, um oligonucleótido marcado de modo detectável, o qual hibridiza numa sequência de ácido nucleico que codifica um polipéptido correspondente a um marcador da invenção ou (2) um par de iniciadores úteis para amplificar uma molécula de ácido nucleico correspondente a um marcador da invenção. 0 estojo também pode incluir um agente tampão, um conservante ou um agente estabilizador de proteínas. 0 estojo também pode incluir componentes necessários para detectar o agente detectável (por exemplo, uma enzima ou um substrato). 0 estojo também pode conter uma amostra de controlo ou uma série de amostras de controlo que podem ser analisadas e comparadas com a amostra de ensaio. Cada componente do estojo pode estar encerrado dentro de um recipiente individual e todos os vários recipientes podem estar dentro de uma única embalagem, conjuntamente com instruções para interpretar os resultados dos ensaios realizados utilizando o estojo.
Os métodos de diagnóstico aqui descritos podem identificar indivíduos possuindo, ou em risco de desenvolver, uma doença ou distúrbio associado à expressão ou actividade inadequada, aberrante ou indesejada da 13245. Como aqui utilizado, o termo "indesejada" inclui um fenómeno indesejado envolvido numa resposta biológica tal como a indução de uma resposta imunológica inapropriada ou a proliferação celular desregulada.
Numa forma de realização é identificada uma doença ou distúrbio associado à expressão ou actividade aberrante ou indesejada da 13245. Obtém-se uma amostra de um indivíduo e avalia-se a proteína ou ácido nucleico da 13245 (por 99 exemplo, ARNm ou ADN genómico), em que o nível, por exemplo, a presença ou ausência, da proteína ou ácido nucleico da 13245 é diagnóstica para um indivíduo possuindo ou em risco de desenvolver uma doença ou distúrbio associado à expressão ou actividade aberrante ou indesejada da 13245. Como aqui utilizado, uma "amostra de ensaio" refere-se a uma amostra biológica obtida de um indivíduo de interesse, incluindo um fluido biológico (por exemplo, soro), amostra de células, ou tecido.
Os ensaios de prognóstico aqui descritos podem ser utilizados para determinar se se pode administrar a um indivíduo um agente (por exemplo, um agonista, antagonista, mimético de péptido, proteína, péptido, ácido nucleico, molécula pequena ou outro fármaco candidato) para tratar uma doença ou distúrbio associado à expressão ou actividade aberrante ou indesejada da 13245. Por exemplo, estes métodos podem ser utilizados para determinar se um indivíduo pode ser eficazmente tratado com um agente que modula a expressão ou actividade da 13245.
Os métodos da invenção também podem ser utilizados para detectar alterações genéticas num gene da 13245, determinando-se desse modo se um indivíduo com um gene alterado está em risco de sofrer de um distúrbio caracterizado pela regulação inapropriada da actividade da proteína 13245 ou expressão do ácido nucleico, tal como um distúrbio associado à tumorigénese ou indução de uma resposta imunológica inadequada. Em formas de realização preferidas, os métodos incluem detectar, numa amostra do indivíduo, a presença ou ausência de uma alteração genética caracterizada por pelo menos uma de uma alteração que afecta a integridade de um gene que codifica uma proteína 100 13245, ou a expressão inadequada do gene da 13245. Por exemplo, estas alterações genéticas podem ser detectadas verificando a existência de pelo menos um de 1) uma delecção de um ou mais nucleótidos de um gene da 13245; 2) uma adição de um ou mais nucleótidos de um gene da 13245; 3) uma substituição de um ou mais nucleótidos de um gene da 13245, 4) um rearranjo cromossómico de um gene da 13245; 5) uma alteração no nivel de um transcrito de ARN mensageiro de um gene da 13245, 6) modificação aberrante de um gene da 13245, tal como do padrão de metilação do ADN genómico, 7) a presença de um padrão de excisão-união não natural de um transcrito de ARN mensageiro de um gene da 13245, 8) um nivel não natural de uma proteína 13245, 9) perda alélica de um gene da 13245, e 10) modificação pós-tradução inapropriada de uma proteína 13245.
Uma alteração pode ser detectada sem uma sonda/iniciador numa reacção em cadeia da polimerase, tal como por PCR de ancoragem ou RACE-PCR, ou, alternativamente, numa reacção em cadeia de ligação (LCR), o último dos quais pode ser particularmente útil para detectar mutações pontuais no gene da 13245. Este método pode incluir os passos de colher uma amostra de células de um indivíduo, isolar o ácido nucleico (por exemplo, genómico, ARNm ou ambos) da amostra, pôr em contacto a amostra de ácido nucleico com um ou mais iniciadores que hibridizam especificamente num gene da 13245 em condições em que ocorre a hibridização e amplificação do gene da 13245 (se presente), e detectar a presença ou ausência de um produto de amplificação ou detectar a dimensão do produto de amplificação e comparar o comprimento com uma amostra de controlo. Espera-se que a PCR e/ou LCR possa ser adequada para ser utilizada como um passo de amplificação 101 preliminar em conjunto com qualquer uma das técnicas utilizadas para detectar mutações aqui descritas.
Os métodos de amplificação alternativos incluem: replicação de sequências auto-sustentada (Guatelli et ai., 1990, Proc. Natl. Acad. Sei. USA 87:1874-1878), sistema de amplificação transcricional (Kwoh et al., 1989, Proc. Natl. Acad. Sei. USA 86:1173-1177), Q-Beta Replicase (Lizardi et al., 1988, Bio/Technology 6:1197) ou outros métodos de amplificação de ácido nucleico, seguidos da detecção das moléculas amplificadas utilizando técnicas conhecidas dos especialistas na matéria.
Noutra forma de realização, as mutações num gene da 13245 de uma amostra celular podem ser identificadas detectando alterações nos padrões de clivagem de enzimas de restrição. Por exemplo, isola-se ADN da amostra e controlo, amplifica-se (opcionalmente), digere-se com uma ou mais endonucleases de restrição e determina-se o tamanho do comprimento dos fragmentos, por exemplo, por electroforese em gel, e compara-se. As diferenças do tamanho de fragmento entre o ADN da amostra e do controlo indica mutações na amostra de ADN. Além disso, pode utilizar-se ribozimas específicos em relação à sequência (por exemplo, Patente U.S. número 5 498 531) para identificar a presença de mutações especificas por desenvolvimento ou perda de um sitio de clivagem pela ribozima.
Noutras formas de realização, as mutações genéticas na 13245 podem ser identificadas hibridizando uma amostra em ácidos nucleicos de controlo, por exemplo, ADN ou ARN, por exemplo, matrizes bidimensionais, ou, por exemplo, matrizes à base de chip. Estas matrizes incluem uma multiplicidade 102 de endereços, cada um dos quais é posicionalmente distinguível do outro. Em cada endereço da multiplicidade está localizada uma sonda diferente. As matrizes podem ter uma densidade alta de endereços, por exemplo, podem conter centenas ou milhares de sondas de tipo oligonucleótido (Cronin et al., 1996, Hum. Mutat. 7:244-255; Kozal et al., 1996, Nature Med. 2:753-759). Por exemplo, as mutações genéticas na 13245 podem ser identificadas em matrizes bidimensionais contendo sondas de ADN geradas pela luz como descrito em (Cronin et al., supra). Abreviadamente, pode utilizar-se uma primeira matriz de sondas de hibridização para percorrer extensões compridas de ADN numa amostra e num controlo para identificar alterações de bases entre as sequências fazendo matrizes lineares de sondas sequenciais de sobreposição. Este passo permite identificar mutações pontuais. Este passo é seguido de uma segunda matriz de hibridização que permite a caracterização de mutações específicas utilizando matrizes de sondas especializadas mais pequenas complementares a todas as variantes ou mutações detectadas. Cada matriz de mutação é constituída de conjuntos de sondas paralelas, umas complementares ao gene natural e outras complementares ao gene mutante.
Ainda noutra forma de realização pode utilizar-se qualquer uma de uma diversidade de reacções de sequenciação conhecidas na técnica para sequenciar directamente o gene da 13245 e detectar mutações comparando uma sequência da amostra 13245 com a sequência correspondente natural (controlo). Pode utilizar-se procedimentos automáticos de sequenciação quando se realiza os ensaios de diagnóstico (1995, Biotechniques 19:448), incluindo sequenciação por espectrometria de massa. 103
Outros métodos para detectar mutações no gene da 13245 incluem métodos nos quais se utiliza a protecção de agentes de clivagem para detectar bases discrepantes em heteroduplexes de ARN/ARN ou ARN/ADN (Myers et al., 1985, Science 230:1242; Cotton et al., 1988, Proc. Natl. Acad. Sei. USA 85:4397; Saleeba et al., 1992, Meth. Enzymol. 217:286-295) .
Ainda noutra forma de realização, a reacção de clivagem discrepante utiliza uma ou mais proteínas que reconhecem pares de bases discrepantes em ADN de cadeia dupla (as chamadas enzimas de "reparação de ADN discrepante") em sistemas definidos para detectar e mapear mutações pontuais em ADNc de 13245 obtidos de amostras de células. Por exemplo, a enzima mutY de E. coli cliva A em G/A sem correspondência e a timidina glicosilase de ADN de células HeLa cliva T em G/T sem correspondência (Hsu et al., 1994, Carcinogenesis 15:1657-1662; Patente U.S. número 5 459 039) .
Noutras formas de realização, as alterações na mobilidade electroforética serão utilizadas para identificar mutações nos genes da 13245. Por exemplo pode utilizar-se polimorfismo conformacional da cadeia simples (SSCP) para detectar diferenças na mobilidade electroforética entre ácidos nucleicos mutantes e naturais (Orita et al., 1989, Proc. Natl. Acad. Sei. USA 86:2766; Cotton, 1993, Mutat. Res. 285:125-144; Hayashi, 1992, Genet. Anal. Tech. Appl. 9:73-79). Fragmentos de ADN de cadeia simples de ácidos nucleicos 13245 da amostra e controlo serão desnaturados e deixados ficar novamente naturados. A estrutura secundária dos ácidos nucleicos de cadeia simples varia de acordo com a sequência, a alteração 104 resultante na mobilidade electroforética permite a detecção até mesmo da alteração de uma única base. Os fragmentos de ADN podem ser marcados ou detectados com sondas marcadas. A sensibilidade do ensaio pode ser melhorada utilizando ARN (em vez de ADN), no qual a estrutura secundária é mais sensível a alterações na sequência. Numa forma de realização preferida, o método objecto utiliza análise heteroduplex para separar moléculas heteroduplex de cadeia dupla com base em alterações na mobilidade electroforética (Keen et al., 1991, Trends Genet 7:5).
Ainda noutra forma de realização, analisa-se o movimento dos fragmentos mutantes ou naturais em geles de poliacrilamida contendo um gradiente de desnaturante utilizando electroforese em gel de gradiente desnaturante (DGGE) (Myers et al., 1985, Nature 313:495). Quando se utiliza DGGE como método de análise, modifica-se o ADN para garantir que ele não desnatura completamente, por exemplo adicionando uma pinça de GC de aproximadamente 40 pares de bases de ADN rico em GC de fusão elevada por PCR. Noutra forma de realização, utiliza-se um gradiente de temperatura em vez de um gradiente de desnaturante para identificar diferença na mobilidade do ADN de controlo e da amostra (Rosenbaum e Reissner (1987) Biophys Chem 265:12753).
Exemplos de outras técnicas para detectar mutações pontuais incluem, mas não se limitam a, hibridização selectiva de oligonucleótidos, amplificação selectiva ou extensão selectiva de iniciadores (Saiki et al., 1986, Nature 324:163; Saiki et al., 1989, Proc. Natl. Acad. Sei. USA 86:6230) . 105
Alternativamente pode utilizar-se tecnologia de amplificação especifica para alelos que depende na amplificação selectiva por PCR em conjunção com a actual invenção. Os oligonucleótidos utilizados como iniciadores para amplificação especifica podem ser portadores da mutação de interesse no centro da molécula (pelo que a amplificação depende da hibridização diferencial; Gibbs et al., 1989, Nucl. Acids Res. 17:2437-2448) ou no extremo 3' de um iniciador onde, em condições apropriadas, se pode impedir o emparelhamento discrepante ou reduzir a extensão da polimerase (Prossner, 1993, Tibtech 11:238). Além disso pode ser desejável introduzir um novo sitio de restrição na região da mutação para criar detecção baseada na clivagem (Gasparini et al., 1992, Mol. célula Sondas 6:1). Espera-se que em determinadas formas de realização, a amplificação também possa ser realizada utilizando Taq ligase para amplificação (Barany, 1991, Proc. Natl. Acad. Sei. USA 88:189). Nestes casos ocorrerá ligação apenas se houver um emparelhamento perfeito na extremidade 3' na sequência 5' tornando possível a detecção da presença de uma mutação conhecida num sítio específico pesquisando a presença ou ausência de amplificação.
Os métodos aqui descritos podem ser realizados, por exemplo, utilizando estojos de diagnóstico pré-embalados compreendendo pelo menos uma sonda de ácido nucleico ou reagente anticorpo aqui descrito, o qual pode ser convenientemente utilizado, por exemplo, em instalações clínicas para diagnosticas doentes que apresentem sintomas ou antecedentes familiares de uma doença ou patologia envolvendo um gene da 13245. 106
Utilização de Moléculas de 13245 como Marcadores Representativos
As moléculas de 13245 da invenção também são úteis como marcadores de distúrbios ou estados patológicos, como marcadores para precursores de estados patológicos, como marcadores para a predisposição a estados patológicos, como marcadores da actividade do fármaco ou como marcadores do perfil farmacogenómico de um indivíduo. Utilizando os métodos aqui descritos pode detectar-se a presença, ausência e/ou quantidade da moléculas de 13245 da invenção e pode correlacionar-se com um ou mais estados biológicos in vivo. Por exemplo, as moléculas de 13245 da invenção podem servir como marcadores representativos para um ou mais distúrbios ou estados patológicos ou para condições que conduzem a estados patológicos. Como aqui utilizado, um "marcador representativo" é um marcador biológico objectivo que se correlaciona com a ausência ou presença de uma doença ou distúrbio, ou com a progressão de uma doença ou distúrbio (por exemplo, com a presença ou ausência de um tumor). A presença ou quantidade de tais marcadores é independente da doença. Por conseguinte, estes marcadores podem servir para indicar se um percurso particular de tratamento é eficaz para diminuir um estado patológico ou distúrbio. Os marcadores representativos são particularmente úteis quando a presença ou extensão de um estado patológico ou distúrbio é difícil de avaliar através de metodologias correntes (por exemplo, tumores em fase precoce), ou quando é desejada uma avaliação da progressão da doença antes de se atingir um critério de avaliação clinico potencialmente perigoso (por exemplo, pode fazer-se uma avaliação de uma doença cardiovascular utilizando os níveis de colesterol como um marcador representativo e pode 107 fazer-se uma análise da infecção por HIV utilizando os niveis de ARN de HIV como um marcador representativo, muito antes dos resultados clínicos indesejáveis de enfarte do miocárdio ou SIDA declarada). Foram descritos exemplos da utilização de marcadores representativos (por exemplo, Koomen et al., 2000, J. Mass. Spectrom. 35:258-264; James, 1994, AIDS Treat. News Arch. 209).
As moléculas de 13245 da invenção também são úteis como marcadores farmacodinâmicos. Como aqui utilizado, um "marcador farmacodinâmico" é um marcador biológico objectivo o qual se correlaciona com efeitos medicamentosos. A presença ou quantidade de um marcador farmacodinâmico não está relacionado com o estado patológico ou distúrbio para o qual o fármaco está a ser administrado; por conseguinte, a presença ou quantidade do marcador é indicadora da presença ou actividade do fármaco num indivíduo. Por exemplo, um marcador farmacodinâmico pode ser indicador da concentração do fármaco no tecido biológico, uma vez que o marcador é expressado ou transcrito ou não expressado ou transcrito nesse tecido em relação com o nível do fármaco. Neste sentido, a distribuição ou captação do fármaco pode ser seguida através do marcador farmacodinâmico. De modo semelhante, a presença ou quantidade do marcador farmacodinâmico pode ser relacionada com a presença ou quantidade do produto metabólico de um fármaco, pelo que a presença ou quantidade do marcador é indicadora da velocidade relativa da metabolização do fármaco in vivo. Os marcadores farmacodinâmicos são particularmente úteis no aumento da sensibilidade da detecção de efeitos do fármaco, em particular quando o fármaco é administrado em doses baixas. Uma vez que até mesmo uma pequena quantidade de um fármaco 108 pode ser suficiente para activar ciclos múltiplos de transcrição ou expressão do marcador (por exemplo, um marcador da 13245), o marcador amplificado pode estar numa quantidade que é mais fácil de detectar do que o próprio fármaco. De igual modo, o marcador pode ser mais fácil de detectar devido à natureza do próprio marcador; por exemplo, utilizando os métodos aqui descritos, pode utilizar-se anticorpos anti-13245 num sistema de detecção imunológico para um marcador da proteína 13245 ou pode utilizar-se sondas marcadas radioactivamente específicas para a 13245 para detectar um marcador do ARNm da 13245. Além do mais, a utilização de um marcador farmacodinâmico pode facilitar a previsão com base no mecanismo do risco associado ao tratamento com o fármaco para além da gama de observações directas possíveis. Foram descritos exemplos da utilização de marcadores farmacodinâmicos (por exemplo, Patente U.S. número 6 033 862; Hattis et al., 1991, Env. Health Perspect. 90: 229-238; Schentag, 1999, Am. J. Health-Syst. Pharm. 56 Supl. 3: S21-S24; Nicolau, 1999, Am, J. Health-Syst. Pharm. 56 Supl. 3: S16-S20).
As moléculas de 13245 da invenção também são úteis como marcadores farmacogenómicos. Como aqui utilizado, um "marcador farmacogenómico" é um marcador biológico objectivo o qual correlaciona com uma resposta ou susceptibilidade clínica específica ao fármaco num indivíduo (por exemplo, McLeod et al., 1999, Eur. J. Câncer 35:1650-1652). A presença ou quantidade do marcador farmacogenómico está relacionada com a resposta previsível do indivíduo a um fármaco ou classe de fármacos específico antes da administração do fármaco. Avaliando a presença ou quantidade de um ou mais marcadores farmacogenómicos num indivíduo pode seleccionar-se a terapia de fármaco que é 109 mais apropriada para o indivíduo ou que se espera que tenha um maior grau de sucesso. Por exemplo, com base na presença ou quantidade de ARN ou proteína (por exemplo, proteína ou ARN de 13245) para marcadores tumorais específicos num indivíduo pode seleccionar-se um fármaco ou percurso de tratamento que está optimizado para o tratamento do tumor específico que está provavelmente presente no indivíduo. De modo semelhante, a presença ou ausência de uma mutação específica da sequência no ADN da 13245 pode correlacionar com a resposta da 13245 ao fármaco. Por conseguinte, a utilização de marcadores farmacogenómicos permite a aplicação do tratamento mais apropriado para cada indivíduo sem que se tenha de administrar a terapia.
Composições farmacêuticas O ácido nucleico e os polipéptidos, seus fragmentos, assim como os anticorpos anti-13245 (também aqui referidos como "compostos activos") da invenção podem ser incorporados em composições farmacêuticas. Estas composições incluem tipicamente a molécula de ácido nucleico, proteína ou anticorpo e um veículo farmaceuticamente aceitável. Como aqui utilizado a linguagem "veículo farmaceuticamente aceitável" inclui solventes, meios de dispersão, revestimentos, agentes antibacterianos e antifúngicos, agentes isotónicos e agentes de retardamento da absorção, e semelhantes, compatíveis com a administração farmacêutica. Nas composições também podem ser incorporados compostos activos suplementares.
Uma composição farmacêutica é formulada para ser compatível com a via de administração pretendida. Exemplos 110 de vias de administração incluem a administração parentérica, por exemplo, intravenosa, intradérmica, subcutânea, oral (por exemplo, inalação), transdérmica (tópica), transmucosa e rectal. As soluções ou suspensões utilizadas para aplicação parentérica, intradérmica ou subcutânea podem incluir os componentes seguintes: um diluente estéril tal como água para injecção, soro fisiológico, óleos fixos, polietileno glicóis, glicerina, propileno glicol ou outros solventes sintéticos; agentes antibacterianos tais como álcool benzilico ou metilparabenos; antioxidantes tais como ácido ascórbico ou bissulfito de sódio; agentes quelantes tais como ácido etilenodiaminotetraacético; tampões tais como acetatos, citratos ou fosfatos e agentes para o acerto da tonicidade tal como cloreto de sódio ou dextrose. O pH pode ser ajustado com ácidos ou bases, tal como ácido clorídrico ou hidróxido de sódio. A preparação parentérica pode ser fechada em ampolas, seringas descartáveis ou frasquinhos de dose múltipla feitos de vidro ou plástico.
As composições farmacêuticas adequadas para utilização em injectáveis incluem soluções aquosas estéreis (quando solúveis em água) ou dispersões e pós estéreis para preparação extemporânea de soluções ou dispersões injectáveis estéreis. Para administração intravenosa, os veículos adequados incluem soro fisiológico, água bacterioestática, Cremophor EL™ (BASF, Parsippany, NJ) ou soro fisiológico tamponado com fosfato (PBS). Em quaisquer dos casos, a composição tem de ser estéril e deverá ser fluida até ao ponto em que exista uma introdução fácil com seringa. Ela deverá ser estável nas condições de fabrico e armazenagem e têm de ser conservadas contra a acção de contaminação de microrganismos tais como bactérias e 111 fungos. 0 veículo pode ser um solvente ou meio de dispersão contendo, por exemplo, água, etanol, poliol (por exemplo, glicerol, propileno glicol e polietileno glicol líquido, e semelhantes), e misturas adequadas destes. A fluidez apropriada pode ser mantida, por exemplo, através da utilização de um revestimento tal como lecitina, mantendo o tamanho de partícula necessário no caso de dispersões e através da utilização de tensioactivos. A prevenção em relação à acção de microrganismos pode ser conseguida por vários agentes antibacterianos e antifúngicos, por exemplo, parabenos, clorobutanol, fenol, ácido ascórbico, timerosal e semelhantes. Em muitos casos será preferido incluir agentes isotónicos, por exemplo, açúcares, poliálcoois tal como manitol, sorbitol, cloreto de sódio na composição. A absorção prolongada das composições injectáveis pode ser conseguida incluindo um agente na composição que retarde a absorção, por exemplo, monoestearato de alumínio e gelatina.
As soluções injectáveis estéreis podem ser preparadas incorporando o composto activo na quantidade necessária num solvente apropriado com um ou uma combinação de ingredientes enumerados acima, consoante necessário, seguida de esterilização por filtração. Duma maneira geral, as dispersões são preparadas incorporando o composto activo num veículo estéril que contém um meio de dispersão básico e os outros ingredientes necessários dos enumerados acima. No caso de pós estéreis para a preparação de soluções injectáveis estéreis, os métodos de preparação preferidos são secagem em vácuo e secagem por congelação, as quais produzem um pó da substância activa e de qualquer ingrediente adicional desejado a partir de uma sua solução previamente esterilizada por filtração. 112
As composições orais incluem geralmente um diluente inerte ou um veiculo comestível. Para os efeitos de administração oral terapêutica, o composto activo pode ser incorporado com excipientes e utilizado na forma de comprimidos, trociscos ou cápsulas, por exemplo, cápsulas de gelatina. As composições orais também podem ser preparadas utilizando um veículo fluido para serem utilizadas como um colutório. Podem ser incluídos aglutinantes e/ou materiais adjuvantes farmaceuticamente compatíveis como parte da composição. Os comprimidos, pílulas, cápsulas, trociscos e semelhantes podem conter qualquer um dos seguintes ingredientes, ou compostos de uma natureza semelhante: um aglutinante, tal como celulose microcristalina, goma de tragacanta ou gelatina; um excipiente, tal como amido ou lactose; um desintegrante, tal como ácido algínico, Primogel™, ou amido de milho; um lubrificante, tal como estearato de magnésio ou Sterotes™; um deslizante, tal como dióxido de silício coloidal; um edulcorante, tal como sacarose ou sacarina; ou um aromatizante, tal como hortelã-pimenta, salicilato de metilo ou aroma a laranja.
Para administração por inalação, os compostos são fornecidos na forma de um i aerossol a partir de um recipiente ou dispensador pressurizado que contém um propulsor adequado, por exemplo, um gás tal como dióxido de carbono, ou um nebulizador. A administração sistémica também pode ser por transmucosa ou meios transdérmicos. Para administração transmucosa ou transdérmica utiliza-se na formulação penetrantes apropriados para a barreira a ser permeada. Tais penetrantes são geralmente conhecidos na técnica, e 113 incluem, por exemplo, para administração transmucosa, detergentes, sais biliares e derivados do ácido fusídico. A administração transmucosa pode ser conseguida através da utilização de formulações para pulverização nasal ou supositórios. Para administração transdérmica, os compostos activos são formulados em pomadas, unguentos, geles ou cremes como geralmente conhecidos na técnica.
Os compostos também podem ser preparados na forma de supositórios (por exemplo, com bases convencionais para supositórios tais como manteiga de cacau e outros glicéridos) ou enemas de retenção para administração rectal.
Numa forma de realização, os compostos activos são preparados com veiculos que protegerão o composto contra a eliminação rápida do organismo, tal como uma formulação de libertação controlada, incluindo implantes e sistemas de administração microencapsulados. Pode utilizar-se polímeros biocompativeis, biodegradáveis, tais como acetato de etileno e vinilo, polianidridos, poli(ácido glicólico), colagénio, poliortoésteres e poli(ácido láctico). Os métodos para a preparação de tais formulações serão evidentes aos especialistas na técnica. Os materiais também podem ser obtidos comercialmente de Alza Corporation e Nova Pharmaceuticals, Inc. Também se pode utilizar suspensões de lipossomas (incluindo lipossomas orientados para células infectadas utilizando anticorpos monoclonais dirigidos para antigénios virais) como veiculos farmaceuticamente aceitáveis. Estes podem ser preparados de acordo com métodos descritos (por exemplo, Patente U.S. número 4 522 811). 114 É vantajoso formular as composições orais ou parentéricas na forma de dosagem unitária para facilidade de administração e uniformidade de dosagem. Forma unitária de dosagem como aqui utilizada refere-se a unidades fisicamente discretas adequadas como dosagens unitárias para o indivíduo a ser tratado; contendo cada unidade uma quantidade predeterminada de composto activo calculada para produzir o efeito terapêutico desejado associada ao veículo farmacêutico necessário. A toxicidade e eficácia terapêutica de tais compostos podem ser determinadas por procedimentos farmacêuticos correntes em culturas de células ou animais experimentais, por exemplo, para determinar a LD50 (a dose letal para 50% da população) e a ED50 (a dose terapeuticamente eficaz em 50% da população) . A relação de dose entre os efeitos tóxico e terapêutico é o índice terapêutico e ele pode ser exprimido como a relação LD50/ED50. São preferidos compostos que exibem índices terapêuticos elevados. Embora os compostos que exibem efeitos secundários possam ser utilizados deverão ser tomadas as precauções necessárias para conceber um sistema de administração que oriente tais compostos para o sítio do tecido afectado para minimizar a lesão potencial em células não infectadas e, desse modo, reduzir os efeitos secundários.
Os dados obtidos a partir de ensaios de culturas de células e estudos animais podem ser utilizados na formulação de uma gama de dosagem para utilização em seres humanos. A dosagem de tais compostos situa-se preferencialmente dentro de uma gama de concentrações em circulação que incluem a ED50 com pouca ou nenhuma toxicidade. A dosagem pode variar dentro desta gama 115 dependendo da forma de dosagem empregue e da via de administração utilizada. Para qualquer composto utilizado no método da invenção, a dose terapeuticamente eficaz pode ser inicialmente estimada a partir de ensaios em cultura de células. Uma dose pode ser formulada em modelos animais para atingir uma gama de concentração em circulação no soro que inclui a IC50 (isto é, a concentração do composto de ensaio que atinge metade da inibição máxima dos sintomas) como determinado na cultura de células. Esta informação pode ser utilizada para se determinar de modo mais exacto doses úteis em seres humanos. Os níveis no soro podem ser medidos, por exemplo, por cromatografia líquida de alta eficiência.
Como aqui definida, uma quantidade terapeuticamente eficaz de proteína ou polipéptido (isto é, uma dosagem eficaz) varia desde cerca de 0,001 até 30 miligrama por quilograma de peso corporal, preferencialmente cerca de 0,01 até 25 miligrama por quilograma de peso corporal, mais preferencialmente cerca de 0,1 até 20 miligrama por quilograma de peso corporal, e ainda mais preferencialmente cerca de 1 até 10 miligrama por quilograma, 2 até 9 miligrama por quilograma, 3 até 8 miligrama por quilograma, 4 até 7 miligrama por quilograma, ou 5 até 6 miligrama por quilograma de peso corporal. A proteína ou o polipéptido pode ser administrado uma vez por semana durante entre cerca de 1 até 10 semanas, preferencialmente entre 2 até 8 semanas, mais preferencialmente entre cerca de 3 até 7 semanas, e ainda mais preferencialmente durante cerca de 4, 5 ou 6 semanas. O especialista na técnica compreenderá que determinados factores podem influenciar a dosagem e periodicidade necessária para tratar eficazmente um indivíduo, incluindo mas não se limitando à gravidade da 116 doença ou distúrbio, tratamentos prévios, o estado de saúde geral e/ou idade do indivíduo, e outras doenças presentes. Além disso, o tratamento de um indivíduo com uma quantidade terapeuticamente eficaz de uma proteína, polipéptido ou anticorpo pode incluir um único tratamento ou pode incluir, preferencialmente, uma série de tratamentos.
Para anticorpos, a dosagem preferida é de 0,1 miligrama por quilograma de peso corporal (geralmente 10 até 20 miligrama por quilograma) . Se o anticorpo for para actuar no cérebro é geralmente apropriada uma dosagem de 50 até 100 miligrama por quilograma. Duma maneira geral, os anticorpos parcialmente humanos e os anticorpos totalmente humanos tem uma semivida mais prolongada no organismo humano do que outros anticorpos. Por conseguinte são frequentemente possíveis dosagens menores e uma administração menos frequente. Pode utilizar-se modificações tal como lipidação para estabilizar os anticorpos e para aumentar a captação e a penetração no tecido (por exemplo, no cérebro). Um método para a lipidação de anticorpos é descrito por Cruikshank et al. (1997, J. AIDS Hum. Retrovir. 14:193). A presente invenção abrange agentes que modulam a expressão ou actividade. Um agente pode ser, por exemplo, uma molécula pequena. Por exemplo, estas moléculas pequenas incluem, mas não se limitam a, péptidos, miméticos de péptidos (por exemplo, peptóides), aminoácidos, análogos de aminoácidos, polinucleótidos, análogos de polinucleótidos, nucleótidos, análogos de nucleótidos, compostos orgânicos ou inorgânicos (isto é, incluindo compostos hetero-orgânicos e organo-metálicos) possuindo um peso molecular inferior a cerca de 10 000 grama por mole, compostos 117 orgânicos ou inorgânicos possuindo um peso molecular inferior a cerca de 5000 grama por mole, compostos orgânicos ou inorgânicos possuindo um peso molecular inferior a cerca de 1000 grama por mole, compostos orgânicos ou inorgânicos possuindo um peso molecular inferior a cerca de 500 grama por mole, e sais, ésteres, e outras formas farmaceuticamente aceitáveis de tais compostos.
As doses ilustrativas incluem guantidades de miligrama ou micrograma da molécula peguena por guilograma do indivíduo ou peso da amostra (por exemplo, cerca de 1 micrograma por quilograma até cerca de 500 miligrama por quilograma, cerca de 100 micrograma por quilograma até cerca de 5 miligrama por quilograma, ou cerca de 1 micrograma por quilograma até cerca de 50 micrograma por quilograma. Entender-se-á ainda que as doses apropriadas de uma molécula pequena dependem da potência da molécula pequena em relação à expressão ou actividade a ser modulada. Quando são administradas a um animal (por exemplo, um ser humano) uma ou mais destas moléculas pequenas para modular a expressão ou actividade de um polipéptido ou ácido nucleico da invenção, o médico, veterinário ou investigador pode, por exemplo, prescrever inicialmente uma dose relativamente pequena e em seguida aumentar a dose até obter uma resposta apropriada. Além disso, entender-se-á que o nivel de dosagem especifico para qualquer animal em particular dependerá de uma diversidade de factores incluindo a actividade do composto especifico empregue, a idade, peso corporal, saúde geral, género e alimentação do indivíduo, do tempo de administração, da via de administração, da velocidade de excreção, qualquer 118 associação de fármaco e do grau de expressão ou actividade a ser modulada.
Um anticorpo (ou fragmento deste) pode ser conjugado com uma unidade terapêutica tal como uma citotoxina, um agente terapêutico ou um metal de ião radioactivo. Uma citotoxina ou agente citotóxico inclui qualquer agente que é prejudicial para as células. Os exemplos incluem taxol, citocalasina B, gramicidina D, brometo de etidio, emetina, mitomicina, etoposide, tenoposide, vincristina, vinblastina, colchicina, doxorrubicina, daunorrubicina, di-hidroxi-antracin-diona, mitoxantrona, mitramicina, actinomicina D, 1-desidrotestosterona, glucocorticóides, procaina, tetracaina, lidocaina, propranolol e puromicina e análogos ou homólogos destes. Os agentes terapêuticos incluem, mas não se limitam a, antimetabolitos (por exemplo, metotrexato, 6-mercaptopurina, 6-tioguanina, citarabina, 5-fluorouracil decarbazina), agentes alquilantes (por exemplo, mecloretamina, tioepa clorambucil, melfalan, carmustina (BSNU) e lomustina (CCNU), ciclotosfamida, bussulfan, dibromomanitol, estreptozotocina, mitomicina C e cis-diclorodiamina platina(II) (DDP) cisplatina), antraciclinas (por exemplo, daunorrubicina (anteriormente daunomicina) e doxorrubicina), antibióticos (por exemplo, dactinomicina (anteriormente actinomicina), bleomicina, mitramicina e antramicina (AMC)) e ahentes antimitóticos (por exemplo, vincristina e vinblastina).
Os conjugados da invenção podem ser utilizados para modificar uma dada resposta biológica e a unidade de fármaco não é para ser interpretada como estando restringida aos agentes terapêuticos químicos clássicos. 119
Por exemplo, a unidade de fármaco pode ser uma proteína ou polipéptido possuindo uma actividade biológica desejada. Tais proteínas podem incluir, por exemplo, uma toxina tal como abrina, ricina A, gelonina, exotoxina de pseudomonas ou toxina da difteria; uma proteína tal como o factor de necrose tumoral, interferão alfa, interferão beta, factor de crescimento de células nervosas, factor de crescimento derivado de plaquetas, activador plasminogénio de tecido; ou, modificadores da resposta biológica tais como, por exemplo, linfocinas, interleucinas-1, -2 e -6, factor estimulador de colónias de macrófagos granulócitos, factor estimulador de colónias de granulócitos ou outros factores de crescimento.
Alternativamente, um anticorpo pode ser conjugado com um segundo anticorpo para formar um anticorpo heteroconjugado como descrito por Segai na Patente U.S. número 4 676 980.
As moléculas de ácido nucleico da invenção podem ser inseridas em vectores e utilizadas como vectores de terapia de genes. Os vectores de terapia de genes podem ser administrados a um indivíduo, por exemplo, por injecção intravenosa, administração local (ver Patente U.S. número 5 328 470) ou por injecção estereotáctica (por exemplo, Chen et al., 1994, Proc. Natl. Acad. Sei. USA 91:3054-3057). A preparação terapêutica do vector de terapia de genes pode incluir o vector de terapia de genes num diluente aceitável, ou pode compreender uma matriz de libertação lenta na qual está embebido o veículo de administração de genes. Alternativamente, nos casos em que o vector de administração de genes completo pode ser produzido intacto a partir de células recombinantes, por 120 exemplo, vectores retrovirais, a preparação farmacêutica pode incluir uma ou mais células que produzem o sistema de administração do gene.
As composições farmacêuticas podem ser incluídas num recipiente, embalagem ou dispensador conjuntamente com instruções para administração. Métodos de Tratamento A presente invenção proporciona métodos de tratamento profiláctico e terapêutico para tratar um indivíduo em risco de (ou susceptível) a um distúrbio ou possuindo um distúrbio associado à expressão ou actividade aberrante ou indesejada da 13245. No que se refere aos métodos de tratamento profiláctico e terapêutico, tais tratamentos podem ser ajustados ou modificados especificamente, com base no conhecimento obtido na área da farmacogenómica. "Farmacogenómica," como aqui utilizada, refere-se à aplicação de tecnologias genómicas tais como sequenciação de genes, genética estatística e análise da expressão de genes para fármacos em desenvolvimento clínico e no mercado. Mais especificamente, o termo refere-se ao estudo de como os genes do doente determinam a sua resposta ao fármaco (por exemplo, um "fenótipo de resposta ao fármaco," ou "genótipo de resposta ao fármaco" do doente.) Assim, noutro aspecto a invenção proporciona métodos para ajustar o tratamento profiláctico ou terapêutico de um indivíduo com as moléculas de 13245 da presente invenção ou os moduladores da 13245 de acordo com o genótipo individual de resposta ao fármaco. A farmacogenómica permite ao clínico ou médico ajustar os tratamentos profilácticos ou terapêuticos aos doentes que beneficiarão o máximo do 121 tratamento e para evitar o tratamento de doentes que sentirão efeitos secundários tóxicos relacionados com o fármaco. 0 tratamento é definido como a aplicação ou administração de um agente terapêutico a um doente, ou a aplicação ou administração de um agente terapêutico a um tecido ou linha celular isolado de um doente, que tem uma doença, um sintoma de doença ou uma predisposição para uma doença, com o propósito de curar, sarar, aliviar, atenuar, alterar, remediar, melhorar ou afectar a doença, os sintomas da doença ou a predisposição para a doença.
Um agente terapêutico inclui, mas não se limita a, moléculas pequenas, péptidos, anticorpos, ribozimas e oligonucleótidos antimensageiros.
Num aspecto, a invenção proporciona um método para prevenir uma doença ou patologia num indivíduo associada a uma expressão ou actividade aberrante ou indesejada da 13245, administrando ao indivíduo a 13245 ou um agente que modula a expressão da 13245, ou pelo menos uma actividade da 13245. Os indivíduos em risco de uma doença que é provocada ou facilitada pela expressão ou actividade aberrante ou indesejada da 13245 podem ser identificados, por exemplo, por qualquer um ou por uma combinação de ensaios de diagnóstico ou prognóstico como aqui descritos. A administração de um agente profiláctico pode ocorrer antes da manifestação dos sintomas característicos da aberração da 13245, de modo a que a doença ou distúrbio é prevenida ou, alternativamente, retardada na sua progressão. Dependendo do tipo de aberração da 13245 pode utilizar-se, por exemplo, uma proteína 13245, um agonista 122 da 13245 ou um antagonista da 13245 para tratar o indivíduo. 0 agente apropriado pode ser determinado com base nos ensaios de rastreio aqui descritos. É possível que alguns distúrbios da 13245 possam ser provocados, pelo menos em parte, por um nível anormal de produto génico, ou pela presença de um produto génico com actividade anormal. Como tal, a redução do nível e/ou actividade de tais produtos génicos provocariam o melhoramento dos sintomas do distúrbio.
Como discutido, o tratamento com sucesso de distúrbios da 13245 pode ser efectuado por técnicas que servem para inibir a expressão ou actividade de produtos génicos alvo. Por exemplo, compostos, por exemplo, um agente identificado utilizando um ensaio descrito acima, que demonstre possuir actividade moduladora negativa, pode ser utilizado de acordo com a invenção para prevenir e/ou melhorar os sintomas de distúrbios da 13245. Tais moléculas podem incluir, mas não se limitam a péptidos, fosfopéptidos, moléculas orgânicas ou inorgânicas pequenas ou anticorpos (incluindo, por exemplo, policlonais, monoclonais, humanizados, anti-idiotípicos, quiméricos ou anticorpos de cadeia simples, e os fragmentos Fab, F(ab)2 e Fab de bibliotecas de expressão, moléculas scFV, e seus fragmentos de ligação a determinantes antigénicos).
Além disso, as moléculas antimensageiras e ribozimas que inibem a expressão do gene alvo também podem ser utilizadas de acordo com a invenção para reduzir o nível de expressão de genes alvo, reduzindo assim eficazmente o nível de actividade do gene alvo. Além do mais pode utilizar-se moléculas de hélice tripla para reduzir o nível 123 de actividade do gene alvo. As moléculas antimensageiras, ribozimas e hélices triplas foram discutidas acima. É possivel que a utilização de moléculas antimensageiras, ribozimas e/ou hélices triplas para reduzir ou inibir a expressão de genes mutantes também possa reduzir ou inibir a transcrição (hélice tripla) e/ou tradução (antimensageira, ribozima) de ARNm produzido por alelos normais do gene alvo, pelo que a concentração do produto génico alvo normal presente pode ser menor do que a necessária para um fenótipo normal. Nestes casos pode introduzir-se moléculas de ácido nucleico que codificam e expressam os polipéptidos do gene alvo exibindo actividade normal do gene alvo nas células via um método de terapia de genes. Alternativamente, em casos em que o gene alvo codifica uma proteina extracelular pode ser preferido co-administrar proteina normal do gene alvo na célula ou tecido para manter o nivel necessário de actividade celular ou tecidular do gene alvo.
Outro método pelo qual se pode utilizar as moléculas de ácido nucleico no tratamento ou prevenção de uma doença caracterizada pela expressão da 13245 é através da utilização de moléculas aptaméricas especificas para a proteina 13245. Os aptameros são moléculas de ácido nucleico possuindo uma estrutura terciária que lhes permite ligarem-se especificamente aos ligandos da proteina (por exemplo, Osborne et al., 1997, Curr. Opin. Chem. Biol. 1:5-9; Patel, 1997, Curr. Opin. Chem. Biol. 1:32-46). Uma vez que as moléculas de ácido nucleico podem, em muitos casos, ser mais convenientemente introduzidas em células alvo do que moléculas de proteina terapêuticas, os aptameros oferecem um método através do qual a actividade da proteina 124 13245 pode ser diminuída especificamente sem a introdução de fármacos ou outras moléculas que podem ter efeitos pluripotentes.
Podem ser gerados anticorpos que são específicos para o produto génico alvo e que reduzem a actividade do produto génico alvo. Estes anticorpos podem, assim, ser administrados em casos em que as técnicas moduladoras negativas são apropriadas para o tratamento de distúrbios da 13245.
Em circunstâncias em que a injecção de um animal ou um indivíduo humano com uma proteína 13245 ou determinante antigénico para estimular a produção de anticorpo é prejudicial para o indivíduo, é possível gerar uma resposta imunológica contra a 13245 através da utilização de anticorpos anti-idiotípicos (por exemplo, Herlyn, 1999, Ann. Med. 31:66-78; Bhattacharya-Chatterjee et al., 1998, Câncer Treat. Res. 94:51-68). Se um anticorpo anti-idiotípico for introduzido num indivíduo mamífero ou humano, ele deveria estimular a produção de anticorpos anti-anti-idiotípicos, que deveriam ser específicos para a proteína 13245. As vacinas para uma doença caracterizada pela expressão da 13245 também podem ser produzidas deste modo.
Nos casos em que o antigénio alvo é intracelular e são utilizados anticorpos inteiros, podem ser preferidos anticorpos de internalização. Pode utilizar-se lipofectina ou lipossomas para administrar o anticorpo ou um fragmento da região Fab que se liga ao antigénio alvo às células. Nos casos em que se utilizam fragmentos do anticorpo é preferido o fragmento inibidor mais pequeno que se liga ao 125 antigénio alvo. Por exemplo pode utilizar-se péptidos possuindo uma sequência de aminoácidos correspondente à região Fv do anticorpo. Alternativamente, também podem ser administrados anticorpos neutralizantes de cadeia simples que se ligam a antigénios intracelulares alvo. Estes anticorpos de cadeia simples podem ser administrados, por exemplo, expressando sequências de nucleótidos que codificam os anticorpos de cadeia simples na população da célula alvo (por exemplo, Marasco et ai., 1993, Proc. Natl. Acad. Sei. USA 90:7889-7893).
Os compostos identificados que inibem a expressão, síntese e/ou actividade de genes alvo podem ser administrados a um doente em doses terapeuticamente eficazes para prevenir, tratar ou melhorar distúrbios da 13245. Uma dose terapeuticamente eficaz refere-se à quantidade do composto que é suficiente para originar melhoramento dos sintoma do distúrbios. A toxicidade e eficácia terapêutica de tais compostos podem ser determinadas por procedimentos farmacêuticos correntes em culturas de células ou animais experimentais, por exemplo, para determinar a LD50 (a dose letal para 50% da população) e a ED50 (a dose terapeuticamente eficaz em 50% da população) . A relação de dose entre os efeitos tóxico e terapêutico é o índice terapêutico e ele pode ser exprimido como a relação LD50/ED50. São preferidos compostos que exibem índices terapêuticos elevados. Embora os compostos que exibem efeitos secundários possam ser utilizados deverão ser tomadas as precauções necessárias para conceber um sistema de administração que oriente tais compostos para o sítio do tecido afectado para minimizar a 126 lesão potencial em células não infectadas e, desse modo, reduzir os efeitos secundários.
Os dados obtidos a partir de ensaios de culturas de células e estudos animais podem ser utilizados na formulação de uma gama de dosagem para utilização em seres humanos. A dosagem de tais compostos situa-se preferencialmente dentro de uma gama de concentrações em circulação que incluem a ED50 com pouca ou nenhuma toxicidade. A dosagem pode variar dentro desta gama dependendo da forma de dosagem empregue e da via de administração utilizada. Para qualquer composto utilizado no método da invenção, a dose terapeuticamente eficaz pode ser inicialmente estimada a partir de ensaios em cultura de células. Uma dose pode ser formulada em modelos animais para atingir uma gama de concentração em circulação no soro que inclui a IC50 (isto é, a concentração do composto de ensaio que atinge metade da inibição máxima dos sintomas) como determinado na cultura de células. Esta informação pode ser utilizada para se determinar de modo mais exacto doses úteis em seres humanos. Os níveis no soro podem ser medidos, por exemplo, por cromatografia líquida de alta eficiência.
Outro exemplo de determinação da dose eficaz para um indivíduo é a capacidade para analisar directamente os niveis de composto "livre" e "ligado" no plasma do indivíduo de ensaio. Estes ensaios podem utilizar anticorpos miméticos e/ou "biossensores" que foram criados por técnicas de impressão molecular técnicas. 0 composto que é capaz de modular a actividade da 13245 é utilizado como um molde, ou "molécula de impressão," para organizar espacialmente monómeros polimerizáveis antes da sua 127 polimerização com reagentes catalíticos. A remoção subsequente da molécula impressa deixa uma matriz polimérica que contém uma "imagem negativa" repetida do composto e é capaz de religar selectivamente a molécula nas condições de ensaio biológico. Na técnica existem artigos de revisão detalhados desta técnica (Ansell et al., 1996, Curr. Opin. Biotechnol. 7:89-94; Shea, 1994, Trends Polimer Sei. 2:166-173). Estas matrizes de afinidade "impressas" são adequadas para ensaios de ligação de ligando, de acordo com os quais o componente anticorpo monoclonal imobilizado é substituído por uma matriz adequadamente impressa (por exemplo, uma matriz descrita em Vlatakis et al., 1993, Nature 361:645-647. Através da utilização de marcação isotópica pode seguir-se facilmente a concentração de composto "livre" que modula a expressão ou actividade da 13245 e utilizar-se em cálculos da IC50.
Estas matrizes de afinidade "impressas" também podem ser concebidas para incluir grupos fluorescentes cujas propriedades emissoras de fotões alteram-se de modo mensurável após ligação local e selectiva do composto alvo. Estas alterações podem ser facilmente analisadas em tempo real utilizando dispositivos apropriados de fibra óptica, permitindo por sua vez a optimização rápida da dose num indivíduo de ensaio com base na sua IC50 individual. Um exemplo rudimentar de um tal "biossensor" é discutido em Kriz et al. (1995, Anal. Chem. 67:2142-2144).
Outro aspecto da invenção relaciona-se com métodos para modular a expressão ou actividade da 13245 para efeitos terapêuticos. Assim sendo, numa forma de realização ilustrativa, o método modulador da invenção envolve o contacto de uma célula com uma 13245 ou um agente que 128 modula uma ou mais das actividades da actividade da proteína 13245 associada à célula. Um agente que modula a actividade da proteína 13245 pode ser um agente como aqui descrito, tal como um ácido nucleico ou uma proteína, uma molécula alvo natura de uma proteína 13245 (por exemplo, um substrato ou receptor da 13245), um anticorpo da 13245, um agonista ou antagonista da 13245, um mimético de péptido de um agonista ou antagonista da 13245, ou outra molécula pequena.
Numa forma de realização, o agente estimula uma ou mais actividades da 13245. Exemplos de tais agentes estimuladores incluem a proteína 13245 activa e uma molécula de ácido nucleico que codifica a 13245. Noutra forma de realização, o agente inibe uma ou mais actividades da 13245. Exemplos de tais agentes inibidores incluem moléculas antimensageiras de ácido nucleico da 13245, anticorpos anti-13245 e inibidores da 13245. Estes métodos moduladores podem ser realizados in vitro (por exemplo, cultivando a célula com o agente) ou, alternativamente, in vivo (por exemplo, administrando o agente a um indivíduo). Como tal, a presente invenção proporciona métodos de tratamento de um indivíduo que sofre de uma doença ou distúrbio caracterizado pela expressão ou actividade aberrante ou indesejada de uma proteína 13245 ou molécula de ácido nucleico. Numa forma de realização, o método envolve administrar um agente (por exemplo, um agente identificado por um ensaio de rastreio aqui descrito), ou associação de agentes que modulam (por exemplo, regula positivamente ou regula negativamente) a expressão ou actividade da 13245. Noutra forma de realização, o método envolve administrar uma proteína 13245 ou molécula de ácido 129 nucleico como terapia para compensar a expressão ou actividade reduzida, aberrante ou indesejada da 13245. A estimulação da actividade da 13245 é desejável em situações nas quais a 13245 está regulada negativamente de modo anormal e/ou nas quais o aumento da actividade da 13245 terá provavelmente um efeito benéfico. Por exemplo, a estimulação da actividade da 13245 é desejável em situações nas quais a 13245 está regulada negativamente e/ou nas quais o aumento da actividade da 13245 terá provavelmente um efeito benéfico. Do mesmo modo, a inibição da actividade da 13245 é desejável em situações nas quais a 13245 está regulada positivamente de modo anormal e/ou nas quais um diminuição na actividade da 13245 terá provavelmente um efeito benéfico.
Farmacogenómica
As moléculas de 13245 da presente invenção, assim como os agentes, ou moduladores que têm um efeito estimulador ou inibidor na actividade da 13245 (por exemplo, expressão do gene da 13245) como identificados por um ensaio de rastreio aqui descrito podem ser administrados a indivíduos para tratar (profiláctica ou terapeuticamente) distúrbios associados à 13245 associados à actividade aberrante ou indesejada da 13245 (por exemplo, distúrbios associado à tumorigénese ou indução de uma resposta imunológica inapropriada). Em conjunção com esse tratamento pode ter-se em consideração a farmacogenómica (isto é, o estudo da relação entre o genótipo de um indivíduo e a resposta desse indivíduo a um composto exógeno ou fármaco). Diferenças no metabolismo de agentes terapêuticos pode levar a toxicidade grave ou falha terapêutica alterando a relação entre a dose 130 e a concentração no sangue do fármaco farmacologicamente activo. Assim, um médico ou clinico pode considerar a aplicação do conhecimento obtido em estudos de farmacogenómica relevantes para determinar se administrar uma molécula de 13245 ou um modulador da 13245 assim como para ajustar a dosagem e/ou regímen terapêutico de tratamento com uma molécula de 13245 ou modulador da 13245. A farmacogenómica lida com variações hereditárias clinicamente significativas na reposta aos fármacos devido a uma disposição alterada do fármaco e a uma acção anormal em pessoas afectadas (por exemplo, Eichelbaum et al., 1996, Clin. Exp. Pharmacol. Physiol. 23:983-985; Linder et al., 1997, Clin. Chem. 43:254-266). Em geral podem ser diferenciados dois tipos de condições farmacogenéticas. As condições genéticas transmitidas como um factor único alterando o modo como os fármacos actuam no organismo (acção alterada do fármaco) ou condições genéticas transmitidas como factores únicos que alteram o modo como o organismo actua nos fármacos (metabolismo alterado do fármaco). Estas condições farmacogenéticas podem ocorrer como efeitos genéticos raros ou como polimorfismos naturais. Por exemplo, a deficiência de glucose-6-fosfato desidrogenase (G6PD) é uma enzimopatia hereditária comum na qual a complicação clínica principal é a hemólise após ingestão de fármacos oxidantes (anti-maláricos, sulfonamidas, analgésicos, nitrofuranos) e consumo de fava.
Uma abordagem farmacogenómica para identificar genes que permitem prever a resposta ao fármaco, conhecida como "uma associação ao genoma," assenta fundamentalmente num mapa de alta resolução do genoma humano consistindo de marcadores relacionados com genes já conhecidos (por 131 exemplo, um mapa de marcador de gene "bi-alélico" o qual consiste de 60 000-100 000 sítios polimórficos ou variáveis no genoma humano, cada um dos quais tem duas variantes). Um tal mapa genético de alta resolução pode ser comparado com um mapa do genoma de cada um de um número estatisticamente significativo de doentes que tomam parte na Fase II/III de um ensaio cínico de fármaco para identificar marcadores associados à resposta ou efeito secundário particular observado. Alternativamente, um tal mapa de alta resolução pode ser gerado a partir da combinação de cerca de dez milhões de polimorfismos de nucleótido único conhecidos (SNPs) no genoma humano. Como aqui utilizado, um "SNP" é uma alteração comum que ocorre numa base de um nucleótido numa extensão de ADN. Por exemplo, pode ocorrer um SNP uma vez em cada 1000 bases de ADN. Um SNP pode estar envolvido num processo patológico, no entanto, a grande maioria pode não estar associado a doença. Fornecido um mapa genético com base na ocorrência de tais SNPs, os indivíduos podem ser agrupados em categorias genéticas dependendo de um padrão específico de SNPs no sei genoma individual. Deste modo, os regímenes de tratamento podem ser ajustados a grupos de indivíduos geneticamente semelhantes, tendo em consideração traços que podem ser comuns entre estes indivíduos geneticamente semelhantes.
Alternativamente, pode utilizar-se um método designado de "abordagem do gene candidato" para identificar genes que permitem prever a resposta ao fármaco. Segundo este método, se for conhecido o gene que codifica um alvo do fármaco (por exemplo, uma proteína 13245 da presente invenção), todas a variantes comuns desse gene podem ser facilmente identificadas na população e pode determinar-se se ter uma 132 versão do gene relativamente a outra está associado à resposta específica ao fármaco.
Alternativamente pode utilizar-se um método designado "perfil de expressão de genes," para identificar genes que permitem prever a resposta ao fármaco. Por exemplo, a expressão de genes de um animal medicado com um fármaco (por exemplo, uma molécula de 13245 ou modulador da 13245 da presente invenção) pode dar uma indicação se foram ligados percursos genéticos relacionados com a toxicidade. A informação gerada a partir de mais do que uma das abordagens farmacogenómicas acima pode ser utilizada para determinar regímenes de dosagem e tratamento apropriados para o tratamento profiláctico ou terapêutico de um indivíduo. Este conhecimento, quando aplicado ao doseamento ou selecção do fármaco, pode evitar reacções adversas ou falhas terapêuticas e assim aumentar a eficiência terapêutica ou profiláctica quando se está a tratar um indivíduo com uma molécula de 13245 ou um modulador da 13245, tal como um modulador identificado por um dos ensaios de rastreio ilustrativos aqui descritos. A presente invenção proporciona ainda métodos para identificar novos agentes, ou combinações, que se baseiam na identificação de agentes que modulam a actividade de um ou mais dos produtos génicos codificados por um ou mais dos genes da 13245 da presente invenção, em que estes produtos podem estar associados à resistência das células para um agente terapêutico. Especificamente, a actividade das proteínas codificadas pelos genes da 13245 da presente invenção pode ser utilizada como uma base para identificar agentes para ultrapassar a resistência ao agente. Ao 133 bloquear a actividade de uma ou mais das proteínas de resistência, as células alvo, por exemplo, as células do sistema imunológico, tornar-se-ão sensíveis ao tratamento com um agente ao qual as células alvo não modificadas eram resistentes. A monitorização da influência dos agentes (por exemplo, fármacos) na expressão ou actividade de uma proteína 13245 pode ser aplicada em ensaios clínicos. Por exemplo, a eficácia de um agente determinado por um ensaio de rastreio como aqui descrito para aumentar a expressão do gene da 13245, os níveis de proteína ou regular positivamente a actividade da 13245, pode ser monitorizada em ensaios clínicos de indivíduos apresentando uma expressão diminuída do gene da 13245, níveis de proteína baixos ou uma actividade regulada negativamente da 13245. Alternativamente, a eficácia de um agente determinado por um ensaio de rastreio para diminuir a expressão do gene da 13245, os níveis de proteína ou regular negativamente a actividade da 13245, pode ser monitorizada em ensaios clínicos de indivíduos apresentando uma expressão aumentada do gene da 13245, níveis de proteína elevados ou uma actividade regulada positivamente da 13245. Nestes ensaios clínicos, a expressão ou actividade de um gene da 13245, e preferencialmente, de outros genes que tenham sido implicados, por exemplo, no distúrbio associado à 13245 pode ser utilizada como uma "leitura" ou marcadores do fenótipo de um célula particular.
Outras Formas de Realização
Noutro aspecto, a invenção caracteriza, um método para analisar uma multiplicidade de sondas de captura. 0 método 134 pode ser utilizado, por exemplo, para analisar a expressão de genes. 0 método inclui: proporcionar uma matriz bidimensional possuindo uma multiplicidade de endereços, sendo cada endereço da multiplicidade opcionalmente distinguível de cada um dos outros endereços da multiplicidade, e em que cada endereço da multiplicidade possui uma sonda de captura única, por exemplo, uma sequência de ácido nucleico ou péptido; contactar a matriz com a 13245, preferencialmente purificada, ácido nucleico, preferencialmente purificado, polipéptido, preferencialmente purificado, ou anticorpo, e desse modo avaliar a multiplicidade de sondas de captura. A ligação, por exemplo, no caso de um ácido nucleico, hibridização com uma sonda de captura num endereço da multiplicidade, é detectada, por exemplo, pelo sinal gerado por uma etiqueta ligada ao ácido nucleico, polipéptido ou anticorpo de 13245.
As sondas de captura podem ser um conjunto de ácidos nucleicos de uma amostra seleccionada, por exemplo, a amostra de ácidos nucleicos derivada de um tecido ou célula de controlo ou não estimulado. 0 método pode incluir pôr em contacto o ácido nucleico, polipéptido ou anticorpo de 13245 com uma primeira matriz possuindo uma multiplicidade de sondas de captura e uma segunda matriz possuindo uma multiplicidade diferente de sondas de captura. Os resultados da hibridização podem ser comparados, por exemplo, para analisar diferenças na expressão entre uma primeira e segunda amostras. A primeira multiplicidade de sondas de captura pode ser de uma amostra de controlo, por exemplo, uma amostra, por exemplo, uma amostra de fluido biológico, 135 tecido ou célula natural, normal ou sem doença, não estimulada. A segunda multiplicidade de sondas de captura pode ser de uma amostra experimental, por exemplo, uma amostra, por exemplo, uma amostra de fluido biológico, tecido ou célula de tipo mutante, em risco de, estado patológico ou de distúrbio, ou estimulada. A multiplicidade de sondas de captura pode ser uma multiplicidade de sondas de ácido nucleico cada uma das quais hibridiza especificamente, com um alelo da 13245. Estes métodos podem ser utilizados para diagnóstico num indivíduo, por exemplo, para avaliar o risco de uma doença ou distúrbio, para avaliar a adequabilidade de um tratamento seleccionado para um indivíduo, para avaliar se um indivíduo tem uma doença ou distúrbio. A 13245 está associada à fosforilação de proteína, assim ela é útil para avaliar distúrbios relacionados com a fosforilação aberrante da proteína, tal como tumorigénese e sinalização celular inapropriada. 0 método pode ser utilizado para detectar SNPs, como descritos acima.
Noutro aspecto, a invenção caracteriza, um método para analisar uma multiplicidade de sondas. 0 método é útil, por exemplo, para analisar a expressão de genes. 0 método inclui: proporcionar uma matriz bidimensional possuindo uma multiplicidade de endereços, sendo cada endereço da multiplicidade posicionalmente distinguível de cada um dos outros endereços da multiplicidade possuindo uma sonda de captura única, por exemplo, em que as sondas de captura são de uma célula ou indivíduo que expressa a 13245 ou de uma célula ou indivíduo no qual foi induzida uma resposta 136 mediada pela 13245, por exemplo, fazendo contactar a célula com o ácido nucleico ou proteína 13245, ou administrada à célula ou indivíduo ácido nucleico ou proteína 13245; pôr em contacto a matriz com uma ou mais sondas de investigação, em que uma sonda de investigação pode ser um ácido nucleico, polipéptido ou anticorpo (o qual é preferencialmente outro que não o ácido nucleico, polipéptido ou anticorpo de 13245); proporcionar uma matriz bidimensional possuindo uma multiplicidade de endereços, sendo cada endereço da multiplicidade posicionalmente distinguível de cada um dos outros endereços da multiplicidade, e em que cada endereço da multiplicidade possui uma sonda de captura única, por exemplo, em que as sondas de captura são de uma célula ou indivíduo o qual não expressa a 13245 (ou não expressa de modo tão intenso como no caso da multiplicidade de sondas de captura positivas para a 13245) ou de uma célula ou indivíduo no qual não foi induzida uma resposta mediada pela 13245 (ou foi induzida num grau menor do que na primeira amostra); fazer contactar a matriz com uma ou mais sondas de investigação (a qual é preferencialmente outra que não o ácido nucleico, polipéptido, ou anticorpo de 13245), e desse modo avaliar a multiplicidade de sondas de captura. A ligação, por exemplo, no caso de um ácido nucleico, hibridização com uma sonda de captura num endereço da multiplicidade, é detectada, por exemplo, pelo sinal gerado por uma etiqueta ligada ao ácido nucleico, polipéptido ou anticorpo de 13245.
Noutro aspecto, a invenção caracteriza, um método para analisar uma multiplicidade de sondas ou uma amostra. 0 método é útil, por exemplo, para analisar a expressão de genes. 0 método inclui: proporcionar uma matriz 137 bidimensional possuindo uma multiplicidade de endereços, sendo cada endereço da multiplicidade posicionalmente distinguível de cada um dos outros endereços da multiplicidade possuindo uma sonda de captura única, fazer contactar a matriz com uma primeira amostra de uma célula ou indivíduo que expressa ou expressa inadequadamente a 13245 ou de uma célula ou indivíduo no qual foi induzida uma resposta mediada pela 13245, por exemplo, fazendo contactar a célula com ácido nucleico ou proteína 13245, ou administrando à célula ou indivíduo ácido nucleico ou proteína 13245; proporcionar uma matriz bidimensional possuindo uma multiplicidade de endereços, sendo cada endereço da multiplicidade posicionalmente distinguível de cada um dos outros endereços da multiplicidade, e em que cada endereço da multiplicidade possui uma sonda de captura única, e fazendo contactar a matriz com uma segunda amostra de uma célula ou indivíduo que não expressa a 13245 (ou não expressa de modo tão elevado como no caso das sondas de captura de multiplicidade positiva par a 13245) ou de uma célula ou indivíduo no qual não foi induzida uma resposta mediada pela 13245 (ou foi induzida num grau muito menor do que na primeira amostra); e comparar a ligação da primeira amostra com a ligação da segunda amostra. A ligação, por exemplo, no caso de um ácido nucleico, a hibridização com uma sonda de captura num endereço da multiplicidade, é detectada, por exemplo, pelo sinal gerado por uma etiqueta ligada ao ácido nucleico, polipéptido ou anticorpo de 13245. A mesma matriz pode ser utilizada para ambas as amostras ou pode utilizar-se matrizes diferentes. Se forem utilizadas matrizes diferentes a multiplicidade de endereços com sondas de captura deverá estar presente em ambas as matrizes. 138
Noutro aspecto, a invenção apresenta um método para analisar 13245, por exemplo, analisar a estrutura, função ou relação com outras sequências de ácido nucleico ou aminoácido. 0 método inclui: proporcionar uma sequência de ácido nucleico ou aminoácido da 13245, por exemplo, sequência de nucleótidos da 13245 ou uma parte desta; comparar a sequência da 13245 com uma ou mais, preferencialmente uma multiplicidade, de sequências de uma colecção de sequências, por exemplo, um banco de dados de sequências de ácidos nucleicos ou proteínas; para desse modo analisar a 13245. 0 método pode incluir avaliar a identidade de sequência entre uma sequência 13245 e uma sequência da base de dados. 0 método pode ser realizado acedendo à base de dados num segundo sítio, por exemplo, via internet.
Noutro aspecto, a invenção caracteriza, um conjunto de oligonucleótidos, úteis, por exemplo, para identificar SNPs, ou identificar alelos específicos da 13245. 0 conjunto inclui uma multiplicidade de oligonucleótidos, cada um dos quais tem um nucleótido diferente numa posição em investigação, por exemplo, um SNP ou o sítio de uma mutação. Numa forma de realização preferida, a multiplicidade de oligonucleótidos são idênticos uns com os outros na sequência (excepto para diferenças de comprimento). Os oligonucleótidos podem ser proporcionados com etiquetas diferentes, de modo a que um oligonucleótido que hibridiza num alelo proporciona um sinal que é distinguível de um oligonucleótido que hibridiza num segundo alelo. 139 A sequência de uma molécula de 13245 é proporcionada numa variedade de meios para facilitar a sua utilização. Uma sequência pode ser proporcionada como um produto, que não uma molécula de ácido nucleico ou aminoácido isolada, a qual contém uma 13245. Um tal produto pode proporcionar uma sequência de nucleótidos ou aminoácidos, por exemplo, uma grelha de leitura aberta, numa forma que permite o exame do produto utilizando meios que não são directamente aplicáveis para examinar as sequência de nucleótidos ou aminoácidos, ou um subconjunto destas, como elas existem na natureza ou na forma purificada.
Uma sequência de nucleótidos ou aminoácidos da 13245 pode ser registada num meio legível por computador. Como aqui utilizado, "meio legível por computador" refere-se a um meio que pode ser lido e directamente acedido por um computador. Tais meios incluem, mas não se limitam a: meios de armazenagem magnéticos, tais como disquetes, meios de armazenagem em disco duro e fita magnética; meios de armazenagem ópticos tais como CD-ROM; meios de armazenagem eléctricos tais como RAM e ROM; e híbridos destas categorias tais como meios de armazenagem magnéticos/ópticos. 0 especialista tem disponível uma diversidade de estruturas de armazenagem de dados para criar um meio legível por computador possuindo nele registado uma sequência de nucleótidos ou aminoácidos da presente invenção. A escolha da estrutura de armazenagem de dados será geralmente com base nos meios escolhidos para aceder à informação armazenada. Além disso pode utilizar-se uma diversidade de programas e formatos de processamento de dados para armazenar a informação de uma sequência de 140 nucleótidos da presente invenção em meio legível por computador. A informação de uma sequência pode ser representada num ficheiro de processamento de texto, formatado em suporte lógico comercialmente disponível tal como WordPerfect™ e Microsoft Word™, ou representada na forma de um ficheiro ASCII, armazenado numa aplicação de base de dados, tal como DB2, Sybase™, Oracle™ ou semelhantes. O especialista pode adaptar facilmente qualquer número de formatos de estruturação de dados (por exemplo, ficheiro de texto ou base de dados) para obter um meio legível em computador possuindo nele registada informação sobre uma sequência de nucleótidos da presente invenção.
Ao proporcionar as sequências de nucleótidos ou aminoácidos da invenção numa forma legível por computador, o especialista pode aceder rotineiramente a informação sobre uma sequência para uma diversidade de finalidades. Por exemplo, um especialista pode utilizar as sequências de nucleótidos ou aminoácidos da invenção na forma legível por computador para comparar uma sequência alvo ou motivo estrutural alvo com a informação da sequência armazenada nos meios de armazenagem de dados. Faz-se uma pesquisa para identificar fragmentos ou regiões das sequências da invenção que igualam uma sequência alvo ou motivo alvo particular.
Como aqui utilizado, uma "sequência alvo" pode ser qualquer sequência de ADN ou aminoácidos de seis ou mais nucleótidos ou dois ou mais aminoácidos. Um especialista pode reconhecer facilmente que quanto maior for uma sequência alvo, menor será a probabilidade com que uma sequência alvo estará presente como uma ocorrência 141 aleatória na base de dados. Os comprimentos típicos de sequência de uma sequência alvo são desde cerca de 10 até 100 aminoácidos ou desde cerca de 30 até 300 resíduos de nucleótidos. No entanto sabe-se bem que os fragmentos comercialmente importantes , tais como os fragmentos de sequência envolvidos na expressão de genes e no processamento de proteínas, podem ter um comprimento menor.
Os suportes lógicos para computador estão publicamente disponíveis o que permite que o especialista aceda a informação de sequências fornecidas num meio legível por computador para análise e comparação com outras sequências. Uma diversidade de algoritmos conhecidos estão abertos ao público e uma variedade de suportes lógicos comercialmente disponíveis para realizar pesquisas estão e podem ser utilizados nos sistemas com base em computadores da presente invenção. Exemplos de tais suportes lógicos incluem, mas não se limitam a, MacPattern (EMBL), BLASTN e BLASTX (NCBIA).
Assim, a invenção apresenta um método para fazer um registo legível por computador de uma sequência de 13245 que inclui registar uma sequência numa matriz legível por computador. Numa forma de realização preferida, o registo inclui uma ou mais das seguintes: identificação de uma grelha de leitura aberta; identificação de um domínio, região ou sítio; identificação do início da transcrição; identificação do finalizador da transcrição; a sequência de aminoácidos integral da proteína, ou de uma forma madura desta; a extremidade 5' da região traduzida; ou as regiões reguladoras 5' e/ou 3'. 142
Noutro aspecto, a invenção caracteriza, um método para analisar uma sequência. 0 método inclui: proporcionar uma sequência ou registo de 13245, em forma legível por computador; comparar uma segunda sequência com a sequência do gene nome; analisando desse modo uma sequência. A comparação pode incluir comparar com sequências para determinar a identidade de sequência ou determinar se uma sequência está incluída dentro de outra, por exemplo, determinar se a sequência 13245 inclui uma sequência que está a ser comparada. Numa forma de realização preferida, a 13245 ou a segunda sequência está armazenada num primeiro computador, por exemplo, num primeiro sítio e a comparação é efectuada, lida ou registada num segundo computador, por exemplo, num segundo sítio. Por exemplo, a 13245 ou a segunda sequência pode estar armazenada numa base de dados pública ou particular num computador, e os resultados da comparação efectuada, lidos ou registados num segundo computador. Numa forma de realização preferida o registo inclui um ou mais dos seguintes: identificação de uma ORF; identificação de um domínio, região ou sítio; identificação do início de transcrição; identificação do finalizador de transcrição; sequência de aminoácidos integral da proteína ou de uma forma madura desta; a extremidade 5' da região traduzida; ou as regiões reguladoras 5' e/ou 3'.
Esta invenção é ainda ilustrada pelos exemplos seguintes que não deverão ser interpretados como sendo restrictores. Os conteúdos de todas as referências, patentes e pedidos de patente publicados citados ao longo deste pedido são aqui incorporados por referência.
EXEMPLOS 143
Exemplo 1
Identificação e Caracterização do ADNc da 13245 humana A sequência de nucleótidos de 13245 humana (Figura 1; SEQ ID N°. 1), a qual tem aproximadamente 6575 nucleótidos de comprimento incluindo as regiões não traduzidas, contém uma sequência de codificação prevista iniciada com metionina próxima dos resíduos de nucleótidos 19-6178. A sequência de codificação codifica uma proteína com 2053 aminoácidos (SEQ ID N°. 2).
Exemplo 2
Distribuição do ARNm da 13245 no Tecido
As hibridizações por transferência de Northern com várias amostras de ARN podem ser realizadas em condições correntes e lavadas em condições rigorosas, isto é, 0,2xSSC a 65 °C. Pode utilizar-se uma sonda de adn correspondente à totalidade ou a uma fracção do ADNc da 13245 (SEQ ID N°. 1). O ADN pode, por exemplo, estar radioactivamente marcado com 32P-dCTP utilizando o estojo Prime-It™ (Stratagene, La Jolla, CA) segundo as instruções do fornecedor. Os filtros contendo ARNm de tecidos hematopoiéticos e endócrinos de ratinhos, e linhas celulares de cancro (Clontech, Paio Alto, CA) podem ser ensaiados em solução de hibridização ExpressHyb™ (Clontech) e lavados em condições rigorosas de acordo com as recomendações do fabricante.
Exemplo 3
Expressão Recombinante de 13245 e, Células Bacterianas 144
Neste exemplo, a 13245 é expressada como um polipéptido de fusão recombinante de glutationa-S- transferase (GST) em E. coli e o polipéptido de fusão é isolado e caracterizado. Especificamente, sequências de ácido nucleico 13245 são fundidas com sequência de ácido nucleico GST e esta construção de fusão é expressada em E. coli, por exemplo, estirpe PEB199. A expressão da construção de fusão GST-13245 em PEB199 é induzida com IPTG. 0 polipéptido de fusão recombinante é purificado de lisados bacterianos em bruto da estirpe PEB199 induzida por cromatografia de afinidade em esferas de glutationa. Utilizando análise electroforética em gel de poliacrilamida do polipéptido purificado dos lisados bacterianos, determina-se o peso molecular do polipéptido de fusão resultante.
Exemplo 4
Expressão de Proteina 13245 Recombinante em Células
COS
Para expressar o gene da 13245 em células COS, utiliza-se o vector pADNc/Amp da Invitrogen Corporation (San Diego, CA) . Este vector contém uma origem de replicação SV40, gene de resistência à ampicilina, uma origem de replicação de E. coli, um promotor CMV seguido de uma região poliligante e um intrão SV40 e sitio de poliadenilação. Clona-se um fragmento de ADN que codifica a proteina 13245 inteira e uma marcação HA (Wilson et al., 1984, célula 37:767) ou uma marcação FLAG® fundida na grelha à sua extremidade 3' do fragmento na região poliligantes do vector, colocando desse modo a expressão da proteina recombinante sob o controlo do promotor CMV. 145
Para construir o plasmídeo, a sequência de ADN da 13245 é amplificada por PCR utilizando dois iniciadores. 0 iniciador 5' contém o sitio de restrição de interesse seguido de aproximadamente vinte nucleótidos da sequência de codificação da 13245 começando a partir do códão de iniciação; a sequência da extremidade 3' contém sequências complementares ao outro sitio de restrição de interesse, um códão de paragem de tradução, uma marcação HA ou FLAG® e pelo menos 20 nucleótidos da sequência de codificação da 13245. O fragmento amplificado por PCR e o vector pADNc/Amp são digeridos com as enzimas de restrição apropriadas e o vector é desfosforilado utilizando a enzima CIAP (New England Biolabs, Beverly, MA) . Preferencialmente os dois sitios de restrição escolhidos são diferentes para que o gene da 13245 seja inserido na orientação desejada. A mistura de ligação é transformada em células de E. coli (pode utilizar-se estirpes HB101, DHSalpha, SURE, disponíveis de Stratagene Cloning Systems, La Jolla, CA), a cultura transformada é aplicada em placas com meio de ampicilina e as colónias resistentes são seleccionadas. Isola-se o ADN de plasmideo dos transformados e examina-se por análise de restrição para a presença do fragmento correcto.
Em seguida transf ecta-se células COS com o ADN de plasmideo de 13245-pADNc/Amp utilizando os métodos de co-precipitação com fosfato de cálcio ou cloreto de cálcio, transfecção mediada por DEAE-dextrano, lipofecção ou electroporação. Outros métodos adequados para transfectar células hospedeiras podem ser encontrados em Sambrook et al., (1989, Molecular Cloning: A Laboratory Manual. 2nd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) . A expressão do polipéptido da 13245 é 146 detectada marcando radioactivamente (pode utilizar-se 35S-metionina ou 35S-cisteína, disponível de NEN, Boston, MA) e imunoprecipitação (Harlow et al., 1988, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) utilizando um anticorpo monoclonal específico para HA. Abreviadamente, as células são marcadas durante 8 horas com 35S-metionina (ou 35S-cisteína). Os meios de cultura são depois recolhidos e as células são submetidas a lise utilizando detergentes (tampão RIPA, 150 milimolar de NaCl, 1% de NP-40, 0,1% de SDS, 0,5% de DOC, 50 milimolar Tris, pH 7,5). Tanto o lisado celular como os meios de cultura são precipitados com um anticorpo monoclonal específico para HA. Os polipéptidos precipitados são depois analisados por SDS-PAGE.
Alternativamente, clona-se ADN contendo a sequência de codificação da 13245 directamente no poliligante do vector pADNc/Amp utilizando os sítios de restrição apropriados. O plasmídeo resultante é transfectado em células COS do modo descrito acima e a expressão do polipéptido da 13245 é detectada marcando radioactivamente e imunoprecipitando utilizando um anticorpo monolonal específico para a 13245. 147
LISTAGEM DE SEQUÊNCIAS <110> KAPELZrER-LIBERMANN, Rosana MILLENIUM PHARMACEUTICALS, INC. <120> 13245, Uma nova Proteína Cinase Humana de Tipo Distrofia Miotónica e Suas Utilizações
<130> 10147-57WO <140> Ainda não atribuído <141> 2001-10-23 <150> US 20/242429 <151> 200-10-23 <16 0> 7 <170> Patentln Ver. 2.1
<210> 1 <211> 6574 <212> ADN <213> Homo Sapiens <400> 1 148 agagacgccs ggtgctgctg ccacccttfca ctctttgttc aactttgtcc aaggactt.cg agagagaaag gcccaggagc ccgtggatce gaatatcagc gaaaacetga afcgggatacg atcaagctgg aaactcccga gatggaaaag gagatgattt sttatgaatt cttgatctga tgctgccatc ttcgttccca tcgtgggttt ccgtttgtgg gtgtcgggtc agcaaagagc ttacatcgga gcetctgsga agtagcttaa gcactçcagc caggagtscc cttgtctcag gctgctgaag gatcaaggga cagefccaaãa agggagctgg gtggaagctg gagcgfcagag gtggggagat aacccatfcgc tgactcaaca fcctttgaaga çgaagtattc aagtcagaag caaccgggga aggtttcatt cccaattaca ctggagggga tacagiitta tgeatcgaga tggattttgg ttgggacccc: gcacctacgg atgggagatc tccagcggtt ttcasagctt ctttcttctç ccctcaagtc catcctctcc ggttfctcgta tggactcccc tacaagactc gagigtcaga ctcagagatc agegaagtfct ttctccatga aggcfccaagt caagaagacg sattcaagcg agcctgaagt. ttcaggagct agasgcfcgca aggaacgccg aaaacagact gfctgaagttc cagccgggcc gcagatgtct atgcagtcag cgácáccâta tcttgtaggt catctatgct ttitgaggaa gtatgccfcfct cfctgctgtca cetagctgag oatcasgcct afcctgccgcg agattacatg cctggactgt ecccttegea tttgaaattt gttgtgcggc taaaattgac tgacgatgac gtgccagctç cagcaaggca tgccaagact tcaggaceag ggfcggaggct cctcctggag ggagcaagca tatcagagag ggaagaaatg gagtgatcte gaaagcgaca gggagaahafc ccaagagaaa gaaocgagag ceafctctctg gaaggatgac aaatatggaç tccaggetga cctctttccc cctgetctga çctgagttac. tgtggtcact stgaaagtga gagcggaaca eaggacaaaa cttttgaata ctgattttgg gaga&cattc aaaatgaatfc gctcctgaag gactggtggt gagggaacct ccagatgace cagaaagaga tggaacaaca acctccaatt agcccctcag ctggggafcte agctccatgg tgfccacaagá gtgctfragtc caggaccttg cggatggagg cagagccgga aggttgatga tacgaatctg gaatgtcsgc gcgaasctgg ctggagaagg gattcttctg gagaacsagg atccagacaa cgcggaatcc atctgttcfct gagsagggat tgaagattaa aggagctcca ttgctgaagt tgaagaagsa tattatctcg atcaccttta gatatgagga ctcttcacag tcgttgaccg caaacaagafc tgctgactgt cagtgggcgt ctgcçagaac ccaaagtgag gactgaagtt ttcgtaactc ttgatgaacc gettctcggg tfcggtagatc aaaagaaact tggagcagga agaaggaggfc ctaectacat fcgfceccagga agctccaaga tgaatcagtt sgctgagaga ataeaçfcgtt sçaagatcaa ctgcaaagga aaggcafccag taaagagact aatcccaaca tttggatgct 60 ccaggggaaa 120 õttagatgcc 180 gcacgtgagc 240 gccttcggca 3Q0 gcaggtggta 360 ggctfctâttg 420 aagcacaagc 480 tctgatggag 540 ccagttagat 600 eçttcatctg 660 cacaggacaç 120 ggtgaatgcc 780 gatgaacggg G40 gatt.gcct.at 900 cttcaataac 960 cegtgacttt 1020 tgaaggtcfct 1080 tcctcccccc 1140 agagaagaat 1200 tgaagaactg 1260 tgagtctgfrt 1320 tctcatcaaa 1380 aatgacecgg 1440 ggagctgaag 1500 cacagaetgc 1560 ggstgacaaa 1620 aatcaaagag 1680 ggaagaggat 1740 gtctcggctt 1800 gasggctaag 1860 tgctgagcag 1S20 gcgagccgag 1980 asagasgctg 2040 agagaccafcg 2100 oatccagcaç 2160 149 afcggctgata caectagaag gacaatcaga cacgaggagg gctatggatt aaacttgeag ôtttctgâãc cagaaccgaa aatcggctgc aaactggage cagttgacag acagagctgg agagatgaaa ctggaggagc tacttgtcca agtgaagtgg aagcaaaega ttggaggccc gtccfcgggfcgr gacaccgaga gtggsgctgg gagcagaagc gctatgcttg aaacagaggc cacattttcc aeagaaagaa aaggtgaaaâ aaastggace gctttaccca asagctcgct gcccgggagg acçgcgaggc gccatgagçç tttagtcggc etgaacatgc gcatecaaat gccacctgcg aaaatgaact tggatgaagg gtcctggagg ccggtggaag ggtgcfctccg cfctggaaact cccttcagtg tfcgââaaact asggácctgg gtgaagaaag cccaacafcfct gggctctgca ctcagcaaat ttcaccastt tacacgctcg gcctcttcca gagtsctfcgc cgcacagacg ctgttfcgfcga gggacccctg tectcaggag aagggaaacc agcagcecca fcccagcccaç taccgcgagg asatfcctgga tgcaccfcgaa taaagaáôgiã aggcccatgs ccsagatcag eaaatagcag tcaggcaaca aactggagga iggaactgga tcaagcgcca ccctgcaggc aa.gagaccac tccagçgcaa agctaaacca àacaactcga accatcrtecg tggaggctct taaacgatga atgsgâãalc asesgagcag cagtgaagga cgáággccga aaafcgaafcgc ttcfcggaaga gtctgactca gtgaettgga tggaaggcac aacctgctaa cacaggttcc gtgcag&get aagctgcoca agcagatcgc tgctggcccc gtcttaagga gagccacaaa gtetcgaatg gcttgcctgc ecccaggtct tgcccaggaa çateaaaagt astttgagct aactcgcaaa cecfcgctgaa sccsggtggt
GcctaâCcca ggãsgctact tgaaacagfcc itgaagctgt tctgfegcagc acfcgcatccg aeagtatcct aggaabtcct acagcttecc tgtgfctfccca afccicaagtg cccactfccaâ cccgagcgta cgsctfcactt tcgtgaagga acaagcgagg cgccgcccga ggcggaccga gctcgaagag acagaaagag eçtggctgac gaagggcaaa atccctggaa fccttfettacc gaaattttac gcagctggag gacaagattg gctcacagag tgcacgggcg agcagaagct atttgatgct gctgaccgag tgaggetict ccgggsgate gaagaccacg gctgctagaa ccagtttgag ggcgagagco gcacaaggct gagcctctci ccgasgctta gcaagccaaa ãggactgeaa gtãteagctg tatttctcsa aaagaasaag tctgcaçtac agaggaagcc cegcaaagcâ catgtccgcc gccatccagc acgcafcgcac gtgfcgc-tgtg tcaggtgatg tgaatatgcc ecagaeeaag taacaaacga cctcatttat gtgcctfcccc taosgccaaa aotggaaggt gt tggtgggc tgtcccagga catgatagca cctggcccag csagggctgc catgcccagc gaaagagaba csttggaaee ggataagaat tgtctcaatc cgaatttgga gagtcgcfctã etcactcgaa cctggacatc ggcgtcefcca gtccgçcact eccacccacg sggccccagc gctgcgcagg aaacâfccggg cagcactafcg aaggagacac sttctcagcg cagaggattg caaaggaaca ctggagacac aagatcagco cgggaggtca cbacagçtcfc gcectggaga gaagaggaga cttcgtaaca gacaacgctg ggcgccaacg aeggaacgag tgcaccatgo aaagagcggc tgtcgggttc gatcagcgga gagafctctcg gscaagc-tca oagcagaagc ttacagcagc gaagctctag gaaaacattc caaaccaasc ggtttsfcfeta aatgagctga cttcagaaga açggaccacc atcgtgcggfc cgeagaaagg cacaatattc tgfcctggata tgtcacccca acacacttca gagcccagca ggacagcaag gacaatgaag gacggggatg gcagaaaaag gafcgacegte accgaggaag attggagcag ggagaagagc tcccacctgc cacttgtfctg aaagtcgtca gagacctcsg satsaattct gaccafctcct gtgcaggtga gtgttcgtgg cctttggcct gtaattgaga ccgaacccgc taccaggata gaacaccacc tacaacgagc aggcccaagt aggaaaagat tggagaacat aacagaaggc tggaactgtc tgáaggçeça aggctgggaa accaagaccâ gtctagagcã ccctgcagga gccagcttcg tccaggcact gctgtactgt aactcaacaa acgagattgt. agatgcagct tggaggaaca agtgggaggc gaaagctgca fccaccgagtc «tctgcagça atgacctgga tggag&ctga agatggacct atcgggctga aggttctcta tcattgattt gtcgacggaa agctggccct cccgcatcga cacacccatc cgccaaagca agtcttcaac ctcaccgatt ccgtgcactt agtgctceac ccgaggcctt gcagcttgea gctgggacag ccagagaagc tatctattca caçaagcfcga tagãcatgaa ggctctacgc tcttccaaat gggcactgtg ctgcccagcc gggcaggeaa ttctccgcta agccctgcag acgasatcga tggcacctgc acagcgcagg attcttacgg ttgcctacag írccaggcacg gctscetggg aafcfcaagggt gçggcccgtc acattcaccas cacccgcgag agccaagcac gaeaagfcctc ctggccgccc ctcagcccag 2220 taaagtgttg 2280 gatçcagaga 2340 gatgatcaat 2400 tgaagccaat 2460 agaagagatg 2520 gttggaggcc 2530 cagígacasg 2640 cgaggagcag 2700 çegcgagtca 2750 ccaggcgâag 2820 caoggcacat 2880 aatcaeagac 2940 ccaaaactrc 3000 acaactgcga 3060 taccagcsag 3120 ggtcatggat 3180 ctggaggagc 3240 gagaatgctg 3300 tcgcc-aggtg 3360 ggctctcaaa 3420 gaagaagcat 3480 acgagagctc 3540 gcagaaaaat 3600 tctactgaag 3660 ttctçatgaa 3720 tctgcaagcc 3780 agaggaccct 3840 ggagaaggag 3900 gctccggtcc 3960 cscgccagcc 4020 ccagcccagt 4080 tccagaggaa 4140 caacgtagça 4200 tggacgccag 4260 gtgcttgcca 4320 ctgccgtgac 4380 cetggaaggg 4440 gaagtacatt 4500 tggacagagg 4560 tggtgccgtt 4620 tgctaaactg 4680 ctgcaegctg 4740 ectgaatgtc 4800 ttatattetc 486G tcttgtggac 4920 cgacatctca 4960 gattgagaac 5040 caacgaaaac 5100 etgfcatccac 5160 çatgaagcag 5220 tgtgtttgcc 5280 gcagcgagag 5340 aagacgtagc 5400 agaaccetât 5460 ctccfccagca 5520 ccctgccatt 55SG cafcttgctge 5640 cacctcccgc 5700 gegegtggee 5760 accccaccgc 5820 cctggagcga 3850 150 gagaagtccc gaagacagca aacaagggaa gactggaafcâ ctgaatggag gcagagtfcea cagccaectc aaccfccatct gagagacaat tagccaggee atgtgtggec fctggcttaag ccggccggat gcsggggccg gaçggcagag aaaagctgga aaatccggca tgtgacfctci tgcfctacaaa agaaatcaga ctgttgttga tcaaeaggga tcagtccctg aaaaatcgag gctcagcacg gctgectgcg tgccfcctcaa caacctgcca gcaggttgaa agacgtgçtg aagagtactt aagcttctaa ttttgaagga caagtggctg tttcccagaa aahgtaggtt cggagagagc ggagccgigs gttttcacgg çctaactggt aagtctgtfce acttaaâaaa agtgeacstg tfctcfcataga cagacaagac gccfctaaaaa ttttactggc fcaga ggtcccccgg ggaeeeegcfc ttaacactgt cagtcctgag tgagaacaga tggccttaag actgtaagaa aatgacacct caacactgta cacacagatg aaaggagtta gaggctgttt 5940 gtcccaggtg 6000 cacctattat 6060 gafceatccag 6120 ttattgctga 6180 gctgcagagc 6240 acaattgfcaa 6300 ccctggagcc 6360 tttagttcca 6420 actggaaatg 6480 geafcicafctt 6540 6574
<210> 2 <211> 2053 <212> PRT <213> Homo Sapiens <400> 2 Met Leu Lys Fhe Lys Tyr Gly Ala Arg Asn Pro Leu Asp Ala Gly Ala 1 5 10 15 Ala Glu Pro Ile Ala Ser ftrg Ala Ser Arg Leu Asn Leu Phe Phe Gin 20 25 30 Gly Lys Pro Pro Phe tíet Thr Gin Gin Gin Met Ser Pro Leu Ser Arg 35 40 45 Glu Gly Ile Leu Asp Ala Leu Phe Val Leu Phe Glu Glu Cys Ser Gin 50 55 60 Pro Ala Leu Mefc Lys Ile Lys His Val Ser Asn Phe Val Arg Lys Tyr 65 70 75 80 Ser Asp Thr lie Ala Glu Leu Gin Glu Leu G.ln Pro Ser Ala Lys Asp 85 90 95 Phe Glu Val Arg Ser Leu val Gly Cys Gly His phe Ala Glu Val Gin 100 105 110 Val Val Arg Glu Lys Ala Thr Gly Asp Ile Tyr Ala Met &ys Val Met 115 120 125 Lys Lys Lys Ala Leu Leu Ala Gin Glu Gin Val Ser Phe Phe Glu Glu 130 135 140 Glu Arg Asn lie Leu Ser Arg Ser Thr Ser Pro Trp lie Pro Gin Leu 145 150 155 150 Gin Tyr Ala Phe Gin Asp Lys Asn His Leu Tyr Leu Met Glu Glu Tyr 165 170 175 Gin Fro Gly Gly Asp Leu Leu Ser Leu Leu Asn Arg Tyr Glu Asp Gin 180 185 190 Leu Asp Glu Asn Leu Ile GXn Phe Tyr Leu Ala Glu Leu Ile Leu Ais 195 200 205 Val His Ser Val His Leu Met Gly Tyr Val His Arg Asp lie Lys Pro 210 215 220 151
Glu P-.sn Xle Leu Vai Asp Arg Thr Giy His Ile Lys Leu Vai Asp Phe 225 230 235 240 Gly Ser Ala Ala Lys Met Asn Ser Asn lys Met val iH3 ΓΪ Ala Lys Lê ti 24 5 250 255 Pro Ile Gly Thr Pro Asp Tyr Mei Ala Pro Glu Vai Leu Thr Vai Met 260 265 270 Asn Gly Asp Gly Lys Gly Thr Tyr Gly Leu Asp Cys Aso Trp Trp Ser 275 280 285 Vai Gly Vai n« Ala Tyr Glu Met Ile Tyr Gly Arg Ser Pro Phe Ala 230 295 300 Glu Gly Thr Ser Ala Are Thr Phe Asn Asn Ile Met Asn Phe Gin Arg 305 310 315 320 Pbe Leu Lys Phe Pro Asp Asp Pro Lys vai Ser Ser Asp Phe Leu Asp 325 330 335 Leu Ile Glri Ser Leu Leu Cys Sly Gin Lys Glu Arg Leu Lys Phe Glu 340 345 350 Gly Leu Cys Cys His Pro Phe Phe Ser Lys Ue Asp Trp Asn Asn Ile 355 360 365 Arg Asn Ser Pro Pro Prc Phe Vai Pro Thr Leu Lys Ser Asp Asp Asp 3 TO 375 390 thx Ser Asn The Asp Glu Pro Glu Lys Asn Ser Trp Vai Ser Ser Ser 385 390 395 400 Pro Cys Gin LéU Ser Pro Ser Gly Phe Ser Gly Glu Glu Leu Pro Phe 405 420 415 Vai Gly Phe Ser Tyr Ser Lys Ala Leu Gly íle Leu Gly Arg Ser Glu 420 425 430 Ser Vai Vai Ser Gly Leu Asp Ser Pro Ala Lys Thr Ser Ser Met Glu 435 140 445 Lys Lys Leu Leu Ile Lys Ser Lys Glu Leu Gin ASp Ser Gin Asp Lys 4 50 455 4 60 Cys His Lys Met Glu Gin Glu Me t Thr Arg Leu His Arg Arg Vai Ser 465 470 475 480 Glu Vai Glu Ala Vai Leu Ser Gin Lys Giu Vai Glu Leu Lys Ala Ser 405 430 495 Glu Thr Gin Arg Ser Leu Leu Giu Gin Asp Leu Ala Thr Tyr· Ile Thr 500 505 510 Glu Cys Ser Ser Leu Lys Arg Ser Leu Glu Gin Ala Arg Met Glu Vai 515 520 525 Ser Gin Glu Asp Asp Lys Ala Leu Gin Leu Leu His Asp Ile Arg Glu 530 335 540 eia Ser Arg Lys Leu Gin Glu Ile Lys Glu Gin Gl« Tyr Gin Ala Gin 545 550 555 560 152
Vai Sl» Glu Met Arg Leu Met Met Asn Gin Leu Glu Glu Asp Leu Vai 565 570 5-75
Ser Ala Arg Arg Arg Ser Asp Leu Tyr Glu Ser Glu Leu Arg Glu Ser 580 585 530
Arg Leu Ala Ala Glu Glu Phe Lys Arg Lys Ala Thr Glu Cys Gin His 595 600 605
Lys Leu Leu Lys Ala Lys Asp Gin Gly Lys Pro Glu Vai Gly Glu Tyr 610 615 620
Ala Lys Leu Glu Lys lie Asm Ala Glu Gin Gin Leu Lys Ile Gin Glu 625 630 635 640
Leu Gin Glu Lys Leu Glu Lys Ala Ala Lys Glu Arg Ala Glu Arg Glu 645 650 $S5
Leu Gly Lys Leu Gin Asn Arg Glu Asp Ser Ser Glu Gly lie Arg Lys 6S0 665 670
Lys Leu Vai Glu Ala Glu Glu Arg Arg His Ser Leu Glu Asn Lys Vai 675 680 685
Lys Arg Leu Glu Thr Met Glu Arg Arg Glu Asn Arg Leu Lys Asp Asp 690 695 700 lie Gin Thr Lys Ser Gin Gin lie Gin Gin Met Ala Asp Lys Ile Leu 705 710 7.15 720
Glu Leu Glu Glu Lys His Arg Glu Ala Gin Vai Ser Ala Gin Kís Leu 725 730 735
Glu Vsl His Leu Lys Gin Lys Glu Gin His Tyr Glu Glu Lys Ile Lys 740 745 750
Vai Leu Asp Asn Gin Ile Lys Lys Asp Leu Ala Asp Lys Glu Thr Leu 755 760 765
Glu Asn Met Met Gin Arg His Glu Glu Glu Ala His Glu Lys Gly Lys 770 ‘ 776 ?80 lie Leu Ser Glu Gin Lys Ala Met 785 790 Arg Ser Leu Glu Gin .Arg Ile Vai 805 Ala Ais Asn Ser Ser Leu Phe Thr 820 Glu Met Ile Ser Glu Leu Arg Gin 335 840 Ala Gly Lys Leu Glu Ala Gin Asn 850 855
He Asn Ala Met Asp Ser Lys Ile 7:53 800 Glu Leu Ser Glu Ala Asn Lys Leu 810 815 Gin Arg Asn Met Lys Ala Gin Glu B25 830 Gin Lys Phe Tyr Leu Glu Thr Gin 845 Arg Lys Leu Glu Glu. Gin Leu Glu 860
Lys Ile Ser His Gin Asp His Ser Asp Lys Asn Arg Leu Leu Glu Leu 865 870 675 $80
Glu Thr Arg Léu Arg Glu Vai Ser Leu Glu His Glu Glu Gin Lys Lsu 153 885 890 895 Lys Arg Gin Leu Thr Glu Leu Gin Leu Ser LêU Gin Glu Arg 900 905 910 Glu Ser Gin Leu Thr Ala Leu Gin Ala Ala Arg Ala Ala Leu Glu Ser 915 920 925 Sln leu Arg Gin Ala Lys Thr Glu Leu Glu Glu Thr Thr Aia Glu Ala 930 935 940 Glu Glu Glu He Cin Ala Leu Thr Ala His Arq Asp Glu Ile Gin Arg 945 950 955 960 Lys Pha Asp Aia Leu Arg Asn Cys Thr vai He Thr Asp Leu Glu 965 370 975 Glu Gin Leu Asn Gin Leu Thr Glu Asp Asn Ala Glu Leu Asn Asn Gin 980 985 990 Asn Phe Tyr Leu Ser Lys Gin Leu Asp Glu Ala Ser Gly Aia Asn Asp 995 *1 J 1000 LODS Glu lie Vai Gin Leu Arg Ser Glu Vai Asp His Leu Arg Arg Glu lie 1010 1015 1.020 Thr Glu Arg Gru Met Gin Leu Thr Ser Gin Lys Gin Thr Met Glu Ala 1025 1030 1035 1040 Leu Lys Thr Thr cys Thr Hefc Leu Glu Glu Gin vai Met Asp Leu Glu 1045 1050 1055 Ala Leu Asn Asp Glu Leu Leu Glu Lys Glu Arg Gin Trp Glu Aia Trp 1060 1065 1070 Arg Ser Vai Leu Gly Asp Glu Lys Ser Gin Ph© Glu Cys Arg Vai Arg J .075 1080 1085 Glu Leu Gin Arg Met Leu Asp Thr Glu Lys Gin Ser Arg Ala Arg Alâ 1090 1095 1100 Asp Glo Arg lie Thr Glu Ser Arg Gin Vai Vai Glu Leu Ala Vai Lys 1105 1110 1115 1120 Glu Hís Lys Ala Glu Ile Leu Ala Leu Gin Gin Ma L8U Lys Glg Gin 1125 1130 1 A 1135 Lys Leu Lys Ala Glu Ser Leu Ser Asp Lys Leu &5Λ Asp Leu Glu Lys 1140 1 ;1·!5 1150 Lys Híb Ala Met Leu Glu Met Asn Aia Arg Ser Gin Gin Lys Leu 1 155 1160 1165 Glu Thr Glu Arg Glu Leu Lys Gin Arg Leu Leu Glu Glu Gin Aia Lys 1170 1175 1180 Leu Gin Gin Gin Mõt Asp Leu Gin Lys Asn His I,l.e The Arg Leu Thr 1X33 uso 1195 1200 Gin Giy Leu Gin Glu Ala Leu Asp Arg Ala Asp Leu Leu Lys Thr Glu 1205 1210 1215 154
Arg Ser Asp leu Glu Tyr Gxn Leu Glu Asn lie Gin val Leu Tyr Ser 220 1225 1230 His Glu Lys Val Lys Met Glu Gly Thr Ile Ser Gin Gin Thr Lys Leu 1235 1240 1245 ile Asp Phe Leu Glrs Ala Lys Met ASp Gin Prú Ala Lys Lys Lys Lys 2250 1255 1260 Gly Lsu Phe Ser Arg Arg Lys Glu ASP Pro Ala Leu Pro Thr Gin val 1265 1270 1275 1280 Pro Leu Gin Tyr Asn Glu Leu Lys Leu Ala Leu Glu Lys Glu Lys Ala 1285 1290 1295 Arg Cys Alá GlU Lee GlU Glu Ala Leu Gin LyS Tftr Arg Ile Glu Leu 1300 1305 1310 Arg Ser Ala Arg Glu Glu Ala Ala His Arg Lys Ala Thr Asp His Pro 1315 2320 2325 His Pro Ser Thr Pro Ala Thr Ala Arg Gin Gin Ile Ala Met Ser Ala 2330 1335 1340 Ile vai Arg Ser Pro Glu His Gin Pro Ser Ala Met Ser Leu Leu Ala 1345 2350 1353 1360 Pro Pro Ser Ser Arg Arg Lys Glu Ser Ser Thr Pro Glu Glu Phe Ser 1365 L370 1375 Arg Arg Leu Lys Glu Arg Met His His Asn Ile Pro His Arg Phe Asn 1380 1385 1390 Val Gly Leu Asn Met Arg Ala Thr Lys Cys Ala Val Cys Leu Asp Thr 1395 1400 1405 Val His Phe Gly Arg Gin Ala Ser Lys Cys Leu Glu cys Gin Vai Met 1420 1415 1420 Cys His Pro Lys Cys Ser Thr Cys Leu Pro Ala Thr Cys fily Leu Pro 1425 1430 1435 1440 Ala Gltt Tyr Ala Thr His Phe Thr Glu Ala Phe Cys Arg Asp Lys Met 1445 1450 1455 Asn Ser Pro Gly Leu Gin Thr Lys Glu Pro Ser Sèr Ser Leu His Leu 1460 1465 1470 Glu Gly Trp Met Lys Val Pro Arg Asn Asn Lys Arg Gly Gin Gin Gly 1475 1480 1435 Trp Asp Arg Lys Tyr Ile Val Leu Glu Gly Ser Lys Val Leu Ile Tyr 14:90 14 95 1500 Asp Asm Glu Ala Arg Glu Ala Gly Gin Arg Pro Val Glu Glu Phe Ga\í 1305 1510 1515 1520' Léu Cys Leu Pro Asp Gly Asp Val Ser Ile His Gly Ala Val Gly Ala 1525 1530 1535 Ser Glu Leu Ala Asn Thr Ala Lys Ala Glu Lys Ala Glu Ala Asp Ala 1540 1545 1S3Q 155 lys Leu Leu Gly Asn Ser Leu Leu Lys Leu Glu Gly Asp Asp Arg Leu 1555 J M0 ' 1565 Asp Mefc Asn Cys Thr Leu Pro Phe Ser Asp Gin Vai Vai Leu Vãl Gly 1570 1575 1580 Thr Glu Glu Gly Leu Tyr Ala Leu Asn Vai Leu Lys Asn Ser Leu Thr 1585 1590 1595 1600 His Vãl Pro Gly Ile Gly Ala Vai Phs Gin .Ue Tyr Ile Ile Lys Asp 1605 1610 1615 Leu Glu Lys Leu Leu Met Ile Ala Gly Glu Glu Arg Ala Leu Cys Leu 1620 1625 1630 Vai Asp Vai Lys Lys vai Lvs Gin Ser Leu Ala Gin Ser His Lea Pro 1635 1640 1645 Ala Gin Pro Asp Ile Ser Pro Asn He Phe Glu Ala Vai Lys Gly Cys 1650 1555 1660 His Leu Phe Gly Ala Gry LyS Ile Glu Asn Gly Leu Cys Ile Cys Ala 1665 1670 1675 1680 Ala Met Pro Ser Lys Vai Vai Ile Xtèu Arg Tyr Asn Glu Asn Leu Ser 1685 1690 1695 Lys Tyr Cys Ue Arg Lys Glu Ile Glu Thr Ser Glu Pro Cys Ser Cys 1700 1705 1710 Πβ His Phe Thr Asn Tyr Ser rle Leu Ile Gly Thr Asn Lys Phe Tyr L715 1720 1725 Glu Ile Asp Het Lys Gin Tyr Thr ieu Glu Glu Phe Leu Asp Lys Asn 1730 1735 1740 Asp His Ser Leu Ala Pro Ala Vai Phe Ala Ala Ser Ser Asn Ser Phe 1745 1750 1755 1760 Pro vai Ser XI® VaX Gin Vai Asm Ser Ala Gly Gin Arg Glu Glu Tyr L? 65 1770 1775 Leu Leu Cys Phe His Glu Phe Gly vai Phe Vai Asp Set Tyr Gly Arg 1780 1785 1790 Arg Ser Arg Thr ASp Asp Leu Lys Trp ser Arg Leu Pro Í3U Ala Phe 1795 1800 1805 Ala Tyr Arg Glu Fro Tyr Leu Phe Vai Thr His Phe Asn Ser Leu Glu 1310 1815 1820 Vai Ile Glu Ile Gin Ala Arg Ser Ser Ala Gly Thr Pro Ala Arg Ala 1823 1830 1835 1840 Tyr Lsy Asp Ile Pro Asrs Pro Arg Tyr Leu Gly Pro Ala lie Ser Ser 1845 1350 1853 Gly Ala Ile Tyr Leu Ala Ser Ser Tyr Gin Asp Lys LéU Arg Vai Ile 1860 1895 1870
Cys Cys Lys Gly Asn Leu Vai Lys Glu Ser Gly Tftr Glu Bis His Arg 156 1Θ75 1880 1885 Gly Pro Set: Thr Sei' Arg Ser $ex Pro Asn Lys Arg Gly Pro Pro Thr 1390 1895 1900 tyr Asn Glu His Il8 Thr Lys Arg Vai Ala Ser Ser Pro Ala Pro Pro 1905 1910 1915 1920 Glu Gly Pro Ser His Pro Arg Glu Pro Ser Thr Pro Kj. 5 Arg Tyr Arg 1925 1930 1935 Glu Gly Arg Thr Glu Leu Arg Arg Asp Lys Ser Pro Gly Arg Pro Leu 1940 1945 1950 Glu Arg Glu Lys Ser Pro Gly Arg Met Leu Ser Thr Arg Arg Glu Arg 1955 1960 1965 Ser Pro Gly Arg Leu Phe Glu Asp Ser Ser Arg Gly Arg Leu Pro Ala 1970 1975 1980 Gly Ala Vai Arg Thr Pro Leu Ssr Gin Vai A$h Lys Gly Arg Gly Gin 1985 1390 19.95 2000 Ser Ala Ser Glu Vai Phe Thr Vai Asn Thr Vai Thr Tyr Tyr Asp Trp 2005 2010 2015 Asn Lys Lys Leu Asp Asn Leu Pro Ala Asn Trp Ser Vai Leu Arg Ile 2020 2025 2030
Ile Gin LfeU Asn Gly Glu Ilô Arg Gin Çln Vai Glu Lys Ser Vai leu 2035 2040 2045 Arg Thr Asp Tyr Cys 2050<210> 3 <211> 6159 <212> ADN<213> Homo Sapiens <400> 3 afcgttgaagfc gccsgccggg cagcagstgt gaatgeagtc fccegacecca agfccttgtag gscatctatg fcttttigagg cagtatgcct gacttgctgt fcacctagctg gacateaagc ggatctgccg ceagafctsca ggcctggsct tccccctecg ttttfcgeaat tfcgtcgtgcg tctaaâattg tcfcgacgatg tcaaatatgg agcgcggaat cctxcaggct gaatctgttc ctectctttc ccgagaaggg agcctgctet gatgaagatt tagctgagtfc aceggagetc gfefcgfeggtca ctttgctgas efcafcgaaagt gatgaagsag aagagcggaa catattatcfc ttcaggacaa aaatcacctt cacfctfctgaa tagatatçag agcbgafcttt ggctgttcac etgagaacat fccfccgfctgac egaaasfcgaa fctcaaacaag tggctcctga agtgcfcgact gtgacfcggtg gteagtgçgc cagagggaac cfcctgcc&ça ttccagatga ecceaaagtg gccagaaaga gagacfcgaag acfcggsãcaa catfccgtaac acacetcçaa fctttgatgaa cctttiggatg ttccagggga atattagatg aagcacgtga cagccttcgg gtgcaggtgg aaggctttat cgaagcacaa tatctgatgg gaccagttag agcgttcatc cgcacaggsc afeggtgaaig gtgatgaacg gtgattgccC acetteaata agcagtgact tttgaaggfcu tetecfccccc ccagagaaga cfcggtgctgc aaccaecctt ccctetttgt gcaactttgt caãággãctt taagagagaa tggcccsgga gcccgtggat aggaatatca atgaaaacct tgatgggata acatcaagct ccaaacfcccc gggatggaaa abgagatgat acattatgaa ttctfcgatct tfcfcgcfcgcca ccttcgfctcc atfccgtgggt tgaacceafcfc 60 tatgactcaa 120 tctcttcgaa 180 ceggaaçfcst 240 cgaagtcága 300 àgcaaccgag 360 geaggfcirfcca 420 cccccaatta 480 gcctggaggg 540 gatacagttt 600 egfcgcafccga 660 ggtggatfcfct 720 gatfcgggacc 780 aggcacctac 840 ttafcgggaga 900 tttccagcgg S60 gsttcaaagc 1020 tccfcttcttc 1060 caccctcaag 1140 ttcatccfect 1200 157 cegfcgccagc taeagcaagg cçtgccaaçja tctcaggsca gaggtggagg tccctcctgg fctggagcaag gatatcagag gtggaagaaa cggagtgatc cggasagcga gtgggagaat ctccaagaga cagaaccgag cgccafcfcctt ctgaaggatg gagctcgaag aaacagaaag gacctggctg gagaagggca agatccctgg agtcttttta cagaaatttt gagcagcfcgg gagacaagat eagctcacag getgcacggg acagcagaag aaatttgatg cagctgâccg gatgaggctt cgccgggsga ctgaagscca gagctgctag teccagifctg agggcgagag gagcacaagg gagagccfcct gcccgaagct gageaageea caaggactgc gagtatcagc actafcttcts aaaaagaaaa ectctgcagt ctagaggaag caccgeaaag gecaigtceg ccgccateça gascgcafcgc aagtgtgctg fcgfccaggfcga gctgastatg ctccagacca aataacaaac gtcctcafctt cfcgtgccfctc aataeageea aaacfcggaag gtçttgçtqg cafcgfccccag ct ca fcgafc a g tgageccetc cactggggat ctagctccat agtgtcacas etgfcgcttag agcaggacefc cãcggetgga açcagagccç tgaggttgafc tctacgaatc cagaatgtca atçcçaaaet aaefcggagaa aggatfcctte tggagaacaa acatccagac agaaacatcg agcagcseta acaagçjagae asattctcag aacagaggat cccaaaggsa acctggagsc agaagatcsg fcgcgggaggfc agctacagct cggccctgga ctgaagagga ctcttcgtaa aggacaacgc stggcgocaa tcacggaacg cgtgcaccat aaaaagagcg agtgtcggçt ccgatcagcg ctgagattct ctgacaagct fcãcâgeagaa aattacagca aagaagctct tggaaaacat. aacaaaocaa agggttfcatt acsatgagct cccttcagaa caacggacca ccatcgtgcg gccgcagaaa accacaatafc tigtgictgga tgtglcaecc ccacscaetfc aggaçcccag gaggacagca afcgacastga ccgacgggga aagcagaaaa gfcgafcgaceej gcaccgâgga gastfcggage eaggagaaga aggçttçtçg tcttggcaga ggaaaagaaa gaiggageag tcsgaaggag tgctacçtac ggtgtcccag gaagctccaa gatgaafcesg tgagctgsga gcataaactg ggagasgatc ggctgcaaag tgaaggçate ggtaaagaga saaatcecsa ggaggccoaa tgaggaaaag sctggagaac cgaacagaag tgtggaactg câtgaâggco ac&ggctggg ccaccaagatc cagtctagag ctccctgcag gagccagctt gatccaggca cagctgtact fcgaactcaac cgacgagett agagafcgcag getggaggaa gcagtgggag tccagsgctg gatcaecgag cgctctgcag caatgacctg gctggâgsgt gcagatggac agatcgggct tcaggtíctc actcattgafe tagtcgacgg gaagctggcc gacccgcatc cccacaccca gtcgccagag ggsgtcttca tCctcaccgs taccgcgcac câagtgcfccc caeegaggcc eageâgcttg aggctgggsc âgccâgagaa tgtatcfcafct ageagaagct tcfcagacatg agggctctac agfccfcicca-a gcgggcactg ggtgaagaac tetgagtctg cttcfccatca gaaatgaccc gtggagctgâ atcacagaat gaggafcgaca gaaatcaaag ttggaagagg gagtetcgge fctçaaggcta aatgctgagc gagogagccg agaaagaagc cfcagagacca cagafeccagc gtctcagcce attaaagtgt atgatgcaga gcgatgatca tctgaagcca caagasgaga aagttggagg cacagtgaca cacgaggagc gagcgcçagfc cgccaggcga ctcacçgcac çtaatcacag aaccaaaact gtacaactgc çttaççagçc caggtcatgg gcctggagga cagagaatgc tctcgccsgg caggetctca gagaagaagc gaacgagagc citjcagââôa gatctactgs tattctcatg tttctgcaag aaagaggacc ctggagaagg gagctccggt tccacgccag cõcr.agccsa actccãgsgg ttcaacgtsg tttggacgcc acgtgcfctgc ttctgccgtg cacctogasg agqaag taca gctggacaga eatggtgccg gatgcfraaaç aactgcacgc gcccfcgaatg attfcatatfca tgtctirgtgg tgcegtttgt ttgtgtcçgg aaagcaaaga ggttacatcg aggcctctgá gcagtagctt aagcactçca agcaggaçta atcfctgtctc ttgctgctga aggatcaagg agcagcfccaa agagggagct tggtggaagc tggagegtag agatggctga agcacctaga tggaeaatca gacacçagga atgctatgga atsaacttgc tgattfcctga cccagaaccg agaatcggct agaaactgga cacagfctgac agacagagct atsgagatga acctggagga tctacttgtc gaagtgaagt sgaagcaaac atttggaggc gcgtcctggg tggacacega tggtggsgct aagagcagaa atgctatgct tcaaacagag atcacatttt agacagaaag aaaaggtgaa ccaaaatgga ctgctttacc agaaagctcg ccgcccggga ccaccgcgag gtgccatgag aatfctagtcg gactgaacat aggcatccaa cagccacct.g acsaaatgaa ggtggatgaa tfcgfeccbgga ggccggtgga ttggtgcttc fegcbtggaaa fcgcccttcag tcthgaaaaa tcssggacct acgtgaagaa ggggttttcg 1260 tctggactcc 1320 gctacsagac 1380 gagagtgtca 1440 gactcagaga 1500 aaagcgaagt 1560 gcttctccat 1620 ccaggctcaa 1680 agcaagaaga 1740 agaattcaãg 1800 gaagcctgaa 1860 aattcaggag 1920 ggagaagctg 1960 tgaggsacsgc 2040 agaaaacaya 2100 taaaattctg 2160 agtgcacctg 2220 gataaaqaaa 2230 ggaggcccat 2340 ttccaagatc 2400 agcaaatagc 2460 actçaggcaa 2S20 aaaactggag 2560 gqtggaacfcg 2640 gctcaagcgc 2700 agccctgcag 2760 ggaagagacc 2820 aatccsgcgc 2880 gcagctaaac 2940 caaacaactc 3000 ggaccatcfcc 3060 gatçrgagget 3120 cctaaacgat 3180 tgatgagaaa 3240 gaaacagagc 3300 ggcagtçaaç 3360 gctgaaggsc 3420 tgaaatgaat 3480 gcttctggaa 3540 ccgtctgact 3600 aagtgacttg 3660 aatggaaggc 3720 ccaacctgct 3780 cacãcaggtt 3840 ctgtgcagag 3900 ggaagctgcc 3960 gcagcagatc 4020 cctgctggcc 4080 gcgtotfcaag 4140 gcgagceaca 4200 afcgtctcgaa 42S0 cggcttgcet 4320 ctcçccaggt 4380 ggtgcçcagg 4440 gggatcaaaa 4500 agaatttgag 4560 cgaactcgca 4620 ctcçctgctg 4680 tgaccaggtg 4740 ctccctaacc 4800 ggagasgcts. 4860 agtgaaacaej 4 920 158 158 fcccctggcec gtcaagggct gccatgccca cggaaagaga ctcatfcggaa ctggafcaaga eetgtctcaa cacgaafcttg tggagtcgcc aaçtcaçfcçg tacctggaca ttggcgfccrct gagtceggca ggcccaccca gaaggcecea gagctgcgca atgctcagca cggctgcctg agtgcctcfcc gacaacctgc cagcaggttg <210> 4 <211> 2055 <212> PRT <213> Mus Musculus <400> 4 agtcecacct gccaottgtt gcaaagtcgfc fcagagacctc ccsataaatt atgaccattc tcgtgcaggfc gagtgttcçfc tacetttggc aagtasttga tceegaaccc cataccagga efcgaacacca cgtacaaega gceaceegcg gggacaagtc cgcggagaga cgggagccgt aagttttcac cagctaactg aaaagtetgt gcctçcecag tggggcaggc cattctccgc agagccctgc ctacgaaatc cttggcacct gaacagcgca ggattcttac cfcttgcctac gatccaggça gcgctacctg taaafctaagg ccggggcccg gcacatcacc agagccaagc tcctggccgc gcggfcccccs gaggaccccg ggttaacacfc gtcagtcctg tctgagaaca cccgacatct aagattgaga tacaacçtaaa agctgtatcc gacatgaagc gctgtgtttg gggcagcgag ggaagacgta agagaaccct cgctcctcag ggccctgcca gtcafcttgct fcccacctccc aagcgcgtgg acaeeocacc cccctggagc gggaggctgt ctgtcccagg gtcacctatt aggatcstcc gattattgc cacccaacat aegggcfectg acctcagcaa ôcfctcaccaa agtacacgct ccgcctcttc aggagtactt gccgcacaga atctgtttgt cagggaçccc tfctcctcagg gcaagggaaa gcagcagccc cctccagccc getaccgcga gagagaagtc ttgaagacag tgaacaaggg afcgactggaa agctgaatçg ttttgaagct catctgtgca atactgcatc ttacagtatc cgaggaattc eaacagctte gctgtgtttc cgatctcaag gacceaettc tgcccgagcg agcgatttac cefccgtgaaç eaaeasgcga
agcgcogcCC ggggcggacc ceceggccgg cagcaggggc aagagggcag fcaaaaagctg agaaatccgg 4980 5040 5100 5160 5220 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 5940 6000 6060 6220 6159
Met Leu Lys Phe Lys Tyr Giy Vai Arg Asn Pro Pro Glu Ala Ser Ala 5 10 15 Se r Glu Pro lie Ala Ser Arg Ala Ser Arg Leu Asn Leu Phe Phe Gin 20 25 30 Giy Lys Pro Pro Leu Met Thr Gin Gin Gin Met Ser Ala Leu Ser Arg 35 40 45 Glu Giy Met Leu Asp Ala Leu Phe Ala Leu Phe Glu Glu Cys Ser Gin 50 55 50 Pro Ais Leu Met Lys Met Lys His Vai Ser Ser Phe Val Gin Lys Tyr 65 70 75 δο Ser Asp Thr Xle Ala Glu Leu Arg Glu Leu Gin Pro Ser Ala Arg Asp 85 90 §5 Phe Glu Vai Arg Ser Leu Vsl Giy Cys Giy His Phe Ala Glu val Gin 100 105 110 Vai Vai Arg Glu Lys Ala Thr Giy A$p Val Tyr Ala Met Lys He Met' 115 120 125 i*ys Lys Lys Ala Leu Leu .^lu Gin Glu Gin Val Ser Phe Phe Glu Gltf 130 135 140 aiu Arg Asn Xle Leu Ser Arg Ser Thr Ser Pro Trp I.!e Pro Gin Leu 14 5 ISO 155 160
Sln Tyr Ala Phe Gin Asp Lys Aart Asrt Leu Tyr leu Vai Mefc filu Tyr 165 170 175 159
Gin Pro Gly Gly Asp PlMS Leu Ser Ií8U Leu ASíí Arg Tyr Gru Asp Gin ISO 185 190 Leu Asp Glu Ser Met Ile Gin Phe Tyr Leu Ala Glu Leu Ile Leu Ala 195 200 2Ô5 Val Bis Ser vai 0Í2 Gin Met Gly Tyr Val Eis Arg Asp Ile Lys Pro 210 215 220 Glu Asn lie leu Ile Asp Arg Thr Gly Glu ile Lys Leu Val Asp Phe 225 230 235 240 Gly Se* Ala Ala Lys Het Asn Ser Asn lys Val Asp Ala Lys Leu Pro 245 250 255 Ile Sly Thr Pr o Asp Tyr Met Ala Pro Glu val Leu Thr Val Met Asn 200 263 270 Glu Asp Arg Arg Gly Thr Gly Leu Asp Cys Asp Trp Trp Ser Val 275 280 285 Gly Vai Vai Ala Tyr Glu Met Vai Tyr Gly Lys Thr Pro Phe Thr Glu 230 295 300 Giy Iftr Ser Ala Arg Thr Phe A$n ÃSn Ile Met Asn Phe Gin Arg Phe 305 310 315 320 Leu Lys Phe Pro Asp A.sp Pro Lys val Ser Ser Glu Leu Leu Asp Leu 325 330 335 Leu Gin Ser leu Leu Cys Vai Gin lys Glu Arg Leu Lys Phe Glu Gly 340 345 35C Leu Cys Cys Bis Pro Phe Phe Ala Arg Thr Asp Ttp Asn Asn XI© Arg 355 360 365 Asn Ser Pro Pro Pro Phe Val Pro Thr Leu Lys Ser Asp Asp Asp Thr 370 375 380 5er Asn Phe Asp São Pro Glu Lys Asn Ser Trp Ala Phe lie Leu Cys 385 390 395 400 Vai Pro Ala Glu Pro Leu niã Phe Ser Gly Glu Glu Leu Pro Phe Val 405 410 415 Gly Phe Ser Tyr Ser Lys Ala Leu Gly Tyr Leu Gly Arg Ser Glu Ser 420 425 430 Vâ 1 Vai Ser Ser Leu Asp Ser Pro Ala Lys Vai Ser Ser Met Glu Lys 435 440 445 Lys leu Leu Ile Lys Ser Lys Glu Leu Gin Aâp Ser Gin Asp Lys Cys 430 455 460 His Lys Me-; Glu Gin Glu Met Thr Arg Leu His Arg Arg Val Ser Glu 465 470 475 480 Vai Glu AiS Vai Leu Ser Gin Lys Glu Val GlU Leu Lys Ala Ser GlU 485 490 495 Thr Gin Arg Ser Leu leu Glu Gin Asp Leu Ala Thr Tyr Ile Thr Glu 500 505 510 160
Cys Ser Ser Leu Lys Arg Ser Leu Glu Gin Ais Arg Met Glu Vai Ser 515 520 525 Gin Glu Asp Asp Lys Ala Leu Gin Leu Leu fiis Asp Ile Arg Glu Gin 530 535 540 Ser Arg Lys Leu Gin Glu Ile Lys Glu Gin Glu Tyr Gin Ala Gin Vãl 545 5 50 555 560 Glu Glu Met Arg Leu Mst Met Asn Gin Leu Glu Glu Asp Leu Vai Ser 565 570' 575 Ala Arg Arg Arg Ser Asp Leu Tyr Glu Ser GlU Leu Arg Glu Ser Arg 580 585 590 Leu Ala Ala Glu Glu Phe Lys Arg Lys Ala Asn Glu Cys Gin Kis Lys 595 600 605 Leu Hat Lys Ala Lys Asp Gin Gly Lys P.ro Glu Vai Gly Glu Tyr Ser 610: 615 620 Lys Leu Glu Lys Ile Asn Ala Glu Gin Gin Leu Lys Ile Gin Glu Leu 625 630 635 640 Gin Glu Lys Leu Glu Lys Ala Vai Lys Ala Ser Thr Glu Ala Thr Glu 645 650 655 Leu Leu Gin Asn Ile Arg Gin Ala Lys Glu Arg Ala Glu Arg Glu Leu 6SQ 665 670 Glu Lys Lsu Bis Asn Arg Glu Asp Sex Ser Glu Gly Ile Lys Lys Lys 675 680 685 leu Vai b.JiU Ala Glu Glu Arg Arg Bis Ser Leu Glu Asn Lys Vai Lys 690 695 700 Arg Leu Gin Thr Met Glu Arg Arg Glu Asn Arg Leu Lys Asp Asp Ile 705 710 715 720 Gin Thr Lys Ser Glu Gin Ile Gin Glft «et Al â Asp Lys Ile Lôu Glu 725 730 735 Leu Glu Glu Lys Bis Arg Glu Ala Gin Vai Ser Ala Gin Bis Leu Glu 740 74 5 750 Vai Bis Leu Lys Gin Lys Glu Gin Bis tyr Glu Glu Lys Ile Lys Vai 755 760 765 Leu Asp Asn Gin XI a Lys LyS Asp Leu Ala Asp Lys Glu Ser Leu Glu 770' 775 780 A$n Met Met Gin Arg Bis Glu Glu Glu Ala His Glu Lys Gly Lys lie 5 85 790 795 SOO Leu Ser Giu Gin Lys Ala Met Ile Asn Ala Met Asp Ser Lys ile Arg 80·5 810 815 Ser Leu Glu Gin Arg Ile Vai Glu Leu Ser Glu Ala Asn Lys Leu Ala 620 825 830 Ais Asn Ser Ser Leu Ph© Tftr Gin Arg Aân Met Lys Ala Gin Glu Glu 161 835 840 845 Met Ile Ssr Glu Leu Arg Gin Gin Lys Phe Tyr Leu Gxu Thr Gin Ala 8 50 855 860 Gly Lys Leu Glu Ala Gin Asn Arg Lys Leu Glu Glu Gin Leu Glu Lys 865 810 875 880 lie ser His Gin Ãsp His Ser Asp Lys Ser Arg Leu Leu Glu Leu Glu 885 890 895 Thr Arg Leu Arg Glu Vai Ser Leu Glu His Glu Glu Gin Lys Leu Glu 900 905 9X0 Leu Lys Arg Gin Leu Thr Glu Leu Gin Leu Ser Leu Gin Glu Arg Glu SIS 920 925 Ser Gin Leu Thx Ala leu Gin Ala Ala Arg Ala Ala Leu Gltó Ser Gin 930 935 940 Leu Arg Gin Ala Lys Thr Glu Leu Glu Glu Thr Thr Ala Glu Ala Glu 945 950 955 960 GX o Glu Ile Gin Ala Leu Thr Ala His Arg Asp Glu Ile Gin Arg Lys 965 970 97.5 p.he ASp Ala Leu Arg Asn Ser Cys Thr Vai lie Thr Asp Leu Glu Glu 980 985 990 Gin Leu ASÍl: Gin leu Thr Glu Asp Asn Ala Glu Leu Asn Asn Gin Asn 395 1000 1005 Phe Tyr Leu Ser lys Gin Leu Asp Glu Ala Ser Gly Ala Asn Asp Glu 1010 1015 1020 lie Vai Gin Leu Arg Ser Glu Vai Asp ais Leu Axg Axg Glu Ue Thr 1025 1030 1035 1040 Glu Arg Glu Met Leu Thr Ser Gin Lys Gin Thr Met Glu Ala Leu 104 5 LOBO 1055 Lys Thx Thx Cys Thr Mefc Leu Glu Glu Sin Vai Leu Asp Leu Glu Ala 106Q LG65 1070 Leu Asn Asp Glu Léu Leu Glu Lys Glu Axg Gin Trp Glu Ala Trc Arg 1075 1080 1085 Ser Vai Leu Gly Asp Glu Lys Ser Gin Phe Glu Cys Arg Vai Arg Glu LO 90 1095 1.100 Leu Gin Arg Met Leu As p Thr Glu Lys Gin Ser Arg Ala Arg Ala Asp 1105 mo Π15 Í.120 Gin Arg lie Thr Giu Ser Arg Gin Vai Vai Glu Leu Ala Vai Lys Glu 1125 U30 1135 His Lys Ala Glu Ile Leu Ala Leu Gin Gin Ala Leu Lys Glu Gin Lys 1140 1145 LISO Leu Lys Ala Glu Ser Leu ser Asp Lys Lfcu Asn Asp Leu Glu Lys Lys 1153 1160 11.65 162
Bis Ala Met leu Glu Met Asn Ala Arg Ser Leu Gin Gin Lys Leu Glu 1170 U75 1180 Thr Glu Arq Glu Leu Lys Gin Arg Leu Leu Glu Glu Gin AlS Lys Leu 1185 1190 1195 1200 Gin Gin Gin Met- Asp Leu Gin Lys Asn Hís Ile Phe Arg Leu Thr Gin 1205 1210 1215 Gly Leu Gin Glu Ala Leu Asp Arg Ais Asp Leu Leu Lys Thr Glu Arg 1220 1223 L230 Ser Asp Leu Glu Tyr Gin Leu Glu Asn 11» Gin Val Leu Tyr Ser Hís 1235 1240 Í.245 Glu Lys Vai Lys Met Slu Gly Thr He Ser Gin Gin Thr Lys Lsii Ile 1250 1.255 1260 Asp Phe leu Gin Ala Lys Met Asp Gin Pro Ala Lys Lys Lys Lys Val 1265 1270 1275 1280 Pro Leu Gin Tyr Asn Glu Leu Lys Leu Ala Leu Glu iy£5 Glu Lys Ala 1285 1290 1295 Arg Cys Ala Glu Leu Glu Glu Alã Leu Gin Lys Thr Arg Ile Glu Leu 1300 1305 1310 Arg Ser Ala Arg Glu Gin Ala .Alâ Bis Arg Lys Ala Thr Asp His Pro 1315 1320 Í325 Hís Pro Ser Thr Pro Ala Thr Ala Arg Gin Gin Ile Ala Met Ser Ala 1330 1335 1340 iiê vai Arg Ser Pro Glu His Gin Pro Ser Ala Met Ser Leu Leu Ala 1345 1350 1355 1360 Pro Erp Ser Ser Arg Arg Lys Glu Ser Ser Thr Pro Glu Glu Phe Ser 1365 1370 1375 Arg Arg Leu Lys Glu Arg Met Bis His Asn Ile Pro Hís Arg Phe Asu 1380 - 1385 1390 Vai Gly Leu As« Met Arg Ala Thr Lys Cys Alã val Cys Leu Asp Thr 1395 1400 1405 Vai Bis Phe Gly Arg Gin Ala Ser Lys Cys Leu Glu Cys Gin Val Met 1410 1415 1420 Cys His Pro Lys Cys Ser Thr Cys Leu Pro Ala Thr Cys Gly Leu Pro 1425 1430 1435 1440 Ala Glu Tyr AlS Thr His Phe Thr Glu Phe Cys Arg Asp Lys Met 1445 1450 1455 ftsn Ser Pro Gly Leu Gin Ser Lys Glu Pro Gly Ser Ser Leu His Leu 1460 1465 1470 Glu Gly Trp Met lys Vai Pro Arg Asn Asn Lys Arg Gly Gin Gin Gly 1475 1480 1385 Trp Asp Arg Lys Tyr He Vai Leu Glu Gly Ssz Lys Val Leu Ile Tyr 1430 1495 1500 163
As» Asn Gru Ala Arg Glu Ala Gly Gin Arg Pro Val Glu Glu Phe Glu 1SQ5 1510 1515 1 1520 ieo Cys leu Pro Asp Gly Asp Vel Ser lie Ria Gly A.la Val Gly Ma L525 1530 1535 Ser GIu Leu Ma Asn Thr Ala Lys Ala Asp val Pro Tyr Ile Leu Lys 1540 L545 1550 Met Glu Ser His Pro Ris Thr Thr Cys Trp Pro Gly Arg Thr Leu Tyr 1555 1560 1565 Lee Leu Ala Pre Ser Phe Pro Asp Lys Gin Arg Trp Val Thr Ala Leu 1570 1575 1580 Gin Ser Vai Val Ala Gly Gly Arg Val Ser Arg Glu Lys Ala Glu Ala 1585 1590 1595 j L6Q0 Asp Ala Lys Leu Leu Gly Asn Ser Leu Leu Lys Leu GLu Gly Asp Asp 1605 1610 1615 Arg Leu Asp Met Asn Cys Thr Leu Pro Phe Ser Asp Gin Val Val Leu 1620 1625 1630 Vai Gly Thr Glu Giu Gly Leu Tyr Ala Leu Asn Val Leu Lys Asn Ser 1635 1640 164S Leu Thr His He Pro Gly Ile Gly Ala Val Phe Gin Ile Tyr Ile Ile 1650 1655 1660 Lys A$p Léu GliJ Lys Leu Leu Met Ile Ala Gly Glu Glu Arg Ala Leu 166! 5 1670 1675 1680 Cys leu val Asp Val Lys Lys Val Lys Gin Ser Leu Ala Gin Ser His 1685 1690 1695 leu Pro Alâ Gin Pro Asp Val Ser Pro Asn Ile Phe Glu Ala Val Lys 1700 1705 1710 Gly Cys Hr s Leu Phe AI 3 Ala Gly Lys Ile Glu Asn Ser Leu Cys Ile 1715 1720 1723 Cys Ala Ala Met Pro Ser Lys Val Val Ile Leu Arg Tyr Asn Asp Asn 1730 1735 1740 leu Ser Lys Tyr Cys He Arg Lys Glu lie GI» Thr Ser Glu Pro Cys 174! 5 1750 1755 1760 Ser Cys lie Bis Phe Thr Asn Tyr Ser Ile Leu lie Gly Thr Asn Lys 1765 1770 1775 Phe Tyr Glu Ha Asp Met Lys Gin Tyr Thr Leu Asp Glu Phe Leu Asp 1780 1785 1790 lys Asn. Asp His Ser Leu Ala Pro Ala Val Phe Ala Ser Ser Ssr Asn 17 95 1800 1805 Ser Phe Pro Val Ser Ile Val Gin Ala Asn Ser A 1,5 Gly Gin Arg Glu 1810 1815 1820
Glu Tyr Leu Lee Cys Phe Sis Gly Phe Gly Vai Phe Vai Asp Sér Tyr 164 1825 1830 1835 1840 Gly Arg Arg Ser Arg Thr Asp Asp Leu Lys Trp Ser Arg Leu Pro Leu 1845 1850 1855 Ala Phe Ala Tyr Arg Glu Pro Tyr Leu Phs Val Thx His Phe Asn Ser LS60 1865 1870 Leu Glu Val Ile Glu Ile Gin Ala Arg Ser Ser Leu Gly Ser Pro Ala 1875 1880 1885 Arg Ala Tyr Leu Glu Ile Pro Asn Pro Arg Tyr Leu Gly Pro Ala Ile 1890 1823 1900 Ser Ser Gly Ala Ile Tyr Leu Ala Ser Ser Tyr Gin Asp Lys Leu Arg 2905 1910 1915 1920 val íle Cys Cys Lys Gly Asn Leu Vel. Lys Glu Ser Gly Thr Glu Gin 1925 L930 1935 His Arg Val Pro Ser Thr Ser Arg Ser Ser Pro Asn Lys Arg Gly Pro 1940 1945 1950 Pro Thr Tyr Asn Glu His Ile Thr Lys Arg Val Ala Ser Ser Pro Ala 1955 1960 1965 Pro Pro Glu Gly Pro Ser His Pro Arg GlU Pro Ser Thr Pro His Arg 1970 1975 1980 Tyr Arg Asp Arg Glu Gly Arg Thr Glu Leu Arg Arg Asp Lys Ser Pro 1985 L990 1295 2000 Gly Arg Pro Leu Glu Arg Glu Lys Ser Pro .Gly Arg Met Leu Ser Thr 2005 2010 2015 Arg Arg Glu Arg Ser Pro siy Arg Leu Phe Glu Asp Ser Ser Arg Gly 2 !Q20 2025 2030 Arg Leu Pro Ala Gly Ala Val Arg Thr Pro Leu Ser Gin Val Asn Lys 2035 >040 2045 Val Trp Asp Gin Ser Ser Val 2050 2055
<210> 5 <211> 1641 <212> PRT <213> Mus musculus <400> 5
Pro Phs Val Pro Thr Leu Lys Ser Asp Asp Asp Thr Ser Asn Phe Asp 1 5 10 15 Glu Pro Glu Lys Asn Ser Trp Val Ser Ser Ser Val Cys Gin Leu Ser 20 25 30 Pro Ser Gly Phe Ser Gly Glu Glu Leu Prc Phe Vel Gly Phe Ser Tyr 35 40 45 Ser Lys Ala Leu Gly Tyr Leu Gly Arg Ser Glu Ser vai Val Ser Ser 50 55 60 165
Leu Asp Ser Pro Ala Lys Vai Ser Ser Mefc Gru Lys Lys Leu Leu Ile 65 70 75 80 Lys Ser Lys Glu Leu Gin Asp Ser Gln Asp Lys Cys His Lys Met Glu 85 90 95 Gln Glu Met Thr Arg Leu HiS Arg Arg Vai Ser Glu V«1 Glu Ala Vai 100 105 uo Leu Ser Gin Lys Glu Vai Glu Leu Lys Ala Ser Glu Thr Gln Arg Ser 115 120 125 Leu Leu Glu Gin Asp Leu Ala Thr Tyr Ile Thr Glu Cys Ser Ser Leu .OG 135 140 Lys Arg Ser Leu Glu Gln Ala Arg Met Glu Vai Ser Gln Glu Asp Asp 145 150 155 160 Lys Ala Leu Gin Leu Leu His Asp Ile Arq Glu Gln Ser Arg Lvs Leu 165 17Ò 175 Gln Glu Ile Lys Glu Gln Glu Tyr Gln Ala Gln Vai Glu Glu Met Arg ISO 185 190 Leu Het Met Asn Gin Leu Glu Glu Asp Leu Vai Ser Ala Arg Arg Arg 135 200 205 Ser Asp Leu Tyr Glu Ser Glu Leu Arg Glu Ser Arg Leu Ala Ala Glu 210 215 220 Glu Phe Lyâ Arg Lys Ala Asn Glu Cys Gln His i*ys Leu Met Lys Ala 225 230 235 240 Lys Asp Gin Giy Lys Pro Glu Vai Gly Glu Tyr Ser Lys Leu Glu Lys 245 250 255 lie Asn Ala Glu Gin Gln Leu Lys Ile Gln Glu Leu Gln Glti Lys Leu 250 265 270 Glu Lys Ala Vai Lys Ala. Ser Thr Glu Ala Thr Glu Leu Leu Gln Asn 275 280' 285 Ile Arg Gin Ala Lys Glu Arg Ala Glu Arg Glu Leu Glu ly & Leu His 230 235 300 Asn Arg Glu Agp Ser Ser Glu Gly Ile Lys Lys Lys Leu Vai aiu Ala 305 310 315 320 Glu Glu Leu Glu Glu Lys His Arg Glu Ala Gln Vai Ser Ala Gln His 325 330 335 Leu Glu Vai His Leu Lys Gln Lys Glu Gln His Tyr Glu Glu Lys lie 340 345 350 Lys vai Leu Asp Asn Gln Ile Lys Lys Asp Leu Ala Asp Lys Glu Ser 355 360 365 Leu Glu Asn Met Met Gln Arg Hj,S Gru Glu Glu Ala His Glu Lys Gly 37D 375 350
Lys lis Lsu Ser Glu Gln Lys Ma Met Ile Asn Ala Mefc Asp Ser Lys 166 385 390
Ile Arg Ser Leu Glu Gin Arg Ile 405 Leu Ala Ala Asn Ser Ser Phe 420 Glu Glu Mêt ile Ser Gi.u Leu Arg 435 440 Gin Ala Giy Lys Leu Glu Ala Gin 450 455 Glu Lys Ile Ser Hls Gin Asp ais 4 65 4 70 Leu Glu Thr Arg Leu Arg Glu Val 485 lieis Glu Leu Lys Arg Gin Leu Thr 500 Arg Glu Ssr Gin Leu Thr Ala Leu 515 520 Ser Gin Leu Arç Gin Ala Lys Thr 530 535 Ais Glu Glu Glu Ue Gin Ala Leu 545 550 Arg Lys Phe Asp Ma Leu Arg Asn 565 Glu Glu Gin XíôU Asn Gin Leu Thr 580 Gin Asn Phe Tyr Leu Ser Lys Gin 595 600 Asp Glu Ile Vai Gin Leu Arg Ser 610 615 Ile Thr Glu Arg Glu tfet Gin Leu 625 63Õ Ala Leu Lys Thr Thr Cys Thr t4et 645 Glu Ala Leu Asn Asp Glu Leu Leu 660 Trp Arg Ser Vai Leu GXy Asp Glu 675 680 Arg Glu Leu GlR Arg Met Leu Asp 69Q 695 Ais Asp Gin Arg Ile Thr Glu Ser 705 710 395 400 Val Glu Leu Ser Glu Ala Asn Lys 410 415 Thr Gin Arg Asn Mefc Lys Ala Gin 425 430 Gin Gin Lys Phe Tyr Leu Glu Thr 445 Asn Arg Lys Leu Glu Glu Gin Leu. 460 Ser Asp Lys Ser Arg Leu Leu Glu 4 7S 480 Ser Leu Gru His Glu Glu Gin Lys 490 4 95 Glu Leu Gl.n Leu Ser Leu dn Glu 505 510 Gin Ala Ala Arg Ala Ala Leu Glu. 525 Glu Leu Glu Glu Thr Thr Ala Glu 540 Thr Ala Kís Arg Asp Glu Ile Gin 555 560 Ser Cys Thr Val Xis Thr Asp Leu 570 575 Glu Asp Asn Ala Glu Leu Asn Asn 585 590 Leu Asp Glu Ara Ser Giy Ala Asn 605 Glu val Asp His Leu Arg Arg Gru 620 Thr Ssr Gin Lys Gin Thr Met Glu. 635 640 Leu Glu Glu Gin Val Leu Asp Li8U 650 655 Glu Lys Glu Arg Gin Trp Glu Ale. 665 670 Lys Ser Gin Phe Glu Cys Arg val 685 Thr Glu Lys Gin Ser Arg Ala Arg 700 Arg Gin val Val Glu Leu Ala Val 715 720 167
Lys Glu His Lys Ala Glu He Leu 725 Gin LyS Leu Lys Ala Glu Ser Leu 740 Lys Lys His Ala Met Leu Glu Met 755 760 Leu Glu Thr Glu Arg Glu Leu Lys 770 775 Lys Leu Gin Gin Gin Met Asp Leu 785 790 Thr Gin Gly Leu Gin Glu Ala Leu 805 Glu Arg Ser Asp Leu Slu Tyr Gin 820 Ser Bis Glu Lys val Lys Met Glu 835 840 Leu He Asp Phe Leu Gin Ala Lys 850 855 Lys Vai Pro Leu Gin Tyr Asn Glu 865 S70 Lys Ala Arg Cys Ala Glu Leu Glu 885 Glu Leu Arg Ser Ala Arg Glu Glu 900 His Pro His Pro Ser Thr Pro Ala 915 920 Ser Ala Ile Vai Arg Ser Pro Glu 930 935 Leu Ala Pro Pro Ser Ser Arg Arg 945 950 Phe Ser Arg Arg Leu Lys Glu Arg 965 Phe Asn vai Gly Leu Asn Met Arg 980 Asp Thr Vai His Phe Gly Arg Gin 995 1000 Vai Met Cys His Pro Cys Ser 1010 1015 Leu Pro Ala Glu Tyr Ala Thr His 1025 1030 Lys Met Asn Ser Pro Gly Leu Gin
Ala Gin Gin Ala Leu Lys Glu 730 735
Ser Asp Lys Leu Asn Asp Leu Glu 745 750
Asn Ala Arg Ser Leu Gin Gin Lys 765
Gin Arg Leu Leu Glu Glu Gin Ala
7SO
Gin Lys As» His 1.1 e Phe Arg Leu 795 800
Asp Arg Ala Asp Leu Leu Lys Thr· 810 815
Leu Glu Asn He Gin Vai Leu Tyr 825 830
Gly Thr He Ser Gin Gin Thr Lys 845
Met Asp Gin Pr o Ma Lys Lys Lys 860
Leu Lys Leu Ala Leu Glu Lys Glu 875 880
Glu Ais Leu Gin Lys Thr Arg He 890 895
Ala Ala His Arg Lys Ala Thr Asp 905 910
Thr Ala Arg Gin Gin He Ala Met 925
His Gin Ρχο Ser Ala Met Ser Leu 940
Lys Glu Ser Ser Thr Pro Slu Slu 955 960
Met His His Asn lie Pro His Arg 370 975
Ala Thr Lys Cys Ala vai Cys Leu 985 990
Ala Ser Lys Cys Leu Slu Cys Gin 1005
Thr Cys Leu Pro Ala Thr Cys Gly 1020
Phe Thr Glu Ala Phe Cys Arg Asp 1035 1040
Ser Lys Glu pro Gly Ser Ser Leu 1050 1055 1045 168
His Leu Glu Gly Trp Met Lys Val Pro Arg Asn Asn Lys Arg Gly Gin 1060 1065 L070 Gin Gly Trp Asp Arg LyS Tyr Xle Val Leu Glu Gly Ser Lys Val Lsu 1075 1080 1085 Ile Tyr Asp Asn Glu Ala Arg Glu Ala Gly Gin Arg Pro Val Giu Glu 1030 1005 L10Õ Phe Glu Leu Cys Leu Pro Asp Gly Asp Val Ser lie His Gly Ala Val 1105 1110 1115 1120 Gly Ala Ser Glu Leu Ala Asn Thr Ala Lys Ala Asp Val Pro Tyr lie 1125 1.130 1135 Leu Lys Met Glu Ser His Pro His Thr Thr Cys Trp Pro Gly Arg Thr 1140 1145 1 L150 Leu Tyr &©U Leu Ala Pro Ser Phe Pro Asp Lys Gin Arg Trp Vai Thr 1155 LI 60 L165 Ala Leu Glu Ser Vhal Val Ala Gly Gly Arg Val Ser Arg Glu Lys Ala 1170 1175 1180 Giu Ala Asp Ala Lys Leu Leu Gly Asn Ser Leu Lys Leu Glu Gly 1185 ] LISO 1195 1290 Asp Asp Arg Leu Asp Met Asn cys Thr Leu Pro Phe Ser Asp Gin val 1205 1210 1215 Val Leu Val Gly Thr GlU Glu Gly Leu Tyr Aia Leu Asn Val Leu Lys 1220 1225 3 L23Q Asn Ser Leu Thr His Ile Pro Gly Ile Gly Ala val Phe Gin ile Tyr 1235 1240 1245 Ile llê Lys Asp Leu du Lys Leu Leu Met lie Ala Gly Glu Glu Arg 1250 1255 1260 Ala Leu Cys Leu Val Asp Val Lys Lys Val Lys Gin Ser Leu Ala Gin 1265 1270 1275 1280 Ser His Leu Pro Ala Gin Pro Asp Val Ser Pro Asn Ile Phe Glu Alã 1285 L290 1295 Val Lys Gly Cys His Leu Phe Ala Ala Gly Lys Ile Glu Asn Ser Leu 1300 L305 ‘310 Cys lie Cys Ala Aia Met pro Ser Lys Val Val He Leu Arg Tyr Asn 1315 1320 1325 Asp Asn Leu Ser Lys Tyr Cys Ile Arg Lys Glu Ile Glu Thr Ser Glu 1330 1335 d L340 Pro Cys Ser Cys He His Phe Thr Asn Tyr Ser Ile Lsu lie Gly Thr 1345 1350 1355 1360 Asn Lys Phe Tyr Glu Xle Asp Met Lys Gin Tyr Thr Leu Asp Giu Phe 1363 1370 1375
Leu Asp Lys Asn Agp His Ser Leu Ala Pro Ala Val Phe Ala Ser Ser 169 1380 1385 1390 Ser Asn Ser Phe Pro Val Ser Ile Val Gin Ala Asn Ser A.la Gly Gin 13S5 1400 1405 Arg Glu Glu Tyr Leu Leu Cys Phe His Glu Phe Gly Val Phe Val Asp mo 1515 1420 Ser Tyr Gly Arg Arg Ser Arg Thr Asp Asp Leu Lys Trp Ser Arg Leu 1425 1430 1435 1440 Oro Leu Ala Phe Ala Tyr Arg Glu Pro Tyr Leu Phe Val Thr Ris Phe 1445 1450 1455 Asm Ser Lsu Glu Val 1.1 e Glu Ile Gltl Ala Arg Ser Sér Leu Gly Ser 1460 1465 1470 Oro Ale Arg Ala Tyr Leu Glu Ile Pro Asn Pro Arg Tyr Leu Gly Pro 1475 1480 1485 Ala Ile Ser Ser Gly Ala He Tyr Leu Ala Ser ser Tyr Gin Asp Lys 14 90 1495 1500 teu Arg Val Tle Cys Cys lys Gly Asn Leu Val Lys Glo Ser Gly Thr 1305 1510 1515 1520 Glu Gin Bis Arg Val Pro Ser Thr Ser Arg Ser Ser Pro Asn Lys Arg L52S 1530 1535 Gly Pro Pro Thr Tyr Asn Glu His Ile Thr Lys Arg val Ala Ser Ser 1540 1545 1550 Pro Ala Pro Pro Glu Gly Pro Ser Ris pro Arg Glu Pro Ser Thr Pro 1555 1560 1565 His Arg Xyr Arg Asp Arg Glu Gly Arg Thr Glu Leu Arg Arg Asp Lys 1570 1575 1580 Ser Pro Gly Arg Pro Leu Glu Arg Glu Lys Ser Pro Gly Arg Met Leu 1585 1590 15S5 1600 Ser Thr Arg Arg Glu Arg Ser Pro Gly ftrg Leu Phe Glu Asp Ser Ser 1605 1610 1615 Arg Gly Arg Pro Aiâ Gly Ala Val Arg Thr Pro Leu Ser Gin Val 1620 1625 3.630 Asn Lvs Val Trp Asp Gin Ser Ser Val 1635 1640
<210> 6 <211> 1597 <212> PRT <213> Mus musculus <400> 6
Het Lau Leu Gly Glu Glu Ale Het Mefc Glu Gin Glu Met Thr Arg Leu 1 S 10 15
His Arg Arg Vai Ser Glu val Glu Ale vai Leu Ser Gin Lys Glu Val 20 2£ 30 170
Glu Leu Lys Ala Ser Glu Thr Gin Arç Ser Lsu Leu Glu Gin Asp Lau 35 40 4 5 Ala Thr Tyr Ue Thr Glu Cys Ser Ser Leu Lys Arg Ser Leu. Glu Gin. 50 55 60 Ala Arg Met Glu Vai Ser Gin Glu Asp Asp Lys Ala Leu Gin Leu Leu es 70 75 8C Hís Asp Ile Arç Glu Gin Ser Arg Lys Leu Gin Glu ile Lys Glu Gin 85 30 93 Glu Tyr Gin Ala Gin Vai Glu Glu Met Arg Lçti Met Met Asn Gin Leu 100 105 110 Glu Glu Asp Leu Vai Ser Ala Arg Arg Arg Ser Asp Leu Tyr Glu Ser 115 120 125 Glu Leu Mg Glu Ser Arg Leu Alâ Ma Glu Glu ?he Lys Arg Lys Ala 130 135 140 Asa Glu Cys Gin His Lys Leu Met Lys Ala Lys Asp Gin Gly Lys Έτο 145 .130 155 160 Glu Vai Gly Glu Tyr Ser Lys Leu Glu Lys Ile Asn Ala Glu Gin Gltt 165 170 175 leu Lys Ile Gin &lu Leu Gin Glu Lys Leu Glu Lys Aiu Vai Lys Ala 180 185 190 Ser Thr Ala Thr Glu Leu Leu Glu Asn 11* Arg Gin Ala lays Glu 195 200 205 Arg Ala Glu Arç Glu Leu Glu Lys Leu His Asn Arg Glu Asp Ser Ser 210 213 220 Glu Gly Ue Lys Lys Lys Leu Vai Glu Ala Glu Glu Arg Arg Hís Ser 225 230 235 240 Leu Glu Asn Lys Vai Lys Arg Leu Glu Thr Met Glu Arg Arg Glu Asn 245 250 255 Arg &6U Lys Asp Asp Ile Gin Thr Lys Ssr Glu Gin Ile Gin Gin Met. 260 265 270 Ma Asp Lys Ile Leu Glu Leu Glu Glu Lys Ria Arg Glu Ala Gin Vai 275 280 285 Ser Ala Gin His Leu Glu Val His Lsu Lys Gin Lys Glu Gin His Tyr 230 295 300 Glu Glu Lys Ile Lys Vai Leu Asp Asn Gin Ile Lys Lys Asp Leu Alá 305 310 315 .320 Asp Lys Glu Ser Leu CjIu Asn Met Met Gin Arg His Glu Gru GÍU Ala 325 330 335 Hís Glu Lys Gly Lys Ile Leu Ser Glu Gin Lys Ala Met Ile ASU Ala 340 345 350
Met Asp Ser X»ys Ile Arg Ser Leu Glu Gin Arg Ιλβ Vai Glu Leu Ser 171 355 36D 365
V
Glu Ala Asn Lys Leu Ala Ala Asn. Ser Ser Leu Phe Thr Gin Arg Asn 370 37 5 380 Mfit Lys Ala Gin Glu Glu Het Ile Ser Glu Leu Arg Gin Gin Lys Phe 385 390 385 400 Tyr Lsu Glu Thr Gin Aiã Gly Lys Leu Glu Ala Gin Asn Arg Lys Leu 405 410 415 Glu Glu Gin Lêu Glu Lys Ile Ser His Gin Asp His Ser Asp Lys Ser 420 4.25 4 30 Arg Leu Leu Gla Leu Glu Thr Arq Leu Arg Glu vai Ser Leu Glu His 435 44Õ 445 Glu. Glu Gin Lys Leu Glu Leu Lys Arg Gin Leu Thr Glu Leu Gin Leu 450 455 460 Ser leu Gin Glu Arg G .í n Ser Gin Leu Thr Ala Leu Gin Ala Ala Arg 4 65 470 475 480 Ala AI a Leu Glu Ser Gin Leu Arg Gin Ala Lys Thr G.lu Leu Glu Glu ies 480 495 Thr Thr Ala Glu Ala Glu Glu Glu He Gin Ala Leu Thr Ala His Arg 500 505 510 Asp Glu Ile Gin Arg Lys Pha Asp Ala Leu Arg Asn Ser Cys Thr Vai 515 520 525 lie Thr Aap Leu Glu Glu Gin Leu Asn Gin Leu Thr Glu Asp Asn Ala 530 535 540 Glu Leu Asn Asn Gin Asn Fhe Tyr Leu Ser Lys Gin Leu Asp Glu Ala 545 550 555 560 Ser Gly Ala Asn Asp Glu 11« Vai Gin Leu Arg Ser Glu V'al Asp His 565 570 575 Leu Arg Arg Glu Xle Thr Glu Arg Glu Met Gin. Leu Thr Ser Gin Lys 380 565 330 Gin Thr Met Glu Ala Leu Lys Thr Thr Cys Thr Met Leu Glu Glu Gin 39S 600 605 Vai leu Asp Leu Glu Ala Leu Asn Asp Glu Leu Leu Glu Lys Glu Arg 610 615 620 tain Trp Glu Ala Trp Arg Ser Vai Leu Gly Asp Glu Lys Ser Gin Phe 625 630 635 640 Glu Cyg Arg vai Arg Glu Leu Gin. Arg Met Leu ASp Thr Glu Lys Gin 645 650 653 Ssr Axg Ala Arg Ala Asp Gin Arg lie Thr Glu Ser Arg Gin Vai Vai 660 §65 670 Glu leu Ala Vai Lys Glu His Lys Ala Glu Ile Leu Ala Leu Gin Gin 675 680 685 172
Ala Leu Lys Giu Gin Lys Leu Lys Ala Glu Ser Leu Ser Asp Lys Leu 690 695 700 Asn Asp Leu Glu Lys Lys His Ala Met Leu Glu Met Asn Ala Arg Ssr 705 710 715 720 Leu Gin Gin Lys Leu Glu Thr Glu Arg Glu Leu Lys Gin Arg Leu Leu 725 730 735 Glu Glu Gin Aia Lys Leu Gin Gin Gin Met Asp Leu Gin Lys Asn His 740 7 4 S 750 lie Phe Arg Leu Thr Gin eiy Leu Gin Glu Ala Leu Asp Arg AI n Asp 755 760 765 Leu Leu Lys Thr Glu Arg Ser Asp Leu Glu Tyr Gin Leu Glu Asn Ile 770 775 780 Gin Vai Leu Tyr Ser His Glu Lys Vai Lys Met Giu Gly Ile Ser 785 790 7 95 800 Gin Gin Thr Lys Leu Ile Asp Fhe Leu Gin Ala Lys Met Asp Gin Pro 805 S1Q SI 5 Ais Lys Lys Lys Lys Vai Pro Leu Gin Tyr Asn Glu Leu Lys Leu Ala 820 825 830 Leu Glu Lys Giu Lys Ala Arg Cys Ala. Glu Leu Glu Glu Ala Leu Gin 835 840 845 lys Thr Arg Ile Glu Leu Arg Ser Ala Arg Glu Glu Ala Ala His Arg 850 855 SSG Lys Ala Thr Asp His Pro HiS Pro Ser Thr Pro Ala Thr Ala Arg Gin 065 370 675 880 Gin Ile Ala Met Ser Ala Ile Vai Arg Ser Pro Glu His Gin P.ro Ser 885 890 895 Ala Met Ser Leu Leu Ala Pro Pro Ser Ser Arg Arg Lys Glu Ser Ser SOO 905 910 Thr ?rc Glu Glu Phe Ser Arg Arg Leu Lys Glu Arg Met Ris Hrs Asn 915 920 925 lie Pro His Arg Pha Asn VbI Gly Leu Asn Met Arg Ala Thr Lys Cys 930 935 940 Ala Vsl Cys Leu Asp Xhi Vai Hâs Phe Gly Arq Gin Ala Ser Lys Cys 950 955 960 Leu Glu Cys Gla Vai Met Cys His Pro Lys Cys Ser Thr Cys Leu Pro 965 970 975 Ala Thr Cys Gly Leu Pro Ala Glu Tyr Ala Thr His Phe Thr Glu Ala 980 985 390 Phe Cys Arg Asp Lys Met Asn Ser Pro Gly Leu Gin Ser Lys Glu Pro 995 1000 1005
Gly Ser Ser Leu Kis Leu Giu Gly Txp Met Lys Va.1 Pro Arg Asn Asn. 1010 1015 1020 173
Lys Arg Gly Gin Gin Gly Trp Asp Arg Lys Tyr 13 e Vai Leu Glu Giy 102¾ 1030 1035 104 0 Ser Lys Vai Leu Ile Tyr Asp Asn Glu Ala Arg Ala /t V0-4.V Gin Arg 1045 1050 1055 Pro Vai Glu Glu Phe Glu Leu Cys Leu. Pro Asp Gly Asp Vai Ser Ile 1060 1065 1070 His Gly Ala Vai Gly Ala Ser Glu Leu Ala Asn Thr Ala Lys Ala Asp 1075 1080 1085 Vai Pro Tyr Ile Leu Lys Met Glu Ser His Pro His Thr Thr Cys Trp 1090 1095 1100 Pro Gly Arg Thr Leu Tyr Leu Leu Ala Pro Ser Phe Pro Asp Lys Gin 1105 1 LI 10 1115 1120 Ar® Trp Vai Thr Ala Leu Glu Ser Vai Vai Ala Gly Gly Arg Vai Ser 1125 1130 i ."L3 5 Arg Glu Lys Ala Glu Ala Asp Ala Lys Leu Leu Gly Asn ser Leu Leu 1140 1145 1 L1.50 lys Leu Glu Gly Asp Asp Arg Leu Asp Met Asn Cys Thr Leu Pro Phe 1155 1160 1165 Ser Asp Gin Vai Vai Leu Vai Gly Thr Glu Glu Gly Leu Tyr Ala Leu 1170 1175 1180 Asr Vai Leu Lys Asn Ser Leu Thr His lie Pro Gly Ile Gly Ala Vai 1185 1190 11.95 1300 Phe Gin Ile Tvr Ile Ile Lys Asp Leu Glu Lys Leu Leu Met Ile Ala 1205 1210 1215 Gly Gly Gla Arg Leu Cys Leu Vai Asp Vai Lys Lys Vai Lys Gin 1220 1225 1230 Ser leu GXii Ser Ris Leu Pro Ala Gin Pro Asp Vai Ser Pro Asn 1235 1240 1245 Ile Phe Glu Ala vai Lys Gly Cys His Leu Phe Ala AXs Gly Lys Ile 1230 1255 1260 Glu Asn Ser Leu Cys Ile Cys Ala Ala SSet Pro Ser Lys Vai Vai Ile 1265 1270 1275 1280 Leu Arg tyr Asn Asp Asn Leu Ser Lys Tyr Cys Ile Arg Lys Glu Ile 1385 1290 li 35 Glu Thr Ssx Giii Pro Cys $er Cys Ile His Phe Thr Asn Tyr Ser lie 1300 1305 L310 Leu He Gly Thr Asn Lys Phe Tyr Glu Ile Asp Met Lys Gin Tyr Thr 1315 1320 1325 Leu Asp Glu Phe Leu Asp Lys Asn Asp His Ser Leu Ala Pro Ala Vai 1330 1335 1330
Phe Ala Ser Ser Ser Asr Ser Phe Pro Vai Ser Ile Vai Qln Ala Asn 174 1345 1350 ·. L355 1360 Ser Ma Gly Gin Arg Glu Glu Tyr Leu Leu Cys Phe His Glu Phe Gly 1365 1370 L375 Vai Phe Vai Asp Ser Tyr Gly Arg Arg Ser Arg Thr Asp Asp Leu Lys 1380 1385 1390 Irp Ser Arg Leu Pro Leu Ala Phe Ala Tyr Arg Glu Pro Tyr Leu Phe 1395 1400 1405 Vai Thr His Phe Asn Ser Leu Glu Val Tle Glu Ile Gin Ala Arg Ser 1410 1415 1420 ser Leu Gly ser Pro Arg Ala Tyr Leu Glu Ile Pro Asn Pro Arg 1425 1430 1435 1440 Tyr Leu Gly Pro Ala Ile Ser Ser Gly Ala Ile Tyr Leu Ala Ser Ser 1445 1450 1455 Tyx Gin Asp Lys Levi Arg Vai 11 e Cys Cys Lys Gly Asn Leu Val Lys 1460 1465 1470 Glu Ser Gly Thr Gin Gin His Arg Val Pro Ser Thr Ser Arg Ser Ser 1475 1480 *] L485 Pro Asn Lys Arg Gly Pro Pro Thr Tyr Asn Glu His Ile Thr Lys Arg 14 90 1495 1500 Vai Ala Ser Ser Pro Ala Pro Pro Glu Gly Pro Ser His Pro Arg Glu 1505 1510 1515 1520 Pro Ser Thr Pro His Arg Tyr Arg Asp Arg Glu Gly Arg Thr Glu Leu 1525 J L530 1535 Arg Arg Asp Lys Ser Pro Gly Arg Pro Leu Glu Arg Glu Lys Ser Pro 1540 1545 1550 Gly Arg Met Leu Ser Thr Arg Arg Glu Arg Ser Pro Gly Arg Leu Phe t555 1560 1565 Glu Asp Ser Ser Arg Gly Arg Leu Pro Ala Gly Ma Val Arg Thr Pro 1570 L575 1580 Leu Ser Gin Vai Asn Lys Vai Trp Asp Gin Ser Ser Val 1585 1590 1595 <210> 7 <211> 1286
<212> PRT <213> Homo Sapiens <400> 7 175
Vai Leu Asp A-S A Gin Ile Ly5 Lys ÃSP Léu Ala Asp Lys Glu Thr Leu 1 5 10 15 Glu Asn Mst Met Gin Arg His Glu 61« Glu Ala Hrs Glu lys Gly Lys 20 25 30 Ila Leu Ser Glu Gin Lys Ala Mefc Ile Asn Ala Mst Asp Ser Lys Ile 35 40 45 176
Arg Ser Leu Glu Gin Arg Ile Vai Glu Leu Ser Glu Ala Asn Lys Leu SC 55 60 Ala Ala Asn Ser Ser LeU Phe Thr Gin Arg Asn Met Lys Ala Gin Glu 65 70 75 80 SiO. Mst Ile $er Glu Leu Arg Gin Gin Lys Fhe Tyr Leu Glu Thr Gin 85 90 95 Ala Gly Lys Leu Glu Ala Gin Asn Arg Lys Leu Glu Glu Gin Leu Glu 100 105 110 Lys Ile Ser Bis Gin Asp His Ser Asp Lys Asn Arg Leu Leu Glu Leu 115 120 125 Glu Thr Arg Leu Arg Glu Vai Ser Leu Glu His Glu Glu Gin Lys Leu 130 135 140· Glu ÍiUU Lys Arg Gin Leu Thr Glu Leu Glu Leu Ser Leu Gin Glu Arg 145 ISO 155 160 Glu Ssr Gin Leu Thr Ala Leu Gin Ala Ala Arg Ala Ala Leu Glu Ser 165 170 175 Gin Leu Ãrg Gin Ala Lys Thx Glu Leu eia Glu Thr Thr Ala Glu Ala 180 185 ISO Glu Glu Glu Ile Gin Ala Leu Thr Ale BiS Arg Asp Glu Ile Gin Axg 195 200 205 Lys Phe Asp Ala Leu Aíg Asn Ser Cys Thr Val ile Thr Asp Leu Siu 210 215 220 Glu Gin Leu Asn Gin Leu Thr Glu Asp Asn Ala Glu Leu Asn Asn Gin 225 230 235 240 Asn Phe Tyr Leu Ser Lys Gin Leu Asp Glu Ala Ser Gly Ala Asn Asp 245 250 255 Glu Ile Vai Gin Leu Arg Ser Glu Vai Asp íiís Leu Arg Arg Glu Ile 260 265 270 Thr Glu Arg Glu Met Gin Leu Thr Ser Gin Lys Gin Thr Met Glu Ala 275 280 285 Leu Lys Thr Thr Cys Thr Met Leu Glu Glu Gin Vai Mèt Asp Leu Glu 290 295 300 Ala Leu Asn Asp Glu Leu Leu Glu Lys Glu Arg Gin Trp Glu Ala Trp 305 310 313 320 Arg Ssr Val Leu G1 y Asp Glu Lys Ser Gin Ohe Glu Cys Axg Val Arg 325 330 335 Glu Léu Gin Arg Met Leu Asp Thr Glu Lys Gin Ser Arg Ala Arg Ala 340 345 350 Asp Gin Aro Ile Thr Glu Ser Arg Gin Val Val Glu Leu Ala Val Lys 353 360 363
Glu His Lys Ala Glu lis Leu Ais teu Gin Gin Ala 1«« Lys Glu Gin 177 370 375 380 lys leu lys Ala Glu Ser Leu Ser Asp Lys Leu Asn Asp Leu Glu Lys 385 380 395 400 lys His Ala Het Leu Glu Met ftân Ala Arg Ser Leu Gin Gin Lys Leu 405 410 415 Glu Thr sm Arg Glu Leu Lys Gin Arg Leu Leu Glu Glu Gin Ala Lys 420 425 430 Leu Sin Sin Gin Met Asp Leu Gin Lys Asn His Ile Phe Arg Leu Thr 435 440 445 Gin Gly leu Gin Glu Ala Leu Asp Arg Ala Asp Leu Leu Lys Thr Glu 450 455 460 &rg Ser Asp Leu Glu Tyr Gin Leu Glu Asn Ile Gin Val Leu Tyr Ser 465 470 475 480 His Glu Lys vai lys Ket Glu Gly Thr U» Ser Gin Gin Thr Lys Leu 485 490 495 lie Asp Phe Leu Gin Ma Lys «et Asp Gin Fro Ala Lys Lys Lys Lys 500 505 510 Vai Pro leu Gin Tyr Asn Glu Leu Lys Leu Ala Leu Glu Lys Glu Lys 515 520 525 Ala Arg Cys Ala Glu Leu Glu Glu Ala Leu Gin Lys Thr Arg Ile Glu 330 535 540 leu Arg Ser Ala Arg Glu Glu Ala Ala His Arg Lys Ala Thr Asp His 545 550 555 560 Pro His Pro Ser Thr Pio Ala Thr Ala Arg Gin Gin lie Ala Met, Ser 565 570 575 Ala Ile Val Arg Ser Pro Glu His Gin Pro Ser Ala Met Ser Leu Leu 5S0 585 590 Alâ Pro Pro Ser Ser Arg Arg Lys Glu Ser Ser Thr Pro Giu Glu Phe 595 600 605 Ser Arg Arg Leu Lys Glu Arg Met His His Asn Ile Pro His Arg Phe 610 615 620 Asn Vai Gly leu Asn «et Arg Ala Thr Lys Cys Ala Val Cys Leu Asp 625 630 635 640 Thr Vai His Phe Gly Arg Gin Ala Ser Lys Cys Leu Glu Cys Gin Val 645 650 655 Met Cys His Pro Lys Cys Ser Thr Cys Leu Pro Ala Thr Cys Gly Leu 660 665 670 Pro Ais Glu Tyr Ala Thr His Phe Thr Glu Ara Phe Cys Arg Asp Lys 675 680 685
Met Asn Ser Pro Gly Leu Gin Thr Lys Glu Pro Ser Ser Ser leu His S90 695 700 178
LeU Glu Gly trp Mefc Lys Vai Pro 705 710 Gly Trp ftsp Arg Lys Tyr Ile Vai 725 Tyr Asp Asn Glu Ala Arg Glu Ala 740 Glu Leu Cys Leu Pro Asp Gly ftsp 755 760 Ala Ser Glu Leu Ala. Asn Thr Ala 770 775 Lys Mefc Glu Ser Hi$ Pxo HÍS Thr 785 790 Tyr Leu Leu Ala Pro Ser Phe Pro 805 Leu Glu Ser Vai Vai Ala Gly Gly 820 Ala ftsp Ala Lys Leu Leu Gly Asn 835 840 Asp Arg Leu Asp Hat Asn Cys Thr 850 855 Leu Vai Gly I.hr Glu Glu Gly Leu 865 970 Ser Leu Th£ His Vai Pro Gly Ile 885 lie ly$ Asp Leu Glu Lys Leu Leu 900 Leu Cys Leu Vai Asp Vai Lys Lys 915 920 His Leu Pro Ala Gin Pro Asp Xle 330 S35 lys Gly Cys His L«u Phe Gly Ala 945 950 Ile Cys Ais Ala Met Pro Ser Lys 965 Ase Leu Ser Lys Tyr Cys Xle Arg 380 Gys Ser Cys Xle HiS Phe Thr Aâr. 995 1.000 Lys Phe Tyr Glu Xle Asp Ket Lys LO 10 1015 Asp Lys Asn Asp His Ser Leu Ala 1025 1030
Arg Asn Asn Lys Arg Gly Gin Gin 715 720 Leu Glu Gly Ser Lys Val Leu Ile 730 735 Gly Gin Arg Pro Val Glu Glu Phe 745 750 val Ser Ile His Gly Ala val ciy 765 Lys ftlâ Asp Val Pro Tyr Ile Leu 780 Thr Cys Trp Pro Gly Arg Thr Leu 795 800 Asp Lys Gin Arg Trp Val Thr Ala 810 815 Arg Val Sex Arg Glu Lys Ala Glu 825 830 Ser Leu Leu Lys Leu Glu Gly Asp 845 Leu Pro Phe Ser Asp Gin Val Val 860 Tyr Ala Leu Asn Val Leu Lys ftsn 87 S 860 Gly Ala Val Phe Gin Xle Tyr lie 890 8 95 Met lie Ala Gly Glu Glu Arg Al.a 905 S10 Val Lys Gin Ser Leu Ala Gin Ser 925 Ser Pro Asn Ils Phe Glu Ala Val 940 Gly Lys Ile Glu Asn Gly Leu Cys 955 960 Val Vai Xle Leu Arg Tyr Asn Glu 970 975 Lys Glu lie Glu Thr Ser Glu Pro 985 990 Tyr Ser XI* Leu lie Gly Thr Asn 1005 Gin Tyr Thr Leu Glu Glu Phe Leu : 1020 Pkq Ala Val Phe Ala .AJls Ser Ser 1035 1040 179
Asn Ser Phe Pro Vai Ser 11 e Vai Gin Vai Asn Ser Ala Gly Gin Arg 104 5 1050 L055 Glu Glu Tyr Leu Leu Cys Phe His Glu Phe Gly Val Phe Val Asp Ser 1060 1065 1070 Tyr Gly Arg Arg Sex Arg Thr Asp Asp Lôu Lys Trp Ser Arg Leu Pro 1075 1080 1085 Leu Ala Phe Ala Tyr Arg Glu Pro Tyr Leu Phe Val Thr His Phe Asn 1030 1095 1 1 1100 Ser Leu Glu Vai Ilè GlU Ile Gin Ala Arg Ser Ser Ala Gly Thr Pro 1105 1110 1115 1120 Ala Arg Ala Tyr Leu Asp lie Pro Asn Pro Arg Tyr Leu Gly Pro Ala 112 5 1130 1135 He Ser Ser Gly Ala lie Tyr Leu Ala Ser Ser Tyr Gin Asp Lys Leu 1140 1145 1250 Arg Vai He Cys Cys Lys Gly Asa Leu Val Lys Glu Ser Gly Thr Glu 1155 1160 1165 Bis Ris Arg Gly Pro Ser Thr Ser Arg Ser Ser Pro Asn Lys Arg Gly 1170 1175 1180 ?ro Pro Thr Tyr Asn Glu His 21a Thr Lys Arg Val Ala Ser Ser Pro 1135 1190 1195 1200 Ala Pro Pro Glu Gly Pro Ser His Pro Arg Glu Pro Ser Thr Pro Bis 1205 1210 1215 Arg Tyr Arg Glu Gly Arg Thr Glu Leu Arg Arg Asp Lys Ser Pro Gly 1220 1225 1230 Arg pro leu Glu Arg Glu Lys Ser Pro Gly Arg Met Leu Ser Thr Arg 1235 1240 1245 Arg Glu Arg Ser Pro Gly Arg Leu Phe Glu Asp Ser Ser Arg Gly Arg 1250 1255 1260 Leu Pro Ala Gly Ala Vai Arg Thr Pro Leu Ser Gin Val Asn Lys Val 1265 1270 1275 1280 Trp Asp Gin Ser Ser Vai 1285
Lisboa, 27 de Fevereiro de 2007

Claims (42)

  1. REIVINDICAÇÕES Molécula de ácido nucleico isolada seleccionada do grupo consistindo de: a) uma molécula de ácido nucleico compreendendo uma sequência de nucleótidos a qual é pelo menos 80% idêntica à sequência de nucleótidos da SEQ ID N°. 1 ou 3, em que a molécula de ácido nucleico codifica um polipéptido com actividade cinase; b) uma molécula de ácido nucleico compreendendo um fragmento de pelo menos 1400 nucleótidos contíguos da sequência de nucleótidos da SEQ ID N°.l ou 3, em que a molécula de ácido nucleico codifica um polipéptido com actividade cinase; c) uma molécula de ácido nucleico que codifica um polipéptido compreendendo uma sequência de aminoácidos da SEQ ID N°. 2; d) uma molécula de ácido nucleico que codifica um fragmento de um polipéptido compreendendo uma sequência de aminoácidos da SEQ ID N°. 2, em que o fragmento compreende pelo menos 1000 aminoácidos contíguos da SEQ ID N°. 2 e tem actividade cinase; e e) uma molécula de ácido nucleico que codifica uma variante alélica natural de um polipéptido compreendendo a sequência de aminoácidos da SEQ ID N°. 2, em que a molécula de ácido nucleico hibridiza com uma molécula de ácido nucleico compreendendo uma das SEQ ID N°. 1, SEQ ID NO: 3, e um complemento destas, em condições rigorosas, e em que a molécula de ácido nucleico codifica um polipéptido com actividade cinase. 2
  2. 2. Molécula de ácido nucleico isolada da reivindicação 1, a qual é seleccionada do grupo consistindo de: a) um ácido nucleico compreendendo a sequência de nucleótidos da SEQ ID N°. 1 ou 3; e b) uma molécula de ácido nucleico que codifica um polipéptido compreendendo a sequência de aminoácidos da SEQ ID N°. 2.
  3. 3. Molécula de ácido nucleico da reivindicação 1 compreendendo ainda uma sequência de ácido nucleico vectorial.
  4. 4. Molécula de ácido nucleico da reivindicação 1 compreendendo ainda uma sequência de ácido nucleico que codifica um polipéptido heterólogo.
  5. 5. Célula hospedeira que contém a molécula de ácido nucleico da reivindicação 1.
  6. 6. Célula hospedeira da reivindicação 5, em que a célula hospedeira é uma célula hospedeira de mamífero.
  7. 7. Célula hospedeira de mamífero não humano contendo a molécula de ácido nucleico da reivindicação 1.
  8. 8. Polipéptido isolado seleccionado do grupo consistindo de: a) um polipéptido que é codificado por uma molécula de ácido nucleico compreendendo uma sequência de nucleótidos a qual é pelo menos 80% idêntica a um ácido nucleico compreendendo a sequência de 3 nucleótidos da SEQ ID N°.l ou 3, em que o polipéptido tem actividade cinase; b) uma variante alélica natural de um polipéptido compreendendo a sequência de aminoácidos da SEQ ID N°. 2, em que o polipéptido é codificada por uma molécula de ácido nucleico a qual hibridiza com uma molécula de ácido nucleico compreendendo uma de SEQ ID N°. 1, SEQ IDNO: 3, em condições rigorosas, e em que o polipéptido tem actividade cinase; c) um fragmento de um polipéptido compreendendo uma sequência de aminoácidos da SEQ ID N°. 2, em que o fragmento compreende pelo menos 1000 aminoácidos contíguos da SEQ ID N°. 2, e em que o polipéptido tem actividade cinase; e d) um polipéptido compreendendo uma sequência de aminoácidos a qual é pelo menos 80% idêntica à sequência de aminoácidos da SEQ ID N°.2, em que o polipéptido tem actividade cinase.
  9. 9. Polipéptido isolado da reivindicação 8 compreendendo a sequência de aminoácidos da SEQID NO: 2.
  10. 10. Polipéptido da reivindicação 8, compreendendo ainda uma sequência de aminoácidos heteróloga.
  11. 11. Anticorpo ou parte imunologicamente activa deste que se liga selectivamente com um polipéptido da reivindicação 8.
  12. 12. Anticorpo ou parte imunologicamente activa deste da reivindicação 11, em que o anticorpo está marcado de modo detectável. 4
  13. 13. Anticorpo ou parte imunologicamente activa deste da reivindicação 12, em que a etiqueta detectável é seleccionada do grupo consistindo de: a) enzimas; b) grupos prostéticos; c) materiais fluorescentes; d) materiais luminescentes; e) materiais bioluminescentes; e f) materiais radioactivos.
  14. 14. Anticorpo ou parte imunologicamente activa deste da reivindicação 11, em que o anticorpo é seleccionado do grupo consistindo de: a) anticorpo monoclonal; b) anticorpo policlonal; c) fragmento Fab; d) fragmento F(ab'h; e) anticorpo quimérico; f) anticorpo humanizado; e g) anticorpo humano.
  15. 15. Método para produzir um polipéptido seleccionado do grupo consistindo de: a) um polipéptido compreendendo a sequência de aminoácidos da SEQ ID N°. 2; b) um polipéptido compreendendo um fragmento da sequência de aminoácidos da SEQ ID N°. 2, em que o fragmento compreende pelo menos 1000 aminoácidos contíguos da SEQ ID N°. 2, e em que o polipéptido tem actividade cinase; e 5 c) uma variante alélica natural de um polipéptido compreendendo uma sequência de aminoácidos da SEQ ID N°. 2, em que o polipéptido é codificado por uma molécula de ácido nucleico a qual hibridiza com uma molécula de ácido nucleico compreendendo uma de SEQ ID N°.l, SEQ ID NO: 3, em condições rigorosas, e em que o polipéptido tem actividade cinase; d) um polipéptido que é codificado por uma molécula de ácido nucleico compreendendo uma sequência de nucleótidos a qual é pelo menos 80% idêntica a um ácido nucleico compreendendo a sequência de nucleótidos da SEQ ID N°.l ou 3, em que o polipéptido tem actividade cinase; e) um polipéptido compreendendo uma sequência de aminoácidos a qual é pelo menos 80% idêntica à sequência de aminoácidos da SEQ ID N°.2, em que o polipéptido tem actividade cinase. compreendendo o método cultivar a célula hospedeira da reivindicação 5 em condições nas quais a molécula de ácido nucleico é expressada.
  16. 16. Método para detectar a presença de um polipéptido da reivindicação 8 numa amostra, compreendendo: a) fazer contactar a amostra com um anticorpo que se liga selectivamente com um polipéptido da reivindicação 8; e b) determinar se o anticorpo se liga com o polipéptido na amostra. 6
  17. 17. Estojo compreendendo um anticorpo que se liga selectivamente com um polipéptido da reivindicação 8 e instruções de utilização.
  18. 18. Método para detectar a presença de uma molécula de ácido nucleico da reivindicação 1 numa amostra, compreendendo os passos de: a) fazer contactar a amostra com uma sonda ou iniciador de ácido nucleico o qual hibridiza selectivamente com a molécula de ácido nucleico; e b) determinar se a sonda ou iniciador de ácido nucleico se liga com uma molécula de ácido nucleico na amostra.
  19. 19. Método da reivindicação 18, em que a amostra compreende moléculas de ARNm e é feita contactar com uma sonda de ácido nucleico.
  20. 20. Estojo compreendendo uma sonda ou iniciador de ácido nucleico que hibridiza selectivamente com uma molécula de ácido nucleico da reivindicação 1 e instruções de utilização.
  21. 21. Método para identificar um composto que um polipéptido da reivindicação 8 compreendendo os passos de: a) fazer contactar um polipéptido, ou uma célula que expressa um polipéptido da reivindicação 8 com um composto de ensaio; e b) determinar se o polipéptido se liga com o composto de ensaio. 7
  22. 22. Método da reivindicação 21, em que a ligação do composto de ensaio com o polipéptido é detectada por um método seleccionado do grupo consistindo de: a) detecção de ligação detectando directamente a ligação composto de ensaio/polipéptido; b) detecção de ligação utilizando um ensaio de ligação competitivo; e c) detecção de ligação utilizando um ensaio para a transdução de sinal mediada pela 13245.
  23. 23. Método in vitro para modular a actividade de um polipéptido da reivindicação 8 compreendendo fazer contactar um polipéptido ou uma célula que expressa um polipéptido da reivindicação 8 com um anticorpo que se liga com o polipéptido numa concentração suficiente para modular a actividade do polipéptido.
  24. 24. Método para identificar um composto que modula a actividade de um polipéptido da reivindicação 8, compreendendo: a) fazer contactar um polipéptido da reivindicação 8 com um composto de ensaio; e b) determinar o efeito do composto de ensaio na actividade do polipéptido para desse modo identificar um composto que modula a actividade do polipéptido.
  25. 25. Utilização de um anticorpo o qual modula a actividade de um polipéptido compreendendo uma sequência de aminoácidos a qual é pelo menos 80% idêntica à sequência de aminoácidos da SEQ ID No. 2 e o qual tem actividade cinase, no fabrico de um medicamento para 8 modular a capacidade de uma célula para catalisar interconversão das formas fosforilada e desfosforilada de uma proteína GTPase.
  26. 26. Utilização de um ácido nucleico antimensageiro ou ribozima que modula a expressão de uma molécula de ácido nucleico compreendendo uma sequência de nucleótidos que é pelo menos 80% idêntica à sequência de nucleótidos da SEQ ID N°, 1 ou 3 e o qual codifica um polipéptido com actividade cinase, no fabrico de um medicamento para modular a capacidade de uma célula para catalisar a interconversão das formas fosforilada e desfosforilada de uma proteína GTPase.
  27. 27. Utilização de acordo com a reivindicação 26, em que o ácido nucleico antimensageiro hibridiza em condições rigorosas com um transcrito do gene da 13245.
  28. 28. Utilização de acordo com a reivindicação 27, em que o ácido nucleico oligonucleótido compreende pelo menos 15 resíduos de nucleótidos.
  29. 29. Utilização de acordo com a reivindicação 27, em que o transcrito é um ARNm.
  30. 30. Utilização de acordo com a reivindicação 26, em que o ácido nucleico antimensageiro hibridiza em condições rigorosas com um polinucleótido com uma sequência de nucleótidos a qual é pelo menos 80% idêntica à sequência de nucleótidos da SEQ ID N°. 1.
  31. 30. Utilização de acordo com a reivindicação 26, em que o ácido nucleico antimensageiro hibridiza em condições 9 rigorosas com um polinucleótido com uma sequência de nucleótidos a qual é pelo menos 80% idêntica à sequência de nucleótidos da SEQ ID N°. 3.
  32. 32. Método in vitro para avaliar se um composto de ensaio é útil para modular pelo menos um fenómeno seleccionado do grupo consistindo de (1) interconversão das formas fosforilada e desfosforiladade de um resíduo de serina, treonina ou tirosina de uma proteína GTPase; (2) contractilidade celular; (3) crescimento celular; (4) condutividade celular; (5) entrada de uma célula no ciclo celular; (6) progressão de uma célula através do ciclo celular; (7) mitogénese; (8) metabolismo celular; (9) transcrição de genes; (11) citocinese; (12) forma celular; (13) movimento celular; (14) integração de um genoma virai no genoma de uma célula hospedeira; (15) conservação de um genoma virai no genoma de uma célula hospedeira; (16) uma alteração citológica numa célula hospedeira infectada por vírus; (17) produção virai numa célula hospedeira infectada por vírus; (18) interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; e (19) encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus, em que o método compreende: a) adicionar o composto de ensaio a uma primeira composição compreendendo um polipéptido que tem uma sequência de aminoácidos pelo menos 80% idêntica à SEQ ID N°. 2 e que exibe uma actividade 13245; e 10 b) comparar a actividade cinase na primeira composição e numa segunda composição que é essencialmente idêntica à primeira composição excepto que ela não compreende o composto de ensaio, de acordo com o que uma diferença na actividade cinase nas primeira e segunda composições é uma indicação de que o composto de ensaio é útil para modular o fenómeno.
  33. 33. Método da reivindicação 32, em que a actividade é actividade cinase da GTPase.
  34. 34. Método da reivindicação 32, em que a proteína tem a sequência de aminoácidos da SEQ ID N°. 2.
  35. 35. Método da reivindicação 32, em que a composição compreende uma célula compreendendo um ácido nucleico que codifica a proteína.
  36. 36. Método da reivindicação 35, em que o ácido nucleico é o genoma da célula.
  37. 37. Método da reivindicação 35, em que o ácido nucleico compreende o gene da 13245. (3) crescimento celular;
  38. 38. Método para avaliar se um composto de ensaio é útil para modular pelo menos um fenómeno seleccionado do grupo consistindo de (1) interconversão das formas fosforilada e desfosforiladade de um resíduo de serina, treonina ou tirosina de uma proteína GTPase; (2) contractilidade 11 celular;(4) condutividade celular; (5) entrada de uma célula no ciclo celular; (6) progressão de uma célula através do ciclo celular; (7) mitogénese; (8) metabolismo celular; (9) transcrição de genes; (11) citocinese; (12) forma celular; (13) movimento celular; (14) integração de um genoma virai no genoma de uma célula hospedeira; (15) conservação de um genoma virai no genoma de uma célula hospedeira; (16) uma alteração citológica numa célula hospedeira infectada por vírus; (17) produção virai numa célula hospedeira infectada por vírus; (18) interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; e (19) encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus, em que o método compreende: a) adicionar o composto de ensaio a uma primeira composição compreendendo uma célula a qual compreende um ácido nucleico que codifica um polipéptido que tem uma sequência de aminoácidos pelo menos 80% idêntica à SEQ ID N°, 2 e que exibe uma actividade cinase; e b) comparar a actividade cinase na primeira composição e na segunda composição que é essencialmente idêntica à primeira composição excepto que ela não compreende o composto de ensaio, de acordo com o que uma diferença na actividade cinase nas primeira e segunda composições é uma indicação de que o composto de ensaio é útil para modular o fenómeno. 12
  39. 39. Método para preparar uma composição farmacêutica para modular pelo menos um fenómeno seleccionado do grupo consistindo de (1) interconversão das formas fosforilada e desfosforilada de um resíduo de serina, treonina ou tirosina de uma proteína GTPase; (2) contractilidade celular; (3) crescimento celular; (4) condutividade celular; (5) entrada de uma célula no ciclo celular; (6) progressão de uma célula através do ciclo celular; (7) mitogénese; (8) metabolismo celular; (9) transcrição de genes; (11) citocinese; (12) forma celular; (13) movimento celular ; (14) integração de um genoma virai no genoma de uma célula hospedeira; (15) conservação de um genoma virai no genoma de uma célula hospedeira; (16) uma alteração citológica numa célula hospedeira infectada por vírus; (17) produção virai numa célula hospedeira infectada por vírus; (18) interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; e (19) encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus, em que o método compreende: a) seleccionar um anticorpo, uma molécula de ácido nucleico antimensageiro ou uma ribozima útil para modular pelo menos um dos referidos fenómenos segundo o método da reivindicação 36; e b) combinar o anticorpo, uma molécula de ácido nucleico antimensageiro ou uma ribozima com um veículo farmaceuticamente aceitável para preparar a composição farmacêutica.
  40. 40. Utilização da composição farmacêutica da reivindicação 41 no fabrico de um medicamento para modular, num ser 13 humano, pelo menos um fenómeno seleccionado do grupo consistindo de (1) interconversão das formas fosforilada e desfosforilada de um resíduo de serina, treonina ou tirosina de uma proteína GTPase; (2) contractilidade celular; (3) crescimento celular; (4) condutividade celular; (5) entrada de uma célula no ciclo celular; (6) progressão de uma célula através do ciclo celular; (7) mitogénese; (8) metabolismo celular; (9) transcrição de genes; (11) citocinese; (12) forma celular; (13) movimento celular; (14) integração de um genoma virai no genoma de uma célula hospedeira; (15) conservação de um genoma virai no genoma de uma célula hospedeira; (16) uma alteração citológica numa célula hospedeira infectada por vírus; (17) produção virai numa célula hospedeira infectada por vírus; (18) interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; e (19) encapsulação de um virião numa parte de uma membrana de uma célula hospedeira infectada por vírus.
  41. 41. Método in vitro para identificar um composto útil para modular pelo menos um fenómeno seleccionado do grupo consistindo de (1) interconversão das formas fosforilada e desfosforilada de um resíduo de serina, treonina ou tirosina de uma proteína GTPase; (2) contractilidade celular; (3) crescimento celular; (4) condutividade celular; (5) entrada de uma célula no ciclo celular; (6) progressão de uma célula através do ciclo celular; (7) mitogénese; (8) metabolismo celular; (9) transcrição de genes; (11) citocinese; (12) forma celular; (13) movimento celular; (14) integração de um genoma virai no genoma de uma célula hospedeira; (15) conservação de um genoma virai no 14 genoma de uma célula hospedeira; (16) uma alteração citológica numa célula hospedeira infectada por vírus; (17) produção virai numa célula hospedeira infectada por vírus; (18) interacção de um virião com uma membrana de uma célula hospedeira infectada por vírus; e (19) encapsulação de um vir ião numa parte de uma membrana de uma célula hospedeira infectada por vírus, em que o método compreende: a) fazer contactar o composto de ensaio e um polipéptido seleccionado do grupo consistindo de i) um polipéptido que é codificado por uma molécula de ácido nucleico compreendendo uma fracção possuindo uma sequência de nucleótidos que é pelo menos 80% idêntica à das SEQ ID N°.l e 3 e que codifica um polipéptido com actividade cinase; e ii) um fragmento de um polipéptido possuindo uma sequência de aminoácidos compreendendo a SEQ ID N°. 2, em que o fragmento compreende pelo menos 25 resíduos de aminoácidos contíguos da SEQ ID N°. 2 ou uma célula que expressa o polipéptido; e b) determinar se o polipéptido se liga com o composto de ensaio, de acordo com o que a ligação do polipéptido e do composto de ensaio é uma indicação de que o composto de ensaio é útil para modular o fenómeno. 15
  42. 42. Método da reivindicação 41, em que o polipéptido exibe um determinante antigénico em comum com um polipéptido possuindo a sequência de aminoácidos da SEQ ID N°. 2. Lisboa, 27 de Fevereiro de 2007
PT01985157T 2000-10-23 2001-10-23 13245, uma nova proteína cinase humana de tipo distrofia miotónica e suas utilizações PT1328621E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US24242900P 2000-10-23 2000-10-23

Publications (1)

Publication Number Publication Date
PT1328621E true PT1328621E (pt) 2007-03-30

Family

ID=22914754

Family Applications (1)

Application Number Title Priority Date Filing Date
PT01985157T PT1328621E (pt) 2000-10-23 2001-10-23 13245, uma nova proteína cinase humana de tipo distrofia miotónica e suas utilizações

Country Status (9)

Country Link
US (2) US6946274B2 (pt)
EP (1) EP1328621B1 (pt)
AT (1) ATE349515T1 (pt)
AU (1) AU2002234132A1 (pt)
DE (1) DE60125569T2 (pt)
DK (1) DK1328621T3 (pt)
ES (1) ES2279833T3 (pt)
PT (1) PT1328621E (pt)
WO (1) WO2002034896A2 (pt)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6638745B1 (en) * 2001-03-13 2003-10-28 Applera Corporation Isolated human kinase proteins, nucleic acid molecules encoding human kinase proteins, and uses thereof
US7326781B2 (en) 2002-04-12 2008-02-05 Bristol-Myers Squibb Company Polynucleotides encoding the human citron kinase polypeptide, BMSNKC—0020/0021
US20090088400A1 (en) 2007-09-11 2009-04-02 Puymirat Jack Prostaglandin e2 modulation and uses thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1240194A2 (en) 1999-11-24 2002-09-18 Sugen, Inc. Novel human protein kinases and protein kinase-like enzymes

Also Published As

Publication number Publication date
EP1328621A2 (en) 2003-07-23
ATE349515T1 (de) 2007-01-15
AU2002234132A1 (en) 2002-05-06
DE60125569T2 (de) 2007-10-04
DE60125569D1 (de) 2007-02-08
WO2002034896A2 (en) 2002-05-02
WO2002034896A3 (en) 2002-10-24
US20020160483A1 (en) 2002-10-31
US20050233375A1 (en) 2005-10-20
DK1328621T3 (da) 2007-04-10
EP1328621B1 (en) 2006-12-27
US6946274B2 (en) 2005-09-20
ES2279833T3 (es) 2007-09-01

Similar Documents

Publication Publication Date Title
US20020090627A1 (en) 27419, a novel human arginine-N-methyl transferase and uses thereof
US20050233375A1 (en) 13245, a novel human myotonic dystrophy type protein kinase and uses therefor
US20070178515A1 (en) 3714, 16742, 23546, and 13887 novel protein kinase molecules and uses therefor
US20020019030A1 (en) 25324, 50287, 28899, 47007, and 42967 transferase family members and uses therefor
US20020115137A1 (en) 22406, a novel human pyridoxal-phosphate dependent enzyme family member and uses therefor
WO2002020765A2 (en) 38646, a guanine nucleotide exchange factor and uses therefor
AU2051400A (en) Cark protein and nucleic acid molecules and uses therefor
US20030165845A1 (en) 47647, a novel human lipase and uses therefor
US20030166283A1 (en) 22437, a novel human sulfatase and uses therefor
US6939698B2 (en) 33945, a human glycosyltransferase family member and uses therefor
US20050203049A1 (en) 47169 and 33935, novel human glycosyl transferases and uses therefor
US6849437B2 (en) 47153, a human glycosyltransferase family member and uses therefor
US7198929B2 (en) 14790, a novel protein kinase molecule and uses therefor
US20020137712A1 (en) 69109, a novel human tyrosine phosphatase and uses therefor
WO2002095032A2 (en) Methods and compositions of human proteins and uses thereof.
US20020077312A1 (en) 3700, a novel human protein kinase and uses therefor
US20020119547A1 (en) 58569 and 50111, human proteins and methods of use thereof
US20030129625A1 (en) Methods of using 5433, a human calcium channel family member
US20030165883A1 (en) 27091, a phospholipid transporting ATPase molecule and uses therefor
US20040067513A1 (en) 84569, a novel human map kinase family member and uses therefor
US20020172998A1 (en) 32612, a novel human peptide transporter and uses therefor
US20020061575A1 (en) 27803, a novel human adenylate kinase family member and uses therefor
US20020048574A1 (en) 50090, a novel human hydratase and uses thereof
US20030166242A1 (en) 25828, a novel human aminopeptidase and uses therefor
WO2002062962A2 (en) 60491, a novel human acyltransferase family member and uses thereof