PT1584683E

PT1584683E - Receptores acoplados à proteína g órfãos humanos

Info

Publication number: PT1584683E
Application number: PT05003040T
Authority: PT
Inventors: Ruoping Chen; James N Leonard
Original assignee: Arena Pharm Inc
Priority date: 1998-11-20
Filing date: 1999-10-13
Publication date: 2007-10-17
Also published as: AU3790400A; EP1780280A1; EP1584683B1; HK1037675A1; DK1849866T3; EP2295572A1; EP1133559A2; KR20080024234A; JP2008133300A; PT1133559E; JP2004267216A; IL142538A0; EP1849866A3; EP1849866B1; JP2009298791A; KR20080024233A; NZ527622A; NZ511087A; ATE396400T1; ATE301673T1

Description

ΕΡ 1 584 683/ΡΤ

DESCRIÇÃO "Receptores acoplados à proteína G órfãos humanos"

CAMPO DO INVENTO 0 invento divulgado no presente documento de patente refere-se a receptores transmembranares e mais particularmente a receptores acoplados à proteina G ("GPCR") órfãos, humanos, endógenos. 0 presente invento refere-se apenas a Rup3; outros GPCR são discutidos apenas por referência.

ANTECEDENTES DO INVENTO

Embora existam várias classes de receptores em humanos, a de longe mais abundante e terapeuticamente relevante é representada pela classe dos receptores acoplados à proteína G (GPCR ou GPCRs). Estima-se que existam cerca de 100000 genes dentro do genoma humano e, destes, estima-se que aproximadamente 2% ou 2000 genes codifiquem para GPCRs. Receptores, incluindo GPCRs, para os quais foi identificado o ligando endógeno são referidos como receptores "conhecidos", enquanto que receptores para os quais o ligando endógeno não foi identificado são referidos como receptores "órfãos". Os GPCRs representam uma área importante para o desenvolvimento de produtos farmacêuticos: 60% de todos os farmacêuticos de prescrição foram desenvolvidos a partir de aproximadamente 20 dos 100 GPCRs conhecidos. Esta distinção não é meramente semântica, particularmente no caso de GPCRs. Assim, os GPCRs órfãos são para a indústria farmacêutica o que o ouro foi para a Califórnia nos finais do século XIX - uma oportunidade para conduzir o crescimento, a expansão, o aumento e o desenvolvimento.

Os GPCRs partilham um motivo estrutural comum. Todos estes receptores têm sete sequências de entre 22 a 24 aminoácidos hidrófobos que formam sete hélices alfa, cada uma das quais penetra a membrana (cada penetração é identificada por um número, i.e., transmembranar-1 (TM-1), transmembranar-2 (TM-2), etc.). As hélices transmembranares são unidas através de cadeias de aminoácidos entre a transmembranar-2 e transmembranar-3, a transmembranar-4 e transmembranar-5 e a 2 ΕΡ 1 584 683/ΡΤ transmembranar-6 e transmembranar-7 no lado exterior, ou "extracelular", da membrana celular (estas são referidas como regiões "extracelulares" 1, 2 e 3 (EC-1, EC-2 e EC-3), respectivamente). As hélices transmembranares são também unidas através de cadeias de aminoácidos entre a transmembranar-1 e transmembranar-2, a transmembranar-3 e transmembranar-4 e a transmembranar-5 e transmembranar-6 no lado interior, ou "intracelular", da membrana celular (estas são referidas como regiões "intracelulares" 1, 2 e 3 (IC-1, IC-2 e IC-3), respectivamente). 0 terminal "carboxilo" ("C") do receptor fica no espaço intracelular dentro da célula e o terminal "amino" ("N") do receptor fica no espaço extracelular fora da célula.

Geralmente, quando um ligando endógeno se liga ao receptor (frequentemente referido como "activação" do receptor), existe uma alteração na conformação da região intracelular que permite o acoplamento entre a região intracelular e uma "proteína G" intracelular. Foi relatado que os GPCRs são "promíscuos" no que diz respeito às proteínas G, í.e., que um GPCR pode interagir com mais de uma proteína G. Ver, Kenakin, T., Life Sciences 43: 1095 (1988). Embora existam outras proteínas G, actualmente estão identificadas as proteínas G Gq, Gs, Gi e Go. O acoplamento de um GPCR activado pelo ligando endógeno à proteína G começa um processo de cascata de sinalização (referido como "transdução de sinal"). Sob condições normais, a transdução de sinal de final resulta por fim em activação celular ou inibição celular. Pensa-se que a volta IC-3 bem como o terminal carboxilo do receptor interajam com a proteína G.

Sob condições fisiológicas, existem GPCRs na membrana celular em equilíbrio entre duas conformações diferentes: um estado "inactivo" e um estado "activo". Um receptor num estado inactivo é incapaz de se ligar à via intracelular de transdução de sinal para produzir uma resposta biológica. A alteração da conformação do receptor para o estado activo permite a ligação à via de transdução (através da proteína G) e produz uma resposta biológica. Um receptor pode ser estabilizado num estado activo através de um ligando endógeno ou um composto tal como um fármaco. 3 ΕΡ 1 584 683/ΡΤ

SUMÁRIO DO INVENTO O presente invento proporciona um método de pesquisa de compostos candidatos para identificar um agente farmacêutico para um estado de doença ou distúrbio relacionado com o pâncreas, o método compreendendo: proporcionar uma célula hospedeira eucariota compreendendo um receptor acoplado a proteina G que é uma versão activa dependente do ligando de um receptor com a SEQ ID NO:8, em que o receptor se acopla a uma proteína G; e pesquisar compostos candidatos contra o referido receptor acoplado a proteína G.

BREVE DESCRIÇÃO DOS DESENHOS

As Figuras IA e 1B proporcionam "grelhas" de referência para certos "dot-blots" aqui proporcionados (ver também, Figura 2A e 2B, respectivamente).

As Figuras 2A e 2B proporcionam reproduções dos resultados de certas análises de "dot-blot" resultantes de hCHN3 e hCHN8, respectivamente (ver também, Figuras IA e 1B, respectivamente). A Figura 3 proporciona uma reprodução dos resultados da análise de RT-PCR de hRUP3. A Figura 4 proporciona uma reprodução dos resultados da análise de RT-PCR de hRUP4. A Figura 5 proporciona uma reprodução dos resultados da análise de RT-PCR de hRUP6.

DESCRIÇÃO DETALHADA A literatura científica que evoluiu em torno de receptores adoptou vários termos para se referir a ligandos possuindo vários efeitos sobre os receptores. Para clareza e consistência, serão utilizadas as seguintes definições ao longo deste documento de patente. No ponto em estas definições entrem em conflito com outras definições para estes termos, as seguintes definições deverão prevalecer: 4 ΕΡ 1 584 683/ΡΤ

As ABREVIATURAS DE AMINOÁCIDOS aqui utilizadas são tal como expostas na Tabela 1: TABELA 1

ALANINA ALA A ARGININA ARG R ASPARAGINA ASN N ÁCIDO ASPÁRTICO ASP D CISTEÍNA CYS C ÁCIDO GLUTÂMICO GLU E GLUTAMINA GLN Q GLICINA GLY G HISTIDINA HIS H ISOLEUCINA ILE I LEUCINA LEU L LISINA LYS K METIONINA MET M FENILALANINA PHE F PROLINA PRO P SERINA SER S TREONINA THR T TRIPTOFANO TRP W TIROSINA TYR Y VALINA VAL V COMPOSIÇÃO significa um material compreendendo pelo menos um componente. ENDÓGENO deverá significar um material que um mamífero produz naturalmente. ENDÓGENO em referência a, por exemplo e não como limitação, o termo "receptor", deverá significar aquele que é naturalmente produzido por um mamífero (por exemplo e não como limitação, um humano) ou um vírus. Em contraste, o termo NÃO ENDÓGENO neste contexto deverá significar aquele que não é naturalmente produzido por um mamífero (por exemplo, e não como limitação, um humano) ou um vírus. CÉLULA HOSPEDEIRA deverá significar uma célula capaz de possuir um Plasmídeo e/ou Vector incorporado. No caso de uma 5 ΕΡ 1 584 683/ΡΤ Célula Hospedeira procariótica, um Plasmídeo é tipicamente replicado como uma molécula autónoma à medida que a Célula Hospedeira se replica (geralmente, o Plasmideo é a seguir isolado para introdução numa Célula Hospedeira eucariótica); no caso de uma Célula Hospedeira eucariótica, um Plasmideo é integrado no ADN celular da Célula Hospedeira de forma que quando a Célula Hospedeira eucariótica se replica, o Plasmideo replica-se. Para os fins do presente invento aqui divulgado, a Célula Hospedeira é eucariótica, com mais preferência, de mamífero, com maior preferência é seleccionada a partir do grupo que consiste em células 293, 293T e COS-7. LIGANDO deverá significar uma molécula endógena, de ocorrência natural específica para um receptor endógeno, de ocorrência natural. RECEPTOR NÃO ÓRFÃO deverá significar uma molécula endógena, de ocorrência natural específica para um ligando endógeno, de ocorrência natural em que a ligação de um ligando ao receptor activa uma via de sinalização intracelular. RECEPTOR ÓRFÃO deverá significar um receptor endógeno para o qual o ligando endógeno específico para esse receptor não foi identificado ou é desconhecido. PLASMÍDEO deverá significar a combinação de um Vector e ADNc. Geralmente, um Plasmídeo é introduzido numa Célula Hospedeira para os fins de replicação e/ou expressão do ADNc como uma proteína. VECTOR em referência a ADNc deverá significar um ADN circular capaz de incorporar pelo menos um ADNc e capaz de incorporação numa Célula Hospedeira. A ordem das seguintes secções é exposta para eficiência de apresentação e não se pretende que seja, nem deve ser entendida como, uma limitação da divulgação ou das reivindicações que se seguem. A. Identificação de GPCRs Humanos

Os esforços do projecto do Genoma Humano conduziram à identificação de uma plêiade de informação em relação a 6 ΕΡ 1 584 683/ΡΤ sequências de ácido nucleico situadas no genoma humano; foi o caso neste esforço de ficar disponível informação de sequências genéticas sem uma compreensão ou reconhecimento de se qualquer sequência genómica em particular contém ou pode conter informação do enquadramento de leitura aberto que traduza proteínas humanas. Vários métodos de identificação de sequências de ácido nucleico dentro do genoma humano estão dentro do âmbito da aplicação dos vulgares peritos na arte. Por exemplo, e não como limitação, uma variedade de GPCRs, aqui divulgados, foram descobertos através de revisão da base de dados GenBanK™, enquanto que outros GPCRs foram descobertos através da utilização de uma sequência de ácido nucleico de um GPCR, anteriormente sequenciado, para conduzir uma pesquisa por BLAST™ da base de dados de EST. A Tabela A, abaixo, lista os GPCRs órfãos endógenos divulgados juntamente com um GPCR homólogo dos respectivos GPCRs:

TABELA A GPCRs Órfãos Humanos Divulgados Número de Acesso Identificado Enquadramento de Leitura Aberto (Pares de Bases) Percentagem de Hamologia com o GPCR Designado Referência ao GPCR Homólogo (N2 de Acesso) hARE-3 AL033379 1260 pb 52,3% LPA-R U92642 hARE-4 AC 0 0 6 0 8 7 1119 pb 36% P2Y5 AF000546 hARE-5 AC 006255 1104 pb 32% Oryzias latipes D43633 hGPR27 AA775870 1128 pb hARE-1 AI090920 999 pb 43% KIAA0001 D13626 hARE-2 AA359504 1122 pb 53% GPR27 hPPRl H67224 1053 pb 39% EB11 L31581 hG2A AA754702 1113 pb 31% GPR4 L36148 hRUP3 ALO35423 1005 pb 30% Drosophila melanogaster 2133653 hRUP4 AI307658 1296 pb 32% pNPGPR 28% e 29% Zebrafish Ya e Yb, respectivamente NP_0 04876 AAC41276 e AAB94616 hRUP5 AC 0 0 5 8 4 9 1413 pb 25% DEZ 23% FMLPR Q99788 P21462 hRUP6 AC 0 0 5 8 71 1245 pb 48% GPR66 NP_0 060 47 hRUP7 AC 0 0 7 9 2 2 1173 pb 43% H3R AF140538 hCHN3 EST 36581 1113 pb 53% GPR27 hCHN4 AA804531 1077 pb 32% trombina 4503637 hCHN6 EST 2134670 1503 pb 36% edg-1 NP_001391 hCHN8 EST 764455 1029 pb 47% KIAA0001 D13626 hCHN9 EST 1541536 1077 pb 41% LTB4R NM_000752 hCHNlO EST 1365839 1055 pb 35% P2Y NM_0 02 563 7 ΕΡ 1 584 683/ΡΤ A homologia do receptor é útil em termos de ganho de uma apreciação de um papel dos receptores divulgados dentro do corpo humano. Adicionalmente, tal homologia pode proporcionar perspectivas quanto a um possível ligando ou possíveis ligandos endógenos que possam ser activadores naturais dos GPCRs órfãos divulgados. B. Pesquisa de Receptores

Ao longo dos últimos anos tornaram-se mais facilmente disponíveis técnicas para identificação de ligandos endógenos (isto, primeiramente, com o fim de proporcionar um meio de conduzir ensaios de ligação a receptores que requerem um ligando endógeno do receptor) porque o estudo tradicional dos receptores prosseguiu sempre a partir da presunção a priori (com bases históricas) de que o ligando endógeno tem de ser primeiro identificado antes da descoberta poder prosseguir para se encontrar antagonistas e outras moléculas que possam afectar o receptor. Mesmo em casos onde um antagonista poderia ter sido conhecido primeiro, a pesquisa prolongava-se imediatamente para a procura do ligando endógeno. Este modo de pensar persistiu na investigação de receptores mesmo depois da descoberta de receptores constitutivamente activados. 0 que não foi até agora reconhecido é que é o estado activo do receptor que é mais útil para descobrir agonistas, agonistas parciais e agonistas inversos do receptor. Para as doenças que resultam de um receptor sobre-activo ou de um receptor sub-activo, o que se deseja num fármaco terapêutico é um composto que actue diminuindo o estado activo de um receptor ou aumentando a actividade do receptor, respectivamente, não necessariamente um fármaco que seja um antagonista do ligando endógeno. Isto porque um composto que reduz ou aumenta a actividade do estado activo do receptor não precisa de se ligar no mesmo local que o ligando endógeno. Assim, tal como ensinado por um método deste invento, qualquer pesquisa de compostos terapêuticos devia começar pela pesquisa de compostos contra o estado activo independente do ligando.

Tal como se sabe na arte, os GPCRs podem ser "activos" no seu estado endógeno mesmo sem a ligação do ligando endógeno do receptor a estes. Tais receptores naturalmente activos podem 8 ΕΡ 1 584 683/ΡΤ ser pesquisados para a identificação directa (i.e., sem necessidade do ligando endógeno do receptor) de, em particular, agonistas inversos. Alternativamente, o receptor pode ser "activado" através, p. ex., mutação do receptor para estabelecer uma versão não endógena do receptor que seja activa na ausência do ligando endógeno do receptor. A pesquisa de compostos candidatos contra uma versão constitutivamente activada endógena ou não endógena dos GPCRs órfãos humanos aqui divulgados pode proporcionar a identificação directa de compostos candidatos que actuem neste receptor da superfície celular, sem requerer a utilização do ligando endógeno do receptor. Através da determinação de áreas dentro do corpo onde a versão endógena dos GPCRs humanos aqui divulgados é expressa e/ou sobre-expressa, é possível determinar estados de doença/distúrbio relacionados que estejam associados à expressão e/ou sobre-expressão do receptor; uma tal abordagem é divulgada neste documento de patente.

Em relação à criação de uma mutação que pode evidenciar activação constitutiva dos GPCRs órfãos humanos aqui divulgados esta baseia-se na distância do resíduo de prolina o qual se presume estar situado dentro de TM6 do GPCR tipicamente próximo da interface TM6/IC3 (tal resíduo de prolina parece ser bastante conservado). Através da mutação do resíduo de aminoácido situado a 16 resíduos de aminoácidos deste resíduo (presumivelmente situado na região IC3 do receptor) para, de preferência, um resíduo de lisina, pode ser obtida tal activação. Outros resíduos de aminoácidos podem ser úteis na mutação nesta posição para alcançar este objectivo. C. Identificação e/ou Selecção da Doença/Distúrbio

De preferência, a sequência de ADN do GPCR órfão humano pode ser utilizada para fazer uma sonda para (a) análise de "dot-blot" contra ARNm de tecido e/ou (b) identificação por RT-PCR da expressão do receptor em amostras de tecido. A presença de um receptor numa fonte de tecido, ou num tecido doente, ou a presença do receptor a concentrações elevadas em tecido doente em comparação com um tecido normal, pode ser utilizada de preferência para identificar uma correlação com 9 ΕΡ 1 584 683/ΡΤ um regime de tratamento, incluindo mas não se limitando a, uma doença associada a essa doença. Os receptores podem igualmente ser localizados em regiões de órgãos através desta técnica. Com base nas funções conhecidas dos tecidos específicos nos quais o receptor se localiza, o putativo papel funcional do receptor pode ser deduzido. D. Pesquisa de Compostos Candidatos

1. Técnicas genéricas de ensaio de pesquisa de GPCR

Quando um receptor de proteína G se torna constitutivamente activo (i.e., activo na ausência de ligando endógeno ligado a ele), liga-se a uma proteína G (p. ex., Gq, Gs, Gi, Go) e estimula a ligação de GTP à proteína G. A proteína G actua então como uma GTPase e hidrolisa lentamente o GTP em GDP, após o que o receptor, sob condições normais, se torna desactivado. No entanto, receptores constitutivamente activados continuam a trocar GDP por GTP. Pode ser utilizado um análogo não hidrolisável de GTP, [35S]GTPyS, para monitorizar uma maior ligação às membranas que expressam receptores constitutivamente activados. Está relatado que [35S]GTPyS pode ser utilizado para monitorizar o acoplamento de proteínas G a membranas na ausência e presença de ligando. Um exemplo desta monitorização, entre outros exemplos bem conhecidos e disponíveis dos peritos na arte, foi relatado por Traynor e Nahorski em 1995. A utilização preferida deste sistema de ensaio é para pesquisa inicial de compostos candidatos porque o sistema é genericamente aplicável a todos os receptores acoplados a proteína G independentemente da proteína G em particular que interage com o domínio intracelular do receptor.

2. Técnicas de ensaio específico de pesquisa de GPCR

Uma vez identificados compostos candidatos utilizando o ensaio "genérico" de receptores acoplados a proteína G (i.e., um ensaio para seleccionar compostos que sejam agonistas, agonistas parciais ou agonistas inversos), é preferido mais pesquisa para confirmar que os compostos interagiram no local do receptor. Por exemplo, um composto identificado através do ensaio "genérico" pode não se ligar ao receptor, mas pode em 10 ΕΡ 1 584 683/ΡΤ vez disso simplesmente "desacoplar" a proteína G do domínio intracelular. a. Gs e Gi

Gs estimula a enzima adenilil-ciclase. Gi (e Go), por outro lado, inibe esta enzima. A adenilil-ciclase catalisa a conversão de ATP em AMPc; assim, os GPCRs constitutivamente activados que se acoplam à proteína Gs estão associados a maiores níveis celulares de AMPc. Por outro lado, os GPCRs constitutivamente activados que se acoplam à proteína Gi (ou Go) estão associados a menores níveis celulares de AMPc. Ver, geralmente, "Indirect Mechanisms of Synaptic Transmission", Cap. 8, From Neuron To Brain (3a. Ed.) Nichols, J.G. et al. eds. Sinauer Associates, Inc. (1992). Assim, ensaios que detectam o AMPc podem ser utilizados para determinar se um composto candidato é, p. ex., um agonista inverso do receptor (í.e., um tal composto diminuiria os níveis de AMPc). Pode ser utilizada uma variedade de abordagens conhecidas na arte para medir AMPc; uma abordagem mais preferida assenta na utilização de anticorpos anti-AMPc num formato baseado em ELISA. Outro tipo de ensaio que pode ser utilizado é um ensaio do sistema repórter de segundo mensageiro de células inteiras. Promotores de genes conduzem a expressão das proteínas que um determinado gene codifica. 0 AMP cíclico conduz a expressão génica promovendo a ligação de uma proteína de ligação ao ADN ou factor de transcrição que responde a AMPc (CREB) que se liga depois ao promotor em locais específicos designados elementos de resposta a AMPc e conduz a expressão do gene. Podem ser construídos sistemas repórter que têm um promotor contendo múltiplos elementos de resposta a AMPc antes do gene repórter, p. ex., β-galactosidase ou luciferase. Assim, um receptor acoplado a Gs constitutivamente activado provoca a acumulação de AMPc que então activa o gene e a expressão da proteína repórter. A proteína repórter tal como β-galactosidase ou luciferase pode então ser detectada utilizando ensaios bioquímicos padrão (Chen et al. 1995). b. Go e Gq

Gq e Go estão associados à activação da enzima fosfolipase C, que por sua vez hidrolisa o fosfolípido PIP2, 11 ΕΡ 1 584 683/ΡΤ libertando dois mensageiros intracelulares: diacicloglicerol (DAG) e inositol-1,4,5-trifosfato (IP3) . Maior acumulação de IP3 está associada a activação de receptores associados a Gq e Go. Ver, geralmente, "Indirect Mechanisms of Synaptic Transmission", Cap. 8, From Neuron To Brain (3a. Ed.) Nichols, J.G. et al. eds. Sinauer Associates, Inc. (1992). Ensaios que detectam acumulação de IP3 podem ser utilizados para determinar se um composto candidato é, p. ex., um agonista inverso de um receptor associado a Gq ou Go (í.e., um tal composto diminuiria os niveis de IP3) . Receptores associados a Gq podem também ser examinados utilizando um ensaio repórter de APl em que a fosfolipase C dependente de Gq provoca a activação de genes contendo elementos de APl; assim, os receptores associados a Gq activados evidenciarão um aumento na expressão de tais genes, pelo que agonistas inversos destes evidenciarão uma diminuição de tal expressão e os agonistas evidenciarão um aumento de tal expressão. Estão comercialmente disponíveis ensaios para tal detecção.

3. Proteína de Fusão de GPCR A utilização de um GPCR órfão constitutivamente activado endógeno ou de um GPCR órfão constitutivamente activado não endógeno, para pesquisa de compostos candidatos para a identificação directa de agonistas inversos, agonistas e agonistas parciais proporciona um desafio único em que, por definição, o receptor é activo mesmo na ausência de um ligando endógeno ligado a este. Assim, é frequentemente útil que seja utilizada uma abordagem que possa aumentar o sinal obtido pelo receptor activado. Uma abordagem preferida é a utilização de uma Proteína de Fusão de GPCR.

Geralmente, uma vez determinado que um GPCR está ou esteve constitutivamente activado, utilizando as técnicas de ensaio expostas acima (bem como outras), é possível determinar a proteína G predominante que se acopla com o GPCR endógeno. 0 acoplamento da proteína G ao GPCR proporciona uma via de sinalização que pode ser avaliada. Como é preferível que a pesquisa ocorra através da utilização de um sistema de expressão de mamífero, espera-se que um tal sistema tenha proteína G endógena nele. Assim, por definição, num tal sistema, 0 GPCR órfão constitutivamente activado sinalizará 12 ΕΡ 1 584 683/ΡΤ continuamente. Neste aspecto, é preferível que este sinal seja aumentado para que na presença de, p. ex., um agonista inverso do receptor, seja mais provável que este seja capaz de diferenciar mais rapidamente, particularmente no contexto de pesquisa, entre o receptor quando é posto em contacto com o agonista inverso.

Pretende-se que a Proteína de Fusão de GPCR aumente a eficácia da proteína G que se acopla ao GPCR. A Proteína de Fusão de GPCR é preferida para pesquisa com um GPCR constitutivamente activado não endógeno porque uma tal abordagem aumenta o sinal que é de preferência utilizado em tais técnicas de pesquisa, embora a Proteína de Fusão de GPCR possa também ser (e de preferência é) utilizada com um GPCR constitutivamente activado endógeno. Isto é importante na facilitação de uma significativa razão "sinal para ruído"; uma tal razão significativa é preferida para a pesquisa de compostos candidatos tal como aqui divulgado. A construção de uma construção útil para expressão de uma Proteína de Fusão de GPCR está dentro do âmbito da aplicação dos vulgares peritos na arte. Vectores e sistemas de expressão comercialmente disponíveis oferecem uma variedade de abordagens que se podem ajustar às necessidades particulares de um investigador. Os critérios de importância para uma tal construção de Proteína de Fusão de GPCR são que a sequência do GPCR e a sequência da proteína G estejam ambas enquadradas (de preferência, que a sequência para o GPCR esteja a montante da sequência da proteína G) e que o codão de terminação do GPCR tem de ser suprimido ou substituído de forma a que, após expressão do GPCR, a proteína G possa também ser expressa. 0 GPCR pode ser ligado directamente à proteína G ou pode haver resíduos espaçadores entre os dois (de preferência, não mais de cerca de 12, embora este número possa ser facilmente avaliado por um vulgar perito na arte). Temos preferência (com base na conveniência) em utilizar um espaçador em que alguns locais de restrição que não são utilizados tornar-se-ão, eficazmente, após expressão, um espaçador. De preferência, a proteína G que se acopla ao GPCR terá sido identificada antes da criação da construção da Proteína de Fusão de GPCR. Como existem apenas algumas proteínas G que foram identificadas, é preferível que esteja disponível uma construção compreendendo 13 ΕΡ 1 584 683/ΡΤ a sequência da proteína G (í.e., uma construção de proteína G universal) para inserção de uma sequência de GPCR endógena nela; isto proporciona eficiência no contexto de pesquisa em larga escala de uma variedade de diferentes GPCRs endógenos possuindo diferentes sequências. E. Outra Utilidade

Uma utilização preferida dos GPCRs órfãos humanos aqui divulgados pode ser para a identificação directa de compostos candidatos como agonistas inversos, agonistas ou agonistas parciais (de preferência para utilizar como agentes farmacêuticos). Estas versões de GPCRs humanos podem também ser utilizadas em cenários de investigação. Por exemplo, sistemas in vitro e in vivo incorporando GPCRs podem ser utilizados para elucidar e compreender melhor os papéis destes receptores na condição humana, tanto normal como doente, bem como para compreender o papel da activação constitutiva uma vez que se aplica à compreensão da cascata de sinalização. 0 valor dos GPCRs órfãos humanos é que a sua utilidade como ferramenta de investigação é aumentada através da determinação da localização(ões) de tais receptores dentro do corpo, os GPCRs podem ser utilizados para compreender o papel destes receptores no corpo humano antes de ser identificado o ligando endógeno para estes. Outras utilizações dos receptores divulgados tornar-se-ão evidentes para os peritos na arte com base, inter alia, numa revisão deste documento de patente.

EXEMPLOS

Os seguintes exemplos são apresentados para fins de elucidação, e não como limitação, do presente invento e para proporcionar informação de referência. Embora sejam aqui divulgadas sequências de ácido nucleico e de aminoácidos especificas, os vulgares peritos na arte estão credenciados com a capacidade de fazer modificações menores a estas sequências alcançando os mesmos resultados ou resultados substancialmente semelhantes aos relatados abaixo. A menos que indicado em contrário abaixo, todas as sequências de ácido nucleico para os GPCRs órfãos humanos endógenos divulgados foram sequenciadas e verificadas. Para fins de receptores equivalentes, os vulgares peritos na arte apreciarão 14 ΕΡ 1 584 683/ΡΤ facilmente que podem ser feitas substituições conservativas às sequências divulgadas para obter um receptor funcionalmente equivalente.

Exemplo 1

GPCRS HUMANOS ENDÓGENOS 1. Identificação de GPCRs Humanos Vários dos GPCRs humanos endógenos divulgados foram identificados com base numa revisão da informação da base de dados GenBank. Ao pesquisar a base de dados, foram identificados os seguintes clones de ADNc tal como evidenciado abaixo. GPCRs Órfãos Humanos Divulgados Número de Acesso Sequência de AON Completa (Pares de Bases) Enquadramento de Leitura Aberto (Pares de Bases) Acido Nucleico SEQ ID NO: Aminoácidos SEQ ID NO: hARE-3 AL033379 111389 pb 1260 pb 1 2 hARE-4 AC 0 0 6 0 8 7 226925 pb 1119 pb 3 4 hARE-5 AC 006255 127605 pb 1104 pb 5 6 hRUP3 AL035423 140094 pb 1005 pb 7 8 hRUP5 AC005849 169144 pb 1413 pb 9 10 hRUP6 AC005871 218807 pb 1245 pb 11 12 hRUP7 AC007922 158858 pb 1173 pb 13 14

Outros GPCRs humanos endógenos divulgados foram identificados através da condução de uma pesquisa por BLAST da base de dados de EST (dbest) utilizando os seguintes clones de EST como sequências de busca. Os seguintes clones de EST identificados foram então utilizados como sonda para pesquisar uma biblioteca genómica humana. 15 ΕΡ 1 584 683/ΡΤ GPCRs Órfãos Humanos Divulgados Busca (Sequência) Clone de EST/N2 de Acesso Identificado Enquadramento de Leitura Aberto (Pares de Bases) Ácido Nucleico SEQ ID NO: Aminoácidos SEQ ID NO: hGPCR27 GPCR27 de Ratinho AA775870 1125 pb 15 16 hARE-1 TDAG 1689643 AI090920 999 pb 17 18 hARE-2 GPCR27 68530 AA359504 1122 pb 19 20 hPPRl PPR1 Bovino 238667 H67224 1053 pb 21 22 hG2A 1179426 de Ratinho Ver Exemplo 2 (a), abaixo 1113 pb 23 24 hCHN3 N.A. EST 36581 (inteiro) 1113 pb 25 26 hCHN4 TDAG 1184934 AA804531 1077 pb 27 28 hCHN6 N.A. EST 2134670 (inteiro) 1503 pb 29 30 hCHN8 KIAA0001 EST 764455 1029 pb 31 32 hCHN 9 1365839 EST 1541536 1077 pb 33 34 hCHNIO EST 1365839 de Ratinho 1365839 Humano 1005 pb 35 36 hRUP4 N.A. AI307658 1296 pb 37 38 N.A. - " não aplicável". 2. Clonagem Inteira a. hG2A (SEQ ID Nos: 23 & 24) O clone de EST de ratinho 1179426 foi utilizado para obter um clone genómico humano contendo todas menos três sequências de aminoácidos de codificação de hG2A. A extremidade 5' desta sequência de codificação foi obtida utilizando 5'RACE™ e o molde para PCR foi ADNc de Baço Humano Marathon-ready™ de Clontech. O G2A humano divulgado foi amplificado por PCR utilizando os iniciadores específicos do ADNc de G2A para o primeiro e segundo ciclos de PCR tal como mostrado em SEQ ID No: 39 e SEQ ID No: 40, tal como se segue: 16 ΕΡ 1 584 683/ΡΤ 5 '-CTGTGTACAGCAGTTCGCAGAGTG-3 ' (SEQ ID Νο: 39, Io ciclo de PCR) 5 '-GAGTGCCAGGCAGAGCAGGTAGAC-3 ' (SEQ ID No: 40, 2o ciclo de PCR). A PCR foi efectuada utilizando Advantage™ GC Polymerase Kit (Clontech; serão seguidas as instruções do fabricante), a 94°C durante 30 seg seguido de 5 ciclos de 94°C durante 5 seg e 72°C durante 4 min; e 30 ciclos de 94°C durante 5 seg e 70°C durante 4 min. Foi purificado um fragmento de PCR de aproximadamente 1,3 Kb a partir de gel de agarose, digerido com HindIII e Xbal e clonado no vector de expressão pRC/CMV2 (Invitrogen). A inserção clonada foi sequenciada utilizando o estojo T7 Sequenase™ (USB Amersham; serão seguidas as instruções do fabricante) e a sequência foi comparada com a sequência apresentada. A expressão da G2A humana será detectada através de sondagem de um "dot-blot" de ARN (Clontech; serão seguidas as instruções do fabricante) com o fragmento marcado com P . b. hCHN9 (SEQ ID NOS: 33 & 34) A sequenciação do clone de EST 1541536 indicou que hCHN9 é um clone de ADNc parcial possuindo apenas um codão de iniciação; í.e., faltava o codão de terminação. Quando foi utilizado hCHN9 para "blast" contra a base de dados (nr), a sequência a 3' de hCHN9 era 100% homóloga à região 5' não traduzida do ADNc do receptor B4 de leucotrieno, que continha um codão de terminação enquadrado com a sequência de codificação de hCHN9. Para determinar se a região 5' não traduzida do ADNc de LTB4R era a sequência a 3' de hCHN9, foi efectuada PCR utilizando iniciadores baseados na sequência a 5' que flanqueia o codão de iniciação que se encontra em hCHN9 e na sequência a 3' em torno do codão de terminação que se encontra na região 5' não traduzida de LTB4R. A sequência do iniciador a 5' utilizada foi tal como se segue: 5 ' -CCCGAATTCCTGCTTGCTCCCAGCTTGGCCC-3 ' (SEQ ID No: 41; com sentido) e 5 ' -TGTGGATCCTGCTGTCAAAGGTCCCATTCCGG-3 ' (SEQ ID No: 42; anti-sentido) . A PCR foi efectuada utilizando ADNc de timo como molde e polimerase rTth (Perkin Elmer) com o sistema tampão proporcionado pelo fabricante, 0,25 μΜ de cada iniciador e 0,2 mM de cada um dos 4 nucleótidos. A condição dos ciclos foi 17 ΕΡ 1 584 683/ΡΤ de 30 ciclos de 94°C durante 1 min, 65°C durante 1 min e 72°C durante 1 min e 10 s. Foi obtido da PCR um fragmento de 1,1 Kb consistente com o tamanho previsto. Este fragmento de PCR foi subclonado em pCMV (ver abaixo) e sequenciado (ver, SEQ ID No: 33). C. hRUP4 (SEQ ID No: 37 & 38) O hRUP4 inteiro foi clonado por RT-PCR com ADNc de cérebro humano (Clontech) como moldes: 5'-TCACAATGCTAGGTGTGGTC-3' (SEQ ID No: 43, com sentido) e 5'-TGCATAGACAATGGGATTACAG-3' (SEQ ID No: 44; anti-sentido). A PCR foi efectuada utilizando a polimerase TaqPlus™ Precision (Stratagene; serão seguidas as instruções do fabricante) pelos seguintes ciclos: 94°C durante 2 min; 94°C 30 seg; 55°C durante 30 seg, 72°C durante 45 seg e 72°C durante 10 min. Os ciclos 2 até 4 foram repetidos 30 vezes.

Os produtos de PCR foram separados num gel de agarose a 1% e um fragmento de PCR de 500 pb foi isolado e clonado no vector pCRII-TOPO (Invitrogen) e sequenciado utilizando o estojo T7 DNA Sequenase™ (Amersham) e os iniciadores SP6/T7 (Stratagene). A análise da sequência revelou que o fragmento de PCR era de facto uma forma processada alternativamente de AI307658 possuindo um enquadramento de leitura aberto contínuo com semelhança com outros GPCRs. A sequência completa deste fragmento de PCR foi tal como se segue:

5' -TCACAATGCTAGGTGTGGTCTGGCTGGTGGCAGTCATCGTAGGATCACCCATGTGGCAC

GTGCAACAACTTGAGATCAAATATGACTTCCTATATGAAAAGGAACACATCTGCTGCTTAGAAGAGTGG

ACCAGCCCTGTGCACCAGAAGATCTACACCACCTTCATCCTTGTCATCCTCTTCCTCCTGCCTCTTATG

GTGATGCTTATTCTGTACGTAAAATTGGTTATGAACTTTGGATAAAGAAAAGAGTTGGGGATGGTTCAG

TGCTTCGAACTATTCATGGAAAAGAAATGTCCAAAATAGCCAGGAAGAAGAAACGAGCTGTCATTATGA

TGGTGACAGTGGTGGCTCTCTTTGCTGTGTGCTGGGCACCATTCCATGTTGTCCATATGATGATTGAAT ACAGTAATTTTGAAAAGGAATATGATGATGTCACAATCAAGATGATTTTTGCTATCGTGCAAATTATTG GATTTTCCAACTCCATCTGTAATCCCATTGTCTATGCA-3' (SEQ.ID.NO.: 45)

Com base na sequência de cima, foram utilizados dois conjuntos de iniciadores oligonucleotidicos com sentido: 18 ΕΡ 1 584 683/ΡΤ 5'-CTGCTTAGAAGAGTGGACCAG-3' (SEQ ID Νο: 46, oligo 1), 5'-CTGTGCACCAGAAGATCTACAC-3' (SEQ ID No: 47, oligo 2) e dois conjuntos de iniciadores oligonucleotídicos anti-sentido: 5'-CAAGGATGAAGGTGGTGTAGA-3' (SEQ ID No: 48, oligo 3) 5'-GTGTAGATCTTCTGGTGCACAGG-3' (SEQ ID No: 49, oligo 4) para PCR 3'- e 5'-RACE com um ADNc de cérebro humano Marathon-Ready™ (Clontech, n.° de Cat. 7400-1) como molde, de acordo com as instruções do fabricante. Os fragmentos de ADN gerados

TM pela PCR RACE foram clonados no vector pCRll-TOPO (Invitrogen) e sequenciados utilizando os iniciadores SP6/T7 (Stratagene) e alguns iniciadores internos. O produto de 3'-RACE continha uma cauda poli(A) e um enquadramento de leitura aberto completado terminando num codão de terminação TAA. O produto de 5'-RACE continha uma extremidade 5' incompleta; í.e., o codão de iniciação ATG não estava presente.

Com base na nova sequência a 5', o oligo 3 e o seguinte iniciador: 5'-GCAATGCAGGTCATAGTGAGC-3' (SEQ ID No: 50, oligo 5) foram utilizados para a segunda volta de PCR 5' -RACE e os produtos de PCR foram analisados tal como acima. Foi realizada uma terceira volta de PCR 5'-RACE utilizando os iniciadores anti-sentido: 5'-TGGAGCATGGTGACGGGAATGCAGAAG-3' (SEQ ID No: 51; oligo 6) e 5'-GTGATGAGCAGGTCACTGAGCGCCAAG-3' (SEQ ID No: 52; oligo 7). A sequência dos produtos de PCR 5'-RACE revelou a presença do codão de iniciação ATG e outra volta de PCR 5'-RACE não gerou mais nenhuma sequência a 5'. A sequência a 5' completada foi confirmada por RT-PCR utilizando o iniciador com sentido 5'-GCAATGCAGGCGCTTAACATTAC-3' (SEQ ID No: 53, oligo 8) 19 ΕΡ 1 584 683/ΡΤ e ο oligo 4 como iniciadores e a análise da sequência do produto de PCR de 650 pb gerado a partir de moldes de ADNc de cérebro e coração humano (Clontech, n.° de Cat. 7404-1). A sequência a 3' completada foi confirmada por RT-PCR utilizando o oligo 2 e o seguinte iniciador anti-sentido: 5'-TTGGGTTACAATCTGAAGGGCA-3' (SEQ ID No: 54; oligo 9) e análise da sequência do produto de PCR de 670 pb gerado a partir de moldes de ADNc de cérebro e coração humano (Clontech, n.° de Cat. 7404-1). d. hRUP5 (SEQ ID Nos: 9 & 10) O hRUP5 inteiro foi clonado por RT-PCR utilizando um iniciador com sentido a montante de ATG, o codão de iniciação (SEQ ID No: 55) e um iniciador anti-sentido contendo TCA como codão de terminação (SEQ ID No: 56), que tinham as seguintes sequências: 5'-ACTCCGTGTCCAGCAGGACTCTG-3' (SEQ ID No: 55) 5'-TGCGTGTTCCTGGACCCTCACGTG-3' (SEQ ID No: 56) e ADNc de leucócitos periféricos humanos (Clontech) como molde. Foi utilizada ADNc-polimerase Advantage (Clontech) para a amplificação numa reacção de 50 μΐ através do seguinte ciclo com o passo 2 até ao passo 4 repetidos 30 vezes: 94°C durante 30 seg; 94°C durante 15 seg; 69°C durante 40 seg; 72°C durante 3 min; e 72°C durante 6 min. Um fragmento de PCR de 1,4 kb foi isolado e clonado com o vector pCRII-TOPO™ (Invitrogen) e completamente sequenciado utilizando o estojo T7 DNA Sequenase™ (Amersham). Ver, SEQ ID No: 9. e. hRUP6 (SEQ ID Nos: 11 & 12) O hRUP6 inteiro foi clonado por RT-PCR utilizando os iniciadores: 5'-CAGGCCTTGGATTTTAATGTCAGGGATGG-3' (SEQ ID No: 57) e 5'-GGAGAGTCAGCTCTGAAAGAATTCAGG-3' (SEQ ID No: 58); 20 ΕΡ 1 584 683/ΡΤ e ADNc de timo humano Marathon-Ready™ (Clontech) como molde. Foi utilizada ADNc-polimerase Advantage (Clontech, de acordo com as instruções do fabricante) para a amplificação numa reacção de 50 μΐ através do seguinte ciclo: 94°C durante 30 seg; 94°C durante 5 seg; 66°C durante 40 seg; 72°C durante 2,5 seg e 72°C durante 7 min. Os ciclos 2 a 4 foram repetidos 30 vezes. Um fragmento de PCR de 1,3 Kb foi isolado e clonado no vector pCRII-TOPO™ (Invitrogen) e completamente sequenciado (ver, SEQ ID No: 11) utilizando o estojo ABI Big Dye Termmator (P.E. Biosystem) . f. hRUP7 (SEQ ID Nos: 13 & 14) O RUP7 inteiro foi clonado por RT-PCR utilizando os iniciadores: 5'-TGATGTGATGCCAGATACTAATAGCAC-3' (SEQ ID No: 59; com sentido) e 5' -CCTGATTCATTTAGGTGAGATTGAGAC-3' (SEQ ID No: 60; anti-sentido) e ADNc de leucócitos periféricos humanos (Clontech) como molde. Foi utilizada ADNc-polimerase Advantage™ (Clontech) para a amplificação numa reacção de 50 μΐ através do seguinte ciclo com o passo 2 até ao passo 4 repetidos 30 vezes: 94°C durante 2 minutos; 94°C durante 15 segundos; 60°C durante 20 segundos; 72°C durante 2 minutos; 72°C durante 10 minutos. Um fragmento de PCR de 1,25 Kb foi isolado e clonado com o vector pCRII-TOPO (Invitrogen) e completamente sequenciado

TM utilizando o estojo ABI Big Dye Termmator (P.E. Biosystem). Ver, SEQ ID No: 13. g. hARE-5 (SEQ ID No: 5 & 6) O hARE-5 inteiro foi clonado por PCR utilizando os iniciadores específicos de hARE-5 5'- CAGCGCAGGGTGAAGCCTGAGAGC-3', SEQ ID No: 69 (com sentido, a 5' do codão de iniciação ATG) e 5'-GGCACCTGCTGTGACCTGTGCAGG-3', SEQ ID No: 70 (anti-sentido, a 3' do codão de terminação TGA) e ADN genómico humano como molde. Foi utilizada ADN-polimerase TaqPlus Precision™ (Stratagene) para a amplificação através do seguinte ciclo com o passo 2 ao passo 4 repetidos 35 vezes: 21 ΕΡ 1 584 683/ΡΤ 96°C, 2 minutos; 96°C, 20 segundos; 58°C, 30 segundos, 72°C, 2 minutos; e 72°C, 10 minutos.

Um fragmento de PCR de 1,1 Kb do tamanho previsto foi isolado e clonado no vector pCRII-TOPO™ (Invitrogen) e completamente sequenciado (SEQ ID No: 5) utilizando o estojo T7 DNA Sequenase™ (Amersham). h. hARE-4 (SEQ ID Nos: 3 & 4) O hARE-4 inteiro foi clonado por PCR utilizando os iniciadores específicos de hARE-4 5'-CTGGTGTGCTCCATGGCATCCC-3', SEQ ID No: 67 (com sentido, a 5' do codão de iniciação ATG) e 5' -GTAAGCCTCCCAGAACGAGAGG-3' , SEQ ID No: 68 (anti-sentido, a 3' do codão de terminação TGA) e ADN genómico humano como molde. Foram utilizados ADN-polimerase Taq (Stratagene) e DMSO a 5% para a amplificação através do seguinte ciclo com o passo 2 ao passo 3 repetidos 35 vezes: 94°C, 3 minutos; 94°C, 30 segundos; 59°C, 2 minutos; 72°C, 10 minutos.

Um fragmento de PCR de 1,12 Kb do tamanho previsto foi isolado e clonado no vector pCRII-TOPO™ (Invitrogen) e completamente sequenciado (SEQ ID No: 3) utilizando o estojo T7 DNA Sequenase (Amersham). i. hARE-3 (SEQ ID Nos: 1 & 2) O hARE-3 inteiro foi clonado por PCR utilizando os iniciadores específicos de hARE-3 5'-gatcaagcttCCATCCTACTGAAACCATGGTC-3', SEQ ID No: 65 (com sentido, os nucleótidos em minúsculas representam a extremidade saliente de HindIII, ATG como codão de iniciação) e 5'-gatcagatCtCAGTTCCAATATTCACACCACCGTC-3', SEQ ID No: 66 (anti-sentido, os nucleótidos em minúsculas representam a extremidade saliente de Xbal, TCA como codão de terminação) e ADN genómico humano como molde. Foi utilizada ADN-polimerase TaqPlus Precision™ (Stratagene) para a amplificação através do seguinte ciclo com o passo 2 ao passo 4 repetidos 35 vezes: 94°C, 3 minutos; 94°C, 1 minuto; 55°C, 1 minuto; 72°C, 2 minutos; 72°C, 10 minutos. 22 ΕΡ 1 584 683/ΡΤ

Um fragmento de PCR de 1,3 Kb do tamanho previsto foi isolado e digerido com Hindlll e Xbal, clonado no vector pRC/CMV2 (Invitrogen) nos locais HindiII e Xbal e completamente sequenciado (SEQ id No: 1) utilizando o estojo T7 DNA Sequenase™ (Amersham). j. hRUP3 (SEQ ID Nos: 7 & 8) O hRUP3 inteiro foi clonado por PCR utilizando os iniciadores específicos de hRUP3 5'-GTCCTGCCACTTCGAGACATGG-3', SEQ ID No: 71 (com sentido, ATG como codão de iniciação) e 5'-GAAACTTCTCTGCCCTTACCGTC-3', SEQ ID No: 72 (anti-sentido, a 3' do codão de terminação TAA) e ADN genómico humano como molde. Foi utilizada ADN-polimerase TaqPlus Precision™ (Stratagene) para a amplificação através do seguinte ciclo com o passo 2 ao passo 4 repetidos 35 vezes: 94°C, 3 minutos; 94°C, 1 minuto; 58°C, 1 minuto; 72°C, 2 minutos; 72°C, 10 minutos.

Um fragmento de PCR de 1,0 Kb do tamanho previsto foi isolado e clonado no vector pCRII-TOPO™ (Invitrogen) e completamente sequenciado (SEQ ID No: 7) utilizando o estojo T7 DNA Sequenase™ (Amersham).

Exemplo 2

EXPRESSÃO DO RECEPTOR

Embora esteja disponível na arte uma variedade de células para a expressão de proteínas, é preferível que sejam utilizadas células de mamífero. A primeira razão para isto é baseada na praticabilidade, i.e., utilização de, p. ex., células de levedura para a expressão de um GPCR, embora possível, introduz no protocolo uma célula não de mamífero que pode não incluir (de facto, no caso de levedura não inclui) o acoplamento ao receptor, o mecanismo genético e vias de secreção que evoluíram para os sistemas de mamífero - assim, os resultados obtidos em células não de mamífero, embora de potencial utilização, não são tão preferidos como os obtidos a partir de células de mamífero. Das células de mamífero, as células COS-7, 293 e 293T são particularmente preferidas, embora a célula de mamífero específica utilizada possa ser baseada nas necessidades particulares do artesão. O 23 ΕΡ 1 584 683/ΡΤ procedimento geral para expressão dos GPCRs divulgados é tal como se segue.

No primeiro dia, foram plaqueadas ΙχΙΟ7 células 293T por placa de 150 mm. No segundo dia, serão preparados dois tubos de reacção (as proporções a seguir para cada tubo são por placa): o tubo A será preparado misturando 20 μρ de ADN (p. ex., vector pCMV; vector pCMV com ADNc do receptor, etc.) em 1,2 ml de DMEM isento de soro (Irvine Scientific, Irvine, CA); o tubo B será preparado misturando 120 μΐ de lipofectamina (Gibco BRL) em 1,2 ml de DMEM isento de soro. Os tubos A e B são misturados por inversão (várias vezes), seguida de incubação à temperatura ambiente durante 30-45 min. A mistura pode ser referida como a "mistura de transfecção". As células 293T plaqueadas são lavadas com PBS lx, seguido de adição de 10 ml de DMEM isento de soro. Serão então adicionados às células 2,4 ml da mistura de transfecção, seguido de incubação durante 4 h a 37°C/C02 a 5%. A mistura de transfecção foi então removida por aspiração, seguida da adição de 25 ml de DMEM/Soro Fetal Bovino a 10%. As células serão então incubadas a 37°C/CC>2 a 5%. Após 72 h de incubação, as células podem então ser colhidas e utilizadas para análise.

Exemplo 3

DISTRIBUIÇÃO TECIDUAL DOS GPCRs HUMANOS DIVULGADOS Várias abordagens podem ser utilizadas para determinação da distribuição tecidual dos GPCRs aqui divulgados: 1. Análise de "Dot-Blot"

Utilizando um formato de "dot-blot" de tecido humano comercialmente disponível, os GPCRs órfãos endógenos foram sondados para uma determinação das áreas onde tais receptores se localizam. Os fragmentos de ADNc dos GPCRs do Exemplo 1 (marcados radioactivamente) foram (ou podem ser) utilizados como sonda: a sonda marcada radioactivamente foi (ou pode ser) gerada utilizando o ADNc completo do receptor (excisado do vector) utilizando um Prime-It II™ Random Primer Labeling Kit (Stratagene, #300385), de acordo com as instruções do fabricante. Um ARN humano Master Blot™ (Clontech, #7770-1) foi hibridado com a sonda marcada radioactivamente de GPCR 24 ΕΡ 1 584 683/ΡΤ humano endógeno e lavado sob condições rigorosas de acordo com as instruções do fabricante. 0 "blot" foi exposto a película Kodak BioMax™ Autoradiography de um dia para o outro a -80°C. Os resultados estão resumidos para vários receptores na Tabela B e C (ver Figuras IA e 1B para uma grelha identificando vários tecidos e suas localizações, respectivamente). São proporcionados "dot-blots" exemplares na Figura 2A e 2B para resultados derivados utilizando hCHN3 e hCHN8, respectivamente. GPCR ÓRFÃO TABELA B Distribuição Tecidual (maiores niveis, relativamente a outros tecidos no "dot-blot" hGPCR27 Cérebro fetal, Putamen, Glândula pituitária, Núcleo Caudato hARE-1 Baço, Leucócitos periféricos, Baço fetal hPPRl Glândula pituitária, Coração, Glândula salivar, intestino delgado, Testículos hRUP3 Pâncreas hCHN3 Cérebro fetal, Putamen, Córtex occipital hCHN9 Pâncreas, Intestino delgado, Fígado hCHNlO Rim, Tiróide TABELA C GPCR ÓRFÃO Distribuição Tecidual (maiores níveis, relativamente a outros tecidos no "dot-blot" hARE-3 Cerebelo esquerdo, Cerebelo direito, Testículos, Acumbens hGPCR3 Corpo caloso, Núcleo caudato, Fígado, Coração, Septo Inter-Ventricular hARE-2 Cerebelo esquerdo, Cerebelo direito, Substância hCHN8 Cerebelo esquerdo, Cerebelo direito, Rim, Pulmão 25 ΕΡ 1 584 683/ΡΤ

2. RT-PCR a. hRUP3

Para avaliar a distribuição tecidual do ARNm de hRUP3, foi efectuada RT-PCR utilizando iniciadores específicos de hRUP3 e painéis de ADNc de múltiplos tecidos humanos (MTC, Clontech) como moldes. Foi utilizada ADN-polimerase Taq (Stratagene) para a reacção de PCR, utilizando os seguintes ciclos de reacção numa reacção de 40 μΐ: 94°C durante 2 min; 94°C durante 15 seg; 55°C durante 30 seg; 72°C durante 1 min; 72°C durante 10 min. Os iniciadores foram tal como se segue: 5'-GACAGGTACCTTGCCATCAAG-3' (SEQ ID No: 61; com sentido) 5'-CTGCACAATGCCAGTGATAAGG-3' (SEQ ID No: 62; anti-sentido).

Foram carregados 20 μΐ da reacção num gel de agarose a 1%; os resultados estão expostos na Figura 3.

Tal como é apoiado pelos dados da Figura 3, dos 16 tecidos humanos no painel de ADNc utilizado (cérebro, cólon, coração, rim, pulmão, ovário, pâncreas, placenta, próstata, esqueleto, intestino delgado, baço, testículos, timo, leucócitos e fígado) uma única banda de hRUP3 é evidente apenas no pâncreas. A análise comparativa adicional da sequência proteica de hRUP3 com outros GPCRs sugere que hRUP3 está relacionada com GPCRs possuindo ligandos endógenos de moléculas pequenas de tal forma que se prevê que o ligando endógeno de hRUP3 seja uma molécula pequena. b. hRUP4

Foi efectuada RT-PCR utilizando os oligos 8 e 4 de hRUP4 como iniciadores e os painéis de ADNc de múltiplos tecidos humanos (MTC, Clontech) como moldes. Foi utilizada ADN-polimerase Taq (Stratagene) para a amplificação numa reacção de 40 μΐ através dos seguintes ciclos: 94°C durante 30 segundos; 94°C durante 10 segundos; 55°C durante 30 segundos; 72°C durante 2 minutos e 72°C durante 5 minutos com os ciclos 2 a 4 repetidos 30 vezes. 26 ΕΡ 1 584 683/ΡΤ 20 μΐ da reacção foram carregados num gel de agarose a 1% para analisar os produtos de RT-PCR e verificou-se que o ARNm de hRUP4 era expresso em muitos tecidos humanos, com a expressão mais forte em coração e rim (ver Figura 4) . Para confirmar a autenticidade dos fragmentos de PCR, um fragmento de 300 pb derivado da extremidade 5' de hRUP4 foi utilizado como sonda para a análise de "Southern Blot". A sonda foi marcada com 32P-dCTP utilizando o Prime-It II™ Random Primer Labeling Kit (Stratagene) e purificada utilizando as micro-colunas ProbeQuant G-50 (Amersham). A hibridação foi feita de um dia para o outro a 42°C após uma pré-hibridação de 12 h.

O "blot" foi finalmente lavado a 65°C com SSC 0,1χ. O "Southern blot" confirmou os fragmentos de PCR como hRUP4. c. hRUP5

Foi efectuada RT-PCR utilizando os seguintes iniciadores específicos de hRUP5: 5'-CTGACTTCTTGTTCCTGGCAGCAGCGG-3' (SEQ ID No: 63; com sentido) 5 ' -AGACCAGCCAGGGCACGCTGAAGAGTG-3 ' (SEQ ID No: 64; anti-sentido) e os painéis de ADNc de múltiplos tecidos humanos (MTC,

Clontech) como moldes. Foi utilizada ADN-polimerase Taq (Stratagene) para a amplificação numa reacção de 40 μΐ através dos seguintes ciclos: 94°C durante 30 seg; 94°C durante 10 seg; 62°C durante 1,5 min; 72°C durante 5 min e com os ciclos 2 a 3 repetidos 30 vezes. 20 μΐ da reacção foram carregados num gel de agarose a 1,5% para analisar os produtos de RT-PCR e verificou-se que o ARNm de hRUP5 era expresso apenas nos leucócitos do sangue periférico (dados não mostrados). d. hRUPô

Foi aplicada RT-PCR para confirmar a expressão e para determinar a distribuição tecidual de hRUP6. Os oligonucleótidos utilizados, com base num alinhamento de AC005871 e segmentos de GPR66, tinham as seguintes sequências: 5'-CCAACACCAGCATCCATGGCATCAAG-3' (SEQ ID No: 73; com sentido), 5 ' -GGAGAGTCAGCTCTGAAAGAATTCAGG-3 ' (SEQ ID No: 74; anti-sentido) 27 ΕΡ 1 584 683/ΡΤ e os painéis de ADNc de múltiplos tecidos humanos (MIC, Clontech) foram utilizados como moldes. A PCR foi efectuada utilizando polimerase TaqPlus Precision (Stratagene; serão seguidas as instruções do fabricante) numa reacção de 40 μΐ através dos seguintes ciclos: 94°C durante 30 seg; 94°C durante 5 seg; 66°C durante 40 seg; 72°C durante 2,5 min e 72°C durante 7 min. Os ciclos 2 a 4 foram repetidos 30 vezes. 20 μΐ da reacção foram carregados num gel de agarose a 1,2% para analisar os produtos de RT-PCR e um fragmento de ADN de 760 pb especifico representando hRUP6 era expresso predominantemente no timo e com menos expressão no coração, rim, pulmão, próstata, intestino delgado e testículos (ver, Figura 5).

Embora esteja disponível para os que estão na arte uma variedade de Vectores, para fins de utilização para GPCRs endógenos e não endógenos, é preferível que o Vector utilizado seja pCMV. Este vector foi depositado na American Type Culture Collection (ATCC) a 13 de Outubro de 1998 (10801 University Blvd., Manassas, VA 20110-2209 USA) sob as condições do Tratado de Budapeste para o Reconhecimento Internacional do Depósito de Microrganismos com o Fim de Procedimento de Patente. O ADN foi testado pela ATCC e determinado ser. A ATCC atribuiu o seguinte número de depósito a pCMV: ATCC #203351. 28 ΕΡ 1 584 683/ΡΤ

LISTAGEM DAS SEQUÊNCIAS

(1) INFORMAÇÃO GERAL (i) REQUERENTE: Chen, Ruoping

Dang, Huong T.

Liaw, Chen W.

Lin, I-Lin

(ii) TÍTULO DO INVENTO: Receptores Acoplados à Proteína G Órfãos Humanos (iii) NÚMERO DE SEQUÊNCIAS: 74 (iv) ENDEREÇO PARA CORRESPONDÊNCIA: (A) DESTINATÁRIO: Arena Pharmaceuticals, Inc. (B) RUA: 6166 Nancy Ridge Drive (C) CIDADE: San Diego

(D) ESTADO: CA

(E) PAÍS: USA (F) CÓDIGO POSTAL: 92121 (v) FORMATO LEGÍVEL EM COMPUTADOR: (A) TIPO DE MEIO: Disquete

(B) COMPUTADOR: Compatível com IBM PC

(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SUPORTE LÓGICO: Patentln Edição #1.0, Versão #1.30 (vi) DADOS DO ACTUAL PEDIDO:

(A) NÚMERO DO PEDIDO: US (B) DATA DE APRESENTAÇÃO: (C) CLASSIFICAÇÃO: (viii) INFORMAÇÃO SOBRE REPRESENTANTE/AGENTE: (A) NOME: Burgoon, Richard P. (B) NÚMERO DE REGISTO: 34787 (ix) INFORMAÇÃO SOBRE TELECOMUNICAÇÕES: (A) TELEFONE: (858) 453-7200 (B) TELECÓPIA: (858) 453-7210 (2) INFORMAÇÃO PARA SEQ ID NO: 1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1260 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1: 60

ATGGTCTTCT CGGCAGTGTtT G&CTGCGTTC CATACCSGOA CÃTCCAACAC AACATTTGTC 29 ΕΡ 1 584 683/ΡΤ GTGTAT3AAA ACACCTACAT GAATATTACA CTCCCTCCAC CATTCC&GCA TCCTGACCTC 120 AGTCCATTGC TTAGATA.TAG TTTTGAAACC ATGGCTCCCA CTGGTTTGAG TTCCTTGACC 18 0 GTGMTAGTA CAGCTGTGCC CACAACACCA GCAOCATTm AGÃ.GCCTAAA CTTGCCTCTT 24 0 CAGATCACCC TTTCTGCTAT AATGATATTC attctgtttg TGTCTTTTCT TGGGAACTTG 300 GTTGTTTGCC TCÂTGGTTTA CCAAAAAGCT GCCATGAGGT CTGCAATTAA CATCCTCCTT ISO GCCAGCCTAG CTTTTGCAGA CATGTTGCTT GCAGTGCTGA ACATGCCCTT TGCCCTG6TA 420 ACTATTCTTA ÇTACCCGATG GATTTTTGGG AAATTCTTCT GTAGGGTATC TGCTATQTTT 430 TTCTGGTTAT TTGTGATAGA AGGAGTAGCC ATCCTGCTCA TCATTAGCAT AGATAGGTTC 540 CTTATTATAG TCCAGAGGCA GGATAAGCTA AACCCATATA GAGCTAAGGT TCTGATTGCA 600 GTTTCTTGGG CMCTÍCCTT TTGTGTAGC? TTTCCTTTAG CCGTAGGMA CCCCGACCTS 660 CAGATACCTT CCCGAGCTCC CCAGTGTGTG TTTGGGTACA CAACCAATCC AGGCTACCAG 720 GCTTATGTGA TTTTGATTTC TCTCATTTCT TTCTTCATAC CCTTCCTGGT AATACTGTAC 780 TCATTTATGG GCATACTCAA CACCCTTCGG CACAATGCCT TGAGGATCCA TAGCTACCCT 840 GAAGGTATAT GCCTCAGCCA GGCCAGCAAA CTGGGTCTCA TGAGTCTGCA GAGACCTTTC SOO CAGATGAGCA TTGACATGGG CTTTAAAACA CGTGCCTTCA CCACTÂTTTT GATTCTCTTT 960 GCTGTCTTCA TTGTCTGCTG GGCCCCATTC AccAermcA GCCTTSTGGC AACATTCAGT1020 AAGCACTTTT ACTAXCAGCA CAACTETTTT GAGATTAGCA CCTGGCTACT GTGGCTCTGC10 8 0 TACCTCAAGT CTGCATTGAA TCCGCTGATG VACTACTGGA GGATTMGAA ATXCCATGAT1140 GCTTGCCTGG ACATGATGCC TAAGTCCTTC AAGTTTTTGC CGCAGCTCCC TGGTCACACA120 0 AAGCGACQGA TACGTCCTAG TGCTGTCTAT GTGTGTGGGG AACATCGGAC GGTGGTGTGÂ12 S 0 (2) INFORMAÇÃO PARA SEQ ID NO: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 419 aminoácidos (B) TIPO: aminoácido (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 2:

Het Vai She Ser Ala Vai Leu Thr Ala Phe Sis Thr Gly Thr Ser Agn I S 10 15 30 ΕΡ 1 584 683/ΡΤ

Thr Thr Phe Vai Vai Tyr Glu Asn Thr Tyr Met Asn Ile Thr Leu Pro 20 25 30

Pro Pro Phe Gin His Pro Asp Leu Ser Pro Leu Leu Αχ-g Tyr Ser Phe 35 40 45

Giu Thr Met Ale Pro Thr Gly Leu Ser Ser Leu Thr Vai Asn Ser Thr 50 55 60

Ala Vai Pro Thr Thr Pro Ala Ala Phe Lys Ser Leu Asn Leu Pro Leu 65 70 75 80

Gin Ile Thr Leu Ser Ala Ilá Mefc Ile Phe Ile Leu Phe Vai Ser Phe 85 90 55

Leu Gly Asn Leu Vai Vai Cys Leu Met Vai Tyr Gin Lys Ala Aia Met 100 105 110

Arg Ser Ala Ile Asn Ile Leu Leu Ala Ser Leu Aia Phe Ala Aap Met 115 120 125

Leu Leu Ala Vai Leu Asn Met Pro Phe Ala Leu Vai Thr Ile Leu Thr 130 135 140

Thr Arg Trp Ile Phe Gly Lys Phe Phe Cys Arg Vai Ser Ala Met Phe 145 150 155 160

Phe Trp Leu Phe Vai Ile Giu Gly Vai Ala Ile Leu Leu Ile Ile Ser 165 170 175

He Asp Arg Phe Leu Ile Ile Vai Gin Arg Gin Asp Lys Leu Asn Pro 180 185 ISO

Tyr Arg Ala Lys vai Lsu ile Ala Vai Ser Trp Ala Thr Ser Phe Cys 195 200 205

Vai Ala Phe Pro Leu Ala Vai Gly Asn Pro Asp Leu Gin. ile Pro Ser 210 215 220

Arg Ala Pro Gin Cys Vai Phe Gly Tyr Thr Thr Asn Pro Gly Tyr Gin 22S 230 235 240

Aia Tyr Vai Ile Leu Ile Ser Leu Ile Ser Phe Phe Ila Pro Phe Leu 245 250 2S5

Vai Ile Leu Tyr Ser Phe Met Gly Ile Leu Asn Thr Leu Arg His Asn 260 265 270

Ala Leu Arg Ile His Ser Tyr Pro Glu Gly He Cys Leu Ser Gin Aia 275 280 285

Ser Lys Leu Gly Leu Met Ser Leu Gin Arg Pro Phe Gin Met Ser Ile 290 295 300

Asp Met Gly phe Lys Thr Arg Ala Phe Thr Thr Ile Léu Ile Leu Phe 31 ΕΡ 1 584 683/ΡΤ 305 310 315 320

Ala val Phe He Val Cys Trp Ala Pro Phe Thr Thr Tyr Ser Leu Val 32$ 330 335 Ala Thr Phe Ser Lys His Phe Tyr Tyr Gin His As» Phe Phe Glu ile 340 345 350 ser Thr Trp Leu Leu Trp Leu Cys Tyr Leu Lys Sex Ala Leu Asn Pro 355 360 365 Leu Ile Tyr Tyr Trp Arg Ha Lys Lys Phe His ASp Ala Cys Leu Asp 370 375 380 Met Met Pro Lys Ser Phe Lys Phe Leu Pro Gin Leu Pro Gly His Thr 385 390 395 400 Lys Arg Arg Ile Arg Pro Ser Ala Val Tyr Val Cys Gly Glu His Arg 405 41Q 415

Thr Vai Vai (2) INFORMAÇÃO PARA SEQ ID NO: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1119 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 3: ATGTTAGCCA ACAGCTCCTC AACCAACAGT TCTGTTCTCC CGTGTCCTGA CTACCGACCT 50 ACCCACCGCC TGCACTTGGT GGTCTACAGC TTGGTGCTGG CTGCCGGGCT CCCCCTCAAC 120 GCGCTAGCCG TCTGGGTCTT cctgcgcgcg CTGCGCGTGC ACTCGGTGGT GAGCGTGTAC ISO ATGTGTAACC TGGCGGCCAG CGACCTGCTC TTCACCCTCT CGCTGCCCGT TCCTCTCTCC 240 TACTACGCAC TGCACCACTG GCCCTTCCCC GACCTCCTGT GCCAGACSAC GGCCGCCATC 300 TTCCAGATGA ACATGTACGG CAGCTGCATC TTCCTGATGC TCATCMCGT GGACCGCTAC 350 GCCOCCATCG TGCACCCGCT GCGACTGCGC CACCTGCGGC GGCCCCGCGT GGCGCGGCTG 420 CTCTGCCTGG GCGTGTGGGC GCTCATCCTG GTGTTTGCCG TOCCCGCCGC CCGCGTGCAC 480 AGGCCCTCGC GTTGCCGCTA CCGGGACCTC GAGGTGCGCC TATGCTTCGA GAGCTTCAGC 540 GACGAGCTGT GGAAAGGCAG GCTGCTGCCC CTCGTGCTGC TGGCCGAGGC GCTGGGCTTC 600 32 ΕΡ 1 584 683/ΡΤ 3CTGGCGCGC SSO GGCTAACÇTG 720 CGGGCTGCTG 780 GGTGCTGATG 840 CTACTTTAGC SOO CAGGACCTCS 960 CÃCCACCGAC1020 CCACTCTCTG1080 1119

CTGCTGCCCC TGGCGGCGGT GGTCTACTCG TCGGGCCGAG TCTTCTGGAC CCCGACGCCÃ CGCAGAGCCA GCGGCGGCGG AAGACCGTGC GCCTCCTGCT GTCATCTTCC TGCTGTGCTT CG7GCCCTAC ÂACAGCACGC TGGCGGTCTA CGGAGCAAGC TGGTGGCOGC CAGCGTGÇCT GCCCGCGATC GCGTGC3CQG GTGATGGTGC TGCTG3CCGG CGCCAACTGC GTGÇTGGACC CGCTGGTGTA GCCGAGGGCT TCCGCAACAC CCTGCGCGGC CTGGGCACfC CGCACCGGGC GCCACCAACG GGACGCGGGC GGCGCTCGCG CAATCCGAAA GGTCCGCCGT GCCACCAGGC CGGATGCCGC CAGTCAGGQG CTGCTCCGAC CCTCCGACTC TCTTCCTTCA CACAGTGTCC CCAGGATTCC GCCCTCTGA (2) INFORMAÇÃO PARA SEQ ID NO: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 372 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 4:

Met Leu Ala Asn Ser Ser Ser Thr Asa Ser ser Val Leu Pro Cys Pro 1 Λ, 5 10 15 Asp Tyr Arg Pro Tbr Bis Arg Leu His Leu Val Val Tyr Ser Leu Val 20 25 30 Leu Ala Ala Gly Leu Pro Leu Asa Ala Leu Ala Leu Trp Val Phe Leu 35 40 45 Arg Ala Leu Arg Vai His Ser Vai Vai Ser Vai Tyr Met Cys Asn Leu 50 SS 60 Ai a Ala Ser Asp Leu Leu Phe Thr Leu Ser Leu Pro Val Arg Leu Ser 65 70 75 80 Tyr Tyr Ala Leu His Hia Trp Pro Phe Pro Asp Leu Leu Cys Gin Thr 85 90 95 Thr Gly Ala lie Phe Gla Met Asa Met Tyr Gly Ser Cys lie Phe Leu 100 105 110 Met Leu Asa Vai Asp Arg Tyr Ala Ala Ile val His Pro Leu Arg 115 120 125 33 ΕΡ 1 584 683/ΡΤ

Leu Arg His Leu Arg Arg Pro Arg Vai Ala Arg Leu Leu Cys Leu Gly 130 135 140 KÍS íeo v«l Trp Ala Leu He Leu Vai Phe Ala Vai Pro Ala Ala Arg Vai 145 150 155

Arg Pro Ser Arg Cys Arg Tyr Arg Asp Leu Glu Vai Arg Leu Cys Phe 165 170 175

Glu Ser Phe Ser Asp Glu Leu Trp Lys Gly Arg Leu Leu Pro Leu Vai ISO 195 190

Leu Leu Ala Glu Ala Leu Gly Phe Leu Leu Pro Leu Ala Ala Vai Vai 195 200 205

Tyr Ser Ser Gly Arg Vai Phe Trp Thr Leu Ala Arg Pro Asp Ala Thr 210 215 220

Gin Ser Gin Arg Arg Arg Lys Thr Vai Arg Leu Leu Leu Ala Asn Leu 225 230 235 240

Vai Ue Phe Leu Leu Cys Phe Vai Pro Tyr Asn ser Thr Leu Ala Vai 245 2S0 255

Tyr Gly Leu Leu Arg Ser Lys Leu Vai Ala Ala Ser Vai Pro Ala Arg 260 26S 270

Asp Arg Vai Arg Gly Vai Leu mt Vai Met Vai Leu Leu Ala Gly Ala 275 280 285

Asn Cys Vai Leu Asp Pro Leu Vai Tyr Tyr Phe Ser Ala Glu Gly Phe 290 235 3Q0

Arg Asn Thr Leu Arg Gly Leu Gly Thr Pro His Arg Ala Arg Thr Ser 305 310 315 320

Ala Thr Asn Gly Thr Arg Ala Ala Leu Ala Gin Ser Glu Arg Ser Ala 325 330 335

Vai Thr Thr Asp Ala Thr Arg Pro Asp Ala Ala Ser Gin Gly Leu Leu 340 345 350

Arg Pro Ser Asp Ser His Ser Leu Ser Ser Phe Thr Gin Cys Pro Gin 355 360 365

Asp Ser Ala Leu 370 (2) INFORMAÇÃO PARA SEQ ID NO: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1107 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear 34 ΕΡ 1 584 683/ΡΤ (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 5: ATGGCCAACT CCACAGGGCT GAACGCCTCA GAAGTCGCAG GCTCGTTGGG GTTGATCCTG 60 GCAÕCTGTCG TGGAGGTGGG '3GCACTGCTG GGCAACGGCG CGCTGCTGGT CGTÕGTGCTG 120 CGCACGCCGG GACTGCGCGA CGCGCTCTAC CTQGCGCACC TGTGCGTCGT GGACCTGCTG 180 GCGGCCGCCT CCATCATGCC GCTGGGCCTG C7GGCCGCAC CGÇCGCCCGG GCTGGGCCGC 240 GTGCGCCTGG GCCCCGCGCC ATSCCGCGCC GCTCGCTTCC TCTCCGCCGC TCTGCTGCCG 300 GCCTGCACGC TCGGGGTGGC cgcacttggc CTGGCACGCT ACCGCCTCA? CGTGCACCCG 360 CTGCGGCCAG GCTCGCGGCC GCCGCCTGTG CTCGTGCTCA CCGCCGTGTG GGCCGCGGCG 420 GGACTGCTGG GCGCGCTCTC CCTGCTCGGC CCGCCGCCCG CACCGCCCCC TGCTCCTGCT 480 CGCTGCTCGG TCCTGSCTGG GGGCCTCGGG CCCTTCCGGC CGCTCTGGGC CCTGCTGGCC 540 TTCGCGCTGC ccGcccrccr GCTGCTCGGC GCCTACGGCG GCATCTTCGT GGTGGCGCGT 600 CGCGCTGCCC TGAGGCCCCC ACGGCCGGCG CGCGGGTCCC GACTCCGCTC GSACTCTCTG 660 GATAGCCGCC TTTCCATCTT GCCGCCGCTC CGGCCTCGCC IXÍCCCGGGGG CAAGGCGGCC 720 ÇTGGCCCCAG CGCTGGCCGT GGGCCAATtT GCAGCC7GCT GGCTGCCTTA TGGCTGCGCG 780 TGCCTGGCGC CCGCAGCGCG GGCCGCGGAA GCC3AAGCGG CTGTCACCTG GGTCGCCTAC 840 TCGGCCTTCG CGGCTCACCC CTTCCTGTAC GGGCTSCTGC AGCGCCCCGT GCGCTTGGCA 900 CTGGGCCGCC TCTCTCGCCG TGCACTGCCT GGACCEGTGC GGGCCTGCAC TCCGCAAGCC 960 TGGCACCCGC GGGCACTCTT GCAATGCCTC CAOAGACCCC CAGAGGGCCC TGCCQTAGGC10 20 CCTTCTGAGG CTCCAGAACÂ GACCCCCGAG TTGGCAGGAG GGCGGAGCCC CGCATACCAG1080 GGGCCACCTG AGAGTTCTCT CTCCTGA 1107 (2) INFORMAÇÃO PARA SEQ ID NO: 6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 368 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 6: 35 ΕΡ 1 584 683/ΡΤ

Met Ala As η Ser Thr Gly Leu Asn Ala Ser Glu Vai Ala Gly Se- Leu 1 5 10 is

Gly Leu Sis Leu Ala Ala Vai Vai Glu Vai Gly Ala Leu Leu Gly Asa 20 25 30

Gly Ala Leu Leu Vai Vai Vai Lau Arg Thr Pro Gly Leu Arg Asp Ala 35 40 4.c

Leu Tyr jj«u Ala His Leu Cys Vai Vai Asp Leu Leu Ala Ala Ala Ser 50 5S eo

Ile Met Pro Leu Gly Leu Leu Ala Ala Pro Pro Pro Gly Leu Gly Arg 65 70 75 80 vai Arg Leu Gly Pro Ala Pro Cys Arg Ala Ala Arg Phe Leu ser Ala SS 55

Ala Leu Leu Pro Ala Cyg Thr Leu Gly Vai Ala Ala Leu Gly Leu Ala 100 105 xj,(j

Arg Tyr Arg Leu Ile Vai His Pro Leu Arg Pro Gly Ser Arg Pro Pro Ur r2C 155

Pro Vai Leu Vai Leu Thr Ala Vai Trp Ma Ala Ala Gly Leu Leu Gly 130 135 140

Ala Leu Ser Leu Leu Gly Pro Pro Pro Ala Pro Pro Pro Ala Pro Ala

145 150 155 ISO

Arg Cys Ser Vai Leu Ala Gly Gly Leu Gly Pro Phe Arg Prõ Leu Trp 165 170 175

Ala Leu Leu Ala phe Ala Leu Pro Ma Leu Leu Leu Leu Gly Ala Tyr ISO 185 130

Gly Gly Ile Phe Vai Vai Ala Arg Arg Ala Ala Leu Arg Pro Pro Arg 1SS 300 205

Pro Ala Arg Gly Ser Arg Leu Arg Ser Asp Ser Leu Asp Ser Arg Leu 210 215 220

Ser Ile Leu Pro pro Leu Arg Pro Arg Leu Pro Gly Gly Lys Ala Ala 225 230 235 240 Léu Ala Pro Ala Leu Ala Vai Gly Gin Phe Ala Ala Cys Trp Leu Pro 245 250 255

Tyr Gly Cys Ala Cys Leu Ala Pro Ala Ala Arg Ala Ala Glu Ala Glu 260 265 270

Ala Ala Vai Thr Trp Vai Ala Tyr Ser Ma Phe Ala Ala His Pro Phe 27S 2SO 285

Leu Tyr Gly Leu Leu Gin Arg Pro Vai Arg Leu Ala Leu Gly Arg Léu 36 ΕΡ 1 584 683/ΡΤ

230 235 3QO

Ser Arg Arg Ala Leu Pro Gly Pro Vai Arg Ala Cys Thr Pro Gin Ala 305 310 315 320 Trp Híg Pro Arg Ala Leu Leu Gin Cys Leu Gin Arg Pro Pro Glu Gly 325 330 335 Pro Ala Vai oiy Pro Ser Glu Ala Pro Glu Gin Thr Pro Glu Leu Ala 340 345 350 Gly Gly Arg Ser Pro Ala Tyr Gin Gly Pro Pro Glu Ser Ser Leu Ser 355 360 355 (2) INFORMAÇÃO PARA SEQ ID NO: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1008 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 7: ATGGAATCAT CTTTCTCATT TGGAGTGATC CTTGCTGTCC TGGCCTCCCT CATCATTGCT so ACTMCACAC TAGTGGCTGT GGCTGTGCTG CTSTTGATCC ACAAGAATGA TGGTGTGAGT 120 CTCTGCTTCA CCTTGAATCT GGCTGTGGCT GACACCTTGA TTGGTGTGGC CATCTCTGGÇ 180 CTACTCACAG ACCAGCTCTC CAGCCCTTCT CGGCCCACAC AGAAGACCCT GTGCAGCCTG 240 CGGATGGCAT TTGTCACTTC CTCCGCAGCT GCCTCTGTCC TCACGGTCAT GCTGATCACC 3QQ TTTGACAGGT ACCTTGCCAT CAAGCAGCCC ttcggctact TGAAGATCAT GAGTGGGTTC 350 GTGGCCGGGG CCTGCATTGC CGGGCTGTGG TTAGTGTCTT ACCTCATTGG CTTCCTCCCA 420 CTCGGAATCC CCATGTTCCA GCAGACTGCC TACAÂÁGGGC AGTGCAGCTT CTTTGCTGTA 480 TTTCACCCTC ACTTCGTGCT GACCCTCTCC TGCGTTGGCT TCTTCCCAGC CATGCTCCTC 540 TTTGTCTTCT TCTACTGCGA CATGCTCAAG ATTGCCTCCA TGCACAGCCA GCAGATTCGA SQO AAGATGGAAC ATGCAGGAGC CATGGCTGGA GGTTÃTCGAT CCCCACGGAC TCCCAGCGAC 560 TTCAAAGCTC TCCGTACTGT GTC7GTTCTC ATXGGGAGCT TTGCTCTATC CTGGACCCCC 720 TTCCTTATCA CTGGCATTGT GCAGGTGGCC TGCCAGGAGT GTCACCTCTA CCTAGTGCTG 790 GAACGGTACC TGTC-GCTGCT CGGCGTGGGC AACTCCCTGC TCMCCCACT CÃTCTATGCC 540 37 ΕΡ 1 584 683/ΡΤ TATTGGCÂGA AGGAGGTGCG ACTGCAGCTC TACC&CATGG CCCTAGGAGT GAAGAAGGTG 900 CTCACCTCÂT TCCTCCTCTT TCTÇTCGGCC AGGÂATTGTG GCCCAGAGAG GCCCAGGGAA 960 AGTTCCTGTC ACATCGTCAC TATCTCCAGC TCAGAGTTTG ATGGCTAA 1008 (2) INFORMAÇÃO PARA SEQ ID NO: 8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 335 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 8:

Met Giu Ser Ser Phe Ser Phe Gly Vai lie Leu Ala Vai Leu Ala Ser 15 io is

Leu lie Ile Ala Thr Asn Thr Leu Vai Ala Vai Ala vai Leu Leu Leu 20 25 30

Ile His Lys Asn Asp Gly Vai Ser Leu Cys Phe Thr Leu Aa» Leu Ala 35 40 45

Vai Ala Asp Thr Leu Ile Gly Vai Ala Ile Ser Gly Leu Leu Thr Asp 50 SS 60

Gin Leu Ser Ser Pro Ser Arg Pro Thr Glrs Lys Thr Leu Cys Ser Leu 55 ?0 75 90

Arg Met Ala Phe Vai Thr Ser Ser Ala Ala Ala Ser Vai Leu Thr Vai 85 90 9$

Mst Leu lie Thr Phe Asp Arg Tyr Leu Ala Ile Lys Gin pro Phe Arg 100 105 110

Tyr l.eu Lys Ile Met Ser Gly ?he Vai Ala Gly Ala Cys Ile Ala Gly U5 120 125 L.su Trp Leu Vai Ser Tyr Leu Ile Gly Phe Leu Pro Leu Gly Ile Pro 130 135 140

Met phe Gin Gin Thr Ala Tyr Lys Gly Gin Cys Ser Phe Phe Ala Vai L45 iso 155 160

Phe His Pro His Phe Vai Leu Thr Leu Ser Cys Vai Gly Phe Phe Pro 165 170 175 A^a Met Leu Leu Phe Vai Phe Phe Tyr Cys Asp Met Leu Lys Ile Ala 180 1*35 190 38 ΕΡ 1 584 683/ΡΤ

Ser Met His Ser Gin Gin Ile Arg Lys Met Glu RiS Ala Gly Ala Met 195 200 205 Ala Giy Gly Tyr Arg Ser Pro Arg Thr Pro Ser Asp Phe Lys Ala Leu 210 215 220 Arg Thr Vai Ser Vai Leu Ue Gly Ser Phe Ala Leu Ser Trp Thr Pro 225 230 235 240 Phe Leu Ile Thr oiy lie Vai Gin Vai Ala Cys Gin Glu Cys His Leu 245 250 255 Tvr Leu Vai Leu Slu Arg Tyr Leu fpinrí ••rp Leu Leu Gly Vai Gly Asn Ser 260 265 270 Leu Leu Asn Pro Leu Lie Tyr Ala Tyr Trp Gin Lys Glu val Arg Lôu 275 280 285 Gin Leu Tyr His Met Ma Leu Qav Vai Lys Lys Vai Leu Tlir Ser Phe 290 295 300 Leu Leu Phe Leu Ser Ala Arg Asn Cys Gly Pro Glu Arg Pro Arg Glu 305 310 315 320 Ser Ser Cys His ile Vai Thr Ile Ser Ser Ser Glu Phe Asp Gly 325 330 335 (2) INFORMAÇÃO PARA SEQ ID NO: 9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1413 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 9: ATGGACACTA CCATGGAAGC TGACCVGGGT GCCACTGGCC ACAGGCCCCG CACAGAGCTT 60 GATGATGAQG ACTCCTACCC CCAAGGTGGC TGGGACACGG TCTTCCTGGT GGCCCTGCTG 120 CTCCTTGGGC TGCCAGCCAA TGGGTTGATG GCGTGGCTGG CCGGCTCCCA GGCCCGGCAT 180 GGAGCTGGCA CGCGTCTGGC GCTGCTCCTG CTCAGCCTGG CCCTOTCTGA CTTCTTGTTC 240 CTGGCAGCAG CGGCCTTCCA GATCCTAGAG ATCCGGCATG G8GGACACTG GCCGCTGGGG 300 ACAGCTGCCT GCCGCTTCTA CTACTTCCTA TGGGGCGTGT CCTACTCCTC CQGCCTCTTC 360 ctgctggccg ccctcagcct CGACCGCTGC CTGCTGGCGC TSTGCCCACA CTGGTACCCT 420 GGGCACCGCC CASTCCGCCT GCCCCTCTGG GTCTGCGCCG GTGTCTGGGT GCTGGCCACA 480 39 ΕΡ 1 584 683/ΡΤ

CTCTTCAGCG TGCCCTGGCT GGTCTTCCCC GAGGCTGCCG TCTSGTGGTA ATCTGCCTGG ACTTCTGGGA CAGCGAGGAG CTGTCGCTGA GGATGCTGGA GGCTTCCTGC CTTTGCTCCT GCTGCTCGTC TGCCACGTGC TCACCCAGGC CGCACCTGCC ACCGCCAACA GCAGCCCGCA GCCTGCCGGG GCTTCGCCCG ACCATTCTGT CAGCCTATGT GGTCCTGÂGG CTGCCCTACC AGCTGGCCCA CTGGCCTTCC TGTGGGACGT CTACTCTGGC TACCTGCTCT GGGAGGCCCT GACTACCTGA TCCTACTCAA CAGCTGCCTC AGCCCCTTCC TCTGCCTCAT GACCTCCGGA CCCTGCTGCG CTCCGTGCTC TCGTCCTTCG CGGCAGCTCT CGGCCGGGCA GCTTCACGCC CACTGAGCCA CAGÂCCCAGC TAGATTCTCA CTGCCAGAGC CGATGGCAGA GGCCCAGTCA CAGATGGÂTC CTGTG5CCCA AACCCCACAC TCCÂSCCACG ATCGGATCCC ACAOCTCAGC CACAGCTGAA CAOCCACAST CGGATCCCAC AGCCCAGCCA CÂGCTGAACC TCATGGCCCÃ gattctgtgg CCCAGCCACA GGCAGACACT AACGTCCAGA CCCCTGCACC TCT3TGCCCA GTCCCTGTGA TGAAGCTTCC CCMCCCCAT CCTCQCA.TCC GCCCTTGAGG ACCCAGCCAC ACCTCCTGCC TCTGAAGGAG AAAGCCCCAG CCAGAGGCGG CCCCGGGCGC AGGCCCCACG TGA CGACCTGGTC 540 GGTCCTGGGC- SOO CACAGCCTGT 5SO TGTGGCCAGG 720 GCTGCTCTAC 780 GGTCTACTCC 840 GGCCAGTGCC 900 CTCCGAGG&G 9ÊO GGGTCCAACT1Q2Q GCCTCAGGTG1Q8Q CCCTACGGCC1Í40 <3 CCACAGTCAX200 TGCTGCCAGT1260 TACCCC&GGS13 2 O CAGCACCCCG1 380 1413 (2) INFORMAÇÃO PARA SEQ ID NO: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 468 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 10:

Met Asp Thr Thr Met Giu Ala ASp Leu Oly Ala Thr Gly Hís Arg Pro 1 5 10 15 Arg Thr GIu Leu Asp Asp Glu Asp 3er Tyr Pro Gin Gly Gly Trp âsp 20 25 30 Vai Phe Leu Vai Ala Leu Leu Leu Leu Gly Leu Pro Asn Gly 35 40 45

Leu Met Ala Trp Leu Ala Gly Ser Gin Ala Arg His Gly Ala Gly Thr 40 ΕΡ 1 584 683/ΡΤ 50 55 60

Arg Leu Ala Leu Leu Leu Leu Ser Leu Ala Leu S&x Asp Phe Leu Phe 6$ 70 75 S0

Leu, Ala Ala Ala Ala Phe Gin Xle Leu GXu Ile Arg His Gly Gly His

S5 90 SS

Trp Bro Lau Gly Thr Ala Ala Cys Arg Phe Tyr Tyr Phe Leu Trp Gly X00 105 110

Vai ser Tyr Ser Ser Gly Leu Phe Leu Leu Ala Ala Leu Ser Leu Asp 115 120 12S

Arg Cys Leu Leu Ala Leu Cys Pro His Trp Tyr Bro Gly His Arg Pro 130 135 140

Vai Arg Leu Pro Leu Trp Vai Cys Ala Gly Vai Trp Vai Leu Ala Thr

145 ISO 155 ISO

Leu Phe Ser Vai Pro Trp Leu Vai Phe Pro Glu Ala Ala Vai Trp Trp 165 170 175

Tyr Asp Leu Vai lie Cys Leu Asp Phe Trp Asp Ser Glu Glu Leu Ser ISO 185 190

Leu Arg Mefc Leu Glu Vai Leu Gly Gly Phe Leu Pro Phe Leu Leu Leu 195 200 205

Leu Vai Cys His Vai Leu Thr Gin Ala Thr Arg Thr Cys His Arg Glu 210 215 220

Gin Gin Pro Ala Ala Cys Arg Gly Phe Ala Arg Vai Ala Arg Thr lie

225 230 235 2-4C

Leu Ser Ala Tyr Vai Vai Leu Arg Leu Pro Tyr Gin Lau Ala Gin Leu 245 250 255

Lau Tyr Leu Ala Phe Leu Trp Asp Vai Tyr Ser Gly Tyr Leu Leu Trp 260 265 270

Glu Ala Leu Vai Tyr Ser Asp Tyr Leu Xle Leu Leu Asn Ser Cys Leu 275 * 280 285

Ser Pro Phe Leu Cys Leu Met Ala Ser Ala Asp Leu Arg Thr Leu Leu 290 295 300

Arg Ser Vai Lau Ser Ser Phe Ala Ala Ala Leu Cys Glu Glu Arg Pro 305 310 315 320

Gly Ser Phe Thr Bro Thr Glu Bro Gin Thr Gin Leu Asp Ser Glu Gly 325 330 335

Bro Thr Leu Bro Glu Pro Met .Ala Glu Ala Gin Ser Gin Met Asp Pro 340 345 3S0 41 ΕΡ 1 584 683/ΡΤ

Vai Ala Gin Pro Gin Val Asn Pro Thr Leu Gin Pro Àrg Ser Asp Pro 355 360 365 Thr Ala Gin Pro Gin Leu Asn Pro Thr Ala Gin Pro Gin Ser Asp Pro 370 375 380 Thr Ala Gin Pro Gin Leu Asn Leu Met Ala Gin Pro Gin Ser Asp Ser 385 390 395 400 Vai Ala Gin Pro Gin Ala Asp Thr Asn Val Gin Thr Pro Ala Pro Ala 405 410 415 Am Ser Ser Vai Pro Ser Pro Cys Asp Glu Ala Ser Pro Thr Pro Ser 420 425 430 Ser His Pro Thr Pro Gly Ala Leu Glu Asp Pro Ala Thr Pro Pro Ala 435 440 445 Ser Glu Gly Glu Ser Pro Ser Ser Thr Pro Pro Glu Ala Ala Pro Gly 450 455 460

Ala Gly Pro Thr 4S5 (2) INFORMAÇÃO PARA SEQ ID NO: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1248 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 11: ATGTCAGGGA TGGAAAAACT TCAGMTSCT TCCTGGATCT ACCAGCAGAA ACTAGAAGAT SC CCATTCCAGA AACACCTGAA CAGCACCQAG GAGTATCTGG CCTTCCTCTG CGGACCTCGG 120 CGCAGCCACT TCT7CCTCCC CGTGTCTGTG GTGTATGTGC CAATTTTTGT GGTGGGGGTC 180 ATTGGCAATG TCCTGGT3TG CCTGGTGATT CTGCAGCACC AGGCTATGAA GACGCCCACC 240 AACTACTACC TCTTCAGCCT GGCGGTCTCT GACCTCCTGG 7CCTGCTCCT TGGAATGCCC 300 CTGGAGOTCT ATGAGATGTG C3CGCMCTAC CCTTICTTGT TCGGGCCÇGT GGGCTGCTAC 360 TTCAAGACGS CCCTCTTTGA GACCGTGTGC TTCGCCTCCA TCCTCAGCAT CACCACCGTC 420 &GCGT3GAGC GCTACGTGGC CATCCTACAC CCGTTCCGCG CCAAACTGCA GAGCACCCGG 480 CGCCGGGGCC TCAGGATCCT CGGCATCGTC TGGGGCTTCT CCGTGCTCTT CTCCCTGCCC 540 42 ΕΡ 1 584 683/ΡΤ AACACCAGCA TCCATGGCAT CAACTTCC&C TACTTCCCCA ATGGGTCCCT GGTCCCAG6T ÊQO TCGGCCACCT GTACGGTCAT CA&GCCCATG TGGATCTACA ATTTCATCAT CCAGGTCACC SSO TCCTTCCTAT TCTACCTCCT CCCCATGACT GTCATCAGTG TCCTCTACTA CCTCATGGCA 720 CTCAGACTAA AGAAAGACAA ATCTCTTGAG GCAGATGAAG GGAATGCAAA ÍATTCAAAGA 780 CCCTGCAGAA AATC&GTCM CAAGATGCTG TTTCTCTTGG TCTTAGTGTT TGCTATCTGT 840 TGGGCCCCGT TCCACATTGA CCGACTCTTC TTCAGCTTTG TGGAGGAGTG GAQTSAATCC 900 CTGGCTGCTG TGTTCAACCT C5TCCATGTG GTGTCAGGTG TCTTCTTCTA CCTGAGCTCA 960 GCTGTCAACC CCATTATCTA TAACCTACTG TCTCGCCGCT TCCAGGCAGC ATTCCASAAXX020 GTGATCTCTT CTTTCCACM ACAGTGGCAC TCCCAGCATG ACCCACAGTT GCCACCTGCC108O CAGCGGAACA TCTTCCTGAC ÂG&ATGCC&C TTTGTGGAGC TGACCGAAGà TATAGGTCCC114Q CAATTCCCAT GTCAGTCATC CATGCACAAC TCTCACCTCC CAACAGCCCT CTCTAGTGAA12 0 0 CAGATGTCAA GAACAAACTA TCAAAGCTTC CACTTTAACA MACCTGA 1248 (2) INFORMAÇÃO PARA SEQ ID NO: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 415 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 12:

Met Ser Gly Met Glu Lys Leu Gin Aan Ala Ser Trp ile Tyr Gin Gin 1 5 10 15

Lys Leu Glu Asp Pro Phe Gin Lys Bis Leu Asn Ser Thr Glu Glu Tyr 20 25 30

Leu Ala Phe Leu Cys Giy Pro Arg Arg Ser Hís Phe Phe Leu Pro Vai 35 40 45

Ser Vai Vai Tyr Vai Pro lia Phe vai Vai Gly Vai 11a Gly Asn Vai 50 35 60

Leu vai Cys Leu Vai lie Leu Gin Eia Gin Ala Met Lys Thr Pro Thr 65 70 73 80

Leu Leu .95

Asn Tyr Tyr Leu Phe Ser Leu Ala Vai Ser Asp Leu Leu Vai 85 90 43 ΕΡ 1 584 683/ΡΤ

Leu Gly Met Pro l;eu Glu Vai Tyr 100 teu Phe Gly Pro Val Gly Cys Tyr 115 120

Vai Cys Phe Ala Ser Ile Leu Ser 130 135

Tyr Val Ala Ile Leu His Pro Phe 145 ISO

Arg Arg Ala Leu Arg ile Leu Gly LS5

Glu Met Trp Arg Asn Tyr Pro Phe 105 llõ

Phe Lys Thr Ala Leu phe Glu Thr 125 ile Thr Thr Val Ser Val Glu Arg 140

Arg Ala Lys Leu Gin Ser Thr Arg 155 ISO

Ile Val Trp Gly Phe Ser Val Leu 170 175

Phe ser Leu Pro Asn Thr Ser Ile His Gly Ile Lys Phe His Tyr Phe 180 135 190

Pro Asn Gly Ser Leu Val Pro Gly Ser Ala Thr Cys Thr val lie Lys 195 200 205

Pro Met Trp Ile Tyr Asn Phe Ile lie Gin Val Thr Ser Phe Leu Phe 210 215 220

Tyr Leu Leu Pro Met Thr Val Ile Ser Val Leu Tyr Tyr Leu Met Ala 22S 230 235 240

Leu Arg Leu Lys Lys Asp Lys Ser Lau Glu Ala Asp Glu Gly Asn Ala 245 250 2S5

Asn Ile Gin Arg Pro Cys Arg Lys Ser Val Asn Lys Met Leu Phe Val 250 265 270

Leu Val Leu Val Phe Ala Ile Cys Trp Ala Pro Phe His Ile Asp Arg 275 280 285

Leu Phe Phe Ser Phe Vai Glu Glu Trp Ser Glu Ser Leu Ala Ala Val 290 295 300

Phe Asn Leu Val His Val Val Ser Gly Val Phe Phe Tyr Leu Ser Ser 30» 310 315 320

Ala Val Asn Pro Ile Ile Tyr Asn Leu Leu Ser Arg Arg Phe Gin Ala 32S 330 335

Ala Phe Gin Asn Val Ile Ser Ser Phe His Lys Gin Trp His Ser Gin 340 345 350

His Asp Pro Gin Leu Prc Pro Ala Gin Arg Asn Ile Phe Leu Thr Glu 355 360 36S

Cys His Phe Val Glu Leu Thr Glu Asp lie Gly Pro Gin Phe Pro Cys 370 375 380

Gin Ser Ser Met His Asn Ser His Leu Pro Thr Ala Leu Ser ser Glu 385 390 395 400 44 ΕΡ 1 584 683/ΡΤ

Gin Mefc Ser Arg Thr Asn Tyr Gin Ser Phe Hxs Phe Asn Lys Thr 405 410 41S (2) INFORMAÇÃO PARA SEQ ID NO: 13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1173 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 13:

ATGCCAGATA CTAATAGCAC AATCAATTTA tttatgtcct tagtagcttt tgctataatg

GTGGTGGACA AftMCCTTAG ACATCGAAGT GACTTCTTTG TGGGTGTGAT CTCCATTCCT GATTTTGGM. AGGAAATCTG TC-TATTTTGG TCTGTATATA ACATTGTCCT CATCAGCTAT TCTTATAGAA CTCAACATAC TGGGGTCÍTG GTGCTGGCCT TCTTAGTGAA TGGGCCAATC GGTAGTGAAT GTGAACCTGG ATTTTTTTCG TTGGAA7TCG TGATCCCAGT CATCTTAGTC CTGTGGAAGC GTGATCATC? CAGTA3GTGC TCCAACATCT GTGGACACTC ATTCAGAGGT TCGACÂGAAG TTCCTGCATC CTTTCATTCA TTTTCCrCAA GAACCAAGAT GAATAGCAAT CAATCAGÂTT CTGTASCTCT TCACC&AAGG TTAGCCMST CACTGGCCAT TCTCTTAGGG CTGTTCACAA TTGTCCTTTC ATTTTATTCC AGAATT3CAT TTTGGCTTCA GTGGTTCMT TGTCACAAGC GCTTTCMAA GGCTTTCTTG TCACTMQCA CTCGTGTTAC TTTA6CATTT 60 CTAGGAAATG CTTTGGTCAT TTTAGCTTTT 120 AGTTATTTTT TTCTTAACTT GGCCATCTCT 130 TTGTACATCC CTCACACGCT GTTCGAATGG 240 CTCACTACTG ACTATCTGTT atqtacagca 300 GATCGATACC TGTCAGTCTC AAATGCTGTG 360 AAGATTGTTA CTCrGATGGT GGCCGTTTGG 420 ATTCTAGTTT CAGAGTCTTG SÃAGGATGAâ 480 GAATGGTACA TCCTTGCCAT CACATCATTC 540 GCTTATTTCA ACÂTGAATAT TTATTGGAGC 600 CAAAGCC&TC CTGGACTGAC TGCTGTCTCT 660 AGACTATCTT CAAGGAGATC TCTTTCTGCA 720 GAGAGACAGA GGAGAAAGAG TASTCTCATG 780 ACAATTGCTT CCAAAATGGG TTCCTTCTCC 840 GAACATGTTG AACTGCTTAG AGCCAGGAGA 300 GTTTTTGCTG TTTGCTGGGC TCCATATTCT 360 TCAGCMCAG GTCCTAAATC AGTTTGGTAT102Q TCCTTTGTCA ATCCTCTTTT GTATCCATTG10 8 G AAAATATTTT GTATAAAAAA GCAACCTCTA1140 1173

CCATCACAÃC ACAGTCGGTC AGTATCTTCT TM 45 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 390 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 14:

Mat Pro Asp Thr Asn Ser Thr 11 e Asn Lau ser Leu Ser Thr Arg Val 1 s 10 15 Thr Leu Ala Phe Phe Met Ser Leu val Ala Phe Ala Ile Met Leu Gly 20 25 30 Asn Ala Leu val Us Leu Ala Phe Val Val Asp Lys Asn Leu Arg Bis 35 40 45 Arg Ser Ser Tyr Phe Phe Leu Asn Leu Ala Ile Ser Asp Phe Phe Val 50 55 60 Gly Vai ile ser lie Pro Leu Tyr Xle Pro ais Thr Leu Phe Glu Trp es' 70 7$ 80 Asp Phe Gly Lys Glu Xle Cys val Phe Trp Leu Thr Thr Asp Tyr Leu 85 90 95 Leu Cys Thr Ala Ser Val ‘Tyr Asn Ile Val Leu Ile Ser Tyr Asp Arg 100 105 110 Leu Ser Val Ser Asn Ala Val Ser Tyr Arg Thr Gin Hia Thr Gly 115 120 125 Vai Leu Lys Xle val Thr' Leu Met Val Ala Val Trp Val Leu Ala Phe 130 135 140 Leu Vai Asn Gly Pro Met Ile Leu val Ser Glu Ser Trp Lys Asp Glu 145 150 155 150 Gly Ser Glu Cys Glu Pro Gly Phe Phe Ser Glu Trp Tyr Ile Leu Ala 165 170 175 lie Thr Ser Phe Leu slu Phe val Ile Pro Val Ile Leu Val Ala Tyr 180 185 190 Phe Asn Met Asn Xle Tyr Trp Ser Leu Trp Lys Arg Asp Hís Leu Ser 195 200 205 Arg Cys Gin Ser ÍIÍS Pro Gly Leu Thr Ala Val Ser Ser Asn Ile Cys 210 215 220 46 ΕΡ 1 584 683/ΡΤ <31y His Ser Phe Arg Gly Arg Leu ser Ser Arg Arg Ser Leu Ser Alã 225 230 235 240 Ser Thr Glu Val Pro Ala Ser Phe His Ser Glu Arg Gin Arg Arg Lys 245 250 255 Ser Ser Leu Met Phe Ser Ser Arg Thr Lys Met Asn Ser Asn Thr He 260 265 270 Ala Ser Lys Met Gly Ser Phe Ser Gin Ser ASp Ser Val Ala Leu His 275 280 285 Gin Arg Glu His Val Glu Leu Leu Arg Ala Arg Arg Leu Ala Lys Ser 230 295 300 Leu Ala Ile Leu Leu Gly Val Phe Ara Val Cys Trp Ala Pro Ser 305 310 315 320 Leu Phe Thr Ile Val Leu Ser Phe Tyr Ser Ser Ala Thr Gly Pro Lys 325 330 335 Ser Val Trp Tyr Arg lie Ala Phe Trp Leu Gin Trp Phe Asn Ser Phe 340 345 350 Val Asn Pro Leu Leu Tyr Pro Leu cys His Lys Arg Phe Glu Lys Ala 355 360 365 Phe Leu Lys Tle Phe Cys lie Lys Lys Gin Pro Leu Pro Ser Gin His 370 375 380 Ser Arg Ser val Ser Ser 385 390 (2) INFORMAÇÃO PARA SEQ ID NO: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1128 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 15: ATQGCOAACG CGAGOSRGCC GGGTGGCAQC GGCGGCGGCQ AGGCGGCCGC CCTGGGCCTC 60 AAGCTGGCCA CGCTCAGCCT GCTGCTGTGC GTGAGCCTAG CGGGCAACG? GCTC-TTCGCG 120 CTGCTGATCO TGCGGGAGCG CAGCCTGCAC CGCGCCCCGT ACTACCTGCT GCTCGACCTG 180 TÔCCTGGCCG ACGGGCTGCG CGCGCTCGCC TGCCTCCCGG CCGTCAXGCT GGCGGCGCGG 240 CGTGÇGGCGG CCSCQGCGGG G5CGCCGCCG GGCGCGCTGG GCTGCAAGCT GCTCGCCTTC 300 47 ΕΡ 1 584 683/ΡΤ CTGGCCGCGC TC7TCTGCTT CCACGCCGCC T7CCTGCTGC TGGGCGTGGG CGTCACCCGC 360 TACCTGGCCA TCGCGCACCA CCGCTTCTAT GCAGAGCGCC TGGCCGGCTG GCCGTGCGCC 420 SCCATGCTGG TGTGCGCCGC CTGGGCGCTG SCGCTGGCCG CGGCCTTCCC GCCAGTGCTG 480 GACGGCGGTG GCGACGACGA GGACGOGCCG TGCGCCCTGG AGCAGCGGCC CGACGGCGCC 540 CCCGGCGCGC TGGGCTTCCT GCTGCTGCTG GCCGTGGTGG 7GGGCGCCAC GCACCTCGTC 600 mccTccGcc TGCTCTTCTT CATCCACGAC CGCCGCAAGA TGCGGCCCGC GCGCCTG3TG 660 CCCGCCGTCA QCCACGACTG GACCTTCCAC GGCCCGGGCG CCACCGGCCA GGCGGCCGCC 720 AACTGGACGG CGGGCTTCGG CCGCGGGCCC ACGCCGCCCG CGCTTGTGGG CATCCSOCCC 780 GCAGGGCCG3 GCCGCGGCGC GCGCCGCCTC CTCGTGCTGG AAGAATTCAA GACGGAGAAG 840 AGGCTOTGCA AGATGTTCTA CGCCGTCACG CTGCTCTTCC TGCTCCTCTG GGGGCCCTAC 900 GTCGTGGCCA GCTACCTGCG GGTCCTGGTG CQGCCCGGCG CCGTCCCCCA GSCCTACCTQ 360 ACGGCCTCCG TGTGGCTGAC CTTCGCGCAG GCCGGCATCA ACCCCGTCGT GTGCTTCCTC1020 TTCAACAGGG AGCTGAGGGA CTGCTTCAGG GCCCAGTTCC CCTGCTGCCA GAGCCCCCGG108Q ACCACCCAGG CGACCCATCC CTGCGACCTG AAAGGCATTG GTTTATGA 1128 (2) INFORMAÇÃO PARA SEQ ID NO: 16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 375 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 16:

Met Ala Asii Ala Ser Giu Pro Gly Gly Ser Gly Gly Gly Glu Ala Ala 1 5 10 15 Ala Leu Gly Leu Lys Leu Ala Tftr Leu Ser Leu Leu Leu Cys vai Ser 20 25 30 Leu Ala Gly As» Val Leu Phe Aia Leu Leu lie Vai Arg Glu Arg Ser 3$ 40 45 Leu His Arg Ala Pro Tyr Tyr Leu Leu Leu Aso Leu Cys Leu Ala Asp 50 55 60 Gly Leu Arg Ala Leu Ala Cys Leu Pro Ala Vai Met Leu Ala Ala Arg 65 70 75 80 48 ΕΡ 1 584 683/ΡΤ

Arg Ala Ala Ala Ala Ala Gly Ala Pro Pro Gly Ala teu Gly Cys Lys 85 90 95 teu Leu Ala Phe Leu Ala Ala Leu Phe Cys Phe His Ala Ala Phe Leu 100 105 110

Leu Leu Gly Vai Gly Vai Thr Arg Tyr Leu Ala Ile Ala His His Arg 115 120 125

Phe Tyr Ala Glu Arg Leu Ala Gly Trp Pro Cys Ala Ala Met Leu Vai 130 135 140

Cys Ala Ala Trp Ala Leu Ala Leu Ala Ala Ala Phe pro Pro Vai Leu 145 ISO 155 160

Asp Gly Gly Gly Asp Asp Glu Asp Ala Pro Cys Ala Leu Glu Gin Arg 165 170 275

Pro Asp Gly Ala Pro Gly Ala Leu Gly Phe Leu Leu Leu Leu Ala Vai 180 185 190

Vai Vai Gly Ala Thr His Leu Vai Tyr Leu Arg Leu Leu Phe Phe Ile 195 200 205

His Asp Arg Arg Lys ffet Arg Pro Ala Arg Leu Vai Pro Ala Vai Ser 210 215 220

Kia Asp Trp Thr Phe His Gly Pro Gly Ala Thr Gly Gin Ala Ala Ala 225 230 235 240

Asn Trp Thr Ala Gly Phe Gly Arg Gly Pro Thr Pro Pro Ala Leu Vai 245 250 255

Gly Ile Arg Pro Ala Gly Pro Gly Arg Gly Ala Arg Arg Leu Leu Vai 2$0 265 270

Leu Glu Glu Phe Lys Thr Glu Lys Arg Leu Cys Lys ffet Phe Tyr Ala 275 280 285

Vai Thr Leu Leu Phe Leu Leu Leu Trp Gly Pro Tyr Vai Vai Ala Ser 290 295 300

Tyr Leu Arg Vai Leu Vai Arg Pro Gly Ala Vai Pro Glu Ala Tyr Leu 305 310 315 320

Thr Ala Ser Vai Trp Leu Thr Phe Ala Gin Ala Gly Tle Asm Pro Vai 325 330 335

Vai Cys Phe Leu Phe Asn Arg Glu Leu Arg Asp Cys Phe Arg Ala Gin 340 345 350

Phe Pro Cys Cys Gin Ser Pro Arg Thr Thr Gin Ala Thr His Pro Cys 355 3S0 365

Asp Leu Lys Gly X.!e Gly Leu 370 375 49 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1002 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 17: ATOAACÂCCA CA3TGAT0CA AGGCTTCAAC AGATCTGAGC GGTGCCCCAG agacactcgg 60 ATAGTACAGC TGGTATTCCC AGCCCTCTAC ACAGTGGTTT TCTTOACCGG CATCCTGCTG 120 AATACTTTGG CTCTGTGGGT GTTTGTTCAC ATCCCCAGCT CCTCCACCTT CATCATCTAC 180 CTCAAAÃACA CTTTGGTGGC CGACTTGATA ATGACACTCA I^TTCCTTT CAAAATCCTC 240 TCTGACTCAC ACCTGGCACC CTGGCAGCTC AGAGCTTTTG TGTGTCGTTT TTCTTGGGTG 300 ATATTTTATG AGACCATGTA TGTGGGCATC GTGCTGTTAG GGCTCATAGC CTTTGACAGA 3fiO TTCCTCAAGA TCATCAGACC TTTGAGAAAT ATTTTTCTAA AAAAACCTGT TTTTGCAAAA 420 ACGGTCTCAA TCTTCATCTG GTTCTTTTTG TTCTTCATCT CCCTGCCAAA TACGATCTTG 480 AGCAACAAGG AAGCAACACC ATCGTCTGTG AAMAGTGTS CTTCÇTTAAA GGGGCCTCTG S40 GG6CTGAMT GGCATCAAAT GGTAAATAAC ATATGCCAGT TTATTTTCTG GACT3TTTTT 600 ATCCTAATGC TTGTGTTTTA TGTGGTTATT GCAAAMAAG TATATGATTC TTATASAAAG sso TCCAMAGTA AGGÃCAGAAA AA&C&ACAAA AAGCTGGAAG GCAMGTATT TGTTGTCGTG 720 3CTGTCTTCT TTGTGTGTTT TQCTCCATTT CATTTTGCCA GAGTTCCATA TACTCACAGT 780 C&AACCAÂCA ATAAGACTGA CTGTAGACTG CAAAATCAAC TGTTTATTGC TAAAGAAACA 840 ACTCTCTTTT TGGCAGCAAC TAACATTTGT ATGGATCCCT TAATATACAT ATTCTTATGT 900 AAAAAÁTTCA CAGAAAAGCT ACCATGTATG CAAGGGAGAA AGACCACAGC ATCAAGCCAA S60 GAAAATCATA GCACTCAGAC AGACAACÂTA ACÇTTAGGCT GA •i L0 02 (2) INFORMAÇÃO PARA SEQ ID NO: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 333 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante 50 ΕΡ 1 584 683/ΡΤ (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 18:

Met Asn Thr Thr Vai Met Gin Gly Phe Asn Arg Ser Glu Arg Cys Pro 15 iS

Arg Asp Thr Arg xle vai Gin Leu Vai Phe Pro Ala Leu Tyr Thr Vai 20 25 30

Vai Pha Leu Thr Gly Xle Leu Leu hsm Thr Leu Ala Leu Trp Vai Phe 35 40 45

Vai His Xle Pro Ser Ssr Ser Thr PM lie Xle Tyr Leu Lys Asn Thr 50 55 eo

Leu Vai Ala Asp Leu He Met Thr Leu Met Leu Pro Phe Lys Xle Leu 65 70 75 eo

Ser Asp Ser Sis Leu Ala Pro Trp Gin Leu Arg Ala Phe Vai Cys Arg S5 90 95

Phe Ser Ser V»1 Ile PM Tyr Glu Thr Met Tyr Vai Gly xle Vai Leu '100 105 no

Leu Gly Leu Xle Ala Phe Asp Arg PM Leu Lys Ile Xle Arg Pro Leu 115 120 125

Arg Asn lie PM Leu Lys Lys Pro Vai Phe Ala Lys Thr vai Ser Xle 130 135 140

Phe Ile Trp Phe Phe Leu Phe Phe Ile Ser Leu Pró Asn Thr Ile Leu »5 ISO 155 160

Ser Asn Lys Glu Ala Thr Pro Ser Ser Vai Lys Lys Cys Ala Ser Leu

165 170 17S

Lys Gly Pro Leu Gly Leu Lye Trp His Gin Met Vai Asn Asn Ile Cys 180 185 190

Gin PM Ile Phe Trp Thr Vai Phe Xle Leu Met Leu Vai Phe Tyr vai 135 200 205

Vai Xle Ala Lys Lys Vai Tyr Asp Ser Tyr Ai"5 Lys Ser Lys Ser Lys 210 2x5 210

Asp Arg Lys Asn Asn Lye Lys Leu Glu Gly Lys vai Phe Vai vai Vai 225 230 235 240

Ala Vai PM Phe Vai Cys Phe Ala Pro Phe Bis Phe Ala Arg Vai Pro 245 250 255 51 ΕΡ 1 584 683/ΡΤ

Tyr Thr His Sar Gin Thr Asn Asa Lys Thr Asp Cys Arg Leu Gin Asn 260 263 270

Oln Leu Phe lie Ala Lys Glu Thr Thr Leu Phe Leu Ala Ala Thr Asn 275 280 285

Ile Cys Met Asp Pro Leu Ile Tyr Ile Phe Leu Cys Lys Lys Phe Thr 230 29S 300

Glu Lys Leu Pr o Cys Hst Gin Gly Arg Lys Thr Thr Ala Ser Ser Gin 305 310 3X5 320

Glu Asei His Ser Ser Gin Thr Asp Asm ile Thr Leu Gly 325 330 (2) INFORMAÇÃO PARA SEQ ID NO: 19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1122 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 19: ATGGCCAACA CTACCGGAGA GCCTGAGGAG GTGAGCGGCG CTCTGTCCCC ACCGTCCGCA 60 TCAGCTTATG TGAAGCTGGT ACTGCTGGGA CTGATTATGT GCGTGAGCCT GGCGGGTAAC 120 GCCATCTTGT CCCTGCTGGT GCTCAAGGAG CGTGCCCTGC ACAAGGCTCC TTACTACTTC ISO CTGCTGGACC TGTGCCTGGC CGATGGCATA CGCTCTGCCG TCTGCTTCCC CTTT3TGCTG 240 GCTTCTGTGC GCCACGGCTC TTCATGGACC TTCAGTGCAC TCAGCTGCAA GATTGTGGCC 300 TTTATQGCCG TGCTCTTTTG CTTCCATQCG GCCTTCATGC TGTTCTGCAT CAGCGTCACC 360 CGCTACATGG CCÂTCGCCCA CCACCGCTTC TACGCCAAGC SCAT0ACACT CTGGACATGC 420 GCGGCTGTCA TCTGCATGCC CTGGACCCTG TCTGTGGCCÂ TGGCCTTCCC ACCTGTCTTT 480 GACGTGGGCA CCTACAAGTT TATTCGGGAG GAGGACCAGT GCATCTTTGA GCATCGCTAC 540 TTCAAGGCCA ATGACACGCT GGGCTTCATG CTTATGTTGG CTGTGCTCAT GGCAGCTACC 600 CATGCTGTCT ACGGCAAGCT GCTCCTCTTC GAGTATCGTC ACCGCAAGAT GAAGCCAGTG 660 CAfíATGGTGC CAGCCATCAG CCAGAACTGG ACATTCCATG GTCCCGGGGC CACCGGCCAG 720 GCTGCTGCCA ACTGGATCGC CGGCTTTGGC CGTGGGCCCA TGCCACCAAC CCTGCTGGGT 790 ATCCGGCAGA ATGGGCATGC AGCCAGCCGG CGGCTACTGG GCATGGACGA GGTCAAGGGT S40 52 ΕΡ 1 584 683/ΡΤ GAAAAGCAGC TGGGCCGCAT GTTCTÃCGCG ATCACACTGC TCTTTCTGCT CCTCTGGTCA 900 CCCTACATCS TGGCCTGCTA CTGGCGAGTG TTTGTGAAAG CCTGTGCTGT GCCCCACCGC 9SO TACCTGGCCA CTGCTGTTTG SATGAGCTTC GCCCAGGCTG CCGTCAACCC AATTGTCTGC1G20 TTCCTGCTCA ACAAGGACCT CAAGAAGTGC CTGACCACTC ACGCCCCCTG CTGGGGCACAi 0 8 D GGAGGTGCCC CGGCTCCCAG AGAACCCmC TGTGTCATGT GA 1122 (2) INFORMAÇÃO PARA SEQ ID NO: 20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 373 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 20:

Met Ala Asn Thr Thr Gly Glu Pro Glu GlU Vai Ser Gly Ala Leu Ser 5 10 15 Pro Pro Ser Ala Ser Ala Tyr Vai Lys Leu Vai Leu Leu Gly Leu Ile 20 25 30 Met Cys Val Ser Leu Ala Gly ASU Ala Ile Leu Ser Leu Leu Vai Leu 35 40 45 lys Glu Arg Ala Leu His Lys Ala Pro Tyr Tyr The Leu Leu Asp Leu 50 5S 60 Cys Lau Ala Asp Gly lie Arg Ssr Ala Vai Cys Phe Pro Phe Val Leu S5 70 75 30 Ala Ser Vai Arg His Gly Ser Ser Trp Thr Phe Ser Ala Lau Ser Cys 85 90 95 Lys Ile Vai Ala Phe Met Ala Vâl Leu Phe Cys She His Ala Ala Phe 100 1QS 110 Mst Leu Phe Cys Ile Ser Vai Thr Arg Tyr Met Alá Ile Ala His His 115 120 125 Arg Phe Tyr Ala Lys Arg Met Thr Leu Trp Thr Cys Ala Ala Val Ile 130 135 140 Cys Met Ala Trp Thr Leu Ser Vai Ala Met Ala Phe Pro Pro Val Phe 145 150 155 ISO Asp Vai G-Xy Thr Tyr Lys Phe Ile Arg Glu Glu Asp Gin Cys lie Phe 155 170 175 53 ΕΡ 1 584 683/ΡΤ

GlU EÍS Arg Tyr Phe Lys Ala Asn Asp Thr Leu Gly Phe Mat Leu Met 190 185 150 Leu Ma Vai Leu Met Ala Ala Thr HÍS Ala Vai Tyr Gly Lys Leu Leu 13S 200 2Q5 Lèu Phe GIu Tyr Arg His Arg Lys Met Lys Pro Vai Gin Met Vai Pro 210 215 220 Ala Ile Ser Gin Asn Trp Thr Phe His Gly Pro Gly Ala Thr Gly Gin A* ii* 230 235 240 Ala Ala Ala Asn Trp Ile Ale Gly Fhe Gly Arg Gly Pro Met Pro Pro 245 250 255 Thr Leu Leu Gly Ile Arg Gin Aso Gly His Alá Ala Ser Arg Arg Leu 260 265 270 Leu Gly Met Agp Glu Vai Lys Gly Glu Lys Gin Leu Gly Arg Mat Phe 27S 280 28$ Tyr Ala ile Thr Leu Leu Phe Leu Leu Leu Trp Ser Pro Tyr lie Vai 290 295 300 Ala Cys Tyr Trp Arg Vai Phe Vai Lys Ala Cys Alá Vai Pro HiS Arg 3 OS 310 315 320 Tyr Leu Ala Thr Ala Vai Trp Met Ser Phe Ala Gin Ala Ala Vai Asn 325 330 335 Pro Ile Vai Cys Phe Leu Leu Asa Lys Asp Leu Lys Lys Cys Leu Thr 340 345 350 Thr His Aia Pro Cys Trp Gly Thr Gly Gly Alá Pro Ala Pro Arg Glu 3S5 360 365 Ρΐο Tyr Cys Vai Met 370 (2) INFORMAÇÃO PARA SEQ ID NO: 21: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1053 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 21: ATGGCTTTGG MCAGAACCA GTCAACAGA? TATTATTATG AGGAAAATQA AATGAATGGC 60 actt&tgact acagtcaata tgaattgatc TGTATCAAAG AAGATGTCAG AGAATTTGCA 120 54 ΕΡ 1 584 683/ΡΤ AAAGTTTTCC TCCCTGTATT CCTCAC&ATA GCTTTCGTCA TTGGACTTGC AGGCAATTCC 180 ATGGTAGTGG CAATTTATGC CTATTACAAG AAACAGAGAA CCAAAACAGA TGTGTACATC 240 CTGAATTTGG CTGTAGCAGA TTTACTCCTT CTATTCÂCTC TGCCTTTTTG GGCTGTTAAT 300 GCAGTTCATG GGTGGGTTTT AGGGAAAATA ATGTGCAAAA 7AACTTCAGC CTTGTACACA 360 CTAAACTTTG TCTCTGGAAT GCAGTTTCXG GCTTGCATCA gcatagacag ATATGTGGCA 420 GTAACTAAT3 TCCCCAGCCA ATCAGGAGTG GGAAAACCAT gctggatcat CTGTTTCTGT 480 GTCTGGATGG CTGCCATCTT GCTGAGCATA CCCCAGCTGG TTTTTTATAC AGTAAATGAC 540 AATGCTAGGT GCATTCCCAT TTTCCCCCGC TACCTAGGAA CATCAA7GAA AGCATTGATT SOO CAAA7GCTAG AGATCTGCAT TGGATTTGTA GTACCCTTTC TTATTATGGG GGTGTGÇTAC 6S0 TTTATCACGG CAAGGACACT CATGAAGATG CCAAACATTA AAATATCTCG ACCCGTAAAA 720 GTTCTGCTCA CAGTCGTTAT AGTTTTCATT GTCACTCAAC TGCCTTATAA CATTGTCAAG 780 TTCTGCCGAG CCATAGACAT CATCTACTCC CTGATCACCA GCTGCAACAT GAGCAAACSC 840 ATGGACATCG CCATCCAAGT CACAGAAAGC ATTGCACTCT TTCACAGCTG CCTCAACCCA 000 ATCCTTTATG TTTTTATGGG AGCATCTTTC AAAAACTACG TTATGAAAGT GGCCAAGAAA 960 TATGGGTCC7 GGAGAAGACA GAGACAAAGT GTGGAGGAGT TTCCTTTTGA TTCTGAGOGTl .020 CCTACAGAGC CAACCAGTAC TTTTAGCATT TM, 1053 (2) INFORMAÇÃO PARA SEQ ID NO: 22: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 350 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 22:

Met Ala Leu Glu. Gin Asn Gin Ser Thr Asp Tyr Tyr Tyr Glu Glu Asu 1 S 10 15

Glu Met Asn Gly Thr Tyr Asp Tyr Ser Gin Tyr Glu Leu lie Cys lie 20 25 30

Lys Glu Asp Val Arg Glu %e Ala Lys Vai Phe Leu Pro Vai Phe Leu 35 40 45

Thr lie Ala Phe val lie Gly Leu Ala Gly Asn Ser Met Val Val Ala 55 ΕΡ 1 584 683/ΡΤ 50 S5 €0

Ile Tyr Ala Tyr Tyr Lys Lys Gin Arg Thr Lys Thr Asp Vai Tyr Ile S5 70 75 80

Leu Asn Leu Ala Vai Ala Asp Leu Leu Leu Leu Phe Thr Leu Pro Phe 85 30 35

Trp Ala Vai Asn Ala Vai His Gly Trp Vai Leu Gly Lys Ile Met Cys ICO 105 110

Lys Ile Thr Ser Ala Leu Tyr Thr Leu Asn Phe Vai Ser Gly Met Gin 113 120 125

Phe Leu Ala Cys Ile Ser Ile Asp Arg Tyr Vai Ala Vai Thr Asn Vai 130 135 140

Pro Ser Gin Ser Gly V&l Gly Lys Pro Cys Trp Ile Úe Cys Phe Cys 145 ISO 155 150

Vai Trp Met Ala Ala Ile Leu Leu Ser lie Pro Gin Leu vai Phe Tyr 165 170 175

Thr vai Asn Asp Asn Ala Arg Cys Ile Pro lie Phe Pro Arg Tyr Leu 180 185 130

Gly Thr ser Met Lys Ala Leu Ile Gin Hat Leu Glu ile Cys Ile Gly 195 200 205

Phe Val Vai Pro Phe Leu Ile Met Gly Vai Cys Tyr Phe Ile Thr Ala 210 21S 220

Arg Thr Leu Met Lys Met Pro Asn Ile Lys Ile Ser Arg Pro Leu Lys 225 230 235 240

Val Leu Leu Thr v&l Vai Ile Vai Phe ile Vai Thr Gin Leu Pro Tyr 245 250 255

Asn Ile Val Lys Phe Cys Arg Ala lie Asp ile Ile Tyr Ser Leu lie 260 265 270

Thr Ser Cys Asn Met Ser Lys Arg Met Asp Ile Ala Ile Gin Val Thr 275 280 285

Glu Ser ile Ala leu Phe His Ser Cys Leu Asn Pro Ile Leu Tyr Val 290 295 300

Phe Met Gly Ala Ser Phe Lys Asn Tyr Val Mac. Lys Val Ala Lys Lys 30S 310 315 320

Tyr Gly Ser Trp Arg Arg Gin Arg Gin Ser V&I Glu Glu Phe Pro Phe .325 330 335

Asp Ser Glu Gly pro Thr Glu Pro Thr Ser Thr Phe Ser Ile 340 345 350 56 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 23: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1116 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 23: ATGCCAGGAA ACGCCACCCC AGTGACCACC GCCAAGA.CCT GCAACAACGT GTCCTTCGAA AGCGCGGTGT GCACGCTGGG GGTGCCGGCC CAGGTACTGC AGGGCAACGT GCTGGCCGTC CTGTACACAG gcacgctgcc actctgggtc ctaggcctgc tggcctcgaa ggtgaccgcc

ATCCTCTTCC TGTGCTGCAT CTCCTGCGAC AGTCGGGGCC gccgccgccg gaggaccgcc

GTCGGGATCG TTCACTACCC GGTGTTCCAG CTGCAGATGG ACAGCAGGAT TGCCGGGTAC ATCCCTCTCT ccatcatcgc cttcaccaac

ATGGGCTTAA GCGCTGCCCA GAAGGCCAAG ATCTTCCTAG TCTGCTTCGC CCCGTACCAC TCCTACTACA GAGGAGACAG GAACGCCATG TCTGTGGTGT TTCTGTGCCT GTCCACGGTG CTGGCCACGG ACCATTCCCG CCAAGAAGTG TCCATGAAGA CAGACGTCAC CAGGCTCACC CCCGTGGCCC TTGCAGACCA CTACACCTTC TGCCCTGCAA AGAGGCTGAT TGAGSAfíTCC ACTGÇCCCGT GGGCCTCCCT GGGCCTCTCC 6Q GASAGCASGA TAGTCCTGGT C3TGGTGTAC 120 AACTGCCTGA CTGCGTGGCT GGCGCTGCTG 180 TACCTGCTCT GCCTGGCACT CTGCGfiACTG 240 ATCTATÃTCC GCAACCAGCA CCGCTGGACC 30Q TACATCTTCT TCTGCAACAT CTACGTCAGC 360 CGCTTCSTGG CCGTGGTGTA CGCGCTGGAG 420 ATCCTCATCT CCGCCTGCAT CTTCATCCTC 480 ACGGAAGACA aggagagctg CTTTGACATG 540 TACTACGCCA qgttcaccgt TGGCTTTGCC 600 CACCGGATTT TCAGGAGC ΛΤ CAAGCAGAGC €60 GTGAAGCACT CGGCC&TCGC ÕGTGGTTGTC 720 CTGGTTCTCC TCGTCAAAGC CGCTGCCTTT 780 TGCGGCTTGG AGGAAAGGCT GTACACAGCC 840 AACGGCGTGG CTGACCCCAT TATCTACGTG 900 TCCAGAATCC ATAAGGGGTG GAAAGAGTGG 960 CACAGCAGGG ACACCGAG3Â GCTSCA3TCG1G2Q TCCAGGCCCG TGCACCCACC AGGGTCACCA1080 ÍGCTGA 1116 (2) INFORMAÇÃO PARA SEQ ID NO: 24: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 371 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante 57 ΕΡ 1 584 683/ΡΤ (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 24:

Met Pro Gly Asn Ala Thr Pro Val Thr Thr Thr Ala Pro Trp Ala Ser 1 5 10 15 Leu Gly Leu Ser Ala Lys Thr Cys Asn Asn Val Ser Phe Glu Glu Ser 20 25 30 Arg Ile Vai Leu val Val Val Tyr Ser Ala Val Cys Thr Leu Gly Val 35 40 45 Pro Ala Asa cys Leu Thr Ala Trp Leu Ala Leu Leu Gin Val Leu Gin 50 55 60 Gly Asn Vai Leu Ala Val Tyr Leu Leu Cys Leu Ala Leu Cys GlU Leu 65 70 75 80 Leu Tyr Thr Gly Thr Leu Pro Leu Trp Val ile Tyr Ile Arg Asn Gin 85 90 35 Hís Arg Trp Thr Leu Gly Leu Leu Ala Ser Lys Val Thr Ala Tyr ile ISO 105 110 Phe Phe Cys Asn Ile Tyr Val Ser Ile Leu Phe Leu cys Cys Ile Ser 115 120 125 Cys As p Arg Phe Val Ala val Val Tyr Ala Leu Glu Ser Arg Gly Arg 130 135 140 Arg Arg Arg Arg Thr Ala Ile Leu Ile Ser Ala Cys Ile Phe Ile Leu 145 150 155 160 Vai Gly Ile Vai His Tyr Pro val Phe Gin Thr Glu Asp Lys Glu Thr 165 170 175 Cys Phe Asp Met Leu <3ln Met Asp Ser Arg Ile Ala Gly Tyr Tyr Tyr 130 185 130 Ala Arg Phe Thr Val Gly Phe Ala Ile Pro Leu Ser Ile ile Ala Phe 135 200 205 Thr Asn HÍS Arg Ile Phe Arg Séx Ile Lys Gin Ser Met Gly Leu Ser 210 215 220 Ala Ala Gin Lys Ala Lys Val Lys Ris Ser Ala Ile Ala Val Val Val 225 230 235 240 58 ΕΡ 1 584 683/ΡΤ lie Phe Leu Vai Cys Phe Ala Pro Tyr His Leu Val Leu Leu Val Lys 245 250 255 Ala Ala Ala Phe Ser Tyr Tyr Arg Gly Asp Arg Asn Ala Met Cys Gly 260 265 270 Leu Glu Glu Arg Leu Tyr Thr AI a ser Vai Vai Phe Leu Cys Leu Ser 275 280 285 Thr Vai Asn Gly Vai Ala Asp Pro 11« lie Tyr Val Leu Ala Thr Asp 290 295 300 His Ser Arg Gin Glu Vai Ser Arg lie His Lys Gly Trp Lys Glu Trp 305 310 315 320 Ser Hat Lys Thr Asp Vai Thr Arg Leu Thr His Ser Arg Asp Thr Glu 325 330 335 Glu Leu Gin Ser Pro Vai Ala Leu Ala Asp His Tyr Thr Phe Ser Arg 340 345 350 Pro vai His Pro Pro Gly Ser Pro Cys Pro Ala Lys Arg Leu Xle Glu 355 360 365

Glu ser Cys 370 (2) INFORMAÇÃO PARA SEQ ID NO: 25: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1113 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 25: ATGGCGAACT ATAGCCATGC AGCTGACAAC ATTTTGCAAA ATCTCTCGCC TCTAACAGCC 60 TTTCTGAAAC TGACTTCCTT SGGTTTCATA ATAGGAGTCA GCGTGGTGGG CAACCTCCTG 120 ATCTCCATTT TGCTAGTGAA AGATAAGACC TTGCATAGAG CACCTTACTA CTTCCTGTTG 180 GATCTTTGCT GTTCAGATAT CCTCAGATCT GCAATTTGTT TCCCATTTQT GTTCA&CTCT 240 GTCAAAÃATG QCTCTACCTG GACTTATGGG ACTCTGACTT GCAAAGTGAT TGCCTTTCTG 300 GGQGTTTTGT CCTGTTTCCA CACTGCTTTC ATGCTCTTCT GCATCAGTGT CACCAGATAC 360 ITAGCTATCG CCCATCACCG CTTCTATACA ÂAGAGGCTGA CCTTTTGGAC GTGTCTGGCT 420 GTGATCTGTA TGGTGTGGAC TCTGTCTGTG GCCATGGCAT TTCCCCCGGT TTTAGACGTG 480 59 ΕΡ 1 584 683/ΡΤ GGCACTTÃCr CATTCATTAG GGAGGAAGAT CAATGCACCT TCCAACACCG CTCCTTCAGG 540 GCTAATGATT CCTTAGGATT TATGCTGCTT CTTGCTCTCA TCCTCCTAGC CACACAGCTT 600 GTCTACCTCA AGCTGATATT TTTCGTCCAC GATCGAAGAA AAA7GAAGCC AGTCCAGTTT 660 GTAGCAGCAG TCAGCCAGAA CTGGACT7TT CATGGTCCTG GAGCCAGTGG CCAGGCAGCT 720 GCCAÂTTGGC TAGCAGGATT TGGAAGGGGT CCCACACCAC CCACCTTGC? GGGCATCAGG 780 CAAAATGCAA ACACCACAGG CAGAAGAAGG CTÃTTGGTCT TAGACGAGTT CAAAATGGAG 840 AAAAGAATCA GCAGAATGTT CÍATATAATG ACTTTTCTGT TTCTAACC7T GTGGGGCCCC 300 TACCTGGTGG CCTGTTATTG GAOAGTTTTT GCAAGAGGGC CTGTAGTACC AGGGGGATTT 960 CTAACAGCTG CTGTCTGGAT GAGTTTTGCC CAAGCAGQAA TCAATCCTTT TGTCTGCATT1020 TTCTCAAACA GGGAGCTGAG GCGCTG7TTC AGCACAACCC TTCTTTACTG CAGAAAATCClG80 AGGTTACCAA GGGAACCTTA CTGTGTTATA TGA XI13 (2) INFORMAÇÃO PARA SEQ ID NO: 26: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 370 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 26:

Mat Ala Asa Xyr Ser Hís Ala Ala Asp Asn Ile Leu Gin Asn Leu Ser 1 = 10 15

Pro Leu Thr Ala Phe Leu Lys Leu Thr Ser Leu Gly Phe Ile Ile Gly 20 25 30

Vai Ser Vai Vai Gly Asn Leu Leu Ile Ser lie Leu Leu Vai Lys Asp 35 40 43

Lys Thr Leu Hís Arg Ala Pro Tyr Tyr phe Leu Leu Asp Leu Cys Cys 50 55 60

Ser Asp Ile Leu Arg Ser Ala ile Cys Phe Pro Phe Vai Phe Asa Ser 65 70 75 S0

Vai Lys Asn Gly Ser Thr Trp Thr Tyr Gly Thr Leu Thr Cys Lys Vai 85 90 95 11« Ala Phe Leu Gly Vai Leu Ser Cys Phe His Thr Ala Phe Met Leu 60 ΕΡ 1 584 683/ΡΤ 100 105 1X0

Phe Cys Ile Ser Vai Thr Arg Tyr leu Ala Ile Ala His Eis Arg Phe 115 120 125

Tyr Thr Lys Arg Leu Thr Phe Trp Thr Cys Leu Ala Vai Ile Cys Met 130 135 140

Vai Trp Thr Lau Ser Vai Ala Met Alá Phe Pro Prc Vai Leu Asp Vai 145 150 155 160

Gly Thr Tyr Ser Phe Ile Arg Glu Glu Asp Gin Cys Thr Phe Gin His 165 170 175

Arg Ser Phe Arg Ala Asm Asp Ser Leu Gly Phe Met Leu Leu Leu Ala 180 185 190

Leu Ile Leu Leu Ala Thr Gin. Leu Vai Tyr Leu Lys Leu Ile Phe Phe 135 200 205

Vai His Asp Arg Arg Lys Met Lys Pro Vai Gin Phe Vai Ala Ala Vai 210 215 220

Ser Gin Asn Trp Thr Phe His Gly Pro Gly Ala Ser Gly Gin Ala Ala 225 230 235 240

Ala Asm Trp Leu Ala Gly Phe Gly Arg Gly Pro Thr Pro Pro Thr Leu 245 250 255

Leu Gly Ile Arg Gin Asn Ala Asa Thr Thr Gly Arg Arg Arg Leu Leu 260 265 270

Vai Leu Asp Glu Phe Lys Met Glu Lys Arg Ile Ser Arg Met Phe Tyr 275 280 285

Ila Met Thr Phe Leu Phe Leu Thr Leu Trp Gly Pro Tyr Leu Vai Ala 290 295 300

Cys Tyr Trp Arg Vai Phe Ala Arg Gly Pro Vai Vai Pro Gly Gly Phe 305 310 315 320

Leu Thr Ala Ala Vai Trp Met Ser Phe Ala Gin Ala Gly Ile Asn Pro 325 330 335

Phe Vai Cys Ile Phe Ser Asn Arg Glu Leu Arg Arg Cys Phe Ser Thr 340 345 350

Thr Leu Leu Tyr Cys Arg Lys Ser Arg Leu Pro Arg Glu Pro Tyr Cys 355 360 365

Vai Ila 370 61 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 27: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1080 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 27: ATGCAGGTCC CGAACAGCAC CGGCCCGGAC AACGCGACGC TGCAGATGCT GCGGAACCCG 60 GCGATCGCGG TGGCCCTGCC CGTGGTGTAC TOSCTGGTGG CGGCGGTCAG CATCCCGGGC 120 AACCTCTTCT CTCTGTGGGT GCTGTGCCGG CGCATGGGGC CCAGATCCCC GTCGGTCATC 180 TTCATGATCA ACCTGAGCGT CACGGACCTG ATGCTGGCCA GCGTGTTGCC TTTCCAAATC 240 TACTACCATT GCAACCGCCA CCACTGGGXA TTCGGGGTGC TGCTTTGCAA CC-TGGTGACC 300 GTGGCCTTTT ACGCAAACAT GTATTCCAGC ATCCTCACCA TGACCTGTAT CAGCGXGGAG 360 CGCTTCCTGG GGGTCCTGTA CCCGCTCAGC TCCAAGCGCT GGCGCCGCCG TCGTTACGCG 420 GTGGCCGCGT GTGCAGGGAC CTGGCTGCTG CTCCTGACCG CCCTGT5CCC GCTGGCGCGC 480 ACCGATCTCA CCTACCCGGT GCACGCCCTG GGCATCATCA ccTGcrrcGA CGTCCTCAAG 540 TGGACGATGC TCCCCAGCGT GGCCATGTGG GCCGTGTTCC TCTTCACCAT CTTCATCCTG 600 CTGTTCCTCA TCCCGTTCGT GATCACCGTG GCTTGTTACA CGGCCACCAT CCTCAAGCTG 660 TTGCGCACGG AGGAGGCGCA CGGCCGGGAG CAGCGGAGGC GCGCGGTGGG CCTGGCCGCG 720 GTGGTCTTGC TGGCCTTTGT CACCTGCTTC GCCCCCAACA ACTTCGTGCT CCTGGCGCAC 780 ATC3TGAGCC GCCTGTTCTA CGGCAAGAGC TACTACCACG TGTACAAGCT CACGCTGTGT 840 CTCAGCTSCC TCAACAACTG TCTGSACCCG TTTSTTTÂTT ACTTTGCGTC CGGGGAATTC SOO CAGCTGCGCC TGCQGGAATA TTTGSGCTGC CGCCGGGTOC CCAGAGACAC CCTGGACAÇG 360 CGCCGCGAGA GCCTCTTCTC CGCCAGGACC ACGTCCGTGC GCTCCGAGGC CGGTGCGCAC102O CCTGAAGGGA TQGAGGGAGC C&CCAGGCCC GGCCTCCAGA GGCAGGAGAG TGTGTTCTGAl080 (2) INFORMAÇÃO PARA SEQ ID NO: 28: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 359 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante 62 ΕΡ 1 584 683/ΡΤ (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 28:

Met Gin Vai Pro Asn Ser Thr Gly Pro Asp Asn Ala Thr Leu Gin Met 15 10 1B

Leu Arg Asn Pro Ala lie Ala Vai Ala Leu Pro Vai Vai Tyr Ser Leu 20 25 30

Vai Ala Ala Vai Ser Ile Pro Gly Asn Leu Phe Ser Leu Trp Vai Leu 3S 40 45

Cys Arg Arg Met Gly Pro Arg ser Pro ser Vai Ile Phe Met Ile Aan 50 55 60

Leu Ser Vai Thr Asp Leu Met Leu Ala Ser Vai Leu Pro Phe Gin Ile 65 70 ?S 80

Tyr Tyr Kis Cys Asn Arg Bis His Trp Vai Phe Gly Vai Leu Leu Cys 85 90 95

Asn Vai Vai Thr Vai Ala Phe Tyr Ala Asn Met Tyr Ser Ser Ile Leu 100 105 110

Thr Met Thr Cys ile Ser Vai Glu Arg Phe Leu Gly Vai Leu Tyr Pro 115 120 125

Leu Ser Ser Lys Arg Trp Arg Arg Arg Arg Tyr Ala vai Ala Ala Cys 130 135 14.0

Ala Gly Thr Trp Leu Leu Leu Leu Thr Ala Leu Cys Pro Leu Ala Arg

145 150 155 ISO

Thr Asp Leu Thr Tyr Pro Vai Eis Ala Leu Gly Ile ile Thr Cys Phe 165 170 175

Asp Vai Leu Lys Trp Thr Met Leu pro Ser Vai Ala Met Trp Ala Vai 180 185 190

Phe Leu Phe Thr Ile Phe Ile Leu Leu Phe Leu Ile Pro Phe Vai rle 1SS 200 205

Thr Vai Ala Cys Tyr Thr Ala Thr Ile Leu Lys Leu Leu Arg Thr Glu 210 215 220

Glu Ala His Gly Arg Glu Glu Arg Arg Arg Ala Vai Gly Leu Ala Ala 225 230 235 240

Vai Vai Leu Leu Ala Phe Vai Thr Cys Phe Ala Pro Asn Asn Phe Vai 245 250 255

Leu Leu Ala His Ile Vai Ser Arg Leu Phe Tyr Gly Lys Ser Tyr Tyr 260 265 270 63 ΕΡ 1 584 683/ΡΤ

Kis Val Tyr Lys Leu Thr Leu Cys Leu Ser Cys Leu Asn Asn Cys Leu 27$ 260 285 Asp Pro Pha Val Tyr Tyr Phe Ala Ser Arg Glu Phe Gin Leu Arg Leu 290 295 300 Arg Glu Tyr Leu Gly Cys Arg Arg Val Pro Arg Asp Thr Leu Asp Thr 305 310 315 320 Arg Arg Glu Ser Leu Phe Ser Ala Arg Thr Thr Ser Val Arg ser Glu 325 330 335 Ala Gly Ala His Pro GXu Gly Met Glu Gly Ala Thr Arg Pro Gly Leu 340 34 5 350 Gin Arg Gin Glu Ser Val Phe 35$ (2) INFORMAÇÃO PARA SEQ ID NO: 29: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1503 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 29: ATGGAGCGTC CCTGGGAGGA GAGCCCAGGC C03GAGGGGG CAGCTGAGGG CTCGCCTGTG 60 CCAGTCGCCG COGGGGCGCG CTCCG3TGCC GCGGCGAGTG GCACAGGCTG GCAGCCATGG 120 GCTGAGTGCC CGGGACCCAA ggggagggsg CAACTGCTGG CGACCGCCGC- CCCTTTGCGT 180 CGCTGGCCCG CCCCCTCGCC TGCCAGCTCC AGCCCCGCCC CCGGAGCGGC GTCCGCTCAC 24 0 TCGGTTCAAG GCAGCGCGAC TGCGGGTGGC GCACGACCAG GGCGCAGACC TTGGGGCGCG 300 CGGCCCATGG AGTCGGGGCT gctgcggccg GCGCCGGTGA gcgaggtcat CGTCCTGGAT 360 TACAACTACA CCGGCAAGCT CCGCGGTGCG ÀGCTACCAGC CGGGTGCCGG CÇTGCGCGCC 420 GACGCCGTGG TGTGCCTGGC GGTGTGCGCC TTCATCGTGC TAGAGAATCT AGCCGTGTTG 480 TTGGTGCTCG GACGCCACCC GCGCTTCCAC OCTCCCATGT TCCTGCTCCT GGGCAGCCTC 540 ACGTTGTCGG ATCTQCTGGC AGGCGCCGCC TACGCCGCCA ACATCCTACT GTCGGGGCCG 600 CTCAC3CTGA AACTGTCCCC CGCGCTCTGG TTCGCACGGG AGGGAGGCGT CTTCGTGGCA 660 CTCACTGCGT CCGTGCTGAG CCTCCTGGCC ÂTCGCGCTGG AGCGCAGCCT CãCCATGGCG 720 64 ΕΡ 1 584 683/ΡΤ CGCAGGGGGC CCGCGCCCGT CTCCAGTCGG GGGCGCACOC TGGCGATGGC AGCCGCGGCC 780 TGGGGCGTGT CGCTGCTCCT CGGGCTCCTG CCAGCGCTGG GCTGGAATTG CCTGGGTCGC 840 CTGGACGCTT GCTCCACTGT CTTGCCGCTC TACGCCAAGG CCTACGTGCT CTTCTGCGTG 900 CTCGCCTTCG TGGGCATCCT GGCCGCGATC 7GTGCACTCT ACGCGCGCAT CTACTGCCAG 960 GTACGCGCCA ACGCGCGGCQ CCTGCCGGCA CGGCeCGGSA CTGCGGGGAC CACCTCGACC102 0 CGGGCGCGTC GCAAGCCGCG CTCTCTGGCC TTGCTGCGCA CGCTCAGCGT GGTGCTCCTG1080 GCCTTTGTGG CATGTTGGGG CCCCCTCTTC CTGCTGCTGT TGCTCGACGT GGCGTGCCCG114 0 GCGC6GACCT GTCCTGTACT CCTGCAGGCC GAICCCTTCC TGGGACTGGC CATGGCCAAC1200 TCACTTCTGA ACCCCATCAT CTAOACGCTC ACCAACCGCG ACCXGCGCCA CGCGCTCCTG1260 CGCCTGGTCT GCTQCSGACG CCACTCCTGC GGCAGAGACC CGAGTGGCTC CCAGCAGTCG132Q GCGAGCGCGG CTGAGGCTTC CQGGGGCCTG CGCCGCTGCC TGCCCCCGGG CCTTGATGGG13S 0 AGCT7CAGCG GCTCGGAGCG CTCATCGCCC CAGCGCGACQ GGCTGGACAC CAGCGGCTCC144 0 ACAGGCAGCC CCGGTGCACC CACAGCCGCC CGGACTCTOG TATCAGAACC GGCTGCAGAC1500 TGA 1503 (2) INFORMAÇÃO PARA SEQ ID NO: 30: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 500 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 30:

Met Glu Arg Pro Trp Glu Asp Ser Pro Gly Fro Glu Gly Ala Ala Glu *· 5 10 15 Gly Ser Pro Vai Pro Vai Ala Ala Gly Ala Arg Ser Gly Ala Ala Ala 20 25 30 Ser Gly Thr Gly Trp Gin Pro Trp Ala Glu Cys Pro Gly Pro Lys Gly 35 40 45 Arg Gly Gin JvJÊIÀ Leu Ala Thr Ala Gly Pro Leu Arg Arg Trp Pro Ala 50 55 60 Pro Ser Pro Ala Ser Ser Ser Pro Ala Pro Gly Ala Ala Ser Ala Kis 65 70 75 30 65 ΕΡ 1 584 683/ΡΤ

Ser Vai Gin Gly Ser Ala Thr Ala Gly Gly Ala Arg Pro Gly Arg Arg 85 90 95

Pro Trp Gly Ala Arg Pro Met Glu Ser Gly Leu Leu Arg Pro Ala Pro 100 105 HO

Vai Ser Glu vai Ile Vãl Leu Eis Tyr Asn Tyr Thr Gly Lys Leu Arg 11S 120 125

Gly Ala Ser Tyr Gin Pro Gly Ala Gly Leu Arg Ala Asp Ala Vai Vai 130 135 140

Cys Leu Ala Vai Cys Ala Phe Ile Vai Leu Glu Asn Leu Ala Vai Leu

145 150 155 ISO

Leu Vai Leu Gly Arg Hls Pro Arg Phe His Ala Pro Met Phe Leu Leu 165 1*70 175

Leu Gly Ser Leu Thr Leu Ser Asp Leu Leu Ala Gly Ala Ala Tyr Ala ISO 185 190

Ala Agn Ile Leu Leu Ser Gly Pro Leu Thr Leu Lys Leu Ser Pro Ala 195 200 205

Leu Trp Phe Ala Arg Glu Gly Gly Vai Phe Vai Ala Leu Thr Ala Ser 210 215 220

Vai Leu Ser Leu Leu Ala Ile Ala Leu Glu Arg Ser Leu Thr Met Ala 225 230 235 240

Arg Arg Gly Pro Ala Pro Vai Ser Ser Arg Gly Arg Thr Leu Ala Met 24S 250 255

Ala Ala Ala Ala Trp Gly Vai Ser Leu Leu Leu Gly Leu Leu Pro Ala 260 265 270

Leu Gly Trp Asn Cys Leu Gly Arg Leu Asp Ala Cys ser Thr Vai Leu 275 280 285

Pro Leu Tyr Ala Lys Ala Tyr Vai Leu Phe Cys Vai Leu Ala Phe Vai 290 295 300

Gly Ile Leu Ala Ala Ile Cys Ala Leu Tyr Ala Arg Ile Tyr Cys Gin 305· 310 315 320

Vai Arg Ala Asn Ala Arg Arg Leu Pro Ala Arg Pro Gly Thr Ala Gly 325 330 335

Thr Thr Ser Thr Arg Ala Arg Arg Lys Pro Arg Ser Leu Ala Leu Leu 340 345 350

Arg Thr Leu Ser Vai Vai Leu Leu Ala Phe Vai Ala Cys Trp Gly Pto 355 360 365

Phe Leu Leu Leu Leu Leu Asp Vai Ala Cys Pro Ala Arg Thr Cys 66 ΕΡ 1 584 683/ΡΤ 3 70 375 380 Pro Vai Leu Leu Gin Ala Asp Pro Phe Leu Gly Leu Ala Met 385 390 395 Ser Leu Leu Asn Pro Ile n« Tyr Thr Leu Thr Asn. Arg Asp 405 410 Kis Ala Leu Leu Arg Leu Val Cys Cys Gly Arg His Ser Cys 420 425 430 Asp Pro Ser Gly Ser Gin Gin Ser Ala Ser Ala Ala Glu Ala 435 440 445 Gly Leu Arg Arg Cys Leu Pro Pro Gly Leu Asp Gly Ser Phe 450 455 460 Ser Glu Arg Ser Ser Pro Gin Arg ASp C-ly Leu Asp Thr Ser 465 470 475 Thr Gly Ser Pro Gly Ala Pro Thr Ala Ala Arg Thr Leu Val 48$ 490 Pro Ala Ala Aap

Ala Asn 400

Leu Arg 415

Gly Arg

Ser Gly

Gly Ser 480

Ser Glu 495 500 (2) INFORMAÇÃO PARA SEQ ID NO: 31: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1029 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 31: ATGCAAGCCQ TCGACAATCT CACCTCTGCG CCTGGGAACA CCAGTCTGTG CACCAGAGAC 60 TACAAAATCA CtCAGGTCCT CTTCCCACTG CTCTACACTG TCCTGTTTTT TGTTGGACTT 120 ATCACAAATG GCCTGGCGAT GAGGATTTTC TTTCA&ATCC GSftGTAAATC AAACTTTATT 180 ATTTTTCTTA A3AACACAGT CATTTCTGAT CTTCTCATGA TTCTGACTTT TCCATTCAAA 240 ATTCTTAGTS ATGCCAAACT GGGAAC&GGA CCACTGAGAA CTTTTGTGTG TCAAGTTACC 300 TCCGTCATAT TTTATTTCAC AATGTATA7C AGTATTTCAT TCCTGGGACT GATAACTATC 360 GATCGCTACC AGAAGACCAC CAGGCCATTT AAAACATCCA ACCCCAM&A TCTCTTGGGG 420 3CTAAGATTC TCTCTGTTGT CATCTGGGCA TTCATGTTCT TACTCTCTTT GCCTAACATG 480 67 ΕΡ 1 584 683/ΡΤ ATTCTGACCA ACAGGCAGCC GAGAGACAAO AATGTGAAGA AATGCTCTTT CCTTAAATCA 540 GAGTTCGGTC TAGTCTGGCA TGAAATAGTA AATIACATCT GTCAAGTCAT TTTCTGGATT 600 AATTTCTTAA TTGTTÂTTGT ATGTTATACA CTCATTACM AAGAACTG7A CCGGTC&TAC 660 GTA&GA&CGA GGGGTOTAGG TAAAGTCCCC AGGAAAAAGG TGAACGTCAA AGTTTTCATT 720 ATCATTGCTG TATTCTTTAT TTGTTTTGTT CCTTTCCATT TTGCCCGAAT TCCTTACACC 7SO CTGAGCCAAA CCCGGGATGT CTTTGACTGC ACTGCTGAAA ATACTCTGTT CTATGTGAAA 840 GAGAGCACTC TGTGGTTAAC TTCCTTAAAT GCATGCCTGG ATCCGTTCAT CTATTTTTTC 900 CTTTGCAÂGT CCTTCAGMÂ TICCTTGATA AGTATGCTGA AGTGCCCCAA TTCTGCAACA 960 TCTCTGTCCC &3GACAATAG GAJU&AAGAA CAGGATGGTG GTGÂCCCMA TGMGAGACTl 020 CCMTGTM 1029 (2) INFORMAÇÃO PARA SEQ ID NO: 32: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 342 aminoácidos (B) TIPO: aminoácído (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 32:

Met Gm Ala Val Asp Asn Leu Thr Ser Ala Pro Gly Asn Thr Ser Leu 1 5 10 15 Cys Thr Arg Asp Tyr Lys Ile Thr Gin Val Leu Phe Pro Leu Leu Tyr 20 25 3G Thr Vai Leu Phe Phe Val Gly Leu Ile Thr Asn Gly Leu Ala Met àrg 35 40 45 Ile Phe Phe Gin Ile Arg Ser Lys Ser Asn Phe Ile Ile Phe Leu Lys 50 55 «0 Asn Thr Val lie Ser Asp Leu Leu Met Ile Leu Thr Phe Pro Phe Lys 65 70 75 80 Ile Leu Sar Asp Ala Lys Leu Gly Thr Gly Pro Leu Arg Thr Phe Val 85 90 95 Cys Gin Vai Thr Ser Val Ile Phe Tyr Phe Thr Met Tyr lie Ser Ile 100 105 110 ser Phe Leu C5ly Leu Llê Thr Ile Asp Arg Tyr Gin Lys Thr Thr Arg 68 ΕΡ 1 584 683/ΡΤ 115 120 125

Pro Phe Lys Thr Ser Asn Pro Lys Asn Leu Leu Gly Ala Lys Xis Leu 130 135 i4o

Ser Vai Vai Ile Trp Ala Phe Met Phe leu Leu Ser Leu Pro Asn Mefc 145 150 155 i§0

Ila Leu Thr Asn Arg Gin pro Arg Asp Lys Asn Vai Lys Lys Cys Ser 16S 170 175

Phe Leu Lys Ser Glu Phe Gly Leu Vai Trp His Glu Ile Vai Asn Tyr 180 185 130

Ile Cys Gin Vai Ile Phe Trp lie Asn Phe Leu lie Vai Ile Vai Cys 195 200 205

Tyr Thr Leu Ile Thr Lys Glu Leu Tyr Arg Ser Tyr Vai Arg Thr Arg 210 215 220

Gly Vai Gly Lys Vai Pro Arg Lys Lys Vai Asn Vai Lys Vai Phe Ile 225 230 235 240

Ile Ile Ala Vai Phe Phe Ile Cys Phe Vai pro Phe His Phe Ala Arg 24S 250 255

Ile Pro Tyr Thr Leu Ser Gin Thr Arg Asp Vai Phe Asp Cys Thr Ala 250 265 270

Glu Asn Thr Leu Phe Tyr vai Lys Glu Ser Thr Leu Trp Leu Thr Ser 275 2S0 28S

Leu Asn Ala Cys Leu Asp pro Phe Ile Tyr Phe Phe Leu Cys Lys Ser 230 235 300

Phe Arg Asn Ser Leu Ile Ser Met Leu Lys Cys Pro Asn Ser Ala Thr 305 310 315 320

Ser Leu Ser Gin Asp Asn Arg Lys Lys Glu Gin Asp Gly Gly Asp pro 325 330 335

Asn Glu Glu Thr Pro Met 340 (2) INFORMAÇÃO PARA SEQ ID NO: 33: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1077 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) 69 ΕΡ 1 584 683/ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 33: ATGTCGGTCT CCTACCGTCC CCCAGGGAAC GAGACACTGC TGAGCTGGAA GACTTCGCGG 60 GCCACAGGCA cagccítcct gctgctggcg gcgctgctgg GGCTGCCTGG CAACGGCTTC 120 QTGGTGTGGA GCTTGGCGSG CXGGCGGCCT GCACGGGGGC <3ACC<3CT<3GC GGCCACGCTT 180 GTGCTGCACC TGGCGCTGGC CGACGGCGCG GTGCTGCTGC TCACGCCGCT CTTTGTGGCC 240 TTCCTGAGCC GGCACGCCTG GCCGCTGGGC CAGGCG6GCT GCAAGGCGGT GTACTACGTG 300 TGCGCGCTCA GCATGTACGC CAGCGTGCTG CTCACCGGCC TGCTCAGCCT GCAGCGCTGC 360 CTCGCAGTCA CCCGCCCCTT CCTGGCGCCT CGGCTGCGCA GCCCGGCCCT GGCCCGCCGC 420 CTGCTGCTGG CGGTCTGGCT GGCCGCCCTQ TTGCTCGCCG TCCCGGCCGC CGTCTACCGC 480 CACCTGTGGÁ GGGACCGCGT ATGCCAGCTG TGCCACCCGT C3CCGGTCCA CGCCGCCGCC. 540 CACCTGAGCC TGGAGAÇTCT GACCGCTTTC GTGCTTCCTT TCGGGCTGAT SCTCGOCTGC 600 TACAGCGTGA CGCTQGCÃCG GCTGCGGSGC GCCCGCTGGG CCTCCGGGCG GCACGGGGCG 660 CGGGT<3<3<3CC GGCTGGTGAG CGCCATCGTG CTTGCCTTCG GCTT3CTCTG GGCCCCCTAC 720 CACGCAGTCA ACCTTCTGCA SGCGGTCGCA GCGCIGGCTC CACCGGAAGG GGCCTTGGCG 780 AAGCTGGGCG GAGCCGGCCA GGCGGCGCGA GCGGGAACTA CGGCCTTGGC CTTCTTCAGT 840 TCTAGCGTCA ACCCGGTGCT CTACGTCTTC ACCGCTGGAG ATCTGCTGCC CCGGGCAGGT 900 CCCCGTTTCC TCACGCSGCT CTTCGAAGGC TCTGGGGÃGS CCCGAGGGGG CGGCCGCTCT 960 AGGG&AGGGA CCATGSAGCT CCGAACTACC CCTCAGCTGA AAGTGGTGGG GCAGGGCCGC1020 GGCAATGGAG ACCCGG<3<3<3<3 TGGGATGGAG AAGGACGGTC CGGAATGGGA CCTTTGA 1077 (2) INFORMAÇÃO PARA SEQ ID NO: 34: (i) CARACTERÍSTIÇAS DA SEQUÊNCIA: (A) COMPRIMENTO: 358 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 34:

Mac Ser Vai Cvs Tyr Arg Pro Çre <31y Asn GIu Thr Leu Leu Ser Trp 1 5 10 IS

Lys Thr Ser Arg Ala Thr Gly Thr Ala Phe Leu Leu Leu Ala Ala Leu 70 ΕΡ 1 584 683/ΡΤ 20 25 30

Leu Gly Leu Pro Gly Asn Gly Phe Vai Vai Trp Set Leu Ala Gly Trp 33 40 45

Arg Pro Ala Arg Gly Arg Pro Leu Ma Ala Thr Leu Vai Leu His Leu 50 55 60

Ala Leu Ma Asp Gly Ala Vai Leu Leu Leu Thr Pro Leu Phe Vai Ala 65 70 75 80

Phe Leu Thr Arg Gin Ma Trp Pro Leu Gly Gin Ma Gly Cys Lys Ala 85 30 95

Vai Tyr Tyr Vai Cys Ala Leu Ser Met Tyr Ala Ser Vai Leu Leu Thr 100 105 110

Gly Leu Leu Ser Leu Gin arg Cys Leu Ma Vai Thr Arg Pro Phe Leu MS 120 125

Ala Pro Arg Leu Arg ser Pro Ala Leu Ala Arg Arg Leu Leu Leu Ala MO 13S 140

Vai Trp Leu Ala Ala Leu Leu Leu Ala Vai Pro Ala Ala Vai Tyr Arg 14S 150 1SS 160

His Leu Trp Arg Asp Arg Vai Cys Gin Leu Cys His Pro Ser Pro Vai 165 170 175

His Ala Ala Ala Hia Leu Ser Leu Glu Thr Leu Thr Ma Phe Vai Leu ISO 185 130

Pro Phe Gly Leu Met Leu Gly Cys Tyr Ser vai Thr Leu Ala Arg Leu 235 200 205

Arg Gly Ala Arg Trp Gly Ser Gly Arg His Gly Ala Arg Vai Gly Arg 210 213

Leu Vai Ser Ala Ile Vai Leu Ala Phe Gly Leu Leu Trp Ala Pro Tyr 225 230 235 240

His Alá Vai Asn Leu Leu Gin Ma Vai Ala Ma Leu Ala Pro Pro Glu 245 250 255 270

Gly Ala Leu Ma Lys Leu Gly Gly Ala Gly Gia Ala Ala Arg Ma Gly 200 265

Thr Thr Ma Leu Ala Phe Phe ser Ser ser Vai Asn Pro 275 280

Vai Leu Tyr ass veu

Vai Phe Thr Ma Gly Asp Leu Leu Pro Arg Ma Gly Pro Arg Phe I 200 295 300

Thr Arg Leu Phe Glu Gly Ser Gly Glu Ala Arg Gly Giv Gly Arg ãsr 305 310 315 “ 320 71 ΕΡ 1 584 683/ΡΤ

Arg Glu Gly Thr Met Glu Leu Arg Thr Thr Pro Gin Leu Lys Vai Vai 325 330 335

Gly Gin. Gly Arg Gly Asn Gly Asp Pro Gly Gly Glv Met Glu Lys Asp 340 345 350

Gly Pro Glu Trp Asp Leu 355 (2) INFORMAÇÃO PARA SEQ ID NO: 35: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1005 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 35: ATGCTGGGGA TCATGGCATG GAATGGA&CT TGCAAAAACT GGCTGGCAGC AGAGGCTGCC 60 CTGGAÂA&G? ACTACCPTTC CATTTTTTAT GGGATTGAGT TCGTTGTGGG AGTCCTTGGA 120 AATACCATTG TTGTTTACGG CTACATCTTC TCTCTGAAGA ACTGGAACAG CAGTAATATT 180 TATCTCTTTA ACCTCTCTGT CTCTGACTTA GCTTTTCTGT GCACCCTCCC CATGCTQATA 240 AGGAGTTATG CCAA7GGAAA CTGGÂTATAT GGAGACGTGC tctgcataag CAACCGATAT 300 GTGCTTCATG CCAACCTCTA TACCAGCATT CTCTTTCTCA CTTTTATCAG CATAGATCGA ISO TAGTTGATAA TTMGTATCC tttccgâgaa CACCTTCTGC AÂAAGAAAGA GTTTGCTATT 420 TTAATCTCCT TGGCCATTTG ggttttagta ACCTTAGAGT TACTACCCAT ACXTCCCCTT 480 ATAAATCCTG TTATAACTGA CAAT3GCACC ACCTGTAATG ATTTTGCAAG TTCTGGAGAC S4Q ccçaactaca AGCTCATTTA CAGCATGTGT CTAACACTG? TGGGGTTCCT tattcctctt 600 TTTGTGATGT GTTTCTTTTA TTACAAGATT GCTCTCTTCC TAAAGCAGAG G&ATAGGCAG 66C GTTGCTACTG CTCTGCCCCT TSAAAAGCCT CTCAACTTGG TCATCATOGC AGTGGTAATC 720 TTCTCTGTGC TTTTTACACC CTATCACGTC ÀTGCGGÂATG TOAGGATCGC TTCACGCCTG 780 GGGAGTTGGA AGCAGTATCA GTGCACTCAG GTCGTCATCA ACTCCTÍTTA CATTGTC-ACA 840 CGGCC1TTGG CCTTTCTGAA CAGTGTC&TC AACCCTGTCT TCTATTTTCT TTTGGGAGAT 300 CACTTCAGGG ACATGCTGAT GAATCAACTG AGACACAACT TCAAATCCCT TACATCCTTT 360 AGCAGATGGG CTCATGAACT CCTACTTTCA TTCAGAGAAA AGTGA LC05 72

ΕΡ 1 584 683/PT

INFORMAÇÃO PARA SEQ ID NO: 36: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 334 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO

Met Leu Cly lie Met Ala Trp Asn Ala Thr Cys Lys Asn Trp Leu Ala 1 5 10 15

Ala Glu Ala Ala Leu Glu Lys Tyr Tyr Leu Ser Ile Phe Tyr Giy Ile 20 25 30

Glu Ph.e Vai Vai Giy Vai Leu Giy Asn Thr Ile Vai Vai Tyr Giy Tyr 35 40 45

Ile Phe Ser Leu Lys Asn Trp Asn Ser Ser Asn Ile Tyr Leu Phe Asn 50 55 60

Leu Ser Vai Ser Asp Leu Ala Phe Leu Cys Thr Leu Pro Met Leu Ile 65 70 75 80

Arg Sar Tyr Ala Asn Giy Asn Trp Ile Tyr Giy Asp Vai Leu Cys Ile 85 90 95

Ser Asn Arg Tyr Vai Leu Hls Ala Asn Leu Tyr Thr Ser Ile Leu Phe 100 105 110

Leu Thr Phe Ile Ser Lie Asp Arg Tyr Leu lie lie Lys Tyr Pro Phe 115 120 125

Arg Glu His Leu Leu Gin Lys Lys Glu phe Ala lie Leu Ile Ser Leu 130 135 140

Ala Ile Trp Vai Leu Vai Thr Leu Glu Leu Leu Pro Ile Leu Pro Leu 145 150 155 160

Ile Asn Pro Vai Ile Thr Asp Asa Giy Thr Thr Cys Asn Asp Phe Ala 165 170 175

Ser Ser Giy Asp Pro Asn Tyr Asn Leu Ile Tyr Ser Met Cys Leu Thr 180 185 190

Leu Leu Giy ?he Leu lie Pro Leu Phe Vai Met Cys Phe Phe Tyr Tyr 135 200 " 205

Lys Ile Ala Leu Phe Leu Lys Gin Arg Asn Arg Gin Vai Ala Thr Ala 210 215 220 73 ΕΡ 1 584 683/ΡΤ LêU Pro Leu Glu Lys Pro Leu Asn Leu Vai Ile Mefc Ala Vai Vai Ile 225 230 235 240 Phe Ser Vai Leu Phe Thr Pro Tyr His Vai Mefc Arg Asn Vai Arg Ile 245 250 255 Ala Ser Arg Leu Gly Ser Trp Lys Glu Tyr Glu Cys Thr Gin Vai Vai 260 265 270 lie Asa Ser Phe Tyr Ile Vai Thr Arg Pro Leu Ala Phe Leu Asn Ser 275 280 285 Vai He Asa Pro Vai Phe Tyr Phe Leu Leu Gly Asp His Phe Arg Asp 230 235 300 Mêt Leu Met Asn Gin Leu Arg His Asn Phe Lys Ser Leu Thr Ser Phe 305 310 315 320 Ser Arg Trp Ala HiS Glu Leu Leu Leu Ser Phe Arg Glu Lys 325 330 (2) INFORMAÇÃO PARA SEQ ID NO: 37: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1296 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 37: ATGCAGGCGC TTAACÃTTAC CCCGGAGCAG TTCTCTCGGC TSCTGCGGGA CCÂC&ACCTG 60 ACGCGGGAGC AGTTCATCGC TCTGTACCGG CTGCGACCGC TCGTCTACAC CCCAGAGCTG 120 CCGGGACGCG CCAAGCTGGC CCTCGTGCTC ACCGGCQTGC TCATCTTCGC CCTGGCGCTC 180 TTTGGCAATG CTCTGGTGTT CTACGTG3TG ACCCGCAGCA AGGCCATGCG CACCGTCACC 240 AACATCTTTA TCTGCTCCTT GGCGCTC&GT GACCTGCTCA TC&CCTTCTT CTGCATTCCC 300 GTCACCATGC TCCAGA&CAT TTCCGACAAC. TGGCTGGGGG GTGCTTTCAT TTGCAAGATG 360 GTGCCATTTG TCCAQTCTAC CGCTGTTGTG ACAGAAATGC TCACTATQAC CTGCATTGCT 420 GTGGAAAGGC ACCAGGGACT TGTGCATCCT TTTAAAATGA AGTGGCAATA CACCAACCGA 480 AGGGCTTTCA CAATGCTAQG TGTGGTCTGG CTGGTGGOAG TCATCGTAGG ATCACCCATG S4Ô TGGCACGTGC AACAACTTGA GATCAAATAT GACTTCCTAT ATGAAAAGGA ACACATCTGC 600 TGCTTAGAAG AGTGGACCAG CCCTGTGCAC CAGAAGATCT ACACCACCTT CATCCTTGTC 660 74 ΕΡ 1 584 683/ΡΤ ATCCTCTTCC TCCTGCCTCT 7ATGGTGATG CTTATTCTGT ACSvGTA&AA? TGGTTATGAA 720 CTTTGGATAA AGAAAAGAGT TGGGGATGGT TCAGTGCTTC GAACTATTCA 'TGGAAAASAA 730 ATGTCCAAAA TAGCCAGGAA GAAGAAACGA GCTGTCATTA TGATGGTGAC AGTGGTGGC? 340

CTCTTTGCTS TGTGCTGGGC ACCATTCCAT GTTGTCCATA TGATGAITGA ATACAGTAAT 900 TTTGAAAAGG AATATGATGA TGTCACAATC AAGATGATTT TTGCTATCGT GCAAATTATT SSO GGATTTTCCA ACTCCATCTG TAATCCC&7T GTCTATGCA7 TTATGAATGA AAACTTCAAAi 020 AAAAATGTTT TGTCTGCAGT TTGTTATTGC ATAGTAAATA AAACCTTCTC TCCAQCACAA10 8 0 AGGCATGGAA ATTC&GGAAT TACAATGATG CGGAAGAAAG CAAAGTTTTC CCTCAGAGAG1140 AATCCAGTGG AGGAAACCAà AGGAGAAGCA TTCAGTGATG GCAACATTGA &GTCAAATTG1200 TGTGÂACAGA CAGAGOAGAA GAAAAAGCTC AAACGACATC TTGCTCTCTT TAGGTCTGAA126 0 1296

CTGGCTGAGA ATTCTCCTTT AGACAGTGGG CATTAA (2) INFORMAÇÃO PARA SEQ ID NO: 38: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 431 aminoácidos (B) TIPO: aminoácido (C) CADEIA: (D) TOPOLOGIA: irrelevante (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 38:

Mefc Gin Ala Leu Asn ILe Thr Pro Giu Gin Phe Ser Arg Leu Leu Arq 15 10 is

Asp Kis Asn Leu Thr Arg Giu Gin. Phe 11$ Ale Leu Tyr Arg Leu Arg 20 25 30~

Pro Leu Vai Tyr Thr Pro Glu Leu Pro Gly Arg Ala Lys Leu Ala Leu 35 40 45

Vai Leu Thr Gly vai Leu rie Phe Ala Leu Ala Leu Phe Gly Asn Ala 50 55 6Q

Leu Vai Phe Tyr Vai Vai Thr Arg Ser Lys Ala Met Arg Thr Vai Thr 6S 70 75 80

Asn Xle Phe Ile Cys Ser Leu Ala Leu Ser Asp Leu Leu He Thr Phe 35 90 gg

Phe Cys 21$ Pro Vai Thr Mat Leu Gin Asn He Ser Asp Asn Trp Leu 75 ΕΡ 1 584 683/ΡΤ 100 105 110 Giy Gly Ala Phe Ile Cys Lys Met Val Pro Phe Val Gin Ser Thr Ala us 120 125 Val Val Thr Glu Met Leu Thr Met Thr Cys Ile Ala Val Glu Arg Hl a 130 135 140 Gin Gly Leu Val His Pro Phe Lys Met Lvs Trp Gin Tyr Thr Asn Arg 145 150 155 160 Arg Ala Phe Thr Met Leu Gly Val val Trp Leu Val Ala Val Ile Val 165 170 175 Gly Ser Pro Met Trp His Val Gin Gin Leu Glu Ile Lys Tyr Asp Phe 180 185 190 Leu Tyr Glu Lys Glu His ile Cys Cys Leu Glu Glu Trp Thr Ser Pro 195 200 205 Val His Gin Lys Ile Tyr Thr Thr Phe Ile Leu Val Ile Leu Phe Leu 210 215 220 Leu Pro Leu Met Val Met Leu Ile Leu Tyr Ser Lys Ile Gly Tyr Glu 225 230 235 240 Leu Trp Ile Lys Lys Arg Val Gly Asp Gly Ser val Leu Arg Thr lie 245 250 255 His Gly Lys Glu Met Ser Lys Ile Ala Arg Lys Lys Lys Arg Ala Val 260 265 270 Ile Met Met Val Thr Val Val Ala Leu Phe Ala Val Cys Trp Ala Pro 27S 280 285 Phe Eis Val Val His Met Met Ile Glu Tyy Ser Asn Phe Glu Lys Glu 290 295 300 Tyr Asp Asp Val Thr Ile Lys Met ile Phe Ala Ile Val Gin Ile Ile 305 310 315 320 Gly Phe Ser Asn Ser ile Cys Asn Pro Ile Val Tyr Ala Phe Met Asn 325 330 335 Glu Asn Phe Lys Lys Asn val Leu Ser Ala Val Cys Tyr Cys Ile Val 340 345 350 Asn Lys Thr Phe Ser Pro Ala GlR Arg His Gly Asn Ser Gly Ile Thr 355 360 365 Met Met Arg Lys Lys Ala Lys Phe Ser Leu Arg Glu Asn iro Val Glu 370 375 380 GlU Thr Lys Gly Glu Ala Phe Ser Asp Gly Asn Ile Glu Val Lys Leu 2BS 3 90 335 400 76 ΕΡ 1 584 683/ΡΤ

Cys Glu Gin Thr Glu Glu Lys Lys Lys Leu Lys Arg His Leu Aia Leu 405 410 415

Phe Arg Ser Glu Leu Ala Glu Asn Ser Pro Leu Asp Ser Gly Hia 420 42S 430 (2) INFORMAÇÃO PARA SEQ ID NO: 39: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 39:

CTGTGTACAG CAGTTCGCAG AGTG (2) INFORMAÇÃO PARA SEQ ID NO: 40: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 40: 24

GAGTGCCAGG CAGAGCAGGT AGAC (2) INFORMAÇÃO PARA SEQ ID NO: 41: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 31 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 41: 31

CCCGAATTCC TGCTTSCTCC CAGCTTGGCC C 77 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 42: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 42 tgtggatcct gctgtcaa&g gxcccattcc gg (2) INFORMAÇÃO PARA SEQ ID NO: 43: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 43 TOACAATGCT AGÕTGTGGTC (2) INFORMAÇÃO PARA SEQ ID NO: 44: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 44

TGCATAGACA ATGGGATTAC AG 78 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 45: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 511 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 45: TCACMTGCT AGGTGTGGTC TGGCTGGTGG CAGTCATCGT AGGATCACCC ATGTGGCACG ÇQ TGCAACAACT TGMAICMA TATG&CTTCC ΤΑΤΑΤΟΑΑΑΑ GGMCACATC TGCTGCTTAG 120 AAGAGTGGAC CAGCCCTGTG CACCAGAAGA TCTACACCAC CTTCATCCTT GTCATCCTCT 180 TCCTCCTGCC TCTTATGGTG ATGCTTATTC TGTACGTAAA ATTGGTTATG AACTTTGGAT 240 AAAGAAAAGA GTTGGGGATG OTTCAGTGCT TCGAACTATT CATGGAAAAG AAATGTCCAA 300 AATAGCCAGG &AGAA.GAMC GAGCTGTCAT TATGÂTGGTQ ACAGTGGTGG CTCTCTTTGC 360 TGTGTGCTGG GCACCATTCC ATGTTGTCCA TATGATGATT GAATACAGTA ATTTTGAAAA 420 GGAATaTGAT GATGTCACM TCMGAT5AT TTTTGCTATC GTGCAAATTA TTGGATTTTC 480 CAACTCCATC TGTAATCCCA TTGTCTATGC A 511 (2) INFORMAÇÃO PARA SEQ ID NO: 46: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 46: CTGCTTAGAA GAGTGGACCA G 21 (2) INFORMAÇÃO PARA SEQ ID NO: 47: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear 22 79 ΕΡ 1 584 683/ΡΤ (ii) TIPO DE MOLÉCULA: ADN (genómico)

(ίν) ΑΝΤΙ-SENTIDO: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 47: CTOTGCACCA GMGATCTAC AC (2) INFORMAÇÃO PARA SEQ ID NO: 48: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ΑΝΤΙ-SENTIDO: SIM 21

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 48: CAAGGATGAA GSTGSTGTAG A (2) INFORMAÇÃO PARA SEQ ID NO: 49: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ΑΝΤΙ-SENTIDO: SIM 23 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 49: G7GTAGAXCT TCTG3TGCAC MC (2) INFORMAÇÃO PARA SEQ ID NO: 50: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 50: 21

GCAÃTGCAGG TCATAGTGAG C 80 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 51: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iii) HIPOTÉTICA: SIM

(iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 51: TGGAQCATGG TQACGGGMT GCAGAAG (2) INFORMAÇÃO PARA SEQ ID NO: 52: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 52: GTGÂTGAGCA GGTCACTGAG CGCCMG 27 (2) INFORMAÇÃO PARA SEQ ID NO: 53: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 53: GCAATGCAGG CGCTTAACAT TAC 23 (2) INFORMAÇÃO PARA SEQ ID NO: 54: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear 22 81 ΕΡ 1 584 683/ΡΤ (ii) TIPO DE MOLÉCULA: ADN (genómico)

(ίν) ΑΝΤΙ-SENTIDO: SIM

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 54: TTGGGTTACA ATCTGÃAGGS CA (2) INFORMAÇÃO PARA SEQ ID NO: 55: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO 23

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 55: ACTCCQTGTC CAGCAGGA.CT CTG (2) INFORMAÇÃO PARA SEQ ID NO: 56: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM 24

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 56: TGCGTGTTCC TGGACCCTCA CGTG (2) INFORMAÇÃO PARA SEQ ID NO: 57: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO 29 82 ΕΡ 1 584 683/ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 57: CAGGCCTTGG ATTTTMTGT CAG3GATGG (2) INFORMAÇÃO PARA SEQ ID NO: 58: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM 27

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 58: &SÂGAGTCAG CTCTGAAAGA ATTC&GG (2) INFORMAÇÃO PARA SEQ ID NO: 59: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 59: TGATGTGATG gcagatacta atagcac (2) INFORMAÇÃO PARA SEQ ID NO: 60: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM 27 83 ΕΡ 1 584 683/ΡΤ

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 60: CCTGATTCAT TTAGGTGAGA TTGAGAC (2) INFORMAÇÃO PARA SEQ ID NO: 61: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 61: SAC&GCTACC TTSCC&TCA& G (2) INFORMAÇÃO PARA SEQ ID NO: 62: (i) CARACTERÍSTICAS DA SEQUENCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 62: 22

CTGCACMTG CCAGTGATAA GG (2) INFORMAÇÃO PARA SEQ ID NO: 63: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 63:

CTGACTTCTT GTTCCTGGCA GCAGCGG 84 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 64: (i) CARACTERISTICAS DA SEQUENCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 64:

ASACCAGCCA GGGCACGCTG AAGAGTG 27

(2) INFORMAÇÃO PARA SEQ ID NO: 65: (i) CARACTERISTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 65: GATCAAGCTT CCATCCTACT GMACC&TGG TC 32 (2) INFORMAÇÃO PARA SEQ ID NO: 66: (i) CARACTERISTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 66:

GATCAGATCT CAGTTCCÁS.T ATTCACACCA CCGTC 35 85 ΕΡ 1 584 683/ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO: 67: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 67: CTGGTGTGCT CCATGGCATC CC (2) INFORMAÇÃO PARA SEQ ID NO: 68: (i) CARACTERÍSTICAS DA SEQUENCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 68: GTAAGCCTCC ÇAGAACGAGA GG (2) INFORMAÇÃO PARA SEQ ID NO: 69: (i) CARACTERÍSTICAS DA SEQUENCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 69: CAGCGCAGGG TGAAGCCTGA GAGC (2) INFORMAÇÃO PARA SEQ ID NO: 70: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear 24 24 86 ΕΡ 1 584 683/ΡΤ (ii) TIPO DE MOLÉCULA: ADN (genómico)

(ίν) ΑΝΤΙ-SENTIDO: SIM

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 70: GGCACCTGCI GTGACÇTQTG CAGG (2) INFORMAÇÃO PARA SEQ ID NO: 71: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ΑΝΤΙ-SENTIDO: NÃO 22

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 71: GTCCTGCC&C TTCGAGACAT SG (2) INFORMAÇÃO PARA SEQ ID NO: 72: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ΑΝΤΙ-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 72: GAMCTTCTC TGCCCTTÂCC GTC (2) INFORMAÇÃO PARA SEQ ID NO: 73: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ΑΝΤΙ-SENTIDO: NÃO 26 87 ΕΡ 1 584 683/ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 73: CCMCACCAG CATCCATGGC ATCAAG (2) INFORMAÇÃO PARA SEQ ID NO: 74: (i) CARACTERISTICAS DA SEQUENCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(iv) ANTI-SENTIDO: SIM (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 74: 27

GGAGAGTCAG CTCTGAAAGÂ ATTCAGG

LISTAGEM DE SEQUÊNCIAS <110> Arena Pharmaceuticals, Inc. <120> Receptores Acoplados a Proteína G Órfãos Humanos <130> JEC/FP6282123 <140> EP 05003040.2 < 14 0 > 1999 10 13 <150> EP 99972682.1 <151> 1999 10 13 <150> PCT/US99/23687 <151> 1999 10 13 <150> 60/109,213 <151> 1998 11 20 <150> 60/120,416 <151> 1999 02 16 <150> 60/121,852 <151> 1999 02 26 <150> 60/123,946 <151> 1999 03 12 <150> 60/123,949 <151> 1999 03 12 <150> 60/136,436 <151> 1999 05 28 ΕΡ 1 584 683/ΡΤ < 17Ο> Patent In Ver. 2.1 Λ Ο LO \—1 V 60/136, 437 < 151 > 1999 05 28 Λ Ο LO \—1 V 60/136, 439 < 151 > 1999 05 28 Λ Ο LO \—1 V 60/136, 567 < 151 > 1999 05 28 Λ Ο LO \—1 V 60/137, 127 < 151 > 1999 05 28 < 15 0 > 60/137, 131 < 151 > 1999 05 28 Λ Ο LO \—1 V 60/141, 448 < 151 > 1999 06 29 Λ Ο LO \—1 V 60/156, 653 < 151 > 1999 09 29 Λ Ο LO \—1 V 60/156, 333 < 151 > 1999 09 29 Λ Ο LO \—1 V 60/156, 555 < 151 > 1999 09 29 Λ Ο LO \—1 V 60/156, 634 < 151 > 1999 09 29 < 15 0 > 60/157, 280 < 151 > 1999 10 01 < 15 0 > 60/157, 294 < 151 > 1999 10 01 Λ Ο LO \—1 V 60/157, 281 < 151 > 1999 10 01 Λ Ο LO \—1 V 60/157, 293 < 151 > 1999 10 01 Λ Ο LO \—1 V 60/157, 282 < 151 > 1999 10 01 Λ Ο LO \—1 V 09/417, 044 < 151 > 1999 10 12 < 15 0 > 09/416, 760 < 151 > 1999 10 12 <16 0> 74 89 ΕΡ 1 584 683/ΡΤ

<210> 1 <211> 1260 <212> ADN <213> Homo sapiens <400> 1 atggtcttct cggcagtgtt gactgcgttc gtgtatgaaa acacctacat gaatattaca agtccattgc ttagatatag ttttgaaacc gtgaatagta cagctgtgcc cacaacacca cagatcaccc tttctgctat aatgatattc gttgtttgcc tcatggttta ccaaaaagct gccagcctag cttttgcaga catgttgctt actattctta ctacccgatg gatttttggg ttctggttat ttgtgataga aggagtagcc cttattatag tccagaggca ggataagcta gtttcttggg caacttcctt ttgtgtagct cagatacctt cccgagctcc ccagtgtgtg gcttatgtga ttttgatttc tctcatttct tcatttatgg gcatactcaa cacccttcgg gaaggtatat gcetcagcca ggccagcaaa cagatgagca ttgacatggg ctttaaaaca gctgtcttca ttgtctgctg ggceccattc aagcáctttt actatcagca caactttttt tacctcaagt ctgcattgaa tccgctgatc gcttgcctgg acatgatgcc taagtccttc aagcgacgga tacgtcctag tgctgtctat cataccggga catccaacac aacatttgtc 60 ctccctccac cattccagca tcctgacctc 120 atggctccca ctggtttgag ttccttgacc 180 gcagcattta agagcctaaa cttgcctctt 240 attctgtttg tgtcttttct tgggaacttg 300 gccatgaggt ctgcaattaa catcctcctt 360 gcagtgctga acatgccctt tgccctggta 420 aaatccttcc gtagggtatc tgctatgttt 480 atcctgctca tcattagcat agataggttc 540 aacccatata gagctaaggt tctgattgca 600 tttcctttag ccgtaggaaa ccccgacctg 660 tttgggtaca caaccaatcc aggctaccag 720 ttcttcatac ccttcctggt aatactgtac 780 cacaatgcct tgaggatcca tagctaccct 840 ctgggtctca tgagCctgca gagacctttc 900 cgtgccttca ccactatttt gattctcttt 960 accacttaca gccttgtggc aacattcagt 1020 gagattagca cctggctact gtggctctgc 1080 tactactgga ggattaagaa attccatgat 1140 aagtttttgc cgcagctccc tggtcacaca 1200 gtgtgtgçgg aacatcggac ggtggtgtga 1260

< 210 > 2 <211> 419 <212> PRT <213> Homo sapiens 90 ΕΡ 1 584 683/ΡΤ < 4 0 0 > 2

Met Vai Phe Ser Ala val Leu 1 5 Thr Thr Phe Vai Vai Tyr Glu 20 Pro Pro Phe Gin His Pro Asp 35 Glu Thr Met Ala Pro Thr Gly 50 55 Ala Vai Pro Thr Thr Pro Ala 65 70 Gin Ile Thr Leu Ser Ala Ile 85 Leu Gly Asn Leu Vai Val Cys 100 Arg Ser Ala Ile Asn Ile Leu 115 Leu Leu Ala Vai Leu Asn Met 130 135 Thr Arg Trp Ile Phe Gly Lys 145 150 Phe Trp Leu Phe Vai Ile Glu 165 Ile Asp Arg Phe Leu Ile Ile 180 Tyr Arg Ala Lys Vai Leu Ile 195 Vai Ala Phe Pro Leu Ala Val 210 215 Arg Ala Pro Gin Cys Val Phe 225 230 Ala Tyr Vai Ile Leu Ile Ser 245 Vai Ile Leu Tyr Ser Phe Met

His Asn

Ala Phe His Thr Gly Thr Ser Asn 10 15

Thr Tyr Met Asn Ile Thr Leu Pro 25 30

Ser Pro Leu Leu Arg Tyr Ser Phe 45

Ser Ser Leu Thr Vai Asn Ser Thr 60

Phe Lys Ser Leu Asn Leu Pro Leu 75 80

Ile Phe Ile Leu Phe Vai Ser Phe 90 95

Met Vai Tyr Gin Lys Ala Ala Met 105 110

Ala Ser Leu Ala Phe Ala Asp Met 125

Phe Ala Leu Vai Thr Ile Leu Thr 140

Phe Cys Arg Vai Ser Ala Met Phe 155 160

Vai Ala Ile Leu Leu Ile Ile Ser 170 175

Gin Arg Gin Asp Lys Leu Asn Pro 185 190

Vai Ser Trp Ala Thr Ser Phe Cys 205

Asn Pro Asp Leu Gin Ile Pro Ser 220

Tyr Thr Thr Asn Pro Gly Tyr Gin 235 240

Ile Ser Phe Phe Ile Pro Phe Leu 250 255

Ile Leu Asn Thr Leu Arg 265 270 260 91 ΕΡ 1 584 683/ΡΤ

Ala Leu Arg Ile His Ser Tyr Pro Glu Gly Ile Cys Leu Ser Gin Ala 275 280 285 Ser Lys Leu Gly Leu Met Ser Leu Gin Arg Pro Phe Gin Met Ser Ile 290 295 300 Asp Met Gly Phe Lys Thr Arg Ala Phe Thr Thr Ile Leu Ile Leu Phe 305 310 315 320 Ala Vai Phe Ile Vai Cys Trp Ala Pro Phe Thr Thr Tyr Ser Leu Vai 325 330 335 Ala Thr Phe Ser Lys His Phe Tyr Tyr Gin His Asn Phe Phe Glu Ile 340 34 5:· 350 Ser Thr Trp Leu Leu Trp Leu Cys Tyr Leu Lys Ser Ala Leu Asn Pro 355 360 365 Leu Ile Tyr Tyr Trp Arg Ile Lys Lys Phe His Asp Ala Cys Leu Asp 370 375 380 Met Met Pro LyS Ser Phe Lys Phe Leu Pro Gin Leu Pro Gly His Thr 385 390 395 400 Lys Arg Arg Ile Arg Pro Ser Ala Vai Tyr Vai Cys Gly Glu His Arg 405 410 415

Thr Vai Vai

<210> 3 <211> 1119 < 212 > ADN <213> Homo sapiens <400> 3 atgttagcca acagctcctc aaccaacagt tctgttctcc cgtgtcctga ctaccgacct 60 acccaccgcc tgcacttggt ggtctacagc ttggtgctgg ctgccgggct ccccctcaac 120 gcgctagccc tctgggtctt cctgcgcgcg ctgcgcgtgc actcggtggt gagcgtgtac 180 atgtgtaacc tggcggccag cgacctgctc ttcaccctct cgctgcccgt tcgtctctcc 240 tactacgcac tgcaccactg gcccttcccc gacctcctgt gccagacgac gggcgccatc 300 ttccagatga acatgtacgg cagctgcatc ttcctgatgc tcatcaagct ggaccgctac 360 gccgccatcg tgcacccgct gcgactgcgc cacctgcggc ggccccgcgt ggcgcggctg 420 ctctgcctgg gcgtgtgggc gctcatcctg gtgtttgccg tgcccgccgc ccgcgtgcac 480 aggccctcgc gttgccgcta ccgggacctc gaggtgcgcc tatgcttcga gagcttcagc 540 gacgagctgt ggaaaggcag gctgctgccc ctcgtgctgc tggccgaggc gctgggcttc 600 ctgctgcccc tggcggcggt ggtctactcg tcgggccgag tcttctggac gctggcgcgc 660 cccgacgcca cgcagagcca gcggcggcgg aagaccgtgc gcctcctgct ggctaacctc 720 gtcatcttcc tgctgtgctt cgtgccctac aacagcacgc tggcggtcta cgggctgctg 780 cggagcaagc tggtggcggc cagcgtgcct gcccgcgatc gcgtgcgcgg ggtgctgatg 840 gtgatggtgc tgctggccgg cgccaactgc gtgctggacc cgctggtgta ctactttagc 900 gccgagggct tccgcaacac cctgcgcggc ctgggcactc cgcaccgggc caggacctcg 960 gccaccaacg ggacgcgggc ggcgctcgcg caatccgaaa ggtccgccgt caccaccgac 1020 gccaccaggc cggatgccgc cagtcagggg ctgctccgac cctccgactc ccactctctg 1080 tcttccttca cacagtgtcc ccaggattcc gccctctga 1119

<210> 4 <211> 372 <212> PRT <213> Homo sapiens 92 ΕΡ 1 584 683/ΡΤ < 4 Ο Ο > 4

Met Leu Ala Asn Ser Ser Ser Thr Asn Ser Ser Vai Leu Pro Cys Pro 1 5 10 15 Asp Tyr Arg Pro Thr His Arg Leu His Leu Vai Vai Tyr Ser Leu Vai 20 25 30 Leu Ala Ala Gly Leu Pro Leu Asn Ala Leu Ala Leu Trp Vai Phe Leu 35 40 45 Arg Ala Leu Arg Vai His Ser Vai Vai Ser Vai Tyr Met Cys Asn Leu 50 55 60 Ala Ala Ser Asp Leu Leu Phe Thr Leu Ser Leu Pro Vai Arg Leu Ser 65 70 75 80 Tyr Tyr Ala Leu His His Trp Pro Phe Pro Asp Leu Leu Cys Gin Thr 85 90 95 Thr Gly Ala Ile Phe Gin Met Asn Met Tyr Gly Ser Cys Ile Phe Leu 100 105 110 Met Leu Ile Asn Vai Asp Arg Tyr Ala Ala Ile Vai His Pro Leu Arg 115 120 125 Leu Arg His Leu Arg Arg Pro Arg Vai Ala Arg Leu Leu Cys Leu Gly 130 135 140 Vai Trp Ala Leu Ile Leu Vai Phe Ala Vai Pro Ala Ala Arg Vai His 14 5 150 155 160 Arg Pro Ser Arg Cys Arg Tyr Arg Asp Leu Glu Vai Arg Leu Cys Phe 165 170 175 Glu Ser Phe Ser Asp Glu Leu Trp Lys Gly Arg Leu Leu Pro Leu Vai 180 185 190 Leu Leu Ala Glu Ala Leu Gly Phe Leu Leu Pro Leu Ala Ala Vai vai 195 200 205 Tyr Ser Ser Gly Arg Vai Phe Trp Thr Leu Ala Arg Pro Asp Ala Thr 210 215 220 Gin Ser Gin Arg Arg Arg Lys Thr Vai Arg Leu Leu Leu Ala Asn Leu 225 230 235 240 Vai Ile Phe Leu Leu Cys Phe Vai Pro Tyr Asn Ser Thr Leu Ala Vai 245 250 255 Tyr Gly Leu Leu Arg Ser Lys Leu Vai Ala Ala Ser Vai Pro Ala Arg 260 265 270 Asp Arg Vai Arg Gly Vai Leu Met Vai Met Vai Leu Leu Ala Gly Ala 275 280 285 93 ΕΡ 1 584 683/ΡΤ

Asn Cys Vai Leu Asp Pro Leu Vai Tyr Tyr Phe Ser Ala Glu Gly Phe 290 295 300 Arg Asn Thr Leu Arg Gly Leu Gly Thr Pro His Arg Ala Arg Thr Ser 305 310 315 320 Ala Thr Asn Gly Thr Arg Ala Ala Leu Ala Gin Ser Glu Arg Ser Ala 325 330 335 Vai Thr Thr Asp Ala Thr Arg Pro Asp Ala Ala Ser Gin Gly Leu Leu 340 345 350 Arg Pro Ser Asp Ser HiS Ser Leu Ser Ser Phe Thr Gin Cys Pro Gin ^ C 360 36.6

Asp Ser Ala Leu 370 <210> 5 <211> 1107

<212> ADN <213> Homo sapiens <400> 5 atggccaact ccacagggct gaacgcctca gaagtcgcag gctcgttggg gttgatcctg 60 gcagctgtcg tggaggtggg ggcactgctg ggcaacggcg cgctgctggt cgtggtgctg 120 cgcacgccgg gactgcgcga cgcgctctac ctggcgcacc tgtgcgtcgt ggacctgctg 180 gcggccgcct ccatcatgcc gctgggcctg ctggccgcac cgccgcccgg gctgggccgc 240 gtgcgcctgg gecccgcgcc atgccgcgcc gctcgcttcc tctccgccgc tctgctgccg 300 gcctgcacgc tcggggtggc cgcacttggc ctggcacgct accgcctcat cgtgcacccg 360 ctgcggccag gctcgcggcc gccgcctgtg ctcgtgctca ccgccgtgtg ggcegcggcg 420 ggactgctgg gcgcgctctc cctgctcggc ccgccgcccg caccgccccc tgctcctgct 480 cgctgctcgg tcctggctgg gggcctcggg cccttccggc cgctctgggc cctgctagcç 540 ttcgcgctgc ccgccctcct gctgctcggo gcctacggcg gcatcttcgt ggtggcgcy·; 6C0 cgcgctgccc tgaggccccc acggccggcg cgcgggtccc gactccgctc ggactctctg 660 gatagccgcc tttccatctt gccgccgctc cggcctcgcc tgcccggggg caaggcggcc 720 ctggccccag cgctggccgt gggccaattt gcagcctgct ggctgcctta cggctgcgcg 780 tgcctggcgc ccgcagcgcg ggccgcggaa gccgaagcgg ctgtcacctg ggtcgcctac 840 tcggccttcg cggctcaccc cttcctgtac gggctgctgc agcgccccgt gcgcttggca 900 ctgggccgcc tctctcgccg tgcactgcct ggacctgtgc gggcctgcac tccgcaagcc 960 tggcacccgc ggçcactctt gcaatgcctc cagagacccc cagagggccc tgccgtaggc 1020 ccttctgagg ctccagaaca gacccccgag ttggcaggag ggcggagccc cgcataccag 1080 gggccacctg agagttctct ctcctga 1107 <210> 6 <211> 368

< 212 > PRT <213> Homo sapiens < 4 0 0 > 6

Met Ala Asn Ser Thr Gly Leu Asn Ala Ser Glu Vai Ala Gly Ser Leu 15 10 15

Gly Leu Ile Leu Ala Ala Vai Vai Glu Vai Gly Ala Leu Leu Gly Asn 20 25 30 94 EP 1 584 683/PT Gly Ala Leu Leu Val Val Val Leu 35 40 Leu Tyr Leu Ala His Leu Cys Val 50 55 Ile Met Pro Leu Gly Leu Leu Ala 65 70 Val Arg Leu Gly Pro Ala Pro Cys 85 Ala Leu Leu Pro Ala Cys Thr Leu 100 Arg Tyr Arg Leu Ile Val His Pro 115 120 Pro Val Leu Val Leu Thr Ala Val 130 135 Ala Leu Ser Leu Leu Gly Pro Pro 145 150 Arg Cys Ser Val Leu Ala Gly Gly 165 Ala Leu Leu Ala Phe Ala Leu Pro 180 Gly Gly Ile Phe Val Val Ala Arg 195 200 Pro Ala Arg Gly Ser Arg Leu Arg 210 215 Ser Ile Leu Pro Pro Leu Arg Pro 225 230 Leu Ala Pro Ala Leu Ala Val Gly 24 5 Tyr Gly Cys Ala Cys Leu Ala Pro 260 Ala Ala Val Thr Trp Val Ala Tyr 275 280 Leu Tyr Gly Leu Leu Gin Arg Pro 290 2 95 Ser Arg Arg Ala Leu Pro Gly Pro 305 310 Trp His Pro Arg Ala Leu Leu Gin 325 Pro Ala Val Gly Pro Ser Glu Ala 340

Arg Thr Pro Gly Leu Arg Asp Ala 45

Vai Asp Leu Leu Ala Ala Ala Ser 60

Ala Pro Pro Pro Gly Leu Gly Arg 75 80

Arg Ala Ala Arg Phe Leu Ser Ala 90 95

Gly Vai Ala Ala Leu Gly Leu Ala 105 110

Leu Arg Pro Gly Ser Arg Pro Pro 125

Trp Ala Ala Ala Gly Leu Leu Gly 140

Pro Ala Pro Pro Pro Ala Pro Ala 155 160

Leu Gly Pro Phe Arg Pro Leu Trp 170 175

Ala Leu Leu Leu Leu Gly Ala Tyr 185 190

Arg Ala Ala Leu Arg Pro Pro Arg 205

Ser Asp Ser Leu Asp Ser Arg Leu 220

Arg Leu Pro Gly Gly Lys Ala Ala 235 240

Gin Phe Ala Ala Cys Trp Leu Pro 250 255

Ala Ala Arg Ala Ala Glu Ala Glu 265 270

Ser Ala Phe Ala Ala His Pro Phe 285

Vai Arg Leu Ala Leu Gly Arg Leu 300

Val Arg Ala Cys Thr Pro Gin Ala 315 320

Cys Leu Gin Arg Pro Pro Glu Gly 330 335

Pro Glu Gin Thr Pro Glu Leu Ala 345 350

Gly Gly Arg Ser Pro Ala Tyr Gin 355 360 <210> 7 <211> 1008 <212> ADN <213> Homo sapiens

Gly Pro Pro Glu Ser Ser Leu Ser 365 95 ΕΡ 1 584 683/ΡΤ < 4 Ο Ο > 7 “ ‘-ϊί”1----- actaacacac ctctgcttca ctactcacag cggatggcat tttgacaggt gtggccgggg ctcggaatcc tttcaccctc tttgtcttct aagatggaac ttcaaagctc ttccttatca gaacggtacc tattggcaga ctcacctcat agttcctgtc ctttctcâtt tagtggctgt ccttgaatct accagctctc ttgtcacttc acct tgccat cctgcattgc ccatgttcca acttcgtgct tctactgcga atgcaggagc tccgtactgt ctggcattgt tgtggctgct aggaggtgcg tcctcctctt acatcgtcac t nna nt γγλ fr. ggctgtgctg ggctgtggct cagcccttct ctccgcagct caagcagccc cgggctgtgg gcagactgcc gaccctctcc catgctcaag catggctgga gtctgttctc gcaggtggcc cggcgtgggc actgcagctc tctctcggcc tatctccagc

Cttgrl-gt-.rr ctgtCgatcc gacaccttga cggcccacac gcctctgtcc ttccgctact ttagtgtctt tacaaagggc tgcgttggct attgcctcca ggttatcgat attgggagct tgccaggagt aactccctgc taccacatgg aggaattgtg tcagagtttg tggcctccct acaagaatga ttggtgtggc agaagaccct tcacggtcat tgaagatcat acctcattgg agtgcagctt tcttcccagc tgcacagcca ccccacggac ttgctctatc gtcacctcta tcaacccact ccctaggagt gcccagagag atggctaa catcattgct 60 tggtgtcagt 120 catctctggc 180 gtgcagcctg 240 gctgatcacc 300 gagtgggttc 360 cttcctccca 420 ctttgctgta 480 catgctcctc 540 gcagattcga 600 tcccagcgac 660 ctggaccccc 720 cctagtgctg 780 catctatgcc 840 gaagaaggtg 900 gcccagggaa 960 1008

< 210 > 8 <211> 335 <212> PRT <213> Homo sapiens < 4 0 0 > 8

Met Glu Ser Ser Phe Ser Phe Gly Vai Ile Leu Ala Vai Leu Ala Ser 1 5 10 15 Leu Ile Ile Ala Thr Asn Thr Leu Vai Ala Vai Ala Vai Leu Leu Leu 20 25 30 Ile His Lys Asn Asp Gly Vai Ser Leu Cys Phe Thr Leu Asn Leu Ala 35 40 45 Vai Ala Asp Thr Leu Ile Gly Vai Ala Ile Ser Gly Leu Leu Thr Asp 50 55 60 Gin Leu Ser Ser Pro Ser Arg Pro Thr Gin Lys Thr Leu Cys Ser Leu 65 70 75 80 Arg Met Ala Phe Vai Thr Ser Ser Ala Ala Ala Ser Vai Leu Thr Vai 85 90 95 Met Leu Ile Thr Phe Asp Arg Tyr Leu Ala Ile Lys Gin Pro Phe Arg 100 105 110 96 ΕΡ 1 584 683/ΡΤ

Tyr Leu Lys Ile Met Ser Gly Phe Val Ala Gly Ala Cys Ile Ala Gly 115 120 125 Leu Trp Leu Val Ser Tyr Leu Ile Gly Phe Leu Pro Leu Gly Ile Pro 130 135 140 Met Phe Gin Gin Thr Ala Tyr Lys Gly Gin Cys Ser Phe Phe Ala val 145 150 155 160 Phe His Pro His Phe Val Leu Thr Leu Ser Cys Val Gly Phe Phe Pro 165 170 175 Ala Met Leu Leu Phe Val Phe Phe Tyr Cys Asp Met Leu Lys Ile Ala 180 185 190 Ser Met His Ser Gin Gin Ile Arg Lys Met Glu His Ala Gly Ala Met 195 200 205 Ala Gly Gly Tyr Arg Ser Pro Arg Thr Pro Ser Asp Phe Lys Ala Leu 210 215 220 Arg Thr Val Ser Val Leu Ile Gly Ser Phe Ala Leu Ser Trp Thr Pro 225 230 235 240 Phe Leu Ile Thr Gly Ile Val Gin Val Ala Cys Gin Glu Cys His Leu 245 250 255 Tyr Leu val Leu Glu Arg Tyr Leu Trp Leu Leu Gly Val Gly Asn Ser 260 265 270 Leu Leu Asn Pro Leu Ile Tyr Ala Tyr Trp Gin Lys Glu Val Arg Leu 275 280 285 Gin Leu Tyr His Met Ala Leu Gly Val Lys Lys Val Leu Thr Ser Phe 290 255 300 Leu Leu Phe Leu Ser Ala Arg Asn Cys Gly Pro Glu Arg Pro Arg Glu 305 310 315 320 Ser Ser Cys His Ile Val Thr Ile Ser Ser Ser Glu Phe Asp Gly 325 330 335

< 210 > 9 <211> 1413 <212> ADN <213> Homo sapíens <400> 9 atggacacta ccatggaagc tgacctgggt gccactggcc acaggccccg cacagagctt 60 gatgatgagg actcctaccc ccaaggtggc tgggacacgg tcttcctggt ggccctgctg 120 ctccttgggc tgccagccaa tgggttgatg gcgtggctgg ccggctccca ggcccggcat 180 ggagctggca cgcgtctggc gctgctcctg ctcagcctgg ccctctctga cttcttgttc 240 ctggcagcag cggccttcca gatcctaçag atccggcatg ggggacactg gccgctgggg 300 acagctgcct gccgcttcta ctacttccta tggggcgtgt cctactcctc cggcctcttc 360 ctgctggccg ccctcagcct cgaccgctgc ctgctggcgc tgtgcccaca ctggtaccct 420 gggcaccgcc cagtccgcct gcccctctgg gtctgcgccg gtgtctgggt gctggccaca 480 ctcttcagcg tgccctggct ggtcttcccc gaggctgccg tctggtggta cgacctggtc 540 97 ΕΡ 1 584 683/ΡΤ atctgcctgg acttctggga cagcgaggag ctgtcgctga ggatgctgga ggtcctgggg 600 ggcttcctgc ctttcctcct gctgctcgtc tgccacgtgc tcacccaggc cacagcctgt 660 cgcacctgcc accgccaaca gcagcccgca gcctgccggg gcttcgcccg tgtggccagg 720 accattctgt cagcctatgt ggtcctgagg ctgccctacc agctggccca gctgcCctac 780 ctggccttcc tgtgggacgt ctactctggc tacctgctct gggaggccct ggtctactcc 840 gactacctga tcctactcaa cagctgcctc agccccttcc tctgcctcat ggccagtgcc 900 gacccccgga ccccgctgcg ctccgtgctc tcgtccttcg cggcagctct ctgcgaggag 360 cggccgggca gcttcacgcc cactgagcca cagacccagc tagattctga gggtccaact 1020 ctgccagagc cgatggcaga ggcccagtca cagatggatc ctgtggccca gcctcaggtg 1080 aaccccacac tccagccacg atcggatccc acagctcagc cacagctgaa ccctacggcc 1140 cagccacagt cggatcccac agcccagcca cagctgaacc tcatggccca gccacagtca 1200 gattctgtgg cccagccaca ggcagacact aacgtccaga cccctgcacc tgctgccagt 1260 tctgtgccca gtccctgtga tgaagcttcc ccaaccccat cctcgcatcc taccccaggg 1320 gcccttgagg acccagccac acctcctgcc tctgaaggag aaagccccag cagcaccccg 1380 rcagagnrgg ccccaagcgc aagccccaca toa 1413

<210> 10 <211> 468 <212> PRT <213> Homo sapiens <400> 10

Met Asp Thr Thr Met Glu Ala Asp Leu Gly Ala Thr Gly His Arg Pro 1 5 10 15 Arg Thr Glu Leu Asp Asp Glu Asp Ser Tyr Pro Gin Gly Gly Trp Asp 20 25 30 Thr Vai Phe Leu Vai Ala Leu Leu Leu Leu Gly Leu Pro Ala Asn Gly 35 40 45 Leu Met Ala Trp Leu Ala Gly Ser Gin Ala Arg His Gly Ala Gly Thr 50 55 60 Arg Lfcu Ala Leu Leu Leu Leu Ser Leu Ala Leu Ser Asp Leu Phe 65 70 75 80 Leu Ala Ala Ala Ala Phe Gin Ile Leu Glu Ile Arg His Gly Gly His 85 90 95, Trp Pro Leu Gly Thr Ala Ala Cys Arg Phe Tyr Tyr Phe Leu Trp Gly 100 105 110 Vai Ser Tyr Ser Ser Gly Leu Phe Leu Leu Ala Ala Leu Ser Leu Asp 115 120 125 Arg Cys Leu Leu Ala Leu Cys Pro His Trp Tyr Pro Gly His Arg Pro 130 135 140 Vai Arg Leu Pro Leu Trp Vai Cys Ala Gly Vai Trp Vai Leu Ala Thr 145 150 155 160 Leu Phe Ser Vai Pro Trp Leu Vai Phe Pro Glu Ala Ala Vai Trp Trp 16S 170 175

Leu Ser

Tyr Asp Leu Vai Ile Cys Leu Asp Phe Trp Asp Ser Glu Glu 180 185 190 98 ΕΡ 1 584 683/ΡΤ

Leu Arg Met Leu Glu Vai Leu Gly Gly Phe Leu Pro Phe Leu Leu Leu 195 200 205 Leu Vai Cys His Vai Leu Thr Gin Ala Thr Arg Thr Cys His Arg Gin 210 215 220 Gin Gin Pro Ala Ala Cys Arg Gly Phe Aia âry Vai Ala Ary Thr Ile 225 230 235 240 Leu Ser Ala Tyr Vai Vai Leu Arg Leu Pro Tyr Gin Leu Ala Gin Leu 245 250 255 Leu Tyr Leu Ala Phe Leu Trp Asp val Tyr Ser Gly Tyr Leu Leu Trp 260 265 270 Glu Ala Leu Vai Tyr Ser Asp Tyr Leu Ile Leu Leu Asn Ser Cys Leu 275 280 285 Ser Pro Phe Leu Cys Leu Met Ala Ser Ala Asp Leu Arg Thr Leu Leu 290 295 300 Arg Ser Vai Leu Ser Ser Phe Ala Ala Ala Leu Cys Glu Glu Arg Pro 305 310 315 320 Gly Ser Phe Thr Pro Thr Glu Pro Gin Thr Gin Leu Asp Ser Glu Gly 325 330 335 Pro Thr Leu Pro Glu Pro Met Ala Glu Ala Gin Ser Gin Met Asp Pro 340 345 350 Vai Ala Gin Pro Gin Vai Asn Pro Thr Leu Gin Pro Arg Ser Asp Pro 355 360 365 Thr Ala Gin Pro Gin Leu Asn Pro Thr Ala Gin Pro Gin Ser Asp Pro 370 37 5 380 Thr Ala Gin Pro Gin Leu Asn Leu Met Ala Gin Pro Gin Ser Asp Ser 385 390 395 400 Vai Ala Gin Pro Gin Ala Asp Thr Asn Val Gin Thr Pro Ala Pro Ala 405 410 415 Ala Ser Ser Vai Pro Ser Pro Cys Asp Glu Ala Ser Pro Thr Pro Ser 420 425 430 Ser His Pro Thr Pro Gly Ala Leu Glu Asp Pro Ala Thr Pro Pro Ala 435 440 445 Ser Glu Gly Glu Ser Pro Ser Ser Thr Pro Pro Glu Ala Ala Pro Gly 450 455 460

Ala Gly Pro Thr 4 65

<210> 11 <211> 1248 <212> ADN <213> Homo sapiens 99 ΕΡ 1 584 683/ΡΤ <400> 11 atgtcaggga ccattccaga cgcagccact attggcaatg aactactacc ctggággtct ttcaagacgg agcgtggagc cgccgggccc aacaccagca tcggccacct tccttcctat CtCSOaCt as ccctgcagaa tgggccccgt ctggctgctç gctgtcaacc gtgatctctt cagcggaaca caattcccat cagatgtcaa <210> 12 <2ll> 415 <212> PRT <213> Homo sapiens < 4 0 0 > 12 tggaaaaact aacacctgaa tcttcctccc tcctggtgtg tcttcagcct atgagatgtg ccctctttga gctacgtggc tcaggatcct tccatggcat gtacggtcat tctacctcct agaaagacaa aatcagtcaa tccacattga tgttcaacct ccattatcta ctttecacaa tcttcctgac gtcagtcatc gaacaaacta tcagaatgct cagcaccgag cgtgtctgtg cctggtgatt ggcggtctct gcgcaactac gaccgtgtgc catcctacac cggcatcgtc caagttccac çaagcccatg ccccatgact atnt-nhtnag caagatgctg ccgactcttc cgtccatgtg taacctactg acagtggcac agaatgccac catgcacaac tcaaagcttc tcctggatct gagtatctgg gtgtatgtgc ctgcagcacc gacctcctgg cctttottgt ttcgcctcca ccgttccgcg tggggcttct tacttcccca tggatctaca gtcatcagtg gcagstoaao tttgtcttgg ttcagctttg gtgtcaggtg tctcgccgct tcccagcatg tttgtggagc tctcacctcc cactttaaca accagcagaa ccttcctctg caatttttgt aggctatgaa tcctgctcct tcgggcccgt tcctcaçcat ccaaactgca ccgtgctctt atgggtccct atttcatcat tcctctacta gaaatgcaaa tcttagtgtt tggaggagtg tcttcttcta tccaggcagc acccacagtt tgaccgaaga caacagccct aaacctga actagaagat cggacctcgg ggtgggggtc gacgcccacc tggaatgccc gggctgctac caccaccgtc gagcacccgg ctccctgccc ggtcccaggt ccaggtcacc cctcatggca tattcaaaga tgctatctgt gagtgaatcc cctgagctca attccagaat gccacctgcc tataggtccc ctctagtgaa 60 120 1B0 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1248

Met Ser Gly Met Glu Lys Leu Gin Asn Ala Ser Trp Ile Tyr Gin Gin 1 5 10 15 Lys Leu Glu Asp Pro Phe Gin Lys His Leu Asn Ser Thr Glu Glu Tyr 20 25 -C Leu Ala Phe Leu Cys Gly Pro Arg Arg Ser His Phe Phe Leu Pro Val 35 40 45 Ser val Val Tyr Val Pro Ile Phe Val Val Gly Val Ile Gly Asn Val 50 55 60 Leu Val Cys Leu Val Ile Leu Gin His Gin Ala Met Lys Thr Pro Thr 65 70 75 80 Asn Tyr Tyr Leu Phe Ser Leu Ala Val Ser Asp Leu Leu Val Leu Leu 85 “90 95 Leu Gly Met Pro Leu Glu Val Tyr Glu Met Trp Arg Asn Tyr Pro Phe 100 105 110 Leu Phe Gly Pro Val Gly Cys Tyr Phe Lys Thr Ala Leu Phe Glu Thr 115 120 125 Vai Cys Phe Ala Ser Ile Leu Ser Ile Thr Thr Val Ser Val Glu Arg 130 135 140

Tyr Vai Ala Ile Leu His Pro Phe Arg Ala Lys Leu Gin Ser Thr Arg 100 ΕΡ 1 584 683/ΡΤ 145 150 155 160

Arg Arg Ala Leu Arg Ile Leu Gly Ile Val Trp, Gly Phe Ser Val Leu 165 170 175 Phe Ser Leu Pro Asn Thr Ser Ile His Gly Ile Lys Phe His Tyr Phe ISO 185 190 Pro Asn Gly Ser Leu Val Pro Gly Ser Ala Thr Cys Thr Val Ile Lys 195 200 205 Pro Met Trp Ile Tyr Asn Phe Ile Ile Gin Val Thr Ser Phe Leu Phe 210 215 220 Tvr Leu Leu Pro Met Thr Val Ile Ser Val Leu Tyr Tyr Leu Met Ala 225 230 235 240 Leu Arg Leu Lys Lys Asp Lys Ser Leu Glu Ala Asp Glu Gly Asn Ala 245 250 255 Asn Ile Gin Arg Pro Cys Arg Lys Ser Val Asn Lys Met Leu Phe Val 260 265 270 Leu Vai Leu Vai Phe Ala Ile Cys Trp Ala Pro Phe His Ile Asp Arg 275 280 285 Leu Phe Phe Ser Phe Val Glu Glu Trp Ser Glu Ser Leu Ala Ala Val 290 295 300 Phe Asn Leu Vai His Val Val Ser Gly Val Phe Phe Tyr Leu Ser Ser 305 310 315 320 Ala Vai Asn Pro Ile Ile Tyr Asn Leu Leu Ser Arg Arg Phe Gin Ala 325 330 335 Ala Phe Gin Asn \ f-, Ί voa. Ile Ser Ser Phe His Lys Gin TrF His Ser Gin 340 345 350 His Asp Pro Gin Leu Pro Pro Ala Gin Arg Asn Ile Phe Leu Thr Glu 355 360 365 Cys His Phe Vai Glu Leu Thr Glu Asp Ile Gly Pro Gin Phe Pro Cys 370 375 380 Gin Ser Ser Met His Asn Ser His Leu Pro Thr Ala Leu Ser Ser Glu 385 390 395 400 Gin Met Ser Arg Thr Asn Tyr Gin Ser Phe His Phe Asn Lys Thr 405 410 415 < 210 > 13 <211> 1173 <212> ADN < 213 > Homo sapíens < 4 0 0 > 13 atgccagata ctaatagcac aatcaattta tcactaagca ctcgtgttac tttagcattt 60 tttatgtcct tagtagcttt tgctataatg ctaggaaatg ctttggtcat tttagctttt 120 101 ΕΡ 1 584 683/ΡΤ gtggtggaca aaaaccttag acatcgaagt agttattttt ttcttaactt ggccatctct 180 gacttctttg tgggtgtgat ctccattcct ttgtacatcc ctcacacgct gttcgaatgg 240 gattttggaa aggaaatctg tgtattttgg ctcactactg actatctgtt atgtacagca 300 tctgtatata acattgtcct catcagctat gatcgatacc tgtcagtctc aaatgctgtg 360 tcttatagaa ctcaacatac tggggtcttg aagattgtta ctctgatggt ggccgtttgg 420 gtgctggcct tcttagtgaa 'tgggccaatg attctagttt cagagtcttg gaaggatgaa 480 ggtagtgaat gtgaacctgg atttttttcg gaatggtaca tccttgccat cacatcattc 540 ttggaattcg tgatcccagt catcttagtc gcttatttca acatgaatat ttattggagc 600 ctgtggaagc gtgatcatct cagtaggtgc caaagccatc ctggactgac tgctgtctct 660 tccaacatct gtggacactc attcagaggt agactatctt caaggagatc tctttctgca 720 tcgacagaag ttcctgcatc ctttcattca gagagacaga ggagaaagag tagtctcatg 780 ttttcctcaa gaaccaagat gaatagcaat acaattgctt ccaaaatggg ttccttctcc 840 caatcagatt ctgtagctct tcaccaaagg gaacatgttg aactgcttag agccaggaga 900 ttagccaagt cactggccat tctcttaggg gtttttgctg tttgctgggc tccatattct 960 ctgttcaca.a ttgtccrhtn attttattoc tcagcaacaa gtcctaaatc aattegatat 1020 ► agaattgcat tttggcttca gtggttcaat tcctttgtca atcctctttt gtatccattg 1080 tgtcacaagc gctttcaaaa ggctttcttg aaaatatttt gtataaaaaa gcaacctcta 1140 ccaccacaac acagtcggtc agtatcttct taa 1173

<210> 14 <211> 390 <212> PRT <213> Homo sapíens < 4 0 0 > 14

Met Pro Asp Thr Asn Ser Thr ile Asn Leu Ser Leu Ser Thr Arg Vai 1 5 10 15 Thr Leu Ala Phe Phe Met Ser Leu Vai Ala Phe Ala Ile Met Leu Gly 20 25 30 Asn Ala Leu Vai Ile Leu Ala Phe Vai Vai Asp Lys Asn Leu Arg His 35 40 45 Ai'y Ser Ser Tyr Phe Phe Leu Asn Leu Ala Ile Ser Asp PLc- riv íi Vai 50 55 60 Gly Vai Ile Ser Ile Pro Leu Tyr Ile Pro His Thr Leu Phe Glu Trp 65 70 75 80 Asp Phe Gly Lys Glu Ile Cys Vai Phe Trp Leu Thr Thr Asp Tyr Leu 85 90 95 Leu Cys Thr Ala Ser Vai Tyr Asn Ile Vai Leu Ile Ser Tyr Asp Arg 100 105 110 Tyr Leu Ser Vai Ser Asn Ala Vai Ser Tyr Arg Thr Gin His Thr Gly 115 120 125 Vai Leu Lys Ile Vai Thr Leu Met Vai Ala Vai Trp Vai Leu Ala Phe 130 135 140 Léu Vai Asn Gly Pro Met Ile Leu Vai Ser Glu Ser Trp Lys Asp Glu 145 150 155 160 Gly Ser Glu Cys Glu Pro Gly Phe Phe Ser Glu Trp Tyr Ile Leu Ala 165 170 175 102 ΕΡ 1 584 683/ΡΤ

Ile Thr Ser Phe Leu Glu Phe Vai Ile Pro Val Ile Leu Val Ala Tyr 180 185 190 Phe Asn Met Asn Ile Tyr Trp Ser Leu Trp Lys Arg Asp His Leu Ser 195 200 205 Arg Cys Gin Ser His Pro Gly Leu Thr Ala Vai Ser Ser Asn He Cys 210 215 220 Gly His Ser Phe Arg Gly Arg Leu Ser Ser Arg Arg Ser Leu Ser Ala 225 230 235 240 Ser Thr Glu Vai Pro Ala Ser Phe His Ser Glu Arg Gin Arg Arg Lys 245 250 255 Ser Ser Leu Met Phe Ser Ser Arg Thr Lys Met Asn Ser Asn Thr Ile 260 265 270 Ala Ser Lys Met Gly Ser Phe Ser Gin Ser Asp Ser Val Ala Leu His 275 280 285 Gin Arg Glu His Vai Glu Leu Leu Arg Ala Arg Arg Leu Ala Lys Ser 290 295 300 Leu Ala Ile Leu Leu Gly Vai Phe Ala Val Cys Trp Ala Pro Tyr Ser 305 310 315 320 Leu Phe Thr Ile Vai Leu Ser Phe Tyr Ser Ser Ala Thr Gly Pro Lys 325 330 335 Ser Vai Trp Tyr Arg Ile Ala Phe Trp Leu Gin Trp Phe Asn Ser Phe 340 345 350 Vai Asn Pro Leu Leu Tyr Pro Leu Cys His Lys Arg Phe Gin Lys Ala 355 360 365 Phe Leu Lys Ile Phe Cys Ile Lys Lys Gin Pro Leu Pro Ser Gin His 370 375 380 Ser Arg Ser Vai Ser Ser 385 390 < 210 > 15 <211> 1128

< 212 > ADN <213> Homo sapíens <400> 15 atggcgaacg cgagcgagcc gggtggcagc ggcggcggcg aggcggccgc cctgggcctc 60 aagctggcca cgctcagcct gctgctgtgc gtgagcctag cgggcaacgt gctgttcgcg 120 ctgctgatcg tgcgggagcg cagcctgcac cgcgccccgt actacctgct gctcgacctg 180 tgcctggccg acgggctgcg cgcgctcgcc tgcctcccgg ccgtcatgct ggcggcgcgg 240 cgtgcggcgg ccgcggcggg ggcgccgccg ggcgcgctgg gctgcaagct gctcgccttc 300 ctggccgcgc tcttctgctt ccacgccgcc ttcctgctgc tgggcgtggg cgtcacccgc 360 tacctggcca tcgcgcacca ccgcttctat gcagagcgcc tggccggctg gccgtgcgcc 420 gccatgctgg tgtgcgccgc ctgggcgctg gcgctggccg cggccttccc gccagtgctg 480 gacggcggtg gcgacgacga ggacgcgccg tgcgccctgg agcagcggcc cgacggcgcc 540 cccggcgcgc tgggcttcct gctgctgctg gccgtggtgg tgggcgccac gcacctcgtc 600 103 ΕΡ 1 584 683/ΡΤ tacctccgcc tgctcttctt catccacgac cgccgcaaga tgcggcccgc gcgcctggtg 660 cccgccgtca gccacgactg gaccttccac ggcccgggcg ccaccggcca ggcggccgcc 720 aactggacgg cgggcttcgg ccgcgggccc acgccgcccg cgcttgtggg catccggccc 780 gcagggccgg gccgcggcgc gcgccgcctc ctcgtgctgg aagaattcaa gacggagaag 840 aggctgtgca agatgttcta cgccgtcacg ctgctcttcc tgctcctctg ggggccctac 900 gtcgtggcca gctacctgcg ggtcctggtg cggcccggcg ccgtccccca ggcctacctg 960 acggcctccg tgtyyCtyãC CttCgCyCáy yCCyyCALCâ áOCCCyLcyt yLyuLLueLu 1020 ttcaacaggg agctgaggga ctgcttcagg gcccagttcc cctgctgcca gagcccccgg 1080 accacccagg cgacccatcc ctgcgacctg aaaggcattg gtttatga 1128

<210> 16 <211> 375 <212> PRT <213> Homo sapiens <400> 16

Met Ala Asn Ala Ser Glu Pro Gly Gly Ser Gly Gly Gly Glu Ala Ala 1 5 10 15 Ala Leu Gly Leu Lys Leu Ala Thr Leu Ser Leu Leu Leu Cys Vai Ser 20 25 30 Leu Ala Gly Asn Vai Leu Phe Ala Leu Leu Ile Vai Arg Glu Arg Ser 35 40 45 Leu His Arg Ala Pro Tyr Tyr Leu Leu Leu Asp Leu Cys Leu Ala Asp 50 55 60 Gly Leu Arg Ala Leu Ala Cys Leu Pro Ala Vai Met Leu Ala Ala Arg 65 70 75 80 Arg Ala Ala Ala Ala Ala Gly Ala Pro Pro Gly Ala Leu Gly Cys Lys 85 90 95 Leu Leu Ala Phe Leu Ala Ala Leu Phe Cys Phe His Ala Ala Phe Leu 100 105 110 Leu Leu Gly Vai Gly Vai Thr Arg Tyr Leu Ala Ile Ala His His Arg 115 120 125 Phe Tyr Ala Glu Arg Leu Ala Gly Trp Pro Cys Ala Ala Met Leu Vai 130 135 140 Cys Ala Ala Trp Ala Leu Ala Leu Ala Ala Ala Phe Pro Pro Vai Leu 145 150 155 160 Asp Gly Gly Gly Asp Asp Glu Asp Ala Pro Cys Ala Leu Glu Gin Arg 165 170 175 Pro Asp Gly Ala Pro Gly Ala Leu Gly Phe Leu Leu Leu Leu Ala Vai 180 185 190 Vai Vai Gly Ala Thr His Leu Vai Tyr Leu Arg Leu Leu Phe Phe Ile 195 200 205 His Asp Arg Arg Lys Met Arg Pro Ala Arg Leu Vai Pro Ala Vai Ser 210 215 220 104 ΕΡ 1 584 683/ΡΤ

His Asp Trp Thr Phe His Gly Pro Gly Ala Thr Gly Gin Ala Ala Ala 225 230 235 240 Asn Trp Thr Ala Gly Phe Gly Arg Gly Pro Thr Pro Pro Ala Leu Val 245 250 255 ri --v?aj T > « XX? nx>^ Prc W 7 -nx o sjxy Pro ^»7 .. m y 7 .. v? a j » 7 _ πια n — — nx y » _ — ucu T UC u tt. 7 VOA 260 265 270 Leu Glu Glu Phe Lys Thr Glu Lys Arg Leu Cys Lys Met Phe Tyr Ala 275 280 285 Vai Thr Leu Leu Phe Leu Leu Leu Trp Gly Pro Tyr Val Val Ala Ser 290 295 300 Tyr Leu Arg Vai Leu Vai Arg Pro Gly Ala Val Pro Gin Ala Tyr Leu 305 310 315 320 Thr Ala Ser Vai Trp Leu Thr Phe Ala Gin Ala Gly Ile Asn Pro Val 325 330 335 Vai Cys Phe Leu Phe Asn Arg Glu Leu Arg Asp Cys Phe Arg Ala Gin 340 345 350 Phe Pro Cys Cys Gin Ser Pro Arg Thr Thr Gin Ala Thr His Pro Cys 355 360 365 Asp Leu Lys Gly Ile Gly Leu 370 375 <210 > 17 <211> 1002

< 212 > ADN <213> Homo sapiens < 4 0 0 > 17 atgaacacca cagtgatgca aggcttcaac agatctgagc ggtgccccag agacactcgg 60 atagtacagc tggtattccc agccctctac acagtggttt tcttgaccgg catcctgctg 120 aatactttgg ctctgtgggt gtttgttcac atccccagct cctccacctt catcatctac 180 ctcaaaaaca ctttggtggc cgacttgata atgacactca tgcttccttt caaaatcctc 240 tctgactcac acctggcacc ctggcagctc agagcttttg tgtgtcgttt ttcttcggtg 300 atattttatg agaccatgta tgtgggcatc gtgctgttag ggctcatagc ctttgacaga 360 ttcctcaaga tcatcagacc tttgagaaat atttttctaa aaaaacctgt ttttgcaaaa 420 acggtctcaa tcttcatctg gttctttttg ttcttcatct ccctgccaaa tacgatcttg 480 agcaacaàgg aagcaacacc atcgtctgtg aaaaagtgtg cttccttaaa ggggcctctg 540 gggctgaaat ggcatcaaat ggtaaataac atatgccagt ttattttctg gactgttttt 600 atcctaatgc ttgtgtttta tgtggttatt gcaaaaaaag tatatgattc ttatagaaag 660 tccaaaagta aggacagaaa aaacaacaaa aagctggaag gcaaagtatt tgttgtcgtg 720 gctgtcttct ttgtgtgttt tgctccattt cattttgcca gagttccata tactcacagt 780 caaaccaaca ataagactga ctgtagactg caaaatcaac tgtttattgc taaagaaaca 840 actctctttt tggcagcaac taacatttgt atggatccct taatatacat attcttatgt 900 aaaaaattca cagaaaagct accatgtatg caagggagaa agaccacagc atcaagccaa 960 gaaaatcata gcagtcagac agacaacata accttaggct ga 1002 <210> 18 <211> 333

< 212 > PRT <213> Homo sapiens 105 ΕΡ 1 584 683/ΡΤ <900> 18 Met Asn Thr Thr Vai Met Gin Gly Phe Asn Arg Ser Glu Arg Cys Pro 1 5 10 15 'hr Arg II 20

Vai Phe Leu Thr Gly Ile Leu Leu Asn Thr Leu Ala Leu Trp Vai Phe 35 40 45

Vai His Ile Pro Ser Ser Ser Thr Phe Ile Ile Tyr Leu Lys Asn Thr 50 55 60

Leu Vai Ala Asp Leu Ile Met. Thr Leu Met Leu Pro Phe Lys Ile Leu 65 70 75 80

Ser Asp Ser His Leu Ala Pro Trp Gin Leu Arg Ala Phe Vai Cys Arg 85 90 95

Phe Ser Ser Vai Ile Phe Tyr Glu Thr Met Tyr Vai Gly Ile Vai Leu 100 105 110

Leu Gly Leu Ile Ala Phe Asp Arg Phe Leu Lys Ile Ile Arg Pro Leu 115 120 125

Arg Asn Ile Phe Leu Lys Lys Pro Vai Phe Ala Lys Thr Vai Ser Ile 130 135 140

Phe Ile Trp Phe Phe Leu Phe Phe Ile Ser Leu Pro Asn Thr Ile Leu 145 150 155 160

Ser Asn Lys Glu Ala Thr Pro Ser Ser Vai Lys Lys Cys Ala Ser Leu 165 170 175

Lys Gly Pro Leu Gly Leu Lys Trp His Gin Met Vai Asn Asn Ile Cys 180 185 190

Gin Phe Ile Phe Trp Thr Vai Phe Ile Leu Met Leu Vai Phe Tyr Vai 195 200 205

Vai Ile Ala Lys Lys Vai Tyr Asp Ser Tyr Arg Lys Ser Lys Ser Lys 210 215 220

Asp Arg Lys Asn Asn Lys Lys Leu Glu Gly Lys Vai Phe Vai Vai Vai 225 230 235 240

Ala Vai Phe Phe Vai Cys Phe Ala Pro Phe His Phe Ala Arg Vai Pro 245 250 255

Tyr Thr His Ser Gin Thr Asn Asn Lys Thr Asp Cys Arg Leu Gin Asn 260 265 270

Gin Leu Phe Ile Ala Lys Glu Thr Thr Leu Phe Leu Ala Ala Thr Asn 275 280 285

Ile Cys Met Asp Pro Leu Ile Tyr Ile Phe Leu Cys Lys Lys Phe Thr 290 295 300

Glu Lys Leu Pro Cys Met Gin Gly Arg Lys Thr Thr Ala Ser Ser Gin 305 310 315 320

Glu Asn His Ser Ser Gin Thr Asp Asn Ile Thr Leu Gly 325 330

<210> 19 <211> 1122 <212> ADN <213> Homo sapiens 106 ΕΡ 1 584 683/ΡΤ <400> 19 atggccaaca ctaccggaga gcctgaggag gtgagcggcg ctctgtcccc accgtccgca 60 tcagcttatg tgaagctggt actgctggga ctgattatgt gcgtgagcct ggcgggtaac 120 gccatcttgt ccctgctçgt gctcaaggag cgtgccctgc acaaggctcc ttactacttc 180 ctgctggacc tgtgcctggc cgatggcata cgctctgccg tctgcttccc ctttgtgctg 240 gcttctgtgc gccacggctc ttcatggacc ttcagtgcac tcagctgcaa gattgtggcc 300 tttatggccg tgctcttttg cttccatgcg gccttcatgc tgttctgcat cagcgtcacc 360 cgctacatgg ccatcgccca ccaccgcttc tacgccaagc gcatgacact ctggacatgc 420 gcggctgtca tctgcatggc ctggaccctg tctgtggcca tggccttccc acctgtcttt 480 gacgtgggca cctacaagtt tattcgggag gaggaccagt gcatctttga gcatcgctac 540 ttcaaggcca atgacacgct gggcttcatg cttatgttgg ctgtgctcat ggcagctacc 600 catgctgtct acggcaagct gctcctcttc gagtatcgtc accgcaagat gaagccagtg 660 cagatggtgc cagccatcag ccagaactgg acattccatg gtcccggggc caccggccag 720 gctgctgcca actggatcgc cggctttggc cgtgggccca tgccaccaac cctgctgggt 780 atccggcaga atgggcatgc agccagccgg cggctactgg gcatggacga ggtcaagggt 840 gaaaagcagc tgggccgcat gttctacgcg atcacactgc tctttctgct cctctggtca 900 ccctacatcg tggcctgcta ctggcgagtg tttgtgaaag cctgtgctgt gccccaccgc 960 tacctggcca ctgctgttcg gatgagcttc gcccaggctg ccgtcaaccc aattgtctgc 1020 ttcctgctca acaaggacct caagaagtgc ctgaccactc acgccccctg ctggggcaca 1080 ggaggtgccc cggctcccag agaaccctac tgtgtcatgt ga 1122

<210> 20 <211> 373 <212> PRT <213> Homo sapiens <400> 20

Met Ala Asn Thr Thr Gly Glu Pro Glu Glu val Ser Gly Ala Leu Ser 1 5 10 15 Pro Pro Ser Ala Ser Ala Tyr Val Lys Leu Val Leu Leu Gly Leu Ile 20 25 30 Met Cys Vai Ser Leu Ala Gly As-n Ala- Ile Leu Ser Leu Leu Val Leu 35 40 45 Lys Glu Arg Ala Leu His Lys Ala Pro Tyr Tyr Phe Leu Leu Asp Leu 50 55 60 Cys Leu Ala Asp Gly Ile Arg Ser Ala Val Cys Phe Pro Phe Val Leu 65 70 75 80 Ala Ser Val Arg His Gly Ser Ser Trp Thr Phe Ser Ala Leu Ser Cys 85 90 95 107 ΕΡ 1 584 683/ΡΤ

Lys Ile Vai Ala Phe Met Ala Val Leu Phe Cys Phe His Ala Ala Phe 100 105 110 Met Leu Phe Cys Ile Ser Val Thr Arg Tyr Met Ala Ile Ala His His 115 120 125 & rn • •j Phe Tyr Ala T.wc " J “ & **«·* ♦ ·- >3 Met Thr Z»cu Τ'— * vja Bi. ΛΑΟ »1- πχα t*- ϊ VOA τ ·> _ XXC 130 135 140 Cys Met Ala Trp Thr Leu Ser Val Ala Met Ala Phe Pro Pro Val Phe 145 150 155 160 Asp Vai Gly Thr Tyr Lys Phe Ile Arg Glu Glu Asp Gin Cys Ile Phe 165 170 175 Glu His Arg Tyr Phe Lys Ala Asn Asp Thr Leu Gly Phe Met Leu Met 180 185 190 Leu Ala Vai Leu Met Ala Ala Thr His Ala Val Tyr Gly Lys Leu Leu 195 200 205 Leu Phe Glu Tyr Arg His Arg Lys Met Lys Pro Val Gin Met Val Pro 210 215 220 Ala Ile Ser Gin Asn Trp Thr Phe His Gly Pro Gly Ala Thr Gly Gin 225 230 235 240 Ala Ala Ala Asn Trp Ile Ala Gly Phe Gly Arg Gly Pro Met Pro Pro 245 250 255 Thr Leu Leu Gly Ile Arg Gin Asn Gly His Ala Ala Ser Arg Arg Leu 260 265 270 Leu Gly Met Asp Glu Val Lys Gly Glu Lys Gin Leu Gly Arg Met Phe 275 280 285 Tyr Ala Ile Thr Leu Leu Phe Leu Leu Leu Trp Ser Pro Tyr Ile Val 290 295 300 Ala Cys Tyr Trp Arg Val Phe Val Lys Ala Cys Ala Val Pro His Arg 305 310 315 320 Tyr Leu η 1 -m α Thr B 1 ma Val Φνη Met Ser Phe Ala Gin η l i nj.o η 1 · val B noti 325 330 335 Pro Ile Val Cys Phe Leu Leu Asn Lys Asp Leu Lys Lys Cys Leu Thr 340 345 350 Thr His Ala Pro Cys Trp Gly Thr Gly Gly Ala Pro Ala Pro Arg Glu 355 360 365

Pro Tyr Cys Vai Met 370

<210> 21 <211> 1053 <212> ADN <213> Homo sapiens 108ΕΡ 1 584 683/ΡΤ < 4 0 0 > 21 atggctttgg acttatgact aaagttttcc atggtagtgg gcagttcatg ctaaactttg gtaactaatg gtctggatgg aatgctaggt Caaatgctag tttatcacgg gttctgctca ttctgccgag atggacatcg atcctttatg tatgggCcct cctacagagc aacagaacca gtcaacagat tattattatg acagtcaata tgaattgatc tgtatcaaag tccctgtatt cctcacaata gctttcgtca caatttatgc ctattacaag aaacagagaa ggtgggtttt agggaaaata tctctggaat gcagtttctg tccccagcca atcaggagtg ctçccatctt gctgagcata gcattcccat tttcccccgc agatctgcat tggatttgta caaggacact catgaagatg cagtcgttat agttttcatt ccatagacat catctactcc ccatccaagt cacagaaagc tttttatggg agcatctttc ggagaagaca gagacaaagt caaccagtac ttttagcatt atgtgcaaaa gcttgcatca ggaaaaccat ccccagctgg tacctaggaa gtaccctttc ccaaacatta gtcactcaac ctgatcacca attgcactct aaaaactacg gtggaggagt taa aggaaaatga aagatgtcag ttggacttgc ccaaaacaga L^CCcttlty taacttcagc gcatagacag gctggatcat ttttttatac catcaatgaa ttattatggg aaatatctcg tgccttataa gctgcaacat ttcacagctg ttatgaaagt ttccttttga aatgaatggc 60 agaatttgca 120 aggcaattcc 180 tgtgtacatc 240 ggctgttaat 300 cttgtacaca 360 atatgtggca 420 ctgtttctgt 480 agtaaatgac 540 agcattgatt 600 ggtgtgctac 660 acccctaaaa 720 cattgtcaao 780 gagcaaacgc 840 cctcaaccca 900 ggccaagaaa 960 ttctgagggt 1020 1053 <210> 22 <211> 350 <212> PRT<213> Homo sapiens <400> 22

Met Ala Leu Glu Gin Asn Gin Ser Thr Asp Tyr Tyr Tyr Glu Glu Asn 1 5 10 15 Glu Met Asn Gly Thr Tyr Asp Tyr Ser Gin Tyr Glu Leu Ile Cys Ile 20 25 30 Lys Glu Asp Val Arg Glu Phe Ala Lys Val Phe Leu Pro Val Phe Leu 35 40 45 Thr Ile Ala Phe Val Ile Gly Leu Ala Gly Asn Ser Met Val Val Ala 50 55 60 Ile Tyr Ala Tyr Tyr Lys Lys Gin Arg Thr Lys Thr Asp Val Tyr Ile 65 70 75 80 Leu Asn Leu Ala Val Ala Asp Leu Leu Leu Leu Phe Thr Leu Pro Phe 85 90 95 Trp Ala Val Asn Ala Val His Gly Trp Val Leu Gly Lys Ile Met Cys 100 1,05 110 Lys Ile Thr Ser Ala Leu Tyr Thr Leu Asn Phe Val Ser Gly Met Gin 115 120 125 Phe Leu Ala Cys Ile Ser Ile Asp Arg Tyr Val Ala Val Thr Asn Val 130 135 140 Pro Ser Gin Ser Gly Val Gly Lys Pro Cys Trp Ile Ile Cys Phe Cys 145 150 155 160 Val Trp Met Ala Ala Ile Leu Leu Ser Ile Pro Gin Leu Vai Phe Tyr 109 ΕΡ 1 584 683/ΡΤ 165 170 175

Thr Vai Asn Asp Asn Ala Arg Cys Ile Pro Ile Phe Pro Arg Tyr Leu 180 185 190 Gly Thr Ser Met Lys Ala Leu Ile Gin Met Leu Glu Ile Cys Ile Gly η Λ c X ΙΊΛΑ 4VU 205 Phe Vai Vai Pro Phe Leu Ile Met Gly Vai Cys Tyr Phe Ile Thr Ala 210 215 220 Arg Thr Leu Met Lys Met Pro Asn Ile Lys Ile Ser Arg Pro Leu Lys 225 230 235 240 Vai Leu Leu Thr Vai Vai Ile Vai Phe Ile Vai Thr Gin Leu Pro Tyr 245 250 255 Asn Ile Vai Lys Phe Cys Arg Ala Ile Asp Ile Ile Tyr Ser Leu Ile 260 265 270 Thr Ser Cys Asn Met Ser Lys Arg Met Asp Ile Ala Ile Gin Vai Thr 275 280 285 Glu Ser Ile Ala Leu Phe His Ser Cys Leu Asn Pro Ile Leu Tyr Vai 290 295 300 Phe Met Gly Ala Ser Phe Lys Asn Tyr Vai Met Lys Vai Ala Lys Lys 305 310 315 320 Tyr Gly Ser Trp Arg Arg Gin Arg Gin Ser Vai Glu Glu Phe Pro Phe 325 330 335 Asp Ser Glu Gly Pro Thr Glu Pro Thr Ser Thr Phe Ser Ile 340 345 350

<210> 23 <211> 1116 <212> ADN <213> Homo sapiens <400> 23 atgccaggaa acgccacccc agtgaccacc gccaagacct gcaacaacgt gtccttcgaa agcgcggtgt gcacgctggg ggtgccggcc caggtactgc agggcaacgt gctggccgtc ctgtacacag gcacgctgcc actctgggtc ctaggcctgc tggcctcgaa ggtgaccgcc atcctcttcc tgtgctgcat ctcctgcgac agtcggggcc gccgccgccg gaggaccgcc gtcgggatcg ttcactaccc ggtgttccag ctgcagatgg acagcaggat tgccgggtac atccctctct ccatcatcgc cttcaccaac atgggcttaa gcgctgccca gaaggccaag atcttcctag tctgcttcgc cccgtaccac tcctactaca gaggagacag gaacgccatg tctgtggtgt ttctgtgcct gtccacggtg ctggccacgg accattcccg ceaagaagtg tccatgaaga cagacgtcac caggctcacc cccgtggccc ttgcagacca ctacaccttc tgccctgcaa agaggctgat tgaggagtcc actgccccgt gggcctccct gggcctctcc 60 gagagcagga tagtcctggt cgtggtgtac 120 aactgcctga ctgcgtggct ggcgctgctg 180 tacctgctct gcctggcact ctgcgaactg 240 atctatatcc gcaaccagca ccgctggacc 300 tacatcttct tctgcaacat ctacgtcagc -360 cgcttcgtgg ccgtggtgta cgcgctggag 420 atcctcatct ccgcctgcat cttcatcctc 480 acggaagaca aggagacctg ctttgacatg 540 tactacgcca ggttcaccgt tggctttgcc 600 caccggattt tcaggagcat caagcagagc 660 gtgaagcact cggccatcgc ggtggttgtc 720 ctggttctcc tcgtcaaagc cgctgccttt 780 tgcggcttgg aggaaaggct gtacacagcc 840 aacggcgtgg ctgaccccat tatctacgtg 900 tccagaatcc ataaggggtg gaaagagtgg 960 cacagcaggg acaccgagga gctgcagtcg 1020 tccaggcccg tgcacccacc agggtcacca 1080 tgctga 1116 110 ΕΡ 1 584 683/ΡΤ <210> 24 <211> 371 <212> PRT <213> Homo <400> 24

Met Pro Gly Asn Ala Thr Pro Vai Thr Thr Thr Ala Pro Trp Ala Ser 1 5 10 15 Leu Gly Leu Ser Ala Lys Thr Cys Asn Asn Vai Ser Phe Glu Glu Ser 20 25 30 Arg Ile Vai Leu Vai Vai Vai Tyr Ser Ala Vai Cys Thr Leu Gly Vai 35 40 45 Pro Ala Asn Cys Leu Thr Ala Trp Leu Ala Leu Leu Gin Vai Leu Gin 50 55 60 Gly Asn Vai Leu Ala Vai Tyr Leu Leu Cys Leu Ala Leu Cys Glu Leu 65 70 75 80 Leu Tyr Thr Gly Thr Leu Pro Leu Trp Vai Ile Tyr Ile Arg Asn Gin 85 90 95 His Arg Trp Thr Leu Gly Leu Leu Ala Ser Lys Vai Thr Ala Tyr Ile 100 105 110 Phe Phe Cys Asn Ile Tyr Vai Ser Ile Leu Phe Leu Cys Cys Ile Ser 115 120 125 Cys Asp Arg Phe Vai Ala Vai Vai Tyr Ala Leu Glu Ser Arg Gly Arg 130 135 140 Arg Arg Arg Arg Thr Ala Ile Leu Ile Ser Ala Cys Ile Phe Ile Leu 145 150 155 160 Vai Gly Ile Vai His Tyr Pro Vai Phe Gin Thr Glu Asp Lys Glu Thr 165 170 175 Cys Phe Asp Met Leu Gin Met Asp Ser Arg Ile Ala Gly Tyr Tyr Tyr 180 185 190 Ala Arg Phe Thr Vai Gly Phe Ala Ile Pro Leu Ser Ile Ile Ala Phe 195 200 205 Thr Asn His Arg Ile Phe Arg Ser Ile Lys Gin Ser Met Gly Leu Ser 210 215 220 Ala Ala Gin Lys Ala Lys Vai Lys His Ser Ala Ile Ala Vai Vai Vai 225 230 235 240 Ile Phe Leu Vai Cys Phe Ala Pro Tyr His Leu Vai Leu Leu Vai Lys 245 250 255

Ala Ala Ala Phe Ser Tyr Tyr Arg Gly Asp Arg Asn Ala Met Cys Gly 111 ΕΡ 1 584 683/ΡΤ 260 265 270

Leu Glu Glu Arg Leu Tyr Thr Ala Ser Vai Vai Phe Leu Cys Leu Ser 275 280 285 Thr Vai Asn Gly Vai Ala Asp Pro Ile Ile Tyr Vai Leu Ala Thr Asp 290 295 300 His Ser Arg Gin Glu Vai Ser Arg Ile His Lys Gly Trp Lys Glu Trp 305 310 315 320 Ser Met Lys Thr Asp Vai Thr Arg Leu Thr His Ser Arg Asp Thr Glu 325 330 335 Glu Leu Gin Ser Pro Vai Ala Leu Ala Asp His Tyr Thr Phe Ser Arg 340 345 350 Pro Vai His Pro Pro Gly Ser Pro Cys Pro Ala Lys Arg Leu Ile Glu 355 360 365

Glu Ser Cys 370

<210> 25 <211> 1113 <212> ADN <213> Homo sapiens <400> 25 atggcgaact tttctgaaac atctccattt gatctttgct çtcaaaaatg ggygteitgt CCagctatcg gtgatctgta ggcacttact getaatgatt gtctacctca gtagcagcag gccaattggc caaaatgcaa aaaagaatca tacctggtgg ctaacagctg ttctcaaaca aggttaccaa atagccatgc agctgacaac tgacttcctt gggtttcata tgctagtgaa agataagacc gttcagatat cctcagatct gctctacctg gaettatggg culytttcca cactgctttc cccatcaccg cttctataca tggtgtggac tctgtctgtg cattcattag ggaggaagat ccttaagatt tatgctgctt agctgatatt tttcgtccac tcagccagaa ctggactttt tagcaggatt tggaaggggt acaccacagg cagaagaagg gcagaatgtt ctatataatg cctgttattg gagagttttt ctgtctggat gagttttgcc gggagctgag gcgctgtttc gggaacctta ctgtgttata attttgcaaa atctctcgcc ataggagtca gcgtggtggg ttgcatagag caccttacta gcaatttgtt tcccatttgt actctgacee gcaaagtgat atgctcttct gcatí.ag^gt aagaggctga ccttttggac gccatggcat ttcccccggt caatgcacct tccaacaccg cttgctctca tcctcctagc gatcgaagaa aaatgaagcc catggtcctg gagccagtgg cccacaccac ccaccttgct ctattggtct tagacgagtt acttttctgt ttctaacctt gcaagagggc ctgtagtacc caagcaggaa tcaatccttt agcacaaccc ttctttactg tga tctaacagcc 60 caacctcctg 120 cttcctgttg 180 gttcaactct 240 tgcctttctg 100 caccãga*ac 3ãC gtgtctggct 420 tttagacgtg 480 ctccttcagg 540 cacacagctt 600 agtccagttt 660 ccaggcagct 720 gggcatcagg 780 caaaatggag 840 gtggggcccc 900 agggggattt 960 tgtctgcatt 1020 cagaaaatcc 1080 1113

<210> 26 <211> 370 <212> PRT <213> Homo sapiens <400> 26

Met Ala Asn Tyr Ser His Ala Ala Asp Asn Ile Leu Gin Asn Leu Ser 15 10 15 112 ΕΡ 1 584 683/ΡΤ

Pro Leu Thr Ala Phe Leu Lys Leu Thr Ser Leu Gly Phe Ile Ile Gly 20 25 30

Vai Ser Vai Vai Gly Asn Leu Leu Ile Ser Ile Leu Leu Vai Lys Asp 35 40 45

Lys Thr Leu His Arg Ala Pro Tyr Tyr Phe Leu Leu Asp Leu Cys Cys 50 55 60

Ser Asp Ile Leu Arg Ser Ala Ile Cys Phe Pro Phe Vai Phe Asn Ser 65 70 75 80

Vai Lys Asn Gly Ser Thr Trp Thr Tyr Gly Thr Leu Thr Cys Lys Vai 85 90 95

Ile Ala Phe Leu Gly Vai Leu Ser Cys Phe His Thr Ala Phe Met Leu 100 105 110

Phe Cys Ile Ser Vai Thr Arg Tyr Leu Ala Ile Ala His His Arg Phe 115 120 125

Tyr Thr Lys Arg Leu Thr Phe Trp Thr Cys Leu Ala Vai Ile Cys Met 130 135 140

Vai Trp Thr Leu Ser Vai Ala Met Ala Phe Pro Pro Vai Leu Asp Vai 145 150 155 160

Gly Thr Tyr Ser Phe Ile Arg Glu Glu Asp Gin Cys Thr Phe Gin His 165 170 175

Arg Ser Phe Arg Ala Asn Asp Ser Leu Gly Phe Met Leu Leu Leu Ala 180 185 190

Leu Ile Leu Leu Ala Thr Gin Leu Vai Tyr Leu Lys Leu Ile Phe Phe 135 200 205

Vai His Asp Arg Arg Lys Met Lys Pro Vai Gin Phe Vai Ala Ala Vai 210 215 220

Ser Gin Asn Trp Thr Phe His Gly Pro Gly Ala Ser Gly Gin Ala Ala 225 230 235 240

Ala Asn Trp Leu Ala Gly Phe Gly Arg Gly Pro Thr Pro Pro Thr Leu 245 250 255

Leu Gly Ile Arg Gin Asn Ala Asn Thr Thr Gly Arg Arg Arg Leu Leu 260 265 270

Vai Leu Asp Glu Phe Lys Met Glu Lys Arg Ile Ser Arg Met Phe Tyr 275 280 285

Ile Met Thr Phe Leu Phe Leu Thr Leu Trp Gly Pro Tyr Leu Vai Ala 290 295 300

Cys Tyr Trp Arg Vai Phe Ala Arg Gly Pro Vai Vai Pro Gly Gly Phe 305 310 315 320

Leu Thr Ala Ala Vai Trp Met Ser Phe Ala Gin Ala Gly Ile Asn Pro 325 330 335

Phe Vai Cys Ile Phe Ser Asn Arg Glu Leu Arg Arg Cys Phe Ser Thr 340 345 350

Thr Leu Leu Tyr Cys Arg Lys Ser Arg Leu Pro Arg Glu Pro Tyr Cys •\r Γ Λ «·Λ 'Λ r f 3-J-J 003

Vai Ile 370 113 ΕΡ 1 584 683/ΡΤ <210> 27 <211> 1080

< 212 > ADN <213> Homo sapiens <400> 27 atgcaggtcc cgaacagcac cggcccggac aacgcgacgc tgcagatgct gcggaacccg 60 gcgatcgcgg tggccctgcc cgtggtgtac tcgctggtgg cggcggtcag catcccgggc 120 aacctcttct ctctgtgggt gctgtgccgg cgcatggggc ccagatcccc gtcggtcatc 180 ttcatgatca acctgagcgt cacggacctg atgctggcca gcgtgttgcc tttccaaatc 240 tactaccatt gcaaccgcca ccactgggta ttcggggtgc tgctttgcaa cgtggtgacc 300 gtggcctttt acgcaaacat gtattccagc atcctcacca tgacctgtat cagcgtggag 360 cgcttcctgg gggtcctgta cccgctcagc tccaagcgct ggcgccgccg tcgttacgcg 420 gtggccgcgt gtgcagggac ctggctgctg ctcctgaccg ccctgtgccc gctggcgcgc 480 accgatctca cctacccggt gcacgccctg ggcatcatca cctgcttcga cgtcctcaag 540 tggacgatgc tccccagcgt ggccatgtgg gccgtgttcc tcttcaccat cttcatcctg 600 ctgttcctca tcccgttcgt gatcaccgtg gcttgttaca cggccaccat cctcaagctg 660 ttgcgcacgg aggaggcgca cggccgggag cagcggaggc gcgcggtggg cctggccgcg 720 gtggtcttgc tggcctttgt cacctgcttc gcccccaaca acttcgtgct cctggcgcac 780 atcgtgagcc gcctgttcta cggcaagagc tactaccacg tgtacaagct cacgctgtgt 840 ctcagctgcc tcaacaactg tctggacccg tttgtttatt actttgcgte ccgggaattc 900 cagctgcgcc tgcgggaata tttgggctgc cgccgggtgc ccagagacac cctggacacg 960 cgccgcgaga gcctcttctc çgccaggacc acgtccgtgc gctccgaggc. cçgtgcgcac 1020 cccgaaggga tggagggagc caccaggccc ggcctccaga ggcaggagag tgtgi-tctga IOLx <210> 28 <211> 359

< 212 > PRT <213> Homo sapiens <400> 28

Met Gin Vai Pro Asn Ser Thr Gly Pro Asp Asn Ala Thr Leu Gin Met 1 5 10 15 Leu Arg Asn Pro Ala lie Ala Vai Ala Leu Pro Vai Vai Tyr Ser Leu 20 25 30 Vai Ala Ala Vai Ser Ile Pro Gly Asn Leu Phe Ser Leu Trp Vai Leu 35 40 45 Cys Arg Arg Met Gly Pro Arg Ser Pro Ser Vai Ile Phe Met Ile Asn 50 55 60 Leu Ser Vai Thr Asp Leu Met Leu Ala Ser Vai Leu Pro Phe Gin Ile 65 70 75 80 114

ΕΡ 1 584 683/PT

Tyr Tyr His Cys Asn Arg His His Trp Val Phe Gly Val Leu Leu Cys 85 90 95 Asn Vai Val Thr Val Ala Phe Tyr Ala Asn Met Tyr Ser Ser Ile Leu 100 105 110 Thr Met Thr Cys lie Ser Vai Glu Arg Phe Leu Gly Vai Leu Tyr Pro 115 120 125 Leu Ser Ser Lys Arg Trp Arg Arg Arg Arg Tyr Ala Val Ala Ala Cys 130 135 140 Ala Gly Thr Trp Leu Leu Leu Leu Thr Ala Leu Cys Pro Leu Ala Arg 145 150 155 160 Thr Asp Leu Thr Tyr Pro Val His Ala Leu Gly Ile Ile Thr Cys Phe 165 170 175 Asp Vai Leu Lys Trp Thr Met Leu Pro Ser Val Ala Met Trp Ala Val 180 185 190 Phe Leu Phe Thr Ile Phe Ile Leu Leu Phe Leu Ile Pro Phe Val Ile 195 200 205 Thr Vai Ala Cys Tyr Thr Ala Thr Ile Leu Lys Leu Leu Arg Thr Glu 210 215 220 Glu Ala His Gly Arg Glu Gin Arg Arg Arg Ala Val Gly Leu Ala Ala 225 230 235 240 Vai Val Leu Leu Ala Phe Val Thr Cys Phe Ala Pro Asn Asn Phe Val 245 250 255 Leu Leu Ala His Ile Val Ser Arg Leu Phe Tyr Gly Lys Ser Tyr Tyr 260 265 270 His Val Tyr Lys Leu Thr Leu Cys Leu Ser Cys Leu Asn Asn Cys Leu 275 280 285 Asp Pro Phe Val Tyr Tyr Phe Ala Ser Arg Glu Phe Gin Leu Arg Leu 290 295 300 Arrr •*—í Glu Tyr Leu Gly fvs — J — Arg Aro ---7 Val Pro Arg Asp Thr Leu Asp Thr 305 310 315 320 Arg Arg Glu Ser Leu Phe Ser Ala Arg Thr Thr Ser Val Arg Ser Glu 325 330 335 Ala Gly Ala His Pro Glu Gly Met Glu Gly Ala Thr Arg Pro Gly Leu 340 345 350 Gin Arg Gin Glu Ser Val Phe 355

<210> 29 <211> 1503 <212> ADN <213> Homo sapiens 115 ΕΡ 1 584 683/ΡΤ < 4 Ο Ο > 29 atggagcgtc cctgggagga cagcccaggc ccggaggggg cagctgaggg ctcgcctgtg 60 ccagtcgccg ccggggcgcg ctccggtgcc gcggcgagtg gcacaggctg gcagccatgg 120 gctgagtgcc cgggacccaa ggggaggggg caactgctgg cgaccgccgg ccccttgcgt 180 cgctggcccg ccccctcgcc tgccagctcc agccccgccc ccggagcggc gtccgctcac 240 toggttoaag ycaycgogac tgcgggtygc; ycacyeieuag yyuycayauu tcyyggcgcg 300 cggcccatgg agtcggggct gctgcggccg gcgccggtga gcgaggtcat cgtcctgcat 360 tacaactaca ccggcaagct ccgcggtgcg agctaccagc cgggtgccgg cctgcgcgcc 420 gacgccgtgg tgtgcctggc ggtgtgcgcc ttcatcgtgc tagagaatct agccgtgttg 480 ttggtgctcg gacgccaccc gcgcttccac gctcccatgt tcctgctcct gggcagcctc 540 acgttgtcgg atctgctggc aggcgccgcc tacgccgcca acatcctact gtcggggccg 600 ctcacgctga aactgtcccc cgcgctctgg ttcgcacggg agggaggcgt cttcçtggca 660 ctcactgcgt ccgtgctgag cctcctggcc atcgcgctgg agcgcagcct caccatggcg 720 cqcaggqqqc ccqcqcccqt ctccagtcgg qqqcocacqc tggcgatqgc agccgcggcc 780 tggggcgtgt cgctgctcct cgggctcctg ccagcgctgg gctggaattg cctgggtcgc 840 ctggacgctt gctccactgt cttgccgctc tacgccaagg cctacgtgct cttctgcgtg 900 ctcgccttcg tgggcatcct ggccgcgatc tgtgcactct acgcgcgcat ctactgccag 960 gtacgcgcca acgcgcggcg cctgccggca cggcccggga ctgcggggac cacctcgacc 1020 cgggcgcgtc gcaagccgcg ctctctggcc ttgctgcgca cgctcagcgt ggtgctcctg 1080 gcctttgtgg catgttgggg ccccctcttc ctgctgctgt tgctcgacgt ggcgtgcccg 1140 gcgcgcacct gtcctgtact cctgcaggcc gatcccttcc tgggactggc catggccaac 1200 tcacttctga accccatcat ctacacgctc accaaccgcg acctgcgcca cgcgctcctg 1260 cgcctggtct gctgcggacg ccactcctgc ggcagagacc cgagtggctc ccagcagtcg 1320 gcgagcgcgg ctgaggcttc cgggggcctg cgccgctgcc tgcccccggg ccttgatggg 1380 agcttcagcg gctcggagcg ctcatcgccc cagcgcgacg ggctggacac cagcggctcc 1440 acaggcagcc ccggtgcacc cacagccgcc cggactctgg tatcagaacc ggctgcagac 1500 tga 1503 <210> 30 <211> 500

<212> PRT <213> Homo sapíens <400> 30

Met Glu Arg Pro Trp Glu Asp Ser Pro Gly Pro Glu Gly Ala Ala Glu 1 5 10 15 Gly Ser Pro Vai Pro Vai Ala Ala Gly Ala Arg Ser Gly Ala Ala Ala 20 25 30 Ser Gly Thr Gly Trp Gin Pro Trp Ala Glu Cys Pro Gly Pro Lys Gly 35 40 45 Arg Gly Gin Leu Leu Ala Thr Ala Gly Pro Leu Arg Arg Trp Pro Ala 50 55 60 Pro Ser Pro Ala Ser Ser Ser Pro Ala Pro Gly Ala Ala Ser Ala His 65 70 75 80 Ser Vai Gin Gly Ser Ala Thr Ala Gly Gly Ala Arg Pro Gly Arg Arg 85 90 95 Pro Trp Gly Ala Arg Pro Met Glu Ser Gly Leu Leu Arg Pro Ala Pro 100 105 110 Vai Ser Glu Vai Ile Vai Leu His Tyr Asn Tyr Thr Gly Lys Leu Arg 115 120 125 116 ΕΡ 1 584 683/ΡΤ

Gly Ala Ser Tyr Gin Pro Gly Ala Gly Leu Arg Ala Asp Ala Val Val 130 135 140 Cys Leu Ala Vai Cys Ala Phe Ile Vai Leu Glu Asn Leu Ala Vai Leu 145 150 155 160 Leu Vai Leu Gly Arg His Pro Arg Phe His Ala Pro Met Phe Leu Leu 165 170 175 Leu Gly Ser Leu Thr Leu Ser Asp Leu Leu Ala Gly Ala Ala Tyr Ala 180 185 190 Ala Asn Ile Leu Leu Ser Gly Pro Leu Thr Leu Lys Leu Ser Pro Ala 195 200 205 Leu Trp Phe Ala Arg Glu Gly Gly Vai Phe Vai Ala Leu Thr Ala Ser 210 215 220 Vai Leu Ser Leu Leu Ala ile Ala Leu Glu Arg Ser Leu Thr Met Ala 225 230 235 240 Arg Arg Gly Pro Ala Pro Vai Ser Ser Arg Gly Arg Thr Leu Ala Met 245 250 255 Ala Ala Ala Ala Trp Gly Vai Ser Leu Leu Leu Gly Leu Leu Pro Ala 260 265 270 Leu Gly Trp Asn Cys Leu Gly Arg Leu Asp Ala Cys Ser Thr Val Leu 275 280 285 Pro Leu Tyr Ala Lys Ala Tyr Vai Leu Phe Cys Vai Leu Ala Phe Val 290 295 300 Gly Ile Leu Ala Ala Ile Cys Ala Leu Tyr Ala Arg Ile Tyr Cys Gin 305 31C 315 32C Vai Arg Ala Asn Ala Arg Arg Leu Pro Ala Arg Pro Gly Thr Ala Gly 325 330 335 Thr Thr Ser Thr Arg Ala Arg Arg Lys Pro Arg Ser Leu Ala Leu Leu 340 345 350 Arg Thr Leu Ser Vai Vai Leu Leu Ala Phe Vai Ala Cys Trp Gly Pro 355 360 365 Leu Phe Leu Leu Leu Leu Leu Asp Vai Ala Cys Pro Ala Arg Thr Cys 370 375 380 Pro Vai Leu Leu Gin Ala Asp Pro Phe Leu Gly Leu Ala Met Ala Asn 385 390 395 400 Ser Leu Leu Asn Pro Ile Ile Tyr Thr Leu Thr Asn Arg Asp Leu Arg 405 410 415 His Ala Leu Leu Arg Leu Vai Cys Cys Gly Arg His Ser Cys Gly Arg 420 425 430 Asp Pro Ser Gly Ser Gin Gin Ser Ala Ser Ala Ala Glu Ala Ser Gly 435 440 445 Gly Leu Arg Arg Cys Leu Pro Pro Gly Leu Asp Gly Ser Phe Ser Gly 450 455 4 60 Ser Glu Arg Ser Ser Pro Gin Arg Asp Gly Leu Asp Thr Ser Gly Ser 465 470 47 5 450 Thr Gly Ser Pro Gly Ala Pro Thr Ala Ala Arg Thr Leu Vai Ser Glu 485 490 495

Pro Ala Ala Asp 500 117 ΕΡ 1 584 683/ΡΤ

<210> 31 <211> 1029 <212> ADN <213> Homo sapiens < 4 0 0 > 31 atgcaagccg tacaaaatca atcacaaatg atttttctta attcttagtg tccgtcatat gatcgctacc gctaagattc attctgacca gagttcggtc aatttcttaa gtaagaacga atcattgctg ctgagccaaa gagagaactc ctttgcaagt tctctgtccc ccaatgtaa tcgacaatct cccaggtcct gcctggcgat agaacacagt atgccaaact tttatttcac agaagaccac tctctgttgt acaggcagcc tagtctggca ttgttattgt ggggtgtagg tattctttat cccgggatgt tgtggttaac ccttcagaaa aggacaatag cacctctgcg cttcccactg gaggattttc catttctgat gggaacagga aatgtatatc caggccattt catctgggca gagagacaag tgaaatagta atgttataca taaagtcccc ttgttttgtt ctttgactgc ttccttaaat ttccttgata gaaaaaagaa cctgggaaca ctctacactg tttcaaatcc cttctcatga ccactgagaa agtatttcat aaaacatcca ttcatgttct aatgtgaaga aattacatct ctcattacaa aggaaaaagg cctttccatt actgctgaaa gaatgcctgg agtatgctga caggatggtg ccagtctgtg tcctgttttt ggagtaaatc ttctgacttt cttttgtgtg tcctgggact accccaaaaa tactctcttt aatgctcttt gtcaagtcat aagaactgta tgaacgtcaa ttgcccgaat atactr.tgtt atccgttcat agtgccccaa gtgacccaaa caccagagac 60 tgttggactt 120 aaactttatt 180 tccattcaaa 240 tcaagttacc 300 gataactatc 360 tctcttgggg 420 gcctaacatg 480 ccttaaatca 540 tttctggatt 600 ccgçtcatac 660 agttttcatt 720 tccttacacc 780 ctatgtgaaa 840. ctattctttc 50C ttctgcaaca 960 tgaagagact 1020 1029

<210> 32 <211> 342 <212> PRT <213> Homo sapiens <400> 32

Met Gin Ala Vai Asp Asn Leu Thr Ser Ala Pro Gly Asn Thr Ser Leu 1 5 10 15 Cys Thr Arg Asp Tyr Lys Ile Thr Gin Vai Leu Phe Pro Leu Leu Tyr 20 25 30 Thr Vai Leu Phe Phe Vai Gly Leu Ile Thr Asn Gly Leu Ala Met Arg 35 40 45 Ile Phe Phe Gin Ile Arg Ser Lys Ser Asn Phe Ile Ile Phe Leu Lys 50 55 60 118 ΕΡ 1 584 683/ΡΤ

Asn Thr Vai Ile Ser Asp Leu Leu Met Ile Leu Thr Phe Pro Phe Lys 65 70 75 80 Ile Leu Ser Asp Ala Lys Leu Gly Thr Gly Pro Leu Arg Thr Phe Val 85 90 95 Cys Gin Vâl Tili Ser Vai I lê rhè Tyr riiê Thr Met Tyr Ile Ser lie 100 105 110 Ser Phe Leu Gly Leu Ile Thr Ile Asp Arg Tyr Gin Lys Thr Thr Arg 115 120 125 Pro Phe Lys Thr Ser Asn Pro Lys Asn Leu Leu Gly Ala Lys Ile Leu 130 135 140 Ser Vai Vai Ile Trp Ala Phe Met Phe Leu Leu Ser Leu Pro Asn Met 145 150 155 160 Ile Leu Thr Asn Arg Gin Pro Arg Asp Lys Asn Vai Lys Lys Cys Ser 165 170 175 Phe Leu Lys Ser Glu Phe Gly Leu Vai Trp His Glu Ile Val Asn Tyr 180 185 190 Ile Cys Gin Vai Ile Phe Trp Ile Asn Phe Leu Ile Val Ile Val Cys 195 200 205 Tyr Thr Leu lie Thr Lys Glu Leu Tyr Arg Ser Tyr Val Arg Thr Arg 210 215 220 Gly Vai Gly Lys Vai Pro Arg Lys Lys Vai Asn Val Lys Val Phe Ile 225 230 235 240 Ile Ile Ala Vai Phe Phe Ile Cys Phe Vai Pro Phe His Phe Ala Arg 245. 250 255 Ile Pro Tyr Thr Leu Ser Gin Thr Arg Asp Vai Phe Asp Cys Thr Ala 260 265 270 Glu Asn Thr Leu Phe Tyr Vai Lys Glu Ser Thr Leu Trp Leu Thr Ser 275 280 285 Leu Asn (>„.= 7 ~ Leu Asp Pro Php Ile Twr * j - Phe Phe Leu ~ J ~ —j — Ser 290 295 300 Phe Arg Asn Ser Leu Ile Ser Met Leu Lys Cys Pro Asn ser Ala Thr 305 310 315 320 Ser Leu Ser Gin Asp Asn Arg Lys Lys Glu Gin Asp Gly Gly Asp Pro 325 330 335 Asn Glu Glu Thr Pro Met 340

<210> 33 <211> 1077 <212> ADN <213> Homo sapiens 119 ΕΡ 1 584 683/ΡΤ <400> 33 atgtcggtct gctaccgtcc cccagggaac gccacaggca cagccttcct gctgctggcg gtggtgtgga gcttggcggg ctggcggcct gtgctgcacc tggcgctggc cgacggcgcg ttcctgacce ggcaggcctg gccgctgggc tgcgcgctca gcatgtacgc cagcgtgctg ctcgcagtca cccgcccctt cctggcgcct ctgctgctgg cggtctggct ggccgccctg cacctgtgga gggaccgcgt atgccagctg cacctgagcc tggagactct gaccgctttc tacagcgtga cgctggcacg gctgcggggc cgggtgggcc ggctggtgag cgccatcgtg cacgcagtca accttctgca ggcggtcgca aagctgggcg gagccggcca ggcggcgcga tctagcgtca acccggtgct ctacgtcttc ccccgtttcc tcacgcggct cttcgaaggc agggaaggga ccatggagct ccgaactacc ggcaatggag acccgggggg tgggatggag gagacactgc tgagctggaa gacttcgcgg 60 gcgctgctgg ggctgcctgg caacggcttc 120 gcacgggggc gaccgctggc ggccacgctt 180 gtgctgctgc tcacgccgct ctttgtggcc 240 caggcgggct geãaggcggt gtactacgÍg 3G0 ctcaccggcc tgctcagcct gcagcgctgc 360 cggctgcgca gcccggccct ggcccgccgc 420 ttgctcgccg tcccggccgc cgtctaccgc 480 tgccacccgt cgccggtcca cgccgccgcc 540 gtgcttcctt tcgggctgat gctcggctgc 600 gcccgctggg gctccgggcg gcacggggcg 660 cttgccttcg gcttgctctg ggccccctac 720 gcgctggctc caccqgaaqq qgccttgqcq 780 gcgggaacta cggccttggc cttcttcagt 840 accgctggag atctgctgcc ccgggcaggt 900 tctggggagg cccgaggggg cggccgctct 960 cctcagctga aagtggtggg gcagggccgc 1020 aaggacggtc cggaatggga cctttga 1077 <210> 34 <211> 358

<212> PRT <213> Homo sapiens <400> 34

Met Ser Vai Cys Tyr Arg Pro Pro Gly Asn Glu Thr Leu Leu Ser Trp 1 5 10 15 Lys Thr Ser Arg Ala Thr Gly Thr Ala Phe Leu Leu Leu Ala Ala Leu 20 25 30 Leu Gly Leu Pro Gly Asn Gly Phe val val Trp Ser Leu Ala Gly Trp 35 4 0 4 5 Arg Pro Ala Arg Gly Arg Pro Leu Ala Ala Thr Leu Val Leu His Leu CA U V E E 60 Ala Leu Ala Asp Gly Ala Vai Leu Leu Leu Thr Pro Leu Phe Val Ala 65 70 75 80 Phe Leu Thr Arg Gin Ala Trp Pro Leu Gly Gin Ala Gly Cys Lys Ala 85 90 95 Vai Tyr Tyr Vai Cys Ala Leu Ser Met Tyr Ala Ser Val Leu Leu Thr 100 105 110 Gly Leu Leu Ser Leu Gin Arg Cys Leu Ala Val Thr Arg Pro Phe Leu 115 120 125 Ala Pro Arg Leu Arg Ser Pro Ala Leu Ala Arg Arg Leu Leu Leu Ala 130 135 140 Vai Trp Leu Ala Ala Leu Leu Leu Ala Val Pro Ala Ala Val Tyr Arg 145 150 155 160

His Leu Trp Arg Asp Arg Vai Cys Gin Leu Cys His Pro Ser Pro Vai 120 ΕΡ 1 584 683/ΡΤ 165 170 175

His Ala Ala Ala His Leu Ser Leu Glu Thr Leu Thr Ala Phe- .Vai Leu 180 185 190 Pro Phe Gly Leu Met Leu Gly Cys Tyr Ser Vai Thr Leu Ala Arg Leu 195 ΛΛΛ í. \J \J nnc iUJ Arg Gly Ala Arg Trp Gly Ser Gly Arg His Gly Ala Arg Vai Gly Arg 210 215 220 Leu Vai Ser Ala Ile Vai Leu Ala Phe Gly Leu Leu Trp Ala Pro Tyr 225 230 235 240 His Ala Vai Asn Leu Leu Gin Ala Vai Ala Ala Leu Ala Pro Pro Glu 245 250 255 Gly Ala Leu Ala Lys Leu Gly Gly Ala Gly Gin Ala Ala Arg Ala Gly 260 265 270 Thr Thr Ala Leu Ala Phe Phe Ser Ser Ser Vai Asn Pro Vai Leu Tyr 275 280 285 Vai Phe Thr Ala Gly Asp Leu Leu Pro Arg Ala Gly Pro Arg Phe Leu 290 295 300 Thr Arg Leu Phe Glu Gly Ser Gly Glu Ala Arg Gly Gly Gly Arg Ser 305 310 315 320 Arg Glu Gly Thr Met Glu Leu Arg Thr Thr Pro Gin Leu Lys Vai Vai 325 330 335 Gly Gin Gly Arg Gly Asn Gly Asp Pro Gly Gly Gly Met Glu Lys Asp 340 345 350

Gly Pro 31α Trp Asp Leu 355 < 210 > 35 <211> 1005

< 212 > ADN <213> Homo sapiens <400> 35 atgctgggga tcatggcatg gaatgcaact tgcaaaaact ggctggcagc agaggctgcc 60 ctggaaaagt actacctttc cattttttat gggattgagt tcgttgtggg agtccttgga 120 aataccattg ttgtttacgg ctacatcttc tctctgaaga actggaacag cagtaatatt 180 tatctcttta acctctctgt ctctgactta gcttttctgt gcaccctccc catgctgata 240 aggagttatg ccaatggaaa ctggatatat ggagacgtgc tctgcataag caaccgatat 300 gtgcttcatg ccaacctcta taccagcatt ctctttctca cttttatcag catagatcga 360 tacttgataa ttaagtatcc tttccgagaa caccttctgc aaaagaaaga gtttgctatt 420 ttaatctcct tggccatCtg ggttttagta accttagagt tactacccat acttcccctt 480 ataaatcctg ttataactga caatggcacc acctgtaatg attttgcaag ttctggagac 540 cccaactaca acctcattta cagcatgtgt ctaacactgt tggggttcct tattcctctt 600 tttgtgatgt gtttctttta ttacaagatt gctctcttcc taaagcagag gaataggcag 660 gttgctactg ctctgcccct tgaaaagcct ctcaacttgg tcatcatggc agtggtaatc 720 ttctctgtgc tttttacacc ctatcacgtc atgcggaatg tgaggatcgc ttcacgcctg 780 gggagttgga agcagtatca gtgcactcag gtcgtcatca actcctttta cattgtgaca 840 cggcctttgg cctttctgaa cagtgtcatc aaccctgtct tctattttct ttcgggagat 900 cacttcaggg acatgctgat gaatcaactg agacacaact tcaaatccct tacatccttt 960 agcagatggg ctcatgaact cctactttca ttcagagaaa agtga 1005 121 ΕΡ 1 584 683/ΡΤ

<210> 36 <211> 334 <212> PRT <213> Homo sapiens <4Ο Ο> 36

Met Leu Gly Ile Met Ala Trp Asn Ala Thr Cys Lys Asn Trp Leu Ala 1 5 10 15 Ala Glu Ala Ala Leu Glu Lys Tyr Tvr Leu Ser Ile Phe Tvr Gly Ile 20 25 30 Glu Phe Vai Vai Gly Val Leu Gly Asn Thr Ile Val Val Tyr Gly Tyr 35 40 45 Ile Phe Ser Leu Lys Asn Trp Asn Ser Ser Asn Ile Tyr Leu Phe Asn 50 55 60 Leu Ser Vai Ser Asp Leu Ala Phe Leu Cys Thr Leu Pro Met Leu Ile 65 70 75 80 Arg Ser Tyr Ala Asn Gly Asn Trp Ile Tyr Gly Asp Val Leu Cys Ile 85 90 95 Ser Asn Arg Tyr Val Leu His Ala Asn Leu Tyr Thr Ser Ile Leu Phe 100 105 110 Leu Thr Phe Ile Ser Ile Asp Arg Tyr Leu Ile Ile Lys Tyr Pro Phe 115 120 125 m y Glu Leu Leu Gin Lys Lys Glu Phe Ais Ile Leu lis Ser Leu 130 135 140 Ala Ile Trp Val Leu Val Thr Leu Glu Leu Leu Pro Ile Leu Pro Leu 145 150 155 160 Ile Asn Pro Vai Ile Thr Asp Asn Gly Thr Thr Cys Asn Asp Phe Ala 165 170 175 Ser Ser Gly Asp Pro Asn Tyr Asn Leu Ile Tyr Ser Met Cys Leu Thr 180 185 190 Leu Leu Gly Phe Leu Ile Pro- Leu -Phe Val Met Cys Phe Phe Tyr Tyr 195 200 205 Lys Ile Ala Leu Phe Leu Lys Gin Arg Asn Arg Gin Val Ala Thr Ala 210 215 220 Leu Pro Leu Glu Lys Pro Leu Asn Leu Val Ile Met Ala Val Val Ile 225 230 235 240 Phe Ser Vai Leu Phe Thr Pro Tyr His Val Met Arg Asn Val Arg Ile 245 250 255 Ala Ser Arg Leu Gly Ser Trp Lys Gin Tyr Gin Cys Thr Gin Val Val 260 265 270 Ile Asn Ser Phe Tyr Ile Val Thr Arg Pro Leu Ala Phe Leu Asn Ser 275 280 285 Vai lie Asm Pro Vai Phe Tyr Phe Leu Leu Giy Asp His Phe Arg Asp 290 295 300 Met Leu Met Asn Gin Leu Arg His Asn Phe Lys Ser Leu Thr Ser Phe 305 310 315 320 Ser Arg Trp Ala His Glu Leu Leu Leu Ser Phe Arg Glu Lys 325 330 122 ΕΡ 1 584 683/ΡΤ

<210> 37 <211> 1296 <212> ADN <213> Homo sapiens <400> 37 atgcaggcgc ttaacattac cccggagcag ttctctcggc tgctgcggga ccacaacctg 60 acgcgggagc agttcatcgc tctgtaccgg ctgcgaccgc tcgtctacac cccagagctg 120 ccgggacgcg ccaagctggc cctcgtgctc accggcgtgc tcatcttcgc cctggcgctc 180 tttggcaatg ctctggtgtt ctacgtggtg acccgcagca aggccatgcg caccgtcacc 240 aacatcttta tctgctcctt ggcgctcagt gacctgctca tcaccttctt ctgcattccc 300 gtcaccatgc tccagaacat ttccgacaac tggctggggg gtgctttcat ttgcaagatg 360 gtgccatttg tccagtctac cgctgttgtg acagaaatgc tcactatgac ctgcattgct 420 gtggaaaggc accagggact tgtgcatcct tttaaaatga agtggcaata caccaaccga 480 agggctttca caatgctagg tgtggtctgg ctggtggcag tcatcgtagg atcacccatg 540 tggcacgtgc aacaacttga gatcaaatat gacttcctat atgaaaagga acacatctgc 600 tgcttagaag agtggaccag ccctgtgcac cagaagatct acaccacctt catccttgtc 660 atcctcttcc tcctgcctct tatggtgatg cttattctgt acagtaaaat tggttatgaa 720 ctttggataa agaaaagagt tggggatggt tcagtgcttc gaactattca tggaaaagaa 780 aiCjCCCadciâ Lâg^caggaa gaagaaacga gctgtcatxa a-^t.ggí.ggcl. l-j» ctctttgctg tgtgctgggc accattccat gttgtccata tgatgattga atacagtaat 900 tttgaaaagg aatatgatga tgtcacaatc aagatgattt ttgctatcgt gcaaattatt 960 ggattttcca actccatctg taatcccatt gtctatgcat ttatgaatga aaacttcaaa 1020 aaaaatgttt tgtctgcagt ttgttattgc atagtaaata aaaccttctc tccagcacaa 1080 aggcatggaa attcaggaat tacaatgatg cggaagaaag caaagttttc cctcagagag 1140 aatccagtgg aggaaaccaa aggagaagca ttcagtgatg gcaacattga agtcaaaCtg 1200 tgtgaacaga cagaggagaa gaaaaagctc aaacgacatc ttgctctctt taggtctgaa 1260 ctggctgaga attctccttt agacagtggg cattaa 1296

<210> 38 <211> 431 <212> PRT <213> Homo sapiens <400> 38

Met 1 Gin Ala Leu Asn Ile Thr 5 Pro Glu Gin 10 Phe Ser Arg Leu Leu 15 Arg Asp His Asn Leu 20 Thr Arg Glu Gin Phe 25 Ile Ala Leu Tyr Arg 30 Leu Arg

Pro Leu Vai Tyr Thr Pro Glu Leu Pro Gly Arg Ala Lys Leu Ala Leu 123 ΕΡ 1 584 683/ΡΤ 35 40 45

Vai Leu Thr Gly Val Leu Ile Phe Ala Leu Ala Leu Phe Gly Asn Ala 50 55 60 Leu Vai Phe Tyr Val Val Thr Arg Ser Lys Ala Met Arg Thr Val Thr 65 70 75 80 Asn Ile Phe Ile Cys Ser Leu Ala Leu Ser Asp Leu Leu Ile Thr Phe 85 90 95 Phe Cys Ile Pro Val Thr Met Leu Gin Asn Ile Ser Asp Asn Trp Leu 100 105 110 Glv Gly Ala Phe Ile Cys Lys Met Val Pro Phe Val Gin Ser Thr Ala 115 120 125 Vai Vai Thr Glu Met Leu Thr Met Thr Cys Ile Ala Val Glu Arg His 130 135 140 Gin Gly Leu Val His Pro Phe Lys Met Lys Trp Gin Tyr Thr Asn Arg 145 150 155 160 Arg Ala Phe Thr Met Leu Gly Val Val Trp Leu Val Ala Val Ile Val 165 170 175 Gly Ser Pro Met Trp His Val Gin Gin Leu Glu Ile Lys Tyr Asp Phe 180 185 190 Leu Tyr Glu Lys Glu His Ile Cys Cys Leu Glu Glu Trp Thr Ser Pro 195 200 205 Vai His Gin Lys Ile Tyr Thr Thr Phe Ile Leu Val Ile Leu Phe Leu 210 215 220 XiÔii ri‘0 ti tu V a X Met Leu ile Leu Tyr Ser Lys * j* e:* 225 230 235 240 Leu Trp Ile Lys Lys Arg Val Gly Asp Gly Ser Val Leu Arg Thr ile 245 250 255 His Gly Lys Glu Met Ser Lys Ile Ala Arg Lys Lys Lys Arg Ala Val 260 265 270 Ile Met Met Val Thr Val Val Ala Leu Phe Ala Val Cys Trp Ala Pro 275 280 285 Phe His Vai Val His Met Met Ile Glu Tyr Ser Asn Phe Glu Lys Glu 290 295 300 Tyr Asp Asp Val Thr Ile Lys Met Ile Phe Ala Ile Val Gin Ile Ile 305 310 315 320 Gly Phe Ser Asn Ser Ile Cys Asn Pro Ile Val Tyr Ala Phe Met Asn 325 330 335 Glu Asn Phe Lys Lys Asn Val Leu Ser Ala Val Cys Tyr Cys Ile Val 340 345 350 124 ΕΡ 1 584 683/ΡΤ

Asn Lys Thr Phe Ser Pro Ala Gin Arg His Gly Asn Ser Gly Ile Thr 355 360 365 Met Met Arg Lys Lys Ala Lys Phe Ser Leu Arg Glu Asn Pro Vai Glu 370 375 380 Glu Thr Lys Gly Glu Ala Phe Ser Asp Gly Asn lie Glu vai Lys Leu 385 390 395 400 Cys Glu Gin Thr Glu Glu Lys Lys Lys Leu Lys Arg His Leu Ala Leu 405 410 415 Phe Arg Ser Glu Leu Ala Glu Asn Ser Pro Leu Asp Ser Gly His 420 425 430 <210> 39 <211> 24

< 212 > ADN <213> Homo sapiens <400> 39 ctgtgtacag cagttcgcag agtg 24

<210> 40 <211> 24 <212> ADN <213> Homo sapiens <400> 40 gagtgccagg cagagcaggt agac 24

<210> 41 <211> 31 <212> ADN <213> Homo sapiens < 4 0 0 > 41 cccgaattcc tgcttgctcc cagcttggcc c 31

<210> 42 <211> 32 <212> ADN <213> Homo sapiens <400> 42 tgtggatcct gctgtcaaag gtcccattcc gg 32

<210> 43 <211> 20 <212> ADN <213> Homo sapiens <400> 43 tcacaatgct aggtgtggtc 20

<210> 44 <211> 22 <212> ADN <213> Homo sapiens 125 ΕΡ 1 584 683/ΡΤ < 4 Ο Ο > 44 tgcatagaca atgggattac ag 22 <210> 45 <211> 511

< 212 > ADN <213> Homo sapiens <400> 45 tcacaatgct aggtgtggtc tggctggtgg cagtcatcgt aggatcaccc atgtggcacg 60 tgcaacaact tgagatcaaa tatgacttcc tatatgaaaa ggaacacatc tgctgcttag 120 aagagtggac cagccctgtg caccagaaga tctacaccac cttcatcctt gtcatcctct 180 tcctcctgcc tcttatggtg atgcttattc tgtacgtaaa attggttatg aactttggat 240 aaagaaaaga gttggggatg gttcagtgct tcgaactatt catggaaaag aaatgtccaa 300 aatagccagg aagaagaaac gagctgtcat tatgatggtg acagtggtgg ctctctttgc 360 tgtgtgctgg gcaccattcc atgttgtcca tatgatgatt gaatacagta attttgaaaa 420 ggaatatgat gatgtcacaa tcaagatgat ttttgctatc gtgcaaatta ttggattttc 480 caactccatc tgtaatccca ttgtctatgc a 511

<210> 46 <211> 21 <212> ADN <213> Homo sapiens <400> 46 ctgcttagaa gagtggacca g 21 <210> 47 <211> 22

< 212 > ADN <213> Homo sapiens <400> 47 ctgtgcacca gaagatctac ac 22

<210> 48 <211> 21 <212> ADN <213> Homo sapiens <400> 48 caaggatgaa ggtggtgtag a 21

<210> 49 <211> 23 <212> ADN <213> Homo sapiens <400> 49 gtgtagatct tctggtgcac agg 23 <210> 50 < 211> 21

< 212 > ADN <213> Homo sapiens <400> 50 gcaatgcagg tcatagtgag c 21 126 ΕΡ 1 584 683/ΡΤ <210> 51 <211> 27 <212> ADN <213> Homo < 4 0 0 > 51 sapiens tggagcatgg tgacgggaat gcagaag 27 <210> 52 <211> 27 <212> ADN <213> Homo <400> 52 sapiens gtgatgagca ggtcactgag cgccaag 27 <210> 53 <211> 23 <212.> ADN <213> Homo <400> 53 sapiens gcaatgcagg cgcttaacat tac 23 <210> 54 <211> 22 <212> ADN <213> Homo <400> 54 sapiens ttgggttaca atctgaaggg ca 22 <210> 55 <211> 23 <212> ADN <213> Homo <400> 55 sapiens actccgtgtc cagcaggact ctg 23 <210> 56 <211> 24 <212> ADN <213> Homo <400> 56 sapiens tgcgtgttcc tggaccctca cgtg 24

<210> 57 <211> 29 <212> ADN <213> Homo sapiens <400> 57 caggccttgg attttaatgt cagggatgg 29 127 ΕΡ 1 584 683/ΡΤ <210> 58 <211> 27 <212> ADN <213> Homo <400> 58 sapiens ggagagtcag ctctgaaaga attcagg 27 <210> 59 <211> 27 <212> ADN <213> Homo <400> 59 sapiens tgatgtgatg ccagatacta atagcac 27 <210> 60 <211> 27 <212> ADN <213> Homo <400> 60 sapiens cctgattcat ttaggtgaga ttgagac 27 <210> 61 <211> 21 <212> ADN <213> Homo <400> 61 sapiens gacaggtacc ttgccatcaa g 21 <210> 62 <211> 22 <212> ADN <213> Homo <400> 62 sapiens ctgcacaatg ccagtgataa gg 22 <210> 63 <211> 27 <212> ADN <213> Homo <400> 63 sapiens ctgacttctt gttcctggca gcagcgg 27

<210> 64 <211> 27 <212> ADN <213> Homo sapiens <400> 64 agaccagcca gggcacgctg aagagtg 27 128 ΕΡ 1 584 683/ΡΤ <210> 65 <211> 32 <212> ADN <213> Homo <400> 65 sapiens gatcaagctt ccatcctact gaaaccatgg tc 32 <210> 66 <211> 35 <212> ADN <213> Homo <400> 66 sapiens gatcagatct cagttccaat attcacacca ccgtc 35 <210> 67 <211> 22 <212> ADN <213> Homo <400> 67 sapiens ctggtgtgct ccatggcatc cc 22 <210> 68 <211> 22 <212> ADN <213> Homo <400> 68 sapiens gtaagcctcc cagaacgaga gg 22 <210> 69 <211> 24 <212> ADN <213> Homo <400> 69 sapiens cagcgcaggg tgaagcctga gagc 24 <210> 70 <211> 24 <212> ADN <213> Homo <400> 70 sapiens ggcacctgct qtqacctqtq cagg 24

<210> 71 <211> 22 <212> ADN <213> Homo sapiens < 4 0 0 > 71 gtcctgccac ttcgagacat gg 22 129 ΕΡ 1 584 683/ΡΤ <210> 72 <211> 23 <212> ADN <213> Homo <400> 72 sapiens gaaacttctc tgcccttacc gtc 23 <210> 73 <211> 26 <212> ADN <213> Homo <400> 73 sapiens ccaacaccag catccatggc atcaag 26 <210> 74 <211> 27 <212> ADN <213> Homo <400> 74 sapiens ggagagtcag ctctgaaaga attcagg 27

Lisboa,

Claims

ΕΡ 1 584 683/ΡΤ 1/2 REIVINDICAÇÕES 1. Método de pesquisa de compostos candidatos para identificar um agente farmacêutico para um estado de doença ou distúrbio relacionado com o pâncreas, compreendendo o método: proporcionar uma célula hospedeira eucariota compreendendo um receptor acoplado a proteina G que é uma versão activa dependente do ligando de um receptor com a SEQ ID NO:8, em que o receptor se acopla a uma proteina G; e pesquisar compostos candidatos contra o referido receptor acoplado a proteína G.
2. Método de acordo com a reivindicação 1, em que a célula hospedeira eucariota é uma célula hospedeira de mamífero.
3. Método de acordo com a reivindicação 1, em que a célula hospedeira eucariota é uma célula de levedura.
4. Método de acordo com a reivindicação 1 ou a reivindicação 2, em que a referida pesquisa compreende a detecção de AMPc.
5. Método de acordo com a reivindicação 4, em que a referida detecção de AMPc compreende ELISA utilizando um anticorpo anti-AMPc.
6. Método de acordo com a reivindicação 4, em que a célula compreende um sistema repórter compreendendo múltiplos elementos responsivos a AMPc operativamente ligados a um gene repórter.
7. Método de acordo com qualquer uma das reivindicações anteriores, em que o método compreende a identificação de um agonista do receptor acoplado a proteina G.
8. Método de acordo com qualquer uma das reivindicações 1 a 6, em que o método compreende a identificação de um agonista parcial do receptor acoplado a proteína G. ΕΡ 1 584 683/ΡΤ 2/2
9. Método de acordo com qualquer uma das reivindicações 1 a 6, em que o método compreende a identificação de um agonista inverso do receptor acoplado a proteína G.
10. Método de acordo com qualquer uma das reivindicações 7 a 9, em que o método compreende adicionalmente a confirmação de que o composto candidato se liga ao receptor.
11. Método de acordo com qualquer uma das reivindicações 7 a 10, em que o método compreende adicionalmente a formulação do referido agonista, agonista parcial ou agonista inverso, na forma de um produto farmacêutico.
12. Método de acordo com uma das reivindicações anteriores em que o receptor é um receptor endógeno com a SEQ ID NO:8.
13. Método de acordo com qualquer uma das reivindicações 1 a 11, em que o referido receptor é um receptor não endógeno possuindo uma mutação posicionada a 16 resíduos de aminoácido no sentido N-terminal, do resíduo de prolina conservado no interior do domínio TM6 de SEQ ID NO:8. Lisboa,