PT796344E

PT796344E - Método de detecção de ácidos nucleicos com uma composição de sequência específica.

Info

Publication number: PT796344E
Application number: PT95943035T
Authority: PT
Inventors: Susan Weininger; Arthur M Weininger
Original assignee: Gene Pool Inc
Priority date: 1994-12-09
Filing date: 1995-12-07
Publication date: 2007-05-31
Also published as: JPH10510157A; IL116321A0; EP1820864A3; IL116321A; NO20052968L; NO972611L; DK0796344T3; DE69535384T2; WO1996017956A2; WO1996017956A3; IL150713A; EP0796344A1; ATE353372T1; CN1176663A; DE69535384D1; ES2279516T3; EP0796344B1; JP2006320326A; NO321557B1; MX9704281A

Description

ΕΡ Ο 796 344 /ΡΤ

DESCRIÇÃO "Método de detecção de ácidos nucleicos com uma composição de sequência especifica"

Antecedentes do invento 1. Campo do Invento 0 presente invento proporciona um método e composições para utilizar em ligação, detecção e amplificação da detecção de sequências de Ácido Nucleico Alvo especificas numa amostra com fidelidade e precisão, mesmo na presença de ácidos nucleicos intimamente relacionados mas diferentes. A ligação pode envolver o acompanhamento e montagem de moléculas especificas em Conjuntos de Ligação ao Alvo que se ligam especificamente a Regiões de Ligação ao Alvo formadas através da hibridação de Ácidos Nucleicos Sonda com sequências de Ácido Nucleico Alvo. A amplificação pode envolver o acompanhamento e/ou a montagem de moléculas especificas em Conjuntos de Ligação de Reforço que se ligam especificamente a Regiões de Ligação de Reforço formadas através da hibridação de Ácidos Nucleicos de Reforço com Ácidos Nucleicos Sonda, Ácidos Nucleicos Alvo ou outros Ácidos Nucleicos de Reforço. A detecção envolve proporcionar um ou mais marcadores detectáveis, incluindo moléculas radioactivas, emissoras de luz ou fluorescentes, enzimáticas ou outras moléculas detectáveis ou geradoras de sinais, em associação com o Ácido Nucleico Sonda, o Conjunto de Ligação ao Alvo, o Ácido Nucleico de Reforço ou o Conjunto de Ligação de Reforço. 2. Antecedentes e Descrição da Arte Relacionada

Existe um número crescente de casos nos quais é importante ser capaz de detectar ácidos nucleicos contendo uma sequência especifica, daqui em diante designados Ácidos Nucleicos Alvo (TNA), numa amostra. É desejável ser-se capaz de detectar TNA com o menor número de passos de processamento, com os componentes mais simples e até à exclusão de outros ácidos nucleicos semelhantes mas diferentes, daqui em diante designados Ácidos Nucleicos Primos (CNA). É desejável ser-se capaz de detectar TNA específicos até à exclusão de qualquer um e de todos os CNA na amostra de detecção sem a necessidade de amplificação ou de outro processamento pós-detecção. 2 ΕΡ Ο 796 344 /ΡΤ

Existem numerosos métodos que utilizam ácidos nucleicos imobilizados ou marcados como sondas para TNA. No entanto, utilizando métodos conhecidos, é dificil discriminar entre um tna ligado ao Ácido Nucleico Sonda (PNA) em oposição a um CNA ligado ao PNA. Por exemplo, um ou mais erros de emparelhamento de bases entre o PNA e um CNA podem mesmo assim resultar numa hibridação CNA-PNA que é quase indistinguível de uma hibridação TNA-PNA. Assim, apenas a hibridação não é um indicador óptimo de que um PNA tenha hibridado com um único TNA.

Existem muitas situações nas quais seria utilizado um PNA para tentar determinar se um TNA estava presente numa amostra que pudesse conter CNA. A hibridação do PNA com qualquer CNA nesta situação limitaria o valor de diagnóstico que o PNA pudesse ter para a detecção de um TNA, ausente de verificação adicional. Para além disso, é desejável ser-se capaz de detectar e localizar TNA com baixo número de cópias em amostras que possam conter muitas cópias de CNA, sem a necessidade de criar cópias adicionais do TNA. Seria também desejável ser-se capaz de confirmar a presença de CNA, independentes dos TNA, sem a necessidade de separação dos CNA e TNA na amostra.

Para além disso, seria desejável ser-se capaz de amplificar o sinal de uma hibridação mesmo de baixa frequência de um determinado TNA-PNA. Para este fim, seria desejável um método de polimerização de múltiplas cópias de um marcador, daqui em diante referido como um Ácido Nucleico de Reforço (BNA) sobre O TNA-PNA. 0 presente invento proporciona métodos e composições para alcançar os objectivos anteriores desejados. Tal como revelado pela seguinte revisão, as presentes composições e métodos não foram relatados ou sugeridos na arte. Uma revisão geral e abrangente do estado da arte da detecção de ácidos nucleicos é proporcionada em Keller, Η., M.M. Manak, “dna Probes", Stockton Press, 1989.

Foi relatado um método para detecção de erros de emparelhamento de bases através de meios químicos para determinar se um PNA tinha hibridado com um CNA em vez de com 3 ΕΡ Ο 796 344 /ΡΤ um ΤΝΑ. Na Patente U.S. 4 794 075 de Ford et al., é discutido um método para distinguir fragmentos de ADN que contenham erros de emparelhamento de uma base em relação aos seus homólogos perfeitamente emparelhados. As regiões de cadeia simples dentro de um fragmento dúplex são modificadas com carbodiimida, que reage com residuos não emparelhados de guanina (G) e timina (T) no ADN. Moléculas de ADN dúplex lineares não reagem, enquanto que moléculas de ADN com emparelhamentos errados de uma base reagem quantitativamente. Após a reacção com carbodiimida, as moléculas de ADN são fraccionadas em géis de poliacrilamida de elevada percentagem de modo a que os fragmentos modificados e não modificados possam ser distinguidos. Ford et al. aplicaram esta técnica para localizar e purificar diferenças na sequência de ADN responsáveis por variação fenotipica e doença hereditária. Embora este método seja útil para seguir variações em material genético, possui um grande número de passos, requer componentes dispendiosos e não oferece um meio directo para determinar se um PNA hibridou com o TNA em exclusivo relativamente aos CNA na amostra.

Houve algumas tentativas para assegurar que pelo menos uma porção da hibridação entre o PNA e outro ácido nucleico fosse complementar. Um método envolve a monitorização dos produtos de transcrição que são produzidos se o PNA hibridar com um ácido nucleico de forma suficiente para ser transcrito a partir de um local promotor contido na sonda. A Patente U.S. 5 215 899 de Dattagupta divulga o modo como sequências de ácido nucleico especificas são amplificadas através da utilização de uma sonda em "gancho de cabelo" que, após hibridação e ligação a uma sequência alvo, é capaz de ser transcrita. A sonda compreende uma sequência auto-complementar de cadeia simples que, sob condições de hibridação, forma uma estrutura em "gancho de cabelo" possuindo uma região promotora funcional e compreende ainda uma sequência sonda de cadeia simples prolongando-se a partir da extremidade 3' da sequência em "gancho de cabelo". Após hibridação com uma sequência alvo complementar à sequência sonda e ligação da extremidade 3' da sequência alvo hibridada com a extremidade 5' da sonda em "gancho de cabelo", a sequência alvo é tornada passível de transcrição na presença de uma ARN-polimerase adequada e dos ribonucleósido-trifosfatos apropriados (rNTP). A amplificação 4 ΕΡ Ο 796 344 /ΡΤ

é conseguida através da hibridação da sequência do TNA desejado com a sonda, ligando o TNA ao PNA, adicionando a ARN-polimerase e os rNTP aos híbridos separados e permitindo que a transcrição prossiga até se acumular uma quantidade desejada do produto da transcrição do ARN. Esse método envolve, geral e especificamente, a utilização de ADN em "gancho de cabelo" formado com uma extremidade de cadeia simples desemparelhada para hibridar com uma sequência alvo. Quando a sequência alvo se liga, é permitida a produção de produtos da transcrição do ARN. Assim, o método envolve a detecção de produtos de transcrição secundários em vez da utilização de um conjunto de ligação de ácido nucleico para imobilizar e/ou localizar directamente uma sequência alvo. Um CNA pode ligar-se facilmente à sonda e a falta de complementaridade não interferirá necessariamente com a formação de um híbrido CNA-PNA que possa então suportar a produção de produtos de transcrição indesejados.

Um CNA ligado ao PNA pode ser detectado se a falta de complementaridade interferir com a susceptibilidade do par híbrido CNA-PNA para ser cortado por uma endonuclease de restrição. Na Patente U.S. 5 118 605 de Urdea e na Patente U.S. 4 775 619 de Urdea, foram proporcionados novos métodos para ensaio de um ácido nucleico a analisar, que empregam polinucleótidos possuindo sequências oligonucleotídicas substancialmente homólogas a uma sequência de interesse na substância a analisar, onde a presença ou ausência de hibridação a um rigor predeterminado proporciona a libertação de um marcador de um suporte. São empregues várias técnicas para a ligação de um marcador a um suporte, após o que a clivagem de uma cadeia simples ou dupla permite a libertação de um marcador de um suporte e a libertação do marcador pode ser detectada como indicadora da presença de uma determinada sequência polinucleotídica numa amostra. No entanto, esta técnica possui a desvantagem de um par CNA-PNA poder ser cortado pela endonuclease de restrição, mesmo se houver um emparelhamento errado, desde que o emparelhamento errado esteja fora da região de reconhecimento da endonuclease. Isto conduziria ao insucesso do ensaio para identificar um híbrido CNA-PNA. 5 ΕΡ Ο 796 344 /ΡΤ

Outro método utiliza uma sonda de ADN ramificada para detectar ácidos nucleicos. A Patente U.S. 5 124 246 de Urdea et al. divulga multimeros oligonucleotidicos lineares ou ramificados úteis como amplificadores em ensaios bioquímicos que compreendem (1) pelo menos uma primeira unidade oligonucleotídica de cadeia simples (PNA) que é complementar a uma sequência oligonucleotídica de cadeia simples de interesse (TNA), e (2) uma multiplicidade de segundas unidades oligonucleotídicas de cadeia simples que são complementares a um oligonucleótido marcado de cadeia simples. Embora sejam descritas hibridações de ácidos nucleicos em sanduíche amplificadas e imunoensaios utilizando os multimeros, o método tem a limitação de poderem ocorrer hibridações PNA-CNA e resultar na produção de um sinal indesejado.

Para além dos métodos para identificação de TNA, foram divulgados métodos para a amplificação deste ADN. Na Patente U.S. 5 200 314 de Urdea, uma cadeia polinucleotídica a analisar possuindo uma sequência a analisar (TNA) é detectada dentro de uma amostra contendo polinucleótidos através do contacto do polinucleótido a analisar com uma sonda de captura (PNA) sob condições de hibridação, onde a sonda de captura possui um primeiro parceiro de ligação específico para o TNA, e uma segunda sequência de ligação específica para um terceiro parceiro de ligação de fase sólida. O dúplex resultante é então imobilizado através de ligação específica entre os parceiros de ligação, e os polinucleótidos não ligados são separados das espécies ligadas. O polinucleótido a analisar é opcionalmente deslocado da fase sólida, depois amplificado através de PCR. Os iniciadores de PCR possuem, cada um, uma região polinucleotídica capaz de hibridar com uma região do polinucleótido a analisar e pelo menos um dos iniciadores possui ainda um parceiro de ligação adicional capaz de se ligar a um parceiro de ligação de fase sólida. O produto amplificado é então separado da mistura reaccional através da ligação específica entre os parceiros de ligação e o produto amplificado é detectado. Embora seja possível confirmar (através de PCR) que um determinado ácido nucleico hibridou com o PNA, a confirmação é dispendiosa e envolve múltiplos passos. 6 ΕΡ Ο 796 344 /ΡΤ

Quanto aos relatórios que envolvem a interacção de um ácido nucleico de cadeia dupla e uma proteína de ligação a ADN, foi descrito um método através do qual uma sequência de ADN imobilizada que contém locais de ligação a uma única proteína é utilizada para purificar essa proteína. A Patente U.S. 5 122 600 de Kawaguchi et al. divulga uma microesfera com ADN imobilizado compreendendo cadeias de ADN possuindo sequências de bases que se ligam especificamente a uma determinada proteína, e um transportador possuindo um tamanho de partícula de não mais de 50 pm e não menos de 0,01 pm que não absorve qualquer proteína, sendo as cadeias do referido transportador e do referido ADN ligadas uma à outra através de uma ligação química, e um processo para purificação de uma proteína utilizando a referida microesfera. Uma vez que isto é um método de purificação para uma proteína, não divulga um método de detecção de um TNA nem um método através do qual uma proteína se ligue a um ácido nucleico de cadeia dupla para fins de detecção e localização de sequências de TNA específicas.

Em EP-A-0453301 descreve-se um método para detecção de uma sequência alvo polinucleotídica numa amostra, em que as sequências num TNA são detectadas através da hibridação do primeiro e do segundo PNA com o TNA. Cada PNA contém um dúplex pré-formado, ou um dúplex que é formado através de prolongamento da cadeia, capaz de se ligar a uma proteína de ligação específica da sequência nucleotídica.

Em EP-A-0147665 divulga-se também a utilização de proteínas de ligação a ADN dúplex específicas da sequência como meios de detecção num ensaio de hibridação. Novamente, a sonda dúplex é pré-formada.

Em EP-A-0450594 divulga-se a possibilidade de marcação das designadas moléculas reveladoras com compostos específicos da sequência dúplex, p.ex. certos intercaladores. Estes compostos são unidos às moléculas reveladoras antes da hibridação.

Em US-A-4556643 divulga-se a detecção não radioactiva de sequências nucleotídicas específicas numa amostra, envolvendo 7 ΕΡ Ο 796 344 /ΡΤ a hibridação de uma sonda contendo sequências específicas da proteína de ligação ao ADN. WO 93/00446 divulga oligonucleótidos de cadeia simples compreendendo uma porção que, quando tornada de cadeia dupla, se liga à proteína UL9 derivada do vírus de Herpes simples, e outra porção que, quando tornada de cadeia dupla, se liga a compostos intercaladores.

Sumário do Invento O presente invento é definido nas reivindicações anexas. Proporciona métodos através dos quais sequências de Ácido Nucleico Alvo (TNA) específicas são detectadas através da utilização de Ácidos Nucleicos Sonda (PNA) que, após hibridação com os TNA, são capazes de se ligar a Conjuntos de Ligação ao Alvo (TBA) . Cada TBA liga-se pelo menos a uma região específica do par híbrido PNA-TNA, a Região de Ligação Alvo (TBR). O TBA é constituído por uma ou mais moléculas, das quais uma ou mais se podem ligar a sequências TBR de um modo específico e dependente da sequência ou da conformação. O TBA pode compreender uma ou mais sequências piloto, designadas "PILOTOS" ou "Sequências de Assimetria", que se montam e restringem os componentes de ligação aos nucleótidos do TBA a geometrias específicas. Os PILOTOS actuam montando unidades de reconhecimento de ácido nucleico específicas ou outros pilotos aos quais as unidades de reconhecimento de ácidos nucleicos específicas se unem nos TBA de um modo predeterminado. O TBA pode também conter uma ou mais moléculas que ancoram ou localizam o TBA.

Os PNA de acordo com o presente invento são definidos na reivindicação 1. As utilizações destes ácidos nucleicos são definidas noutras reivindicações.

Os PNA, para além das sequências específicas de TNA, contêm também uma ou mais sequências, 1/2 BBR, capazes de hibridar com 1/2 BBR complementares em Ácidos Nucleicos de Reforço (BNA). Através da hibridação dos BNA adicionados aos 1/2 BBR iniciais presentes nos PNA, os prolongamentos dos PNA são feitos na forma de híbridos PNA-BNA e depois BNA-BNA. Estes prolongamentos contêm uma ou mais Regiões de Ligação de 8 ΕΡ Ο 796 344 /ΡΤ

Reforço (BBR) . Cada BBR é capaz de se ligar a um Conjunto de Ligação de Reforço (BBA). 0 BBA é constituído por moléculas, uma ou mais das quais pode ligar-se a uma BBR de um modo específico e dependente da sequência ou da conformação. O BBA pode compreender uma ou mais sequências piloto, designadas "PILOTOS" ou "Sequências de Assimetria", que montam e restringem os componentes de ligação dos nucleótidos do TBA a geometrias específicas. Os PILOTOS actuam montando unidades de reconhecimento de ácidos nucleicos específicas ou outros pilotos aos quais unidades de reconhecimento de ácidos nucleicos específicas se unem nos BBA de um modo predeterminado. 0 BBA pode conter moléculas que ancoram ou localizam o BBA ou que permitem a detecção dos BBA ligados e deste modo dos complexos TBA-TNA-PNA aos quais elas, por sua vez, se ligam. São divulgados métodos e composições para utilização dos 1/2 BBR, BNA, BBR, BBA e PILOTOS BBA, incluindo a sua utilização como componentes de estojos de testes de diagnóstico e forenses. São divulgados métodos e composições para os procedimentos de teste e a produção de um estojo de teste contendo PNA, TBA, TBR, BNA, BBR e BBA para a detecção, localização e diferenciação de sequências de ácido nucleico específicas, incluindo sequências de ácido nucleico que se verificam em células humanas, no Vírus da Imunodeficiência Humana (HIV), no Vírus do Papiloma Humano (HPV) e noutros sistemas contendo ácidos nucleicos incluindo vírus e bactérias.

Assim, é um objectivo deste invento proporcionar métodos e composições para utilizar na ligação, detecção e amplificação da detecção de sequências de Ácido Nucleico Alvo numa amostra com fidelidade e precisão, mesmo na presença de sequências de ácido nucleico intimamente relacionadas mas diferentes.

Assim, é um objectivo deste invento proporcionar métodos e composições para a criação de Conjuntos de Ligação ao Alvo que se ligam especificamente a Regiões de Ligação Alvo formadas através da hibridação de Ácidos Nucleicos Sonda com sequências do Ácido Nucleico Alvo. 9 ΕΡ Ο 796 344 /ΡΤ

Outro objectivo deste invento é o de proporcionar um método e composições para a criação de Conjuntos de Ligação de Reforço que se liguem especificamente a Regiões de Ligação de Reforço formadas através da hibridação de sequências de Ácido Nucleico de Reforço com Ácidos Nucleicos Sonda, Ácidos Nucleicos de Reforço e Ácidos Nucleico em "gancho de cabelo".

Outro objectivo deste invento é o de proporcionar um método e composições para utilizar na amplificação da detecção de conjuntos de Ligação ao Alvo ligados a Regiões de Ligação Alvo utilizando Conjuntos de Ligação de Reforço e Ácidos Nucleicos de Reforço.

Outro objectivo deste invento é o de proporcionar um método e composições que permitam a utilização de um ou mais marcadores detectáveis, incluindo mas limitado a marcadores radioactivos, emissores de luz, fluorescentes, enzimáticos ou outras moléculas geradores de sinal. Estes marcadores são utilizados em associação com Ácidos Nucleicos Sonda, Conjuntos de Ligação ao Alvo, Conjuntos de Ligação de Reforço, Ácidos Nucleicos de Reforço ou Ácidos Nucleicos em "gancho de cabelo".

Breve Descrição dos Desenhos

As seguintes ilustrações estão contidas na Figura 1: a Figura 1-1 é um PNA contendo um 1/2 TBR, que é uma sequência de cadeia simples que é complementar a um TNA e a uma sequência de 1/2 bbr. a Figura 1-Ila é um TNA ao qual são adicionados os componentes da Figura 1-1 e, sob condições de hibridação, se liga ao PNA para formar os componentes da Figura 1-IIIa, um hibrido PNA-TNA contendo pelo menos uma TBR. A Figura 1-IVa é um BNA que é adicionado aos componentes da Figura 1-llla e, sob condições de hibridação, se liga a 1/2 BBR da Figura 1-IIIa para formar um hibrido PNA-BNA contendo uma BBR mostrada na Figura 1-Va. A Figura 1-IIb é um BNA que é adicionado aos componentes da Figura 1-1, e que, sob condições de hibridação, se liga ao PNA para formar os componentes da Figura 1-IIIb, um hibrido PNA-TNA contendo uma BBR. A Figura 1-IVb é um TNA ao qual se adicionam os componentes da Figura 1-Illb e que, sob condições 10 ΕΡ Ο 796 344 /ΡΤ de hibridação, se liga a 1/2 TBR da Figura l-lllb para formar um híbrido PNA-BNA contendo uma TBR mostrada na Figura 1-Vb. A Figura 1-IIc é um HNA que é adicionado aos componentes da Figura 1-1, e que, sob condições de hibridação, se liga ao pna para formar os componentes da Figura 1-IIIc, um híbrido PNA-HNA contendo uma BBR. A Figura 1-IVc é um TNA que é adicionado aos componentes da Figura 1-IIIc e que, sob condições de hibridação, se liga a 1/2 TBR da Figura 1-iiic para formar um híbrido PNA-BNA contendo uma BBR mostrada na Figura 1-Vb.

Os híbridos que formam as TBR e BBR são úteis no presente invento. Os PNA e BNA, tal como indicado na Figura 1, podem não conter um suporte e/ou indicador ligado ou conter um suporte ligado ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies, e/ou indicadores (OSA). A Figura 2a é um diagrama de estratégias para polimerização de BNA sobre PNA e protecção das extremidades por HNA. A Figura 2b é um diagrama de estratégias adicionais para amplificação de sinais PNA-TNA através da polimerização de BNA e protecção das extremidades por HNA. A Figura 3 é um diagrama mostrando a utilização de BNA contendo múltiplas 1/2 BBR por BNA. A Figura 4a é um diagrama mostrando a ligação de TBA e BBA a TBR e BBR, e a capacidade do TBA para discriminar entre TNA e CNA. De acordo com esta concretização, se o TBA for imobilizado, numa esfera, superfície de uma placa de microtítulo ou qualquer outra superfície, apenas complexos tais como o complexo X seriam mantidos e detectados, enquanto que complexos tais como os complexos XI não. A Figura 4b é um diagrama que exemplifica acontecimentos semelhantes aos mostrados na Figura 4a mas numa ordem de ocorrência ligeiramente diferente. 11 ΕΡ Ο 796 344 /ΡΤ A Figura 5 é um diagrama exemplificando PNA contendo entre uma 1/2 TBR e nenhuma 1/2 BBR até PNA contendo até cinco 1/2 TBR e uma 1/2 BBR. Os membros (a) e (b) de cada número (I, II, III, IV, V) formam um conjunto que, após hibridação com um TNA, proporciona TBR com (membros (a) ) ou sem (membros (b) ) uma 1/2 BBR disponível para amplificação através de hibridação com BNA possuindo 1/2 BBR complementares. A Figura 6a é um diagrama exemplificando um determinado TNA possuindo duas 1/2 TBR que, após ligação a um PNA apropriado, forma duas TBR infimamente associadas capazes de se ligar a dois TBA. É também proporcionada uma 1/2 BBR para amplificação. A Figura 6b é um diagrama mostrando os mesmos acontecimentos que a Figura 6a excepto que aqui é utilizado um duplo TBA de modo a que a discriminação entre TBR simples que ocorrem em amostras celulares normais possa ser discriminada de TBR duplos, anormais. A Figura 6c é um diagrama mostrando o mesmo cenário que a Figura 6a excepto que aqui são identificadas cinco TBR no TNA. Cada TBR pode ser ligada a um TBA igual ou diferente e cada TBA pode ser diferenciadamente marcado, permitindo a confirmação de todos os cinco locais presentes no TNA. A Figura 6d é um diagrama dos mesmos acontecimentos que na Figura 6c excepto que aqui é mostrado um duplo TBA, prolongando o que é mostrado na Figura 6b à utilização do duplo TBA. Um exemplo do TNA mostrado no item II das Figuras 6a, 6b, 6c e 6d é o ADN ou ARN de cadeia simples de HIV. A Figura 7 mostra a LTR de HIV como um TNA e dois PNA, e uma estratégia para a detecção do TNA utilizando os PNA. A Figura 8 é um esquema de uma concretização do presente invento em que é utilizada um conjunto de ligação ao alvo para ligar um hibrido TNA-PNA, e são utilizados conjuntos de ligação de reforço para ligar BNA polimerizados. A Figura 9 é um esquema de um TBA modular no qual as sequências do conjunto, as sequências ligantes e as sequências 12 ΕΡ Ο 796 344 /ΡΤ de assimetria são utilizadas para acompanhar unidades de reconhecimento do ácido nucleico desejadas juntas para formar um TBA. A Figura 10 mostra TBA modulares úteis na detecção de sequências especificas de HIV. A Figura 11 mostra TBA modulares úteis na detecção de sequências de virus do papiloma humano. Cada unidade de E2 é de facto um dimero da porção de ligação ao ADN de E2. A Figura 12a é um esquema do fraccionamento do TNA e da mudança de mobilidade devida à ligação de um TBA. A Figura 12b é um esquema do fraccionamento do TNA e do aumento na mudança de mobilidade devida à ligação de BBA para além de TBA. A Figura 13 mostra uma estratégia de detecção para sequências de deleção; um exemplo da utilização desta estratégia é para um ensaio de integração de virus do papiloma humano. A Figura 14 mostra a montagem de TBA de ordem superior através da utilização de unidades de reconhecimento de ácidos nucleicos, sequências ligantes, de montagem e de assimetria de modo a serem formados vários Conjuntos de Ligação ao Alvo específicos para locais de ligação na LTR de HIV. A Figura 15 mostra a montagem de TBA de ordem superior através da utilização de unidades de reconhecimento de ADN, sequências ligantes, de montagem e de assimetria de modo a serem formados vários Conjuntos de Ligação ao Alvo específicos para locais de ligação no genoma de HPV. A Figura 16 mostra a discriminação alcançada através da utilização de um TBA complexo e a capacidade de moléculas de ligação alvo competidoras endógenas para eliminar a ligação do TBA a uma molécula de ácido nucleico prima mas não do TNA que contém a orientação apropriada de mais de um local reconhecido pelo TBA. 13 ΕΡ Ο 796 344 /ΡΤ A Figura 17 mostra a capacidade de um TBA para ser especificamente direccionado para se ligar a locais de emparelhamento errado da sequência e a ligar-se de preferência aqueles locais em locais primos que não contenham todos os emparelhamentos errados alvo.

Breve Descrição das Sequências SEQ ID NO:l corresponde à Figura 5-la-I e mostra o local de ligação a NF-kB de MHC de classe I. SEQ ID NO:2 corresponde à Figura 5 (Ia) e mostra o local de ligação a NF-kB da microglobina B2. SEQ ID NO:3 corresponde à Figura 5 (Ia) e mostra o local de ligação a NF-kB da imunoglobulina capa. SEQ ID NO:4 corresponde à Figura 5 (Ia) e mostra um dos locais de ligação a NF-kB de HIV. SEQ ID NO:5 corresponde à Figura 5 (Ia) e mostra um dos locais de ligação a NF-kB de HIV. SEQ ID NO:6 corresponde à Figura 5 (la) e mostra o local de ligação a NF-kB de c-myc. SEQ ID NO:7 corresponde à Figura 5 (lia) e mostra um local de ligação duplo a NF-kB de HIV. SEQ ID NO:8 corresponde à Figura 5 (lia) e mostra um local de ligação duplo a NF-kB de HIV. SEQ ID NO:9-16 correspondem à Figura 5 (lia) e mostram um local de ligação duplo com um local sendo um local de ligação a NF-kB de HIV e o outro local sendo um local de ligação a SPl de HIV. SEQ ID NO :17-18 correspondem à Figura 5 (Ha) e mostram um local de ligação duplo a SPl de HIV. 14 ΕΡ Ο 796 344 /ΡΤ SEQ ID ΝΟ:19-31 correspondem à Figura 5 (iila) e mostram um local de ligação duplo a NF-kB de HIV e um local de ligação a SP1 de HIV. SEQ ID NO:32-33 correspondem à Figura 5 (IVa) e mostram um local de ligação quádruplo onde dois locais são locais de ligação a NF-kB de Hiv e dois locais são locais de ligação a SP1 de HIV. SEQ ID NO:34 corresponde à Figura 5 (Via) e mostra um local de ligação quíntuplo onde dois locais são locais de ligação a NF-kB de HIV e três locais são locais de ligação a SP1 de HIV. SEQ ID NO:35 é um exemplo de uma 1/2 BBR, neste caso os elementos 0L1, 0L2 e 0L3 do operador esquerdo do bacteriófago lambda, incluindo sequências intervenientes. SEQ ID NO:36 é um exemplo de uma 1/2 BBR, neste caso os elementos 0R3, 0R2 e 0R1 do operador direito do bacteriófago lambda, incluindo sequências intervenientes. SEQ ID NO:37 é a LTR de HIV. SEQ ID NO:38 é um PNA complementar ao PNA da LTR de HIV. SEQ ID NO:39 é um PNA complementar a um PNA da LTR de HIV diferente do de SEQ ID NO:38. SEQ ID NO:40 é um PNA complementar a parte da LTR de HIV e contém também 1/2 BBR e uma sequência solta para polimerização dos BNA no PNA.

SEQ ID NO:41 é um BNA complementar à 1/2 BBR de SEQ ID NO:40. SEQ ID NO:42 é um BNA que polimerizará sobre o BNA de SEQ ID NO:41 e que, com as SEQ ID NO:40 e 41, cria um local de reconhecimento PstI. SEQ ID NO:43 é um BNA que é complementar ao BNA de SEQ ID NO:42 e que completa um local de reconhecimento Bamhl. 15 ΕΡ Ο 796 344 /ΡΤ SEQ ID ΝΟ:44 é um ΗΝΑ que possui um local de reconhecimento BamRl que hibridará com o local de reconhecimento BamRl criado por SEQ ID NO:42 e 43 no polímero em crescimento. SEQ ID NO:45 é um segundo PNA que, tal como SEQ ID NO:40, é complementar a parte da LTR de HIV, mas não à mesma sequência que SEQ ID NO:40. SEQ ID NO:45 codifica também uma 1/2 bbr e uma ponta solta que permitirá a polimerização de BNA começando com um local de reconhecimento Sphl. SEQ ID NO:46-62 são PNA específicos do vírus do papiloma humano (HPV) que, após hibridação com sequências de HPV, formam TBR que se ligam a proteínas de ligação ao ADN de HPV. SEQ ID NO:63-71 são unidades de reconhecimento de ADN de NF-kB para incorporação em TBA. SEQ ID NO:72 é uma sequência de localização nuclear. SEQ ID NO:73 é uma unidade de reconhecimento da sequência de SPl. SEQ ID NO:74 é uma unidade de reconhecimento de proteínas de ligação a TATA. SEQ ID NO:75-84 são unidades de reconhecimento do ADN de E2 do vírus de papiloma. SEQ ID NO:85-92 são sequências de assimetria. SEQ ID NO:93 é uma unidade de reconhecimento de proteínas de ligação a TATA de Arabidopsis. SEQ ID NO:94 é uma unidade de reconhecimento de proteínas de ligação ao ADN de HPV-16-E2-1. SEQ ID NO:95 é uma unidade de reconhecimento de proteínas de ligação ao ADN de HPV-16-E2-2. SEQ ID NO:96 é uma unidade de reconhecimento de proteínas de ligação ao ADN de HPV-18-E2. 16 ΕΡ Ο 796 344 /ΡΤ SEQ ID ΝΟ:97 é uma unidade de reconhecimento de proteínas de ligação ao ADN de HPV-33-E2. SEQ ID NO:98 é uma unidade de reconhecimento de proteínas de ligação ao ADN de E2 do vírus do papiloma bovino. SEQ ID NO :99-102 são sequências ligantes exemplificativas. SEQ ID NO:103 é uma sequência sinal de localização nuclear (NLS) exemplificativa. SEQ ID NO :104-108 são sequências de acompanhamento exemplificativas. SEQ ID NO:109-116 são sequências de TBA montadas exemplificativas. SEQ ID NO:117 é um local de ligação a NF-kB de consenso. SEQ ID NO: 118 é uma sequência de aminoácidos de Tat de HIV.

Abreviaturas ácido nucleico de cadeia simples 111111111111111 ^ ^ ^ ^ ^ ^ ^ ácido nucleico de cadeia dupla

Ifí 1111ΙΤΤΠ11ΓΓ lll M 11111111111

Região de ligação no ácido nucleico

sem suporte nem indicadores, ou com suporte sólido ou outros meios de localização, incluindo, mas não se limitando a esferas, polímeros e superfícies ou indicadores = OSA BBA conjunto de ligação de reforço (Booster Bíndíng

Assembly) bbr região de ligação de reforço (Booster Binding

Region) 17 ΕΡ Ο 796 344 /ΡΤ ΒΝΑ ácido nucleico de reforço (Booster Nucleic Acid) CNA ácido nucleico primo (Cousin Nucleic Acid)

1/2 BBR região de cadeia simples que, quando hibridada com a sequência complementar de um HNA ou de um BNA, se pode ligar a um BBA

1/2 TBR região de cadeia simples do PNA que, quando hibridada com a sequência complementar de um TNA, se pode ligar a um TBA OSA suporte ou ligação opcional, circulo com caixa (Optional Support ou Attachment) PNA ácido nucleico sonda (Probe Nucleic Acid) TBA conjunto de ligação ao alvo (Target Binding

Assembly) TBR região de ligação alvo (Target Binding Region) TNA ácido nucleico alvo (Target Nucleic Acid) HNA Ácido Nucleico em "gancho de cabelo" (Hairpin

Nucleic Acid)

Definições

Deve também entender-se a partir da descrição que se segue que quando se mencionam termos como conjuntos de ligação ao alvo (TBA), conjuntos de ligação de reforço (BBA), proteínas de ligação ao ADN, proteínas de ligação ao ácido nucleico ou proteínas de ligação ao ARN, o que se pretende são composições constituídas por moléculas que se ligam a sequências de ácido nucleico alvo (TNA) de ADN ou ARN independentemente da especificidade da categoria das moléculas de ligação a partir das quais são derivadas. Assim, por exemplo, um TBA adaptado para se ligar a sequências do vírus da imunodeficiência humana pode ser muito semelhante a um factor de transcrição NF-kB que tipicamente se liga a sequências de ADN. No entanto, tal como aqui se utiliza, entender-se-á que o TBA pode ser adaptado para uma utilização óptima para se ligar a sequências de ARN de uma determinada composição ou conformação de sequência. 18 ΕΡ Ο 796 344 /ΡΤ A fidelidade do método de detecção aqui divulgado depende em grande medida da ligação selectiva dos TBA e BBA a motivos de ácido nucleico particulares. Deve entender-se ao longo desta divulgação que a base da discriminação de TBA e BBA dos TNA de sequências aparentadas (ácidos nucleicos primos ou CNA) pode ser a formação de segmentos hibridos precisos de ácido nucleico sonda (PNA)-ácido nucleico alvo (TNA) (hibridos PNA-TNA) . No entanto, a base da discriminação pode também ser a formação de uma determinada conformação e pode não requerer a completa ausência de emparelhamento errado de bases no híbrido TNA-PNA. Assim, a base da operação de TBA ou BBA deve ser sempre entendida como dependendo da discriminação de qualquer propriedade única do híbrido TNA-PNA em oposição a quaisquer propriedades mostradas por quaisquer híbridos PNA-CNA que se possam formar numa amostra de teste colocada em contacto com um dado PNA.

Descrição Detalhada do Invento 0 presente invento é definido pelas reivindicações anexas. Proporciona um método para identificar especificamente um ácido nucleico alvo (TNA) numa amostra através da utilização de conjuntos de ligação ao alvo (TBA) que incorporam proteínas de ligação a ácido nucleico específicas. Através da utilização de ácidos nucleicos sonda (PNA) específicos para uma dada sequência de TNA e um TBA que seja específico para a região de ligação alvo (TBR) dúplex formada após a formação de sequências híbridas TNA-PNA, forma-se um complexo TBA-TNA-PNA estável. Proporcionando adicionalmente sequências amplificáveis específicas no PNA, para além de sequências que contribuam especificamente para a formação da TBR reconhecida pelo TBA, a ligação do PNA ao TNA é detectada e a detecção amplificada. Para este fim, pode ser utilizado qualquer um de vários sistemas de amplificação de ácidos nucleicos, incluindo reacção em cadeia da polimerase ou a utilização de ADN ramificado, cada ramificação do qual contém um marcador detectável. Em particular, é aqui descrito um novo método de amplificação onde a porção amplificável do PNA contém sequências sobre as quais podem ser polimerizados ácidos nucleicos de reforço (BNA). Após a formação de cada híbrido BNA-PNA, forma-se uma região de ligação de reforço (BBR) à qual um conjunto de ligação de reforço (BBA) se liga 19 ΕΡ Ο 796 344 /ΡΤ especificamente. Se marcados de forma detectável, os BBA ou BNA proporcionam uma amplificação essencialmente ilimitada do acontecimento de ligação TNA-PNA original.

De acordo com este invento, entender-se-á que o TNA inclui sequências de ácido nucleico especificas. 0 TBA entender-se-á ser qualquer conjunto molecular que possa de forma especifica e apertada ligar-se a um hibrido TNA-PNA formado. 0 tba conterá uma ou mais moléculas cujas sequências são suficientes para se ligarem à TBR. Os dominios de ligação ao ácido nucleico que são conhecidos podem ser utilizados directamente como componentes do TBA ou modificados de acordo com os ensinamentos aqui proporcionados. As moléculas mais facilmente disponíveis com tais sequências são os domínios de ligação ao ADN das proteínas de ligação ao ADN. Especificamente, conhecem-se muitas proteínas de ligação ao ADN ou ao ARN que podem ser utilizadas directamente como a proteína não modificada conhecida, ou o TBA pode ser uma proteína de ligação ao ácido nucleico modificada de acordo com os ensinamentos específicos aqui proporcionados. No último caso, as modificações específicas que são desejáveis incluiriam a optimização de afinidades de ligação, remoção de actividades indesejadas (tais como actividade de nuclease e reorganização do TBA na presença de outras moléculas com uma afinidade para componentes do TBA), optimização da selectividade de uma sequência alvo sobre sequências intimamente aparentadas, e optimização da estabilidade.

Exemplos de proteínas de ligação ao ADN que podiam ser utilizadas de acordo com este invento são as porções de ligação ao ADN do factor de transcrição NF-kB (p50 e p65), NF-IL6, NF-AT, rei, TBP, a proteína E2 do vírus do papiloma humano, spl, os repressores cro e Cl do bacteriófago lambda e proteínas semelhantes bem como proteínas conhecidas cuja porção de ligação ao ADN foi isolada, clonada, sequenciada e caracterizada. Adicionalmente, é incluída qualquer outra proteína de ligação ao ADN ou porção de uma proteína que seja necessária e suficiente para se ligar a um híbrido de TBR ou a uma BBR. Isto inclui proteínas ou porções de proteínas de tipo selvagem com actividade de ligação ao ADN alterada bem como proteínas criadas com especificidade de ligação ao ADN alterada, tal como a troca de uma hélice de reconhecimento da 20 ΕΡ Ο 796 344 /ΡΤ ligação ao ADN de uma proteína para outra. Adicionalmente, proteínas que exibem ligação ao ácido nucleico e outras funções no ácido nucleico, tais como endonucleases de restrição, podem ser utilizadas como função de ligação ao ácido nucleico. Proteínas que se ligam a regiões alvo em híbridos ADN-ARN bem como híbridos ARN-ARN estão incluídas (ver, por exemplo, Shi, 1995; DeStefano, 1993, Zhu, 1995; Gonzales, 1994; Salazar, 1993; Jaishree, 1993; Wang, 1992; Roberts, 1992; Kainz, 1992; Salazar, 1993 (b)) . Os conjuntos de ligação podem ser construídos com a utilização de uma molécula que acompanha porções do conjunto de ligação de modo a possam ser alcançadas combinações e geometrias de componentes específicas. Esta molécula é aqui designada como um PILOTO. Os pilotos podem ser constituídos por proteínas ou qualquer combinação de materiais orgânicos e inorgânicos que alcancem a selecção combinatória e/ou induzam geometrias específicas entre membros do TBA ou BBA. Um acompanhante é uma estrutura estável sobre a qual pode ser construído um TBA ou BBA de modo a que seja proporcionada a conformação correcta do TBA ou BBA enquanto que ao mesmo tempo elimina propriedades indesejáveis de uma proteína de ligação a ácido nucleico de ocorrência natural. Como exemplo específico desta concretização, é proporcionada uma versão modificada do factor de transcrição pleiotrópico, NF-kB, utilizando uma proteína cro do bacteriófago lambda modificada como acompanhante. Cada dímero de ligação de NF-kB retém a afinidade de ligação picomolar para o local de ligação de NF-kB enquanto que ao mesmo tempo o conjunto de ligação apresenta várias características vantajosas de produção, estabilidade e especificidade.

Tendo em vista o antecedente, os vários aspectos e concretizações deste invento são descritos abaixo em detalhe. 1. Os Ácidos Nucleicos Sonda (PNA) e sua preparação. Os PNA do presente invento compreendem pelo menos três partes principais unidas umas às outras. Com referência à Figura 1(I) dos desenhos, a primeira parte do PNA é uma ou mais sequências de bases, designada "1/2 TBR". Com referência à Figura 1(1 e lia) dos desenhos, a 1/2 TBR no PNA é complementar a uma sequência de interesse numa amostra, contendo o TNA uma 1/2 TBR. Com referência à Figura l(llla) dos desenhos, o TNA, 21 ΕΡ Ο 796 344 /ΡΤ quando adicionado ao ΡΝΑ sob condições de hibridação, forma um híbrido PNA-TNA contendo uma TBR. Com referência à Figura 1(1) dos desenhos, a segunda parte do PNA é uma sequência de bases, designada "1/2 bbr". Com referência à Figura 1(1, Ilb, lie e IVa) dos desenhos, a 1/2 BBR no PNA é complementar a uma 1/2 BBR contida num BNA ou num HNA. Com referência à Figura l(lllb, Illc e Va) dos desenhos, o BNA ou HNA, quando adicionado ao PNA sob condições de hibridação, forma um híbrido pna-bna ou um híbrido PNA-HNA, respectivamente, contendo uma BBR. Com referência à Figura 1(1) dos desenhos, a terceira parte do PNA é o OSA, designado por um círculo dentro de uma caixa. 0 OSA é a ausência de suporte e/ou de um indicador, ou um suporte sólido ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores que é/são ligados covalentemente ou não covalentemente, mas especificamente, associados ao PNA. 0 OSA pode ser um átomo ou molécula que ajuda na separação e/ou localização tal como um grupo de ligação a um suporte sólido ou marcador que pode ser detectado através de vários meios físicos incluindo, mas não se limitando a, adsorção ou imagiologia de partículas emitidas ou luz. Os métodos para unir indicadores a oligonucleótidos ou para imobilizar oligonucleótidos a suportes sólidos são bem conhecidos na arte (ver Keller e Manak, supra). 0 PNA do presente invento pode ser preparado através de qualquer método adequado. Tais métodos, em geral, incluirão síntese de oligonucleótidos e clonagem num vector replicável. Os métodos para a síntese de ácidos nucleicos são bem conhecidos na arte. Quando clonados ou sintetizados, a purificação da cadeia e a separação podem ser necessárias para utilizar o produto como um PNA puro. Os métodos de preparação de sondas de ARN são bem conhecidos (ver por exemplo Blais 1993, Blais 1994, que utiliza transcrição in vitro a partir de uma reacção PCR incorporando um promotor da ARN-polimerase de T7) .

Será entendido pelos peritos na arte que o comprimento e a sequência específica do PNA dependem do comprimento e da sequência a detectar num TNA, e das constrições para se alcançar uma ligação apertada e específica do TBA particular a utilizar (ver discussão sobre TBA abaixo). Em geral, PNA com 22 ΕΡ Ο 796 344 /ΡΤ comprimentos de sequência entre cerca de 10 e cerca de 300 nucleótidos de comprimento são adequados, sendo os de cerca de 5-100 nucleótidos de comprimento desejáveis para muitas das concretizações especificamente exemplificadas aqui.

Deve entender-se também que o PNA pode ser construído de modo a conter mais de uma 1/2 TBR e a produzir mais de uma TBR para um ou mais TBA, iguais ou diferentes, bem como TBR complexas reconhecidas por novos tba dúplex e multíplice (ver descrição abaixo em relação a estes novos TBA) após hibridação dos PNA e TNA. A Figura 5 ilustra PNA específicos que contêm uma ou mais 1/2 TBR. As sequências específicas que correspondem às sequências de 1/2 TBR ilustradas na Figura 5 (la, lia, Illa, IVa e Va) são SEQ ID NO:l-34 (ver Descrição das Sequências acima).

Tal como mostrado nas Figuras 2a e 2b, o PNA, contendo uma 1/2 TBR, pode ser hibridado com um ou mais BNA (ver descrição abaixo) e a cadeia de bna polimerizada até qualquer potencial comprimento desejado para amplificação do acontecimento de hibridação TNA-PNA. De preferência, estarão presentes no PNA entre 1 e 10 1/2 BBR.

Tal como mostrado nas Figuras 6a e 6b, o PNA pode conter várias 1/2 TBR, iguais ou diferentes, que podem hibridar com várias 1/2 TBR num TNA. De cada vez que uma 1/2 TBR no PNA coincide com uma 1/2 TBR num TNA, forma-se uma Região de Ligação Alvo, TBR, que se pode ligar a uma TBA. Para além disso, não é essencial que todas as TBR estejam num único PNA contíguo. Assim, numa concretização do presente invento, são utilizados dois PNA diferentes para detectar sequências num determinado TNA. Como ilustração deste aspecto do presente invento, a Figura 7 mostra uma representação da repetição terminal longa (LTR) do vírus da imunodeficiência humana (HIV) . Tal como se sabe na arte, a LTR de HIV compreende dois locais de ligação a NF-kB e três locais de ligação a SPl, muito próximos, em que NF-kB e SPl são proteínas de ligação ao ADN conhecidas. A Figura 7 proporciona dois PNA, PNA1 (SEQ ID NO:38) e PNA2 (SEQ ID NO:39), cada um dos quais é complementar à cadeia oposta mostrada como um TNA (SEQ ID NO: 37), que mostra os dois locais de ligação a NF-kB e os três locais de ligação a SPl da LTR de HIV. De acordo com este aspecto do 23 ΕΡ Ο 796 344 /ΡΤ presente invento, PNAl híbrida especificamente com a secção do TNA mostrada na Figura 7 com as bases sublinhadas com um símbolo enquanto que PNA2 híbrida especificamente com a secção do TNA mostrada na Figura 7 com as bases sublinhadas com um símbolo Cada um de PNAl e PNA2 pode também conter sequências (indicadas pelos símbolos "#" ou "*") que hibridarão com sequências 1/2 BBR de um BNA (ver abaixo). Adicionalmente, cada um de PNAl e PNA2 pode ser marcado de modo diferencial com um OSA, tal como um fluoróforo como um marcador de fluoresceína ou rodamina, que permitirá a confirmação de que ambas as sondas se ligaram ao TNA. Se for detectada apenas um ou nenhum marcador, conclui-se que o TNA não está presente na amostra a testar.

Noutro aspecto da concretização mostrada na Figura 7, é mostrado um método para alterar a especificidade do presente método de ensaio. Através da alteração do comprimento do intervalo entre PNAl e PNA2, de modo a que seja alterada a região de TNA que permanece sem hibridar, um executante deste invento é capaz de alterar a discriminação do ensaio.

Para exemplificar mais claramente este aspecto do presente invento, é necessário enfatizar que a TBR pode ter uma estrutura helicoidal. Assim, enquanto PNAl cria TBR numa "face" da hélice, PNA2 cria uma TBR na mesma face ou numa face diferente da hélice, dependendo da distância entre o meio de cada TBR (sublinhado na Figura 7). Se o meio de cada local de ligação for um produto inteiro de 10,5 bases de distância, as TBR estarão no mesmo lado da hélice, enquanto que produtos não inteiros de 10,5 bases de distância colocarão as TBR em lados opostos da hélice. Deste modo, qualquer cooperatividade na ligação pelo TBA reconhecendo a TBR de PNAl e pelo TBA reconhecendo a TBR de PNA2 pode ser manipulada (ver Hochschild, A., M. Ptashne, Cell 44: 681-687, 1986, mostrando este efeito para a ligação do repressor do bacteriófago lambda a dois locais diferentes do operador situados a diferentes distâncias um do outro numa hélice de ADN). Tal como descrito por Perkins et al. (EMBO J. 12: 3551-3558, 1993), é necessária cooperatividade entre os locais de NF-kB e SPl para se alcançar a activação da LTR de HIV. No entanto, para os fins do presente invento, pode-se tirar vantagem do motivo do local de ligação duplo NF-kB-triplo SPl na LTR de HIV proporcionando 24 ΕΡ Ο 796 344 /ΡΤ uma nova proteína de ligação única capaz de se ligar a ambos os locais simultaneamente, mas apenas se o espaço entre os locais for geometricamente praticável. Isto é controlado tanto pela estrutura do tba seleccionado como pelo tna utilizado. Assim, na concretização exemplificada na Figura 7, as duas sondas podem ser utilizadas com uma região inter-sondas suficientemente grande de ADN de cadeia simples restante de modo a que, mesmo se os locais de ligação a NF-kB e SPl estiverem em lados opostos da hélice, a região de cadeia simples entre as sondas proporciona uma "charneira" suficientemente flexível de modo a que o ADN se possa dobrar e torcer para acomodar a geometria do TBA. Alternativamente, pode ser desenhado um ensaio mais rigoroso através do estreitamento da distância inter-sondas de modo a que o ADN se possa apenas dobrar, mas não torcer. Finalmente, as sondas podem ser tão pouco espaçadas ou ser utilizado um único PNA, de modo a que o ADN se possa dobrar mas não torcer. Assim, esta figura exemplifica e permite a produção de sistemas de detecção com qualquer grau desejado de discriminação entre os ácidos nucleicos alvo possuindo sequências semelhantes, mas diferentes justaposições destas sequências.

Em termos de um estojo de diagnóstico ou forense para HIV, os peritos na arte compreenderão que os aspectos acima mencionados deste invento permitem a obtenção de componentes do estojo de diagnóstico ou forense à medida para corresponder ao que se sabe a dado momento sobre as estirpes prevalentes de HIV ou de outro patogénio ou condição de doença. Será apreciado pelos peritos na arte que, embora a detecção de infecção de HIV não seja a única utilidade do presente invento, devido à mutabilidade do genoma de HIV, é provavelmente um dos ambientes de teste mais complexos para um tal diagnóstico. No entanto, é precisamente num tal ambiente mutável que a flexibilidade do presente método, ligada à sua capacidade para discriminar entre sequências muito intimamente aparentadas, podem ser melhor apreciadas. Em ambientes menos mutáveis, alguma da sofisticação à qual este método se sujeita não necessita ser utilizada. Assim, num estojo de diagnóstico para infecção de virus do papiloma, todas as caracteristicas de discriminação da interacção TBA-TBR estão disponíveis, juntamente com a capacidade para amplificar o sinal utilizando os BNA e BBA, mas pode ser utilizado um único PNA simples, tal 25 ΕΡ Ο 796 344 /ΡΤ como qualquer um de SEQ ID NO :44-62, que identifique sequências únicas do virus do papiloma, que também se saiba que se ligam a um TBA tal como a proteina E2 do virus do papiloma ou porções de ligação ao ADN truncadas desta (ver Hedge et al., Nature 359: 505-512, 1992; Monini et al., J.

Virol. 65: 2124-2130, 1991).

Na aplicação do presente método à detecção de um determinado TNA para fins de avaliação de se estão presentes certos ácidos nucleicos que estão associados com a progressão de melanoma, hepatoma, cancros da mama, cervical, do pulmão, do cólon, da próstata, pancreático ou dos ovários, o TNA pode ser obtido a partir de materiais de biopsia tomados de órgãos e fluidos suspeitos de conter as células cancerosas. Para a detecção de deficiências genéticas, o TNA pode ser obtido a partir de amostras de pacientes contendo as células afectadas. Para detecção de contaminantes e produtos de fermentação no fabrico de alimentos, produtos químicos ou biotecnológicos ou na bio-resolução de desperdícios, o TNA pode ser obtido a partir de amostras tomadas a vários estádios no processo de fermentação ou tratamento. Para a detecção de patogénios ou contaminantes em alimentos ou fármacos, a amostra de TNA pode ser obtida a partir do alimento ou fármaco, esfregaços de alimentos ou superfícies em contacto com os alimentos, fluidos em contacto com os alimentos, materiais de processamento, fluidos e semelhantes associados ao fabrico ou em contacto com os alimentos, fármacos ou amostras biológicas tomadas daqueles em contacto com os alimentos ou fármacos ou semelhantes. 2. Ácidos Nucleicos de Reforço (BNA), Regiões de Ligação de Reforço (BBR) e sua preparação. Os BNA do presente invento são constituídos por pelo menos uma ou mais 1/2 BBR ligadas a um OSA. As 1/2 BBR podem hibridar com 1/2 BBR complementares contidas no PNA, outros BNA ou num HNA.

Com referência à Figura 1 (I, Ilb e Illb) dos desenhos, o BNA mais simples é constituído por duas partes. Com referência à Figura l(IIb) dos desenhos, a primeira parte do BNA mais simples é uma sequência de bases que é complementar à sequência no PNA que é designada "1/2 BBR". Com referência à Figura l(IIb) dos desenhos, a segunda parte do BNA mais simples é o OSA, designado por um círculo dentro de uma caixa. 26 ΕΡ Ο 796 344 /ΡΤ Ο OSA é ausência de suporte e/ou de indicador, ou um suporte sólido ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores que são ligados covalentemente ou não covalentemente, mas especificamente, associados ao BNA.

Com referência à Figura 2a (II e III) dos desenhos, o BNA pode conter mais de uma sequência de 1/2 BBR. 0 BNA ilustrado na Figura 3(11) contém uma sequência que é complementar ao PNA ilustrado na Figura 3(1) e duas outras sequências de 1/2 BBR. 0 BNA ilustrado na Figura 3 (III) contém duas sequências de 1/2 BBR que são complementares a duas das sequências de 1/2 BBR no BNA ilustrado na Figura 3(11), mais até "n" 1/2 BBR adicionais para polimerização de mais BNA.

Sob condições de hibridação, o BNA ilustrado na Figura 3(11), quando combinado com o PNA ilustrado na Figura 3(1), cria o híbrido PNA-BNA ilustrado na Figura 3(IVa) contendo uma BBR e uma extensão não hibridada com duas sequências de 1/2 BBR adicionais ou sequências de "reforço". As BBR criadas através da referida hibridação podem ser idênticas, semelhantes ou dissemelhantes na sequência. As BBR criadas através da referida hibridação podem ligar-se a BBA idênticas, semelhantes ou dissemelhantes (ver abaixo). Os BNA podem ter sido preparados de forma análoga aos PNA.

Sob condições de hibridação, o híbrido BNA-BNA ilustrado na Figura 3(IVb), quando combinado com o PNA ilustrado na Figura 3(Vb), cria o híbrido PNA-BNA ilustrado na Figura 3(VI) contendo uma BBR, dois híbridos BNA-BNA adicionais contendo BBR e uma extensão não hibridada com uma sequência de 1/2 BBR adicional, uma sequência de "reforço". As BBR criadas pela referida hibridação podem ser idênticas, semelhantes ou dissemelhantes na sequência. As BBR criadas pela referida hibridação podem-se ligar a BBA idênticas, semelhantes ou dissemelhantes (ver abaixo). Os BNA podem ser preparados de um modo análogo ao da preparação dos PNA. 3. Os Ácidos Nucleicos Alvo (TNA) e sua preparação. 0 primeiro passo na detecção e amplificação de sinais produzidos através da detecção de um determinado TNA de acordo com o presente método é a hibridação de tal alvo com o PNA numa 27 ΕΡ Ο 796 344 /ΡΤ mistura adequada. Tal hibridação é alcançada sob condições adequadas bem conhecidas na arte. A amostra suspeita de conter ou que se sabe conter o tna pretendido pode ser obtida a partir de uma variedade de fontes. Pode ser uma amostra biológica, uma amostra de alimento ou agrícola, uma amostra ambiental e por aí adiante. Na aplicação do presente método para a detecção de um determinado TNA para fins de diagnóstico médico ou forense, o TNA pode ser obtido a partir de uma amostra de biopsia, um fluido corporal ou exsudado tal como urina, sangue, leite, líquido cerebrospinal, expectoração, saliva, fezes, aspirados pulmonares, esfregaços da garganta ou genitais e semelhantes. Adicionalmente, a detecção pode ser in situ (ver por exemplo Embretson, 1993, Patterson, 1993; Adams, 1994) .

Assim, PNA específicos para vertebrados (incluindo mamíferos e incluindo humanos) ou para qualquer um ou para todos os seguintes microrganismos de interesse podem ser considerados e utilizados de acordo com o presente método:

Corinebactérias

Corynebacterium diphtheria Bacilos

Bacillus thuríngíensis Pneumococos

Diplococcus pneumoniae Estreptococos

Streptococcus pyogenes Streptococcus salivarius Estafilococos

Staphylococcus aureus Staphylococcus albus Pseudomonas

Pseudomonas stutzen Neissérias

Neisseria meningitidis Neisseria gonorrhea 28 ΕΡ Ο 796 344 /ΡΤ

Enterobacteriáceas Escheríchía colí Aerobacteria aerogenes Klebsiella pneumoniae Salmonella typhosa Salmonella choleraesuis Salmonella typhimurium Shigellae dysenteriae Shigellae schmítzíí Shigellae arabinotarda Shigellae flexneri Shigellae boydii Shigellae sonnei Outros bacilos entéricos Proteus vulgaris Proteus mirabilis Proteus morgani Pseudomonas aeruginosa Alcaligenes faecalis Vibrio cholerae Grupo Hemófilos-Bordetelas Hemophilus influenza, H. Ducryi Hemophilus hemophilus Hemophilus aegypticus Hemophilus parainfluenzae Bordetella pertussis Pasteurelas Pasteurella pestis Pasteurella tulareusis Brucelas Brucella melitensis Brucella abortus

As bactérias coliformes

As Salmonellae

As Shigellae

Espécies de Proteus

Brucella suis 29 ΕΡ Ο 796 344 /ΡΤ

Bacilos Aeróbicos Formadores de Esporos Bacillus anthracis Bacillus subtilis Bacillus megaterium Bacillus cereus

Bacilos Anaeróbicos Formadores de Esporos Clostridium botulinum Clostridium tetani Clostridium perfringens Clostridium novyi Clostridium septicum Clostridium histolyticum Clostridium tertium Clostridium bifermentans Clostridium sporogenes

Micobactérias

Mycobacterium tuberculosis hominis Mycobacterium bovis Mycobacterium avium Mycobacterium leprae Mycobacterium paratuberculosis

Actinomicetos (bactérias tipo fungo) Actinomyces isaeli Actinomyces bovis Actinomyces naeslundii Nocardia asteroides Nocardia brasiliensis

As Espiroquetas

Treponema pallidum Treponema pertenue Treponema carateum Spirillum minus Streptobacillus moniliformis Borrelia recurrens Leptospira icterohemorrhagiae Leptospira canicola 30 ΕΡ Ο 796 344 /ΡΤ

Tripanassomas

Micoplasmas

Mycoplasma pneumoniae Outros patoqénios

Listeria monocytogenes Erysípelothríx rhusiopathiae Streptobacíllus moniliformis Donvanía granulomatis Bartonella bacillformls Ricketsias (parasitas tipo bactérias) Ríckettsía prowazekíí Rickettsia mooseri Ríckettsía rickettsii Rickettsia conori Rickettsia australís Rickettsia sibiricus Rickettsia akari Rickettsia tsutsugamushi Rickettsia burnetti Rickettsia quintana

Clamídias (parasitas bacterianos/virais inclassificáveis) agentes Chlamydia (denominação incerta)

Fungos

Cryptococcus neoformans Blastomyces dermatidis Histoplasma capsulatum Coccidioides immitis Paracoccidioides brasiliensis Candida albicans Aspergillus fumigatus

Mucor corymbífera (Absidia corymbifera)

Rhízopus oryzae

Rhizopus arrhizus Phycomycetes

Rhízopus nigricans

Sporotrichum schenkii

Flonsecaea pedrosoi

Fonsecaea compact 31 ΕΡ Ο 796 344 /ΡΤ

Fonsecacae dermatidis Cladosporium carríoní Phialophora verrucosa Aspergillus nidulans Madurella mycetomi Madurella grisea Allescheria boydii Phialophora jeanselmei Microsporum gypsum Tríchophyton mentagrophytes Keratinomyces ajelloi Microsporum canis Tríchophyton rubrum Microsporum adouini Vírus

Adenovírus

Herpesvírus

Herpes simplex Varicela (Chicken pox)

Herpes zoster (Shingles)

Vírus B

Citomegalovírus

Poxvírus

Varíola (smallpox)

Vaccinia Poxvírus bovís Paravaccinia Molluscum contagiosum Picornavírus Poliovírus Vírus Coxsackie Ecovírus Rinovírus Mixovírus

Influenza (A, B e C)

Parainfluenza (1-4) Vírus da papeira Vírus da Doença de Newcastle 32 ΕΡ Ο 796 344 /ΡΤ Vírus do sarampo Vírus da peste bovina (Rinderpest) Vírus da esgana canina Vírus sincicial respiratório Vírus da rubéola Arbovírus Vírus da encefalite equina Oriental Vírus da encefalite equina Ocidental Vírus Sindbis Vírus Chikugunya Vírus da floresta Semliki Vírus de Mayora Vírus da encefalite de St. Louis Vírus da encefalite da Califórnia vírus da febra da carraça do Colorado Vírus da febre amarela Vírus do Dengue

Reovírus

Reovírus tipos 1-3 Retrovírus Vírus da imunodeficiência humana (HIV) Vírus linfotrófico de células T humanas I & II (HTLV) Hepatite

Vírus da hepatite A

Vírus da hepatite B

Vírus da hepatite nãoA-nãoB

Hepatite, C, D, E Vírus Tumorais Vírus da leucemia de Rauscher Vírus Gross Vírus da leucemia de Maloney Virus dos papilomas humanos

Será entendido por um perito na arte que é geralmente necessário tratar amostras suspeitas de conter um determinado TNA de um tal modo de forma a produzir fragmentos que possam facilmente hibridar com o PNA. Pode ser necessário tratar a amostra de teste para efectuar a libertação ou para extrair o 33 ΕΡ Ο 796 344 /ΡΤ ΤΝΑ para hibridação, tal como expondo sangue ou outras células a um ambiente hipotónico, ou rompendo de outro modo a amostra utilizando meios mais vigorosos. Quando se pensa que o TNA está presente na forma de cadeia dupla, será naturalmente desejável separar as cadeias para tornar o TNA hibridável na forma de cadeia simples através de métodos bem conhecidos na arte, incluindo mas não se limitando a aquecimento ou exposição limitada a condições alcalinas que possam ser neutralizadas após a adição do pna de cadeia simples para permitir que a hibridação ocorra. Os métodos para preparação de alvos de ARN são bem conhecidos (ver Waterhouse, 1993; Mitchell, 1992) . A fragmentação de amostras de ácido nucleico contendo TNA é habitualmente necessária para diminuir a viscosidade da amostra e para aumentar a acessibilidade dos TNA aos PNA. Tal fragmentação é alcançada através de meios aleatórios ou específicos conhecidos na arte. Assim, por exemplo, nucleases especificas que se saiba cortarem com uma determinada frequência no genoma particular a analisar, podem ser utilizadas para produzir fragmentos de um tamanho molecular médio conhecido. Adicionalmente, outras nucleases, fosfodiesterases, exonucleases e endonucleases, fragmentação fisica e ultra-sons são todos métodos possíveis para este fim. Estes processos são bem conhecidos na arte. A utilização de enzimas de restrição para fins de fragmentação do ADN é geralmente preferida. No entanto, o ADN pode também ser fragmentado através de uma variedade de meios químicos tais como a utilização dos seguintes tipos de reagentes: EDTA-Fe(ll) (de acordo com Stroebel et al., J. Am. Chem. Soc. 110: 792 7, 1988; Dervan, Science 232: 464, 1986); Cu(II)- fenantrolina (de acordo com Chen e Sigman, Science 231: 1197, 1987); enzima de restrição de classe IIS (de acordo com Kim et al., Science 240: 504, 1988); ADNase híbrida (de acordo com Corey et al., Biochem. 28: 8277, 1989); bleomicina (de acordo com Umezawa et al., J. Antibiot. (Tokyo) Ser. A. 19: 200, 1986); neocarzinostatina (Goldberg et al., "Second Annual Bristol-Myers Symposium in Câncer Research", Academic Press, New York, pág. 163, 1981); e metidiumpropil-EDTA-Fe(II) (de acordo com Hrtzberg et al., J. Am. Chem. Soc. 104: 313, 1982). A remoção de proteínas, como através do tratamento com uma protease, é também geralmente desejável e os métodos para 34 ΕΡ Ο 796 344 /ΡΤ efectuar a remoção das proteínas de amostras de ácidos nucleicos, sem perda apreciável de ácido nucleico, são bem conhecidos na arte.

Os TNA do presente invento devem ser suficientemente longos para que exista uma quantidade suficiente de híbrido de cadeia dupla a flanquear a TBR de modo a que um TBA se possa ligar sem ser perturbado pelas extremidades dos fragmentos não ligados. Tipicamente, são utilizados fragmentos no intervalo de cerca de 10 nucleótidos a cerca de 100 000 nucleótidos, e de preferência no intervalo de cerca de 20 nucleótidos a cerca de 1000 nucleótidos como tamanho médio para fragmentos de TNA. Exemplos de sequências específicas de TNA que podem ser

detectadas são sequências complementares às sequências de PNA aqui descritas para a detecção de sequências de ácido nucleico celulares normais, celulares anormais (como em oncogenes activados, genes estranhos integrados, genes geneticamente deficientes) e específicas de patogénios, para as quais são conhecidas proteínas de ligação a ácido nucleico específicas, ou que podem ser produzidas de acordo com métodos descritos nesta divulgação. Com referência à Figura 7, um TNA relacionado com HIV específico é mostrado como SEQ ID NO:37. 4. Extensões do PNA utilizando BNA, sua preparação e amplificação do sinal. Sob condições de hibridação, podem ser adicionados BNA que hibridam com os PNA, híbridos PNA-BNA, BNA e/ou híbridos BNA-BNA. As adições acima mencionadas podem ser feitas de um modo polimérico não vectorial ou de um modo vectorial, com uma ordem conhecida de BNA.

Com referência à Figura 2a, é apresentado um reforço simples. Um polímero de reforço é produzido através da adição de dois BNA, ilustrados na Figura 2a (Ib e Ic), que quando combinados sob condições de hibridação com o PNA, formam os híbridos PNA-BNA-BNA, constituídos pelo PNA e pelas "extensões de reforço", ilustrados na Figura 2a (lia, Ilb, IIc e Ild) deixando pelo menos uma sequência de 1/2 bbr desemparelhada. Cada sequência de 1/2 BBR desemparelhada, ilustrada na Figura 2a (lia, Ilb, IIc e Ild), pode hibridar com BNA adicionais para formar extensões de "reforço" adicionais. Cada sequência de 1/2 BBR desemparelhada, ilustrada na Figura 2a (lia, Ilb, IIc e Ild) pode hibridar com HNA adicionados, 35 ΕΡ Ο 796 344 /ΡΤ ilustrados na Figura 2a (Illa e Illb). A hibridação dos HNA, que não podem hibridar com BNA adicionais, actua "rematando" da adição dos BNA no PNA, tal como ilustrado na Figura 2a (iva, ivb, ivc e ivd).

Com referência à Figura 2b, é possível controlar e especificar a ordem e os componentes das extensões do PNA. Se for necessária uma única BBR, um HNA contendo a sequência complementar à 1/2 BBR no PNA é adicionado ao PNA para produzir uma única BBR e para "rematar" evitando quaisquer extensões de "reforço" no PNA. Se houver BBR adicionais a adicionar ao PNA, pode ser alcançada uma extensão controlada do PNA.

Com referência à Figura 2b, é apresentado um reforço simples. A extensão polimérica vectorial é alcançada através da adição de um BNA que seja especifico para o PNA, tal como ilustrado na Figura 2b (Ia e lia), que quando combinado sob condições de hibridação com o PNA, forma híbridos pna-bna-BNA, constituídos pelo PNA e extensões de "reforço". Estas extensões, se marcadas com um OSA, proporcionam um método para amplificar grandemente qualquer sinal produzido após a ligação de um PNA a um TNA na amostra. Para além disso, através da ligação de ΒΒΑ marcados às BBR do polímero, é alcançada uma amplificação adicional.

Qualquer um de vários métodos pode ser utilizado para preparar os BNA, incluindo, p.ex., síntese através de química conhecida ou através de métodos de produção de ADN recombinante. No último método, pode ser produzido um número essencialmente ilimitado de BNA de modo simples e económico, por exemplo, através da produção em procariotas (E. colí por exemplo) de um ADN plasmídico possuindo múltiplas repetições das sequências de BNA específicas flanqueadas por locais de restrição possuindo extremidades soltas. Deste modo, por exemplo, os locais operadores esquerdo ou direito do bacteriófago lambda, ou qualquer outro ADN ou outras sequências de ácido nucleico que se saiba ligarem-se especificamente e fortemente a um determinado BBA, tal como uma proteína de ligação a ADN ou ARN, podem ser produzidas num número de cópias essencialmente ilimitado, com cada cópia flanqueada por um EcoRI, PstI, Bamtil ou qualquer um de vários 36 ΕΡ Ο 796 344 /ΡΤ outros locais de nucleases de restrição vulgares. Alternativamente, um polímero em locais repetidos pode ser excisado através de locais de restrição únicos não presentes dentro do polímero. Grandes quantidades de plasmídeo pBR322, pUC ou outro plasmídeo possuindo múltiplas cópias destas sequências são produzidas através de métodos bem conhecidos na arte, o plasmídeo é cortado com a enzima de restrição flanqueando o local polimerizado e as múltiplas cópias libertadas dos operadores são isoladas através de cromatografia ou de quaisquer outros meios convenientes conhecidos na arte. 0 BNA, antes da utilização, é então separado da cadeia e é então passível de polimerização sobre um PNA codificando uma cópia complementar de cadeia simples do operador como uma 1/2 BBR. Os BNA podem ser polimerizados vectorialmente sobre o PNA através da utilização de diferentes enzimas de restrição para flanquear cada repetição do polímero no plasmídeo utilizado para produzir múltiplas cópias do BNA. Alternativamente, o polímero de BNA pode ser hibridado com o PNA através de extremidades soltas numa ou em ambas as extremidades do polímero de BNA, sem necessidade de separar as cadeias e de hibridar cada segmento de BNA. Exemplos de sequências de BNA específicas são proporcionados acima na secção intitulada Descrição das Sequências, como SEQ ID NO:35-36. Para estabilizar o polímero de BNA, pode ser utilizada ADN-ligase para ligar de modo covalente os BNA hibridados. 5. Os Ácidos Nucleicos em "gancho de cabelo" (HNA) e sua preparação. Os HNA aqui descritos compreendem pelo menos duas partes principais unidas uma à outra: Uma sequência de cadeia simples, que é complementar a uma 1/2 BBR, e uma região de ácido nucleico de cadeia dupla formada, sob condições de hibridação, pela auto-associação de sequências auto-complementares dentro do HNA. Com referência à Figura 1 (IIc) dos desenhos, a 1/2 BBR no HNA pode ser construída de modo a ser complementar à 1/2 BBR no PNA. Com referência à Figura 1 (I, IIc e IIIc) dos desenhos, o HNA acima mencionado, quando adicionado ao PNA sob condições de hibridação, forma um híbrido PNA-HNA contendo uma BBR. Com referência à Figura 1 (IIIc, IVc e Vc) dos desenhos, um híbrido PNA-HNA, sob condições de hibridação, após a adição do TNA, pode formar um híbrido TNA-PNA-HNA contendo uma TBR e uma BBR. 37 ΕΡ Ο 796 344 /ΡΤ

Com referência à Figura 2a e 2b, os HNA podem ser utilizados para "rematar" ou terminar a adição de extensões de BNA ao PNA. Os dois BNA da Figura 2a (Ib e Ic) podem associar-se para formar o híbrido mostrado na Figura 3(ivb) ou podem hibridar directamente e individualmente com o PNA tal como ilustrado na Figura 2a (Ia-c, Ila-d) . Os dois HNA (mostrados na Figura 2a (Illa e Illb)) podem terminar a hibridação do BNA com outros BNA que se estendem do PNA, tal como ilustrado na Figura 2a (iva-d). 0 HNA na Figura 2a (Illa) pode terminar os híbridos PNA-BNA mostrados na Figura 2a (Ilb e Ild) e qualquer híbrido PNA-BNA com uma 1/2 BBR de cadeia simples que seja complementar à 1/2 BBR no HNA ilustrado na Figura 2a (Illa) . De modo semelhante, o HNA na Figura 2a(IIIb) pode terminar os híbridos PNA-BNA mostrados na Figura 2a (lia e lie) e qualquer híbrido PNA-BNA com duas 1/2 BBR de cadeia simples que sejam complementares às 1/2 BBR no HNA ilustrado na Figura 2a(IIIb). São construídos HNA que terminarão os híbridos PNA-BNA que são construídos a partir da adição sequencial de BNA ao PNA tal como ilustrado na Figura (2b). As sequências de cadeia simples de 1/2 BBR ilustradas na Figura 2b (Ia, Illa, Va e Vila) são especificamente complementares às sequências de 1/2 BBR de cadeia simples ilustradas na Figura 2b (Ib, Illb, Vb e VIIb) e produzem os híbridos PNA-BNA-HNA rematados únicos ilustrados na Figura 2b (Ic, IIIc, Vc e VIIc).

As sequências auto-complementares no HNA e a sequência de volta que se liga às sequências em "gancho de cabelo" auto-complementares podem ser de qualquer composição e comprimento, desde que não impeçam substancialmente nem inibam a apresentação da 1/2 BBR de cadeia simples que compreende parte do HNA pelo HNA ou se liguem selectivamente ao BBA ou ao TBA. As sequências de volta devem ser seleccionadas de modo a que a formação da volta não impeça a formação do "gancho de cabelo". Um exemplo de um HNA útil neste pedido é proporcionado como SEQ ID NO:44 (ver Descrição das Sequências acima). 6. Os Conjuntos de Ligação ao Alvo (TBA) e sua preparação. Um TBA pode ser qualquer substância que se liga a uma determinada TBR formada através de hibridação de determinados TNA e PNA, desde que o TBA tenha pelo menos os seguintes atributos: 38 ΕΡ Ο 796 344 /ΡΤ a) Ο ΤΒΑ tem de se ligar à(s) TBR de um modo que seja altamente específico para a(s) TBR de interesse. Isto é, o TBA tem de discriminar entre as TBR presentes no híbrido TNA-PNA e sequências dúplex semelhantes formadas por híbridos PNA-CNA. O TBA tem de se ligar ao híbrido PNA-CNA com uma avidez suficientemente baixa para que após lavagem do complexo TBA-TNA-PNA, o híbrido PNA-CNA seja deslocado e o híbrido PNA-TNA não seja deslocado; b) 0 TBA tem de se ligar de forma ávida à(s) TBR criada (s) através da hibridação do TNA com o PNA. Afinidades de ligação no intervalo de 1CT5 a cerca de 10~12 ou mais são geralmente consideradas suficientes. Tal como observado abaixo, nalguns casos pode ser desejável utilizar um determinado TBA que possua uma avidez muito baixa para uma determinada TBR, mas que possua uma afinidade muito maior quando é proporcionada uma determinada configuração de múltiplas TBR de modo a que o quadrado da afinidade do TBA para cada TBR se torne a afinidade relevante para esse TBA em particular.

Exemplos de componentes de ligação ao ADN úteis na formação dos TBA incluem, mas não se limitam a NF-kB, proteína E2 do vírus do papiloma, factor de transcrição SP1, enzimas de restrição inactivas, anticorpos, etc. Foi reconhecido na arte que cada uma destas proteínas contém sequências que se ligam a determinadas sequências de ácido nucleico e as afinidades destas interacções são conhecidas. Naturalmente, o método do presente invento não se limita à utilização destas proteínas de ligação ao ADN conhecidas ou a fragmentos destas. A partir da presente divulgação, será aparente para um vulgar perito na arte que o presente método pode facilmente ser aplicado à utilização de novos TBA exibindo pelo menos os atributos necessários observados acima. Assim, por exemplo, em WO 92/20698, foi descrita uma molécula de ligação ao ADN específica da sequência compreendendo um conjugado oligonucleotídico formado pela ligação covalente de um fármaco de ligação ao ADN a um oligonucleótido formando um tríplex. O método dessa divulgação podia ser utilizado para produzir novos TBA para utilizar de acordo com a presente divulgação, desde que os TBA assim formados verificassem os critérios descritos acima. Adicionalmente, os métodos das Patentes U.S. 5 096 815, 5 198 346 e WO 88/06601, podem ser 39 ΕΡ Ο 796 344 /ΡΤ utilizados para criar novos TBA para utilizar de acordo com o método deste invento. Podem ser utilizados anticorpos específicos ou porções destes (ver por exemplo Blais, 1994).

Quando o TBA é uma proteína, ou um complexo de proteínas, será reconhecido que pode ser utilizado qualquer um de vários métodos de rotina na arte para produzir o TBA. 0 TBA pode ser isolado a partir do seu ambiente natural ou, se isto for impraticável, produzido através de técnicas padrão de biologia molecular. Assim, utilizando NF-kB como exemplo, utilizando as porções de ligação ao ADN das subunidades p50 ou p65, este conjunto de ligação pode ser produzido de acordo com métodos recombinantes conhecidos na arte (ver por exemplo Ghosh, Cell 62: 1019-1029, 1990, que descreve a clonagem da subunidade de ligação ao ADN p50 de NF-kB e a homologia dessa proteína com rei e dorsal). São conhecidas muitas proteínas de ligação ao ADN e a outros ácidos nucleicos que podem ser utilizadas como ou em TBA de acordo com este invento. Uma vez conhecida a sequência de aminoácidos de qualquer proteína de ligação a ADN, ARN:ADN, ARN ou outro ácido nucleico, uma sequência de ADN apropriada codificando a proteína pode ser preparada através de meios sintéticos ou pode ser utilizada uma cópia de ADNc do ARNm codificando a proteína a partir de uma fonte de tecido apropriada. Para além disso, podem ser obtidas cópias genómicas codificando a proteína e os intrões serem removidos de acordo com métodos conhecidos na arte. Para além disso, os TBA podem ser quimicamente sintetizados.

Uma vez obtida uma sequência de codificação apropriada, pode ser utilizada mutagénese dirigida ao local para alterar a sequência de aminoácidos codificada para produzir proteínas de ligação ao ácido nucleico mutantes exibindo características de ligação mais desejáveis que as da proteína de ligação ao ácido nucleico original. Como exemplo deste processo, a sequência de aminoácidos das porções de ligação ao ADN de NF-kB podem ser alteradas de forma a produzir uma molécula NF-kB' que se liga de forma mais forte ao local de ligação de NF-kB (ver exemplos abaixo Hiv-Detect e Hiv-Lock). 40 ΕΡ Ο 796 344 /ΡΤ

Para proporcionar uma melhor perspectiva deste aspecto do presente invento, deve-se observar as seguintes considerações. Utilizando NF-kB como exemplo, pode ser preparado um TBA utilizando a molécula NF-kB de ocorrência natural. No entanto, como esta molécula está presente em quantidades pequenas e decrescentes nas células e como as subunidades desta proteína de ligação ao ADN foram clonadas, seria mais razoável preparar grandes quantidades do complexo através de meios de ADN recombinante tal como foi já alcançado para esta proteína (ver por exemplo Ghosh, Cell 62: 1019-1029, 1990). NF-kB é um indutor pleiotrópico de genes envolvidos em respostas imunitárias, inflamatórias e reguladoras do crescimento a confrontos patogénicos primários (virais, bacterianos ou de stress) ou a confrontos patogénicos secundários (citoquinas inflamatórias). NF-kB é uma proteína de ligação ao ADN dimérica compreendendo uma subunidade p50 e uma p65, ambas as quais contactam e ligam-se a sequências de ADN específicas. Num estado inactivado, NF-kB reside no citoplasma celular, complexado com um inibidor específico, 1-kB, para formar um heterodímero citoplasmático. Após activação, o inibidor é descomplexado e o dímero p50-p65 relocaliza-se através de um sinal de localização nuclear (NLS) específico no núcleo celular onde se pode ligar ao ADN e efectuar o seu papel como activador da transcrição de numerosos genes (ver Grimm e Baeuerle, Biochem. J. 290: 297-308, 1993, para uma revisão do estado da arte em relação a NF-kB). O dímero p50-p65 liga-se com uma afinidade picomolar a sequências correspondentes à de consenso GGGAMTNYCC (SEQ ID NO:117), com afinidades ligeiramente diferentes dependendo da sequência exacta. Deve notar-se que se observou também a ocorrência de homodímeros de p50 e p65. Estes homodímeros apresentam propriedades bioquímicas diferentes bem como afinidades ligeiramente diferentes das sequências de ligação dentro e semelhantes à de consenso acima. Assim, dependendo das características de ligação desejadas do TBA, pode ser utilizado um heterodímero p50-p65, um homodímero p50-p50 ou um homodímero p65-p65 ou fragmentos dos dímeros acima mencionados.

Um modo pelo qual podem ser produzidos vários novos TBA é mostrado esquematicamente na Figura 9. As unidades de 41 ΕΡ Ο 796 344 /ΡΤ reconhecimento dos ácidos nucleicos do TBA podem ser montadas e associadas a unidades de reconhecimento de ácidos nucleicos de TBA semelhantes ou diferentes através de um "acompanhante". 0 acompanhante é uma estrutura na qual são construídos os vários elementos de reconhecimento do TBA e que confere propriedades desejáveis nas unidades de reconhecimento dos ácidos nucleicos. 0 acompanhante é constituído por qualquer sequência que proporcione sequências de montagem de modo a que as mesmas ou diferentes unidades de reconhecimento dos ácidos nucleicos sejam colocadas em íntima e estável associação umas com as outras. Assim, por exemplo, no caso de um TBA desenhado para ligar fortemente a TBR de NF-kB, um TBA é montado proporcionando sequências cro de lambda como sequências de montagem, ligadas às sequências de ligação ao ácido nucleico para p50 ou p65 de NF-kB. As sequências de ligação ao ácido nucleico de p50 ou p65 são ligadas às sequências cro no terminal carboxilo ou amino de cro e no terminal carboxilo ou amino da unidade de reconhecimento do ácido nucleico da p50 ou p65. Sequências de ligação são opcionalmente proporcionadas para permitir o espaçamento apropriado das unidades de reconhecimento do ácido nucleico para uma óptima ligação à TBR.

As sequências de montagem, exemplificadas acima pelas sequências cro e Cl (SEQ ID NO:104-108), compreendem quaisquer oligopéptidos estáveis que se liguem naturalmente e fortemente a sequências semelhantes. Assim, no caso de cro, é bem conhecido que um dímero de cro se liga aos locais operadores do bacteriófago lambda (Anderson et al.r Nature 290: 754-758, 1981; Harrison e Aggarwal, Ann. Rev. Biochem. 59: 933-969). As unidades monoméricas de cro associam-se de forma apertada e específica umas às outras. Assim, através da ligação de sequências de unidades de reconhecimento de ADN às sequências cro, é alcançada uma associação íntima e apertada.

As sequências ligantes opcionais compreendem qualquer sequência de aminoácidos que não interfira com a montagem do TBA ou a ligação ao ácido nucleico, e que não seja instável de modo a libertar a unidade de reconhecimento do ácido nucleico do TBA completo. É desejável mas não necessário que as sequências ligantes sejam covalentemente ligadas a outros componentes do conjunto de ligação. A associação deve ser 42 ΕΡ Ο 796 344 /ΡΤ específica de modo a ajudar na montagem e fabrico dos conjuntos de ligação. Exemplos de tais sequências incluem, mas não se limitam a, sequências tão bem conhecidas como as verificadas a ligar vários domínios em proteínas estruturais. Assim, por exemplo, na proteína repressora de lambda, existe uma sequência ligante entre o domínio de ligação ao ADN e o domínio de dimerização que é útil para este fim. São conhecidas muitas outras destas sequências e a sequência exacta destas não é crítica para este invento, desde que seja conduzida experimentação de rotina para assegurar a estabilidade e a não interferência com a ligação ao ácido nucleico alvo. Exemplos de tais sequências são aqui proporcionados como Met Ser e SEQ ID NO:99-102. A inserção de locais de proteólise específicos conhecidos nestes ligantes é também uma parte integral deste invento. A presença de tais locais nas sequências ligantes proporcionará vantagens de fabrico, permitindo que moléculas diferentes sejam montadas na estrutura de acompanhamento.

Para além das unidades de reconhecimento do ácido nucleico, sequências de ligação opcionais e sequências de montagem, os novos TBA deste invento possuem opcionalmente sequências de TNA de assimetria ou PILOTO e uma ou mais unidades OSA. As sequências de assimetria são proporcionadas para favorecer ou prevenir determinadas associações desejáveis ou indesejáveis. Por exemplo, no caso de se desejar que um TBA possua unidades de reconhecimento de ADN de p50 homodiméricas, as sequências de assimetria são proporcionadas para destruir a associação naturalmente mais forte das subunidades p50 e das subunidades p65 de NF-kB, ao mesmo tempo que não destrói as sequências de montagem que mantêm as subunidades p50 juntas. Exemplos de tais sequências são aqui proporcionados como SEQ ID NO:85-92 e SEQ ID NO:105 e 106.

Numa configuração diferente, sequências da subunidade p50 de NF-kB são colocadas em íntima associação com sequências da unidade de reconhecimento de ADN do factor de transcrição SPl. Isto é desejável no caso de um motivo de ligação a NF-kB/SPl ser significativo, como na LTR de HIV onde se sabe existir um motivo de pelo menos seis locais de reconhecimento da proteína de ligação ao ADN, dois NF-kB, três SPl e um local TATA. Uma vez que se sabe também que o segundo local NF-kB e o primeiro 43 ΕΡ Ο 796 344 /ΡΤ SPl são significativos para a regulação da transcrição do HIV (Perkins et ai., EMBO J. 12: 3551-3558, 1993), esta configuração particular de TBA é útil não apenas na detecção de Hiv, mas como terapêutico ou profilático contra a infecção de HIV (ver abaixo). Do mesmo modo, a região de controlo longa (LCR) do virus do papiloma humano pode ser utilizada como região de controlo chave para sondar de acordo com este método.

Tendo em vista os diferentes elementos que podem ser associados, em modo de cassete, de acordo com este método de formação do TBA, é produzida uma variedade essencialmente ilimitada de TBA. Na Figura 10, é exemplificada uma série de moléculas diferentes, referida como "Hiv-detect I-IV" em que "CHAP" denomina o acompanhante, "nfkb" denomina subunidades de NF-kB, "spl" denomina a unidade de reconhecimento do ácido nucleico do factor de transcrição SPl e "TATA" denomina um dimero da unidade de reconhecimento de ADN de uma proteína de ligação ao ADN na sequência TATA (TBP), também conhecida como proteína de ligação a TATA ou TBP. Estas configurações são ainda exemplificadas abaixo e são todas partes integrais do presente invento.

Ainda noutra concretização, a estrutura modular mostrada na Figura 9 é adaptada à detecção e/ou ao tratamento ou profilaxia de um patogénio completamente diferente. Na Figura 11, de um modo semelhante ao das moléculas "HIV-detect I-IV" acima descritas, é produzida uma série de moléculas "HPV-Detect I-IV". Nesta concretização é tirada vantagem das propriedades de ligação ao ADN da proteína E2 do vírus do papiloma humano (HPV). Adicionalmente, é tirado partido dos papéis de SPl e TBP proporcionando unidades de reconhecimento de ADN específicas adaptadas para se ligarem a estas sequências no genoma de HPV. Na formação de TBA específicos de E2 para utilizar na detecção de infecção de HPV, pode ser desejável utilizar qualquer uma de SEQ ID NO:75-84 ou 93-98 como unidades de reconhecimento do ADN de E2. Um TBA contendo um domínio de ligação ao ADN do dimero de E2 bovino e do dimero de E2 humano pode ser particularmente útil.

As várias sequências descritas acima podem ser quimicamente ligadas utilizando materiais de partida 44 ΕΡ Ο 796 344 /ΡΤ oligopeptídicos puros ou podem ser ligadas através do fornecimento de ácidos nucleicos recombinantes codificando, através do bem conhecido código genético, os vários sub- elementos. No caso da produção recombinante, a ligação de sequências de codificação cro a sequências de unidades de reconhecimento do ácido nucleico para formar TBA é vantajosa porque não só cro actua como sequências de montagem no acompanhante como também actua a dirigir a dobragem correcta dos elementos de reconhecimento do ácido nucleico. Sequências exemplificativas para acompanhantes são aqui proporcionadas como SEQ ID NO:104-108. Para além disso, no caso de serem desejadas estruturas de ordem superior compreendendo múltiplos locais de ligação, como num TBA pentamérico NF-kB/NF-kB/ SPl/SPl/SPl, o desenho correcto das sequências de assimetria permite que tais estruturas sejam feitas.

Do modo antecedente, são preparados TBA que se ligam aos seus locais de ligação cognatos com elevada afinidade. Por exemplo, espera-se que os componentes de ligação ao ADN de NF-kB dos TBA da Figura 10 se liguem à LTR de HIV com uma afinidade de entre cerca de 1CT8 e IO”12 molar. Sequências úteis como unidades de reconhecimento do ADN são proporcionadas como SEQ ID NO:63-71, 73-84, 93-98 e 104-108 e exemplificadas mais abaixo.

Tendo em vista a descrição antecedente da montagem dirigida das proteínas de ligação ao ácido nucleico utilizando sequências de montagem e assimetria (ou pilotagem), os peritos na arte reconhecerão que é proporcionado por este invento um método geralmente aplicável para montagem de estruturas proteicas. A generalidade deste método é ainda demonstrada pela consideração, como outro exemplo, da utilização de uma interacção anticorpo-epítopo na montagem de estruturas desejadas. Por meio da especificidade, uma estrutura proteica de ligação ao ADN pode ser montada através da ligação de uma subunidade p50 de NF-kB a um antigénio, tal como uma hormona estimuladora dos melanócitos (MSH) circularizada (através de ligações dissulfureto). Esta pró molécula MSH pode então ser ligada através de um anticorpo anti-MSH para proporcionar um novo conjunto de ligação ao ácido nucleico, com o antigénio e o anticorpo a actuar como sequências de montagem. 45 ΕΡ Ο 796 344 /ΡΤ A estrutura modular proporcionada pela Figura 9 revela que pode ser montada uma grande variedade de TBA utilizando diferentes combinações dos componentes. Assim, são proporcionadas concretizações representativas desta estrutura geral como SEQ ID NO:109-116. 7. Os Conjuntos de Ligação de Reforço (BBA) e sua preparação. Um BBA pode ser qualquer substância que se ligue a uma determinada bbr formada através da hibridação de determinados PNA e BNA, incluindo quando múltiplos ΒΝΑ (até e incluindo "n" BNA, i.e., BNAn, em que "n" é teoricamente 0-°°, mas na prática está entre 1 e 100) são polimerizados sobre o PNA para amplificação do sinal, desde que o BBA tenha pelo menos os seguinte atributos: a) O BBA tem de se ligar às BBR de um modo que seja altamente especifico para a BBR de interesse. Isto é, o BBA tem de discriminar entre as BBR presentes no híbrido PNA-BNA e sequências dúplex semelhantes em híbridos BNA-CNA ou outros CNA. Assim, mesmo quando ocorre apenas um único emparelhamento errado de bases ou diferenças conformacionais com ou sem emparelhamentos errados de bases na produção do híbrido PNA-BNAn ou PNA-BNAn-HNA, o BBA tem de se ligar ao híbrido com uma avidez suficientemente baixa para que após lavagem do complexo TBA-TNA-PNA-BNAn, o BBA seja deslocado das sequências de CNA mas não das sequências de BBR. b) O BBA tem de se ligar avidamente à(s) BBR(s) . Afinidades de ligação no intervalo de 10“5 a cerca de 10“9 ou mais são geralmente consideradas suficientes.

Exemplos de BBA incluem, mas não se limitam a cro e à proteína repressora do bacteriófago lambda, Cl. Adicionalmente, ver Patente U.S. 4 556 643, que sugere outras sequências de ADN e proteínas de ligação específicas tais como repressores, histonas, enzimas modificadoras do ADN e a proteína activadora de genes de catabolitos. Ver também EP 0453301, que sugere uma variedade de proteínas de ligação específicas da sequência nucleotídica (NSSBP) tais como o repressor da tetraciclina, o repressor lac e o repressor do triptofano. Foi reconhecido na arte que cada um destes BBA se liga a determinadas sequências de ácido nucleico conhecidas e as afinidades destas interacções são conhecidas. Naturalmente, 46 ΕΡ Ο 796 344 /ΡΤ ο método do presente invento não se limita à utilização destes BBA conhecidos. A partir da presente divulgação, um perito na arte pode facilmente aplicar a utilização de novos BBA exibindo pelo menos os atributos necessários observados acima no presente método.

Exemplos de novos BBA úteis de acordo com este aspecto do presente invento incluem novas proteínas com base no motivo de uma proteína de ligação a ADN ou ARN ou ADNrARN conhecida tal como cro ou a proteína repressora de λ Cl. De preferência, tais modificações são feitas para melhorar o manuseamento destes componentes do presente invento. Assim, pode ser desejável adicionar uma elevada concentração de cro a um ensaio. Uma das qualidades negativas de cro é que a elevadas concentrações, a ligação de cro ao seu alvo de ADN entra em competição com interacções cro-cro. Assim, por exemplo, pode ser produzida uma cro acompanhada ou mutada que não possua este inconveniente. Exemplos de tais acompanhantes alterados são SEQ ID NO:105-106 e 108. Métodos conhecidos na arte, tais como a produção de novas proteínas de ligação utilizando populações variegadas de ácidos nucleicos e selecção de bacteriófagos que se ligam a determinados alvos pré-seleccionados (i.e., a designada tecnologia de apresentação de fagos, ver discussão acima para a produção de novos TBA) podem ser utilizados para produzir tais novos BBA bem como os novos TBA acima mencionados.

Quando o BBA é uma proteína ou um complexo de proteínas, será reconhecido que qualquer um de vários métodos de rotina na arte pode ser utilizado para produzir o BBA. O BBA pode ser isolado a partir do seu ambiente natural ou, se isto for impraticável, produzido através de técnicas padrão de biologia molecular. Assim, por exemplo, a sequência da proteína cro é conhecida e qualquer clone molecular do bacteriófago lambda pode ser utilizado para obter os ácidos nucleicos apropriados codificando cro para produção recombinante desta. Adicionalmente, os TBA aqui descritos podem ser utilizados como BBA, desde que sejam utilizados TBA diferentes para se ligarem a TBR e BBR. 8. A utilização de BBA e BBR para localizar e amplificar a localização dos complexos PNA-TNA-TBA (ver Figura 8) . Numa concretização deste invento, a ligação altamente específica e extremamente forte dos TBA constituídos por componentes de ligação ao ácido nucleico é utilizada para produzir um ensaio 47 ΕΡ Ο 796 344 /ΡΤ em sanduíche de ácidos nucleicos amplificável. De acordo com um aspecto desta concretização, um suporte sólido é revestido com um primeiro TBA criando um TBA imobilizado. Em solução, um PNA e um tna são postos em contacto sob condições de hibridação e depois postos em contacto com o TBA imobilizado. Apenas as interacções PNA-TNA que formam a TBR específica reconhecida pelo TBA imobilizado são mantidas após a lavagem da superfície sólida que se liga ao complexo TBA-TBR. A detecção da TBR ligada é alcançada através da ligação de Ácidos Nucleicos de Reforço, BNA, às 1/2 BBR presentes nos PNA sob condições de hibridação. Deste modo, mesmo que apenas se ligue um único complexo TBA-TBR ao TBA imobilizado, pode ser produzido um grande sinal amplificado através da polimerização de múltiplos BNA no TNA imobilizado. Cada BNA que se liga ao TNA forma uma BBR que se pode ligar através de BBA que, tal como os TBA imobilizados na superfície sólida, podem ser escolhidos pela sua ligação muito forte e específica a determinadas estruturas de ácido nucleico. Assim, de acordo com esta concretização, o TBA imobilizado pode conter a porção de ligação ao ADN de NF-kB, que se liga de forma muito específica e forte aos locais de ligação de NF-kB formados após hibridação do TNA e PNA para formar um tal local.

Porque é bem conhecido que existem locais de ligação de NF-kB tanto no genoma humano normal como nas repetições terminais longas do vírus da imunodeficiência humana (HIV), este invento proporciona um método de discriminar entre os locais humanos "normais" e os locais presentes em células devido a infecção de HIV. Portanto, num teste desenhado para determinar a presença ou ausência de ADN de HIV numa amostra de ADN humano, os locais de ligação de NF-kB de HIV podem ser vistos como o TNA e os locais de ligação de NF-kB humanos normais podem ser vistos como CNA. De acordo com o método deste invento, a discriminação entre estes TNA e CNA é alcançada tirando vantagem do facto de na LTR de HIV existirem dois locais de ligação de NF-kB, seguidos de três locais de SPl (ver, por exemplo, Koken et al., Virology 191: 968-972, 1992), enquanto que locais de ligação de NF-kB celulares com as mesmas sequências não se verificam em cadeia. 48 ΕΡ Ο 796 344 /ΡΤ

Em casos onde ο ΤΝΑ contém mais de uma 1/2 TBR e é desejável perseguir as aplicações terapêuticas e profiláticas dos TBA, pode ser desejável utilizar mais de um TBA, cada um com a capacidade de se ligar a um tbr no complexo TNA-PNA. Neste caso, pode ser vantajoso seleccionar, como componentes dos TBA, dominios de ligação ao ADN ou de ligação ao ARN com menor afinidade para a sua TBR que o domínio de ligação ao ADN ou de ligação ao ARN de tipo selvagem. Dado que os TBA que estão envolvidos na ligação a múltiplas TBR se podem montar antes da ligação às suas TBR ou montar após a ligação às suas TBR, os TBA individuais não bloquearão as correspondentes TBR nos outros genomas para além do genoma alvo a menos que as TBR sejam espacialmente capazes de se ligar ao complexo de TBA montado. Uma característica da montagem multimérica de TBA que é especificamente reivindicada aqui como parte deste invento é que se espera que uma tal montagem multimérica tenha uma afinidade muito reduzida para um único local dentro do TNA. No entanto, uma vez que a ligação é dramaticamente aumentada relativamente a qualquer TBA, esperar-se-ia que o complexo de TBA não competisse pela ligação a qualquer TBR única com as proteínas nativas correspondentes in situ mas se ligasse fortemente a sequências no híbrido PNA-TNA contendo as TBR para cada um dos componentes de ligação ao ácido nucleico montados no TBA. 0 complexo de TBA deve ser montado e os ligantes ajustados nos TBA individuais de forma a permitir que as regiões de ligação ao ácido nucleico contidas no complexo de TBA alcancem e se liguem simultaneamente a estes alvos.

Uma vez formados os híbridos TNA-PNA e colocados em contacto com o TBA imobilizado, o ácido nucleico não ligado é lavado da superfície imobilizada e os híbridos imobilizados são detectados. Isto é alcançado através de um de vários modos. Num aspecto deste invento, o PNA é marcado com um OSA, tal como um radionuclido, esferas coloridas ou uma enzima capaz de formar um produto de reacção colorido. Para além disso, para além de possuir uma ou mais 1/2 TBR, o PNA pode também conter pelo menos uma 1/2 BBR. As sequências de 1/2 bbr são escolhidas de forma a serem complementares a sequências de 1/2 BBR únicas nos BNA. Na concretização descrita acima, por exemplo, onde o TBA é NF-kB e a TBR formada após hibridação TNA-PNA é um ou mais locais de ligação de NF-kB, a 1/2 BBR pode proporcionar sequências que podem hibridar (isto é, de 49 ΕΡ Ο 796 344 /ΡΤ cadeia simples e complementares) dos operadores esquerdo e direito do bacteriófago lambda (ver, por exemplo, Ptashne, Scientific American 247: 128-140, 1982, e referências ai citadas para sequências destes operadores). Estas podem ser polimerizadas sobre as 1/2 BBR do PNA de um modo vectorial (ver Figuras 2 e 3) proporcionando até "n" BBR e cada BBR forma um local de ligação cro. A cro marcada enzimaticamente, radioactivamente ou de outro modo é colocada em contacto com o complexo TBA-TNA-PNA-(BNA)n. Deste modo é produzido um sinal altamente selectivo e amplificado. O sinal produzido utilizando um PNA possuindo uma única 1/2 TBR indica o sucesso do ensaio em alcançar a ligação TBA-TBR e a polimerização dos BNA para produzir o sinal a partir de locais celulares (i.e., a partir de CNA). A ausência de sinal quando é utilizado um TBA dimerizado indica que no TNA não havia LTR de HIV uma vez que não estavam presentes locais de ligação duplos de NF-kB. Por outro lado, a presença de sinal utilizando o dímero de NF-kB indica infecção de HIV. Como exemplo específico da descrição antecedente desta concretização do presente invento, ver o Exemplo 6 descrevendo um estojo de teste de HIV.

Naturalmente, os peritos na arte reconhecerão que a descrição antecedente está sujeita a várias modificações na escolha dos PNA, TNA, TBA, BNA e BBA. Para além disso, em sistemas que não de HIV, os peritos na arte reconhecerão que o método geral descrito acima pode igualmente ser aplicado. No entanto, estas outras aplicações podem ser mais simples que o método descrito acima uma vez que os TBA utilizados podem não reconhecer quaisquer locais celulares normais e portanto o recorrer à dimerização ou a outros métodos de discriminação entre TNA e CNA pode ser menos critico. No desenho de sondas e conjuntos de ligação para estes outros sistemas, o perito na arte será guiado pelos seguintes princípios e considerações.

Na concretização acima descrita, o interesse de utilizar as porções de ligação ao ADN da proteína NF-kB como o TBA e os elementos de ligação de reconhecimento de NF-kB como as TBR é que estes elementos formam um "ponto de controlo" importante para a replicação do HIV. Isto é, sabe-se que o HIV necessita de utilizar NF-kB como uma característica crítica no seu ciclo de vida replicativo. Pontos de controlo semelhantes para 50 ΕΡ Ο 796 344 /ΡΤ outros patogénios são escolhidos e utilizados como base para a detecção de acordo com os métodos aqui descritos.

Da descrição antecedente de características gerais deste invento e do modo da sua operação, um perito na arte reconhecerá que existe uma variedade de modos específicos para a prática deste invento. Como exemplo, o método deste invento é adaptável a um método e dispositivos utilizando estojos de teste cromatográficos descritos nas Patentes U.S. 4 690 691 e 5 310 650 (as patentes '691 e '650) . Nessas patentes, foi utilizado um meio poroso para imobilizar um TNA ou uma sonda de captura e foi utilizado um solvente para transportar uma fase móvel contendo um PNA marcado, se o TNA estivesse imobilizado, ou o TNA, se estivesse imobilizada uma sonda de captura, para a "zona de captura". Uma vez o TNA ligado na zona de captura, através da sua imobilização directa ou através de captura, um PNA marcado era sujeito a cromatografia através da zona de captura e era detectado qualquer marcador ligado. A adaptação do presente invento a um tal sistema proporciona a melhoria da utilização de um Conjunto de Ligação ao Alvo na zona de captura e, deste modo, a captura de apenas sequências de TBR que coincidem perfeitamente ou de outras TBR que representem conformações do ácido nucleico que se ligam especificamente ao TBA dentro dos dúplices TNA-PNA em virtude da discriminação sensivel anteriormente descrita pelo TBA entre TNA e CNA.

Uma vez os híbridos TNA-PNA ligados ao TBA imobilizado, o sinal é amplificado através da adição de BNA ou de BNA de cromatografia através da zona de captura. Finalmente, o sinal pode ser ainda amplificado através da adição de BBA ou de BBA marcados cromatograficamente através da zona de captura. Deste modo, a facilidade de realização dos passos de análise descritos nas patentes '691 e '650 é aqui melhorada proporcionando uma capacidade adicional de aumentar a especificidade e, através da amplificação, a sensibilidade do método descrito nessas patentes.

Os peritos na arte reconhecerão também que o método do presente invento é passível de ser realizado em placas de 51 ΕΡ Ο 796 344 /ΡΤ microtítulo ou de ser automatizado. A utilização de máquinas incorporando o método deste invento recai deste modo naturalmente dentro do âmbito da presente divulgação e das reivindicações anexas a ela. Assim, por exemplo, este invento é adaptável para utilização em instrumentos tais como o analisador de bancada IMx de Abbott Laboratories (Abbott Park, IL). 0 IMx é actualmente desenhado para correr o imunoensaio de polarização fluorescente (FPZA, ver Kier, KCLA 3: 13-15, 1983) e o imunoensaio enzimático de micropartículas (MEZA, ver "Laboratory Medicine", Vol. 20. N° 1, Janeiro de 1989, págs. 47-49). O método MEZA é facilmente transformado num método de detecção de ácidos nucleicos utilizando o presente invento através da utilização de um TBA como molécula de captura revestida numa microparticula com tamanho submicrométrico (<0,5 pm em média) suspensa em solução. As micropartículas revestidas com TBA são pipetadas para uma célula de reacção. O IMx pipeta então a amostra (PNA-TNA hibridados) para a célula de reacção, formando um complexo com o TBA. Após um período de incubação apropriado, a solução é transferida para uma matriz de fibra de vidro inerte para a qual as partículas têm uma forte afinidade e à qual as micropartículas aderem. Antes ou após a filtração da mistura reaccional através da matriz de fibra de vidro, são adicionados os BNA e BBA ou é utilizado outro meio de amplificação e detecção do sinal que dependa da formação específica de híbridos TNA-PNA. O complexo imobilizado é lavado e o material não ligado flui através da matriz de fibra de vidro.

Os complexos ligados são detectados por meio de BBA marcados com fosfatase alcalina ou BBA marcados de outro modo (radioactivamente, enzimaticamente, por fluorescência). No caso de BBA marcados com fosfatase alcalina, pode ser adicionado o substrato fluorescente 4-metil-umbeliferil-fosfato ou um reagente semelhante. Alternativamente, a enzima pode ser obviada através da marcação directa dos BBA com este ou com um reagente semelhante. Em qualquer caso, o sinal fluorescente ou outro é proporcional à quantidade de híbridos PNA-TNA presentes. A fluorescência é detectada à superfície da matriz por meio de um fluorómetro de superfície frontal tal como descrito pelo fabricante do IMx. Com ajustes menores que podem ser 52 ΕΡ Ο 796 344 /ΡΤ feitos através de experimentação de rotina para optimizar um instrumento tal como o IMx para a hibridação de ácidos nucleicos e interacções ácido nucleico-TBA, o presente invento é completamente adaptável a análises automáticas de amostras de TNA. 9. Outras aplicações de diagnóstico deste invento. Embora a descrição antecedente permita a utilização do presente invento de várias maneiras diferentes, muitas utilidades adicionais deste invento são facilmente apreciadas, por exemplo, num sistema de atraso da mobilidade.

Nesta concretização do presente invento, uma melhoria do bem conhecido ensaio de mudança da mobilidade electroforética (EMSA) é conduzida como se segue (ver Figuras 12a e 12b):

Uma amostra de ADN é fragmentada, através de clivagem aleatória ou através de tratamento com endonucleases de restrição especificas. 0 adn na amostra é então dividido em duas aliquotas iguais e é adicionado um TNA especifico à primeira aliquota mas não à segunda. A primeira e a segunda aliquotas são então sujeitas a electroforese num gel de acrilamida ou agarose e o padrão das bandas de ADN (visualizadas através de ligação a brometo de etidio ou por serem radioactivamente marcadas antes da electroforese) é então comparado para as duas aliquotas. Os fragmentos de ADN possuindo locais de ligação para os quais o tba é específico são atrasados na sua migração ao longo do meio electroforético. Através da utilização de um TBA apropriado, qualquer número de sequências de ADN ou de outro ácido nucleico pode ser seguido deste modo.

Numa modificação do EMSA descrito acima, o TNA fragmentado é hibridado com um PNA e fraccionado numa primeira dimensão. 0 ADN fraccionado é então feito reagir com um TBA apropriado e é observada a mudança na mobilidade dos fragmentos de adn. 0 aumento do atraso é possível através da adição de BBA tal como descrito acima (ver, por exemplo, Vijg e referências aí citadas para técnicas conhecidas de electroforese de ácidos nucleicos a duas (2) dimensões, às quais o presente método pode ser aplicado). 53 ΕΡ Ο 796 344 /ΡΤ

Os seguintes Exemplos são proporcionados para orientar melhor os peritos na arte nos métodos da prática deste invento. As técnicas de ADN recombinante padrão são divulgadas em Sambrook, Fritsch e Maniatis "Molecular Cloning: A Laboratory Manual", 2a Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, e textos mais recentes não são divulgados uma vez que estes estão agora bem dentro dos conhecimentos de uma pessoa competente na matéria.

Exemplo 1 - Preparação dos PNA e Marcação dos PNA Ácidos nucleicos sonda, PNA, podem ser preparados por meios bem conhecidos na arte. Assim, PNA polinucleotidicos de cadeia simples de sequência definida podem ser preparados através de síntese química de fase sólida de acordo com Merrifield. Os PNA podem ser preparados através de síntese automática utilizando tecnologia comercialmente disponível, tal como resinas e máquinas produzidas ou comercializadas por Applied Biosystems, ABI, ou outros fabricantes. Alternativamente, através de métodos de ADN recombinante conhecidos, determinadas sequências de PNA são sintetizadas in vivo, por exemplo, através de clonagem de um PNA dúplex num vector que se possa replicar em E. coli, podem ser preparadas grandes quantidades de PNA dúplex. Os multímeros do PNA podem ser clonados no vector de forma a que para cada mole de vector são libertadas várias moles de PNA após digestão do vector com um fragmento de restrição a flanquear a sequência do PNA. Subsequente à síntese ou à produção recombinante, os PNA são purificados através de métodos bem conhecidos na arte tais como através de electroforese em gel ou cromatografia líquida de alta pressão (HPLC). Se o PNA for produzido como um dúplex, antes da utilização num ensaio de hibridação para detecção das sequências de ácido nucleico alvo, as cadeias do PNA são separadas através de aquecimento ou de outros métodos conhecidos na arte. A sequência específica de bases no PNA é escolhida para reflectir a sequência a detectar num TNA, com a condição de que, de acordo com este invento, o PNA contenha uma sequência de 1/2 BBR, que é uma que após hibridação do PNA e TNA forma uma TBR. Uma vez que existe um número essencialmente ilimitado de tais sequências conhecidas na arte, a escolha da sequência 54 ΕΡ Ο 796 344 /ΡΤ do ΡΝΑ é passível de selecção pelo perito na arte para uma dada aplicação. A sequência da LTR de HIV é uma sequência tal que após hibridação das porções de codificação de um PNA da LTR com os TNA codificando a LTR de Hiv, formará tbr capazes de se ligar às proteínas de ligação ao ADN NF-kB e SPl.

Para além das sequências que formarão uma TBR após hibridação, o PNA pode também conter uma 1/2 BBR. Esta sequência é uma que, após hibridação com um ácido nucleico de reforço, BNA, forma uma BBR que é capaz de se ligar a uma BBA. A BBA é de preferência uma proteína de ligação ao ADN possuindo elevada afinidade para a sequência da BBR.

Neste exemplo particular, a hibridação entre um PNA possuindo como 1/2 TBR, SEQ ID NO:4, e na extremidade 3' dessa sequência, uma sequência de 1/2 BBR mostrada como SEQ ID NO:35. 0 PNA codificando estas sequências é utilizado sem marcação ou é marcado com um isótopo radioactivo tal como P32, S35 ou um isótopo semelhante, de acordo com métodos conhecidos na arte. Alternativamente, o PNA é ligado a uma esfera de entre 0,01 a 10 pm, que pode ser colorida para facilidade de detecção visual. Este marcador forma o OSA tal como descrito no fascículo. Esta sonda híbrida com as sequências da LTR de HIV para formar uma TBR que se liga a NF-kB. Adicionalmente, o PNA híbrida com BNA possuindo uma 1/2 BBR complementar para formar um operador esquerdo do bacteriófago lambda que se liga a cro ou a proteínas repressoras de lambda.

De um modo semelhante ao descrito acima, são utilizados PNA em que a 1/2 TBR é qualquer uma de SEQ ID NO:5 ou SEQ ID NO: 7-34, e uma 1/2 BBR tal como SEQ ID NO:35 ou SEQ ID NO:36 está na extremidade 3' ou 5' da 1/2 TBR.

Exemplo 2 - Preparação e Marcação de BNA

De forma semelhante aos métodos descritos no Exemplo 1 para preparação e marcação de PNA, os BNA são preparados e marcados de acordo com métodos conhecidos na arte. Tal como descrito na Patente U.S. 4 556 643, aqui incorporada por referência (ver particularmente o Exemplo 1), as sequências de ácido nucleico codificando sequências de ligação ao ácido nucleico particulares podem ser produzidas em massa através de 55 ΕΡ Ο 796 344 /ΡΤ clonagem num vector replicável. Para além disso, de forma semelhante a essa divulgação, as sequências de 1/2 TBR e de 1/2 BBR podem ser co-linearmente produzidas deste modo, no entanto, com a distinção de que, de acordo com o presente invento, a sequência de 1/2 TBR forma ela própria um local de reconhecimento do componente de ligação ao ácido nucleico e a 1/2 BBR, ao mesmo tempo que forma um local de reconhecimento do componente de ligação ao ácido nucleico, proporciona também um meio de amplificar o sinal produzido após a ligação da 1/2 TBR a sequências complementares no TNA proporcionando polimerização de BNA sobre o TNA ligado ao PNA. Para permitir isto, é proporcionada uma sequência tal como SEQ ID NO:35, que codifica o operador esquerdo do bacteriófago lambda, com sequências adicionais de modo a que seja criada uma sequência solta numa ou em ambas as extremidades do BNA após hibridação com o PNA.

Como exemplo especifico, a polimerização vectorial dos BNA sobre um TNA é proporcionada através de SEQ ID NO:40-43. Neste exemplo, SEQ ID NO:40 codifica duas 1/2 TBR que hibridarão com duas 1/2 TBR num TNA para formar dois locais de ligação de NF-kB, enquanto que ao mesmo tempo proporciona uma 1/2 BBR do operador esquerdo do bacteriófago lambda, que é adicionalmente terminada na extremidade 3' com o local de reconhecimento para a enzima de restrição PstI. A adição do BNA, SEQ ID NO: 41, com a 1/2 BBR complementar à 1/2 BBR do PNA, SEQ ID NO:40, completa a BBR enquanto que ao mesmo tempo completa o local de reconhecimento PstI, deixando uma extremidade solta de quatro bases para hibridação com BNA adicionais. Concordantemente, é adicionada SEQ ID NO:42 que possui uma sequência de quatro pares de bases na extremidade 3' que é complementar à extremidade solta de quatro bases restante da hibridação de SEQ ID NO:40 e 41. Adicionalmente, é proporcionada SEQ ID NO:42 com uma sequência de cinco bases na sua extremidade 5' que faz parte de um local de reconhecimento BamHI. O polimero em crescimento de BNA é ainda prolongado através da adição do BNA de SEQ ID NO:43 que é complementar a SEQ ID NO:42, completando a BBR ao mesmo tempo que completa o local de reconhecimento BamHI e deixa uma extremidade solta de quatro bases que pode ainda hibridar com BNA possuindo sequências complementares. Deste modo, os BNA podem ser 56 ΕΡ Ο 796 344 /ΡΤ hibridados extensamente de modo a amplificar grandemente o sinal de um único acontecimento de hibridação PNA-TNA.

Tal como com os PNA descritos no Exemplo 1, os BNA podem ser utilizados numa forma não marcada ou podem ser marcados de acordo com métodos conhecidos na arte e descritos no Exemplo 1. Será também apreciado que, em vez de se produzir o polímero de BNA através da adição sequencial de BNA ao complexo PNA-TNA, o polímero de BNA pode ser pré-formado e adicionado directamente ao complexo PNA-TNA. Um método simples para pré-formação de um tal polímero de BNA inclui a produção recombinante de um vector no qual são proporcionados multímeros do BNA com um único local de restrição em cada extremidade do polímero. Este polímero de BNA contendo múltiplas BBR é cortado do vector e híbrida com uma 1/2 BBR de cadeia simples que permanece no PNA após a hibridação do PNA com o TNA. Isto é alcançado proporcionando uma sequência de cadeia simples no PNA complementar a uma extremidade solta produzida no polímero de BNA quando é excisado do vector de produção.

Exemplo 3 - Produção de HNA e Sua Utilização para Protecção de Polímeros de BNA

Os HNA deste invento são produzidos de acordo com métodos conhecidos na arte para produção de polinucleótidos tal como descrito nos Exemplos 1 e 2 para PNA e BNA. No entanto, na produção dos HNA a sequência do HNA é especif icamente desenhada para que uma porção substancial do HNA forme um palindroma auto-complementar para formar um "gancho de cabelo", enquanto que ao mesmo tempo, deixa numa forma de cadeia simples suficientes bases para ser capaz de hibridar com sequências de cadeia simples na cadeia crescente de BNA descrita no Exemplo 2.

Neste Exemplo é proporcionado um HNA de SEQ ID NO:44 para rematar a extensão de BNA no PNA no Exemplo 2 após a adição do BNA, SEQ ID NO:43. Isto é alcançado porque SEQ ID NO:44, para além de possuir uma sequência palindrómica que forma um "gancho de cabelo" estável possui também uma sequência na extremidade 5' do HNA que completa a sequência de BamRI formada através da hibridação de SEQ ID NO:42 e SEQ ID NO:43. 57 ΕΡ Ο 796 344 /ΡΤ

Naturalmente, a terminação do polímero após a adição de apenas 3 BNA é para fins de simplicidade na demonstração do presente invento. Tal como descrito acima, esta polimerização pode ser continuada essencialmente de forma indefinida para amplificar o sinal do acontecimento de hibridação PNA-TNA.

Exemplo 4 - Preparação de TBA e BBA, Marcação e Imobilização Destes

As TBA e as BBA que podem ser utilizadas de acordo com o presente invento incluem qualquer substância que se possa ligar de modo específico às TBR e BBR formadas através de hibridação dos PNA, TNA e BNA. A utilização de proteínas de ligação ao ADN forma um exemplo de tais substâncias.

Para este exemplo, a TBA é o dímero da porção de ligação ao ADN de p50, e a BBA é a proteína cro de lambda. Estas proteínas podem ser produzidas de acordo com métodos conhecidos na arte. Os genes para ambas estas proteínas foram clonados. Assim, estas proteínas são produzidas de forma recombinante e purificadas de acordo com métodos conhecidos na arte. Para além disso, estas proteínas são marcadas, com um radioisótopo, tal como iodo radioactivo, ou com uma enzima, tal como beta-galactosidase ou peroxidase de rábano, ou com um corante fluorescente tal como fluoresceína ou rodamina, de acordo com métodos bem conhecidos na arte. Adicionalmente, um ou ambos os TBA e BBA podem ser imobilizados numa superfície sólida tal como a superfície de uma placa de microtítulo ou a superfície de uma esfera, tal como uma esfera colorida de diâmetro entre 0,01 e 10 pm. Os marcadores nos TBA e BBA podem ser os mesmos ou diferentes.

Neste exemplo, o TBA contendo o domínio de ligação ao ADN de p50 dimérico é marcado com rodamina, enquanto que o BBA, cro, é marcado com fluoresceína. Assim, após a hibridação dos PNA, TNA, BNA e HNA tal como descrito nesta divulgação de patente e os antecedentes e seguintes exemplos, os híbridos de ácidos nucleicos, se formados, são colocados em contacto com um excesso de TBA e cro marcados. A fluorescência destes marcadores é medida de acordo com métodos conhecidos e a detecção de ambos os sinais é indicadora da presença de sequências de 1/2 TBR no TNA. O sinal diferencial produzido 58 ΕΡ Ο 796 344 /ΡΤ pela fluorescência da NF-kB e da cro é uma medida do grau ao qual a polimerização dos BNA sobre o híbrido PNA-TBA resultou em amplificação do sinal. Está contemplada uma amplificação de uma a mais de mil vezes de acordo com o método deste invento.

Exemplo 5 - Hibridação de dois PNA com um TNA e Discriminação Entre um TNA e um CNA OS PNA, PNAl, SEQ ID NO: 40 e PNA2, SEQ ID NO: 45, são utilizados num excesso molar de cerca de dez vezes em relação à concentração de TNA numa amostra de teste. Para este exemplo, uma LTR de HIV dúplex isolada, em que uma cadeia da qual possui a sequência SEQ ID NO:37, mostrada na Figura 7, e a outra cadeia da qual é complementar à sequência mostrada na Figura 7, é utilizada como o TNA. É também utilizado neste exemplo um CNA dúplex isolado, do qual uma cadeia possui a mesma sequência que SEQ ID NO: 37 excepto que, no primeiro local de ligação de NF-kB mostrado na Figura 7, no centro da do local de ligação, posição 1 na Figura 7, em vez de um "T" existe um "A", cuja cadeia complementar portanto emparelha erradamente com o PNA de SEQ ID NO:40 nessa localização. SEQ ID NO: 40 e SEQ ID NO: 50 são ambas adicionadas para separar reacções, a primeira contendo o TNA acima descrito e a segunda contendo o CNA acima descrito. As amostras são solubilizadas num tampão de hibridação apropriado, tal como Tris 10 mM (pH 7,5), edta 1 mM. As amostras são aquecidas a cerca de 90°C durante cerca de cinco minutos para separar as cadeias dos tna dúplex e dos CNA nas amostras e depois as amostras são deixadas a arrefecer para permitir que as cadeias dos PNA, TNA e CNA hibridem.

Uma vez completada a hibridação, o que pode ser determinado de acordo com métodos conhecidos tais como através do cálculo de tl/2 com base nas composições de bases e na temperatura de hibridação de acordo com métodos conhecidos, o PNA de SEQ ID NO:40 é polimerizado através da adição de BNA tal como no Exemplo 2 e a sonda PNA2 de SEQ ID NO: 45 é polimerizada com BNA a começar com a extremidade solta de reconhecimento de Sphl. Após a adição dos BNA e de um breve período de hibridação, são adicionadas amostras separadas a esferas revestidas com NF-kB covalentemente imobilizada e a 59 ΕΡ Ο 796 344 /ΡΤ NF-kB é deixada a ligar-se a quaisquer TBR formadas nas amostras de TNA e CNA. Após cerca de 15 minutos de ligação, as amostras foram lavadas duas vezes com cerca de três volumes de um tampão de lavagem apropriado, tal como Tris 10 mM, pH 7,5, NaCl 100 mM ou outro tampão predeterminado para não interferir com NF-kB ou com a actividade de ligação da proteina repressora Cl do bacteriófago lambda. Após cada lavagem, as esferas foram deixadas a assentar sob gravidade ou através de uma breve centrifugação. isto remove quaisquer ácidos nucleicos que não possuam um local de ligação a NF-kB perfeito formado através de hibridação das sequências de PNA1 e TNA.

Após a lavagem final, a proteína repressora Cl do bacteriófago lambda marcada com um isótopo radioactivo, tal como com iodo radioactivo, ou marcada com uma enzima, tal como peroxidase de rábano, com esferas coloridas ou com um marcador fluorescente, é adicionada a cada amostra. As amostras são então lavadas várias vezes (cerca de 3) com vários volumes (cerca de 2) de um tampão de lavagem apropriado tal como Tris 10 mM, pH 7,5, NaCl 100 mM ou outro tampão predeterminado para não interferir com NF-kB ou com a actividade de ligação da proteina repressora Cl do bacteriófago lambda. Após cada lavagem, as esferas foram deixadas assentar sob gravidade ou através de uma breve centrifugação. Após a última vez que se deixa assentar ou a última centrifugação, o marcador ligado é quantificado através da detecção da radioactividade ligada, da cor libertada num ensaio enzimático, da cor das esferas ou da detecção de fluorescência. Alternativamente, pode ser adicionado um anticorpo anti-Ci e efectuado um imunoensaio enzimático em sanduíche ou um radioimunoensaio padrão para detectar o repressor ligado. Adicionalmente, como controlo negativo (fundo) todas as manipulações antecedentes são realizadas em cadeia com uma amostra na qual as esferas são utilizadas sem possuírem NF-kB imobilizada.

Como resultado do ensaio antecedente, as amostras contendo o controlo e o CNA possuem sinais semelhantemente baixos enquanto que a amostra contendo TNA possui um sinal bem acima do fundo. 60 ΕΡ Ο 796 344 /ΡΤ

Exemplo 6 - Estojo de Teste para a Detecção de HIV A. Conteúdo do estojo: 1. Placa de microtítulo. 2. Solução 1 mg/ml de NF-kB produzida de forma recombinante em solução salina tamponada com tris. 3. Tubo contendo PNA de HIV de cadeia simples (uma mistura de oligonucleótidos pré-misturados codificando dois 1/2 locais de ligação de NF-kB, i.e. uma mistura de SEQ ID NO:7 e 8). 4. Tubo contendo PNA genómico humano de cadeia simples, SEQ ID NO:1. 5. Tubo de nuclease {PstI). 6. Tubo de protease. 7. Tubo contendo BNA pré-polimerizados, 100 unidades de repetição de 0R do bacteriófago lambda, rematados com um HNA mas com 1/2 BBR disponíveis para ligação a hibridos PNA-TNA. 8. Tubo de cro conjugada com peroxidase de rábano (hrp). 9. Tubo de substrato colorido de hrp. 10. Solução salina tamponada com tris, 100 ml. 11. Lanceta. 12. Tubos de reacção A, B, C, contendo cada um 250 μΐ de água destilada. 13. Conta-gotas. B. Método de ensaio: a) A placa de microtítulo (item 1) é revestida com a solução de NF-kB produzida de forma recombinante (item 2) a uma concentração de 1 mg/ml em solução salina tamponada com tris de um dia para o outro a 4°C com agitação. b) Obtêm-se três gotas de sangue do sujeito a testar picando um dedo com a lanceta (reagente 11) e é dispensada uma gota para cada tubo de reacção A, B e C (reagente 12). c) Para cada tubo é dispensada uma gota de solução de protease (reagente 6) com o conta-gotas (item 12) e o tubo é agitado e deixado a repousar durante 5 minutos. 61 ΕΡ Ο 796 344 /ΡΤ d) Uma gota de nuclease (item 5) é adicionada a cada um dos tubos A-C utilizando o conta-gotas e os tubos são agitados e deixados a repousar durante 10 minutos. e) Uma gota do item 3 é adicionada ao tubo A (amostra de teste); uma gota de item 4 é adicionada ao tubo B (controlo positivo); e uma gota de solução salina (item 12) é adicionada ao tubo C como controlo negativo. Os tubos são aquecidos a 50°C em água quente e deixados arrefecer à temperatura ambiente durante uma hora. f) Embora se deixe ocorrer a hibridação no passo (d), a proteína em excesso é drenada da superfície e da placa de microtítulo, do passo (a) e a placa é lavada com solução salina tamponada com tris (tubo 10). g) Os conteúdos dos tubos A-C do passo (e) são transferidos para três poços da placa de microtítulo e deixados a repousar durante 1 hora com agitação. h) Os poços de microtítulo contendo os conteúdos dos tubos A-C são lavados com solução salina tamponada com tris e esvaziados. i) É adicionada uma gota de item 7 a cada poço e deixa-se hibridar com quaisquer locais 1/2 BBR ligados à placa, durante uma hora, seguido de três lavagens com solução salina tamponada com tris . j) É adicionada uma gota de item 8 a cada poço e deixa-se a cro ligar a quaisquer BNA ligados durante 10 minutos, seguido de cinco lavagens de 1 ml com solução salina tamponada com tris. k) É adicionada uma gota de substrato de hrp a cada poço e deixa-se revelar a cor. C. Resultados:

Se os poços A e B mostrarem ambos revelação de cor e o poço C não, o teste é válido e o sujeito foi infectado com HIV. Se apenas o poço A apresentar revelação de cor ou se o poço C apresentar revelação de cor, o teste foi efectuado incorrectamente e é inválido. Se os poços A e C não apresentarem revelação de cor mas o B sim, o teste é válido e o indivíduo não foi infectado com HIV. 62 ΕΡ Ο 796 344 /ΡΤ

Exemplo 7 - Produção de Vários Novos TBA

Novos TBA para utilizar de acordo com o presente invento são preparados como se segue: a) NFkB/NF-kB (Hiv-Detect I). Um ácido nucleico codificando qualquer uma de SEQ ID NO:63-71 ou uma proteína de ligação ao ADN semelhante a NF-kB, é fundido, enquadrado, com uma sequência nucleotídica codificando uma sequência de montagem, tal como cro, de modo a que a sequência de reconhecimento do ADN de NF-kB seja codificada no terminal amino ou carboxilo da sequência de cro. Opcionalmente, é proporcionada uma sequência ligante entre a sequência de NF-kB e a sequência de cro. No outro terminal de cro é opcionalmente proporcionada uma sequência sinal de localização nuclear, tal como SEQ ID NO:72. Mais, são opcionalmente proporcionadas sequências de assimetria no terminal de cro não utilizado pela sequência de reconhecimento de NF-kB. Exemplos de TBA completos são mostrados abaixo. b) NF-kB/SPl (HIV-Detect II) . De um modo semelhante ao descrito em (a) acima, é preparada uma sequência de codificação recombinante codificando um domínio de reconhecimento de NF-kB. Numa construção separada, em vez de SEQ ID NO:63-72, é incluída a sequência de codificação para a porção de reconhecimento do ADN de SP1. Uma tal sequência deve codificar toda ou uma parte funcional de SEQ ID NO:73, que é a porção do factor de transcrição SP1 que exibe ligação ao ADN (ver Kadonaga et al., Cell 51: 1079-1090, 1987). O vector codificando NF-kB e o vector codificando SPl são então co-transfectados num sistema de expressão apropriado tal como é bem conhecido na arte. Uma unidade de reconhecimento de NF-kB monomérica é adicionada para completar o dímero de reconhecimento de NF-kB após a montagem das unidades de reconhecimento de SPl e NF-kB pelo acompanhante. As sequências de assimetria impedem a formação de dímeros de NF-kB ou SPl e dirigem, por sua vez, a formação de heterodímeros NFkB-SPl (i.e., HIV-Detect II), que são então isolados do sistema de expressão (células de mamífero ou bacterianas) através de métodos conhecidos. 63 ΕΡ Ο 796 344 /ΡΤ c) ΤΒΑ de SP1/SP1 (HIV-Detect III). Tal como descrito em (b) acima, é preparada uma construção de TBA codificando SPl. No entanto, apenas esta construção é transfectada para o sistema de expressão e estão incluídas as sequências de assimetria que permitem a formação de dímeros SP1-SP1. d) SPl-TATA (HIV-Detect IV) . Tal como descrito em (b) acima, é produzido um recombinante de TBA codificando SPl. Adicionalmente, é preparado um recombinante codificando um TBA possuindo a sequência de ligação SEQ ID NO:74 ou uma sequência semelhante codificando uma unidade de reconhecimento TATA com sequências de assimetria complementares às incluídas na construção codificando TBA de SPl. Estas construções são co-transfectadas e os heterodímeros isolados através de métodos padrão, incluindo purificação de afinidade numa coluna de ADN possuindo as regiões de ligação ao alvo SPl-TATA apropriadas. e) SP1-E2 (HPV-Detect I). Uma construção codificando SPl é preparada tal como em (b) acima. Uma construção codificando um TBA de E2 é preparada através da utilização de uma sequência codificando qualquer uma de SEQ ID NO:75-84 e 94-98 que são unidades de reconhecimento do ADN de E2 (ver Hedge et al., Nature 359: 505-512, 1992) ou unidades de reconhecimento semelhantes, é preparada e co-transformada ou co-transfectada com a construção codificando o TBA de SPl. A unidade de reconhecimento de E2 monomérica é adicionada ao dímero de reconhecimento de E2 completo após a montagem da unidade de reconhecimento de E2-SP1 pelo acompanhante. O heterodímero HPV-Detect I é isolado de acordo com métodos conhecidos. f) E2-E2 (HPV-Detect II). Tal como descrito acima em (e), é preparada uma construção codificando TBA de E2, excepto que são incluídas sequências de assimetria que permitem a formação de dímeros de E2. Os dímeros expressos são então isolados através de métodos conhecidos incluindo afinidade para um local de ligação de E2 dimérico numa coluna de afinidade de ADN. g) E2-TATA (HPV-Detect III) . Tal como descrito acima em (e) e (d), são preparados TBA de ligação de E2 e TATA (respectivamente), excepto que são incluídas sequências de assimetria que aumentam a formação de heterodímeros em vez de 64 ΕΡ Ο 796 344 /ΡΤ homodímeros. Estas construções são então co-expressas e os heterodímeros são isolados. h) TATA-TATA (HPV-Detect IV) . Tal como descrito acima em (a) e (d), é preparada uma construção codificando TBA de ligação a TATA utilizando sequências de assimetria que favorecem a formação deste homodímero e o homodimero é isolado. i) Outros TBA. Tal como descrito acima para os TBA de HIV e HPV, TBA para qualquer dado patogénio ou estado de doença podem ser produzidos através da identificação de proteínas de ligação ao ADN específicas e da formação de uma construção de expressão utilizando sequências ligantes, de montagem e de assimetria apropriadas.

Exemplo 8

De um modo semelhante ao do ensaio descrito no Exemplo 5, é produzido um ensaio mais rigoroso através da utilização da proteína de ligação NF-kB-SPl dúplex preparada de acordo com o Exemplo 6. Assim, as sondas mostradas na Figura 7 e utilizadas no Exemplo 5 podem ser alongadas para reduzir a distância inter-sondas e deste modo reduzir a flexibilidade do ADN no TNA.

Exemplo 9 - Produção de TBA de "Ordem Superior"

Através da utilização apropriada de sequências de assimetria, são produzidos TBA que são dimeros, trímeros, tetrâmeros, pentâmeros ou hexâmeros de determinadas unidades de reconhecimento de ADN. Deste modo, é produzido um TBA hexamérico através da produção de um primeiro TBA dimérico de p50 de NF-kB utilizando sequências de assimetria que permitem a formação do dímero. Adicionalmente, as sequências de assimetria permitem a tetramerização do dímero de p50 com um dímero SPl-SPl. Finalmente, sequências de assimetria adicionais dirigem a hexamerização com um dímero exibindo sequências de localização nuclear. Isto é alcançado através da incorporação, por exemplo, de sequências de assimetria de insulina, que na natureza forma hexâmeros. Esta formação de hexâmeros é dirigida pelas sequências SEQ ID NO:85 (A) e 65 ΕΡ Ο 796 344 /ΡΤ 86 (Β), 87 (A) e 88 (Β), 89 (A) e 90 (Β), e 91 (A) e 92 (Β) (ver Figuras 13 e 14).

Devido à afinidade extremamente elevada para a LTR de hiv que pode ser gerada utilizando um TBA multimérico, os compostos possuindo esta estrutura e que podem ser utilizados para este fim são aqui referidos como "HIV-Lock".

Um HIV-Lock óptimo é definido por “footprinting" (de acordo com métodos bem conhecidos na arte) de TBA ligados a TBR na LTR de HIV para confirmar que a afinidade de ligação de cada proteína de ligação ao ADN que contribui para a formação do complexo multimérico de TBA é diminuída relativamente à afinidade de qualquer sequência alvo natural (i.e. CNA) da qual a unidade de reconhecimento de ligação ao ADN do TBA é derivada. Qualquer perda concomitante na afinidade de ligação para as TBR de HIV é mais do que compensada após a formação do multímero tal como descrito abaixo.

Pode haver competição entre a ligação de cada TBA componente pela sua TBR e montagem, através das sequências de assimetria para formar o multímero. Isto é evitado ajustando os ligantes entre as sequências de acompanhamento e de assimetria em cada componente do TBA de modo a que estes acontecimentos de competição estejam desacoplados. A redução resultante na dimensionalidade da difusão (eficaz aumento da concentração) para os componentes de assimetria e de montagem do TBA resulta na formação eficiente do complexo multimérico.

Com base no "footprinting", o comprimento e a composição dos ligantes são ajustados para alcançar uma discriminação óptima entre as sequências de HIV alvo e as sequências naturais. Deste modo, embora cada TBA componente terá baixa afinidade para as sequências de CNA e TBR, o complexo multimérico terá uma afinidade extremamente elevada para a TBR agora expandida reconhecida pelo complexo multimérico (o quadrado da afinidade de cada TBR reconhecida por cada TBA componente do TBA multimérico), ao mesmo tempo que possui ainda uma baixa afinidade para os CNA. Do mesmo modo são preparados outros complexos multiméricos de TBA, para além do HIV-Lock. 66 ΕΡ Ο 796 344 /ΡΤ

Os ΤΒΑ que podem ser formados deste modo incluem as seguintes sequências, que são montadas através da ligação de subunidades proteicas ou sequências de ácidos nucleicos codificando estas subunidades, como se segue:

Conjunto A B C

Ligar as Sequências dos Grupos i + II + III IV + V + III IV + III em que os grupos I-V consistem em sequências seleccionadas de entre:

Grupo Seleccionado de entre as Sequências I Qualquer uma de SEQ ID NO:85-92

II Met Ser, ligada a qualquer uma de SEQ ID

NO :104-106, cada uma das quais é ligada a SEQ ID NO: 99

III SEQ ID NO: 100 ligada a qualquer uma de SEQ ID

NO: 75-84 ou 94-98; SEQ ID NO: 101 ligada a SEQ ID

NO:74 ou SEQ ID NO:93; ou SEQ ID NO:102 ligada a SEQ ID NO:74 ou SEQ ID NO:93; ou qualquer uma de SEQ ID NO:72, 103, 73 ou 63-71. IV Qualquer uma de SEQ ID NO:104-106. V SEQ ID NO:99.

Exemplos específicos de tais TBA são SEQ ID NO:109-106, montadas como se segue:

Ligar SEQ IDS. Ser + 104 + 99 + 100 + 94 Ser + 104 + 99 + 72 Ser + 105 + 99 + 102 + 74 Ser + 106 + 99 + 73 Ser + 106 + 99 + 63

Conjunto SEQ ID NO. A 109 85 + Met A 110 85 + Met A 111 86 + Met A 112 86 + Met A 113 89 + Met C 114 106 + 64 C 115 105 + 64 B 116 106 + 99 + 73

Deste modo, escolhendo entre sequências de assimetria, sequências de montagem e unidades de reconhecimento do ADN 67 ΕΡ Ο 796 344 /ΡΤ apropriadas, podem ser formados muitos TBA diferentes. Para além disso, conjuntos destes, tais como SEQ ID NO:114 e 115, associar-se-ão uns aos outros mas não se formarão dimeros de SEQ ID NO:114 ou 115 devido à repulsão de cargas nas sequências de montagem mutadas (SEQ ID NO: 104 é cro; SEQ ID NO: 105 é uma nova cro mutada, carregada negativamente, e SEQ ID NO:106 é uma nova cro mutada, carregada positivamente).

Naturalmente, dada a sequência de aminoácidos destes TBA, um vulgar perito na arte pode produzir clones de ácidos nucleicos recombinantes codificando-as e tais clones recombinantes formam naturalmente uma parte integral deste invento.

Exemplo 10 - Teste de HIV Utilizando "HIV-Lock"

Praticamente como no método utilizado no Exemplo 6, o "HIV-Lock" produzido de acordo com o Exemplo 9 é utilizado como TBA, reagente 2, com resultados semelhantes.

Exemplo 11 - Teste de HIV Utilizando "HIV-Lock" Quando se

Testa Sangue para Doação

Quando a quantidade de sangue a testar não é limitante, tal como quando se testam amostras de sangue para doação quanto a contaminação por HIV, são realizados testes semelhantes aos do Exemplo 6, mas para cada um dos tubos A-C, são sedimentados cerca de 5 ml de sangue numa centrífuga de bancada. Os outros reagentes são proporcionais conforme o necessário para manusear a maior quantidade de TNA presente na amostra.

Exemplo 12 - "HIV-Lock" como Agente Terapêutico Anti-HIV O "HIV-Lock" produzido de acordo com o Exemplo 9 é formulado como uma solução 1 mg/ml em lipossomas e injectado intravenosamente num sujeito que foi testado e confirmado estar infectado com HIV. Uma dose de cerca de 0,1 mg a 100 mg de "HIV-Lock"/quilograma de massa corporal é infundida durante um período de vinte e quatro horas e é monitorizada a concentração de p24 de HIV no soro do paciente. O tratamento é 68 ΕΡ Ο 796 344 /ΡΤ repetido tão frequentemente conforme o necessário tal como quando ocorrem elevações na p24 sérica.

Exemplo 13 - Utilização de uma Construção de TBA de hiv como Terapêutico

Um vector retroviral recombinante ou semelhante é utilizado para distribuir uma construção codificando um TBA de ligação à ltr de hiv a um paciente infectado. 0 vector codifica um acompanhante, tal como cro, e sequências de ADN para porções de ligação de p50. 0 mesmo vector codifica também um acompanhante no qual se dobra um TBA de SPl. São proporcionadas sequências de assimetria de modo que após a co-expressão do TBA de p50 e do TBA de SPl numa única célula infectada com HIV in vivo, ocorre uma associação imediata entre estes TBA, ao mesmo tempo que se impede qualquer associação entre a porção de ligação ao ADN de p50 e monómeros endógenos de p50 ou p65. São também proporcionadas sequências NLS nos TBA de modo a que, após a formação dos dimeros, o TBA se re-localize imediatamente no núcleo da célula e se ligue especificamente às sequências de HIV integradas, impedindo assim qualquer transcrição a partir desse locus.

Para este fim, é desejável seleccionar sequências codificando domínios de ligação ao ADN de modo a que os monómeros expressos sejam montados num TBA que não se ligue a sequências humanas naturais. Assim, é apenas após a ligação dos componentes do TBA às suas sequências alvo que a associação entre todos os componentes do TBA ocorre para formar um complexo que se liga fortemente e especificamente à LTR de HIV.

Exemplo 14 - Estojo de Teste de Diagnóstico para Vírus do Papiloma Humano

Este diagnóstico para o vírus do papiloma humano tira vantagem do diferencial conhecido entre HPV benigno e carcinogénico para proporcionar um teste que indica a susceptibilidade à malignidade num paciente. Os vírus do papiloma são um grupo de pequenos vírus de ADN associados a tumores de células epiteliais escamosas benignos nos vertebrados superiores. Foram verificados pelo menos 27 tipos 69 ΕΡ Ο 796 344 /ΡΤ humanos distintos de vírus do papiloma (HPV); muitos destes foram associados a lesões clínicas específicas. Quatro destes, HPV-6, HPV-11, HPV-16, HPV-18 e HPV-33 foram associados a lesões do tracto genital humano. Em geral, os ADN de HPV-β e HPV-11 foram verificados estar associados a lesões benignas do tracto genital. HPV-16, HPV-18 e HPV-33 foram também verificados estar associados a lesões pré-malignas e malignas e são transcritos na maioria das linhas celulares estabelecidas a partir de carcinomas cervicais. É provável que HPV-16, HPV-18 e HPV-33 sejam apenas dois membros de um grande conjunto de ADN de HPV associados a carcinomas cervicais humanos malignos.

Modelos animais mostraram que lesões benignas do vírus do papiloma podem progredir para lesões malignas na presença de um co-carcinogénio. 0 ADN de HPV foi verificado em metástases de carcinomas cervicais. Em lesões cervicais malignas, o ADN de HPV está habitualmente integrado no genoma humano, mas pode também estar presente ADN de HPV extracromossómico. A integração de HPV para formar o pró-vírus resulta habitualmente na destruição do enquadramento de leitura aberto (ORF) de E2. Apesar da destruição do ORF de E2, o exame de linhas celulares de vários carcinomas cervicais mostrou HPV-16 e HPV-18 transcricionalmente activos e integrados. Quando os genomas de HPV-16 que estão presentes nas linhas celulares de carcinoma cervical humano SiHa e CaSki são examinados, há diferenças verificadas na integração de HPV-16. Na linha SiHa, a integração única do genoma de HPV-16 ocorreu nas bases 3132 e 3384, destruindo os ORF de El e E2 com uma deleção de 0,3 kb. Uma deleção adicional de 50 pares de bases do ADN de HPV-16 resultou na fusão dos ORF de E2 e E4. A porção 5' do ADN de HPV-16, que consiste no ORF de E2 destruído, é ligada a sequências flanqueadoras à direita humanas contínuas. Adicionalmente, é detectada uma única guanina adicional no nucleótido 1138 no meio do ORF de El. Esta adição de um par de bases resulta na fusão dos ORF de Ela e Elb num único ORF de El. O genoma completo de HPV-16 está disponível em GenBank com o número de acesso K02718; o genoma completo de HPV-33 está disponível em GenBank como número de acesso M12732; o 70 ΕΡ Ο 796 344 /ΡΤ genoma completo de HPV-18 está disponível em GenBank como número de acesso X05015.

Como pesquisa preliminar, o facto de uma infecção de HPV ser estabelecida para uma dada amostra de biopsia cervical através de uma simples análise de tipo "sim/não" utilizando, por exemplo, qualquer um ou todos os PNA SEQ ID NO:46-53 e um TBA de E2 tal como descrito acima (i.e., fragmentar o ADN, ligar ao pna, imobilizar com o TBA e detectar o sinal com BNA e BBA).

Uma vez a biopsia se verifique positiva para HPV, obtém-se informação adicional quanto à potencial malignidade do HPV através da análise do estado de integração do vírus no genoma humano. 1. Fragmentar o ADN na amostra da biopsia cervical e hibridar com uma sonda de bloqueio possuindo a sequência SEQ ID NO:60. Esta sonda ligar-se-á a todos os fragmentos no ADN que não foram removidos do fragmento de 0,3 kb. 2. Expor o ADN da amostra da biopsia a um PNA possuindo a sequência SEQ ID NO:61. Esta sonda ligar-se-á apenas a fragmentos que foram suprimidos do fragmento de 0,3 kb (a sonda de bloqueio impedirá a formação de uma volta dos grandes segmentos de deleção se presentes).

3. Um PNA possuindo SEQ ID NO:62 é hibridado com SEQ ID NO:41 para formar uma BBR que se ligará a cro ou ao repressor Cl de λ como BBA, deixando uma porção de cadeia simples capaz de hibridar com o local TATA em SEQ ID NO:61. Este foi adicionado para formar uma TBR na extremidade 5' da grande deleção. 4. A TBR é imobilizada por um TBA possuindo uma unidade de reconhecimento do ADN da proteína de ligação a TATA. 5. Os fragmentos ligados são detectados através da adição de BNA e BBA tal como descrito acima. A detecção do sinal neste ensaio indica que o fragmento grande está suprimido no HPV presente no TNA. Uma vez que esta 71 ΕΡ Ο 796 344 /ΡΤ deleção se correlaciona com malignidade, este ensaio proporciona uma perspectiva sobre o potencial de malignidade da infecção de HPV. Esta conclusão pode ser confirmada através da realização de um ensaio análogo com base na deleção do fragmento de 52 pares de bases que também se correlaciona com malignidade induzida por HPV. A unidade de reconhecimento de TBP utilizada no TBA para este ensaio pode ser escolhida, por exemplo, a partir de uma sequência tal como SEQ ID NO:70 ou SEQ ID NO:93.

Exemplo 15 - Produção de HlV-Lock™ Recombinante

Fase Um - Preparação de ADN para Produzir o HlV-Lock™. É efectuada mutagénese in vitro das regiões de codificação dos componentes de ocorrência natural e clonados do HIV-Lock™ que necessitam ser modificados com um estojo MutaGene Phagemid. O protocolo modificado inclui a utilização de um plasmídeo Blue-script contendo cada um dos componentes de ligação de HIV-Lock™. Estes são transformados para células competentes e os fagemideos contendo uracilo são criados. O ADN de cadeia simples é extraído e utilizado como molde para a cadeia mutagénica. Oligonucleótidos contendo as mutações desejadas, incluindo a incorporação de um novo local de restrição, são sintetizados e tratados com polinucleótido-quinase e ATP. Os oligonucleótidos tratados com a quinase são hibridados com o molde de cadeia simples e a cadeia mutagénica é sintetizada e ligada de acordo com o protocolo MutaGene, com a excepção de que Sequenase 2.0 proporciona a polimerase. As bibliotecas são pesquisadas utilizando nucleótidos marcados nas extremidades com g-32P contendo sequências complementares às mutações introduzidas e através de isolamento do ADN plasmídico e identificação dos mutantes através da presença do local de restrição introduzido. As mutações são também confirmadas através de sequenciação com um estojo Sequenase. O ADN de HIV-Lock™ é clonado no sistema de expressão de baculovírus com um promotor de poliedro.

Fase Dois - Produção de Proteínas HlV-Lock™ Utilizando Baculovírus. Células Sf-9 são cultivadas até uma densidade predeterminada (cerca de lxlO6 células/ml, fase logarítmica), infectadas com o baculovírus contendo as instruções de HIV- 72 ΕΡ Ο 796 344 /ΡΤ

Lock™ θ colhidas para recuperar as proteínas recombinantes compreendendo o HIV-Lock™. No processo de ampliação, as culturas são expandidas de balões para garrafas e subsequentemente para biorreactores. Após infecção as células são colhidas às 12, 24, 36 e 48 horas pela proteína. Os índices de viabilidade são monitorizados ao longo de todo o processo.

Fase Três - Purificação das Proteínas HIV-Lock™. As proteínas colhidas são primeiro separadas dos particulados através de ultracentrifugação de fluxo para facilitar a purificação a jusante. 0 produto centrifugado é então filtrado para esterilização. Os extractos são então centrifugados a 40 000 rpm a 4°C durante 30 minutos e as alíquotas são imunoprecipitadas com anticorpo policlonal de coelho contra um dos componentes de HIV-Lock . As proteínas imunoprecipitadas são corridas numa gel de SDS-PAGE a 10%.

Fase Quatro - Teste das Proteínas HIV-Lock™ Contra ADN de HIV. Os ensaios de mudança de mobilidade são realizados utilizando uma sonda oligonucleotídica compreendendo elementos da repetição terminal longa de HIV e fragmentos contendo NFKB que se liga a ADN associado à cadeia leve capa e a regulação de microglobulina. O oligonucleótido é hibridado com a sua cadeia complementar e marcado na extremidade com ATP g- P. O "footprinting" é alcançado combinando uma pequena quantidade (1CT15 M) de ADN da LTR de HIV radiomarcado com uma quantidade ligeiramente maior de HIV-Lock num tampao a temperatura ambiente durante 10 minutos. O ditiotreitol é adicionado antes da adição da proteína. São adicionados ferro (II), EDTA, peróxido de hidrogénio e ascorbato de sódio e a mistura reaccional é incubada. É adicionado um agente de extinção e os produtos são analisados utilizando electroforese em gel desnaturante. Isto é feito para diferentes concentrações de proteína. O gel resultante é visualizado utilizando um digitalizador "Phosphoimager" e o ficheiro de imagem de elevada resolução resultante é analisado para calcular a afinidade de ligação de HIV-Lock™ para o ADN de HIV relativamente ao ADN celular. 73 ΕΡ Ο 796 344 /ΡΤ

Pode ser utilizado desenho múltiplo e interacções de teste para refinar a ligaçao de HlV-Lock e outros TBA para HIV e outros organismos. Este processo torna possível desenhar conjuntos de ligação de modo a que o conjunto de ligação não seja competitivo com as proteínas de tipo selvagem para locais de ligação únicos nas amostras de genoma. O desenvolvimento de TBA para outros organismos e de TNA para sequências dentro destes organismos pode ser feito utilizando o método acima mencionado. Este método é válido quando a produção de conjuntos de ligação para todas as TBR de ácidos nucleicos incluindo híbridos ADN-ADN, ADN-ARN e ARN-ARN e combinações destes híbridos.

Exemplo 16 - Método para identificação de moléculas de ligação a ácidos nucleicos para produção de TBA e BBA do presente invento:

No método deste invento, os conjuntos de ligação ao alvo e os conjuntos de ligação de reforço são montados através da identificação de moléculas de ligação ao ácido nucleico, e da ligação das porções de ligação ao ácido nucleico das moléculas de modo a alcançar TBA que discriminam entre determinadas sequências alvo e até sequências intimamente aparentadas. Um método para identificação das moléculas de ligação ao ácido nucleico envolve os seguintes passos: 1. Obtenção de uma amostra biológica contendo o ácido nucleico alvo. Esta pode ser por exemplo, um organismo ou um extracto de tecido infectado com um patogénio. 2. Fragmentação da amostra de modo a expor os ácidos nucleicos e a reduzir a complexidade do tamanho do ácido nucleico contido na amostra. 3. Colocação de uma primeira alíquota dos ácidos nucleicos fragmentados em contacto com um meio tampão de controlo e colocação de uma segunda alíquota de ácidos nucleicos fragmentados em contacto com o meio tampão de controlo contendo um perfil conhecido de moléculas de ligação ao ácido nucleico. 4. Análise das duas alíquotas para identificar fragmentos que possuam um comportamento alterado na alíquota em contacto com as moléculas de ligação ao alvo em oposição à alíquota de controlo. Isto é alcançado através de 74 ΕΡ Ο 796 344 /ΡΤ electroforese em gel de uma dimensão, electroforese em gel de duas dimensões, cromatografia liquida de alta resolução, cromatografia em papel ou através de outros meios que revelem um comportamento diferente dos fragmentos de ácido nucleico quando ligados a uma molécula de ligação ao ácido nucleico em oposição a quando o fragmento de ácido nucleico não está ligado. 5. Identificação e isolamento de fragmentos que exibem um comportamento alterado quando colocados em contacto com a molécula de ligação ao ácido nucleico e sequenciação do fragmento de ácido nucleico para determinar se os motivos da molécula de ligação ao ácido nucleico conhecidos estão presentes, ou identificação directa da molécula de ligação ao ácido nucleico ligada ao ácido nucleico. A última pode ser alcançada, por exemplo, através do contacto de uma grelha bidimensional dos ácidos nucleicos sujeitos a electroforese com anticorpos marcados diferencialmente que se ligam às várias moléculas de ligação ao ácido nucleico.

Neste método, de preferência os motivos do ácido nucleico são utilizados para fins diagnósticos ou terapêuticos em que o ácido nucleico alvo possui mais de um alvo molécula de ligação ao ácido nucleico utilizável. Deste modo, pode ser gerado um conjunto de ligação ao alvo complexo que tira vantagem da proximidade de diferentes motivos moleculares de ligação ao ácido nucleico para aumentar a especificidade do TBA montado a partir dos componentes de ligação ao ácido nucleico individuais identificados. As várias porções de ligação ao ácido nucleico das moléculas de ligação ao ácido nucleico são então montadas nos TBA completos tal como descrito acima, por exemplo, para HIV-Lock™.

Exemplo 17 - Método de identificação de sequências de ARN específicas numa amostra

De acordo com os métodos e composições ensinados neste invento, qualquer sequência de ácido nucleico pode ser especificamente identificada. A identificação do ARN de HIV alvo numa amostra é alcançada através da obtenção de uma amostra de sangue do paciente ou de outro fluido biológico ou extracto que possa conter o ARN de HIV, e de testes da 75 ΕΡ Ο 796 344 /ΡΤ presença de locais de ligação a TAR. Tat é um regulador positivo da replicação de HIV que se liga à região TAR do ARN de HIV. A forma completamente activa mais pequena de ocorrência natural de Tat de Hiv tem 72 aminoácidos de comprimento, SEQ ID NO:118 aqui. Tat contém pelo menos dois domínios funcionais e transactiva a expressão génica da repetição terminal longa de HIV (LTR de HIV). Tat liga-se a uma estrutura de caule e volta do ARN formada através da auto-hibridação de sequências em TAR, que ficam imediatamente a 5' da LTR de HIV. 0 ARN da TAR de HIV forma uma protuberância dinucleotídica e duas estruturas de caule e volta (Rhim et al., Virology 202: 202-211, 1994). Tat (SEQ ID NO:118) liga-se a esta estrutura com menor avidez do que variantes de Tat em que Ala58 é uma treonina ou onde His65 é um resíduo Asp (Derse et al., Virology 194: 530-536, 1993). A utilização destes factos no presente método é alcançada através de: 1. Fragmentação de uma amostra biológica para expor os ácidos nucleicos e reduzir a complexidade do tamanho dos ácidos nucleicos. 2. Colocação de um TBA em contacto com a amostra que identifica uma sequência proteica de ligação a TAR híbrida e uma sequência de flanqueamento próxima no genoma de HIV. O TBA utilizado para este fim é montado em cro como acompanhante utilizando Tat como molécula de ligação específica do ARN de HIV. Para proporcionar especificidade tal como a comunicação cruzada entre o local TAR de HIV e locais TAR intimamente aparentados que possam estar presentes devido a outros patogénios tais como citomegalovírus, o tba tem também um componente de anticorpo que reconhece a região de ligação ao híbrido ADN-ARN alvo formada quando o ácido nucleico sonda se liga ao ARN da LTR de HIV. 3. Eliminação de qualquer "comunicação cruzada" produzida através da ligação de Tat à região TAR do ARN de HIV devido a tais contaminantes (ARN primos) tais como a sequência TAR de CMV através do contacto da reacção com excesso de variante de Tat (as variantes Ala58 para Thr ou His65 para Asp) que se ligam mais avidamente. Deste modo, acontecimentos de ligação únicos devidos à ligação de TBA a ARN primos competem com a amostra de ácido nucleico pela variante de Tat. Por outro lado, através da 76 ΕΡ Ο 796 344 /ΡΤ selecção apropriada da afinidade da dupla ligação alcançada em resultado do anticorpo e de Tat, o TBA não é deslocado dos verdadeiros alvos. Este processo é ilustrado na Figura 16. Noutro aspecto deste mesmo método, o TBA pode ser um em que, em vez de se utilizar uma variante de Tat, é utilizado um anticorpo que reconhece este segmento de ácido nucleico e o TBA utilizado é um TBA de duplo anticorpo.

Numa versão alternativa deste método, pode ser utilizado uma ácido nucleico sonda que hibride com o ARN da LTR de HIV. Concordantemente, pode ser criado um segmento dúplex dos locais Spl da LTR como parte da região de ligação ao alvo. Esta região do ARN de HIV flanqueia a região TAR que fica a 5' da LTR mas muito próximo desta. Um TBA contendo Tat e duas unidades de ligação de Spl é acompanhado para proporcionar ligação de Tat a TAR e ligação de Spl aos locais de ligação de Spl. A amplificação e detecção são então realizadas através da adição de BNA, BBA e HNA apropriados. Ainda noutra alternativa, podem ser utilizados PNA possuindo SEQ ID NO:38 e SEQ ID NO:39 (ver Figura 7). É utilizado um TBA que contém uma ou mais unidades de ligação de Spl e uma unidade de anticorpo que se liga ao ADN-ARN híbrido produzido a partir do ARN da amostra e do PNA de SEQ ID NO: 38. Os BNA, BBA e HNA apropriados são então adicionados para amplificar o sinal.

Naturalmente, os peritos na arte reconhecerão que podem ser utilizadas outras combinações de TBA e TNA para optimizar os métodos aqui exemplificados.

Entender-se-á que as sequências aqui proporcionadas são apenas exemplificativas e que outras sequências sugeridas por estas podem ser utilizadas nos métodos deste invento. Será também entendido que embora qualquer sequência aqui proporcionada possa ser desenhada como linear, pode ser utilizada numa forma circular ou permutada de outro modo e que embora designada como não sendo anti-sentido, pode ser utilizada na forma de codificação ou de não codificação ou para se ligar a sequências complementares codificantes ou não codificantes. 77 ΕΡ Ο 796 344 /ΡΤ

LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE:

Nome(s) do(s) Requerente(s): THE GENE POOL, INC.

Rua: 300 Queen Anne Ave. N., Suite 392 Cidade: Seattle Estado/Província: Washington Pais: EUA Código Postal/Zip: 98109-4599 Número de telefone: (206) 526-8617 Número de Fax:

(ii) TÍTULO DA INVENÇÃO: MÉTODO DE DETECÇÃO DE ÁCIDO NUCLEICOS COM UMA COMPOSIÇÃO DE SEQUÊNCIA ESPECÍFICA (iii) NÚMERO DE SEQUÊNCIAS: 118 (iv) ENDEREÇO PARA CORRESPONDÊNCIA: (A) DESTINATÁRIO: Saliwanchik & Saliwanchik (B) RUA: 2421 N.W. 41st St., Suite A-l (C) CIDADE: Gainesville (D) ESTADO: Florida

(E) PAÍS: EUA (F) CÓDIGO POSTAL: 32606 (v) FORMATO LEGÍVEL COMPUTADOR: (A) TIPO DE MEIO: disquete

(B) COMPUTADOR: compatível com PC IBM

(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, Versão #1.25 (vi) DADOS DO PRESENTE PEDIDO: (A) NÚMERO DE PEDIDO: (B) DATA DE APRESENTAÇÃO: (C) CLASSIFICAÇÃO: (viii) INFORMAÇÃO SOBRE REPRESENTANTE/AGENTE: (A) NOME: Gerard H Bencen (B) NÚMERO DE REGISTRO: 35,746 (C) NÚMERO DE REFERÊNCIA/PROCESSO: GP-100.C1 (ix) INFORMAÇÃO PARA TELECOMUNICAÇÕES: (A) TELEFONE: (904) 375-8100 (B) TELEFAX: (904) 372-5800 (2) INFORMAÇÃO PARA SEQ ID NO:1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 78 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:l TGGGGATTCC CCA 13 (2) INFORMAÇÃO PARA SEQ ID NO:2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:2 AAGGGACTTT CCC 13 (2) INFORMAÇÃO PARA SEQ ID NO:3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:3 AGGGGACTTT CCG 13 (2) INFORMAÇÃO PARA SEQ ID NO:4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO 79 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUENCIA: SEQ ID NO:4 GCTGGGGACT TTCCA 15 (2) INFORMAÇÃO PARA SEQ ID NO:5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:5 ACAAGGGACT TTCCG 15 (2) INFORMAÇÃO PARA SEQ ID NO:6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:6 CCGGGTTTTC CCC 13 (2) INFORMAÇÃO PARA SEQ ID NO:7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:7 AAGGGACTTT CCGCTGGGGA CTTTCCA 27 80 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:8: AAGGGACTTT CCGCTGGGGA CTTTCCG 27 (2) INFORMAÇÃO PARA SEQ ID NO:9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:9: GCTGGGGACT TTCCAGGGAG GCGTGG 26 (2) INFORMAÇÃO PARA SEQ ID NO:10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:10 GCTGGGGACT TTCCAGGGGA GGTGTG 26 (2) INFORMAÇÃO PARA SEQ ID NO:11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 81 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:11 GCTGGGGACT TTCCGGGGAG CGTGGC 26 (2) INFORMAÇÃO PARA SEQ ID NO:12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:12 GCTGGGGACT TTCCGGGGAG GCGCGG 26 (2) INFORMAÇÃO PARA SEQ ID NO:13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:13 GCTGGGGACT TTCCAGAGAG GCGTGG 26 (2) INFORMAÇÃO PARA SEQ ID NO:14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO 82 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUENCIA: SEQ ID NO:14 GCTGGGGACT TTCCAGGGGA GGCGTG 26 (2) INFORMAÇÃO PARA SEQ ID NO:15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:15 GCTGGGGACT TTCCAGGGAG GCGTGG 26 (2) INFORMAÇÃO PARA SEQ ID NO:16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:16 GCTGGGGACT TTCCAGGGAG GCTGCC 26 (2) INFORMAÇÃO PARA SEQ ID NO:17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:17 TTTCCAGGGA GGCGTGGCCT GGGCGGGACT GGG 33 83 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:18: CGTGGCCTGG GCGGGACTGG GGAGTGGCGT CCC 33 (2) INFORMAÇÃO PARA SEQ ID NO:19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:19: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCT 45 (2) INFORMAÇÃO PARA SEQ ID NO:20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:20: CAGCAAGGGA CTTTCCGCTG GGGACTTTCC AGGGGAGGTG TGGCCT 46 (2) INFORMAÇÃO PARA SEQ ID NO:21: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 84 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:21: CATCAAGGGA CTTTCCGCTG GGGACTTTCC AGGGGAGGTG TGGCCT 46 (2) INFORMAÇÃO PARA SEQ ID NO:22: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:22: CAACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGGAGGTG TGGCCT 46 (2) INFORMAÇÃO PARA SEQ ID NO:23: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:23: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCAT 45 (2) INFORMAÇÃO PARA SEQ ID NO:24: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 44 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO 85 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:24: CTACAAGGGA CTTTCCGCTG GGGACTTTCC GGGGAGCGTG GCCT 44 (2) INFORMAÇÃO PARA SEQ ID NO:25: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 44 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:25: CTACAAGGGA CTTTCCGCTG GGGACTTTCC GGGGAGGCGC GGCT 44 (2) INFORMAÇÃO PARA SEQ ID NO:26: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:26: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGAGAGGCGT GGACT 45 (2) INFORMAÇÃO PARA SEQ ID NO:27: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:27: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGGAGGCG TGGACT 46 86 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:28: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:28: CTACAGGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGGGAG 46 (2) INFORMAÇÃO PARA SEQ ID NO:29: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 43 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:29: CTACAGGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCTG CCT 43 (2) INFORMAÇÃO PARA SEQ ID NO:30: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 48 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:30: CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCTGGGCG GGACTGGG 48 (2) INFORMAÇÃO PARA SEQ ID NO:31: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 87 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:31: TTTCCAGGGA GGCGTGGCCT GGGCGGGACT GGGGAGTGGC GTCCC 45 (2) INFORMAÇÃO PARA SEQ ID NO:32: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 59 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:32: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCTGGGCG GGACTGGGG 59 (2) INFORMAÇÃO PARA SEQ ID NO:33: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 59 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:33: TTTCCGCTGG GGACTTTCCA GGGAGGCGTG GCCTGGGCGG GACTGGGGAG TGGCGTCCC 59 (2) INFORMAÇÃO PARA SEQ ID NO:34: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 70 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO 88 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:34: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCTGGGCG GGACTGGGGA 60 GTGGCGTCCC 70 (2) INFORMAÇÃO PARA SEQ ID NO:35: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 61 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:35: TATCACCGCC AGTGGTATTT ATGTCAACAC CGCCAGAGAT AATTTATCAC CGCAGATGGT 60 T 61 (2) INFORMAÇÃO PARA SEQ ID NO:36: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 64 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:36: TATCACCGCA AGGGATAAAI ATCTAACACC GTGCGTGTTG ACTATTTTAC CTCTGGCGGT 60 GATA 64 (2) INFORMAÇÃO PARA SEQ ID NO:37: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 70 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO 89 ΕΡ Ο 796 344 /ΡΤ (ίν) ΑΝΤΙ-SENTIDO: ΝΑΟ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:37: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCTGGGCG GGACTGGGGA 60 GTGGCG7CCC 70 (2) INFORMAÇÃO PARA SEQ ID NO:38: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 37 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:38: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGG 37 (2) INFORMAÇÃO PARA SEQ ID NO:39: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:39: CGGGACTGGG GAGTGGCGTC CC 22 (2) INFORMAÇÃO PARA SEQ ID NO:40: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 103 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO 90 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:40: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGTAT CACCGCCAGT GGTATTTATG 60 TCAACACCGC CAGAGATAAT TTATCACCGC AGATGGTTCT GCA 103 (2) INFORMAÇÃO PARA SEQ ID NO:41: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 62 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) MÂ

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:41; GAACCATCTG CGGTGATAAA TTATCTCTGG CGGTGTTGAC ATAAATACCA CTGGCGGTGA 60 ΪΑ 62 (2) INFORMAÇÃO PARA SEQ ID NO:42: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 71 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:42: GATCCAACCA TCTGCGGTGA TAAATTATCT CTGGCGGTGT TGACATAAAT ACCACTGGCG 60 GTGATACTGC A 71 (2) INFORMAÇÃO PARA SEQ ID NO:43: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 63 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO 91 ΕΡ Ο 796 344 /ΡΤ (ίν) ΑΝΤΙ-SENTIDO: ΝΑΟ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:43: GTATCACCGC CAGTGGTATT TATGTCAACA CCGCCAGAGA TAATTTATCA CCGCAGATGG 60 TTG 63 (2) INFORMAÇÃO PARA SEQ ID NO:44: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:44: GATCCGGGGG GATACCCCCC G 21 (2) INFORMAÇÃO PARA SEQ ID NO:45: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 91 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:45: CGGGACTGGG GAGTGGCGTC CCTATCACCG CAAGGGATAA ATATCTAACA CCGTGCGTGT 60 TGACTATTTT ACCTCTGGCG GTGATAGCAT G 91 (2) INFORMAÇÃO PARA SEQ ID NO:46: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 53 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO 92 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:46: CTAAGGGCGT AACCGAAATC GGTTGAACCG AAACCGGTTA GTATAAAAGC AGA 53 (2) INFORMAÇÃO PARA SEQ ID NO:47: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 54 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:47: AAAAGGGAGT AACCGAAAAC GGTCGGGACC GAAAACGGTG TATATAAAAG ATGT 54 (2) INFORMAÇÃO PARA SEQ ID NO:48: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 54 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:48: AGTAGGGTGT AACCGAAAGC GGTTCAACCG AAAACGGTGC ATATATAAAG CAAA 54 (2) INFORMAÇÃO PARA SEQ ID NO:49: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:49: GCTTCAACCG AATTCGGTTG CATG 24 93 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:50: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:50 TGTGCAACCG ATTTCGGTTG CCTT 24 (2) INFORMAÇÃO PARA SEQ ID NO:51: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:51 TATGCAACCG AAATAGGTTG GGCA 24 (2) INFORMAÇÃO PARA SEQ ID NO:52: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:52 TGCCTAACCG TTTTCGGTTA CTTG 24 (2) INFORMAÇÃO PARA SEQ ID NO:53: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 94 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:53: GGACTAACCG TTTTAGGTCA TATT 24 (2) INFORMAÇÃO PARA SEQ ID NO:54: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 52 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:54: GACGACTATC CAGCGACCAA GATCAGAGCC AGACACCGGA AACCCCTGCC AC 52 (2) INFORMAÇÃO PARA SEQ ID NO:55: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 53 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:55: GACGACACGG TATCCGCTAC TCAGCTTGTT AAACAGCTAC AGCACACCCC CTC 53 (2) INFORMAÇÃO PARA SEQ ID NO:56: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 60 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO 95 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:56: GACGACGACC TGCAGACACC ACAGACACCG CCCAGCCCCT TACAAAGCTG TTCTGTGCAG 60 (2) INFORMAÇÃO PARA SEQ ID NO:57: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 68 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:57: CATACCAAAG CC6TC6CCTT GGGCACCGAA GAAACACAAC CACTAAGTTG TTGCACAGAG £0 ACTCAGTG 68 (2) INFORMAÇÃO PARA SEQ ID NO:58: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 77 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:58: TAATGTAATT GATTGTAATG ACTCTATGTG CAGTACCAGT ACCGTATTCC AGCACCGTGT 60 CCGTGGGCAC CGCAAAG 77 (2) INFORMAÇÃO PARA SEQ ID NO:59: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 80 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NAO

(iv) ANTI-SENTIDO: NÃO 96 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:59: ACAGACAACG ATAACCGACC ACCACAAGCA GCGGCCAAAC ACCCCGCCTT GGACAATAGA 60 ACAGCACGTA CTGCAACTAA 80 (2) INFORMAÇÃO PARA SEQ ID NO:60: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 266 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:60: CATATGCAAT ACAATGCATT ATACAAACTG GACACATATA TATATTTGTG AAGAAGCATC 60 AGTAACTGTG GTAGAGGGTC AAGTTGACTA TTATGGTTTA TATTATGTTC ATGAAGGAAT 120 ACGAACATAT TTTGTGCAGT TTAAAGATGA TGCAGAAAAA TATAGTAAAA ATAAAGTATG 180 GGAAGTTCAT GCGGGTGGTC AGGTAATATT ATGTCCTACA TCTGTGTTTA GCAGCAACGA 240 AGTATCCTCT CCTGAAATTA TTAGGC 266 (2) INFORMAÇÃO PARA SEQ ID NO:61: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 95 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:61: AGSATGTATA AAAAAACATG GATATACAGT GGAAGTGCAG TTTGATGGAG ACATATGCTA 60 TTAGGCAGCA CTTGGCCAAC CACCCCGCCG CGACC 95 (2) INFORMAÇÃO PARA SEQ ID NO:62: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 81 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 97 ΕΡ Ο 796 344 /ΡΤ

(ii) TIPO DE MOLÉCULA: ADNc (iii) HIPOTÉTICA: NÃO (iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:62: CATGTTTTTT TATACATCCA tatcaccgcc agtggtattt atgtcaacac cgccagagat AATTTATCAC CGCAGATGGT T 60 81 (2) INFORMAÇÃO PARA SEQ ID NO:63: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 322 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:63:

Met Ala Aap Aap Asp pro Tyr Gly Thr Gly Gin Met Pbe Bis Leu Asn 15 10 15

Thr Ala l>eu Thr Bis ser lie Phe Asn Ala Glu Leu Tyr ser Pro Glu 20 25 30

Ile Pro Leu Ser Thr Asp Gly Pro Tyr Leu Gin Xle Leu Glu Gin Pro 35 40 45

Lys Gin Arg Gly Phe Arg Phe Arg Tyr Vai Cya Glu Gly Pro ser Bis 50 55 60

Gly Gly Leu Pro Gly Ala Ser Ser Glu Lys Asn Lya Lys Ser Tyr pro 65 70 75 80

Gin vai Lys Xle cye Asn Tyr vai Gly Pro Ala Lye Vai xle vai Gin 85 90 95

Leu vai Thr Asn Gly Lys Asn He His Leu Bis Ala Bis Ser Leu vai 100 105 110 98 ΕΡ Ο 796 344 /ΡΤ

Gly Lys Hia Cya Glu Asp Gly Vai Cys Thr Vai Thr Ala Gly Pro Lys 115 120 125

Asp Met Vai Vai Gly Phe Ala Asn Leu Gly Ile Leu Bis Vai Thr Lye 130 135 140

Lys Lye val Phe Glu Thr Leu Glu Ala Arg Hat Thr Glu Ala cys Ile 145 150 155 160

Arg Gly Tyr Asn Pro Gly Leu Leu Val Hia Ser Asp Leu Ala Tyr Leu 165 170 175

Gin Ala Glu Gly Gly Gly Asp Arg Gin Leu Thr Asp Arg Glu Lys Glu 1B0 185 190 lie Ile Arg Gin Ala Ala Val Gin Gin Thr Lys Glu Het Asp Leu Ser 195 200 205 t

Val Val Arg Leu Het phe Thr Ala Fhe Leu Pro Asp ser Thr Gly Ser 210 215 220

Phe Thr Arg Arg Leu Glu Pro Val Val ser Asp Ala Ile Tyr Asp ser 225 230 235 240

Lys Ala Pro Asn Ala Ser Asn Leu Lys Ile Val Arg Het Asp Arg Thr 245 250 255

Ala Gly cys val Thr Gly Gly Glu Glu lie Tyr Leu Leu Cys Asp Lys 260 265 270

Val Gin Lys Asp Asp Ile Gin Ile Arg Phe Tyr Glu Glu Glu Glu Asn 275 280 285

Gly Gly Val Trp Glu Gly Phe Gly Asp Phe ser Pro Thr Asp Val Bis 290 295 300

Arg Gin Phe Ala Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Val Asn 305 310 315 320

Ile Thr (2) INFORMAÇÃO PARA SEQ ID NO:64: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 325 aminoácidos (B) TIPO: aminoacido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 99 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:64:

Het Ala Glu Aep Asp Pro Tyr Leu Gly Arg Pro Glu Gin Met Pbe Bis 15 10 15

Leu Asp Pro Ser Leu Thr Bis Thr Ile phe Asn Pro Glu Vai Pbe Gin 20 25 30

Pro Gin Het Ala Leu Pro Thr Ala Aep Gly Pro Tyr Leu Gin Ile Leu 35 40 45

Glu Gin Pro Lys Gin Arg Gly Phe Arg Phe Arg Tyr Vai Cys Glu Gly 50 55 60

Pro ser His Gly Gly Leu Pro Gly Ala ser Ser Glu Lys Asn Lys Lys 65 70 75 80

Ser Tyr Pro Gin vai Lys Ile cys Asn Tyr Vai Gly Pro Ala Lys Vai 85 90 95

Ile vai Gin Leu vai Thr Asn Gly Lys Asn Ile Bis Leu Bis Ala Bis 100 105 110

Ser Leu Vai Gly Lys Bis cys Glu Asp Gly Ile Cys Thr vai Thr Ala 115 120 125

Gly Pro Glu Asp Cys Vai Bis Gly Phe Ala Asn Leu Gly ile Leu Bis 130 135 140 vai Thr Lys Lys Lys vai Phe Glu Thr Leu Glu Ala Arg Met Thr Glu 145 150 155 160

Ala Cys Ile Arg Gly Tyr Asn Pro Gly Leu Leu Vai His Pro Asp Leu 165 170 175

Ala Tyr Leu Gin Ala Glu Gly Gly Gly Asp Arg Gin Leu Gly Asp Arg 180 185 190

Glu Lys Glu Leu Ile Arg Gin Ala Ala Leu Gin Gin Thr Lys Glu Met 195 200 205

Asp Leu Ser Vai Vai Arg Leu Het Phe Thr Ala Phe Leu Pro Asp Ser 210 215 220

Thr Gly Ser Phe Thr Arg Arg Leu Glu Pro Vai Vai Ser Asp Ala Ile 225 230 235 240

Tyr Asp ser Lys Ala Pro Asn Ala ser Asn Leu Lys Ile Vai Arg Met 245 250 255

Asp Arg Thr Ala Gly cys Vai Thr Gly Gly Glu Glu Ile Tyr Leu Leu 260 265 270

Cys Asp Lys Vai Gin Lys Asp Asp Ile Gin ile Arg Phe Tyr Glu Glu 275 280 285

Glu Glu Asn Gly Gly Vai Trp Glu Gly phe Gly Asp Phe ser Pro Thr 290 295 300

Asp Vai Bis Arg Gin Phe Ala Ile vai Phe Lys Thr Pro Lys Tyr Lys 305 310 315 320

Asp lie Αβπ Ile Thr 325 100 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:65: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 268 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:65:

Met Glu Pro Ala Asp Leu Leu Pro Leu Tyr Leu Gin Pro GlU Trp Gly 1 5 10 15 Glu Gin Glu Pro Gly Gly Ala Thr Pro Phe Vai Glu Xle Leu Glu Gin 20 25 30 Pro Lys Gin Arg Gly Met Arg Phe Arg Tyr Lys Cys Glu Gly Arg ser 35 40 45 >1 a cl« WJ Ser Xle Pro Gly Bis Ser Thr Asp gay Ala Arg Thr Bxs 50 55 60 Pro Thr Xle Arg Vai Asn HÍS Tyr Arg Gly Pro Gly Arg Val Arg Val 65 70 75 80 ser Leu Vai Thr Lys Asp Pro Pro His Gly Pro Bis Pro Bis Glu Leu 85 90 95 vai Gly Arg Bis cys Gin Bis Gly Tyr Tyr Glu Ala Glu Leu Ser Pro 100 105 110 Asp Arg ser Xle HÍS ser Phe Gin Asn Leu Gly Xle Gin Cys Val Lys 115 120 125 ID Arg Glu Leu Glu Ala Ala Vai Ala Glu Arg xle Arg Thr Asn Asn 130 135 140 Asn Pro Phe Asn Vai pro Met Glu Glu Arg Gly Ala Glu Tyr Asp Leu 145 150 155 160 101 ΕΡ Ο 796 344 /ΡΤ ser Ala Vai Arg Leu cys Phe Gin Vai Trp Vai Aan Gly Pro Gly Gly 165 170 175

Leu Cys Pro Leu pro Pro Vai Leu ser Gin Pro lie Tyr Asp Aan Arg 180 185 190

Ala Pro ser Thr Ala Glu Leu Arg lie Leu Pro Gly Asp Arg Asn ser 195 200 205

Gly ser Cys Gin Gly Gly Asp Glu lie Phe Leu Leu Cys Asp Lys Vai 210 215 220

Gin Lys Glu Asp Ile Glu Vai Arg Phe Trp Ala Glu Gly Trp Glu Ala 225 230 235 240

Lys Gly Ser Phe Ala Ala Ala Asp vai Bis Arg Gin Vai Ala zle Vai 245 250 255

Phe Arg Thr Pro Pro Phe Arg Glu Arg Ser Leu Arg 260 265 (2) INFORMAÇÃO PARA SEQ ID NO:66: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 263 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:66:

Met Asp Asp Leu Phe Pro Leu Ile Phe Pro ser Glu Pro Ala Gin Ala 15 10 15 ser Gly Pro Tyr vai Glu ile ile Glu Gin Pro Lys Gin Arg Gly Met 20 25 30

Arg Phe Arg Tyr Lys Cys Glu Gly Arg ser Ala Gly Ser Ile Pro Gly 35 40 45

Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn 50 55 60

Gly Tyr Thr Gly Pro Gly Thr vai Arg ile Ser Leu Vai Thr Lys Asp 65 70 75 80 102 ΕΡ Ο 796 344 /ΡΤ

Pro Pro Bis Arg Pro Híb Pro Hia Glu Leu vai Gly Lya Asp Cys Arg 85 90 95

Asp Gly Tyr Tyr Glu Ala Asp Leu cys Pro Asp Arg ser Xle Hia ser 100 105 110

Phe Gin Aan Leu Gly Ile Gin Cys vai Lya Lya Arg Asp Leu Glu Gin 115 120 125

Ala xle ser Gin Arg ile Gin Thr Αβη Aan Aan Pro Phe Bis vai Pro 130 135 140

Ile Glu Glu Gin Arg Gly Asp Tyr Asp Leu Aan Ala vai Arg Leu Cys 145 150 155 160

Phe Gin vai Thr Vai Arg Asp Pro Ala Gly Arg Pro Leu Leu Leu Thr 165 170 175

Pro Vai Leu ser Bis Pro Ile Phe Asp Aan Arg Ala Pro Αβη Thr Ala 180 185 190

Glu Leu Lya Ile cys Arg Vai Aan Arg Asn ser Gly ser cys Leu Gly 195 200 205

Gly Aap Glu Ile Phe Leu Leu cya Asp Lya Vai Gin Lya Glu Asp xle 210 215 220

Glu Vai Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly ser phe ser 225 230 235 240

Gin Ala Asp Vai Bis Arg Gin Vai Ala Ile vai Phe Arg Thr Pro Pro 245 250 255

Tyr Ala Asp Pro Ser Leu Gin 260 (2) INFORMAÇÃO PARA SEQ ID NO:67: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 263 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:67:

Met Asp Glu Leu Phe Pro Leu Ile Phe Pro Ala Glu Pro Ala Gin Ala 15 10 15 103 ΕΡ Ο 796 344 /ΡΤ ser Gly pro Tyr Vai Glu lie Ile Glu Gin Pro Lys Gin Arg Gly Met 20 25 30

Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly 35 40 45

Glu Arg ser Thr Asp Thr Thr Lys Thr Hie Pro Thr Ile Lys Ile Asn 50 55 60

Gly Tyr Thr Gly Pro Gly Thr Vai Arg Ile Ser Leu Vai Thr Lys Asp 65 70 75 80

Pro pro ais Arg Pro ais Pro Bis Glu Leu vai Gly Lys Asp Cys Arg 85 90 95

Asp Gly Phe Tyr Glu Ala Glu Leu cys Pro Asp Arg Cys Ile Bis Ser 100 105 110

Phe Gin Asn Leu Gly Ile Gin Cys Vai Lys Lys Arg Asp Leu Glu Gin 115 120 125

Ala ile ser Gin Arg Ile Gin Thr Asn Asn Asn Pro Phe Gin vai Pro 130 135 140

Ile Glu Glu Gin Arg Gly Asp Tyr Asp Leu Asn Ala Vai Arg Leu Cys 145 150 155 160

Phe Gin vai Thr vai Arg Asp pro ser Gly Arg Pro Leu Arg Leu Pro 165 170 175

Pro vai Leu Pro His Pro He Phe 180

Asp Asn Arg Ala Pro Asn Thr Ala 185 190

Glu Leu Lys ile Cys Arg Vai Asn Arg Asn Ser Gly Ser Cys Leu Gly 195 200 205

Gly Asp Glu lie Phe Leu Leu cys Asp Lys Vai Gin Lys Glu Asp Ile 210 '215 220

Glu vai Tyr phe Thr Gly Pro Gly Trp Glu Ala Arg Gly ser Phe ser 225 230 235 240

Gin Ala Asp vai ais Arg Gin Vai Ala Ile Vai Phe Arg Thr Pro Pro 245 250 255

Tyr Ala Asp Pro Ser Leu Gin 260 (2) INFORMAÇÃO PARA SEQ ID NO:68: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 299 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 104 ΕΡ Ο 796 344 /ΡΤ (χί) DESCRIÇÃO DA SEQUENCIA: SEQ ID NO:68:

Met Phe Pro Asn Gin Asn Asn Gly 1 5

Vai Asp Gly Gin Gin Ser Leu Asn 20

Gin Gin Gin Leu Ala Gin ser Thr 35 40

Vai Lys Xle Thr Glu Gin Pro Ala 50 55

Glu Cys Glu Gly Arg ser Ala Gly 65 70

Pro Glu Asn Lys Thr Tyr Pro Thr 85

Arg Ala Vai Vai vai Vai Ser cys 100

Pro Bis Pro His Asn Leu vai Gly 115 120

Cys Thr Leu Glu xle Asn ser Glu 130 135

Leu Gly Xle Gin Cys Vai Lys Lys 145 150

Ala Arg Glu Glu xle Arg vai Asp 165

Arg Phe Gin Pro ser ser xle Asp 180

Gin Vai Phe Met Glu Ser Glu Gin 195 200

Pro Pro Vai Vai Ser Glu Pro Ile 210 215

Leu vai Xle Cys Arg Leu Cys Ser 225 230

Thr Gin Xle Xle Leu Leu Cys Glu 245

Ala Ala Pro Gly Gin Gly Pro Ala 10 15

Tyr Asn Gly Leu Pro Ala Gin Gin 25 30

Lys Asn Vai Arg Lys Lys Pro Tyr 45

Gly Lys Ala Leu Arg Phe Arg Tyr 60 ser Xle Pro Gly Vai Asn Ser Thr 75 80 xle Glu Xle Vai Gly Tyr Lys Gly 90 95 vai Thr Lys Asp Thr Pro Tyr Arg 105 no

Lys Glu Gly cys Lys Lys Gly Vai 125

Thr Met Arg Ala Vai Phe Ser Asn 140

Lys Asp Xle Glu Ala Ala Leu Lys 155 160

Pro Phe Lys Thr Gly phe Ser His 170 175

Leu Asn Ser Vai Arg Leu Cys Phe 185 190

Lys Gly Arg Phe Thr Ser Pro Leu 205

Phe Asp Lys Lys Ala Met Ser Asp 220

Cys Ser Ala Thr Vai Phe Gly Asn 235 240

Lys vai Ala Lys Glu Asp He ser 250 255

Vai Arg Phe Phe Glu GlU Lys Asn 260 Gly Asp Phe Gin Bis Thr Asp val 275 280 Lys Thr Pro Arg Tyr Bis Thr Leu 290 295

Gly Gin ser Vai Trp Glu Ala Phe 265 270 híb Lys Gin Thr Ala ile Thr Phe 285

Asp Ile Thr 105 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO:69: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 261 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:69:

Het Asp Phe Leu Thr Asn Leu Arg Phe Thr Glu Gly Ile ser Glu Pro 1 5 10 15 Tyr Ile Glu Ile phe Glu Gin Pro Arg Gin Arg Gly Thr Arg Phe Arg 20 25 30 Tyr Lys Cys Glu Gly Arg ser Ala Gly ser Ile Pro Gly Glu HÍ8 ser 35 40 45 Thr Asp Asn Asn Lys Thr Phe Pro ser Ile Gin Ile Leu Asn Tyr Phe SO 55 60 Gly Lys Vai Lya Ile Arg Thr Thr Leu Vai Thr Lys Asn Glu Pro Tyr 65 70 75 80 Lys Pro Bis Pro Bis Asp Leu vai Gly Lys Gly cys Arg Asp Gly Tyr 85 90 95 Tyr Glu Ala Glu Pbe Gly Pro Glu Arg Gin Vai Leu Ser Phe Gin Asn 100 105 110 Leu Gly Ile Gin Cys Vai LyB Lys Lys Asp Leu Lys Glu ser Ile Ser 115 120 125 Leu Arg Ile Ser Lys Lys Asn Pro Phe Asn Vai Pro Glu Glu Gin Leu 130 135 140 106 ΕΡ Ο 796 344 /ΡΤ

Bis Asn Ile Asp Glu Tyr Αβρ Leu Asn Val Val Arg Leu cys Phe Gin 145 150 155 160 Ala Phe Leu Pro Αβρ Glu BÍS Gly Asn Tyr Thr Leu Ala Leu Pro Pro 165 170 175 Leu Ile ser Asn Pro Ile Tyr Asp Asn Arg Ala Pro Asn Thr Ala Glu 180 185 190 Leu Arg Ile cys Arg Val Asn Lys Asn Cys Gly ser val Lys Gly Gly 195 200 205 Asp Glu ile Phe Leu Leu Cys Asp Lys Val Gin Lys Αβρ Asp Ile Glu 210 215 220 Val Arg Phe Val Leu Gly Asn Trp Glu Ala Lys Gly ser Phe Ser Gin 225 230 . 235 240 Ala Asp Val His Arg Gin Val Ala Ile Val Phe Arg Thr Pro Pro Phe 245 250 255 Leu Gly Asp Ile Thr 260 2) INFORMAÇÃO i PARA SEQ ID NO:70: (ί) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 262 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:70:

Met Asp Phe Leu Thr Asn Leu Arg Phe Thr Glu Gly He ser Glu pro 15 10 15

Tyr Zle Glu lie Phe Glu Gin Pro Arg Gin Arg Gly Met Arg phe Arg 20 25 30

Tyr Lys Cys Glu Gly Arg ser Ala Gly ser ile Pro Gly Glu Bis ser 35 40 45

Thr Asp Asn Asn Lys Thr Phe Pro ser Ile Gin lie Leu Asn Tyr Phe 50 55 60

Gly Lys Val Lys ile Arg Thr Thr Leu vai Thr Lys Asn Glu Pro Tyr 65 70 75 80 107 ΕΡ Ο 796 344 /ΡΤ

Lye Pro Bis Pro Bis Asp Leu vai Gly Lys Gly cys Arg Asp Gly Tyr 85 90 95 Tyr Glu Ala Glu Phe Gly Pro Glu Arg Gin Vai Leu Ser Phe Gin Asn 100 105 110 Leu Gly Ile Gin Cys Vai Lys Lys Lys Asp Leu Lys Glu ser Ile Ser 115 120 125 Leu Arg ile ser Lys Lys Ile Asn pro Phe Asn val Pro Glu Glu Gin 130 135 140 Leu Bis Asn Ile Asp Glu Tyr Asp Leu Asn Vai Val Arg Leu Cys Phe 145 150 155 160 Gin Ala Phe Leu Pro Asp Glu Bis Gly Asn Tyr Thr Leu Ala Leu Pro 165 170 175 Pro Leu ile ser Asn Pro Ile Tyr Asp Asn Arg Ala Pro Asn Thr Ala iao 185 190 Glu Leu Arg Ile Cys Arg Vai Asn Lys Asn Cys Gly Ser Val Lys Gly 195 200 205 Gly Aep Glu Ile Phe Leu Leu Cys Asp Lys Val Gin Lys Asp Asp Ile 210 215 220 Glu Vai Arg Phe Vai Leu Gly Asn Trp Glu Ala Lys Gly ser Phe ser 225 230 235 240 Gin Ala Asp Vai Bis Arg Gin vai Ala Ile val Phe Arg Thr Pro Pro 245 250 255 Phe Leu Gly Asp Ile Thr 260 (2) INFORMAÇÃO PARA SEQ ID NO :71: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 314 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:71:

Met ser Asn Lys Lys Gin ser Asn Arg Leu Thr Glu Gin Bis Lys Leu 15 10 15 108 ΕΡ Ο 796 344 /ΡΤ

Ser Gin Gly vai Ile Gly Ile Phe Gly Asp Tyr Ala Lya Ala Hia Asp 20 25 30

Leu Ala Vai Gly Glu Vai Ser Lys Leu vai Lya Lys Ala Leu ser Asn 35 40 45

Glu Tyr Fro Gin Leu Ser Phe Arg Tyr Arg Asp ser Ile Lya Lya Thr 50 55 60

Glu Ile Αβη Glu Ala Leu Lys Lys Ile Αβρ Pro Asp Leu Gly Gly Thr 65 70 75 80

Leu Phe vai Ser Asn Ser Ser Ile Lys Pro Asp Gly Gly lie Vai Glu 85 90 95

Vai Lys Asp Asp Tyr Gly Glu Trp Arg vai Vai Leu Vai Ala Glu Ala 100 105 110

Lys Bis Gin Gly Lys Asp Ile Ile Asn Ile Arg Asn Gly Leu Leu Vai 115 120 125

Gly Lys Arg Gly Asp Gin Aap Leu Met Ala Ala Gly Asn Ala Ile Glu 130 135 140

Arg Ser Bis Asn Ile ser Glu ile Ala Asn Phe Met Leu ser Glu ser 145 150 155 160

Bis Phe Pro Tyr Vai Leu Phe Leu Glu Gly Ser Asn Phe Leu Thr Glu 165 170 175

Asn Ile Ser Ile Thr Arg Fro Asp Gly Arg Vai vai Asn Leu Glu Tyr 180 185 190

Aan Ser Gly Ser Glu Ser Bis Phe Pro Tyr Vai Leu Phe Leu Glu Gly 195 200 205

Ser Asn Phe Leu Thr Glu Asn Ile Ser Ile Thr Arg Pro Asp Gly Arg 210 215 220

Vai vai Asn Leu Glu Tyr Asn Ser Gly Ile Leu Asn Arg Leu Asp Arg 225 230 235 240

Leu Thr Ala Ala Asn Tyr Gly Met Pro Ile Asn ser Asn Leu Cya Ile 245 250 255

Asn Lys Phe Vai Asn His Lys Asp Lys ser ile Met Leu Gin Ala Ala 260 265 270 ser Ile Tyr Thr Gin Gly Asp Gly Arg Glu Trp Asp ser Lys Ile Met 275 280 285

Phe Glu ile Met Phe Asp Ile Ser Thr Thr Ser Leu Arg Vai Leu Gly 290 295 300

Arg Asp Leu Phe Glu Gin Leu Thr ser Lys 305 310 (2) INFORMAÇÃO PARA SEQ ID NO:72: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 aminoácidos (B) TIPO: amínoácído (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido 109 ΕΡ Ο 796 344 /ΡΤ

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:72: cys Asp Thr Asp Asp Arg Bis Arg Ile Glu Glu Lys Arg Lys Arg Lys 15 10 15

Thr (2) INFORMAÇÃO PARA SEQ ID NO:73: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 168 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (x) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:73:

Gly Asp Pro Gly Lys Lys Lys Gin Bis He Cys Bis Ile Gin Gly cys 1 5 10 15 Gly Lys vai Tyr Gly Lys Thr ser His Leu Arg Ala Bis Leu Arg Trp 20 25 30 Bia Thr Gly Glu Arg Pro Phe Met Cys Thr Trp Ser Tyr Cys Gly Lys 35 40 45 Arg Phe Thr Arg Ser Asp Glu Leu Gin Arg Bis Lys Arg Thr Bis Thr 50 55 60 Gly Glu Lys Lys Phe Ala cys Pro Glu Cys Pro Lys Arg Phe Met Arg 65 70 75 80 ser Asp Bis Leu ser Lys Bis lie Lys Thr Bis Gin Asn Lys Lys Gly 85 90 95 Gly Pro Gly Vai Ala Leu Ser val Gly Thr Leu Pro Leu Asp ser Gly 100 105 110 Ala Gly Ser Glu Gly Ser Gly Thr Ala Thr Pro ser Ala Leu ile Thr 115 120 125 Thr Asn Met Vai Ala Met Glu Ala lie Cys Pro Glu Gly Ile Ala Arg 130 135 140 Leu Ala Asn Ser Gly lie Asn Val Met Gin Val Ala Asp Leu Gin Ser 145 150 155 160 11· Asn Zle Ser Gly Asn Gly Phe 165 110 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:74: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 181 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:74:

Ser Gly Ile Vai ?ro Gin Leu Gin Asn Ile Vai Ser Thr Vai Asn Leu 1 5 ' 10 15

Gly cys Lys Leu Asp Leu Lys Thr ile Ala Leu Arg Ala Arg Asn Ala 20 25 30

Glu Tyr Asn Pro Lys Arg Phe Ala Ala Vai Zle Met Arg Ile Arg Glu 35 40 45

Pro Arg Thr Thr Ala Leu Zle Phe Ser Ser Gly Lys Met vai cys Thr 50 55 60

Gly Ala Lys ser Glu Glu Gin Ser Arg Leu Ala Ala Arg Lys Tyr Ala 65 70 75 80

Arg Val vai Gin Lys Leu Gly Phe Pro Ala Lys Phe Leu Asp Phe Lys 85 90 95

Ile Gin Asn Met Val Gly ser cys Asp Val Lys Phe Pro Zle Arg Leu 100 105 110

Glu Gly Leu Val Leu Thr His Gin Gin Phe Ser Ser Tyr Glu Pro Glu 115 120 125

Leu Phe Pro Gly Leu Ile Tyr Arg Met Zle Lys Pro Arg Ile Val Leu 130 135 140

Leu Zle Phe val ser Gly Lys val val Leu Thr Gly Ala Lys Val Arg 145 150 155 160

Ala Glu Zle Tyr Glu Ala Phe Glu Asn Zle Tyr pro Zle Leu Lys Gly 165 170 175

Phe Arg Lys Thr Thr 180 (2) INFORMAÇÃO PARA SEQ ID NO:75: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 85 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO 111 ΕΡ Ο 796 344 /ΡΤ

(ίν) ΑΝΤΙ-SENTIDO: NÃO (ν) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:75:

Ser Cys Phe Ala Leu Zle ser Gly Thr Ala Asn Gin val Lys Cys Tyr 1 5 10 15 Arg Phe Arg val Lys Lys Asn His Arg His Arg Tyr Glu Asn Cys Thr 20 25 30 Thr Thr Trp Phe Thr Val Ala Asp Asn Gly Ala GlU Arg Gin Gly Gin 35 40 45 Ala Gin Zle Leu Zle Thr Phe Gly Ser Pro ser Gin Arg Gin Asp Phe 50 55 60 Leu Lys His Val Pro Leu Pro Pro Gly Het Asn Zle Ser Gly Phe Thr 65 70 75 80

Ala ser Leu Asp Phe 85 (2) INFORMAÇÃO PARA SEQ ID NO:76: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 87 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:76:

Cys Pro Cys Leu Leu Zle Gly Thr Ser Gly Asn Gly Asn Gin Val Lys 1 5 10 15 Cys Tyr Ser Phe Arg Val Lys Arg Trp His Asp Arg Asp Lys Tyr HÍB 20 25 30 His Thr Thr Thr Trp Trp Ala val Gly Gly Gin Gly ser Glu Arg Pro 35 40 45 Gly Asp Ala Thr Val Zle Val Thr Phe Lys Asp Gin Ser Gin Arg Ser 50 55 60 His Phe Leu Gin Gin val Pro Leu Pro Pro Gly Het Ser Ala His Gly 65 70 75 80 Val Thr Met Thr Val Asp Phe 85 (2) INFORMAÇÃO PARA SEQ ID NO:77: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 112 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:77:

Pro pro vai ile cys Leu Lys Gly Gly Hia Aan Gin Leu Lys cys Leu 15 10 15

Arg Tyr Arg Leu Lye Ser Lys His Ser ser Leu Phe Asp Cys lie Ser 20 25 30

Thr Thr Trp ser Trp Vai Asp Thr Thr ser Thr cys Arg Leu Gly Ser 35 40 45

Gly Arg Met Leu Ile Lys Phe Ala Asp ser Glu Gin Arg Asp Lys Phe 50 55 60

Leu Ser Arg vai Pro Leu Pro Ser Thr Thr Gin Vai Phe Leu Gly Asn 65 70 75 80

Phe Tyr Gly Leu (2) INFORMAÇÃO PARA SEQ ID NO:78: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:78:

Pro Pro vai Ile Leu Vai Arg Gly Gly Ala Asn Thr Leu Lys cys Phe 15 10 15

Arg Asn Arg Ala Arg vai Arg Tyr Arg Gly Leu Phe Lys Tyr Phe ser 20 25 30

Thr Thr Trp ser Trp vai Ala Gly Asp ser Thr Glu Arg Leu Gly Arg 35 40 45

Ser Arg Met Leu Ile Leu Phe Thr Ser Ala cys Gin Arg Glu Lys Pro 50 55 60

Asp Glu Thr Vai Lys Tyr Pro Lys Gly vai Asp Thr ser Tyr Gly Asn 65 70 75 80

Leu Asp ser Leu 113 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:79: (ί) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (x) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:79:

Pro Pro Vai Vai Cys vai Lya Gly Gly Ala Asn Gin Leu Lys Cys Leu 15 10 15

Arg Tyr Arg Leu Lys Ala Ser Thr Gin vai Asp Phe Asp ser Ile ser 20 25 30

Thr Thr Trp His Trp Thr Asp Arg Lys Asn Thr Glu Arg Ile Gly Ser 35 40 45

Ala Arg Met Leu vai Lys Phe Ile Asp Glu Ala Gin Arg Glu Lys Phe 50 55 60

Leu Glu Arg Vai Ala Leu Pro Arg Ser Vai Ser Vai Phe Leu Gly Gin 65 70 75 80

Phe Asn Gly ser (2) INFORMAÇÃO PARA SEQ ID NO:80: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:80:

Thr Pro ile Vai Gin Leu Gin Gly Asp ser Asn Cys Leu Lys cys Phe 15 10 15

Arg Tyr Arg Leu Asn Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser 20 25 30

Ser Thr Trp His Trp Ala ser Pro Glu Ala Pro His Lys Asn Ala Ile 35 40 45 vai Thr Leu Thr Tyr ser ser Glu Glu Gin Arg Gin Gin Phe Leu Asn 50 55 60 114 ΕΡ Ο 796 344 /ΡΤ ser vai Lye Ile Pro Pro Thr Xle Arg His Lya Vai Gly Phe Met Ser 65 70 75 80

Leu His Leu Leu (2) INFORMAÇÃO PARA SEQ ID NO:81: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:81:

Thr Pro Ile Vai Gin Phe Gin Gly Glu Ser Asn cys Leu Lys Cys Phe 15 10 15

Arg Tyr Arg Leu Asn Arg Asp His Arg Bis Leu Phe Asp Leu Ile Ser 20 25 30 ser Thr Trp His Trp Ala ser ser Lys Ala Pro híb Lys His Ala xle 35 40 45

Vai Thr Vai Thr Tyr Asp ser Glu Glu Gin Arg Gin Gin Phe Leu Asp 50 55 60

Vai vai Lys Ile Pro Pro Thr Ile ser His Lys Leu Gly phe Met ser 65 70 75 80

Leu His Leu Leu (2) INFORMAÇÃO PARA SEQ ID NO:82: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 80 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 115 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:82:

Thr pro Ile Ile Bis Leu Lys Gly Asp Arg Asn ser Leu Lys cys Leu 1 5 10 15 Arg Tyr Arg Leu Arg Lys Bis Ser Asp Bis Tyr Arg Asp Ile Ser ser 20 25 30 Thr Trp Bis Trp Thr Gly Ala Gly Asn Glu Lys Thr Gly Ile Leu Thr 35 40 45 Vai Thr Tyr His Ser Glu Thr Gin Arg Thr Lys Phe Leu Asn Thr Vai 50 55 60

Ala Ila Pro Asp ser vai Gin lie Leu Vai Gly Tyr Asn Thr Met Tyr 65 70 75 80 (2) INFORMAÇÃO PARA SEQ ID NO:83: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 80 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:83:

Thr Pro ile Vai Bis Leu Lys Gly Asp Ala Asn Thr Leu Lys cys Leu 1 5 10 15 Arg Tyr Arg Phe Lys Lys Bis cys Thr Leu Tyr Thr Ala Vai Ser Ser 20 25 30 Thr Trp Bis Trp Thr Gly Bis Aen Tyr Lys Bis Lys Ser Ala Ile Vai 35 40 45 Thr Leu Thr Tyr Asp Ser Glu Trp Gin Arg Asp Gin Phe Leu ser Gin 50 55 60 Vai Lys Ile Pro Lys Thr Ile Thr Vai Ser Thr Gly Phe Met ser Ile 65 70 75 80 (2) INFORMAÇÃO PARA SEQ ID NO:84: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 81 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO 116 ΕΡ Ο 796 344 /ΡΤ

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:84:

Ala Pro lie Vai His Leu Lys cly Glu ser Asn ser Lea Lys cys Leu 1 5 10 15

Arg Tyr Arg Leu Lys Pro Tyr Asn Glu Leu Tyr ser ser Met ser ser 20 ‘ 25 30

Thr Trp Bis Trp Tbr Ser Αβρ Asn Lys Asn Ser Lys Asn Gly ile vai 35 40 45

Thr vai Tbr Phe Vai Thr Gly Gin Gin Gin Gin Met Phe Leu Gly Thr 50 55 60

Vai Lys Ile Pro Pro Tbr Vai Gin lie ser Tbr Gly Phe Met Tbr Leu 65 70 75 80

Vai (2) INFORMAÇÃO PARA SEQ ID NO:85: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:85:

Gly Zle Vai Glu Gin Cys Cys Thr Ser He Cys Ser Leu Tyr Gin Leu 15 10 15

Glu Asn Tyr Cys Asn 20 (2) INFORMAÇÃO PARA SEQ ID NO:86: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 117 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:86:

Phe Vai Asn Gin Bis Leu Cys Gly Ser His Leu Vai Glu Ala Leu Tyr 15 10 15

Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 (2) INFORMAÇÃO PARA SEQ ID NO:87: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:87:

Gly Ile Vai Glu Gin Cys Cys Ala Ser Vai Cys ser Leu Tyr Gin Leu 15 10 15

Glu Asn Tyr Cys Asn 20 (2) INFORMAÇÃO PARA SEQ ID NO:88: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:88:

Phe Vai Asn Gin His Leu Cys Gly ser Bis Leu Vai Glu Ala Leu Tyr 15 10 15

Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 (2) INFORMAÇÃO PARA SEQ ID NO:89: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 118 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:89:

Gin Leu Tyr ser Ala Leu Ala Asn Lys cys cys His vai Gly cys lie 15 10 15

Lys Arg ser Leu Ala Arg Phe Cys 20 (2) INFORMAÇÃO PARA SEQ ID NO:90: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:90:

Asp ser Trp Met Glu Glu Vai Xle Lys Xle Cys Gly Arg Glu Leu Vai 15 10 15

Arg Ala Gin lie Ala Ile Cys Gly Met ser Thr Trp Ser Lys Arg Ser 20 25 30

Leu (2) INFORMAÇÃO PARA SEQ ID NO:91: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 119 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:91:

Glu GIu Lys Het Gly Thr Ala Lys Lys cys cya Ala lie Gly Cys Ser 15 10 15

Thr Glu Asp Phe Arg Het Vai cys 20 (2) INFORMAÇÃO PARA SEQ ID NO:92: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 40 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:92:

Arg Pro Asn Trp Glu Glu Arg ser Arg Leu Cys Gly Arg Asp Leu lie 15 10 15

Arg Ala Phe lie Tyr Leu Cys Gly Gly Thr Arg Trp Thr Arg Leu Pro 20 25 30

Asn Phe Gly Asn Tyr Pro Ile Met 35 40 (2) INFORMAÇÃO PARA SEQ ID NO:93: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 182 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 120 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:93:

Ser Gly Ile Vai Pro Thr Leu Gin Asn ile val ser Thr val Asn Leu 1 5 10 15 ASp Cys Lys Leu Asp Leu Lys Ala Ile Ala Leu Gin Ala Arg Asn Ala 20 25 30 Glu Tyr Asn Pro Lys Arg Phe Ala Ala val lie Met Arg Ile Arg Glu 35 40 45 Pro Lye Thr Thr Ala Leu Ile Phe Ala ser Gly Lys Met Val cys Thr 50 55 60 Gly Ala Lys Ser Glu Asp Phe Ser Lys Met Ala Ala Arg Lys Tyr Ala 65 70 75 80 Arg Ile vai Gin Lys Leu Gly Phe Pro Ala Lys Phe Lys Asp Phe Lye 85 90 95 Xle Gin Asn Ile Vai Gly Ser Cys Asp Val Lys Phe Pro Ile Arg Leu 100 105 110 Glu Gly Leu Ala Tyr Ser Bis Ala Ala Phe ser ser Tyr Glu pro Glu 115 120 125 Leu Phe Pro Gly Leu Ile Tyr Arg Met Lys val Pro Lys Ile val Leu 130 135 140 Leu Xle Phe Vai Ser Gly Lys Ile Vai Ile Thr Gly Ala Lys Met Arg 145 150 155 160 ASp Glu Thr Tyr Lys Ala Phe Glu Asn Ile Tyr pro val Leu Ser Glu 165 170 175 Phe Arg Lya Ile Gin Gin 180 (2) INFORMAÇÃO PARA SEQ ID NO:94: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 121 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:94:

Asn Ser Asn Ser Tbr Pr o He Vai His Leu Lys Gly Asp Ala Asn Thr 15 io 15

Leu Lys cys Leu Arg Tyr Arg Phe Lys Lys Eis cys Thr Leu Tyr Thr 20 25 30

Ala Vai Ser ser Thr Trp Bis Trp Thr Gly His Asn vai Lys His Lys 35 40 45

Ser Ala Zle Vai Thr Leu Thr Tyr Asp ser Glu Trp Gin Arg Asp Gin 50 55 60

Phe Leu Ser Gin Vai Lys xle pro Lys Thr lie Thr Vai ser Thr Gly 65 70 75 80

Phe Het Ser lie (2) INFORMAÇÃO PARA SEQ ID NO:95: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:95:

Asn Ser Asn Thr Thr Pro He vai Bis Leu Lys Gly Asp Ala Asn Thr 15 10 15

Leu Lys Cys Leu Arg Tyr Arg Phe Lys Lys Bis cys Thr Leu Tyr Thr 20 25 30

Ala Vai Ser ser Thr Trp Bis Trp Thr Gly Bis Asn Vai Lys Bis Lys 35 40 45

Ser Ala lie vai Thr Leu Thr Tyr Asp ser Glu Trp Gin Arg Asp Gin 50 55 60

Phe Leu ser Gin Vai Lys lie Pro Lys Thr Ile Thr Vai Ser Thr Gly 65 70 75 80

Phe Het ser Ile (2) INFORMAÇÃO PARA SEQ ID NO:96: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 83 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 122 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: : SEQ ID NO:96: ser Gly Asn Thr Thr Pro Ile ile Bis Leu Lya Gly Asp Arg Asn ser 1 5 10 15 Leu Lys cys Leu Arg Tyr Arg Leu Arg Lys HÍS Ser Asp His Tyr Arg 20 25 30 Asp lie ser ser Thr Trp His Trp Thr Gly Ala Gly Asn Glu Lys Thr 35 40 45 Gly Ile Leu Thr Vai Thr Tyr Eis Ser Glu Thr Gin Arg Thr Lys Phe 50 55 60 Leu Asn Thr Vai Ala Ile Pro Asp Ser vai Gin Ile Leu vai Gly Tyr 65 70 75 80 Met Thr Met (2) INFORMAÇÃO PARA SEQ ID NO:97: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácído (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:97:

Ser Gly Asn Thr Ala Pro lie vai Bis Leu Lys Gly Glu Ser Asn Ser 15 10 15

Leu Lys Cys Leu Arg Tyr Arg Leu Lys Pro Tyr Lys Glu Leu Tyr Ser 20 25 30

Ser Met Ser Ser Thr Trp Bis Trp Thr Ser Asp Asn Lys Asn $er Lys 35 40 45

Asn Gly Xle Vai Thr Vai Thr Phe Vai Thr Glu Gin Gin Gin Gin Met 50 55 60

Phe Leu Gly Thr Vai Lys ile Pro Pro Thr Vai Gin lie Ser Thr Gly 65 70 75 80

Phe Met Thr Leu 123 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:98: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 89 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:98:

Ser Gly Asn Thr ser Cys Phe Ala Leu lie Ser Gly Thr Ala Asn Gin 15 10 15

Vai Lys Cys Tyr Arg Phe Arg Vai Lys Lys Asn His Arg Hia Arg Tyr 20 25 30

Glu Asn Cys Thr Thr Thr Trp Phe Thr Vai Ala Asp Asn Gly Ala Glu 35 40 45

Arg Gin Gly Gin Ala Gin Xle Leu Ile Thr Phe Gly ser Pro Ser Gin 50 55 60

Arg Gin Asp Phe Leu Lys Bis Vai Pro Leu Pro Pro Gly Met Asn Ile 65 70 75 80

Ser Gly phe Thr Ala Ser Leu Asp Phe 85 (2) INFORMAÇÃO PARA SEQ ID NO:99: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 7 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: C-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:99:

Ser Asn Lys Lys Thr Thr Ala 1 5 124 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO:100: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 4 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:100

Asn Ser Asn Thr 1 (2) INFORMAÇÃO PARA SEQ ID NO:101: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 4 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:101

Ser Gly Asn Thr 1 (2) INFORMAÇÃO PARA SEQ ID NO:102: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 6 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:102

Ser ser Gly Ser ser Gly 1 5 125 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO:103: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:103:

Cys Tyr Pro Glu Ile Lys Asp Lys Glu Glu Vai Gin Arg Lys Arg 15 10 15 (2) INFORMAÇÃO PARA SEQ ID NO:104: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 66 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:104:

Met Glu Gin Arg Ile Thr Leu Lys Asp Tyr Ala Het Arg Phe Gly Gin 1 5 10 15

Thr Lys Thr Ala Lys Asp Leu Gly vai Tyr Gin Ser Ala Ile Αβη Lys 20 25 30

Ala Ile His Ala Gly Arg Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly 35 40 45

Ser Vai Tyr Ala Glu Glu Vai Lys Pro Phe Pro Ser Asn Lys Lys Thr 50 55 60

Thr Ala 65 (2) INFORMAÇÃO PARA SEQ ID NO:105: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 66 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína 126 ΕΡ Ο 796 344 /ΡΤ

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (x) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:105:

Met Glu Gin Glu Ile Thr Leu Lye Asp Tyr Ala Met Arg phe Gly Gin 15 10 15

Thr Lys Thr Ala Lys Asp Leu Gly vai Tyr Gin Ser Ala Ile Asn Lya 20 25 30

Ala Ile Bis Ala Gly Arg Lys ile Phe Leu Thr ile Asn Ala Asp Gly 35 40 45

Ser vai Tyr Ala Glu Glu vai Lys pre Phe Pro ser Asn Lys Lys Thr 50 55 60

Thr Ala 65 (2) INFORMAÇÃO PARA SEQ ID NO:106: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 66 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:106:

Net Arg Gin Arg Ile Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 15 10 15

Thr Lys Thr Ala Lys Asp Leu Gly Vai Tyr Gin ser Ala Ile Asn Lys 20 25 30

Ala Ile Bis Ala Gly Arg Lys Ile Phe Leu Thr ile Asn Ala Asp Gly 35 40 45 ser vai Tyr Ala Glu Glu vai Lys Pro Phe Pro ser Asn Lys Lys Thr 50 55 60

Thr Ala 65 (2) INFORMAÇÃO PARA SEQ ID NO:107: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 96 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 127 ΕΡ Ο 796 344 /ΡΤ (íi) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:107:

Ser Thr Lys Lys Lys Pro Leu Thr Gin Glu Gin Leu Glu Asp Ala Arg 1 5 10 15 Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu Ser 20 25 30 Gin Glu ser val Ala Asp Lys Met Gly Met Gly Gin ser Gly Val Gly 35 40 45 Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala Leu 50 55 60 Leu Ala Lys Ile Leu Lys val Ser Val Glu Glu Phe ser Pro Ser xle 65 70 75 so Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Glu Pro ser 85 90 95 (2) INFORMAÇÃO PARA SEQ ID NO:108: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 96 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:108: ser Thr Lys Lys Lys pro Leu Thr Gin Glu Gin Leu Glu Asp Ala Arg 15 10 15

Arg Leu Lys Ala ile Tyr Glu Lye Lys Lys Asn Glu Leu Gly Leu Ser 20 25 30

Gin Glu ser Vai Ala Asp Lys Met Gly Met Gly Gin Ser Gly Vai Gly 35 40 45

Ala Leu Phe Asn Gly Xle Asn Ala Leu Asn Ala Tyr Asn Ala Ala Leu 50 55 60

Leu Ala Lys Xle Leu Lys Vai Ser Vai Glu Glu Phe ser Pro Ser Xle 65 70 75 80

Ala Arg Glu Ile Tyr Glu Met Cys Glu Ala Vai Ser Met Glu Pro Ser 85 90 95 128 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO:109: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 180 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:109:

Gly Φ ^4 H vai Glu Gin cya cys Thr ser Ile Cys Ser Leu Tyr Gin Leu 1 5 10 15 Glu Asn Tyr cye Asn Met Ser Het Glu Gin Arg Ile Thr Leu Lys Asp 20 25 30 Tyr Ala Het Arg Phe Gly Gin Thr Lys Thr Ala Lys Asp Leu Gly val 35 40 45 Tyr Gin ser Ala Ile Asn Lys Ala Ile His Ala Gly Arg Lys Ile Phe 50 55 60 Leu Thr Ile Aan Ala Asp Gly Ser Val Tyr Ala Glu Glu Val Lys Pro 65 70 75 80 Phe ?ro ser Asn Lye Lys Thr Thr Ala Ser Asn Lys Lys Thr Thr Ala 85 90 95 Asn Ser ΑΒΠ Thr Thr pro Ile val Bis Leu Lys Gly Asp Ala Asn Thr 100 105 110 Leu Lys cya Leu Arg Tyr Arg Phe Lys Lys His Cys Thr Leu Tyr Thr 115 120 125 Ala Vai Ser ser Thr Trp Bis Trp Thr Gly His Asn Val Lys His Lys 130 135 140 Ser Ala Ile Val Thr Leu Thr Tyr ASp ser Glu Trp Gin Arg Asp Gin 145 150 155 160 Phe Leu ser Gin val Lys ile pro Lys Thr Ile Thr val ser Thr Gly 165 170 175

Phe Het Ser Zle 180 (2) INFORMAÇÃO PARA SEQ ID NO:110: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 113 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO 129 ΕΡ Ο 796 344 /ΡΤ

(iv) ANTI-SENTIDO: NÃO (ν) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:110:

Gly Xle Vai Glu Gin Cys Cys Thr Ser Xle Cys ser Leu Tyr Gin Leu 1 5 10 15 Glu Asn Tyr Cys Asn Met Ser Met Glu Gin Arg Xle Thr Leu Lys Asp 20 25 30 Tyr Ala Met Arg Phe Gly Gin Thr Lys Thr Ala Lys Asp Leu Gly Vai 35 40 45 Tyr Gin ser Ala Xle &sn Lys Ala ile Bis Ala Gly Arg Lys xle Phe 50 55 60 Leu Thr Xle Asn Ala Asp Gly ser vai Tyr Ala Glu Glu Vai Lys Pro 65 70 75 80 Pbe Pro ser Asn Lys Lys Thr Thr Ala Ser Asn Lys Lys Thr Thr Ala 85 90 95 cys Asp Thr Asp Asp Arg His Arg Xle GlU Glu Lys Arg Lys Arg Lys 100 105 110 (2) INFORMAÇÃO PARA SEQ ID NO:111: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 292 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal 130 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:111:

Phe vai Asn Gin Bis Leu Cys Gly ser Bis Leu Vai Glu Ala Leu Tyr 15 10 15

Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Met ser 20 25 30

Met Glu Gin Glu lie Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 35 40 45

Thr Lys Thr Ala Lys Asp Leu Gly vai Tyr Gin ser Ala Ile Asn Lys 50 55 60

Ala Ile Bis Ala Gly Arg Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly 65 70 75 80 ser vai Tyr Ala Glu Glu vai Lys Pro Phe Pro ser Asn Lys Lys Thr 85 90 95

Thr Ala ser Asn Lys Lys Thr Thr Ala ser Ser Gly Ser Ser Gly Ser 100 105 110

Gly ile Vai Pro Gin Leu Gin Asn ile Vai Ser Thr vai Asn Leu Gly 115 120 125

Cys Lys Leu Asp Leu Lys Thr ile Ala Leu Arg Ala Arg Asn Ala Glu 130 135 140

Tyr Asn Pro Lys Arg Phe Ala Ala Vai Ile Met Arg Ile Arg Glu Pro 145 150 155 160

Arg Thr Thr Ala Leu Ile Phe ser ser Gly Lys Met Vai cys Thr Gly 165 170 175

Ala Lys ser Glu Glu Gin ser Arg Leu Ala Ala Arg Lys Tyr Ala Arg 180 185 190 val val Gin Lys Leu Gly Phe Pro Ala Lys Phe Leu Asp Phe Lys xle 195 200 205

Gin Asn Met val Gly ser cys Asp Val Lys Phe Pro Ile Arg Leu Glu 210 215 220

Gly Leu Val Leu Thr Bis Gin Gin Phe Ser Ser Tyr Glu Pro Glu Leu 225 230 235 240

Phe Pro Gly Leu Ile Tyr Arg Met Ile Lys Pro Arg Ile val Leu Leu 245 250 255

Ile Phe val ser Gly Lys Val Val Leu Thr Gly Ala Lys Val Arg Ala 260 265 270

Glu Ile Tyr Glu Ala Phe Glu Asn Ile Tyr Pro Ile Leu Lys Gly Phe 275 280 285

Arg Lys Thr Thr 290 131 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:112: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 273 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:112:

Phe Vai Asn Gin Bis Leu cys Gly ser BiS Leu Vai Glu Ala Leu Tyr 1 5 10 15 Leu vai cys Gly GlU Arg Gly phe Phe Tyr Thr Pro Lys Thr Met ser 20 25 30 Met Arg Gin Arg Ile Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 35 40 45 Thr Lys Thr Ala Lys Asp Leu Gly Vai Tyr Gin Ser Ala Ile Asn Lys 50 55 60 Ala zle Bis Ala Gly Arg Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly 65 70 75 80 ser Vai Tyr Ala Glu Glu Vai Lys Pro Phe Pro Ser Asn Lys Lys Thr 85 90 95 Thr Ala Ser Asn Lys Lys Thr Thr Ala Gly Asp Pro Gly Lys Lys Lys 100 105 110 Gin BiS Ile Cys Bis Ile Gin Gly cys Gly Lys Vai Tyr Gly Lys Thr 115 120 125 Ser Bis Leu Arg Ala Bis Leu Arg Trp His Thr Gly Glu Arg Pro Phe 130 135 140 Met Cys Thr Trp ser Tyr Cys Gly Lye Arg Phe Thr Arg Ser Asp Glu 145 150 155 160 Leu Gin Arg His Lys Arg Thr His Thr Gly GlU Lys Lys Phe Ala Cys 165 170 175 pro Glu cys Pro Lys Arg Phe Met Arg Ser ASp Bis Leu Ser Lys His 180 185 190 132 ΕΡ Ο 796 344 /ΡΤ

Ile Lys Thr His Gin Asn Lys Lye Gly Gly Pro Gly vai Ala Leu Ser 195 200 205

Vai Gly Thr Leu Pro Leu Asp ser Gly Ala Gly Ser Glu Gly Ser Gly 210 215 220

Thr Ala Thr Pro ser Ala Leu Ile Thr Thr Asn Met vai Ala Met Glu 225 230 235 240

Ala Ile cys Pro Glu Gly Ile Ala Arg Leu Ala Asn ser Gly Ile Aen 245 250 255

Vai Met Gin Vai Ala Asp Leu Gin Ser Ile Asn Ile ser Gly Asn Gly 260 265 270

Phe (2) INFORMAÇÃO PARA SEQ ID NO:113: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 421 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:113:

Gin Leu Tyr Ser Ala Leu Ala Asn Lys cys Cys His Val Gly Cys Ile 1 5 10 15 Lys Arg Ser Leu Ala Arg Phe Cys Met Ser Met Arg Gin Arg Ile Thr 20 25 30 Leu Lye Asp Tyr Ala Met Arg Phe Gly Gin Thr Lys Thr Ala Lys Asp 35 40 45 Leu Gly Val Tyr Gin Ser Ala Ile Asn Lys Ala Ile His Ala Gly Arg 50 55 60 Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly ser Val Tyr Ala Glu Glu 65 70 75 80 val Lys Pro Phe Pro Ser Asn Lys Lys Thr Thr Ala Ser Asn Lys Lys 85 90 95 Thr Thr Ala Met Ala Asp Asp Asp Pro Tyr Gly Thr Gly Gin Met Phe 100 105 110 133 ΕΡ Ο 796 344 /ΡΤ

His Leu Asη Thr Ala Leu Thr His ser Ile Phe Asn Ala elu Leu Tyr 115 120 125

Ser Pro Glu Ile Pro Leu Ser Thr Asp Gly Pro Tyr Leu Gin Ile Leu 130 135 140

Glu Gin Pro Lys Gin Arg Gly Phe Arg Phe Arg Tyr vai cys Glu Gly 145 150 155 160

Pro Ser Bis Gly Gly Leu Pro Gly Ala ser Ser Glu Lys Asn Lys Lys 165 170 175

Ser Tyr Pro Gin Vai Lys ile Cys Asn Tyr Vai Gly Pro Ala Lys Vai 180 185 190 lie Vai Gin Leu Vai Thr Asn Gly Lys Asn Ile His Leu His Ala Bis 195 200 205

Ser Leu Vai Gly Lys His Cys Glu Asp Gly Vai Cys Thr Vai Thr Ala 210 215 220

Gly Pro Lys Asp Met Vai Vai Gly Phe Ala Asn Leu Gly Ile Leu Bis 225 230 235 240

Vai Thr Lys Lys Lys Vai Phe Glu Thr Leu Glu Ala Arg Het Thr Glu 245 250 255

Ala Cys Ile Arg Gly Tyr Asn Pro Gly Leu Leu Vai His Ser Asp Leu 260 265 270

Ala Tyr Leu Gin Ala Glu Gly Gly Gly Asp Arg Gin Leu Thr Asp Arg 275 280 285

Glu Lys Glu Ile Ile Arg Gin Ala Ala Vai Gin Gin Thr Lys Glu Het 290 295 300

Asp Leu Ser vai vai Arg Leu Het Phe Thr Ala Phe Leu Pro Asp Ser 305 310 315 320

Thr Gly Ser Phe Thr Arg Arg Leu Glu Pro Vai Vai Ser Asp Ala Ile 325 330 335

Tyr Asp Ser Lys Ala Pro Asn Ala ser Asn Leu Lys Ile vai Arg Het 340 345 350

Asp Arg Thr Ala Gly cys vai Thr Gly Gly Glu Glu ile Tyr Leu Leu 35S 360 365

Cys Asp Lys Vai Gin Lys Asp Asp Ile Gin Ile Arg Phe Tyr Glu Glu 370 375 380

Glu Glu Asn Gly Gly Vai Trp Glu Gly Phe Gly Asp Phe Ser Pro Thr 385 390 395 400

Asp Vai His Arg Gin Phe Ala Ile Vai Phe Lys Thr Pro Lys Tyr Lys 405 410 415

Asp val Asn ile Thr 420 (2) INFORMAÇÃO PARA SEQ ID NO:114: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 391 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 134 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:114:

Met Arg Gin Arg Ile Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 1 5 10 15 Thr Lys Thr Ala Lys Aep Leu Gly Val Tyr Gin Ser Ala Ile Asn Lys 20 25 30 Ala Zle Bis Ala Gly Arg Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly 35 40 45 ser Vai Tyr Ala Glu Glu val Lys Pro Phe Pro ser Asn Lye Lys Thr 50 55 60 Thr Ala Met Ala Glu Asp Asp Pro Tyr Leu Gly Arg Pro Glu Gin Met 65 70 75 80 Phe Bis Leu Asp Pro Ser Leu Thr Bis Thr Ile Phe Asn pro Glu Val 85 90 95 Phe Gin Pro Gin Met Ala Leu Pro Thr Ala Asp Gly Pro Tyr Leu Gin 100 105 110 Ile Leu Glu Gin pro Lys Gin Arg Gly Phe Arg Phe Arg Tyr val Cys 115 120 125 Glu Gly Pro Ser Bis Gly Gly Leu Pro Gly Ala ser Ser Glu Lys Asn 130 135 140 Lys Lys ser Tyr Pro Gin Val Lys Ile cys Asn Tyr Val Gly Pro Ala 145 150 155 160 Lys val Ile Val Gin Leu Val Thr Asn Gly Lys Asn lie Bis Leu Bis 165 170 175 Ala Bis ser Leu Val Gly Lys Bis Cys Glu Asp Gly Ile cys Thr val 180 185 190 135 ΕΡ Ο 796 344 /ΡΤ

Thr Ala Gly Pro GlU Asp cys vai His Gly Phe Ala Asn Leu Gly Ile 195 200 205 Leu His Vai Thr Lya Lys Lys Vai Phe Glu Thr Leu Glu Ala Arg Met 210 215 220 Thr Glu Ala cys Ile Arg Gly Tyr Asn Pro Gly Leu Leu Val His Pro 225 230 235 240 Oi m < Leu Ala Tyr Leu Gin Ala Glu Gly Gly Gly Asp Arg Gin Leu Gly 245 250 255 Asp Arg Glu Lys Glu Leu Ile Arg Gin Ala Ala Leu Gin Gin Thr Lys 260 265 270 Glu Met Asp Leu ser vai Vai Arg Leu Met Phe Thr Ala Phe Leu Pro 275 280 285 Asp Ser Thr Gly ser Phe Thr Arg Arg Leu Glu Pro Val val Ser Asp 290 295 300 Ala lie Tyr λβρ ser Lys Ala Pro Asn Ala Ser Asn Leu Lys Ile val 305 310 315 320 Arg Met Asp Arg Thr Ala Gly Cys vai Thr Gly Gly Glu Glu Ile Tyr 325 330 335 Leu Leu cys Asp Lys vai Gin Lys Asp Asp Ile Gin Ile Arg Phe Tyr 340 345 350 Glu Glu GlU Glu Abd Gly Gly vai Trp Glu Gly Phe Gly Asp Phe Ser 355 360 365 Pro Thr Asp Vai His Arg Gin Phe Ala lie Val Phe Lys Thr Pro Lys 370 375 380 Tyr Lys Asp Ile Asn Ile Thr 385 390 (2) INFORMAÇÃO PARA SEQ ID NO:115: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 391 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal 136 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:115:

Met Glu Gin Glu Zle Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 15 10 15

Thr Lys Thr Ala Lye Asp Leu Gly vai Tyr Gin ser Ala Zle Asn Lys 20 25 30

Ala Zle Bis Ala Gly Arg Lys Zle Phe Leu Thr zle Asn Ala Asp Gly 35 40 45

Ser Vai Tyr Ala Glu Glu vai Lys pro Phe Pro Ser Asn Lys Lys Thr 50 55 SO

Thr Ala Met Ala Glu Asp Asp Pro Tyr Leu Gly Arg Pro Glu Gin Met 65 70 75 80

Phe His Leu Asp Pro Ser Leu Thr His Thr Zle Phe Asn Pro Glu Vai 85 90 95

Phe Gin Pro Gin Met Ala Leu Pro Thr Ala Asp Gly Pro Tyr Leu Gin 100 105 110

Zle Leu Glu Gin Pro Lys Gin Arg Gly Phe Arg Phe Arg Tyr Vai Cys 115 120 125

Glu Gly Pro ser His Gly Gly Leu Pro Gly Ala Ser Ser Glu Lye Asn 130 135 140

Lys Lys Ser Tyr Pro Gin vai Lys Zle cys Asn Tyr vai Gly Pro Ala 145 150 155 160

Leu Bis 175

Lys Vai Zle Vai Gin Leu vai Thr Asn Gly Lys Asn Zle His 165 170

Ala His ser Leu vai Gly Lys His cys Glu Asp Gly zle cye Thr Vai 180 185 190

Thr Ala Gly Pro Glu Asp'Cys Vai His Gly Phe Ala Asn Leu Gly Zle 195 200 205

Leu His Vai Thr Lys Lys Lys Vai 210 215

Thr Glu Ala Cys Zle Arg Gly Tyr 225 230

Asp Leu Ala Tyr Leu Gin Ala Glu 245

Asp Arg Glu Lye Glu Leu zle Arg 260

Glu Met Asp Leu Ser Vai Vai Arg 275 280

Phe Glu Thr Leu Glu Ala Arg Met 220

Asn Pro Gly Leu Leu Vai His Pro 235 240

Gly Gly Gly Asp Arg Gin Leu Gly 250 255

Gin Ala Ala Leu Gin Gin Thr Lys 265 270

Leu Met Phe Thr Ala Phe Leu Pro 285 137 ΕΡ Ο 796 344 /ΡΤ

Asp Ser Thr Gly Ser Phe Thr Arg Arg Leu Glu Pro Vai Vai Ser Asp 290 295 300 Ala Ile Tyr Asp ser Lys Ala Pro Asn Ala ser Asn Leu Lys Ile Vai 305 310 315 320 Arg Met Asp Arg Thr Ala Gly Cys Vai Thr Gly Gly Glu Glu Ile Tyr 325 330 335 Leu Leu Cys Asp Lys vai Gin Lys Asp ASp Ile Gin Ile Arg Phe Tyr 340 345 350 Glu Glu Glu Glu Asn Gly Gly vai Trp Glu Gly Phe Gly Asp Phe ser 355 360 365 Pro Thr Asp vai His Arg Gin Phe Ala Ile vai Phe Lys Thr Pro Lys 370 375 380 Tyr Lys ASP Ile Asn Ile Thr 385 390 (2) INFORMAÇÃO PARA SEQ ID NO:116: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 241 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:116:

Met Arg Gin Arg ile Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 15 10 15

Thr Lys Thr Ala Lys Asp Leu Gly Vai Tyr Gin Ser Ala Ile Asn Lys 20 25 30

Ala ile His Ala Gly Arg Lys Ile Phe Leu Thr He Asn Ala Asp Gly 35 40 45

Ser Vai Tyr Ala Glu Glu vai Lys Pro Phe Pro Ser Asn Lys Lys Thr 50 55 60

Thr Ala ser Asn Lys Lys Thr Thr Ala Gly Asp Pro Gly Lys Lys Lys 65 70 75 80

Gin His ile cys His Ile Gin Gly cys Gly Lys Vai Tyr Gly Lys Thr . 85 90 95 138 ΕΡ Ο 796 344 /ΡΤ

Ser His Leu Arg Ala His Leu Arg Trp His Thr Gly Glu Arg Pro Phe 100 105 no

Met cys Thr Trp ser Tyr cys Gly Lys Arg phe Thr Arg ser Asp Glu 115 120 125

Leu Glu Arg His Lys Arg Thr His Thr Gly Glu Lys Lys Phe Ala cys 130 135 140

Pro Glu cys Pro Lys Arg Phe Met Arg ser Asp His Leu Ser Lys His 145 150 155 160 lie Lys Thr His Gin Asn Lys Lys Gly Gly Pro Gly Vai Ala Leu Ser 165 170 175

Vai Gly Thr Leu Pro Leu Asp ser Gly Ala Gly ser Glu Gly ser Gly 180 185 190

Thr Ala Thr Pro ser Ala Leu lie Thr Thr Asn Met vai Ala Met Glu 195 200 205

Ala ile cys Pro Glu Gly Xle Ala Arg Leu Ala Asn ser Gly lie Asn 210 215 220 vai Met Gin vai Ala Asp Leu Gin Ser Ile Asn Xle Ser Gly Asn Gly 225 230 235 240

Phe (2) INFORMAÇÃO PARA SEQ ID NO:117: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 10 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA : NO

(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:117: GGGAMTNYCC 10 (2) INFORMAÇÃO PARA SEQ ID NO:118: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 72 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal 139 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:118: H6t GlU pro val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly ser 1 5 10 15 GlH pro Lys Thr Ala Cys Thr Aan Cys Tyr Cys Lys Lys Cys Cys Phe 20 25 30 Hia Cya Gin Val Cya Phe lie Thr Lya Ala Leu Gly Ile Ser Tyr Gly 35 40 45 Arg Lys Lys Arg Arg Gin Arg Arg Arg Ala His Gin Asn Ser Gin Thr 50 55 60 His Gin Ala Ser Leu Ser Lys Gin 65 70

Lisboa,

Claims

ΕΡ Ο 796 344 /ΡΤ 1/5 REIVINDICAÇÕES 1. Ácido nucleico sonda (PNA) compreendendo duas sequências diferentes que são: a) uma sequência de cadeia simples (1/2 tbr) que é capaz de formar, sob condições de hibridação, um híbrido (TBR) com um ácido nucleico alvo (TNA); e b) uma sequência de cadeia simples (1/2 BBR) que é capaz de formar, sob condições de hibridação, um híbrido (BBR) com uma sequência de cadeia simples presente num ácido nucleico de reforço (BNA); em que a referida TBR é capaz de se ligar com elevada afinidade a uma substância (TBA) capaz de discriminar entre um híbrido emparelhado (TBR) e um híbrido possuindo nucleótidos desemparelhados, e em que a referida BBR é capaz de se ligar com elevada afinidade a uma substância (BBA) capaz de discriminar entre um híbrido emparelhado (BBR) e um híbrido possuindo nucleótidos desemparelhados.
2. pna de acordo com a reivindicação 1 em que a TBR é constituída por um ou mais locais de reconhecimento para uma proteína de ligação a um ácido nucleico, uma proteína de ligação ao ADN, uma proteína de ligação a um híbrido ADN-ARN ou uma proteína de ligação a ARN.
3. PNA de acordo com a reivindicação 2 em que a TBR é um local de reconhecimento de uma proteína de ligação a um ácido nucleico presente no genoma de um patogénio ou é um local de ligação associado a uma condição patogénica numa genoma de vertebrado ou é um local de reconhecimento de uma proteína de ligação a um ácido nucleico presente no genoma de um organismo que contamina um processo de fermentação.
4. PNA de acordo com a reivindicação 2 em que a TBR é a LTR de HIV ou uma sua porção.
5. Método para detecção ou localização de uma sequência de tna específica, compreendendo os passo de: a) hibridação do referido TNA com o PNA da reivindicação 1; ΕΡ Ο 796 344 /ΡΤ 2/5 b) hibridação do referido PNA com um BNA contendo uma 1/2 BBR cuja sequência é complementar a uma sequência de 1/2 BBR no PNA; c) adição dos produtos dos passos (a) e (b) contendo uma TBR e uma BBR, a uma superfície, a um líquido ou a outro meio contendo um TBA; d) adição de BBA à mistura no passo (c) em que os referidos BBA compreendem: i) uma molécula ou uma porção de uma molécula que é capaz de se ligar selectivamente a uma BBR; ii) um indicador detectável; e e) detecção do sinal produzido pelo indicador ligado ao bba.
6. Método de acordo com a reivindicação 5 em que o referido indicador é uma proteína, incluindo enzimas capazes de catalisar reacções que conduzam à produção de produtos de reacção coloridos; um radionuclido; esferas coloridas.
7. Método in vitro de amplificação do sinal obtido através da ligação do PNA de acordo com a reivindicação 1 a um TNA, que compreende a ligação dos BNA ao híbrido PNA-TNA e a ligação dos BBA marcados aos BNA.
8. Método para detecção ou localização de sequências de ácido nucleico específicas com um elevado grau de sensibilidade e especificidade que compreende: a) adição de PNA tal como definidos na reivindicação 1, contendo uma 1/2 BBR e uma 1/2 TBR, a uma amostra contendo ou suspeita de conter TNA contendo sequências de 1/2 TBR, para formar um complexo possuindo regiões de ligação ao alvo, TBR, formadas pela hibridação de 1/2 TBR complementares presentes nos PNA e TNA, respectivamente; b) ligação das TBR formadas no passo (a) a um TBA imobilizado para formar um complexo TBA-TNA-PNA; c) adição de Ácidos Nucleicos de Reforço, BNA, contendo regiões de ligação de reforço, 1/2 BBR, ao complexo formado no passo (b) de modo a que as 1/2 BBR nos BNA hibridem com as sequências de 1/2 BBR presentes nos PNA ou com as 1/2 BBR presentes nos BNA já ligados ao PNA, ΕΡ Ο 796 344 /ΡΤ 3/5 para formar BBR, de modo que se formem complexos TBA-TNA-PNA-(BNA)n; d) adição de Ácidos Nucleicos em "gancho de cabelo", HNA, contendo sequências de 1/2 BBR, ao complexo formado no passo (c) de modo a que as 1/2 BBR nos HNA hibridem com quaisquer sequências de 1/2 BBR disponíveis presentes nos BNA do complexo do passo (c), rematanto deste modo a extensão dos BNA nos complexos TBA-TNA-PNA-(BNA)n do passo (c) para formar complexos TBA-TNA-PNA-(BNA) n-HNA; e) adição de Conjuntos de Ligação de Reforço, BBA, ligados a porções indicadoras, aos complexos TBA-TNA-PNA-(BNA)n-HNA formados no passo (d) para formar complexos TBA-TNA-PNA-(BNA-BBA) n-HNA; e f) detecção dos sinais produzidos pelas porções indicadoras ligadas aos TBA, PNA, BNA, BBA OU HNA nos complexos TBA-TNA-PNA-(BNA-BBA) n-HNA do passo (e); em que o TNA compreende: i) uma ou mais sequências de ácido nucleico de 1/2 TBR específicas, cuja presença ou ausência numa determinada amostra se pretende confirmar; o BNA compreende: i) uma 1/2 BBR, tal como mostrada na Figura 1 (Ilb), que possui uma sequência que é complementar a uma sequência de 1/2 BBR num PNA e que é capaz de formar, sob condições de hibridação, um híbrido, BBR, com o PNA; ii) um OSA, que é sem suporte ou indicador ligado ou com suporte ligado, ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores; iii) locais de hibridação adicionais, 1/2 BBR, para outros BNA; e iv) sequências, 1/2 BBR, que podem hibridar com BNA já hibridados com o PNA; o BBA compreende: i) uma molécula ou uma porção de uma molécula que é capaz de se ligar selectivamente a uma BBR; e ΕΡ Ο 796 344 /ΡΤ 4/5 ii) um OSA, que é sem suporte e/ou indicador ligado ou com suporte ligado, ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores; e o tba compreende: i) uma molécula ou uma porção de uma molécula que é capaz de se ligar selectivamente a uma TBR; e ii) sem suporte e/ou indicador ligado ou com suporte ligado, ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores.
9. Método de hibridação de fase sólida para detecção da presença de um polinucleótido alvo através da utilização de um PNA tal como definido na reivindicação 1, envolvendo: a imobilização de um polinucleótido alvo, se presente numa amostra de teste, directamente ou através de uma estrutura de captura intermediária, numa fase sólida num local de captura; antes, durante ou após a referida imobilização, a ligação de um marcador detectável ao referido polinucleótido alvo, se presente; e detecção do referido marcador, se houver algum, no referido local de captura; em que a imobilização compreende a utilização de um conjunto de ligação ao alvo (TBA) que se liga apenas a um único híbrido do ácido nucleico alvo e um ácido nucleico sonda (PNA) compreendendo uma 1/2 BBR capaz de se ligar a um ácido nucleico de reforço (BNA) contendo uma 1/2 BBR complementar de cadeia simples que, após hibridação com a 1/2 BBR no PNA, forma uma BBR capaz de se ligar a conjuntos de ligação de reforço marcados (BBA), em que os termos TBA, BNA, BBR e BNA são tal como definidos na reivindicação 1.
10. Estojo de teste de diagnóstico ou forense para a detecção de uma sequência de ácido nucleico alvo numa amostra de ácido nucleico, que compreende uma primeira e uma segunda sondas de ácido nucleico e uma primeira e uma segunda proteínas de ligação ao ácido nucleico, em que a primeira sonda possui uma sequência complementar à sequência alvo e uma sequência adicional; a primeira proteína de ligação é específica para o primeiro dúplex sonda-alvo; ΕΡ Ο 796 344 /ΡΤ 5/5 a segunda sonda é complementar à sequência adicional na primeira sonda; e a segunda proteína de ligação liga-se especificamente ao dúplex primeira sonda-segunda sonda e é marcada com um marcador detectável.
11. Estojo de acordo com a reivindicação 10, em que a primeira sonda é complementar à LTR de HIV e, após hibridação da primeira sonda com a LTR de HIV, forma-se um local de ligação para NF-kB ou uma sua subunidade, SP1, proteína de ligação a TATA, HIV-Detect I, II, III ou IV ou HIV-Lock.
12. Estojo de acordo com a reivindicação 11, em que a primeira proteína de ligação é NF-kB ou uma sua subunidade, SPl, proteína de ligação a TATA, HIV-Detect I, II, III ou IV ou HIV-Lock.
13. Estojo de acordo com qualquer uma das reivindicações 10 a 12, em que a primeira sonda, para além de ser complementar à LTR de HIV, compreende uma sequência que codifica o operador esquerdo ou direito do bacteriófago lambda, e a segunda sonda compreende a sequência complementar à referida sequência do operador esquerdo ou direito do bacteriófago lambda, de modo que, após hibridação da primeira e da segunda sondas, se forma um local de ligação para a proteína repressora Cl do bacteriófago lambda, a proteína cro do bacteriófago lambda ou um seu derivado ou homólogo.
14. Estojo de acordo com a reivindicação 13, em que a segunda proteína de ligação é a proteína repressora Cl do bacteriófago lambda, a proteína cro do bacteriófago lambda ou um seu derivado ou homólogo. Lisboa