PT96223B

PT96223B - Processo para a preparacao de um agente viral responsavel pela hepatite nao-a bnao-b de pos-transfusao

Info

Publication number: PT96223B
Application number: PT9622390A
Authority: PT
Inventors: Peter Edmund Highfield; Brian Colin Rodgers; Richard Seton Tedder; John Anthony James Barbara
Original assignee: Wellcome Found
Priority date: 1989-12-18
Filing date: 1990-12-17
Publication date: 1998-05-29
Also published as: PT96223A

Description

DESCRICÃO

A presente invenção refere-se ao isolamento e caracterização do agente virai responsável pela hepatite pós-transfusão não-A não-B (PT-NANBH) e em particular a polipéptidos virais de PT-NANBH, sequências de ADN que codificam esses polipeptídosviraes, vectores de expressão que contêm essas sequências de ADN, e células de hospedeiro transformadas por esses vectores de expressão. A presente invenção também se refere à utilização de uma sequência de ADN num ensaio de hibridização de ãcido nucleico para o diagnóstico de PT-NANBH. A presente invenção refere-se ainda à utilização em polipéptidos virais PT-NANBH ou an ticorpos moniclonais ou monoclonais contra esses polipépti1 dos num imunoensaio para o diagnóstico de PT-NANBH ou numa vacina para a sua preparação.

A hepatite não-A não-B (NANBH) é por definição um diagnóstico de exclusão e tem sido geralmente utilizada para descrever casos de infecção por hepatite virai em seres humanos que não são devidos aos vírus de hepatite A ou B. Na maior parte desses casos, a causa da infecção não foi identificada embora, no aspecto clínico e epidemiológico, se tenham pensados em vários agentes como sendo responsáveis por essa doença como descrito por Shih e col (Procr. Liver Dis. , 1986, 8, 433-452). Apenas nos Estados Unidos da América, até 10% das transfusões de sangue podem resultar em NANBH o que constitui um problema significativo. Mesmo para PT-NANBH podem existir vários agentes responsáveis pela infecção e ao longo dos anos têm sido feitas muitas reinvindicações para a identificação do agente, contudo nenhuma delas foi devidamente comprovada.

Pedido da Patente Europeia

88310922.5 propõe-se descrever o isolamento e caracterização do agente etiológico responsável pela PT-NANBH que é também referido no pedido como vírus da hepatite C (HCV) . Foi preparada uma biblioteca de cADN a partir do ãcido nucleico vi ral obtido de um chimpanzé infectado com PT-NANBH e que foi escrutinado utilizando anti-soro humano. Foram isolados e se quenciados vários clones positivos. 0 ácido nucleico e os dados da sequência de aminoácidos resultantes, que são descritos no pedido, representam aproximadamente 70% do genoma virai de lOkb e são derivados totalmente do seu terminal 3' correspondente à região de codificação não estrutural.

A presente invenção permitiu agora isolar e caracterizar os polipéptidos virais de PT-NANBH pela clonação e expressão das sequências de ADN que codificam esses polipéptidos virais. 0 ãcido nucleico e os dados de sequência de aminoácidos revelam com supresa que ambos têm diferenças consideráveis em relação aos dados correspondentes referidos no Pedido da Patente Europeia 88310922.5. No global estas diferenças representam até cerca de 20% do nível do ácido nucleico e cerca de 15% do nível de aminoácidos

mas algumas regiões das sequências mostram diferenças ainda maiores. 0 nível global da diferença é muito superior do que seria esperado para dois isolados do mesmo vírus mesmo tendo em conta os factores geográficos, e pensa-se que isto é devido a uma de duas razões possíveis.

Em primeiro lugar, os presentes inventores e os autores do Pedido de Patente Europeia acima referida utilizaram fontes diferentes para o ácido nucleico utilizado para a clonação de cADN. Em particular, o pedido de Patente Europeia descreve a utilização de plasma de chimpanzé como fonte para o material de partida de ácido nucleico virai, tendo sido feito a passagem do vírus através de um chimpanzé durante duas ocasiões. O PT-NANBH é obviamente uma doença humana e a passagem do vírus através de um hospedeiro estranho, mesmo se for parecido com o homem, deve resultar numa mutação elevada do ácido nucleico virai. Desta forma, os dados de sequência contidos no Pedido de Patente Europeia 88310922.5. podem não ser totalmente representativos para o verdadeiro agente virai responsável pelo PT-NANBH no homem. Pelo contrário, os presentes inventores utilizaram ácido nucleico virai a partir de uma fonte de plasma humano como material de partida para a clonação do cADN. Os dados de sequência assim obtidos correspondem mais provavelmente às sequências de ácido nucleico e aminoãcidos nativos de PT-NANBH.

Em segundo lugar, pode acontecer que o agente virai exista sob a forma de mais de um subtipo e os dados de sequência descritos no Pedido de Patente Europeia e os elucidados pelos presentes inventores correspondam a subtipos separados e diferentes do mesmo agente virai. Alternativamente, pode acontecer que o valor da diferença entre os dois conjuntos de dados de sequência seja devido a uma combinação destes dois factores.

A presente invenção proporciona um polipéptido virai PT-NANBH compreendendo um antigénio que possui uma sequência de amino ácidos que é pelo menos 90% ho móloga à sequência de aminoácidos apresentada em SEQ ID NO:

3,4,5,18,19,20,21 ou 22, ou é um seu fragmento antigénico.

A SEQ ID NO: 3,4,5,18,19,20,21 ou 22 representa a sequência de aminoácidos tal como deduzida da sequência de ácidos nucleicos. A sequência de amino ácidos é de preferência de pelo menos 95% ou mesmo 98% homóloga com a sequência de aminoácidos representada em SEQ IN NO: 3,4,5,18,19,20,21 ou 22. Opcionalmente, o antigénio pode ser fundido num polipéptido heterólogo.

Podem ser opcionalmente utilizados em conjunto dois ou mais antigénios, quer em combinação quer fundidos como um polipéptido único. A utilização de dois ou mais antigénios desta forma num ensaio de diagnóstico proporciona resultados mais fiáveis na utilização do ensaio no escrutínio do sangue para o vírus de PT-NANBH. É obtido, de preferência, um antigénio a partir da região de codificação estrutural (a extremidade 5') e um outro antigénio é obtido a partir da região de codificação não estrutural (a extremidade 3') . É particularmente preferido que os antigénios sejam fundidos em conjunto como polipéptido recombinante. Esta última técnica oferece várias vantagens em gue os antigénios individuais podem ser combinados numa proporção fixa, pré-determinada (geralmente equimolar) e apenas é necessário produzir um único polipéptido, que é purificado e caracterizado..

Um fragmento antigénico de um antigénio possuindo uma sequência de aminoácidos que é de pelo menos 90% homóloga ou é representada na SEQ IN NO:

3,4,5,18,19,20,21 ou 22 contém de preferência um mínimo de cinco, seis, sete, oito, nove ou dez, quinze, vinte, trinta, quarenta, ou cinquenta aminoácidos. Os locais antigénicos desses antigénios podem ser identificados utilizando procedimentos convencionais. Estes procedimentos para envolver a fragmentação do próprio polipéptido utilizando enzimas proteolíticas ou agentes químicos e em seguida determinando a capacidade de cada fragmento para se ligar a anticorpos ou provocar uma resposta imune quando inoculado num animal ou sistema de modelo in vitro adequado (Strohmaier et col. J. Gen. Virol.. 1982, 59, 205-306). Alternativamente, o ADN que codifica o polipéptido pode ser fragmentado por digestão com

enzimas de restrição ou outras técnicas bem conhecidas e em seguida introduzido num sistema de expressão para produzir fragmentos (opcionalmente fundidos num polipéptido habitualmente de origem bacteriana) . Os fragmentos resultantes são ensaiados da forma anteriormente descrita (Spence et col. J. Gen. Virol.. 1989, 70, 2843-51; Smith et col. Gene.

1984, 29.; 263-9). Outra técnica é sintetizar quimicamente uns fragmentos pequenos de péptidos (com o comprimento de 3-20 aminoácidos, convencionalrnente 6 amino ácidos de comprimento) que cobre a sequência completa do polipéptido de comprimento total com cada péptido sobrepondo-se ao péptido adjacente. (Esta sobreposição pode ser de 1 a 10 aminoácidos mas é idealmente de n-1 aminoácidos em que n é o comprimento do péptido; Geysen e col. Proc. Natl. Acad. Sei., 1984, 81, 3998-4002). Cada péptido é em seguida ensaiado da forma anteriormente descrita com a excepção de o péptido ser habitualmente acoplado em primeiro lugar a alguma molécula veí culo para facilitar a inducção de uma resposta imune. Finalmente, existem processos preditivos que envolvem a análise da sequência para determinar características particulares, por exemplo hidrofllicidade, que se pensa estar associada com locais imunológicos importantes (Hopp e Woods, Proc. Natl. Acad. Sei., 1981,78, 3824-8; Berzofsky, Science,

1985, 229, 932-40). Estas previsões podem ser em seguida en saiadas utilizando as técnicas de polipéptido ou péptido recombinantes acima descritas.

polipéptido virai é, de preferência, proporcionado numa forma pura, isto é com uma pureza superior a 90% ou mesmo 95%.

polipéptido virai PT-NANBH da pre sente invenção pode ser obtido utilizando um sintetizador de aminoácido, se ele for um antigénio que possua não mais do que cerca de trinta resíduos, ou por tecnologia de ADN recombinante .

A presente invenção também proporciona uma sequência de ADN que codifica um polipéptido virai PT-NANBH como aqui definido.

A sequência de ADN da presente invenção pode ser sintética ou cionada. A sequência de ADN é, de preferência, a representada em SEQ ID NO: 3,4,5,18,19,20,21 ou 22.

Para se obter um polipéptido virai PT-NANBH compreendendo antigénios múltiplos, é preferível fundir as sequências de codificação individuais num quadro de leitura aberto único. A fusão deve obviamente ser efectuada de forma a que não seja significativamente comprometida a actividade antigénica de cada antigénio pela sua potência relativa em relação a outro antigénio. Deve ter-se particularmente em consideração a natureza das sequências da ligação real entre os antigénios. Os processos pelos quais podem ser obtidos esses polipéptidos simples são bem conhecidos.

A presente invenção também proporciona um vector de expressão contendo uma sequência de ADN, tal como aqui definida, e que é susceptível de, num hospedeiro adequado, expressar a sequência de ADN para produzir um polipéptido virai PT-NANBH.

O vector de expressão contem geralmente elementos de controlo de ADN que efectuam a expressão da sequência de ADN num hospedeiro adequado. Estes elementos podem variar de acordo com o hospedeiro mas incluem habitual mente um promotor, um local de ligação de ribosomas, e locais de início e paragem de translacção, e um local de terminação de transcrição. Exemplos desses vectores incluem plasmídios e vírus. Os vectores de expressão da presente invenção englobam vectores extracromossómicos e vectores que são integrados no cromossoma das células do hospedeiro. Para utilização em E. coli o vector de expressão pode conter a sequência de ADN da presente invenção opcionalmente sob a forma de uma fusão ligada ao terminal 5'- ou 3'- da sequência de ADN que codifica, por exemplo, β-galactosidade ou para o terminal 3'- da sequência de ADN que codifica, por exemplo o gene trNE. Para utilização no sistema de baculovirus de insecto (AcNPV), a sequência de ADN é opcionalmente fundida à sequência de codificação de polihedrina.

A presente invenção também proporciona uma célula hospedeiro transformada com um vector de expressão tal como aqui definido .

Exemplos de células hospedeiro para utilização na presente invenção incluem células procarióticas e eucarióticas, como por exemplo células de bactérias, leveduros, mamíferos e insectos. Exemplos particulares dessas células são E. coli, S. cerevisiae, P. pastoris, células do ovário da Hamster chinesa e da ratinha, e Spodoptera frugiperda e Tricoplusia ni. A escolha da célula hospedeiro pode depender de vários factores, mas, se for importante a modificação prós-translacional do polipéptido virai de PT-NANBH, então é preferível utilizar um hospedeiro eucariótico.

A presente invenção também proporciona um processo para a preparação de polipéptido virai PT-NANBH que compreende clonar-se ou sintetizar-se uma sequência de ADN codificando um polipéptido virai PT-NANBH, tal como aqui definido, inserir-se uma sequência de ADN num vector de expressão tal que seja susceptível de ser expresso num hospedeiro adequado, transformar-se uma célula hospedeiro com um vector de expressão, cultivar-se a célula do hospedeiro transformada, e isolar-se o polipéptido virai.

A clonação da sequência de ADN pode ser efectuada utilizando procedimentos convencionais conhecidos. Contudo, é particularmente vantajoso nesses procedimentos utilizar os dados de sequência aqui apresentados de forma a facilitar a identificação e isolamento das sequências de ADN clonadas pretendidas. 0 ARN é de preferência iso lado por agregação do virus do plasma de seres humanos infectados identificados por implicação na transmissão de PT-NANBH. 0 ARN isolado é transcrito inversamente no cADN utilizando uma primagem aleatória ou com oligo-dT. Opcionalmente, o ARN pode ser submetido a uma fase de pré-tratamento para remover qualquer estrutura secundária que possa interferir com a síntese de cADN, por exemplo, por aquecimento ou reacção com hidróxido de metil mercúrico. 0 cADN é habitualmente modificado por adição de ligantes seguido da digestão

com uma enzima de restrição. Ele em seguida inserido num vector de clonação, como por exemplo pBR322 ou um seu derivado ou nos vectores lambda gtlO e gtll (Huynh et col., DNA Cloninq, 1985, Vol 1: A Praticai Approach, Oxford, IRC Press) embalado em viriões como adequado, e as moléculas de ADN recombinantes resultantes utilizadas para transformar a

E.coli e assim produzir a biblioteca pretendida.

A biblioteca pode ser escrutinada utilizando uma técnica de escretinio convencional. Se a biblioteca for uma biblioteca de expressão, ela pode ser escrutinada utilizando um processo imunológico com antisoros obtidos da mesma fonte de plasma do material de partida de ARN e também com antisoros de fontes humanas adicionais que se pensa serem positivos a anticorpos contra PT-NANBH. Dado que os antisoros humanos contêm habitualmente anticorpos contra a E. coli que podem dar origem a um ruído de fundo elevado durante o escrutínio, é preferível tratar em primeiro lugar os antisoros com um lisado de E.coli não transformado de forma a remover todos esses anticorpos. É vantajoso utilizar um controlo negativo utilizando antisoros de dadores humanos credenciados isto é, de dadores humanos que tenham sido repetidamente ensaiados e que se verificou terem anticorpos contra a hepatite virai. Uma técnica de escrutínio alternativa seria utilizar como sondas de hibridização um ou mais oligonucleótidos marcados. A utilização de oligonucleótidos dos escrutínio de uma biblioteca de cADN é geralmente mais simples e mais fiável do que o escrutínio com antisoros. Os oligonucleótidos são preferivelmente sintetizados utilizando a informação das sequências de ADN aqui referidas. Podem ser efectuados um ou mais lotes adicionais de escrutínio de um tipo ou do outro, para caracterizar e identificar os clones positivos.

Tendo identificado um primeiro clone positivo, a biblioteca pode ser reescrutinada para a determinação de clones positivos adicionais utilizando o primeiro clone como sonda de hibridização. Alternativamente ou adicionalmente, podem ser preparadas outras bibliotecas e estas podem ser escrutinadas utilizando imunoescrutínios ou

sondas de hibridização. Desta forma, podem ser obtidas tras sequências de ADN.

Alternativamente, a sequência de ADN que codifica o polipéptido virai de PT-NANBH pode ser sintetizada utilizando procedimentos convencionais e isto pode ser preferido à clonagem do ADN em alguns casos (Gait, Oliqonucleotide Svnthesis: A Practical Approach, 1984, Oxford, IRL Press).

A sequência de ADN pretendida assim cionada ou sintetizada, pode ser inserida num vector de expressão utilizando técnicas conhecidas e convencionais. 0 vector de expressão é normalmente cortado utilizando enzimas de restrição e a sequência de ADN é inserida utilizando uma ligação de extremidade cega ou extremidade em lança. 0 corte é habitualmente feito no bocal de restrição numa posição conveniente no vector de expressão tal que, logo que inserido, a sequência de ADN esteja sob o controlo dos elementos funcionais de ADN que efectuam a sua expressão.

A transformação de uma célula hospedeiro pode ser efectuada utilizando técnicas convencionais. É habitualmente utilizado um marcador fenotípico para distinguir entre os transformantes que foram absorvidos com sucesso do vector de espressão e os que não foram.A cultura da célula hospedeiro transformada e o isolamento do polipéptido virai PT-NANBH pode também ser efectuada utilizando técnicas convencionais.

Os anticorpos específicos para um polipéptido virai PT-NANBH da presente invenção podem ser cultivados utilizando o polipéptido. 0 anticorpo pode ser policlonal ou monoclonal. 0 anticorpo pode ser utilizado ensaiando lotes de polipéptido virai PT-NANBH; purificação de um polipéptido virai PT-NANBH ou um lisado virai; mapeamento de epitopo; quando marcado, como conjugado num ensaio de tipo competitivo, para detecção de anticorpos; e nos ensaios de detecção de antigénios.

anticorpo policlonal contra um polipéptido virai PT-NANBH da presente invenção pode ser obtido por injecção de um polipéptido virai PT-NANBH, opcio ou9

nalmente acoplado a um veículo para promover uma resposta imune, num mamífero hospedeiro, como por exemplo ratinho, rato, ovelha ou coelho, e recuperando o anticorpo assim produzido. 0 polipéptido virai PT-NANBH é geralmente administrado sob a forma de uma formulação injectável em que o polipéptido é misturado com um diluente fisiologicamente aceitável. Podem ser incluídos na formulação adjuvantes como por exemplo o adjuvante completo de Freund (FCA) ou o adjuvante incompleto de Freund (FIA). A formulação é normalmente injectada num hospedeiro durante um período adequado de tempo, sendo tomadas amostras do plasma a intervalos de tempo adequados para ensaio para anticorpo virai anti- PT-NANBH. Quando é obtido um valor adequado de actividade, o hospedeiro é sangrado. O anticorpo é em seguida extraído e purificado do plasma sanguíneo utilizando procedimentos convencionais, por exemplo, por cromatografia de proteína A ou de permuta iónica.

Pode ser obtido um anticorpo monoclonal contra um polipéptido virai PT-NANBH da presente invenção fundindo células de uma linha de células imortalizantes cujas células produzem anticorpo contra o polipéptido virai, e cultivando a linha de células imortalizadas fundidas. Tipicamente, é inoculado um hospedeiro mamífero não humano, como por exemplo um ratinho ou um rato, com o polipéptido virai. Após ter passado um período de tempo suficiente para o hospedeiro criar uma resposta imune, são removidas as células que produzem anticorpos, como por exemplo esplenócitos. As células de uma linha de células imortalizantes, como por exemplo a linha de células do mieloma do ratinho ou do rato, são fundidas com as células produtoras de anticorpos e as fusões resultantes são escrutinadas para identificar uma linha de células, como por exemplo um hibridoma, que segrega o anticorpo monoclonal pretendido. A linha de células fundida pode ser cultivada e o anticorpo monoclonal purificado do meio de cultura de uma forma semelhante à purificação de anticorpo policlonal.

Os ensaios de diagnóstico com base na presente invenção podem ser utilizados para determinar a presença ou ausência de infecção PT-NANBH. Eles podem também ser utilizados para monitorar o tratamento dessa infecção, por exemplo em terapia com interferão. Num ensaio para o diagnóstico da infecção virai, existem três técnicas basicamente distintas que podem ser adotadas envolvendo a detecção do ácido nucleico virai, antigénio virai ou anticorpo virai. 0 ácido nucleico virai é geralmente encarado como o melhor indicador para a presença do próprio virus, e poderá identificar materiais que são susceptíveis de ser infecciosos. Contudo, a detecção do ácido nucleico não é habitualmente tão fácil como a detecção de antigénios ou anticorpos dado que o nível do alvo pode ser muito baixo. É utilizado o antigénio virai como marcador para a presença de vírus e como indicador da infecciosidade. Dependendo do vírus, a quantidade de antigénio presente numa amostra pode ser muito baixa e difícil de detectar. A detecção de anticorpos é relativamente fácil dado que, com efeito, o sistema imune do hospedeiro amplifica a resposta a uma infecção produzindo grandes quantidades de anticorpos circulantes. A natureza da resposta de anticorpos pode muitas vezes ser clinicamente útil, por exemplo, os anticorpos da classe IgM em vez de IgG são indicadores de uma infeccão recente, ou a resposta a um antigénio virai particular poder ser associado com o desaparecimento do vírus. Assim a técnica exacta adoptada para o diagnóstico de uma infecção virai depende das circunstâncias particulares e da informação conhecida. No caso de PT-NANBH, um ensaio de diagnóstico pode englobar qualquer destas três técnicas.

Num ensaio para o diagnóstico de PT-NANBH envolvendo a detecção de ãcido nucleico virai, o processo pode compreender hibridizar-se o ARN virai presente numa amostra de ensaio, ou cADN sintetizado desse ARN virai, com uma sequência de ADN correspondente à sequência de nucleótidos de SEQ ID NO: 3,4,5,18,19,20,21 ou 22 e escrutinando os híbridos de ãcido nucleico resultantes para identificar qualquer ácido nucleico virai de PT-NANBH. A aplicação deste processo é habitualmente restrita a uma amos tra de ensaio de um tecido adequado, como por exemplo uma

biópsia de fígado, em que o ARN virai está provavelmente pre sente a um teor elevado. A sequência de ADN correspondente à sequência de nucleótidos de SEQ ID NO: 3,4,5,18,19,20,21 ou 22 poder tomar a forma de um oligonucleótido ou de uma sequência de cADN opcionalmente contida dentro de um plasmídio. 0 escrutínio dos híbridos de ãcido nucleico é preferivelmente efectuado utilizando uma sequência de ADN marcado. Pode ser efectuado um ou mais lotes adicionais de escrutínio de um tipo ou de outro para caracterizar ainda mais os híbridos e identificar assim qualquer ácido nucleico virai PT-NANBH. As fases de hibridização e escrutínio são efectuadas de acordo com os procedimentos bem conhecidos.

Dada a aplicação limitada deste processo no ensaio do ácido nucleico virai, um processo preferido e mais conveniente compreende efectuar-se a síntese do cADN de ARN virai presente numa amostra de ensaio, amplificar-se uma sequência de ADN pré-escolhida correspondente a uma subsequência da sequência de nucleótidos de SEQ ID NO: 3,4,5,18,19,20,21 ou 22 e identificar-se a sequência de ADN pré-escolhida. A amostra de ensaio pode ser de qualquer tecido ou fluído fisiológico adequado e é preferivelmente concentrada para qualquer ARN virai presente. Exemplos de um tecido adequado incluem uma biópsia de fígado. Exemplos de um fluído fisiológico adequado incluem a urina, plasma, sangue, soro, sémen, lágrimas, saliva ou fluí do cebrebroespinal. Exemplos preferidos são o soro e o plasma.

A síntese do cADN é geralmente efeç tuada por transcrição inversa primada utilizando primários aleatórios definidos ou oligo-dT. 0 primário é, com vantagem, um oligonucleótido correspondente à sequência de nucleótidos de SEQ ID NO: 3,4,5,18,19,20,21 ou 22 e concebidos para enriquecer em cADN contendo a sequência préescolhida.

A amplificação da sequência de ADN pré-escolhida é preferivelmente efectuada utilizado a técnica da reacção em cadeia com polimerase (PCR) (Saiki et col, Science, 1985, 230. 1350-4). Nesta técnica, é utilizado

um par de primários de oligonucleótido um dos quais corresponde a uma parte da sequência de nucleótidos de SEQ ID NO:

3,4,5,18,19,20,21 ou 22 e o outro está localizado no lado 3' do primeiro e correspondente a uma parte da sequência complementar, definindo o par entre eles a sequência de ADN pré-escolhida. Os oligonucleótidos são habitualmente de pelo menos de 15, optimamente 20 a 26, base de comprimento e embora possam ser toleradas algumas incoerências variando as condições de reacção, a extremidade 3' dos oligonucleótidos deve ser perfeitamente complementar de forma a efectuar a primagem de forma eficaz. A distância entre as extremidades 3' dos oligonucleótidos podem ser de cerca de 100 a cerca de 2000 bases. Convenientemente, um dos pares de oligonucleótidos que é utilizado nesta técnica é também utilizado para efectuar a primagem da síntese de cADN. A própria técnica de PCR é efectuada no cADN numa forma de espiral única utilizando uma enzima, como por exemplo Taq polimerase e em excesso dos primários de oligonucleótidos em 20-40 ciclos de acordo com os protocolos publicados (Saiki e col, Science. 1988, 239, 487-491).

Como refinação técnica, podem ser efectuados vários lotes de amplificação, sendo cada lote primado por um par diferente de oligonucleótidos. Assim, após o primeiro lote de amplificação, pode ser utilizado um par interno de oligonucleótidos que define uma sequência de ADN mais pequena (por exemplo de 50 a 500 bases de comprimento) para um segundo lote de amplificação. Neste refinamento um pouco mais fiável,referido como PCR em Cadeia é obviamente a sequência de ADN final amplificada que constitui a sequência pré-seleccionada. (Kemp e col..Proc. Natl. Acad. Sei. . 1989, 86(7) , 2423-7 e Mullis e col, Methods in Enzvmolocrv 1987, 155, 335-350).

A identificação da sequência de ADN pré-selecionada pode ser efectuada por análise dos produtos de PCR num gel de agarose. A presença de uma banda no peso molecular calculado para a sequência pré-seleccionada é um indicador positivo da presença do ácido nucleico virai na amostra de ensaio. Os processos alternativos de identifica13

ção incluem aqueles que se baseiam no ensaio de revelação de Southern, revelação por pontos, restricção de oligómeros e sequenciação de ADN.

A presente invenção também proporciona um dispositivo de ensaio para a detecção do ácido nucleico virai de PT-NANBH, que compreende

i) um par de primários de oligonucleótidos um dos quais corresponde a uma parte da sequência de nucleótidos de SEQ IN NO: 3,4,5,18,19,20,21 ou 22 e o outro está localizado ao lado 3' do primeiro e corresponde a uma parte da sequência complementar definindo o par entre eles uma sequência de ADN pré-seleccionada;

ii) uma enzima de transcriptase inversa para a síntese de cADN a partir do ARN da amostra de ensaio a montagem do primário correspondente à sequência de nucleótidos complementares de SEQ ID NO: 3,4,5,18,19,20,21 ou 22;

iii) uma enzima susceptível de amplificar a sequência de ADN pré-seleccionada; e opcionalmente;

iv) soluções de lavagem e tampões de reacção.

O dispositivo de ensaio também contêm, com vantagem, uma amostra de controlo positiva para facilitar a identificação do ãcido nucleico virai.

As caracteristicas dos primários e as enzimas são preferivelmente como acima descrito em ligação com a técnica de PCR.

Num ensaio para o diagnóstico de PT-NANBH envolvendo a detecção de um antigénio virai ou de um anticorpo virai, o processo pode compreender fazer-se con tactar uma amostra de.ensaio com um polipéptido virai de PT-NANBH da presente invenção, ou um anticorpo policlonal ou monoclonal contra o polipéptido, e determinar-se se existe qualquer ligação de anticorpos-antigénio contido dentro da amostra de ensaio. Para este fim, pode proporcionar-se um dispositivo de ensaio compreendendo um polipéptido virai de PT-NANBH, tal como aqui definido, ou um anticorpo policlonal ou monoclonal para ele, e um sistema para determinar se exis

te qualquer ligação com o anticorpo ou antigénio contido res pectivamente na amostra de ensaio. A amostra de ensaio pode ser tomada de qualquer dos tecidos e de fluídos fisiológicos adequados acima mencionados para a detecção de ãcido nucleico virai. Se for obtido um fluído fisiológico, ele pode ser opcionalmente concentrado para um antigénio virai ou anticorpo presente.

Podem ser utilizados vários ensaios. 0 polipéptido virai de PT-NANBH pode ser utilizado para capturar selectivamente anticorpos contra. PT-NANBH de uma solução, para marcar selectivamente o anticorpo já capturado, ou para capturar e marcar o anticorpo. Além disso, o polipéptido virai pode ser utilizado em vários formatos de ensaio homogéneos em que o anticorpo reactivo com o antigénio é dectado em soluções sem separação de fases.

Os tipos de ensaio em que é utilizado o polipéptido virai PT-NANBH para capturar anticorpos da solução envolve a imobilização do polipéptido numa superfície sólida. Esta superfície deve ser capaz de ser lavada. Exemplos de superfícies adequadas incluem polímeros de vários tipos (moldados em furos de microtitulação; pérolas; palitos de mergulhar de vários tipos; pontas de aspiração; eléctrodos; e dispositivos ópticos), partículas (por exemplo látex; glóbulos vermelhos de sangue estabilizados; células de bactérias ou de fungos; esporos; sóis contendo ouro ou outros metais; e colóides proteicos) com o tamanho habitual de partícula de 0,02 a 5 micrometros, membranas(por exemplo de nitrocelulose; papel; acetato de celulose; e membranas de elevada porosidade/área superficial de um material orgânico ou inorgânico).

A fixação do polipéptido virai PT-NANBH à superfície pode ser por adsorção passiva de uma solução de composição óptima que pode incluir agentes tensioactivos, solventes, sais e/ou caotropos; ou por ligação quimica activa. A ligação activa pode ser realizada por vários grupos funcionais reactivos ou activãveis que podem ser expostos à superfície (por exemplo agentes de condensação; ésteres de ácidos activos, halogenetos e anidridos; grupos ami

no, hidroxilo, ou carboxilo, grupos sulfidrilo; grupos carbonilo; grupos diazo; ou grupos insaturados). A ligação activa pode, opcionalmente, ser feita através de uma proteína (ela própria fixada à superfície passivamente ou através de ligação activa), como por exemplo albumina ou caseína, à qual o polipéptido virai pode ser quimicamente ligado por qualquer um de entre vários processos. A utilização de uma proteína desta forma pode conferir vantagens devida ao ponto isoeléctrico, carga, hidrofilicidade ou outra propriedade físico-química. O polipéptido virai pode também ser fixado à superfície (geralmente mas não necessariamente uma membrana) após separação electroforética de uma mistura reac cional, como por exemplo precipitado imune.

Após contacto (reacção) a superfície que contém o polipéptido virai PT-NANBH com uma amostra de ensaio, permitindo algum tempo de reacção, e, quando necessário, remoção do excesso da amostra por qualquer um de vários processos (como, por exemplo lavagem, centrifugação, filtração magnetismo ou acção capilar) o anticorpo capturado é detectado por qualquer processo que dê um sinal detectável. Por exemplo, isto pode ser conseguido utilizando uma molécula ou partícula marcada como acima descrito que reagirá com o anticorpo capturado (por exemplo proteína A ou proteína G e produtos semelhantes; do subtipo anti-espécie ou anti-imunoglobulina; factor reumatóide; ou anticorpo ao antigénio, utilizado numa forma competitiva ou bloqueante), ou qualquer molécula contendo um epitopo contido no polipéptido.

sinal detectável pode ser óptico ou radioactivo ou físico-químico e pode ser proporcionado directamente por marcação da molécula ou partícula com, por exemplo, um corante, radiomarcação, espécie electroactiva, espécie magneticamente ressonante ou fluorofore ou indirectamente por marcação da molécula ou partícula com uma enzima ela própria capaz de dar origem a uma alteração mensurável de qualquer tipo. Alternativamente o sinal detectável pode ser obtido utilizando, por exemplo, aglutinação, ou através

de um efeito de difracção ou birrefringente se a superfície estiver na forma de partículas.

Os ensaios que se utiliza o próprio polipéptido virai PT-NANBH para marcar un anticorpo já capturado requer alguma forma de marcação do antigénio que lhe permitirá ser detectado. A marcação pode ser directa por ligação química ou passiva por exemplo uma marcação radioactiva, espécies ressonantes magnéticas, partículas de enzima de marcação ao polipéptido; ou indirectamente por fixação de qualquer forma de marcação a uma molécula que reagirá ela própria com o polipéptido. A química de ligação de uma marcação ao polipéptido virai PT-NANBH pode ser directamente feita através de um radical já presente no polipéptido , como por exemplo um grupo amino, ou através de um radical intermédio como por exemplo um grupo maleimido. A captura do anticorpo pode ser efectuada em qualquer das superfícies jã mencionadas por qualquer reagente incluindo adsorção passiva ou activada que resultará na ligação dos anticorpos ou complexos imunes específicos. Em particular, a captura do anticorpo pode ser feita por anti-espécies ou sub-tipo anti-imunoglobulina, por factor reumatóide, proteínas A, G e pro dutos semelhantes, ou por qualquer molécula que contenha um epitopo dentro do polipéptido.

polipéptido PT-NANBH marcado pode ser utilizado numa forma de ligação competitiva em que a sua ligação a qualquer molécula específica em qualquer das superfícies acima exemplificadas é bloqueada por antigénio na amostra. Alternativamente, ele pode ser utilizado numa forma não competitiva em que o antigénio na amostra é especificamente ou não especificamente ligado a qualquer das superfícies acima referidas e está também ligado a uma molécula específica bi- ou polivalente (por exemplo um anticorpo) sendo as valências restantes utilizadas para capturar o polipéptido marcado.

polipéptido virai PT-NANBH e um anticorpo são, com frequência em ensaios homogéneos, separadamente marcados de forma a que quando o anticorpo reage com o polipéptido virai em solução livre, as duas marcações in17

teractuam para permitir, por exemplo, a transferência não radiativa de energia capturada por uma marcação, para outra marcação, com detecção adequada da segunda marcação, excitada ou primeira marcação estabilizada (por exemplo por fluorimetria, ressonância magnética ou medida de enzima). A adição de um polipéptido ou anticorpo virai resulta na restrição do par marcado e assim num nível diferente de sinal no detector.

Um formato de ensaio adequado para detectar anticorpo PT-NANBH é o formato do imunoensaio directo de enzima em sanduíche (EIA). Faz-se o revestimento de um polipéptido virai PT-NANBH em furos de microtitulação. São adicionados simultaneamente uma amostra de ensaio e um polipéptido virai PT-NANBH a que a enzima é acoplada. Qualquer anticorpo PT-NANBH presente na amostra de ensaio ligase ao polipéptido virai que reveste o furo e ao polipéptido virai acoplado com a enzima. Tipicamente, é utilizado o mesmo polipéptido virai em ambos os lados da sanduíche. Após lavagem, é detectada a enzima ligada utilizando um substrato específico que envolve uma alteração de cor.

Um dispositivo de ensaio para utilização EIA compreende:

(1) um polipéptido virai PT-NANBH marcado com uma en zima;

(2) um substrato para a enzima;

(3) um sistema para proporcionar uma superfície em que o polipéptido virai PT-NANBH é imobilizado; e (4) opcionalmente, soluções de lavagem e/ou tampões.

Os polipéptidos virais da presente invenção podem ser incorporados numa formulação para vacinas para induzir a imunidade contra PT-NANBH no homem. Para este fim o polipéptido virai pode ser apresentado em associação com um veículo farmaceuticamente aceitável.

Para utilização numa formulação para vacinas, o polipéptido virai pode opcionalmente ser a18

presentado com parte de uma partícula de fusão do núcleo de hepatite B, como descrito por Clarke e col. (Nature, 1987, 330, 381-384) , ou um polímero com base em polilisina, como descrito em Tam (PNAS, 1988, 85, 5409-5413). Alternativamente, o polipéptido virai pode opcionalmente ser fixado a uma estrutura em partículas, como por exemplo liposomas ou ISCOMS.

Os veículos farmaceuticamente acei tãveis incluem sistemas líquidos adequados para utilização como veículos para introduzir o polipéptido virai num paciente. Um exemplo desse meio líquido é a solução salina. 0 próprio polipéptido virai pode ser dissolvido ou suspenso como sólido no veículo.

A formulação para vacinas pode também conter um adjuvante para estimular a resposta imune e potenciar assim o efeito da vacina. Exemplos de adjuvantes incluem o hidróxido de alumínio e o fosfato de alúminio.

A formulação para vacinas pode conter uma concentração final de polipéptido virai na gama de 0,01 a 5 mg/ml, de preferência 0,03 a 2 mg/ml. A formulação para vacinas pode ser incorporada num recipiente esterilizado, que é em seguida vedado e armazenado a baixa temperatura, por exemplo 4^0, ou pode ser liofilizado.

Para induzir a imunidade no homem ao PT-NANBH, podem ser administradas uma ou mais doses da formulação para vacinas. Cada dose pode ser de 0,1 a 2 ml, de preferência 0,2 a 1 ml. Um método para induzir a imunidade ao PT-NANBH no homem, compreende a administração de uma quantidade eficaz de uma formulação para vacinas, tal como atrás descrita. A presente invenção também proporciona a utilização de um polipéptido virai PT-NANBH para a preparação de uma vacina para utilização na indução de imunidade ao PT-NANBH no homem.

As vacinas da presente invenção podem ser administradas por qualquer processo conveniente para administração de vacinas incluindo a via oral e injecção parentérica (por exemplo intravenosa, subcutânea ou intramus19

cular). 0 tratamento pode consistir numa dose única de vacina ou várias doses durante um certo periodo de tempo.

Foram depositadas as seguintes estirpes E. coli no National Collection of Type Cultures (NCTC), Central Public Health Laboratory, 61, Colindale Avenue, Londres NW9 5HT nas datas indicadas:

i) E. coli TG1 transformada por pDX113 (WD001); Depósito No. NCTC 12369; 7 Dezembro de 1989.

ii) E. coli TG1 transformada por pDX128 (WD002); Depósito No. NCTC 12382; 23 Fevereiro de 1990.

iii) E. coli TG1 transformada por pl36/155 (WD003); Depósi to No. NCTC 12428; 28 Novembro de 1990.

iv) E. coli TG1 transformada por pl56/92 (WD004); Depósi to No. NCTC 12429; 28 Novembro de 1990.

ν) E. coli TG1 transformada por pl29/164 (WD005); Depósi to No. NCTC 12430; 28 Novembro de 1990.

vi) E. coli TGl transformada por pDX136 (WD006); Depósi to No. NCTC 12431; 28 Novembro de 1990.

Nas Figuras, a Figura 1 mostra uma representação da produção de pDX122 descrita no Exemplo 7, a Figura 2 mostra uma representação da produção de duas sequências alternativas fundidas descritas no Exemplo 17, e a Figura 3 mostra mapas de restrição de SEQ ID NO 21 e 22.

Na Listagem Sequencial, estão listadas as SEQ ID NO: 1 a 25 para as quais são feitas referências na descrição e reivindicações.

Os Exemplos a seguir apresentados servem para ilustrar a invenção.

EXEMPLO 1,

Síntese de cAND

Plasma combinado (160 ml) de dois indivíduos (referidos por A e L) conhecidos como tendo transmitido NANBH por transfusões foi diluído (1:2,5) com solução salina tamponada de fosfato (PBS) e em seguida centrifugou-se a 190 000 g (por exemplo 30 000 rpm num

rótor MSE 8x50) durante 5 horas a 4sc. Reteve-se o sobrenadante com uma fonte de anticorpos específicos para investigações subsequentes de bibliotecas de cAND. Suspendeu-se o agregado em 2 ml de 20 mM de tris-cloridrato, 2 mM de EDTA, 3% de SDS, NaCl 0,2 mM (2xPK) extraiu-se 3 vezes com igual volume de fenol, 3 vezes com clorofórmio, uma vez com éter, e em seguida precipitou-se com 2,5 volumes de etánol a -20²C. Ressuspendeu-se o precipitado em 10 μΐ de 10 mM de tris-cloridrato, 1 mM de EDTA a pH 8,0 (TE). Utilizou-se o ácido nucleico como um molde num equipamento de síntese de ADN (Amersham International plc, Amersham, U.K.) com oligo-dT e hexanucleótidos de primagem aleatória. As condições de reacção foram as recomendadas pelo fornecedor do equipamento. Especificamente, utilizou-se o ácido nucleico para uma reacção de síntese da primeira banda que foi marcada com [eí-³²p]dCTP (Amersham; actividade específica de 3000 Ci/mmol) num volume final de 20 μΐ e incubou-se a 42sc durante 1 hora. A reacção completa da primeira banda foi em seguida utilizada para a reacção de síntese da segunda banda, contendo E. coli RNaseH (0,8 U) e ADN polimerase I (23 U) num volume final de 100 μΐ, incubou-se a 12sc durante 60 minutos e em seguida a 22sc durante 60 minutos. A mistura reaccional completa foi em seguida incubada a 70QC durante 10 minutos, colocada em gelo, adicionou-se 1 U de polimerase T4 ADN em seguida incubou-se a 37sc durante 10 minutos. Parou-se a reacção pela adição de 5 μΐ de EDTA 0,2 M a pH 8.

Removeram-se os nucleótidos não incorporados fazendo passar a mistura reaccional por uma coluna NICK (Phar macia Ltd., Milton Keynes, Reino Unido). Extraiu-se em seguida o cADN duas vezes com fenol, três vezes com clorofórmio, uma vez com éter e em seguida adicionaram-se 20 μ% de dextrano antes da precipitação com 2,5 volumes de etánol a 100%.

EXEMPLO 2.

Produção de Bibliotecas de Expressão

Ressuspendeu-se o agregado seco de cADN em 5 μΐ de TE estéril e em seguida incubou-se com 500 ng de ligantes de EcoRI (Pharmacia; GGAATTCC fosforilado) e 0,5 U de T4 ADN ligase (New England BioLabs, Beverley, MA Estados Unidos da América) num volume final de 10 μΐ contendo 20 mM de Tris-HCl pH 7,5, 10 mM de MgCl₂, 10 mM de DTT, 1 mM de ATP durante 3 horas a 15 2C. Neutralizou-se a ligase por aquecimento a 65 ² C durante 10 minutos e digeriu-se o cADN com 180 U de EcoRI (BCL, Lewes, Reino Unido) num volume final de 100 μΐ a 37²C durante 1 hora. Adicionou-se EDTA para uma con centração final de 10 mM e deitou-se a mistura reaccional numa coluna AcA34 (LKB). Recolheram-se as fraç ções (50 μΐ) e contaram-se. Combinou-se o pico de CADN num volume eliminado (980 cpm), extraiu-se duas vezes com fenol, três vezes com clorofórmio, uma vez com éter e em seguida precipitou-se com etanol. Ressuspendeu-se o ds cADN em 5 μΐ de TE e ligou-se nos braços lambda gtll, EcoRI (Gibco, Paisley, Escócia) numa mistura reaccional de 10 μΐ contendo 0,5 U de T4 ADN ligase, 66 mM de tris-cloridrato, 10 mM MgCl₂, 15 mM de DTT pH 7,6 a 152C durante a noite. Após neutralização da ligase por aquecimento para 65sc durante 10 minutos, adicionaram-se 5 μΐ da mistura reaccional a uma mistura reaccional de embalagem Amersham e incubou-se a 22²c durante 2 horas. Titulou-se o material embalado em E. coli estirpe Y1090 (Huynh e col. 1985) e contendo um total de 2,6 χ 10⁴recombinantes.

Prepararam-se as células de placagem (Y1090) por inoculação de 10 ml de caldo-L com uma colónia simples de uma placa de ágar e agitou-se durante a noite a 37^SC. No dia seguinte diluiram-se 0,5 ml da cultura da noite com 10 ml de caldo-L fresco e adicionaram-se 0,1 ml de MgSO₄ 1 M e adicionaram-se 0,1 ml de maltose a 20% (p/v). Agitou-se a cultura durante 2 horas a 372C, fez-se a recolha de bactéria por centrifu22

gação a 5000 g durante 10 minutos e ressuspendeu-se em 5 ml de MgSO₄ 10 mM para produzir as células de placagem para guardar. Misturou-se uma porção (1 μΐ) do material embalado com 0,2 ml de células de placagem, incubou-se a 37SC durante 20 minutos antes de se adicionarem 3 ml de agar superior e deitou-se a mistura toda numa placa de L-agar de 90 mm. Após incubação durante a noite a 37sc contaram-se as placas e determinou-se o número total de fagos recombinantes. 0 material restante embalado (500 μ1) foi guardado a 4^c.

Prepararam-se bibliotecas adicionais de maneira substancialmente semelhante.

EXEMPLO 3.

Escrutínio de bibliotecas de Expressão

A biblioteca inicial descrita no Exemplo 2 foi placada em E. coli estirpe Y1090 a uma densidade de cerca de 5 χ 10³ pfu- por placa de 140 mm e cultivou-se a 37ec durante 2 horas até as placas se tornarem visíveis. Foram deixados em contacto filtros de nitrocelulose estéril que tinham sido impregnados com IPTG (isopropiltiogalactósido) com a placa durante 3 horas e em seguida eles foram removidos. Bloquearam-se em primeiro lugar os filtros por incubação com solução de bloqueamento [3% (p/v) BSA/TBS-Tween (10 mM de

Tris-HCI pH 8, 150 mM de NaCl, 0,05% (v/v) de Tween 20) contendo bronidox a 0,05%] (20 ml/filtro) e em seguida transferiu-se para um tampão de ligação [1% (p/v) de BSA/TBS-Tween contendo bronidox a 0,05%] con tendo anticorpos purificados (por cromatografia de permuta iónica) a partir de plama combinado de A e L (20 Mg/ml). Após incubação à temperatura ambiente durante 2 horas lavaram-se os filtros por três vezes com TBS-Tween e em seguida incubou-se em tampão de ligação contendo anti-humano de ovelha biotinilado (1:250). Após 1 hora à temperatura ambiente lavaramse os filtros por três vezes com TBS/Tween e em seguida incubou-se em tampão de ligação contendo com23

plexo de estreptavidina/peroxidase (1:100). Desenvolveu-se o sinal com DAB. Os sinais positivos apareceram como placas (coloridas) .

De um total de 2,6 χ 10⁴ placas escrutinadas, obtiveram-se 8 positivas no primeiro lote de escrutínio. Utilizando os filtros como molde, foram tomadas as regiões das placas originais correspondentes a estes sinais positivos utilizando uma pipeta de Pasteur esterilizada. Os tampões de agar foram suspensos em 0,1 ml de tampão SM e o fago foi deixado difundir. O título do fago de cada tampão foi determinado em E. coli estirpe Y1090. O fogo guardado de cada tampão foi em seguida reescrutinado da forma anteriormente referida em placas individuais de 90 mm a uma densidade de cerca de 1 χ 10³ pfu por placa. Dos primeiros 8 lotes positivos, um deles era claramente positivo no segundo lote, isto é >1% de placas positivas, e ele foi designado por JG2. Isto corresponde a uma taxa positiva de 40/10⁶ na biblioteca.

Este e outro fago positivo identificado de modo semelhante de outras bibliotecas de cADN descritas no Exemplo 2 foram em seguida purificados por lotes repetidos de escrutínio de placas a uma densidade inferior (1-200 pfu/placa de 90 mm) até que 100% das placas fossem positivas com o escrutínio do anticorpo de A e L. Três destes fagos recombinantes foram designados por JG1, JG2 e JG3.

EXEMPLO 4.

Escrutínio Secundário de JG1, JG2 e JG3 com Painéis de Soro Cada um dos fagos recombinantes, JG1, JG2 e JG3 foi purificado por placa e armazenado como reservas tituladas em tampão SM a 42c. Estes fagos foram misturados (1:1) com um fago de reserva identificado como negativo no Exemplo 3 e a mistura utilizada para infectar a E. coli estirpe Y1090 a 1000 pfu por placa. Foram tomados pedaços de placas e processados da forma descrita no Exemplo 3 com a excepção de os filtros serem cortados em quadrantes e cada quadrante ser

incubado com um anticorpo diferente; estes foram os anticorpos de A e L (20 /ig/ml) ; plasma A (1:500); plasma L (1:500) e H IgG (20 Ag/ml). H é um paciente que se pensa ser positivo aos anticorpos PT-NANBH dado que ele era um hemofílico que tinha recebido o factor VIII não tratado termicamente. No final da reacção cada filtro foi classificado como positivo (quando existiam obviamente duas classe de sinal) ou negativo (quando todas as placas davam o mesmo sinal) . Isto podia ser um julgamento subjectivo e assim os resultados foram comparados e apenas os filtros onde existia um grande acordo foram tomados como positivos. Os resultados obtidos são apresentados na Tabela 1.

TABELA 1

	A e L	A	L	H
JG1	+	+	-	-
JG2	+	+	+	+
JG3	+	+	+	+

JG1 parecia apenas reagir com anticorpos do paciente A e não do L ou H; isto é diferente do que seria de esperar de um polipéptido recombinante verdadeiro relacionado com PT-NANBH e assim foi desprezado o JG1 da análise. Contudo quer JG2 quer JG3 davam reacções positivas claras com três soros de PT-NANBH de A, L e H; estes foram mais analisados.

tipo de análise descrita acima foi repetida para JG2 e JG3 com a excepção de os filtros se25 »W«I

rem cortados em partes mais pequenas e estas foram incubadas com painéis de soros positivos e negativos. Os painéis de soros positivos compreendiam um painel de 10 soros hemofílicos e um painel de 9 soros de viciados da droga intravenosos (IVDA). Estes representavam a melhor fonte de soros positivos mesmo quando a taxa positiva real era desconhecida. 0 painel dos soros negativos foi obtido de dadores credenciados que tinham sido bem monitorados durante muitos anos pelo North London Blood Transfusion Centre, Deansbrook Road, Edgware, Middlesex, U.K. e nunca tinham revelado qualquer sinal de infecção com vários agentes incluindo PT-NANBH. Os resultados obtidos são apresentados na Tabela 2 e 3.

TABELA 2

I.D. JG2 JG3

IVDAS V19146

V27083

V29779

V12561

V15444

V18342

V8403

V20001

V21213

4/4

2/4

0/4

0/5

3/4

4/4

3/4

4/4

3/4

0/5

4/5

5/5

0/5

Hemofílicos M1582

M1581

M1575

M1579

M1585

M1576

M1580

M1578

M1587

M1577

4/4

5/5

3/5

5/5

3/5

1/5

2/5

4/5

5/5

0/5

5/5

0/5

1/5

0/5

3/5

1/5

Os positivos estão sublinhados

TABELA 3

	IVDA	Hemofílicos	Dador Credenciado
JG2	6/9(66%)	5/10(50%)	0/10(0%)
JG3	2/9(22%)	4/10(40%)	0/10(0%)
JG2+JG3	1/9(11%)	3/10(30%)	0/10(0%)
JG2 ou JG3	7/9(77%)	6/10(60%)	0/10(0%)

Estes dados são consistentes com a hipótese de ambos os recombinantes serem polipéptidos de expressão associados com um agente responsável por PT-NANBH e que estes polipéptidos não são idênticos mas podem partilhar alguns locais antigénicos.

EXEMPLO 5.

Mapeamento de Restrição e Sequenciacão de ADN de JG2 e JG3 Foi sujeita a ebulição uma parte (10 μΐ) dos fagos de reserva a JG2 e JG3 para desnaturar o fago e expor o ADN. Este ADN foi em seguida utilizado como molde numa amplificação de PCR utilizando Taq polimerase; cada mistura reaccional continha os seguintes produtos para um volume final de 50 μ1:10ιηΜ de Tris-HCL, 50mM de KCl, l,5mMde MgCl₂, 0,01% de gelatina, pH 8,3 a 25sc mais primários de oligonucleótido dl9 e d20 (SEQ ID NO : 1 e 2 respectivamente: 200 ng cada) ;

estes primários estão localizados nas sequências lambda que flanqueiam o local de clonação Eco RI e assim efectuam a primagem da amplificação de qualquer coisa que seja clonada neste local.

Foi analisada uma parte da mistura reaccional no gel de agarose a 1,0% e comparada com marcadores. A amplificação de JG2 produzia um fragmento com aproximadamente 2 kb; JG3 um com aproximadamente 1 kb. A mistura reaccional restante foi extraída com fenol/clorofórmio na presença de lOmM de EDTA e 1% de SDS e o ADN foi recuperado por precipitação com etanol. 0 material amplificado foi em seguida sugerido com 2 OU de EcoRI durante 60 minutos a 37 2C e separado num gel de agarose a 1% LGT em TAE. Os fragmentos foram reduzidos de tamanho de forma esperada e foram eluídos e purificados com Elutips (S&S). As inserções JG2 e JG3 foram ligadas com EcoRI digerido com pUC13 e transformados em E. coli estirpe TG1. Os recombinantes foram identificados como colónias brancas em placas de X-gal/L-Amp (placas de L-Ágar suplementadas com 100 /zg/ml de ampicilina, 0,5 de mg/ml X-gal) e foram ensaiadas por preparações de plasmídio de peque na escala e digestão com enzima de restrição de EcoRI para determinar o tamanho da inserção de ADN. O plasmídio recombinante contendo a inserção JG2 foi designado por DM415 e o que continha a inserção de JG3 foi designado por DM416.

A sequência da inserção de JG2 foi determinada por se quenciação directa de dupla banda do ADN do plasmídio e por subclonação nos vectores de sequenciação de M13 como por exemplo mpl8 e mpl9 seguido de sequenciação de banda única. A sequencia da inserção de JG3 foi determinada de forma semelhante. 0 ADN resultante e as sequências de aminoácidos deduzidas são apresentadas na SEQ ID NO : 3 e 4.

EXEMPLO 6.

Expressão de Polipéptido PT-NANBH em E. coli

O plasmídio pDM416 (5 μg) foi digerido com EcoRI (2Ου) num volume final de 20 μΐ e a inserção de 1 kb foi recuperada por eluição de um gel de agarose a 1% de LGT. Este material foi em seguida purificado utilizando um fragmento de Klenow e uma mistura de dNTP para preencher as terminais soltos de EcoRI. O ADN foi recuperado por precipitação com etanol seguida de extracção com fenol/clorofórmio. 0 fragmento com terminal cego foi ligado em Smal clivado/fosfatasado

pDEV107 (um vector que permite a clonação no terminal 3' de lac Z) e em seguida transformado em células TG1 de E. coli. Ocorreu um aumento de 3 0 vezes nas colónias em relação a um controlo do vector único. Os transformantes contendo o plasmídio recombinante pretendido foram identificados por hibridização com uma sonda radioactiva produzida por amplificação de PCR do recombinante JG3. Foram analisadas doze colónias por digestão com enzima de restrição (Sall) de mini preparações de plasmídio para determinar a orientação da inserção. Um quarto destes recombinantes estavam na orientação correcta para expressar a sequência de PT-NANBH como fusão com β-galactosidase. Um destes (pDX113) foi tomado para análise posterior.

Foi utilizada uma colónia de pDX113 para inocular 50 ml de caldo L, cultivou-se a 372C com agitação de fase semi-logarítmica e a expressão foi induzida pela adição de 20 mM IPTG. Passadas 3 horas as células foram colhidas por centrifugação a 5000 g durante 20 minutos, ressuspensas em 50 ml de PBS e recentrifugadas. As células recentrifugadas foram ressuspensas em 5 ml de tampão. (25mM de Tris-HCl, lmM de EDTA, lmg/ml de lisozima, 0,2%(v/v) de Nonidet-P40, pH8.0) por grama de agregado e incubou-se a osc durante 2 horas. 0 ADN de bactérias libertado foi digerido por adição de DNASE I e MgSO₄ para as concentrações finais de 40 jug/ml e 2mM respectivamente para reduzir a viscosidade.

Este lisado bruto foi analisado por PAGE e o padrão das proteínas foi revelado com azul de Coomassie. Foi inducida uma proteína com aproximadamente 150KD em bactérias contendo pDX113 e foi estimada uma fracção desta proteína de 10 a 15% da proteína total. Foram transferidos geís semelhantes para uma membrana PVDF (GRI, Dunmow, Essex, U.K.) e as membranas foram incubadas com soros positivos e negativos a PT-NANBH; a proteína de 150KD reagia com os soros A e L mas não com o soro humano normal. Os perfis de controlo con30 tendo o lisado de E. coli que expressavam B-galactosi dase não reagiam com A, L ou soro humano normal.

Foi adicionado a ureia ao lisado bruto até uma concen tração final de 6M e foi removido o material insosolúvel por centrifugação. O extracto de ureia 6M foi utilizado para revestir furos de microtitulação durante 1 hora a 37^0. Os furos foram lavados por três vezes com água duplamente destilada e em seguida bloqueado pela adicção de 0,25ml de BSA a 2% por furo contendo 0,02% de NaNj durante 20 minutos a 37^C. A placa foi em seguida aspirada. As placas de controlo revestidas com um lisado bruto de E. coli es tirpe (pXY461) produzindo β-galactosidase foram produzidas da mesma forma. Estas placas foram utilizadas nos ensaios de ELISA na forma descrita do Exemplo 10.

EXEMPLO 7.

Expressão do Polipéptido PT-NANBH em Células de Insectos

A inserção de PT-NANBH de JG3, isolada da forma descrita no Exemplo 5, foi clonada num quadro com os primeiros 34 nucleótidos de polihedrina no vector pAc360 (Luckow e Summers. Biotechnoloqy. 1988, 6, 47-55) , utilizando o conhecimento do quadro de leitura do gene lacZ no vector gtll. Foram sintetizados os oligonucleótidos que eram capazes de hibridizar as sequências gtll que flanqueavam o local de clonação de EcoRI e que permitiam a amplificação da inserção por PCR. Estes oligonucleótidos incluiam os locais de restrição de BamHI adequadamente colocados para permitirem a clonação directa no local de BamHI de pAc360, colocando o gene de inserção em quadro com as sequências terminais de amino da polihedrina.

Foi submetido a ebulição uma pequena quantidade do re combinante gtll JG3 para expôr o ADN e foi depois uti lizado numa amplificação PCR contendo os primários de oligonucleótidos d75 e d76 (SEQ ID NO : 6 e 7; 200 mg) e 0,5 U de Taq polimerase.

Após amplificação, a mistura reaccional foi extraída com um volume igual de fenol/clorofórmio, precipitada

com etanol e digerida com 10 U de BamHI para um volume final de 30 μΐ. O fragmento amplificado foi resolvido num gel de agarose a 1%, eluído e ligado em pAc360 digerido com BamHI para produzir a construção de transferência pDX119. O plasmídio recombinante (2 Mg) e o AcNPV ADN de tipo natural (1 Mg) foram co-transfectados para células de insectos por precipitação com fosfato de cálcio. O vírus recombinante negativo de inclusão foi escolhido por escrutínio visual. Após três lotes de purificação de placa, foi expandido o vírus recombinante (BHC-5) e foi avaliada a expressão da proteína recombinante em células de insectos por SDS-PAGE, revelação de Western e ELISA. Foi produzida uma proteína abundantemente expressa com aproximadamente 70KD nas células infectadas. Esta proteína é reactiva com os soros PT-NANBH por revelação de Western e ELISA.

Foi construído um outro recombinante de baculovírus (BHR-7) para incluir as sequências de JG2 adicionais às sequências de JG3 presentes em BHC-5, como se representa na Figura 1. As sequências de PT-NANBH presentes em JG2 foram amplificadas e clonadas num vector pAc360 da forma acima descrita de modo a produzir fragmentos de pDX118 e BamHI-Sal adequados de pDX119 e pDX118 e foram ligados em conjunto nessa ordem em pAc360 para produzir a construção de transferência de pDX112.

Os plasmídios recombinantes foram identificados por hibridização e orientação de ADN inserido determinado por análise de enzima de restrição. O vírus recombinante foi produzido da forma acima descrita e a pro teína expressa foi analisada por SDS-PAGE, revelação de Wastern e ELISA. Foi obtido um polipéptido de 95kDa muito abundante (40% da proteína total das células) que reagia com os soros de PT-NANBH encontrado nas células infectadas.

EXEMPLO 8.

Purificação do Polipéptido DX113

A estirpe Ε. coli TG1 contendo o plasmídio pDX113 designado por estirpe WDL001 foi cultivada e induzida num fermentador de 1,5 litros (modelo SET002, SGI, Newhaven, East Sussex, U.K.) a 372C durante 5 horas. As células foram recolhidas por centrifugação a 5000 g durante 20 minutos e tratadas da forma seguinte.

a) Extracção

As células húmidas foram ressuspensas (1:20, p/v) no Tampão A (50mM de Tris-HCl, 50mM de NaCI, lmM de EDTA, 5mM de DTT, 10%(v/v) de glicerol, pH-8,0). Foi adicionada lisozima a uma concentração de 5 mg de sólido por ml de suspensão e a mistura foi deixada em repouso a 4QC. Passados 15 minutos, a mistura foi tratada por sonificação (amplitude de 6μπι de pico a pico) em gelo durante um total de 3 minutos (pulsos de 6x30 se gundos) . A DNasel foi adicionada a 4 /ig por ml de suspensão e a mistura foi deixada em repouso durante mais 30 minutos. A suspensão foi centrifugada durante 20 minutos a 18000 g (máx) e o sobrenadante foi desprezado.

O agregado foi ressuspendido num tampão B (25mM de Hepes, 4M de ureia, 5mM de DTT, pH 8,0) a uma fracção de 1:6 (p/v) para se obter uma suspensão fina. Esta foi centrifugada a 18000 g (máx) durante 20 minutos e o sobrenadante desprezado. A pastilha foi resuspensa num tampão C (25mM de Hepes, 8M de ureia, 2mM de DTT, pH 8,0) a uma fusão de 1,6 (p/v), antes da suspensão foram adi cionados:leupeptina (l/ig/mg) ,pepstatina (l^g/mg) e, E64 (l/ig/ml) . A suspensão foi centrifugada a 18000 g (máx) durante 30 minutos e o sobrenadante decantado e guardado. A pastilha foi res suspensa em 25mM de Hepes, 1% de SDS pH 8,0.

b) Cromatografia sobrenadante obtido de uma fracção de ureia 8M foi diluído a 1,5 (v/v) em 25mM de Hepes, 8M de ureia, 2mM de DTT, pH 8,0 e fraccionado numa

coluna de 7 ml de Q-Sepharose. As proteínas foram eluídas através de um gradiente salino de NaCl 0 IM. A cromatografia e o tratamento de dados foram controlados por FPLC (Pharmacia). 0 DX113 elui a aproximadamente 500mM de NaCl e é virtualmente homogéneo por SDS Page e revelação de Western.

EXEMPLO 9.

Purificação de Polipéptido BHC-5

Foram infectadas células Sf9 (2xl0⁹) com uma preparação de virus recombinante de BHC-5 (moi 5) . Após in-cubação a 28SC durante 2 dias as células foram recolhidas por centrifugação e em seguida processadas de forma seguinte.

a) Extracção

A massa das células húmida (1,2 g) foi ressuspen sa em 6 ml de tampão A (25mM de Hepes, 5mM DTT, leupeptina l/xg/ml, pepstatina l^g/ml, E64 l/xg/ml pH 8,0). As células ressuspendidas foram colocadas em gelo e tratadas por sonif icação por pulsos de 3 x 15 segundos (amplitude de 6 μτα de pico a pico) intervaladas com períodos de repouso de 30 segundos. A suspensão tratada com sonificação foi centrifugada a 18000 g (máx) durante 20 minutos e o sobrenadante foi desprezada. A pastilha foi ressuspensa em tampão A mais ureia 4M (6 ml) e centrifugada a 18000 g (máx) durante 20 minutos. 0 sobrenadante foi desprezado e a pastilha re-extraída com tampão A e ureia 8M (6ml). Após centrifugação a 18000 g (máx) durante 30 minutos o sobrenadante foi repetido e diluído a 1:6 em tampão A e ureia 8M. Este extracto foi cromatografado numa mono-coluna Q equilibrada no mesmo tampão. A coluna foi eluída através de um gradiente salino (0-1,0 M de NaCl) em 12 volumes de coluna. 0 BHC-5 eluía a aproximadamente 0,45 - 0,55mM de NaCl e era

superior a 90% de pureza determinada por SDSPAGE.

O rendimento foi de aproximadamente 70%.

EXEMPLO 10.

Resultados dos Polipéptidos DX113 e BHC-5 e 7 num Ensaio de

ELISA

Foram directamente revestidas placas de microelisa (96 furos, Nunc) com tampão de bicarbonato 50mM (bicarbonato de sódio 50mM e carbonato de sódio 50 mM, titulado a pH 9,5) com um lisado de ureia 6 M bruto de BHC-5 ou com pDX113 purificado. As placas foram bloqueadas com BSA a 0,2% e em seguida incubadas durante 30 minutos a 372C com soros diluídos a 1:20 (báculo) ou 1:100 (E. coli). Após lavagem em mistura de Tween-solução salina (0,85% de solução salina, 0,05% de Tween 20, 0,01% de Bronidox) as placas foram incubadas com imunoglobulina anti-humana de cabra conjugada com peroxidase (1:2000) durante 30 minutos a 37sc. As placas foram em seguida lavadas em mistura de Tween-solução salina e a cor foi revelada por adição de substrato cromogénico TMB (tetrametil-benzidina-HCl) (100 μΐ/furo) e incubou-se durante 20 minutos à temperatura ambiente. A reacção foi parada com 25 μ,Ι de ãcido sulfúrico 2M e foi determinado o valor de OD450 (Tabela 4).

TABELA 4

Ensaio indirecto de ELISA de	formato de Ia anti-humano para
a deteccão de anticorpo NANB

	Báculo BHC-5 (Fase-sólida)	E. coli DX113 (Fase-sólida)
	>2	1,670
	1,855	1,531
	1,081	1,015
Soros de pacientes de	1,842	1,558
alto risco positivos	0,526	0,638
no Ensaio	>2	1,516
	1,823	1,602
	1,779	1,318
	1,122	0,616
	1,686	1,441
	0,259	0,205
	0,158	0,120
	0,298	0,209
Soros de pacientes de	0,194	0,111
alto risco negativos	0,282	0,181
no Ensaio	0,263	0,165
	0,184	0,163
	0,121	0,099
	0,243	0,104
Dador credenciado	0,224	0,119

Foram ensaiados os soros de pacientes de elevado risco de infecção por PT-NANBH (IVDA hemofílicos) da forma acima descrita; todos os dados são expressos como leituras OD450, servindo o dador credenciado como controlo negativo. Deste grupo particular de soros 10/19 são positivos em ambas as fases sólidas.

Foi conjugado DX113 adicionalmente purificado a fosfatase alcalina utilizando a redução de SATA/maleimida e foi estabelecido um ensaio imunométrico. Foram diluídos soros NANB conhecidos positivos e negativos como indicado no soro do dador credenciado e adicionado a uma fase sólida revestida com BHC-7. Quer simultaneamente quer após incubação (30 minutos a 372C) foi adicionado o con jugado DX113 (50 μΐ, 1:2000). Após incubação a 372C durante 30 minutos, foram lavadas as placas com tampão de bicarbonato 50 mM e a cor foi revelada utilizando o sistema de amplificação IQ Bio e foi determinado o valor de OD492 (Tabela

5).

TABELA 5

Ensaio imunométrico (polipéptido marcado) de ELISA para a detecção de anticorpo NANB

Positivo no Ensaio Negativo no Ensaio Dador

Credenciado

>2	0,217
0,821	0,252
>2	0,214
0,542	0,257
0,876	0,308
1,583	0,278
>2	0,296
>2	0,273
1,830	0,262
>2	0,251

Assim em qualquer dos ensaios - antiglobulina ou imunométrico - todas as amostras de alto risco davam resultados concordantes.

EXEMPLO 11.

Formulação para Vacinas

Pode ser preparada uma formulação para vacinas por técnicas convencionais utilizando os seguintes constituintes nas quantidades indicadas:

Virai PT-NANBH Polipéptido >0,36 mg

Tiomersal 0,04-0,2 mg

Cloreto de sódio <8,5 mg

Água para lml

EXEMPLO 12.

Produção de Anticorpos Monoclonais em Polipéptidos PT

Foi sub-clonada a inserção de ADN de DM415 no vector de transferência de baculovirus p36C e o vírus recombinante produzido por um processo essencialmente semelhante à descrita no Exemplo 7. 0 vírus recombinante foi designado por BHC-1 e expressava valores muito baixos de proteína específica de PT-NANBH. Foram lisadas células Sf-9 (5xl0⁷ células/ml) infectadas com BHC-1 em PBS contendo 1% (v/v) de NP40 e centrifugadas a 1300 g durante 2 minutos. O sobrenadante foi feito passar através de Extractigel - D (Pierce Chemicals) para remover o detergente e em seguida misturou-se como emulsão 1:1 como o adjuvante completo de Freund. Foram injectados subcutaneamente ratos com 0,1 ml de emulsão (equivalente a 5xl0⁶células) . Aos dias 14 e 28 após injecçâo, os ratos foram administrados com injecçâo intraperitoneal de 0,1 ml (equivalente a 5xl0⁶ células) de um extracto isento de células Sf-9 infectadas com BHC-5: o BHC-5 contem a inserção de ADN de DM416. Foram tomadas amostras de sangue da cauda e ensaiadas para a determinação da actividade anti-PT-NANBH num ensaio de ELISA (Exemplo 10). Foram ainda administrados dois ratos com uma resposta específica a PT-NANBH por injecção intravenosa com um extracto isento de detergente de células Sf-9 infectadas com BHC-7; o BHC-7 contem uma inserção de ADN produzida por ligação em conjunto das regiões de sobreposição de DM415 e DM416 (Exemplo 7) . Os baços foram removidos passados três dias.

Células de baço foram fundidas com células do mielona NSo na presença de PEG1500 por técnicas convencionais. As células de hibridoma resultantes foram escolhidas para cultura em meio HAT (hipoxantina, amino pterina, timidina) . Nos dias 10 a 14 após fusão, os sobrenadantes foram escrutinados para a determinação da actividade anti-PT-NANBH por um ensaio de ELISA. Os furos que revelavam reactividade com antigénios DX113 e BHC-7 (Exemplo 10) foram identificados e as colónias individuais foram transferidas para furos separados, cultivadas e reensaiadas. Os furos que apresentavam reactividade específica nesta fase foram ainda clonados a uma diluição limite para assegurar a monoclonalidade.

EXEMPLO 13.

Detecção de Ácido Nucleico Virai PT-NANBH em Pacientes

Seropositivos

Soros: Foram congelados a -202C amostras de dadores de 1400 dadores, recolhidas num estudo prospectivo de hepatite após transfusão. As amostras de pré-transfusão e pós-transfusão em série recolhidas de 260 recipientes foram guardadas de forma semelhante. As amostras de pós-transfusão foram recolhidas quinzenalmente durante 3 meses, mensalmente durante 6 meses e semestralmente durante 18 meses. Os soros congelados de dadores e recipientes de três incidentes de PT-NANBH que ocorreram em 1981 foram também tornados disponíveis para o estudo. O diagnóstico de PT-NANBH foi baseado num aumento de alanina amino transferase no soro (ALT) que excedia 2,5 vezes o limite superior do normal em pelo menos duas amostras

de pós-transfusão separadas. Foram excluídos outros vírus hepatrópicos por ensaios sorológicos e as causas não virais de doenças hepatocelulares foram excluídas por estudos convencionais clínicos e laboratoriais.

Imunoensaio: Foram ensaiadas amostras de soro retrospectivamente para a determinação da presença de anticorpos a HCV (antigénio C100) com o dispositivo de Ortho Diagnostics ELISA utilizado de acordo com as instruções do fabricante. Foram titulados repetidamente soros reactivos de acordo com pontos finais num soro humano negativo para anti-ClOO.

Detecção de Sequências Virais de PT-NANBH: Foi extraí do ARN de soro ou plasma, inversamente transcrito, e amplificado da forma a seguir descrita. Os primãros de oligonucleótidos de transcrição inversa/PCR foram derivados da sequência de nucleótidos do gene JG2 iso lado no Exemplo 3, e sintetizou-se num sintetizador de APPlied Biosystems 381A. As sequências dos quatro primários de oligonucleótidos foram as seguintes:

Designação SEP ID NO: Tamanho do

Produto

Sentido d94 8

729bp anti-sentido d95 9

Sentido NI 10

402bp anti-sentido N2 11 (i) Extracção de ARN

Foram levados a um volume de 200 μΐ 5-50 μΐ de soro (ou plasma) por adição de água. A amostra de 200 μΐ foi adicionada a um volume igual de tampão 2 x PK = 0,2M de TrisCl, pH7,5, 25mM de EDTA, 0,3M de NaCl, 2% p/v de SDS, proteinase K 200/ig/ml) , misturada e incubada a 37sc durante

minutos. As proteínas foram removidas por extracção de duas vezes com fenol/clorofórmio e uma vez só com clorofórmio. Foram adicionados 20 μ$ de glicogénio à fase aquosa e o ARN então precipitou por adição de 3 volumes de etanol absoluto refrigerado com gelo. Após armazenagem a -70sc durante 1 hora o ARN foi centrifugado numa centrifugadora de Eppendorf (15 minutos, 14 000 rpm, 4SC) . O agregado obtido foi lavado uma vez com etanol a 95%, seco em vazio e dissolvido em 10 μΐ de ãgua destilada esterilizada. As soluções de ARN foram guardadas a -702C.

(ii) Síntese de cADN

Foram preparados 10 μΐ de uma mistura contendo 2 μΐ da solução de ARN, 50 ng de oligonucleótido sintético d95, 10 mM de Hepes-HCl pH 6,9 e 0,2 mM de EDTA pH 8,0. Esta mistura de 10 μΐ foi coberta com 2 gotas de óleo mineral, aquecida durante 2 minutos num banho de água a 90sc e arrefecida rapidamente com gelo. A síntese de cADN foi efectuada após se ajustar a mistura reaccional para conter 50mM de Tris-HCl pH7,5, 75mM KC1, 3mM de MgCl₂, lOmM de DTT, 0,5mM cada de dATP, dCTP, dGTP e dTTP, 20 unidades de inibidor de RNase (Pharmacia) e 15 unidades de transcriptase inversa de MLV clonada (Pharmacia) para um volume final de 20 μΐ. Os 20 μΐ de mistura foram incubados a 37sc durante 90 minutos. Após síntese o cADN foi guardado a -20sc.

(iii) PCR Em cadeia

Ao longo deste ensaio foram evitados falsos resultados positivos de PCR por aplicação estrita das medidas necessárias para evitar a contaminação de Kwok e Higuchi (Nature, 1989, 339,237-238).

a) Lote 1

A reacção de cadeia de polimerase foi efectuada em 50 μΐ de uma mistura contendo lOmM de Tris-HC1 pH8,3, 50 mM de KC1, 1,5 mM de MgCl₂, 0,01% p/v de gelatina, 1 Unidade Recombinante de taq ADN polimerase (Perkin Elmer Cetus), 2 00μΜ cada de dNTP, 30ng de cada primário exterior (d94 e d95; SEQ ID NO : 8 e 9 respectivamente) e 5 μΐ de solução de cADN. Após um período adicional de 5 minutos de desnaturação a 94 2C, foram conduzidos 35 ciclos de 95sc durante 1,2 minutos, seguidos por uma extensão final de 7 minutos a 72sc (Techne PHC-1 Automated Thermal Cycler).

b) Lote 2

Foi utilizada a mistura reaccional igual à acima descrita para o Lote 1 mas foram utilizados 125 ng de cada primário interno, NI e N2 (SEQ ID NO : 10 e 11 respectivamente) , em vez dos primários externos d94 e d95. Foi transferida uma aliquota de 1 μΐ dos produtos de PCR obtidos no Lote 1 para os 50 μΐ da mistura reaccional do Lote 2. Foram efectuados 25 ciclos de 95sc durante 1,2 minutos, 46ec durante 1 minuto, 72sc durante 1 minuto seguidos de um período de extensão de 7 minutos a 72sc.

c) Análise

Foram analisados 20 μΐ dos produtos de PCR do lo te 1 e do Lote 2 por electroforese num gel de 2% de agarose. As bandas foram visualizadas por meio de revelação com brometo de etídio e fotografadas a 302 nm.

Valor previsto de Serologia Anti-HCV e PCR no Es tudo Prospectivo: seis dos 1400 dadores (0,43%) envolvidos no estudo prospectivo revelaram ter anticorpos a C100 no seu soro. Destes seis dadores positivos de anticorpos positivos apenas um (dador D6) provou ser infeccioso como determinado pelo desenvolvimento de PT-NANBH e soroconversão de C100 num recipiente (recipiente R6)

ver Tabela 6 seguinte. Foram detectadas sequências virais por PCR no soro do dador D6 mas não em qualquer dos outros cinco dadores seropositivos de soro. 0 recipiente R6 que desenvolveu PT-NANBH tinha também recebido sangue de sete outros dadores (D7 a D13) . Os soros destes dadores foram ensaiados e revelaram ser ambos negativos a anticorpos e negativos a PCR.

TABELA 6

RESUMO DOS DADOS DE DADOR/RECIPIENTE : ESTUDO PROSPECTIVO

DADORES	PCR	RECIPIENTES
Dador	anti-HCV	Recipiente	PT-NANBH	ANTI-HCV serocon- versão
DI	+	MB	Rl	Não	Não
D2	+	-	R2	Não	Não
D3	+	-	R3	Não	Não
D4	+	-	R4	Não	Não
D5	+	-	R5	Não	Não
D6	+	+
D7	-	-
D8	-	-
D9	-	-	R6	Sim*	Sim+
D10	-	-
Dll	-	-
D12	-	-
D13	—	—

* período de incubação de 1 mês + A seroconversão ocorria a 5 meses após transfusão

EXEMPLO 14.

Isolamento e Expressão de Sequências Adicionais de PT-NANBH de ADN

As bibliotecas lambda gtll preparadas no Exemplo 2 foram também escrutinadas com soros de pacientes com um elevado risco para PT-NANBH mas que não reagiam com os antigénios virais, DX113, BHC-5 e BHC-7, sendo a razão disto que eles podem bem conter anticorpos que reconheciam antigénios diferentes. Os soros, PJ-5 (The Newcastle Royal Infirmary, Newcastle), Birm-64 (Queen Elizabeth Medicai Centre, Birmingham), PG e Le (University College and Middlesex School of Medicine, Londres) cumpriam este critério e foram utilizados para escrutinar as bibliotecas segundo o mesmo procedimento descrito nos Exemplos 3 e 4. Foram assim identificados vários recombinantes, nenhum dos quais se hibridizava cruzadamente com sondas feitas de JG2 e JG3. Um dos recombinantes, BR11, identificado por reacção com PJ-5, foi escolhido para análises adicionais.

clone, BR11, continha uma inserção com aproximadamente 900 pb que foi ampliada por PCR utilizando os primários d75 e d76 (SEQ ID NO : 6 e 7) como descrito no Exemplo 7. A sequência amplificada foi directamente clonada no vector de baculovirus pAc 360 para formar pDX128 contendo um quadro de leitura aberto em fase com os primeiros 11 aminoácidos da polihedrina. Os lotes de baculovirus recombinantes (designados por BHC-9) foram obtidos segundo os procedimentos descritos no Exemplo 7. As células dos insectos foram infectadas com o vírus recombinante purificado e foi obtido um polipéptido com aproximadamente 22 KD num extracto de células radiomarcadas. A inserção amplificada de BR11 foi também clonada nos vectores de fago pUC13 e M13 para sequenciação; os dados de ADN e de sequência de aminoácidos são apresentados na SEQ ID NO : 5. A inserção contem 834 pb mais os ligantes de EcoRI adicionados durante a clonação.

EXEMPLO 15.

Resultados de um Polipéptido BHC-9 num Ensaio de ELISA

Foi estabelecido um ensaio de ELISA utilizando placas de microtitulação revestidas com extracto de células infectadas com BHC-9 e um sistema de detecção conjugado de lg anti-humano segundo o procedimento descrito no Exemplo 10. Foi avaliado um painel de soro de elevado risco em paralelo contra BHC-7 e BHC-9 e foram também examinados por PCR utilizando o procedimento descrito no Exemplo 13. Os resultados obtidos são apresentados na Tabela 7 em que são sublinhadas as amostras positivas.

TABELA 7

Número	PCR	BHC-7	BHC-9


1	+	2_f 09	2,00
2	+	2,09	2,00
3	+	1,89	1,37
4	+	1,57	0,27
5	+	1,26	2,00
6	+	0,91	2,00
7	-	0,90	0,51
8	+	0,84	1,19
9	-	0,53	0,43
10	-	0,45	2,00
11	+	0,37	1,07
12	-	0,32	2,00
13	-	0,23	0,30
14	-	0,15	0,43
15	+	0,16	0,76
16	-	0,09	1,74
17	-	0,27	2,00
18	-	0,15	2,00
19	-	0,12	2,00
20	-	0,08	0,05
Corte		0,27	0,29

Destas 20 amostras, 50% são claramente positivas com BHC-7 enquanto que 85% são positivas com BHC-9. Duas das amostras 11 e 12) que são positivas no limite com BHC-7 são claramente positivas com BHC-9 e algumas das amostras a ou abaixo do ponto do corte com o BHC-7 são positivas com BHC-9. Além disso, duas das amostras (11 e 15) que estão no limite ou são negativas com BHC-7 são positivas com BHC-9 e são positivas com PCR.

Globalmente existem apenas duas amostras (13 e 20) que são negativas com ambos os polipéptidos e com PCR.

EXEMPLO 16.

Isolamento das sequências de PT-NANBH ADN que sobrepõem aos clones existentes

O escrutínio imunológico das bibliotecas de expressão de cADN descritas nos Exemplos 3, 4 e 14, podem apenas identificar os clones que contêm uma região imuno creativa do vírus. Outra técnica para a produção de clones específicos para PT-NANBH é utilizar PCR para amplificar as moléculas de cADN que se sobrepõem aos clones existentes. Podem ser preparados conjuntos de primários em que um membro do par cai dentro das sequências clonadas existentes e o outro cai fora; esta técnica pode ser ampliada também para pares em cadeia de primários.

cADN preparado de forma descrita no Exemplo 1, foi amplificado por PCR, com pares de primários únicos ou em conjunto, utilizando as condições de reacção descritas no Exemplo 13. A técnica é ilustrada pela utilização dos seguintes pares de primários dl64 (SEQ ID NO : 12) e dl37 (SEQ ID NO : 13); dl36 (SEQ ID NO : 14) e dl55 (SEQ ID NO : 15); dl56 (SEQ ID NO : 16) e d92 (SEQ ID NO : 17) . Um elemento de cada par é designado para efectuar a primagem dentro das sequências clonadas existentes (dl37 e dl36 efectuam pr imagem dentro dos terminais 5' e 3' de BR11 respectivamente, d92 efectua a primagem na extre49

midade 5' de JG3). Os outros primários são baseados nas sequências disponíveis para outros agentes de PTNANBH. 0 primário dl64 corresponde às bases 10 a 31 da figura 2 em Okamoto e col, Japan. J. Exp. Med. . 1990, 60 167-177. Os primários dl55 e dl56 correspondem ás posições 462 a 489 e 3315 a 3337 respectivamente na figura 7 do pedido de Patente Europeia 88310922,5. Foram preparadas uma ou mais preparações de nucleótidos para introduzir um ponto de reconhecimento de EcoRI próximo da extremidade 5' dos primários, com a excepção de dl64 em que foi introduzido um ponto de reconhecimento Bgl2; estas alterações facilitam a clonagem posterior do produto ampliado.

Os produtos de PCR foram digeridos com as enzimas de restrição adequadas, resolvidas por electroforese em gel de agarose e bandas de tamanho esperado foram retiradas e clonadas no plasmídio e vectores de bacteriofagos da forma descrita no Exemplo 3. As sequências do ADN amplificado 164/137 (SEQ ID NO : 18), 136/155 (SEQ ID NO : 19) e 156/92 (SEQ ID NO : 20) são apresentados na listagem de Sequências. Estas novas sequências estendem a cobertura do genona PT-NANBH sobre o obtido por imunoescrutínio (SEQ ID NO : 3,4 e 5). Estas sequências juntamente com as outras que caiem dentro das regiões já descritas podem ser combinadas numa sequência contígua na extremidade 5' (SEQ ID NO : 21) e na extremidade 3' (SEQ ID NO : 22) do genoma PT-NANBH.

EXEMPLO 17.

Fusão de Anticfénios PT-NANBH Diferentes num Único Polipéptido Recombinante

Os dados apresentados na tabela 7 indicam que embora sejam detectadas mais amostras de soro como positivas a anticorpos utilizando BHC-9 como antigénio alvo (17/20) em vez de BHC-7(10/20) existem algumas amostras (por exemplo #4) que são positivas com apenas a BHC-7. Este quadro é construído por um

ensaio de grande escala de amostras. Desta forma, foi derivado uma construção de fusão utilizando a sequência de BHC-7 e BHC-9.

As sequências de BHC-7 e BHC-9 podem ser combinadas de várias maneiras; cada sequência pode ser posicionada no terminal de amino da fusão resultante e a natureza da sequência de ligação pode também ser variada. A figura 2 ilustra duas formas possíveis em que se podem combinar as sequências.

Foram produzidos fragmentos de restrição adequados contendo pontos de enzima de restrição adequados e sequências de ligação quer por PCR utilizando primários específicos quer por digestão de enzima de restrição de plasmídios existentes. O vector de transferência DX143 consiste num fragmento BmaHl/Pstl de DX122 (Figura 1; o ponto Pst está na posição 1504 JG2, SEQ ID NO : 3) ligado à extremidade 5' de toda a região de codificação de BR11 (SEQ ID NO : 7) que foi ampliada como um fragmento Pstl/BamHl utilizando os primários d24 (SEQ ID NO : 23) e d 126 (SEQ ID NO : 24); a região de ligação consiste em seis aminoácidos derivados do primário dl26 e sequências lambda de bacteriofago residuais. 0 vector de transferência DX136 difere de DX143 por o fragmento de BR11, ser produzido utilizando d24 (SEQ ID NO : 23) e dl32 (SEQ ID NO : 25) e assim as regiões de ligação contêm cinco liosinas. Estes vectores de transferência foram utilizados para transferir e cotransfectar células de insecto Sf9 em cultura com AcNPV ADN e foram produzidos lotes purificados em placa de baculovírus recombinantes da forma descrita no Exemplo 7. O BHC-10 foi produzido como resultado da transfecção com DX143; BHC-11 como resultado de transfecção com DX-136. Os polipéptidos recombinantes expressos por estes dois vírus foram analisados por SDS-PAGE e revelação de Western. 0 BHC-10 produzia um polipéptido com um lpeso molecular aparente de 118 kDa. O BHC-11 produzia um polipéptido com um peso molecular

aparente de 96 kDa. Ambos os polipéptidos reagiram com soro que se sabia reagir apenas em ELISA com BHC7 (por exemplo o soro A) ou apenas com BHC-9 (soro B64, Exemplo 14). Os dois polipéptidos diferiam apenas na sequência de ligação e este efeito afecta a sua mobilidade em SDS-PAGE ou a forma como eles são processados nas células infectadas.

EXEMPLO 18.

Comportamento dos Antiqénios de fusão PT-NANBH em ELISA

Foi estabelecido um ensaio ELISA utilizando furos de microtitulação revestidos com extractos de células infectadas com BHC-9 e um conjugado de lg anti-humano seguindo o procedimento descrito mo Exemplo 10. Na Tabela 8 são apresentados os dados obtidos de uma com paração das duas fusões com os outros antigénios recombinantes de PT-NANBH NHC-7 e BHC-9 bem como a proteína recombinante HCV C-100-3 (Ortho Diagnostic Systems, Raritan, New Jersey). Os soros são agrupados por tipo de reacção com BHC-7, BHC-9 e C-100-3. Os soros do Grupo I reagem fortemente com todos os três antigénios; o Grupo II reage fortemente com apenas BHC-7; o Grupo III reage fortemente com apenas BHC-9 e o Grupo IV reage fortemente com apenas dois de três antigénios.

Tabela 8

SORO	BHC-7	BHC-9	C-100-3	BHC-20	BHC-ll
Grupo I AH	>2,0	>2,0	>2,0	>2,0	>2,0
AC	>2,0	>2,0	>2,0	>2,0	>2,0
57	>2,0	>2,0	>2,0	>2,0	>2,0
77	>2,0	>2,0	>2,0	>2,0	>2,0
84	1,4	>2,0	>2,0	>2,0	>2,0
Grupo II
805-6 805-17 805-149	>2,0 >2,0 >2,0	0,261 0,181 0,651	0,1 0,12 0,084	1,78 1,37 1,57	+* +*
Grupo III JS	0,32	>2,0	0,17	>2,0	>2,0
805-57 805-82 805-94	0,069 0,116 0,353	1,403 1,272 1,675	0,25 0,4 0,2	1,9 1,85 >2,0	+* ++* ₊*
PJ1	0,27	>2,0	0,2	>0,2	1,85
Grupo IV A	>2,0	0,14	>2,0	>2,0	>2,0
KT	1,57	0,27	>2,0	>2,0	>2,0
Le	0,152	>2,0	>2,0	>2,0	>2,0
PJ5	0,123	>2,0	>2,0	>2,0	>2,0
303-923 303-939	>2,0 >2,0	0,9 1,55	0,37 0,268	1,9 2,0	+* +*

Estas amostras foram apenas ensaiadas por revelação de Western em BHC-ll.

Estes dados mostram que quer o BHC10 quer o BHC-11 têm uma radioactividade semelhante com estes soros e, mais importante, que ambas as actividades antigénicas parecem ser retidas pelas fusões. Todos os soros dos Grupos II e III, que reagem com apenas BHC-7 ou BHC-9 respectivamente, dão uma reacção clara com as fusões. Adicionalmente existe uma indicação de que agrupando os dois antigénios se obtem um ensaio mais sensível. Por exemplo a amostra KT dá valores de OD de 1,57 e 0,27 com BHC-7 e BHC-9 respectivamente enquanto com as fusões o valor de OD é > 2,0.

SEQ ID NO: 1

TIPO DE SEQUÊNCIA: Nucleótido COMPRIMENTO DA SEQUÊNCIA: 21 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

ORGANISMO FONTE ORIGINAL: bacteriófago lambda gtll

FONTE EXPERIMENTAL IMEDIATA: Sintetizador de oligonucleótidos; oligo dl9

CARACTERÍSTICAS:

de 1 a 21 bases homólogas a uma parte a montante do gene lacZ flanqueando o local EcoRI no bacteriófago lambda gtll

PROPRIEDADES: faz a primagem da síntese do ADN do vector fago em cADN inserido no local EcoRI.

GGTGGCGACG ACTCCTGGAG 21

SRmíWíB ^p*3vç·. „>!raT

SEQ ID NO:2

TIPO DE SEQUÊNCIA: Nucleótido COMPRIMENTO DA SEQUÊNCIA: 21 BASES

No DE BANDAS: única

TOPOLOGIA: LINEAR

TIPO DE MOLÉCULA: ADN sintético

ORGANISMO FONTE ORIGINAL: bacteriofago lambda gtll

FONTE EXPERIMENTAL IMEDIATA: Sintetizador de oligonucleótidos; oligo d20.

CARACTERÍSTICAS:

de 1 a 21 bases homólogas a uma parte a juzante do gene lacZ flanqueando o local EcoRI no bacteriofago lambda gtll

PROPRIEDADES: faz a primagem da síntese do ADN do vector fago em cADN inserido no local EcoRI

TTGACACCAG ACCAACTGGT A 21

SEQ ID NO:3

TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 1770 PARES DE BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: cADN para ARN genómico

ORGANISMO FONTE ORIGINAL: humana; soro infeccioso para hepatite pos-transfusão não-A, não-B

FONTE EXPERIMENTAL IMEDIATA: clone JG2 de biblioteca cADN em lambda gtll

CARACTERÍSTICAS:

com 1 a 1779 pb na parte da poliproteína de PT-NANBH

PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais

CAA

AAT

GAC

TTC

CCA

GAC

GCT

GAC

CTC

ATC

GAG

GCC

AAC

CTC

CTG

TGG

Gin

Asn

Asp

Phe

Pro 5

Asp

Ala

Asp

Leu

lie 10

Glu

Ala

Asn

Leu

Leu 15

Trp

CGG

CAT

GAG

ATG

GGC

GGG

GAC

ATT

ACC

CGC

GTG

GAG

TCA

GAG

AAC

AAG

Arg

His

Glu

Met 20

Gly Gly Asp

Ile

Thr 25

Arg

Vai

Glu

Ser

Glu 30

Asn

Lys

GTA

ATC

CTG

GAC

TCT

TTC

GAC

CCG

CTC

CGA

GCG

GAG

GAT

GAG

Vai

Ile 35

Leu

Asp

Ser

Phe

Asp 40

Pro

Leu

Arg

Ala

Glu 45

Glu

Asp

Glu

CGG

GAA

GTG

TCC

GTC

CCG

GCG

GAG

ATC

CTG

CGG

AAA

TCC

AAG

AAA

TTC

Arg

Glu

Vai

Ser

Vai

Pro

Ala

Glu

Ile

Leu

Arg

Lys

Ser

Lys

Phe

55 60

CCA Pro 65

CCA GCG ATG

CCC GCA TGG GCA CGC CCG GAT TAC AAC CCT CCG CTG

240

Pro

Ala

Met

Pro

Ala 70

Trp

Ala Arg

Pro

Asp Tyr Asn Pro Pro Leu

75

80

CTG

GAG

TCC

TGG

AAG

GCC

CCG

GAC

TAC

GTC

CCT

CCA

GTG

GTA

CAT

GGG

288

Leu

Glu

Ser

Trp

Lys

Ala

Pro

Asp

Tyr

Vai

Pro

Vai

His

Gly

85

90

95

TGC

CCA

CTG

CCA

CCT

ACT

AAG

ACC

CCT

ATA

CCA

CCT

CCA

CGG

AGA

336

Cys

Pro

Leu

Pro

Thr

Lys

Thr

Pro

Ile

Pro

Arg Arg

100

105

110

AAG

AGG

ACA

GTT

CTG

ACA

GAA

TCC

ACC

GTG

TCT

GCC

CTG

GCG

384

Lys

Arg

Thr

Vai

Leu

Thr

Glu

Ser

Thr

Vai

Ser

Ala

Leu

Ala

•

115

120

125

GAG

CTT

GCC

ACA

ÂÂG

GCT

TTT

GGT

AGC

TCC

GGA

CCG

TCG

GCC

GTC

GAC

432

Glu

Leu

Ala

Thr

Lys

Ala

Phe

Gly

Ser

Gly

Pro

Ser

Ala

Vai

Asp

130

135

140

AGC

GGC

ACG

GCA

ACC

GCC

CCT

CCt

GAC

CAA

TCC

GAC

GGC

GGA

480

Ser

Gly

Thr

Ala

Thr

Ala

Pro

Asp

Gin

Ser

Asp

Gly Gly

145

150

155

160

GCA

GGA

TCT

GAC

GTT

GAG

TCG

TAT

TCC

ATG

CCC

CTT

GAG

GGG

528

Ala

Gly

Ser

Asp

Vai

Glu

Ser

Tyr

Ser

Met

Pro

Leu

Glu

Gly

165

170

175

GAG

GCG

GGG

GAC

CCC

GAT

CTC

AGC

GAC

GGG

TCT

TGG

TCT

ACC

GTG

AGT

576

Glu

Pro

Gly Asp

Pro

Asp

Leu

Ser

Asp

Gly

Ser

Trp

Ser

Thr

Vai

Ser

180

185

190

GAG

GCC

GGT

GAG

GAC

GTC

TGC

TCG

ATG

TCC

TAC

ACA

TGG

624

Glu

Ala

Gly

Glu

Asp

Vai

Cys

Ser

Met

Ser

Tyr

Thr

Trp

195 200 205

ACA GGC Thr Gly

GCT Ala

CTG ATC ACG CCA TGC GCT GCG GAG GAA AGC AAG CTG CCC

672

Leu Ile

Thr

Pro Cys 215

Ala Ala

Glu

Glu Ser Lys 220

Leu Pro

210

ATC

AAC

GCG

TTG

AGC

AAC

TCT

TTG

CTG

CGT

CAC

AAC

ATG

GTC

TAC

720

Ile

Asn

Ala

Leu

Ser

Asn

Ser

Leu

Arg

His

Asn

Met

Val

Tyr

225

230

235

240

GCT

ACC

ACA

TCC

CGC

AGC

GCA

AGC

CAG

CGG

CAG

AAG

GTC

ACC

TTT

768

Ala

Thr

Ser

Arg

Ser

Ala

Ser

Gin

Arg

Gin

Lys

Val

Thr

Phe

245

250

255

GAC

AGA

CTG

CAA

ATC

CTG

GAC

GAT

CAC

TAC

CAG

GAC

GTG

CTC

AAG

GAG

816

Asp

Arg

Leu

Gin

Ile

Leu

Asp

His

Tyr

Gin

Asp

Val

Leu

Lys

Glu

•

260

265

270

ATG

AAG

GCG

AAG

GCG

TCC

ACA

GTT

AAG

GCT

AAG

CTT

CTA

TCA

GTA

GAG

864

Met

Lys

Ala

Lys

Ala

Ser

Thr

Val

Lys

Ala

Lys

Leu

Ser

Val

Glu

275

280

285

GAA

GCC

TGC

AAG

CTG

ACG

CCC

CCA

CAT

TCG

GCC

AAA

TCT

AAA

TTT

GGC

912

Glu

Ala

Cys

Lys

Leu

Thr

Pro

His

Ser

Ala

Lys

Ser

Lys

Phe

Gly

290

295

300

TAT

GGG

GCA

AAG

GAC

GTC

CGG

AAC

CTA

TCC

AGC

AAG

GCC

ATT

AAC

CAC

960

Tyr

Gly

Ala

Lys

Asp

Val

Arg

Asn

Leu

Ser

Lys

Ala

Ile

Asn

His

305

310

315

320

ATC

CGC

TCC

GTG

TGG

GAG

GAC

TTG

GAA

GAC

ACT

GAA

ACA

CCA

ATT

1008

Ile

Arg

Ser

Val

Trp

Glu

Asp

Leu

Glu

Asp

Thr

Glu

Thr

Pro

Ile

325

330

335

GAC

ACC

ATC

ATG

GCA

AAA

AAT

GAG

GTT

TTC

TGC

GTC

CAA

CCA

GAG

1056

Asp

Thr

Ile

Met

Ala

Lys

Asn

Glu

Val

Phe

Cys

Val

Gin

Pro

Glu

340 345 350

AGA GGA GGC CGC AAG	CCA Pro	GCT Ala	CGC CTT ATC GTG TTC CCA GAC TTG GGG	1104
Arg	Gly	Gly Arg 355	Lys	Arg Leu 360	Ile Vai	Phe	Pro Asp Leu 365	Gly
GTC	CGT	GTG TGC	GAG	AAA	ATG	GCC CTC	TAT GAC	GTG	GTC TCC ACC	CTC	1152
Vai	Arg	Vai Cys	Glu	Lys	Met	Ala Leu	Tyr Asp	Vai	Vai Ser Thr	Leu
	370				375			380
CCT	CAG	GCT GTG	ATG	GGC	TCC	TCG TAC	GGA TTC	CAG	TAT TCT CCT	GGA	1200
Pro	Gin	Ala Vai	Met	Gly	Ser	Ser Tyr Gly Phe	Gin	Tyr Ser Pro	Gly
385				390			395			400
CAG	CGG	GTC GAG	TTC	CTG	GTG	AAC GCC	TGG AAA	TCA	AAG AAG ACC	CCT	1248
Gin	Arg	Vai Glu	Phe	Leu	Vai	Asn Ala	Trp Lys	Ser	Lys Lys Thr	Pro
			405				410		415
ATG	GGC	TTT GCA	TAT	GAC	ACC	CGC TGT	TTT GAC	TCA	ACA GTC ACT	GAG	1296
Met	Gly	Phe Ala	Tyr	Asp	Thr	Arg Cys	Phe Asp	Ser	Thr Vai Thr	Glu
		420				425			430
AAT	GAC	ATC CGT	GTA	GAG	GAG	TCA ATT	TAT CAA	TGT	TGT GAC TTG	GCC	1344
Asn	Asp	Ile Arg	Vai	Glu	Glu	Ser Ile	Tyr Gin	Cys	Cys Asp Leu	Ala
		435				440			445
CCC	GAA	GCC AGA	CAG	GCC	ATA	AGG TCG	CTC ACA	GAG	CGG CTT TAT	ATC	1392
Pro	Glu	Ala Arg	Gin	Ala	Ile	Arg Ser	Leu Thr	Glu	Arg Leu Tyr	Ile
	450				455			460
GGG	GGT	CCC CTG	ACT	AAT	TCA	AAA GGG	CAG AAC	TGC	GGC TAT CGC	CGG	1440
Gly Gly	Pro Leu	Thr	Asn	Ser	Lys Gly	Gin Asn	Cys	Gly Tyr Arg Arg
465				470			475			480
TGC	CGC	GCG AGC	GGC	GTG	CTG	ACG ACT	AGC TGC	GGT	AAT ACC CTC	ACA	1488
Cys Arg	Ala Ser	Gly	Vai	Leu	Thr Thr	Ser Cys Gly	Asn Thr Leu	Thr

485 490 495

TGT TAC TTG AAG GCC TCT GCA	GCC TGT CGA GCT GCA AAG CTC CAG GAC	1536
Gys Tyr Leu Lys	Ala Ser	Ala	Ala	Cys Arg 505	Ala Ala Lys	Leu 510	Gin	Asp
	500
TGC ACG ATG	CTC	GTG TGC	GGA	GAC	GGC CTT	GTC GTT ATC	TGT	GAG	AGC	1584
Cys Thr Met	Leu	Vai Cys	Gly Asp	Asp Leu	Vai Vai Ile	Cys	Glu	Ser
515				520		525
GCG GGA ACC	CAG	GAG GAC	GCG	GCG	AGC CTA	CGA GTC TTC	ACG	GAG	GCT	1632
Ala Gly Thr	Gin	Glu Asp	Ala	Ala	Ser Leu	Arg Vai Phe	Thr	Glu	Ala
530			535			540
ATG ACT AGG	TAC	TCT GCC	CCC	CCC	GGG GAC	CCG CCC CAA	CCA	GAA	TAC	1680
Met Thr Arg Tyr	Ser Ala	Pro	Pro	Gly Asp	Pro Pro Gin	Pro	Glu	Tyr	•
545		550				555			560
GAC CTG GAG	TTG	ATA ACA	TCA	TGC	TCC TCC	AAT GTG TCG	GTC	GCG	CAC	1728
Asp Leu Glu	Leu	Ile Thr	Ser	Cys	Ser Ser	Asn Vai Ser	Vai	Ala	His
		565			570			575
GAT GCA TCT	GGC	AAA AGG	GTA	TAC	TAC CTC	ACC CGT GAC	CCG			1770
Asp Ala Ser	Gly Lys Arg	Vai	Tyr Tyr Leu	Thr Arg Asp	Pro

580 585 590

SEQ ID NO:4

TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 1035 PARES DE BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: cADN para ARN genómico

ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B

FONTE EXPERIMENTAL IMEDIATA: clone JG3 de biblioteca cADN em lambda gtll

CARACTERÍSTICAS:

de 1 a 1035 pb na parte da poliproteína de PT-NANBH

PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais

ACA Thr

GAA Glu

GTG Val

GAT Asp

GGG GTG CGG CTG

CAC AGG TAC GCT CCG GCG TGC AAA

48

Gly Val 5

Arg Leu

His

Arg 10

Tyr Ala

Pro

Ala

Cys 15

Lys

CCT

CTC

CTA

CGG

GAG

GTC

ACA

TTC

CAG

GTC

GGG

CTC

AAC

CAA

TAC

96

Pro

Leu

Arg

Glu

Val

Thr

Phe

Gin

Val

Gly

Leu

Asn

Gin

Tyr

20

25

30

CTG

GTT

GGG

TCG

CAG

CTC

CCA

TGC

GAG

CCC

GAA

CCG

GAT

GTA

GCA

GTG

144

Leu

Val

Gly

Ser

Gin

Leu

Pro

Cys

Glu

Pro

Glu

Pro

Asp

Val

Ala

Val

40 45

CTC

ACT

TCC

ATG

CTC

ACC

GAC

CCC

TCC

CAC

ATC

ACA

GCA

GAG

ACG

GCT

192

Leu

Thr

Ser

Met

Leu

Thr

Asp

Pro

Ser

His

lie

Thr

Ala

Glu

Thr

Ala

50

55

60

AAG

CGC AGG

CTG

GCC

AGG GGG

TCT

CCC

TCC

TTG

GCC

AGC

TCT

TCA

Lys

Arg Arg

Leu

Ala

Arg Gly

Ser

Pro

Ser

Leu

Ala

Ser

65

70

75

80

GCT AGC Ala Ser

CAG TTG TCT GGC CCT

TCC TCG AAG GCG ACA TAC ATT ACC CAA

288

Gin Leu Ser 85

Gly Pro

Ser Ser

Lys 90

Ala

Thr Tyr

Ile

Thr 95

Gin

AAT

GAC

TTC

CCA

GAC

GCT

GAC

CTC

ATC

GAG

GCC

AAC

CTC

CTG

TGG

CGG

336

Asn

Asp

Phe

Pro

Asp

Ala

Asp

Leu

Ile

Glu

Ala

Asn

Leu

Trp

Arg

100

105

110

CAT

GAG

ATG

GGC

GGG

GAC

ATT

ACC

CGC

GTG

GAG

TCA

GAG

AAC

AAG

GTA

384

His

Glu

Met

Gly Gly

Asp

Ile

Thr

Arg

Vai

Glu

Ser

Glu

Asn

Lys

Vai

•

115

120

125

GTA

ATC

CTG

GAC

TCT

TTC

GAC

CCG

CTC

CGA

GCG

GAG

GAT

GAG

CGG

432

Vai

Ile

Leu

Asp

Ser

Phe

Asp

Pro

Leu

Arg

Ala

Glu

Asp

Glu

Arg

130

135

140

GAA

GTG

TCC

GTC

CCG

GCG

GAG

ATC

CTG

CGG

AAA

TCC

AAG

AAA

TTC

CCA

480

Glu

Vai

Ser

Vai

Pro

Ala

Glu

Ile

Leu

Arg Lys

Ser

Lys

Phe

Pro

145

150

155

160

CCA

GCG

ATG

CCC

GCA

TGG

GCA

CGC

CCG

GAT

TAC

AAC

CCT

CCG

CTG

528

Pro

Ala

Met

Pro

Ala

Trp

Ala

Arg

Pro

Asp

Tyr

Asn

Pro

Leu

165

170

175

GAG

TCC

TGG

AAG

GCC

CCG

GAC

TAC

GTC

CCT

CCA

GTG

GTA

CAT

GGG

TGC

576

Glu

Ser

Trp

Lys

Ala

Pro

Asp Tyr

Vai

Pro

Vai

His

Gly Cys

180 185 190

CCA CTG CCA CCT ACT AAG ACC CCT CCT ATA CCA CCT CCA CGG AGA AAG 624

Pro Leu Pro Pro Thr Lys Thr Pro Pro Ile Pro Pro Pro Arg Arg Lys

195 200 205

AGG ACA Arg Thr	GTT Val	GTT CTG ACA GAA TCC ACC GTG TCT TCT GCC CTG GCG GAG
Val Leu	Thr	Glu Ser 215	Thr Val	Ser	Ser Ala Leu 220	Ala	Glu
	210
CTT	GCC	ACA	AAG GCT	TTT	GGT AGC	TCC GGA	CCG	TCG GCC GTC	GAC	AGC
Leu	Aid	Thr	Lys Ala	Phe	Gly Ser	Ser Gly	Pro	Ser Ala Val	Asp	Ser
225				230			235			240
GGC	ACG	GCA	ACC GCC	CCT	CCT GAC	CAA TCC	TCC	GAC GAC GGC	GGA	GCA
Gly	Thr	Ala	Thr Ala	Pro	Pro Asp	Gin Ser	Ser	Asp Asp Gly Gly	Ala
			245			250			255
GGA	TCT	GAC	GTT GAG	TCG	TAT TCC	TCC ATG	CCC	CCC CTT GAG	GGG	GAG
Gly	Ser	Asp	Val Glu	Ser	Tyr Ser	Ser Met	Pro	Pro Leu Glu	Gly	Glu
			260			265		270
CCG	GGG	GAC	CCC GAT	CTC	AGC GAC	GGG TCT	TGG	TCT ACC GTG	AGT	GAG
Pro	Gly Asp	Pro Asp	Leu	Ser Asp	Gly Ser	Trp	Ser Thr Val	Ser	Glu
		275			280			285
GAG	GCC	GGT	GAG GAC	GTC	GTC TGC	TGC TCG	ATG	TCC TAC ACA	TGG	ACA
Glu	Ala	Gly	Glu .Asp	Val	Val Cys	Cys Ser	Met	Ser Tyr Thr	Trp	Thr
	290				295			300
GGC	GCT	CTG	ATC ACG	CCA	TGC GCT	GCG GAG	GAA	AGC AAG CTG	CCC	ATC
Gly	Ala	Leu	Ile Thr	Pro	Cys Ala	Ala Glu	Glu	Ser Lys Leu	Pro	Ile
305				310			315			320
AAC	GCG	TTG	AGC AAC	TCT	TTG CTG	CGT CAC	CAC	AAC ATG GTC	TAC	GCT
Asn	Ala	Leu	Ser Asn	Ser	Leu Leu	Arg His	His	Asn Met Val	Tyr	Ala
			325			330			335
ACC	ACA	TCC	CGC AGC	GCA	AGC CAG	CGG
Thr	Thr	Ser	Arg Ser	Ala	Ser Gin	Arg

345

672

720

768

816

864

912

960

1008

1035

340

SEQ ID NO:5

TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente

COMPRIMENTO DA SEQUÊNCIA: 834 PARES DE BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: cADN para ARN genómico

FONTE EXPERIMENTAL IMEDIATA: clone BR11 de biblioteca cADN em lambda gtll

CARACTERÍSTICAS:

de 1 a 834 pb na parte da poliproteína de PT-NANBH

PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais

AGA AAA ACC AAA	CGT AAC ACC Arg Asn Thr 5	AAC CTC CGC CCA CAG GAC GTC AGG TTC
Arg Lys	Thr	Lys	Asn Leu	Arg 10	Pro	Gin	Asp	Vai Arg 15	Phe
CCG GGC	GGT	GGT	CAG ATC GTT	GGT GGA	GTT	TAC	CTG	TTG	CCG CGC	AGG
Pro Gly Gly Gly	Gin Ile Vai	Gly Gly	Vai	Tyr	Leu	Leu	Pro Arg Arg
		20		25					30
GGC CCC	AGG	TTG	GGT GTG CGC	GCG ACT	AGG	AAG	ACT	TCC	GAG CGG	TCG
Gly Pro	Arg	Leu	Gly Vai Arg	Ala Thr	Arg	Lys	Thr	Ser	Glu Arg	Ser
	35			40				45
CAA CCT	CGT	GGA	AGG CGA CAA	CCT ATC	CCC	AAG	GCT	CGC	CAG CCC	GAG
Gin Pro	Arg	Gly Arg Arg Gin	Pro Ile	Pro	Lys	Ala	Arg	Gin Pro	Glu
50			55				60

GGC Gly 65	AGG GCC TGG	GCT CAG CCC GGG TAC CCT TGG CCC CTC TAT GGC AAC	240
Arg	Ala Trp	Ala	Gin 70	Pro	Gly Tyr	Pro	Trp Pro Leu Tyr Gly Asn
75	80
GAG	GGC	ATG GGG	TGG	GCA	GGA	TGG CTC	CTG	TCA	CCC CGT GGC TCC CGG	288
Glu	Gly	Met Gly Trp 85	Ala	Gly	Trp Leu	Leu 90	Ser	Pro Arg Gly Ser Arg 95
CCT	AGT	TGG GGC	CCC	ACT	GAC	CCC CGG	CGT	AGG	TCG CGT AAT TTG GGT	336
Pro	Ser	Trp Gly 100	Pro	Thr	Asp	Pro Arg Arg Arg 105	Ser Arg Asn Leu Gly 110
AAA	GTC	ATC GAT	ACC	CTC	ACA	TGC GGC	TTC	GCC	GAC TCT CAT GGG GTA	384
Lys	Vai	lie Asp 115	Thr	Leu	Thr	Cys Gly 120	Phe	Ala	Asp Ser His Gly Vai 125
CAT	TCC	GCT CGT	CGG	CGC	TCC	CTT AGG	GGC	GCT	GCC AGG GCC CTG GCG	432
His	Ser 130	Ala Arg Arg Arg	Ser 135	Leu Arg Gly	Ala	Ala Arg Ala Leu Ala 140
CAT	GGC	GTC CGG	GTT	CTG	GAG	GAC GGC	GTG	AAC	TAT GCA ACA GGG AAT	480
His 145	Gly	Vai Arg	Vai	Leu 150	Glu	Asp Gly	Vai	Asn 155	Tyr Ala Thr Gly Asn 160
TTA	CCC	GGT TGC	TCT	TTC	TCT	ATC TTC	CTC	TTG	GCT TTG CTG TCC TGT	528
Leu	Pro	Gly Cys	Ser 165	Phe	Ser	Ile Phe	Leu 170	Leu	Ala Leu Leu Ser Cys 175
TTG	ACC	ATT CCA	GCT	TCC	GCT	TAT GAA	GTG	CGC	AAC GTG TCC GGG ATC	576
Leu	Thr	Ile Pro 180	Ala	Ser	Ala	Tyr Glu Vai 185	Arg	Asn Vai Ser Gly lie 190
TAC	CAT	GTC ACG	AAC	GAT	TGC	TCC AAC	TCA	AGC	ATC GTG TAC GAG ACA	624
Tyr	His	Vai Thr	Asn	Asp	Cys	Ser Asn	Ser	Ser	Ile Vai Tyr Glu Thr

195 200 205

GCG GAC

ATG ATC ATG CAC

ACC CCC GGG TGT GTG CCC TGT GTC CGG GAG

672

Ala

Asp 210

Met Ile

Met

His

Thr 215

Pro

Gly Cys

Vai Pro 220

Cys

Vai Arg

Glu

GGT

AAT

TCC TCC

CGC

TGC

TGG

GTA

GCG CTC

ACT CCC

ACG

CTC GCG

GCC

720

Gly

Asn

Ser Ser

Arg Cys

Trp

Vai

Ala Leu

Thr Pro

Thr

Leu Ala

Ala

225

230

235

240

AAG

GAC

GCC AGC

ATC

CCC

ACT

GCG

ACA ATA

CGA CGC

CAC

GTC GAT

TTG

768

Lys

Asp

Ala Ser

Ile

Pro

Thr

Ala

Thr Ile

Arg Arg

His

Vai Asp

Leu

245

250

255

CTC

GTT

GGG GCG

GCT

GCC

TTC

TCG

TCC GCT

ATG TAC

GTG

GGG GAT

CTC

816

Leu

Vai

Gly Ala

Ala

Phe

Ser

Ser Ala

Met Tyr

Vai

Gly Asp

Leu

*

260

265

270

TGC

GGA

TCT GTT

TTC

CCG

834

Cys

Gly

Ser Vai

Phe

Pro

275

SEQ ID NO:6

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 31 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

ORGANISMO FONTE ORIGINAL: bacteriófago lambda gtll

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo d75

CARACTERÍSTÍCAS:

de 4 a 9 bases no local BamHI de 10 a 31 bases homólogas à parte a montate do gene lacZ flanqueando o local EcoRI no bacteriófago lambda gtll de 26 a 31 bases no local EcoRI

PROPRIEDADES: faz a primagem da síntese do ADN do vector fago em cADN inserido no local EcoRI e introduz um local BamHI adequado para a clonação subsequente nos vectores de expressão

TAAGGATCCC CCGTCAGTAT CGGCGGAATT C

SEQ ID NO:7

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 30 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

ORGANISMO FONTE ORIGINAL: bacteriofago lambda gtll

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonicleótidos; oligo d76

CARACTERÍSTICAS:

de 4 a 9 bases no local BamHI de 10 a 30 bases homólogas à parte a jusante do gene lacZ flanqueando o local EcoRl no bacteriofago lambda gtll

PROPRIEDADES: faz a primagem da síntese do ADN do vector fago em cADN inserido no local EcoRl e introduz um local BamHI adequado para a clonação subsequente nos vectores de expressão

TATGGATCCG TAGCGACCGG CGCTCAGCTG

SEQ ID NO:8

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 19 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; óligo d94

CARACTERÍSTICAS:

de l a 19 bases homólogas às bases 914 a 932 da banda de sentido de JG2 (SEQ ID NO:3)

PROPRIEDADES: faz a primagem da síntese do ADN na banda negativa do ARN/ADN genómico de PT-NANBH

ATGGGGCAAA GGACGTCCG

SEQ ID NO:9

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 24 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo d94

CARACTERÍSTICAS:

de 1 a 24 bases homólogas às bases 1620 a 1643 da banda de antisentido de JG2 (SEQ ID NO:3)

PROPRIEDADES: faz a primagem da síntese do ADN na banda positiva do ARN/ADN genómico de PT-NANBH

TACCTAGTCA TAGCCTCCGT GAAG 24

SEQ ID NO:10

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 17 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo NI

CARACTERÍSTICAS:

de 1 a 17 bases homólogas às bases 1033 a 1049 da banda de sentido de JG2 (SEQ ID NO:3)

GAGGTTTTCT GCGTCCA 17

SEQ ID NO:11

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 17 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo N2

CARACTERISTICAS:

de 1 a 17 bases homólogas às bases 1421 a 1437 da banda de anti-sentido de JG2 (SEQ ID NO:3)

GCCATAGCCG CAGTTCT 17

SEQ ID NO:12

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 22 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl64

CARACTERÍSTICAS:

de 1 a 22 bases homólogas às bases 10 a 31 da sequência na Fig 2 de Okamoto e col., Japão, J. Exp. Med. 1990, 60, 167-177, base 22 alterada de A para T para introduzir o local de reconhecimento Bgl2 de 8 a 13 bases do local de reconhecimento Bgl2

PROPRIEDADES: faz a primagem da síntese do ADN na banda negativa do ARN/ADN genómico de PT-NANBH e introduz um local Bgl2

CCACCATAGA TCTCTCCCCT GT 22

SEQ ID NO:13

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 30 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl37

CARACTERÍSTICAS:

de 1 a 30 bases homólogas às bases 154 a 183 da banda negativa de BR11 (SEQ ID NO : 5); bases 174, 177 e 178 modificadas para introduzir um local de reconhecimento EcoRI de 5 a 10 bases do local de reconhecimento EcoRI

PROPRIEDADES: faz a primagem da síntese do ADN na banda positiva do ARN/ADN genómico de PT-NANBH e introduz um local EcoRI para clonação

GCGAGAATTC GGGATAGGTT GTCGCCTTCC 30

SEQ ID NO:14

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 27 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl36

CARACTERÍSTICAS:

de 1 a 27 bases homólogas às bases 672 a 698 da banda positiva de BR11 (SEQ ID NO : 5) ; base 675 modificada para introduzir um local de reconhecimento EcoRI de 4 a 9 bases do local de reconhecimento EcoRI

PROPRIEDADES: faz a primagem da síntese do ADN na banda negativa do ARN/ADN genómico de PT-NANBH e introduz um local EcoRI para clonação

GGGGAATTCC TCCCGCTGCT GGGTAGC

SEQ ID NO:15

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 28 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

ORGANISMO FONTE ORIGINAL: chimpanzé; soro infeccioso para hepatite pos-transfusão não-A, não-B

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl55

CARACTERÍSTICAS:

de 1 a 28 bases homólogas às bases 462 a 489 da banda negativa da Fig 47, Pedido da Patente Europeia 88310922.5; bases 483 e 485, modificadas para introduzir um local de reconhecimento EcoRl de 5 a 10 bases do local de reconhecimento EcoRl

PROPRIEDADES: faz a primagem da síntese do ADN na banda positiva do ARN/ADN genómico de PT-NANBH e introduz um local EcoRl para clonação

ACGGGAATTC GACCAGGCAC CTGGGTGT

SEQ ID NO:16

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 23 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl56

CARACTERÍSTICAS:

de 1 a 23 bases homólogas às bases 3315 a 3337 da banda positiva da Fig 47, Pedido da Patente Europeia 88310922.5; bases 3323 modificada para C para introduzir um local de reconhecimento EcoRI de 4 a 9 bases do local de reconhecimento EcoRI

CTTGAATTCT GGGAGGGCGT CTT

SEQ ID NO:17

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 29 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo d92

CARACTERÍSTICAS:

de 1 a 29 bases homólogas às bases 36 a 64 da banda negativa de JG2 (SEQ ID NO : 3); bases 57, 58 e 60 modificadas para introduzir um local de reconhecimento EcoRI de 5 a 10 bases do local de reconhecimento EcoRI

CGCCGAATTC ATGCCGCCAC AGGAGGTTG

SEQ ID NO:18

TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente

COMPRIMENTO DA SEQUÊNCIA: 504 PARES DE BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: cADN para ARN genómico

ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B FONTE EXPERIMENTAL IMEDIATA: clone 164/137

CARACTERÍSTÍCAS:

de 398 a 504 pb início da poliproteína PT-NANBH

PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais

GATCACTCCC CTGTGAGGAA CTACTGTCTT CACGCAGAAA GCGTCTAGCC ATGGCGTTAG 60 TATGAGTGTC GTGCAGCCTC CAGGACCCCC CCTCCCGGGA GAGCCATAGT GGTCTGCGGA 120 ACCGGTGAGT ACACCGGAAT TGCCAGGACG ACCGGGTCCT TTCTTGGATT AACCCGCTCA 180 ATGCCTGGAG ATTTGGGCGT GCCCCCGCAA GACTGCTAGC CGAGTAGTGT TGGGTCGCGA 240 AAGGCCTTGT GGTACTGCCT GATAGGGTGC TTGCGAGTGC CCCGGGAGGT CTCGTAGACC 300

GTGCACC ATG	AGC ACG AAT CCT AAA CCT CAA AGA AAA ACC AAA CGT AAC	349
	Met	Ser Thr	Asn	Pro 5	Lys Pro Gin Arg	Lys 10	Thr Lys Arg Asn
ACC	AAC CGC	CGC CCA	CAG	GAC	GTC AAG TTC CCG	GGC	GGT GGT CAG ATC	397
Thr	Asn Pro	Arg Pro	Gin	Asp	Vai Lys Phe Pro	Gly Gly Gly Gin Ile
15			20		25		30
GTT	GGT GGA	GTT TAC	CTG	TTG	CCG CGC AGG GGC	CCC	AGG TTG GGT GTG	445
Vai	Gly Gly	Vai Tyr	Leu	Leu	Pro Arg Arg Gly	Pro Arg Leu Gly Vai

40 45

CGC GCG ACT AGG AAG ACT TCC GAG CGG TCG CAA CCT CGT GGA AGG CGA Arg Ala Thr Arg Lys Thr Ser Glu Arg Ser Gin Pro Arg Gly Arg Arg

55 60

493

CAA CCT ATC CC Gin Pro Ile Pro

504

SEQ ID NO:19

TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 1107 PARES DE BASES

No DE BANDAS: única topologia: linear

TIPO DE MOLÉCULA: cADN para ARN genómico

ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B FONTE EXPERIMENTAL IMEDIATA: clone 136/155

CARACTERÍSTICAS:

de 1 a 1107 pb de parte da poliproteína PT-NANBH

PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais

TCC

CGC

TGC

TGG

GTA

GCG

CTC

ACT

CCC

ACG

CTC

GCG

GCC

AAG

GAC

Ser

Arg

Cys

Trp 5

Vai

Ala

Leu

Thr

Pro 10

Thr

Leu

Ala

Lys 15

Asp

GCC

AGC

ATC

CCC

ACT

GCG

ACA

ATA

CGA

CGC

CAC

GTC

GAT

TTG

CTC

GTT

Ala

Ser

Ile

Pro 20

Thr

Ala

Thr

Ile

Arg Arg 25

His

Vai

Asp

Leu 30

Leu

Vai

GGG

GCG

GCT

GCC

TTC

TGC

TCC

GCT

ATG

TAC

GTG

GGG

GAT

CTC

TGC

GGA

Gly

Ala

Ala 35

Ala

Phe

Cys

Ser

Ala 40

Met

Tyr

Vai

Gly Asp 45

Leu

Cys

Gly

TCT

GTT

TTC

CTC

GTC

TCT

CAG

CTG

TTC

ACC

TTC

TCG

CCT

CGC

CGA

CAT

Ser

Vai 50

Phe

Leu

Vai

Ser

Gin 55

Leu

Phe

Thr

Phe

Ser 60

Pro

Arg Arg

His

CAG Gin 65

ACG GTA CAG Thr Vai Gin

GAC TGC

AAT TGT TCA ATC TAT CCC GGC CAC GTA TCA

240

Asp

Cys 70

Asn

Cys

Ser Ile

Tyr 75

Pro

Gly

His Vai

Ser 80

GGT

CAC

CGC

ATG

GCT

TGG

GAT

ATG

AAC

TGG

TCA

CCT

ACA

GCA

288

Gly

His

Arg

Met

Ala

Trp

Asp

Met

Asn

Trp

Ser

Pro

Thr

Ala

85

90

95

GCC

CTA

GTG

GTA

TCG

CAG

CTA

CTC

CGG

ATC

CCA

CAA

GCT

GTC

GTG

GAC

336

Ala

Leu

Vai

Ser

Gin

Leu

Arg

Ile

Pro

Gin

Ala

Vai

Asp

100

105

110

ATG

GTG

GCG

GGG

GCC

CAC

TGG

GGA

GTC

CTG

GCG

GGC

CTT

GCC

TAC

TAT

384

Met

Vai

Ala

Gly

Ala

His

Trp

Gly

Vel

Leu

Ala

Gly

Leu

Ala

Tyr

115

120

125

TCC

ATG

GTG

GGG

AAC

TGG

GCT

AAG

GTC

TTG

GTT

GTG

ATG

CTA

CTC

TTT

432

Ser

Met

Vai

Gly

Asn

Trp

Ala

Lys

Vai

Leu

Vai

Met

Leu

Phe

130

135

140

GCC

GGC

GTT

GAC

GGG

GAA

CCT

TAO

ACG

ACA

GGG

ACA

CAC

GGC

CGC

480

Ala

Gly

Vai

Asp

Gly

Glu

Pro

Tyr

Thr

Gly Gly

Thr

His

Gly Arg

145

150

155

160

GCC

CAC

GGG

CTT

ACA

TCC

CTC

TTC

ACA

CCT

GGG

CCG

GCT

CAG

AAA

528

Ala

His

Gly

Leu

Thr

Ser

Leu

Phe

Thr

Pro

Gly

Pro

Ala

Gin

Lys

165

170

175

ATC

CAG

CTT

GTA

AAC

ACC

AAC

GGC

AGC

TGG

CAC

ATC

AAC

AGA

ACT

GCC

576

Ile

Gin

Leu

Vai

Asn

Thr

Asn

Gly

Ser

Trp

His

Ile

Asn

Arg

Thr

Ala

180

185

190

TTG

AAC

TGC

AAT

GAC

TCC

CTC

CAA

ACT

GGG

TTC

CTT

GCC

GCG

CTG

TTC

624

Leu

Asn

Cys

Asn

Asp

Ser

Leu

Gin

Thr

Gly

Phe

Leu

Ala

Leu

Phe

195

200

205

TAC ACG Tyr Thr

CAC His

AGG TTC AAT GCG TCC GGA TGC TCA GAG CGC ATG GCC AGC

672

Arg Phe

Asn

Ala Ser 215

Gly Cys

Ser

Glu Arg 220

Met Ala

Ser

210

TGC

CGC

CCC

ATT

GAC

CAG

TTC

GAT

CAG

GGG

TGG

GGT

CCC

ATC

ACT

TAT

720

Cys

Arg

Pro

Ile

Asp

Gin

Phe

Asp

Gin

Gly

Trp

Gly

Pro

Ile

Thr

Tyr

225

230

235

240

AAT

GAG

TCC

CAC

GGC

TTG

GAC

CAG

AGG

CCC

TAT

TGC

TGG

CAC

TAC

GCA

768

Asn

Glu

Ser

His

Gly

Leu

Asp

Gin

Arg

Pro

Tyr

Cys

Trp

His

Tyr

Ala

245

250

255

CCT

CAA

CCG

TGT

GGT

ATC

GTG

CCC

GCG

TTG

CAG

GTG

TGT

GGC

CCA

GTG

816

Pro

Gin

Pro

Cys

Gly

Ile

Vai

Pro

Ala

Leu

Gin

Vai

Cys

Gly

Pro

Vai

•

260

265

270

TAC

TGT

TTC

ACT

CCA

AGC

CCT

GTT

GTG

GGG

ACG

ACC

GAT

CGT

TTC

864

Tyr

Cys

Phe

Thr

Pro

Ser

Pro

Vai

Gly

Thr

Asp

Arg

Phe

275

280

285

GGC

GCC

CCT

ACG

TAC

AGA

TGG

GGT

GAG

AAT

GAG

ACG

GAC

GTG

CTG

CTT

912

Gly

Ala

Pro

Thr

Tyr

Arg

Trp

Gly

Glu

Asn

Glu

Thr

Asp

Vai

Leu

290

295

300

CTC

AAC

ACG

CGG

CCG

CCA

CGG

GGC

AAC

TGG

TTC

GGC

TGT

ACA

TGG

960

Leu

Asn

Thr

Arg

Pro

Arg Gly

Asn

Trp

Phe

Gly Cys

Thr

Trp

305

310

315

320

ATG

AAT

AGC

ACC

GGG

TTC

ACC

AAG

ACG

TGT

GGG

GGC

CCC

CCG

TGC

AAC

1008

Met

Asn

Ser

Thr

Gly

Phe

Thr

Lys

Thr

Cys

Gly Gly

Pro

Cys

Asn

325

330

335

ATC

GGG

GTC

GGC

AAC

ACT

TTG

ATC

TGC

CCC

ACG

GAC

TGC

TTC

1056

Ile

Gly Gly

Vai

Gly

Asn

Thr

Leu

Ile

Cys

Pro

Thr

Asp

Cys

Phe

340 345 350

CGG AAG Arg Lys

TTG

1107

Leu

CAT CCC GAG GCC ACT TAC ACC AAA TGC GGT TCG GGG CCT TGG 1104

His Pro Glu Ala Thr Tyr Thr Lys Cys Gly Ser Gly Pro Trp 355 360 365

SEQ ID NO:20

TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 2043 PARES DE BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: cADN para ARN genómico

ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B FONTE EXPERIMENTAL IMEDIATA: clone 156/92

CARACTERISTICAS:

de 1 a 2043 pb na parte da poliproteína PT-NANBH

PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais

TGG

GAG

GGC

GTC

TTC

ACA

GGC

CTC

ACC

CAC

GTG

GAT

GCC

CAC

TTC

CTG

Trp

Glu

Gly

Vai

Phe 5

Thr

Gly

Leu

Thr

His 10

Vai

Asp

Ala

His

Phe 15

Leu

TCC

CAA

ACA

AAG

CAG

GCA

GGA

GAC

AAC

TTC

CCC

TAC

CTG

GTG

GCG

TAC

Ser

Gin

Thr

Lys 20

Gin

Ala

Gly Asp

Asn 25

Phe

Pro

Tyr

Leu

Vai 30

Ala

Tyr

CAG

GCT

ACT

GTG

TGC

GCT

AGG

GCC

CAG

GCC

CCA

CCT

CCA

TCA

TGG

GAT

Gin

Ala

Thr 35

Vai

Cys

Ala

Arg

Ala 40

Gin

Ala

Pro

Pro 45

Ser

Trp

Asp

CAA

ATG

TGG

AAG

TGT

CTC

ATA

CGG

CTA

AAG

CCT

ACT

CTG

CGC

CCG

CCA

Gin

Met 50

Trp

Lys

Cys

Leu

Ile 55

Arg

Leu

Lys

Pro

Thr 60

Leu

Arg

Gly

Pro

ACA Thr 65

CCC TTG CTG

TAT AGG CTG GGA GCC GTC CAA AAC GAG GTC ACC CTC

240

Pro

Leu

Tyr

Arg 70

Leu

Gly Ala

Val

Gin Asn Glu Val Thr Leu

75

80

ACA

CAC

CCC

ATA

ACC

AAA

TTC

ATC

ATG

GCA

TGC

ATG

TCA

GCC

GAC

CTG

288

Thr

His

Pro

Ile

Thr

Lys

Phe

Ile

Met

Ala

Cys

Met

Ser

Ala

Asp

Leu

85

90

95

GAG

GTC

ACG

AGC

ACC

TGG

GTG

CTG

GTG

GGC

GGG

GTC

CTT

GCA

GCT

336

Glu Val

Val

Thr

Ser

Thr

Trp

Val

Leu

Val

Gly Gly

Val

Leu

Ala

100

105

110

CTG

GCT

GCG

TAT

TGC

TTG

ACA

GGC

AGC

GTG

GTC

ATT

GTG

GGT

AGG

384

Leu

Ala

Tyr Cys

Leu

Thr

Gly

Ser

Val

Ile

Val

Gly

Arg

•

115

120

125

ATC

TTG

TCC

GGG

CGG

CCG

GCT

ATT

GTT

CCC

GAC

AGG

GAA

GTC

CTC

432

Ile

Leu

Ser

Gly Arg

Pro

Ala

Ile

Val

Pro

Asp

Arg

Glu

Val

Leu

130

135

140

TAC

CAG

GAG

TTC

GAT

GAG

ATG

GAA

GAG

TGC

GCG

TCG

CAC

CTC

CCT

TAC

480

Tyr

Gin

Glu

Phe

Asp

Glu

Met

Glu

Cys

Ala

Ser

His

Leu

Pro

Tyr

145

150

155

160

ATC

GAG

CAG

GGA

ATG

CAG

CTC

GCC

GAG

CAG

TTC

AAG

CAA

AAA

GCG

CTC

528

Ile

Glu

Gin

Gly

Met

Gin

Leu

Ala

Glu

Gin

Phe

Lys

Gin

Lys

Ala

Leu

165

170

175

GGG

TTG

CTG

CAG

ACA

GCC

ACC

AAG

GAA

GCG

GAG

GCC

GCT

CCC

GTG

576

Gly

Leu

Gin

Thr

Ala

Thr

Lys

Gin

Ala

Glu

Ala

Pro

Val

180

185

190

GTG

GAG

TCC

AAG

TGG

CGA

GCC

CTT

GAG

ACC

TTC

TGG

GCG

AAA

CAC

ATG

624

Val

Glu

Ser

Lys

Trp

Arg

Ala

Leu

Glu

Thr

Phe

Trp

Ala

Lys

His

Met

195 200 205

TGG Trp

AAC TTC ATC AGC GGG

ATA CAG TAC TTA GCA GGC TTG TCC ACT CTG

672

Asn Phe 210

Ile Ser

Gly

Ile Gin 215

Tyr

Leu

Ala

Gly Leu 220

Ser Thr

Leu

CCT

GGG

AAT

CCC

GCG

ATT

GCA

TCA

CTG

ATG

GCG

TTC

ACA

GCC

TCT

GTC

720

Pro

Gly

Asn

Pro

Ala

Ile

Ala

Ser

Leu

Met

Ala

Phe

Thr

Ala

Ser

Vai

225

230

235

240

ACT

AGC

CCG

CTC

ACC

CAA

TCT

ACC

CTC

CTG

CTT

AAC

ATC

CTG

GGG

768

Thr

Ser

Pro

Leu

Thr

Gin

Ser

Thr

Leu

Asn

Ile

Leu

Gly

245

250

255

GGA

TGG

GTA

GCC

CAA

CTC

GCT

CCC

AGT

GCT

TCA

GCT

TTC

816

Gly

Trp

Vai

Ala

Gin

Leu

Ala

Pro

Ser

Ala

Ser

Ala

Phe

•

260

265

270

GTA

GGC

GCC

GGC

ATT

GCT

GGT

GCG

GCT

GTT

GGC

AGC

ATA

GGC

CTT

GGG

864

Vai

Gly

Ala

Gly

Ile

Ala

Gly

Ala

Vai

Gly

Ser

Ile

Gly

Leu

Gly

275

280

285

AAG

GTG

CTT

GTG

GAC

ATC

TTG

GCG

GGC

TAT

GGA

GCA

GGA

GTG

GCA

GGC

912

Lys

Vai

Leu

Vai

Asp

Ile

Leu

Ala

Gly Tyr

Gly

Ala

Gly

Vai

Ala

Gly

290

295

300

GCG

CTC

GTG

GCC

TTT

AAG

GTC

ATG

AGC

GGC

GAA

ATG

CCC

TCC

ACC

GAG

960

Ala

Leu

Vai

Ala

Phe

Lys

Vai

Met

Ser

Gly

Glu

Met

Pro

Ser

Thr

Glu

305

310

315

320

GAC

CTG

GTT

AAC

TTA

CTC

CCT

GCC

ATC

CTC

TCT

CCT

GGT

GCC

CTG

GTC

1008

Asp

Leu

Vai

Asn

Leu

Pro

Ala

Ile

Leu

Ser

Pro

Gly

Ala

Leu

Vai

325

330

335

GTC

GGG

GTC

GTG

TGC

GCA

GCG

ATA

CTG

CGT

CGG

CAC

GTG

GGT

CCA

GGG

1056

Vai

Gly

Vai

Cys

Ala

Ile

Leu

Arg Arg

His

Vai

Gly

Pro

Gly

340 345 350

GAG GGG GCT GTG CAG	TGG Trp	ATG Met	AAC CGG CTG ATA GCG TTC GCC TCG CGG	1104
Glu	Gly	Ala Vai 355	Gin	Asn Arg 360	Leu Ile	Ala	Phe Ala Ser Arg 365
GGT	AAC	CAT GTT	TCC	CCC	ACG	CAC TAT	GTG CCA	GAG	AGC GAC GCC GCA	1152
Gly	Asn 370	His Vai	Ser	Pro	Thr 375	His Tyr	Vai Pro	Glu 380	Ser Asp Ala Ala
GCA	CGT	GTC ACT	CAG	ATC	CTC	TCC GAC	CTT ACT	ATC	ACC CAA CTG TTG	1200
Ala 385	Arg	Vai Thr	Gin	Ile 390	Leu	Ser Asp	Leu Thr 395	Ile	Thr Gin Leu Leu 400
AAG	AGG	CTC CAC	CAG	TGG	ATT	AAC GAG	GAC TGC	TCC	ACG CCC TGC TCC	1248
Lys	Arg	Leu His	Gin 405	Trp	Ile	Asn Glu	Asp Cys 410	Ser	Thr Pro Cys Ser 415
GGC	TCG	TGG CTA	AGG	GAT	GTT	TGG GAC	TGG ATA	TGC	ACA GTT TTG GCT	1296
Gly	Ser	Trp Leu 420	Arg Asp	Vai	Trp Asp 425	Trp Ile	Cys	Thr Vai Leu Ala 430
GAC	TTC	AAG ACC	TGG	CTC	CAG	TCC AAG	CTC CTG	CCG	CGA TTA CCG GGA	1344
Asp	Phe	Lys Thr 435	Trp	Leu	Gin	Ser Lys 440	Leu Leu	Pro	Arg Leu Pro Gly 445
GTC	CCC	TTT TTC	TCA	TGC	CAA	CGT GGG	TAC AAG	GGG	GTC TGG CGG GGA	1392
Vai	Pro 450	Phe Phe	Ser	Cys	Gin 455	Arg Gly Tyr Lys	Gly 460	Vai Trp Arg Gly
GAC	GGC	ATC ATG	CAG	ACC	ACC	TGC TCA	TGT GGA	GCA	CAG ATC ACC GGA	1440
Asp 465	Gly	Ile Met	Gin	Thr 470	Thr	Cys Ser	Cys Gly 475	Ala	Gin Ile Thr Gly 480
CAT	GTC	AAA AAC	GGT	TCC	ATG	AGG ATC	GTT GGG	CCT	AAG ACC TGT AGT	1488
His	Vai	Lys Asn	Gly	Ser	Met	Arg Ile	Vai Gly	Pro	Lys Thr Cys Ser

485 490 495

AAC ATG	TGG CAT	GGA ACA TTC CCC	ATC AAC	GCA TAC ACC ACG GGC CCC	1536
Asn	Met	Trp	His 500	Gly Thr Phe	Pro	Ile 505	Asn	Ala Tyr Thr	Thr Gly 510	Pro
TGC	ACG	CCC	TCC	CCA GCG CCA	AAC	TAT	TCC	AGG GCG CTG	TGG CGG	GTG	1584
Cys	Thr	Pro 515	Ser	Pro Ala Pro	Asn 520	Tyr	Ser	Arg Ala Leu 525	Trp Arg	Vai
GCT	GCT	GAG	GAG	TAC GTG GAG	GTT	ACG	CGG	GTG GGG GAT	TTC CAC	TAC	1632
Ala	Ala 530	Glu	Glu	Tyr Vai Glu 535	Vai	Thr	Arg	Vai Gly Asp 540	Phe His	Tyr
GTG	ACG	AGC	ATG	ACC ACT GAC	AAC	GTA	AAA	TGC CCG TGC	CAG GTT	CCA	1680
Vai 545	Thr	Ser	Met	Thr Thr Asp 550	Asn	Vai	Lys	Cys Pro Cys 555	Gin Vai	Pro 560	•
GCC	CCC	GAA	TTC	TTC ACA GAA	GTG	GAT	GGG	GTG CGG CTG	CAC AGG	TAC	1728
Ala	Pro	Glu	Phe	Phe Thr Glu 565	Vai	Asp	Gly 570	Vai Arg Leu	His Arg 575	Tyr
GCT	CCG	GCG	TGC	AAA CCT CTC	CTA	CGG	GAG	GAG GTC ACA	TTC CAG	GTC	1776
Ala	Pro	Ala	Cys 580	Lys Pro Leu	Leu	Arg 585	Glu	Glu Vai Thr	Phe Gin 590	Vai
GGG	CTC	AAC	CAA	TAC CTG GTT	GGG	TCG	CAG	CTC CCA TGC	GAG CCC	GAA	1824
Gly	Leu	Asn 595	Gin	Tyr Leu Vai	Gly 600	Ser	Gin	Leu Pro Cys 605	Glu Pro	Glu
CCG	GAT	GTA	GCA	GTG CTC ACT	TCC	ATG	CTC	ACC GAC CCC	TCC CAC	ATC	1872
Pro	Asp 610	Vai	Ala	Vai Leu Thr 615	Ser	Met	Leu	Thr Asp Pro 620	Ser His	Ile
ACA	GCA	GAG	ACG	GCT AAG CGC	AGG	CTG	GCC	AGG GGG TCT	CCC CCC	TCC	1920
Thr	Ala	Glu	Thr	Ala Lys Arg Arg	Leu	Ala	Arg Gly Ser	Pro Pro	Ser

625

630

635

640

TTG

GCC

AGC

TCT

TCA

GCT

AGC

CAG

TTG

TCT

GCG

CCT

TCC

TCG

AAG

GCG 1968

Leu

Ala

Ser

Ala

Ser

Gin

Leu

Ser

Ala

Pro

Ser

Lys

Ala

645

650

655

ACA

TAC

ATT

ACC

CAA

AAT

GAC

TTC

CCA

GAC

GCT

GAC

CTC

ATC

GAG

GCC 2016

Thr

Tyr

Ile

Thr

Gin

Asn

Asp

Phe

Pro

Asp

Ala

Asp

Leu

lie

Glu

Ala

660

665

670

AAC

CTC

CTG

TGG

CGG

CAT

GAG

ATG

GGC

2043

Asn

Leu

Trp

Arg

His

Glu

Met

Gly

675

680

SEQ ID NO:21

TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 2116 PARES DE BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: cADN para ARN genómico

FONTE EXPERIMENTAL IMEDIATA: contig formado por clones de cADN do terminal 5' do genoma

CARACTERÍSTICAS:

de 308 a 2116 pb do início da poliproteína PT-NANBH

PROPRIEDADES: codifica provavelmente as proteínas virais estruturais e não estruturais

GATCACTCCC CTGTGAGGAA CTACTGTCTT CACGCAGAAA GCGTCTAGCC ATGGCGTTAG 60 TATGAGTGTC GTGCAGCCTC CAGGACCCÔC CCTCCCGGGA GAGCCATAGT GGTCTGCGGA 120 ACCGGTGAGT ACACCGGAAT TGCCAGGACG ACCGGGTCCT TTCTTGGATT AACCÇGCTCA 180 ATGCCTGGAG ATTTGGGCGT GCCCCCGCAA GACTGCTAGC CGAGTAGTGT TGGGTCGCGA 240 AAGGCCTTGT GGTACTGCCT GATAGGGTGC TTGCGAGTGC CCCGGGAGGT CTCGTAGACC 300

GTGCACC ATG	AGC ACG AAT CCT AAA CCT CAA AGA AAA ACC AAA CGT AAC	349
	Met	Ser Thr	Asn	Pro 5	Lys Pro Gin Arg	Lys 10	Thr Lys Arg	Asn
ACC	AAC CGC	CGC CCA	CAG	GAC	GTC AAG TTC CCG	GGC	GGT GGT CAG	ATC	397
Thr	Asn Pro	Arg Pro	Gin	Asp	Val Lys Phe Pro	Gly Gly Gly Gin	Ile
15			20		25			30
GTT	GGT GGA	GTT TAC	CTG.	TTG	ÇCG CGC AGG GGC	cçc	AGG TTG GGT	GTG	445
Val	Gly Gly	Val Tyr	Leu	Leu	Pro Arg Arg Gly Pro Arg Leu Gly	Val

40 45

CGC GCG ACT AGG AAG ACT TCC GAG CGG TCG CAA CCT CGT GGA AGG CGA	493
Arg	Ala Thr	Arg Lys Thr Ser Glu Arg	Ser Gin	Pro Arg Gly 60	Arg Arg
50	55
CAA	CCT ATC	CCC AAG GCT	CGC CAG CCC	GAG GGC	AGG GCC TGG	GCT CAG	541
Gin	Pro Ile 65	Pro Lys Ala	Arg Gin Pro 70	Glu Gly Arg Ala Trp 75	Ala Gin
CCC	GGG TAC	CCT TGG CCC	CTC TAT GGC	AAC GAG	GGC ATG GGG	TGG GCA	589
Pro	Gly Tyr 80	Pro Trp Pro	Leu Tyr Gly 85	Asn Glu	Gly Met Gly Trp Ala 90
GGA	TGG CTC	CTG TCA CCC	CGT GGC TCC	CGG CCT	AGT TGG GGC	CCC ACT	637
Gly 100	Trp Leu	Leu Ser Pro 105	Arg Gly Ser	Arg Pro 110	Ser Trp Gly	Pro Thr 115
GAC	CCC CGG	CGT AGG TCG	CGT AAT TTG	GGT AAA	GTC ATC GAT	ACC CTC	685
Asp	Pro Arg Arg Arg Ser Arg Asn Leu 120	Gly Lys 125	Vai Ile Asp	Thr Leu 130
ACA	TGC GGC	TTC GCC GAC	CTC ATG GGG	TAC ATT	CCG CTC GTC	GGC GCT	733
Thr	Cys Gly	Phe Ala Asp 135	Leu Met Gly Tyr Ile 140	Pro'Leu Vai 145	Gly Ala
CCC	TTA GGG	GGC GCT GCC	AGG GCC CTG	GCG CAT	GGC GTC CGG	GTT GTG	781
Pro	Leu Gly Gly Ala Ala 150	Arg Ala Leu 155	Ala His	Gly Vai Arg 160	Vai Leu
GAG	GAC GGC	GTG AAC TAT	GCA ACA GGG	AAT TTA	CCC GGT TGC	TCT TTC	829
Glu	Asp Gly 165	Vai Asn Tyr	Ala Thr Gly 170	Asn Leu	Pro Gly Cys 175	Ser Phe
TCT	ATC TTC	CTC TTG GCT	TTG CTG TCC	TGT TTG	ACC ATT CCA	GCT TCC	877
Ser 180	Ile Phe	Leu Leu Ala 185	Leu Leu Ser	Cys Leu 190	Thr Ile Pro	Ala Ser 195

GCT Ala

TAT GAA GTG CGC AAC GTG TCC

GGG ATC TAC CAT GTC ACG AAC GAT

925

Tyr Glu Vai Arg Asn 200

Vai Ser

Gly

Ile 205

Tyr His

Vai

Thr

Asn Asp 210

TGC

TCC

AAC

TCA

AGC

ATC

GTG

TAC

GAG

ACA

GCG

GAC

ATG

ATC

ATG

CAC

973

Cys

Ser

Asn

Ser

Ile

Vai

Tyr

Glu

Thr

Ala

Asp

Met

Ile

Met

His

215

220

225

ACC

CCC

GGG

TGT

GTG

CCC

TGT

GTC

CGG

GAG

GGT

AAT

TCC

CGC

TGC

1021

Thr

Pro

Gly

Cys

Vai

Pro

Cys

Vai

Arg

Glu

Gly

Asn

Ser

Arg

Cys

230

235

240

TGG

GTA

GCG

CTC

ACT

CCC

ACG

CTC

GCG

GCC

AAG

GAC

GCC

AGC

ATC

CCC

1069

Trp

Vai

Ala

Leu

Thr

Pro

Thr

Leu

Ala

Lys

Asp

Ala

Ser

Ile

Pro

•

245

250

255

ACT

GCG

ACA

ATA

CGA

CGC

CAC

GTC

GAT

TTG

CTC

GTT

GGG

GCG

GCT

GCC

1117

Thr

Ala

Thr

Ile

Arg Arg

His

Vai

Asp

Leu

Vai

Gly

Ala

260

265

270

275

TTC

TGC

TCC

GCT

ATG

TAC

GTG

GGG

GAT

CTC

TGC

GGA

TCT

GTT

TTC

CTC

1165

Phe

Cys

Ser

Ala

Met

Tyr

Vai

Gly

Asp

Leu

Cys

Gly

Ser

Vai

Phe

Leu

280

285

290

GTC

TCT

CAG

CTG

TTC

ACC

TTC

TCG

CCT

CGC

CGA

CAT

CAG

ACG

GTA

CAG

1213

Vai

Ser

Gin

Leu

Phe

Thr

Phe

Ser

Pro

Arg Arg

His

Gin

Thr

Vai

Gin

295

300

305

GAC

TGC

AAT

TGT

TCA

ATC

TAT

CCC

GGC

CAC

GTA

TCA

GGT

CAC

CGC

ATG

1261

Asp

Cys

Asn

Cys

Ser

Ile

Tyr

Pro

Gly

His

Vai

Ser

Gly

His

Arg

Met

310

315

320

GCT

TGG

GAT

ATG

AAC

TGG

TCA

CCT

ACA

GCA

GCC

CTA

GTG

GTA

1309

Ala

Trp

Asp

Met

Asn

Trp

Ser

Pro

Thr

Ala

Leu

Vai

325 330 335

TCG

CAG

CTA

CTC

CGG

ATC

CCA

CAA

GCT

GTC

GTG

GAC

ATG

GTG

GCG

GGG

Ser 340

Gin

Leu

Arg

Ile 345

Pro

Gin

Ala

Vai

Vai 350

Asp

Met

Vai

Ala

Gly 355

GCC

CAC

TGG

GGA

GTC

CTG

GCG

GGC

CTT

GCC

TAC

TAT

TCC

ATG

GTG

GGG

Ala

His

Trp

Gly

Vai 360

Leu

Ala

Gly

Leu

Ala 365

Tyr

Ser

Met

Vai 370

Gly

AAC

TGG

GCT

AAG

GTC

TTG

GTT

GTG

ATG

CTA

CTC

TTT

GCC

GGC

GTT

GAC

Asn

Trp

Ala

Lys 375

Vai

Leu

Vai

Met 380

Leu

Phe

Ala

Gly 385

Vai

Asp

GGG

GAA

CCT

TAC

ACG

ACA

GGG

ACA

CAC

GGC

CGC

GCC

CAC

GGG

Gly

Glu

Pro 390

Tyr

Thr

Gly Gly 395

Thr

His

Gly Arg

Ala 400

Ala

His

Gly

CTT

ACA

TCC

CTC

TTC

ACA

CCT

GGG

CCG

GCT

CAG

AAA

ATC

CAG

CTT

GTA

Leu

Thr 405

Ser

Leu

Phe

Thr

Pro 410

Gly

Pro

Ala

Gin

Lys 415

Ile

Gin

Leu

Vai

AAC

ACC

AAC

GGC

AGC

TGG

CAC

ATG

AAC

AGA

ACT

GCC

TTG

AAC

TGC

AAT

Asn 420

Thr

Asn

Gly

Ser

Trp 425

His

Ile

Asn

Arg

Thr 430

Ala

Leu

Asn

Cys

Asn 435

GAC

TCC

CTC

CAA

ACT

GGG

TTC

CTT

GCC

GCG

CTG

TTC

TAC

ACG

CAC

AGG

Asp

Ser

Leu

Gin

Thr 440

Gly

Phe

Leu

Ala

Ala 445.

Leu

Phe

Tyr

Thr

His 450

Arg

TTC

AAT

GCG

TCC

GGA

TGC

TCA

GAG

CGC

ATG

GCC

AGC

TGC

CGC

CCC

ATT

Phe

Asn

Ala

Ser 455

Gly

Cys

Ser

Glu

Arg 460

Met

Ala

Ser

Cys

Arg 465

Pro

Ile

GAC

CAG

TTC

GAT

CAG

GGG

TGG

GGT

CCC

ATC

ACT

TAT

AAT

GAG

TCC

CAC

Asp

Gin

Phe

Asp

Gin

Gly Trp

Gly

Pro

Ile

Thr

Tyr

Asn

Glu

Ser

His

470 475 480

1357

1405

1453

1501

1549

1645

1741

1597

1693

GGC TTG GAC CAG AGG

CCC Pro

TAT Tyr 490

TGC TGG CAC

TAC GCA CCT CAA CCG TGT

1789

Gly Leu Asp Gin

Arg

Cys

Trp

His

Tyr Ala Pro 495

Gin Pro Cys

485

GGT

ATC

GTG

CCC

GCG

TTG

CAG

GTG

TGT

GGC

CCA

GTG

TAC

TGT

TTC

ACT

1837

Gly

Ile

Vai

Pro

Ala

Leu

Gin

Vai

Cys

Gly

Pro

Vai

Tyr

Cys

Phe

Thr

500

505

510

515

CCA

AGC

CCT

GTT

GTG

GGG

ACG

ACC

GAT

CGT

TTC

GGC

GCC

CCT

ACG

1885

Pro

Ser

Pro

Vai

Gly

Thr

Asp

Arg

Phe

Gly

Ala

Pro

Thr

520

525

530

TAC

AGA

TGG

GGT

GAG

AAT

GAG

ACG

GAC

GTG

CTG

CTT

CTC

AAC

ACG

1933

Tyr Arg

Trp

Gly

Glu

Asn

Glu

Thr

A‘sp

Vai

Leu

Asn

Thr

535

540

545

CGG

CCG

CCA

CGG

GGC

AAC

TGG

TTC

GGC

TGT

ACA

TGG

ATG

AAT

AGC

ACC

1981

Arg

Pro

Arg

Gly

Asn

Trp

Phe

Gly Cys

Thr

Trp

Met

Asn

Ser

Thr

550

555

560

GGG

TTC

ACC

AAG

ACG

TGT

GGG

GGC'

CCC

CCG

TGC

AAC

ATC

GGG

GTC

2029

Gly

Phe

Thr

Lys

Thr

Cys

Gly Gly

Pro

Cys

Asn

Ile

Gly Gly

Vai

565

570

575

GGC

AAC

ACT

TTG

ATC

TGC

CCC

ACG

GAC

TGC

TTC

CGG

AAG

CAT

CCC

2077

Gly

Asn

Thr

Leu

Ile

Cys

Pro

Thr

Asp

Cys

Phe

Arg Lys

His

Pro

580

585

590

595

GAG

GCC

ACT

TAC

ACC

AAA

TGC

GGT

TCG

GGG

CCT

TGG

TTG

2116

Glu

Ala

Thr

Tyr

Thr

Lys

Cys

Gly

Ser

Gly

Pro

Trp

Leu

600 605

SEQ ID NO:22

TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 3750 PARES DE BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: cADN para ARN genómico

FONTE EXPERIMENTAL IMEDIATA: contig” formado por clones de cADN do terminal 3' do genona

CARACTERÍSTICAS:

de 1 a 3750 pb da parte da poliproteína PT-NANBH

PROPRIEDADES: proteínas virais não estruturais

TGG GAG GGC GTC TTC ACA GGC CTC ACC CAC GTG GAT GCC CAC TTC

CTG Leu

Trp Glu Gly Val Phe Thr Gly Leú Thr His

Val

Asp

Ala

His

Phe 15

5

10

TCC

CAA

ACA

AAG

CAG

GCA

GGA

GAC

AAC

TTC

CCC

TAC

CTG

GTG

GCG

TAC

Ser

Gin

Thr

Lys

Gin

Ala

Gly Asp

Asn

Phe

Pro

Tyr

Leu

Val

Ala

Tyr

20

25

»

30

CAG

GCT

ACT

GTG

TGC

GCT

AGG

GCC

CAG

GCC

CCA

CCT

CCA

TCA

TGG

GAT

Gin

Ala

Thr

Val

Cys

Ala

Arg

Ala

Gin

Ala

Pro

Ser

Trp

Asp

35

40

45

CAA

ATG

TGG

AAG

TGT

CTC

ATA

CGG

CTA

AAG

CCT

ACT

CTG

GGC

GGG

CCA

Gin

Met

Trp

Lys

Cys

Leu

Ile

Arg

Leu

Lys

Pro

Thr

Leu

Arg

Gly

Pro

50

55

60

ACA Thr 65

CCC TTG CTG Pro Leu Leu

TAT AGG

CTG GGA GCC GTC CAA AAC GAG GTC ACC CTC

240

Tyr

Arg 70

Leu

Gly

Ala Vai

Gin 75

Asn

Glu

Vai Thr

Leu 80

ACA

CAC

CCC

ATA

ACC

AAA

TTC

ATC

ATG

GCA

TGC

ATG

TCA

GCC

GAC

CTG

288

Thr

His

Pro

Ile

Thr

Lys

Phe

Ile

Met

Ala

Cys

Met

Ser

Ala

Asp

Leu

85

90

95

GAG

GTC

ACG

AGC

ACC

TGG

GTG

CTG

GTG

GGC

GGG

GTC

CTT

GCA

GCT

336

Glu

Vai

Thr

Ser

Thr

Trp

Vai

Leu

Vai

Gly Gly

Vai

Leu

Ala

100

105

110

CTG

GCT

GCG

TAT

TGC

TTG

ACA

GGC

AGC

GTG

GTC

ATT

GTG

GGT

AGG

384

Leu

Ala

Tyr

Cys

Leu

Thr

Gly

Ser

Vai

Ile

Vai

Gly Arg

•

115

120

125

ATC

TTG

TCC

GGG

CGG

CCG

GCT

ATT

GTT

CCC

GAC

AGG

GAA

GTC

CTC

432

Ile

Leu

Ser

Gly Arg

Pro

Ala

Ile

Vai

Pro

Asp

Arg

Glu

Vai

Leu

130

135

140

TAC

CAG

GAG

TTC

GAT

GAG

ATG

GAA

GAG

TGC

GCG

TCG

CAC

CTC

CCT

TAC

480

Tyr

Gin

Glu

Phe

Asp

Glu

Met

Glu

Cys

Ala

Ser

His

Leu

Pro

Tyr

145

150

155

160

ATC

GAG

CAG

GGA

ATG

CAG

CTC

GCC

GAG

CAG

TTC

AAG

CAA

AAA

GCG

CTC

528

Ile

Glu

Gin

Gly

Met

Gin

Leu

Ala

Glu

Gin

Phe

Lys

Gin

Lys

Ala

Leu

165

170

175

GGG

TTG

CTG

CAG

ACA

GCC

ACC

AAG

CAA

GCG

GAG

GCC

GCT

CCC

GTG

576

Gly

Leu

Gin

Thr

Ala

Thr

Lys

Gin

Ala

Glu

Ala

Pro

Vai

180

185

190

GTG

GAG

TCC

AAG

TGG

CGA

GCC

CTT

GAG

ACC

TTC

TGG

GCG

AAA

CAC

ATG

624

Vai

Glu

Ser

Lys

Trp

Arg

Ala

Leu

Glu

Thr

Phe

Trp

Ala

Lys

His

Met

195

200

205

TGG AAC Trp Asn

TTC Phe

ATC AGC GGG ATA CAG TAC TTA GCA GGC TTG TCC ACT CTG

Ile Ser

Gly

Ile Gin 215

Tyr Leu

Ala

Gly Leu Ser 220

Thr

Leu

210

CCT

GGG

AAT

CCC

GCG

ATT

GCA

TCA

CTG

ATG

GCG

TTC

ACA

GCC

TCT

GTC

Pro

Gly

Asn

Pro

Ala

Ile

Ala

Ser

Leu

Met

Ala

Phe

Thr

Ala

Ser

Vai

225

230

235

240

ACT

AGC

CCG

CTC

ACC

CAA

TCT

ACC

CTC

CTG

CTT

AAC

ATC

CTG

GGG

Thr

Ser

Pro

Leu

Thr

Gin

Ser

Thr

Leu

Asn

Ile

Leu

Gly

245

250

255

GGA

TGG

GTA

GCC

CAA

CTC

GCT

CCC

AGT

GCT

TCA

GCT

TTC

Gly

Trp

Vai

Ala

Gin

Leu

Ala

Pro

Ser

Ala

Ser

Ala

Phe

260

265

270

GTA

GGC

GCC

GGC

ATT

GCT

GGT

GCG

GCT

GTT

GGC

AGC

ATA

GGC

CTT

GGG

Vai

Gly

Ala

Gly

Ile

Ala

Gly

Ala

Vai

Gly

Ser

Ile

Gly

Leu

Gly

275

280

285

AAG

GTG

CTT

GTG

GAC

ATC

TTG

GCG

GGC

TAT

GGA

GCA

GGA

GTG

GCA

GGC

Lys

Vai

Leu

Vai

Asp

Ile

Leu

Ala' Gly Tyr Gly

Ala

Gly

Vai

Ala

Gly

290

295

300

GCG

CTC

GTG

GCC

TTT

AAG

GTC

ATG

AGC

GGC

GAA

ATG

CCC

TCC

ACC

GAG

Ala

Leu

Vai

Ala

Phe

Lys

Vai

Met

Ser

Gly

Glu

Met

Pro

Ser

Thr

Glu

305

310

315

320

GAC

CTG

GTT

AAC

TTA

CTC

CCT

GCC

ATC

CTC

TCT

CCT

GGT

GCC

CTG

GTC

Asp

Leu

Vai

Asn

Leu

Pro

Ala

Ile

Leu

Ser

Pro

Gly

Ala

Leu

Vai

325

330

335

GTC

GGG

GTC

GTG

TGC

GCA

GCG

ATA

CTG

CGT

CGG

CAC

GTG

GGT

CCA

GGG

Vai

Gly

Vai

Cys

Ala

Ile

Leu

Arg Arg

His

Vai

Gly

Pro

Gly

672

720

768

816

864

912

960

1008

1056

340 345 350

GAG GGG GCT GTG CAG	TGG Trp	ATG Met	AAC CGG CTG ATA GCG TTC GCC TCG CGG	1104
Glu	Gly	Ala Vai 355	Gin	Asn Arg 360	Leu Ile	Ala	Phe Ala Ser Arg 365
GGT	AAC	CAT GTT	TCC	CCC	ACG	CAC TAT	GTG CCA	GAG	AGC GAC GCC GCA	1152
Gly	Asn	His Vai	Ser	Pro	Thr	His Tyr	Vai Pro	Glu	Ser Asp Ala Ala
	370				375			380
GCA	CGT	GTC ACT	CAG	ATC	CTC	TCC GAC	CTT ACT	ATC	ACC CAA CTG TTG	1200
Ala	Arg	Vai Thr	Gin	Ile	Leu	Ser Asp	Leu Thr	Ile	Thr Gin Leu Leu
385				390			395		400
AAG	AGG	GTC CAC	CAG	TGG	ATT	AAC GAG	GAC TGC	TCC	ACG CCC TGC TCC	1248
Lys	Arg	Leu His	Gin	Trp	Ile	Asn Glu Asp Cys	Ser	Thr Pro Cys Ser
			405				410		415
GGC	TCG	TGG CTA	AGG	GAT	GTT	TGG GAC	TGG ATA	TGC	ACA GTT TTG GCT	1296
Gly	Ser	Trp Leu	Arg Asp	Vai	Trp Asp	Trp Ile	Cys	Thr Vai Leu Ala
		420				425			430
GAC	TTC	AAG ACC	TGG	CTC	CAG	TCG AAG	CTC CTG	CCG	CGA TTA CCG GGA	1344
Asp	Phe	Lys Thr	Trp	Leu	Gin	Ser Lys	Leu Leu	Pro	Arg Leu Pro Gly
		435				440			445
GTC	CCC	TTT TTC	TCA	TGC	CAA	CGT GGG	TAC AAG	GGG	GTC TGG CGG GGA	1392
Vai	Pro	Phe Phe	Ser	Cys	Gin	Arg Gly Tyr Lys	Gly	Vai Trp Arg Gly
	450				455			460
GAC	GGC	ATC ATG	CAG	ACC	ACC	TGC TCA	TGT GGA	GCA	CAG ATC ACC GGA	1440
Asp	Gly	Ile Met	Gin	Thr	Thr	Cys Ser	Cys Gly	Ala	Gin Ile Thr Gly
465				470			475		480
CAT	GTC	AAA AAC	GGT	TCC	ATG	AGG ATC	GTT GGG	CCT	AAG ACC TGT AGT	1488
His	Vai	Lys Asn	Gly	Ser	Met	Arg Ile	Vai Gly	Pro	Lys Thr Cys Ser

485 490 495

100

AAC ATG TGG CAT GGA ACA TTC CCC ATC AAC GCA TAC ACC ACG GGC CCC

1536

Asn

Met Trp

His Gly Thr Phe Pro Ile

Asn Ala

Tyr Thr Thr 510

Gly Pro

500

505

TGC

ACG

CCC

TCC

CCA

GCG

CCA

AAC

TAT

TCC

AGG

GCG

CTG

TGG

CGG

GTG

1584

Cys

Thr

Pro

Ser

Pro

Ala

Pro

Asn

Tyr

Ser

Arg

Ala

Leu

Trp

Arg

Vai

515

520

525

GCT

GAG

TAC

GTG

GAG

GTT

ACG

CGG

GTG

GGG

GAT

TTC

CAC

TAC

1632

Ala

Glu

Tyr

Vai

Glu

Vai

Thr

Arg

Vai

Gly Asp

Phe

His

Tyr

530

535

540

GTG

ACG

AGC

ATG

ACC

ACT

GAC

AAC

GTA

AAA

TGC

CCG

TGC

CAG

GTT

CCA

1680

Vai

Thr

Ser

Met

Thr

Asp

Asn

Vai

Lys

Cys

Pro

Cys

Gin

Vai

Pro

•

545

550

555

560

GCC

CCC

GAA

TTC

ACA

GAA

GTG

GAT

GGG

GTG

CGG

CTG

CAC

AGG

TAC

1728

Ala

Pro

Glu

Phe

Thr

Glu

Vai

Asp

Gly

Vai

Arg

Leu

His

Arg

Tyr

565

570

575

GCT

CCG

GCG

TGC

AAA

CCT

CTC

CTA-

CGG

GAG

GTC

ACA

TTC

CAG

GTC

1776

Ala

Pro

Ala

Cys

Lys

Pro

Leu

Arg

Glu

Vai

Thr

Phe

Gin

Vai

580

585

590

GGG

CTC

AAC

CAA

TAC

CTG

GTT

GGG

TCG

CAG

CTC

CCA

TGC

GAG

CCC

GAA

1824

Gly

Leu

Asn

Gin

Tyr

Leu

Vai

Gly

Ser

Gin

Leu

Pro

Cys

Glu

Pro

Glu

595

600

605

CCG

GAT

GTA

GCA

GTG

CTC

ACT

TCC

ATG

CTC

ACC

GAC

CCC

TCC

CAC

ATC

1872

Pro

Asp

Vai

Ala

Vai

Leu

Thr

Ser

Met

Leu

Thr

Asp

Pro

Ser

His

Ile

610

615

620

ACA

GCA

GAG

ACG

GCT

AAG

CGC

AGG

CTG

GCC

AGG

GGG

TCT

CCC

TCC

1920

Thr

Ala

Glu

Thr

Ala

Lys

Arg Arg

Leu

Ala

Arg

Gly

Ser

Pro

Ser

625

630

635

640

101

TTG

GCC

AGC

TCT

TCA

GCT

AGC

CAG

TTG

TCT

GCG

CCT

TCC

TCG

AAG

GCG

1968

Leu

Ala

Ser

Ala

Ser

Gin

Leu

Ser

Ala

Pro

Ser

Lys

Ala

645

650

655

ACA

TAC

ATT

ACC

CAA

AAT

GAC

TTC

CCA

GAC

GCT

GAC

CTC

ATC

GAG

GCC

2016

Thr

Tyr

Ile

Thr

Gin

Asn

Asp

Phe

Pro

Asp

Ala

Asp

Leu

Ile

Glu

Ala

660

665

-

670

AAC

CTC

CTG

TGG

CGG

CAT

GAG

ATG

GGC

GGG

GAC

ATT

ACC

CGC

GTG

GAG

2064

Asn

Leu

Trp

Arg

His

Glu

Met

Gly Gly Asp

Ile

Thr

Arg

Vai

Glu

675

680

685

TCA

GAG

AAC

AAG

GTA

ATC

CTG

GAC

TCT

TTC

GAC

CCG

CTC

CGA

GCG

2112

Ser

Glu

Asn

Lys

Vai

Ile

Leu

Asp

Ser

Phe

Asp

Pro

Leu

Arg

Ala

•

690

695

700

GAG

GAT

GAG

CGG

GAA

GTG

TCC

GTC

CCG

GCG

GAG

ATC

CTG

CGG

AAA

2160

Glu

Asp

Glu

Arg

Glu

Vai

Ser

Vai

Pro

Ala

Glu

Ile

Leu

Arg

Lys

705

710

715

720

TCC

AAG

AAA

TTC

CCA

GCG

ATG‘ CCC

GCA

TGG

GCA

CGC

CCG

GAT

TAC

2208

Ser

Lys

Phe

Pro

Ala

Met

Pro

Ala

Trp

Ala

Arg

Pro

Asp

Tyr

725

730

735

AAC

CCT

CCG

CTG

GAG

TCC

TGG

AAG

GCC

CCG

GAC

TAC

GTC

CCT

CCA

2256

Asn

Pro

Leu

Glu

Ser

Trp

Lys

Ala

Pro

Asp

Tyr

Vai

Pro

740

745

750

GTG

GTA

CAT

GGG

TGC

CCA

CTG

CCA

CCT

ACT

AAG

ACC

CCT

ATA

CCA

2304

Vai

His

Gly Cys

Pro

Leu

Pro

Thr

Lys

Thr

Pro

Ile

Pro

755

760

765

CCT

CCA

CGG

AGG

AAG

AGG

ACA

GTT

CTG

ACA

GAA

TCC

ACC

GTG

TCT

2352

Pro

Arg Arg Lys

Arg

Thr

Vai

Leu

Thr

Glu

Ser

Thr

Vai

Ser

770

775

780

102

TCT Ser 785

GCC CTG GCG

GAG CTT GCC ACA AAG GCT TTC GGT AGC TCC GAA CCG

2400

Ala

Leu Ala

Glu

Leu 790

Ala

Thr Lys

Ala

Phe Gly Ser Ser Glu Pro

795

800

TCG

GCC

GTC

GAC

AGC

GGC

ACG

GCA

ACC

GCC

CCT

GAC

CAA

CCC

TCC

2448

Ser

Ala

Vai

Asp

Ser

Gly

Thr

Ala

Thr

Ala

Pro

Asp

Gin

Pro

Ser

805

810

815

GAC

GGC

GGA

GCA

GGA

TCT

GAC

GTT

GAG

TCG

TAT

TCC

ATG

CCC

2496

Asp

Gly Gly

Ala

Gly

Ser

Asp

Vai

Glu

Ser

Tyr

Ser

Met

Pro

820

825

830

CCC

CTT

GAG

GGG

GAG

CCG

GGG

GAC

CCC

GAT

CTC

AGC

GAC

GGG

TCT

TGG

2544

Pro

Leu

Glu

Gly

Glu

Pro

Gly Asp

Pro

Asp

Leu

Ser

Asp

Gly

Ser

Trp

•

835

840

845

TCT

ACC

GTG

AGT

GAG

GCC

GGT

GAG

GAC

GTC

TGC

TCG

ATG

2592

Ser

Thr

Vai

Ser

Glu

Ala

Gly

Glu

Asp

Vai

Cys

Ser

Met

850

855

860

TCC

TAC

ACA

TGG

ACA

GGC

GCT

CTÓ

ATC

ACG

CCA

TGC

GCT

GCG

GAG

GAA

2640

Ser

Tyr

Thr

Trp

Thr

Gly

Ala

Leu

Ile

Thr

Pro

Cys

Ala

Glu

865

870

875

880

AGC

AAG

CTG

CCC

ATC

AAC

GCG

TTG

AGC

AAC

TCT

TTG

CTG

CGT

CAC

2688

Ser

Lys

Leu

Pro

Ile

Asn

Ala

Leu

Ser

Asn

Ser

Leu

Arg

His

885

890

895

AAC

ATG

GTC

TAC

GCT

ACC

ACA

TCC

CGC

AGC

GCA

AGC

CAG

CGG

CAG

AAG

2736

Asn

Met

Vai

Tyr

Ala

Thr

Ser

Arg

Ser

Ala

Ser

Gin

Arg

Gin

Lys

900

905

910

AAG

GTC

ACC

TTT

GAC

AGA

CTG

CAA

ATC

CTG

CAC

GAT

CAC

TAC

CAG

GAC

2784

Lys

Vai

Thr

Phe

Asp

Arg

Leu

Gin

Ile

Leu

Asp

His

Tyr

Gin

Asp

915 920 925

103

GTG

CTC

AAG

GAG

ATG

AAG

GCG

AAG

GCG

TCC

ACA

GTT

AAG

GCT

AAG

CTT

Vai

Leu

Lys

Glu

Met

Lys

Ala

Lys

Ala

Ser

Thr

Vai

Lys

Ala

Lys

Leu

930

935

940

CTA

TCA

GTA

GAG

GAA

GCC

TGC

AAG

CTG

ACG

CCC

CCA

CAT

TCG

GCC

AAA

Leu

Ser

Vai

Glu

Glu Ala

Cys

Lys

Leu

Thr

Pro

His

Ser

Ala

Lys

945

950

955

960

TCT

AAA

TTT

GGC

TAT

GGG

GCA

AAG

GAC

GTC

CGG

AAC

CTA

TCC

AGC

AAG

Ser

Lys

Phe

Gly Tyr

Gly

Ala

Lys

Asp

Vai

Arg

Asn

Leu

Ser

Lys

965

970

975

GCC

ATT

AAC

CAC

ATC

CGC

TCC

GTG

TGG

GAG

GAC

TTG

GAA

GAC

ACT

Ala

Ile

Asn

His

Ile

Arg

Ser

Vai

Trp

Glu

Asp

Leu

Glu

Asp

Thr

980

985

990

GAA

ACA

CCA

ATT

GAC

ACC

ATC

ATG

GCA

AAA

AAT

GAG

GTT

TTC

TGC

Glu

Thr

Pro

Ile

Asp

Thr

Ile

Met

Ala

Lys

Asn

Glu

Vai

Phe

Cys

995

1000

1005

GTC

CAA

CCA

GAG

AGA

GGA

GGC

CGC

AAG

CCA

GCT

CGC

CTT

ATC

GTG

TTC

Vai

Gin

Pro

Glu

Arg

Gly Gly Arg Lys

Pro

Ala

Arg

Leu

Ile

Vai

Phe

1010

1015

1020

CCA

GAC

TTG

GGG

GTC

CGT

GTG

TGC

GAG

AAA

ATG

GCC

CTC

TAT

GAC

GTG

Pro Asp

Leu

Gly

Vai

Arg

Vai

Cys

Glu

Lys

Met

Ala

Leu

Tyr

Asp

Vai

1025

1030

1035

1040

GTC

TCC

ACC

CTC

CCT

CAG

GCT

GTG

ATG

GGC

TCC

TCG

TAC

GGA

TTC

CAG

Vai

Ser

Thr

Leu

Pro

Gin

Ala

Vai

Met

Gly

Ser

Tyr Gly

Phe

Gin

1045

1050

1055

TAT

TCT

CCT

GGA

CAG

CGG

GTC

GAG

TTC

CTG

GTG

AAC

GCC

TGG

AAA

TCA

Tyr

Ser

Pro

Gly Gin Arg

Vai

Glu

Phe

Leu

Vai

Asn

Ala Trp Lys

Ser

2832

2880

2928

2976

3024

3072

3168

3216

1065

3120

1060

1070

104

AAG AAG ACC CCT ATG GGC TTT GCA TAT GAC ACC CGC TGT TTT GAC TCA

Lys Lys Thr Pro Met Gly Phe Ala Tyr Asp Thr Arg Cys Phe Asp Ser

1075 1080 1085

ACA GTC ACT GAG AAT GAC ATC CGT GTA GAG GAG TCA ATT TAT CAA TGT

Thr Vai Thr Glu Asn Asp Ile Arg Vai Glu Glu Ser Ile Tyr Gin Cys

1090 1095 1100

TGT GAC TTG GCC CCC GAA GCC AGA CAG GCC ATA AGG TCG CTC ACA GAG

Cys Asp Leu Ala Pro Glu Ala Arg Gin Ala Ile Arg Ser Leu Thr Glu

1105 1110 1115 1120

CGG CTT TAT ATC GGG GGT CCC CTG ACT AAT TCA AAA GGG CAG AAC TGC

Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys Gly Gin Asn Cys

1125 1130 1135

GGC TAT CGC CGG TGC CGC GCG AGC GGC GTG CTG ACG ACT AGC TGC GGT

Gly Tyr Arg Arg Cys Arg Ala Ser Gly Vai Leu Thr Thr Ser Cys Gly

1140 1145 1150

AAT ACC CTC ACA TGT TAC TTG AAG GCC TCT GCA GCC TGT CGA GCT GCA

Asn Thr Leu Thr Çys Tyr Leu Lys Ala Ser Ala Ala Cys Arg Ala Ala

1155 1160 1165

AAG CTC CAG GAC TGC ACG ATG CTC GTG TGC GGA GAC GGC CTT GTC GTT

Lys Leu Gin Asp Cys Thr Met Leu Vai Cys Gly Asp Asp Leu Vai Vai

1170 1175 1180

ATC TGT GAG AGC GCG GGA ACC CAG GAG GAC GCG GCG AGC CTA CGA GTC

Ile Cys Glu Ser Ala Gly Thr Gin Glu Asp Ala Ala Ser Leu Arg Vai

1185 1190 1195 1200

TTC ACG GAG GCT ATG ACT AGG TAC TCT GCC CCC CCC GGG GAC CCG CCC

Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro Gly Asp Pro Pro

1205 1210 1215

3264

3312

3360

3408

3456

3504

3552

3600

3648

105

CAA CCA GAA TAC GAC CTG GAG TTG ATA ACA TCA TGC TCC TCC AAT GTG 3696

Gin Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys Ser Ser Asn Vai

1220 1225 1230

TCG GTC GCG CAC GAT GCA TCT GGC AAA AGG GTA TAC TAC CTC ACC CGT 3744

Ser_Val Ala His Asp Ala Ser Gly Lys Arg Vai Tyr Tyr Leu Thr Arg

1235 1240 1245

GAC CCG 3750

Asp Pro

1250

106

SEQ ID NO:23

TIPO DE SEQUÊNCIA: Nucleótido COMPRIMENTO DA SEQUÊNCIA: 23

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

ORGANISMO FONTE ORIGINAL: baculovírus Autographa californica Nuclear vírus da Polihedrose (AcNPV)

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo d24

CARACTERÍSTICAS:

faz a primagem da síntese ADN para as sequências do vector de transferência de baculovírus que flanqueia o ADN inserido no local BamHl

CGGGTTTAAC ATTACGGATT TCC

107

SEQ ID NO:24

TIPO DE SEQUÊNCIA: Nucleótido

COMPRIMENTO DA SEQUÊNCIA: 31 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

ORGANISMO FONTE ORIGINAL: baculovirus Autographa californica Nuclear vírus da Polihedrose (AcNPV)

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl26

CARACTERÍSTICAS:

de 1 a 31 bases homólogas às sequências da junção a montante produzidas quando o cADN amplificado por d75 (SEQ ID : 5) é clonado no local de clonação BamHl em pAc360 e vectores semelhantes; as incoerências nas bases 13 e 14 introduzem um local Pstl de 1 a 10 bases homólogas à região do local BamHl em pAc360 e vectores semelhantes de 4 a 9 bases no local BamHl de 12 a 27 bases no local Pstl

PROPRIEDADES: faz a primagem da síntese de ADN na função das sequências do vector de transferência de baculovirus e sequências previamente amplificadas por oligo d75: introduz um local de reconhecimento de Pstl para o trabalho de clonação posterior

TAAGGATCCC CCT GCA GTA TCG GCG GAA TTC 31

Ser Ala Val Ser Ala Glu Phe 5

108

SEQ ID NO:25

TIPO DE SEQUÊNCIA: Nucleótido COMPRIMENTO DA SEQUÊNCIA: 45 BASES

No DE BANDAS: única

TOPOLOGIA: linear

TIPO DE MOLÉCULA: ADN sintético

ORGANISMO FONTE ORIGINAL: N/A

FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl32

CARACTERÍSTICAS:

de 5 a 10 bases no local de reconhecimento Pstl de 13 a 27 bases de ligação codificando para cinco resíduos de Lys de 28 a 45 bases homólogas às bases 4 a 21 de BR11 (SEQ ID 7)

PROPRIEDADES: faz a primagem da síntese de ADN no terminal

5' de BR11 e introduz uma sequência sintética que codifica para cinco lisinas bem como um local de reconhecimento de Pstl para trabalho de clonação posterior

CTGCCTGCA GTA AAG AAG AAG AAG AAG AAA ACC AAA CGT AAC ACC A 45

Vai Lys Lys Lys Lys Lys Lys Thr Lys Arg Asn Leu

Claims

REIVINDICAÇÕES

- lã Processo para a preparação de um polipéptido virai responsável pela hepatite não-A não-B de pós-transfusão (PT-NANBH) caracterizado por se clonar ou sintetizar uma sequência de ADN que codifica um antigénio possuindo uma sequência de aminoácidos que é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3,4,5,18,19,20,21 ou 22, ou um seu fragmento antigénico, inserir-se a sequência de ADN num vector de expressão tal que ele é susceptível de ser expresso num hospedeiro adequado, transformar-se uma célula de hospedeiro com o vector de expressão, cultivar-se célula de hospedeiro transformada, e isolar-se o polipéptido virai.

_ 2§ Processo de acordo com a reivindicação 1, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3,4 ou 5, ou é um seu fragmento antigénico.

_ ₃a _

Processo de acordo com a reivindicação 2, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3, ou 4, ou é um seu fragmento antigénico.

- 4ã Processo de acordo com a reivindicação 2, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 5, ou é um seu fragmento antigénico.

_ ₅a _

Processo de acordo com qualquer das reivindicações anteriores, caracterizado por se obter um lio polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 95% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3,4,5,18,19,20,21 ou 22 , ou é um seu fragmento antigénico.

- 6ã Processo de acordo com a reivindicação 5, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 98% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3,4,5,18,19,20,21 ou 22 ou é um seu fragmento antigénico.

- 73 Processo para a preparação de um polipéptido virai PT-NANBH caracterizado por se clonar ou sintetizar uma sequência de ADN que codifica um antigénio da região de codificação estrutural do genoma virai e um antigénio da região de codificação não-estrutural do genoma virai, inserir-se a sequência de ADN num vector de expressão tal que ele seja susceptível de ser expresso num hospedeiro adequado, transformar-se uma célula de hospedeiro com o vector de expressão, cultivar-se a célula de hospedeiro transformada, e isolar-se o polipéptido virai.

- 83 Processo de acordo com a reivindicação 7, caracterizado por se obter um polipéptido virai PT-NANBH em que o antigénio da região de codificação estrutural tem uma sequência de aminoácidos que é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 5 ou um seu fragmento antigénico, e o antigénio da região de codificação não-estrutural tem uma sequência de aminoácidos que é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3 ou 4, ou um seu fragmento antigénico.

- 93 Processo de acordo com a reivindicação 7, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de ADN é como referida na se111 quência identificada por SEQ ID NO : 3, 4, 5, 18, 19, 20, 21 ou 22.

- 10- Processo para a detecção de ãcido nucleico virai PT-NANBH caracterizado por:

i) hibridizar-se o ARN virai presente numa amostra de en saio, ou cADN sintetizado a partir desse ARN, com uma sequência de ADN correspondente à sequência identificada por SEQ ID NO : 3, 4, 5, 18, 19, 20, 21 ou 22, e escrutinarem-se os híbridos de ácido nucleico resultantes para identificar qualquer ácido nucleico virai PT-NANBH, ou ii) sintetizar-se o cADN do ARN virai presente numa amostra de ensaio, amplificar-se uma sequência de ADN pré-escolhida correspondente a uma subsequência da sequência identificada por SEQ ID NO: 3, 4, 5, 18,

19, 20, 21 ou 22, e identificar-se a sequência de ADN pré-escolhida.

- lia Processo para a detecção de antigénio virai ou anticorpo virai PT-NANBH caracterizado por se fazer contactar uma amostra de ensaio com um polipéptido virai PT-NANBH quando preparado de acordo com qualquer das reivindicações 1 a 8, ou um anticorpo policlonal ou monoclonal e determinar-se se existe qualquer ligação antigénio-anticorpo dentro da amostra de ensaio.

A requerente reivindica as prioridades dos pedidos britânicos apresentados em 18 de Dezembro

112 de 1989 e em 27 de Fevereiro de 1990, sob os nss. 8928562.1 a 9004414.0, respectivamente.

Lisboa, 17 de Dezembro de 1990.