PT624641E

PT624641E - Polimerases de acidos nucleicos termostaveis

Info

Publication number: PT624641E
Application number: PT94106811T
Authority: PT
Inventors: David H Gelfand; Alice M Wang
Original assignee: Hoffmann La Roche
Priority date: 1993-05-14
Filing date: 1994-05-02
Publication date: 2001-04-30
Also published as: EP0624641B1; GR3035477T3; US5491086A; DE69426400D1; JPH06343466A; EP0624641A3; DE69426400T2; ATE198083T1; ES2153395T3; DK0624641T3; CA2123354A1; CA2123354C; EP0624641A2; JP3626226B2

Description

Descrição “Poliraerases de ácidos nucleicos termostáveis” A presente invenção diz respeito a polimerases de ADN termostáveis provenientes de espécies de arquebactérias Pyrodictium hipertermofílicas e a meios para isolar e produzir tais enzimas. As polimerases de ADN termostáveis são úteis em inúmeras técnicas recombinantes de ADN, especialmente na amplificação de ácidos nucleicos por reacção em cadeia com polimerase (RCP).

Pesquisas exaustivas permitiram isolar polimerases de ADN a partir de microrganismos mesofflicos tais como E. coli.. Ver, por exemplo, Bessman et al., 1957, J. Biol. Chem. 223:171--177 e Buttin e Komberg, 1966, J. Biol. Chem. 241:5419-5427. O interesse das polimerases de ADN provenientes de microrganismos termofílicos aumentou com a invenção dos processos de amplificação dos ácidos nucleicos. A utilização de enzimas termostáveis, tais como as descritas na patente de invenção norte-americana n° 4 165 188, para amplificar as sequências existentes de ácidos nucleicos em quantidades relativamente grandes, comparativamente com a quantidade inicialmente presente, foi descrita nas patentes de invenção norte-americanas n^ 4 683 195 e 4 683 202 que explicam os processos de RCP. Tais patentes de invenção consideram-se aqui incorporadas por referência. O processo de RCP implica a desnaturação de um ácido nucleico sujeito à reacção, a hibridação de iniciadores e a síntese de cadeias complementares, catalisada por uma polimerase de ADN. O produto de amplificação de cada iniciador passa a ser uma matriz para a produção da sequência desejada de ácido nucleico. As referidas patentes de invenção explicitam que não é 2 necessário, se a polimerase utilizada for uma enzima termostável, acrescentar essa polimerase a seguir a cada passo de desnaturação, uma vez que o calor não irá destruir a actividade da polimerase. A polimerase de ADN termostável proveniente de Thermus aquaticus (Taq) foi já clonada, expressa e purificada a partir de células recombinantes, coiifonne descrito por Lawyer et al, 1989, J. Biol. Chem. 264:6427-6437 e nas patentes de invenção norte-americanas rr5 4 889 818 e 5 079 352, documentos estes que aqui se consideram incorporados por referência. As preparações impuras de uma actividade de polimerase de ADN isolada a partir de T aquaticus foram descritas por outros autores (Chien et ai, 1976, J,. Bacteriol. 127:1550-1557 e Kaledin et al, 1980, Biotóiimiya 54:644-651). A patente de invenção norte-americana n° 4 889 818, o pedido de patente de invenção europeia publicado com o n° 258 017 e o documento PCT publicado com o n° WO 89/06691, cujo conteúdo se considera aqui incorporado por referência, são documentos que descrevem o isolamento e a expressão recombinante de uma polimerase de ADN termostável de ~94 kD proveniente de Thermus aquaticus e descrevem também a utilização dessa polimerase numa RCP. Embora a polimerase de ADN de I aquaticus seja especialmente preferida para utilização numa RCP e noutras técnicas recombinantes de ADN, há outras polimerases de ADN termofílicas que foram já purificadas, clonadas e expressas. (Ver os documentos PCT co-pendentes de que somos co-proprietários, publicados com os n- WO 91/09950, WO 92/03556, WO 92/06200 e WO 92/06202, que aqui se consideram incoiporados por referência).

As polimerases de ADN termostáveis não são iiTeversivelmente inactivadas, mesmo quando aquecidas a 93-95°C durante breves intervalos de tempo, por exemplo, tal como acontece na prática da amplificação de ADN por RCP. Pelo contrário, a esta temperatura elevada a Pol I de ADN de E. coli é inactivada.

As arquebactérias hipertermófilas, tais como as espécies de Pyrodictium e Methanopyrus, crescem a temperaturas até cerca de 110°C e não são capazes de se desenvolverem abaixo de 80°C (ver Stetter et ai, 1990, FEMS Microbiology Reviews 75:117-124, obra que aqui se considera incorporada por referência). Estes microrganismos anaeróbios estritos, redutores do enxofre, são isolados em ambientes submarinos. Por exemplo, isolou-se o microrganismos P. abyssi numa fumarola submarina activa no oceano profundo de Guaymas, México, a 2000 melros de profundidade, e em água a efluir a 320°C (Pley et ai, 1991, Systemaíic and Applied Microbiology 14:245). Ao contrário das espécies de Pyrodictium, há outros microrganismos termófilos cujo crescimento decorre de uma forma óptima à temperatura de 90°C ou próximo dela e que ainda se desenvolvem à temperatura máxima de 100°C ou próximo dela e que não são difíceis de criar em cultura. Por exemplo, clonou-se e sequenciou-se já uma polimerase de ADN que codifica um gene, a partir de Thermococcis litoralis (pedido de patente de invenção europeia publicado com o n° 455 430).

Pelo contrário, a criação em cultura de microrganismos hiperteimófilos é difícil, devido à sua inaptidão para crescerem sobre meios de gelose solidificada. As células individualizadas das espécies de Pyrodictium são extremamente frágeis e tais organismos crescem sob a forma de redes fibrosas. As técnicas convencionais de fermentação bacteriana são extremamente difíceis para criar em cultura espécies de Pyrodictium devido à fragilidade das suas células e à tendência que estas têm para crescerem sob a forma de redes que vão obstruir as peças de aço dos aparelhos convencionais de fermentação, (ver Stanley, J.T. et cã., eds., Bergey’s Manual of Systematic Bacteriology, 1989, Williams e Wilkins, Baltimore, obra que aqui se considera incorporada por referência). Estas dificuldades impedem a criação de culturas laboratoriais para a preparação de grandes quantidades de enzimas polimerases de ácidos nucleicos purificadas para a caracterização e análise da sequência de aminoácidos. Os especialistas na matéria podem conseguir criar em cultura o microrganismo Pyrodictium até uma densidade celular da ordem de 106-107 células/mL (ver, por exemplo, Phipps et ai, 1991, EMBO J. 10(7):1711-1722). Em contraste, a criação em cultura do microrganismos E. coli atinge vulgarmente uma densidade de 0,3-1,0x10" células/mL.

Assim sendo, é necessário caracterizar melhor estas enzimas polimerases de ADN hipertermófilas, v.g., determinando a sua sequência de aminoácidos e a sequência de ADN que a codifica. Efectuando a clonagem e a expressão do gene num organismo hospedeiro adequado, é possível evitar as dificuldades anteriormente enumeradas e que estão associadas à criação em cultura do hospedeiro natural. Além do mais, pretende-se nestas especialidade produzir polimerases de ADN termostáveis que possuam uma maior termostabilidade e que possam ser utilizadas para melhorar os processos de RCP e para melhorar os resultados obtidos quando se utiliza uma polimerase de ADN termostável noutras técnicas recombinantes, tais como a sequenciação de ADN, a inserção de radiomarcadores nas lacunas e a transcrição reversa. A presente invenção vem ao encontro destas necessidades ao proporcionar informação sobre o ADN e sobre as sequências de aminoácidos, vectores de expressão recombinantes e protocolos de purificação para as polimerases de ADN provenientes das espécies de Pyrodictium. A presente invenção proporciona enzimas termostáveis que catalisam a combinação de nucleósidos-trifosfatos para formarem uma cadeia dc ácido nuclcico complementar de uma cadeia matriz de ácido nucleico. As enzimas são polimerases de ADN retiradas das espécies de Pyrodictium. De acordo com uma variante preferencial, a enzima provém de P. occultum ou P. abyssi. Estes material pode ser utilizado numa reacção de amplificação com diversos ciclos

de temperatura em que são produzidas sequências de ácidos nucleicos a partir de uma determinada sequência de um ácido nucleico em quantidades que são grandes comparativamente com a quantidade inicialmente existente, por forma a que as sequências possam ser facilmente manipuladas e/ou analisadas.

Os genes que codificam a enzima polimerase de ADN de P. occultum e P. abyssi foram já identificados e clonados e proporcionam ainda outra via para a preparação da enzima termostável da presente invenção. Além disso, a invenção proporciona também as sequências de ADN e de aminoácidos dos genes que codificam a enzima de P. occultum e de P. abyssi e os derivados dos genes que codificam a actividade da polimerase do ADN de P. occultum e P. abyssi. Além do mais, a invenção também proporciona genes modificados que codificam formas de actividade da polimerase do ADN de Pyrodictium occultum e de P. abyssi com insuficiência em exonuclease de 3’ para 5’. A invenção também diz respeito a composições enzimáticas que contenham uma enzima purificada e termostável proveniente de P. occultum e/ou P. abyssi, conforme descrito supra, num tampão que contenha um ou vários detergentes poliméricos não iónicos.

Finalmente, a presente invenção proporciona um método para a purificação de poli-merases termostáveis da invenção.

Posto isto, a presente invenção proporciona sequências de ADN e vectores de expressão que codificam a polimerase de ADN de Pyrodictium. Para facilitar a compreensão da invenção apresenta-se seguidamente a definição de vários lermos e expressões.

Os termos e expressões “células”, “linhagem celular” e “cultura de células” podem ser utilizados indiferentemente e todas essas designações compreendem a progenia. Assim, palavras e expressões como “transfoimantes” ou “células transformadas” designam as células primárias

transformadas e as culturas obtidas a partir dessas células, independentemente do número de reproduções. A totalidade da progenia pode não ser exactamente idêntica no que diz respeito ao conteúdo de ADN, devido a mutações deliberadas ou acidentais. A progenia mutante que possua a mesma funcionalidade identificada na célula originalmente transformada considera-se incluída na definição de transformantes. A expressão “sequências de controlo” designa as sequências de ADN necessárias para a expressão de uma sequência codificante funcionalmente ligada, num organismo hospedeiro 1 particular. As sequências de controlo consideradas convenientes para os organismos procariotas compreendem, uma sequência de um promotor, facultativamente uma sequência de um operador, um local de ligação ribossómico e eventualmente outras sequências. Sabe-se que as células eucarióticas utilizam promotores, sinais de poliadenilação e intensificadores. O teimo “sistema de expressão” designa sequências de ADN que contêm uma sequência de codificação desejada e sequências de controlo numa ligação funcional, pelo que os hospedeiros transformados com essas sequências são capazes de produzir as proteínas codificadas. Para se realizar a transformação, o sistema de expressão pode estar contido num vector; no entanto, o ADN relevante também pode estar integrado no cromossoma do hospedeiro. O termo “gene” designa uma sequência de ADN que compreende as sequências de controlo e de codificação necessárias para a produção de um precursor ou polipeptido bioactivo recuperável. O polipeptido pode ser codificado por uma sequência de um gene de comprimento completo ou por uma qualquer parcela da sequência codificadora, desde que seja conservada a actividade enzimática. A expressão “funcionalmente ligado” refere-se ao posicionamento da sequência codificadora de modo a que as sequências de controlo funcionem por forma a comandar a 7 expressão da proteína codificada pela sequência codificadora. Assim, uma sequência codificadora “fimcionalmente ligada” a sequências de controlo da expressão refere-se a uma configuração em que as sequências codificadoras podem ser expressas sob a direcção de uma sequência de controlo. O termo “mistura”, tal como aqui utilizado, refere-se a misturas que contenham poli-merase de Pyrodictium e qualifica um conjunto de materiais de contenham polimerase de Pyrodictium, mas que também podem conter outras proteínas. Se a polimerase de Pyrodictium for obtida a partir de células recombinantes de um hospedeiro, as outras proteínas serão normalmente as que estão associadas a esse hospedeiro. Se o hospedeiro for de tipo bacteriano, como é evidente, as proteínas contaminantes são proteínas bacterianas. A expressão “detergentes poliméricos não iónicos” designa agentes tensioactivos que não possuem nenhuma carga iónica e que se caracterizam, para os objectivos da presente invenção, pela sua capacidade para estabilizarem a enzima de Pyrodictium para valores de pH compreendidos no intervalo entre cerca de 3,5 e cerca de 9,5 e de preferência para valores de pH compreendidos entre 4,0 e 9,0. O termo “oligonucleótido”, tal como aqui utilizado, é definido como sendo uma molécula constituída por dois ou mias desoxirribonucleótidos ou ribonucleótidos, de preferência mais de 3 e vulgarmente mais de 10. O tamanho exacto de um oligonucleótido irá depender de inúmeros factores, incluindo em última instância a função ou a utilização do oligonucleótido. E possível preparar os oligonuclcótidos por qualquer método adequado, incluindo, por exemplo, a clonagem e a restrição de sequências adequadas e a síntese química directa, segundo um método tal como o método do fosfotriéster de Narang et ai, 1979, Meth. Enzymol. 68:90-99; o método do fosfodiéster de Brown et al., 1979, Meth. Euzymol. 68:109-

-151; o método da dietíl-fosforamidite de Beaucage et ai, 1981, Tetrahedron Lett. 22:1859--1862; o método do triéster de Matteucci et ai, 1981, J. Am. Chem. Soc. 103:3185-3191 ou os métodos automáticos de síntese; e ainda o método em suporte sólido descrito na patente de invenção norte-americana n° 4 458 066. O teimo “iniciador”, tal como aqui utilizado, designa um oligonuclcótido, quer este seja de origem natural ou sintético, capaz de servir de ponto de início da síntese quando colocado sob condições em que tenha início o prolongamento do iniciador. A síntese de um produto de prolongamento de um iniciador que seja complementar de uma cadeia de ácido nucleico tem início na presença de nucleósido-trifosfatos e de uma polimerase de ADN ou de uma enzima transcriptase reversa num tampão adequado a uma temperatura conveniente. Um “tampão” contém co-factores (tais como iões de metais divalentes) e sais (para se obter uma força iónica adequada), sendo ajustado para o valor desejado de pH. No caso das polimerases de Pyrodictium o tampão contém preferencialmente entre 1 mM e 3 mM de um sal de magnésio, de preferência MgQh, entre 50 μΜ e 200 μΜ de cada nucleótido e entre 0,2 μΜ e 1 μΜ de cada iniciador, conjuntamente com 10 mM a 100 mM de KC1, 10 mM de tampão Tris (pH 7,5-8,5) e gelatina à razão de 100 pg/mL (embora a gelatina não seja necessária e deva ser evitada em algumas aplicações tal como sucede na sequenciação do ADN).

De preferência, um iniciador é um oligòdesoxirribonucleótido de cadeia simples. O comprimento adequado de um iniciador vai depender do fim em vista a que se destina esse iniciador, mas está compreendido tipicamente entre 15 e 35 nucleótidos. De um modo geral, com as moléculas mais curtas de iniciador trabalhar-se-á a temperaturas mais baixas para a formação de complexos híbridos, suficientemente estáveis, com a matriz. Não é necessário que um iniciador reflicta a sequência exacta da matriz, mas deve ser suficientemente complementar para hibridar com uma matriz.

O termo “iniciador5’ pode designar mais do que um iniciador, em particular se houver uma certa ambiguidade na informação respeitante a uma ou às duas extremidades da região relevante que se pretende amplificar. Por exemplo, se uma sequência de ácidos nucleicos tiver sido deduzida a partir de uma sequência de uma proteína, então um “iniciador” é realmente um conjunto de oligonucleótidos do iniciador que contêm sequências que representam todas a variações possíveis de codões com base na degeneração do código genético. Um dos iniciadores deste conjunto irá ser homólogo com a extremidade da sequência relevante. De igual modo, se uma região “conservada” revelar níveis significativos de polimorfismo numa população é possível preparar então misturas de iniciadores que irão amplificar sequências adjacentes. O iniciador pode ser “substancialmente” complementar de uma cadeia de sequência especifica da matriz. Um iniciador tem de ser suficientemente complementar para hibridar com uma cadeia da matriz para que tenha lugar a amplificação desse iniciador. Uma sequência de iniciador não tem de reflectir a sequência exacta da matriz. Por exemplo, é possível ligar uma extremidade 5’ do iniciador com um fragmento nucleotídico não complementar, sendo a parte restante da sequência do iniciador substancialmente complementar da cadeia. É possível intercalar no iniciador sequências mais compridas ou bases não complementares, desde que a sequência do iniciador possua uma complementaridade suficiente com a sequência da matriz para poder hibridar e consequentemente formar um complexo de tipo matriz e iniciador para a síntese do produto de prolongamento do iniciador. E possível marcai um iniciador, se desejado, incorporando nele um marcador dctcctávcl por meios espectroscópicos, fotoquímicos, biológicos, imunoqmmicos ou químicos. Como exemplos de marcadores úteis refere-se os seleccionados entre 32P, corantes fluorescentes, reagentes densos em electrões, enzimas (tais como as que são vulgarmente utilizadas no EISLE - o mesmo que ELISA), biotina ou haptenos e proteínas para os quais existam anti-soros ou anticorpos monoclonais. Um marcador também pode ser utilizado para “capturar” o iniciador, por forma a facilitar a imobilização quer do iniciador quer de um produto de prolongamento do iniciador, tal como o ADN amplificado, sobre um suporte sólido.

As expressões “endonucleases de restrição” e “enzimas de restrição” designam enzimas bacterianas que cortam o ADN de cadeia dupla numa sequência nucleotídica especifica ou próximo dela.

As expressões “polimerase teimostável” e “enzima termostável” designam uma enzima que é estável ao calor e resistente ao calor e que catalisa adequadamente a combinação dos nucleótidos para formarem produtos de prolongamento do iniciador que sejam complementares de uma cadeia de ácido nucleico da matriz. De um modo geral, a síntese de um produto de prolongamento do iniciador começa na extremidade 3’ do iniciador e prossegue em direcção à extremidade 5’ ao longo da cadeia da matriz, até terminar a síntese.

As enzimas de Pyrodictium termostáveis da presente invenção satisfazem aos requisitos de utilização eficaz na reacção de amplificação conhecida pela designação de reacção em cadeia com polimerase ou RCP, conforme descrito na patente de invenção norte-americana n° 4 965 188 (documento aqui incorporado por referência). As enzimas de Pyrodictium não ficam irreversivelmente desnaturadas (inactivadas) quando sujeitas a temperaturas elevadas durante o período necessário para que tenha lugar a desnaturação dos ácidos nucleicos de cadeia dupla, que é um passo fundamental no processo de RCP. A expressão ‘desnaturação irreversível’, para efeitos da presente invenção, designa a perda permanente e completa de actividade enzimática. As condições térmicas necessárias para a desnaturação de ácido nucleico irão depender, v.g. da concentração salina da solução tampão e da composição e do comprimento

dos ácidos nucleicos que se pretende desnaturar, mas irão estar tipicamente compreendidas entre cerca de 90°C e cerca de 150°C, durante um período que irá depender fundameuialmeiUc da temperatura e do comprimento do ácido nucleico, tendo esse período uma duração tipicamente compreendida entre alguns segundos e 4 minutos.

Eventualmente poderão ser necessárias temperaturas superiores se a concentração salina do tampão e/ou a composição em GC do ácido nucleico forem maiores. As enzimas de Pyrodictium não ficam irreversivelmente desnaturadas por exposições relativamente curtas a temperaturas da ordem de 95°C-100°C. A elevadíssima termostabilidade das enzimas poli-merases de ADN de Pyrodictium proporciona mais vantagens comparativamente com as enzimas termostáveis anteriormente caracterizadas. Antes da presente invenção, nunca havia sido comprovada uma RCP eficiente a temperaturas de desnaturação da ordem dos 100°C. Para este fim, nunca até ao momento presente haviam sido descritas polimerases de ADN termostáveis. No entanto, à medida que aumenta o teor em G/C de um ácido nucleico em estudo, aumenta também a temperatura necessária para desnaturar (Tden) a hélice dupla. No caso das sequências destinatárias que exijam um passo executado a superior a 95°C, os I protocolos anteriormente conhecidos impunham a inclusão de solventes na RCP para desestabilizar parcialmente a hélice dupla, fazendo baixar consequentemente o valor eficaz da Tden. Com esta finalidade, foram utilizados agentes, tais como ghcerol, DMSO ou foimamida, nas RCP (Korge et cã., 1992, Proc. Natl. Acad. Sei. USA 89:910-914 e Wong et ai, 1991, Nuc. Acids Res. 19:2251-2259, documentos estes que aqui se considera incorporados por referência). Tais agentes, para além de desestabilizarem o ADN da hélice dupla vão afectar a estabilidade do iniciador, podem inibir a actividade da enzima e a variação das concentrações de DMSO ou da formamida faz baixar a termorresistência (isto é, o período de semi-vida) das polimerases de ADN termófilas. Assim sendo, ao utilizar estes solventes é necessário executar

12- um número significativo de experiências de optimização e testar diversas condições de reacção. Pelo contrário, aumentando simplesmente o valor da Tj^ para 100°C com polimerase do ADN de Poc ou de Pab, numa RCP de tipo convencional, facilita-se a separação da cadeia completa do produto da RCP, sendo eliminada a necessidade de utilização de agentes desestabilizadores da hélice de ADN.

As polimerases altamente Mpertermófílas aqui descritas são estáveis a temperaturas superiores a 100°C e mesmo a temperaturas da ordem de 110°C. No entanto, tendo em conta ^ que tais temperaturas vão depender dos valores do pH e da potência iónica, então a integridade do ADN em causa pode ser prejudicialmente afectada (Ekert e Kunkel, 1992, In PCR: A Practical Approach, eds. McPherson, Quirke e Taylor, Oxford University Press, páginas 225--244, obra que se considera aqui incorporada por referência). A polimerase do ADN de Pyrodictium actua a uma temperatura óptima que é da ordem de 45°C. As temperaturas inferiores a 45°C facilitam a hibridação do iniciador com a matriz, mas a hibridação do iniciador com a matriz, dependendo da composição e da concentração salina e da composição e do comprimento do iniciador, pode ocorrer a temperaturas mais elevadas ^(v.g. 45-70°C), o que pode favorecer a especificidade da reacção de hibridação do iniciador. As enzimas da presente invenção revelam possuir actividade num amplo intervalo de temperaturas até aos 85°C. A actividade óptima depende da matriz e a temperatura irá estar geralmente compreendida entre 70°C e 80°C. A presente invenção proporciona sequências de ADN que codificam a actividade da polimerase de ADN termostávcl das cspccics dc Pyrodictium. Os casos preferidos da presente invenção são aqueles em que são proporcionadas sequências de ácidos nucleicos e de amino-ácidos para a polimerase do ADN de P. abyssi e P. occultum. As sequências completas que codificam as polimerase de ADN de P. abyssi e de P. occuham estão indicadas mais adiante e são designadas por SEQID No. 1 (P. abyssi) e SEQ ID No. 3 (P. occultum). As sequências deduzidas de aminoácidos receberam as designações dc SEQ ID No. 2 (P. abyssi) e SEQ ID No. 4 (P. occultum). Por razões de conveniência, as sequências dos nucleótidos e dos aminoácidos dessas polimerases são numeradas para efeitos de referência. A presente invenção proporciona sequências de ácidos nucleicos que constituem meios para comparar as sequências das polimerases do ADN de P. occultum e de P. abyssi com outras enzimas de polimerases termostáveis. Uma tal comparação demonstra que estas novas sequências não estão relacionadas com sequências de ácidos nucleicos anteriormente descritas que codifiquem polimerases de ADN termostáveis eubacterianas. Em consequência, os métodos para identificar enzimas polimerases de ADN de Pyrodictium, com base em sequências já publicadas de polimerases de ADN termostáveis eubacterianas conhecidas, não são adequados para isolar as sequências de ácidos nucleicos que codificam as enzimas polimerases de ADN de Pyrodictium.

Polimerase do ADN de P. abvssi SEQ. ED. No. 1 ATGCCAGAAGCTATAGAGITCGTGCnXTr SEQ. ID. No. 2 MetProGluAlalleGluPheVaiLeuLeu )() 31 GAnCAAGCTACGAGAirUTAGGGAAAGAGCCGCjrAATCATACrATCGGGKjrAACGCTA AspSerSerTirGluIleValGliLisGluProValllelleLeuTrpGliValThrLeu 30 91 GACGOTAAACGCATAGrlGCTACTTGATAGGAGGTITAGGCCCrACnCTATGCACIC/VrA AspGliLisArgDeValLeuLeuAspArgArgPheArgProTirPheTirAlaLeuIle 50 151 TCCCGCGACrACGAAGGrAAGGCCGAGGAGGrAGrAGCTGCrA3TAGAAGGCTAAGTATG S erArgAspTirGluGliLis AlaGluGlu Vai Vai AlaAlalleArgArgLeuS erMet 70 211 GCAAAGAGCCCCATAATAGAAGCAAAGGTCGTrAGrAAGMGTACriCGGAAGGCCCCGr AlaLisSerProIlelleGluAlaLisValValSerLisLisTirPheGíiArgProArg 90 271 AAAGCAGICAAAGTAACGACAGlTATACXrGAAICrGrCAGAGAATATAGAGAGGCIGTA LisAlaValLisValThr hrValIleProGluSerValArgGluTirArgGluAlaVal 110 331 AAAAAGCTGGAAGGCGrTGGAAGACICTCTAGAAGCAGACATAAGCnTCGCGAIGAGGTAT LisLisLeuGluGliValGluAspSerLeuGluAlaAspIleArgPheAlaMetArgTir 130 391 CTΑΤΓΓτΑΓ A AGA AGC.TCTACCCGrrTCACAGCATACCGIGTCAGAGOCGAGA-.CCXTIGCjA LeuIleAspLisLisLeuTirProPheThrAlaTirArgValArgAlaGluAsnAlaGIi 150 451

511 571 631 691 751 811 871 931 991 1051 1111 1171 1231 1291 1351 1411 1471 1531 1591 1651

CGCAGCCCTGGTTrcCGrlGrAGACICGGTATACACrATAGTTOAGGACCCAGAGCCrATTArgSerProGliPheArgValAspSerValTirThrlleValGluAspProGluProIle UCXGACAIAACTAGrAXAGATATACCAGAGAIGCGTGIGCrcCXZGTTCGACATAGAGGTCAlaAspIleThrSerlleAspIIeProGluMetArgValLeuAIaPheAspIleGluVal TACAGIAAGAGAGGAAGC0CnAACXXXjIO3CG(XACOD0GICAIAA3AAIUICCAIAAAGTirSerLisArgGliSerProAsnProSerArgAspProValIIellelleSerlIeLis GACAGCMGGGGAACGAGAACOACEAGAAGOCAAIAACXACGA03ACAGAAACGIGCIA AspSerLisGliAsnGluLisLeuLeuGluAlaAsnAsnTirAspAspArgAsnValLeu CGGGAATTTAIAGAGIACATA<XOXrnGACCX3AGACAIAATAGrAGGCrACAATAGCArgGluPhelleGluTirlleArgSerPheAspProAspIlelleValGliTirAsnSer AACAATmGACIGGCCATACCITArAGAACGIOCACACAGAATAGGAGIAAAGCICGACAsnAsnPheAspTrpProTirLeuIIeGluArgAlaHisArglleGliValLisLeuAsp GIGACAAGGCGIGTTGGCXjCAGAGCCAAGr ATCAGCGIUTATGGACATGIUICAGTCCAGValThrArgArgValGliAlaGluProSerMetSerValTirGliHisValSerValGln GGTAGGCrAAACGTAGACCIUrACAACrACGTCGAGGAAATGCATGAGATAAAGGTAAAGGliArgLeuAsnValAspLeuTirAsnTirValGluGluMetHisGluIleLisValLis ACGCTGGAGGAGGTCGCCGAATACCTAGGCGITATGCGCAAGACCGAGCGCGTACTAATAThrLeuGluGluValAlaGluTirLeuGHValMetArgLisSerGluArgValLeuIle GAATGGTGGCGGATCCCAGATTACIGGGACGACGAGAAGAAACGGCXjGCrACIGAAGCGrrGluTrpTrpArglleProAspTirTrpAspAspGluLisLisArgProLeuLeuLisArg TAIGCCCICGACGATGTGAGAGCCACCTACGGCCICGCCGAGAAGATACICCCATIGGCATirAlaLeuAspAspValArgAlaThrTirGliLeuAlaGluLisIleLeuProPheAla ATACAGCrnCGACAGTAACCGGTGTrCCTITAGACCAAGICGGGGCTATGGGCGTAGGTDeGlnLeuSerThrValThrGliValProLeuAspGlnValGliAlaMetGliValGli TTCCXjOCrAGAATOGnACJTITATCAGAGCAGCXjCATGATATGAACGAGCrTGICCCCAACPheArgLeuGluTrpTirLeuMetArgAIaAIaHisAspMetAsnQuLeuVaIProAsn CGKnCAAGCGGCGCGAAGAGAGCTACAAGGGAGCAGTAGIACrAAAGCCCCTAAAGGGrArgValLisArgArgGlu GluSerTirLisGliAlaValValLeuLisProLeuLisGli GTCATCAGAACGTAGrAGTCCITOACITTAGCICAATGrACXXXAACATAAIOATAAAG ValHisGluAsnValValValLeuAspPheSerSerMetTirProAsnDeMetlleLis TACAATGIGGGCCCIGACACGATAATIGACGACCCCICAGAGIGCGAGAAGrACAGIGGATirAsnValGliProAspThrllelleAspAspProSerGlu CisGluLisTirSerGIi TGCTACGTAG(XOCXX}AACnGGGGCACATCTTTAGGCGCrojGOCTCCGGCnCTTTAAGCisTirValAIaProGIuValGliHisMetPheArgArgSerProSerGIiPhePheLis ACCGIOCITOAGAACCICATAGCGCIGCGrAAGCAAGrACGIGAAAAGAIGAAGGAGrn;ThrValLeuGluAsnLeuHeAIaLeuArgLisGlnValArgGluLisMetLisGluPhe CCXXCAGATAGCGCAGAATACGGGATATAC GATGAAOGCCAGAAGGCACICAAGGrIGClAProProAspSerProGluTirArglleTirAspGIuArgGlnLisAlaLeuLisValLeu GCCAACGCTAGCTACGGCrACATGGGATGGGIGCACGCTCGaGKmCIGrAAACGCrGCAlaAsnAlaSerTirGliTirMetGIiTrpValHisAlaArg TrpTirCisLisArgCÍs GCAGAGGOGTAACAGCXnGGGG(XGrAACCIGATACIGICAGCAATAGAATAIOCrACG 170 190 210 230 250 270 290 310 330 350 370 390 410 430 450 470 490 510 530 550

AlaGuAlaValThrAlaTrpGliArgAsnLeuIleLeuSerAlalleGluTirAlaArg 1711 AAGCrCGGOCTCAAAGTAATATACGGAGACACC^ACICraATTCGrAACCrATCATATC LisLeuGliLeuLisVal IleTirGliAspThrAspSerLeuPheValThrTirAspIle

1771 GAGAAGGTAAAGAAGCTAATAGAATICGrcGAGAAACAGCrAGGCnnjAGAIAAAGATA

GluLisValLisLisLeuIleGluPheValGluLisGlnLeuGliPheGluIleLisIle 1831 GACAAGOTATACAAAAGACToITCITTACCGAGGCAAAGAAGCXíCTACCJIOGGCCrCCIG AspLisValTirLisArgValPhePheThrGluAlaLisLisArgTirValGliLeuLeu 1891 GAGGACGGGCGTATGGACATAGTAGGCTnGAGGClGTrAGAGGCGACIGGrlGrlOAGCrA GluAspGliArgMetAspfleValGliPheGluAlaVaLArgGliAspTrpCisGIuLeu 1951 GCTAAAGAGGKjCAAGAGAAAGTAGCAGAGTAATACKjAAGACGGGAGACATAAATAGA AlaLisGluValGlnGlu LisValAlaGluIlelleLeuLisThrGliAspIIeAsnArg 2011 GCCATAAGCTACATAAGAGAGGIGGrlGAGAAAGCrAAGÀGAAGGCAAGATACXXATAACA AlalleSerTirlleArgGIuValValArgLisLeuArgGluGliLisIleProIleThr

2071 AACCTOjTAATATCGAAGACXXIGACAAAGAGAATCGACGAATACGAGCACGAGGCXjCCG

LisLeuValIIeTrpLisThrLeuThrLisArglleGIuGluTirGIuHisGIuAlaPro 2131 CACGTTACTGCAGCACGGCGrrATGAAAGAAGCAGGCTACGATGfGGCACXXjGGAGACAAG

HisValThrAlaAlaArgArgMetLisGlu AlaGliTirAspValAlaProGliAspLis

2191 ATAGGCTACAICATAGTTAAAGGACATGGCAGTATATCGAGTCGTrXCTAGlXXrrACrTT

IleGliTirllelleVal LisGliHisGliSerlleSerSerArgAlaTirProTirPhe

2251 ATGGTAGACrcGICrAAGGITGACACAGAGrACrACATAGACCACCAGATAGrACCAGCA

MetVal AspSerSerLisValAspThrGluTirTirlleAspHisGlnlleVal ProAla

2311 GCAATCAGGATACTCICATACTTCGGGGTCACAGAGAAGCAGCTTAAGGCAGCATCAIGT

AlaMetArglleLeuSerTirPheGliValThrGluLisGln LeuLisAlaAlaSerSer 2371 GGGCATAGGAGrICIUnOjACndTCGCGGCAAAGAAGfrAGccccggctctccaaacta

GliHisArgSerLeuPheAspPhePheAJa AlaLisLis *

Polimerase do ADN de P. occiãtum

SEQ. ID. No. 3 ATCACAGAGACrATAGAGrTCXjIGCIGCTA SEQ. DD. No. 4 MetThrGluThrDeGluPheValLeuLeu

31 GACICTAGCTACGAGATACrGGGGAAGGAGCCGGrAGTAATCCrCIGGGGGATAACGCTT

AspSerSerTirGluIle LeuGliLisGluPro V al V alIleLeuT rpGlilleThrLeu

91 GACCKHA/XACGIGIGGTCCTICTAGACCACCGCITCCGCCCCTACrrCrACGGCCIiCATA

AspGliLisArgValValLeuLeuAspHisArgPheArgProTLrPheTirAlaLeuDe 151 GCCCGGGGCrATGAGGATATGGIGGAGGAGATAGCAGCriGCATAAGGAGGCTTAGIGTCl

AlaArgGliTirGluAspMetValGluGluIleAlaAlaSer IleArgArgLeuSerVal

211 GIC/\AGAGIGCGATAATAGATGGO\AGCCrcnGATAAGAGGTACnCGGCAGGCCCCGT

ValLisSerProIlelleAspAlaLisPro LeuAspLisArgTirPheGliArgProArg AAGGCGGTTtAAGATTAíTIACTATGATACCCGAGIOGITAGACACTACCGCGAGGCGGTC LisAlaValLisIleThr ThrMetlleProGluSerValArgHisTirArgGluAlaVal 271 16

331 AAGAAGATAGAGGGIGTCGAGGACT€<XTCGAGGCAGATATAAGGnTCCAATGAGATAT

LisLisIleGluGliValGluAspSerLeuGluAlaAspIleArgPheAlaMetArgTir

391 CTGATAGATAAGAGGCICTAC(XX7ntACG CHTTACCCXJCrcCCCGTAGACX^ATCCGGGC

LeuIleAspLisArgLeuTirProPheThrValTirArglIeProValGluAspAlaGli

451 CGCAATCCAGGCrrcCGrGTIOACCCrKrlCTACAAGGnGCTGGCGACCCGGAGCCCCTA

ArgAsnProGliPheArgValAspArgValTirLisValAlaGliAspProGluProLeu 511 GCCKATATAACGCfXjAJCGACCnCCCCCGATGAGGCIGGrAGCITnGATATAGAGGro

AlaAspfleThrArgDe AspLeuProProMetArgValLeuAlaPheAspDeGluVal

571 TATAGCAGGAGGGGGAGCCCTAACGCIGCAAGGGATCCAGrlOATAATAGflGTCGCKjAGG

TirSer ArgArgGliSerProAsnProAlaArgAspProValIlelleValSer LeuArg

631 GACAGCGAGGGCAAGGAGAGGCIGATAGAAGCIGAAGGCCATGACGACAGGAGGGTICTG

AspSerGluGliLisGluArgLeuIleGluAiaGIuGliHis AspAspArgArgValLeu

691 AGGGAGmCTAGACTACGTGAGAGCCTrC GACCCXGACATAATAGIGGGCTATAACAGT

ArgGluPheValGluTirValArgAlaPhe AspProAspIlelleValGliTirAsnSer

751 AACCACrrCGACTCGCCCTACCTAATCGAGCGCGCCCGrAGGCICGGGATTAACCICGAC

AsnHisPheAspTrpProTirLeuMetGluArgAlaArgArgLeuGlilleAsnLeuAsp

811 GTrACACGCCGTOTGGGGGCAGAGCCCACC ACCAGCGTCTACGGCCACGTCTCGGIGCAG

ValThr ArgArgValGliAlaGluProThrThrSerValTirGliHisValSer ValGln

871 GGIAGGCIGAACGIGGACCICTACGACTATGCCGAGGAGATGCCGGAGATAAAGATGAAG

GliArgLeuAsnValAspLeuTirAspTirAlaGluGluMet ProGluíleLisMetLis

931 ACGCTIGAGGAGGTAGCXjGAGrACCrAGGC GITAIGAAGAAGAGCGAGCGTGTOATAATA

ThrLeuGluGluValAlaGluTirLeuGli ValMetLisLisSerGluArgValIlelle

991 GAGTGGrrGGAGGATACCCGAGTACIGGGATGACGA.GAAGAAGAGGCAGCIGCrAGAGCGC

GluTrpT rp ArglleProGluTirT rpAsp AspGluLisLisArgGlnLeuLeuGlu Arg

1051 TACGCGCICGACGATGIGAGGGCTACCTAC GGCCTCGCGGAAAAGATGCIACCGTTCGCC

TirAlaLeuAsp Asp V alArgAlaThrTirGKLeu AlaGluLisMetLeu ProPhe Ala

1111 ATACAGCICICCACIGITACGGCnGíIOCCr CIUjACGAGGTAGGIGCIAlGGGCGrAGGC

IleGlnLeuSerThrV alThrGliValProLeuAspGlnVal GliAlaMetGli ValGli

1171 TTnTGCCIAGAGTGGTATCICATCCGIGCACOGIACGATAlGAACGAGCIGGIGCCGAAC

PheArgLeuGluTrpTirLeuMetArgAlaAlaTirAspMetAsnGluLeuValProAsn

1231 CGGGTCGAGAGGAGGGGGGAGAGCTACAAGGGIOCAGTAGIOTTAAAGCCIUICAAGGGA

ArgValGluArgArgGliGluSerTirLisGliAlaValValLeuLisProLeuLisGli

1291 GlTCAIGAGAAIGTIGIGGIOCICGATrn; AGITCCATGrACCCGAGCATAATGATAAAG

ValHisGluAsnValValValLeuAspPheSerSerMetTirProSerlleMetlleLis

1351 TACAACGIGGGOXCGACACTATAGIGGACGACGCCICGGAGrfiCCCAAAGTACGGCGGC

TirAsnValGliProAspThrlleValAspAspProSerGlu CisProLisTirGliGli

1411 TGCTATGTAGCGCGCGAGGTCGGGCACCGGTICCGTCGCrCCCCGCCAGGCTTCTTCAAG

CisTirValAlaProGluValGliHisArgPheArgArgSerProProGliPhePheLis

AOCCFIGCiajAGAACCTACIGAAGCrACGCCGACAGGTAAAGGAGAAGAIGAAGGAGnT

ThrValLeuGlu.-^snLeuLeuLisLeuArgArgGInValLisGluLisMetLisGluPhe 1471 1531 CCGCCTGACAGCCCCGAGrACAOGCICrACGAlGAGCGCCAGA/VGGCGCTCAAGGTItnT ProProAspSerProGluTirArgLeuTirAspGluArgGlnLisAlaLeuLisValLeu 530 1591 GCOAACXKX3AGCIATGGCIACArCXjGGIOGAGOCATCCXXGCIGGrACIC3CAAACGCTriC AlaAsnAlaSerTirGliTirMetGliT rpSerHisAlaArg T rpTirCisLisArgCis 550 1651 GCCGAGGCIGICACAGCCKjGGGCCGrAACCITATACIOACAGCrAtCGAGrATGOCAGG AlaGluAla ValThrAlaT rpGliArgAsn LeuIleLeuThr AlalleGluTirAlaArg 570 1711 AAGCICGGCCTAAAGGITATATAIGGAGAC ACCGAClGOTUnCGIOGICrATGACAAG LisLeuGliLeuLisVal IleTirGliAspThrAspSerLeuPheValValTirAspLis 590 1771 GAGAAGGnXjAGAAGCIGATAGAGTTTCTDC GAGAAGGAGCTGGGCmGAGATAAAGATA GluLis ValGluLisLeuIleGluPheValGluLisGluLeuGliPheGluIle Lislle 610 1831 GACAAGATCTACAAGAAAGFIGnunG^CGGAGGCTAAGAAGCXjCTATGrAGGICTCClG AspLisIleTirLisLisValPhePheThrGluAlaLisLis ArgTirValGliLeuLeu 630 1891 GAGGACXjGACGTATAGACATCGTGGGCTTTGAAGCACjICCGCGGCGACTGGTGCGAGCTCj Glu AspGHArglle Asplle V alGliPhe Glu AlaV al ArgGIi AspT rpCisGluLeu 650 1951 gctaaggaggiocaggagaaggcggcigagatagtgtigaatacggggaaogtcgacaag AlaLisGluValGlnGlu LisAlaAlaGluIleValLeuAsnThrGliAsnValAspLis 670 2011 GClAXAAjCnACAIAAGGGAGGlAAIAAAGCAGCICCGGGAGGGCAADGIGCXAAIAACA Alalle SerTirlleArgGluValIleLisGlnLeuArgGluGliLisValPro IleThr 690 2071 AAGCnAICATATCGAAGACGCIOAGCAAGAGGATAGAGGAGTACGAGCAIGACGCGCCT LisLeuIlelleTrpLisThrLeuSerLÍsArglleGluGlu TirGluHisAspAlaPro 710 2131 CATGTGAlOGCIGCACGGCGrATGAAGGAGGCAGGCrACGAGGTGICICCCGGCGAT/VvG HisValMetAlaAlaArgArgMetLisGlu AlaGHTirGluValSerProGliAspLis 730 2191 GTGGGÍACGTCATAGITMCGGrAGCGGGAGIGIGICCAGCAGGGCCmCCCCTACTIC VaIGliTirVallleVal LisGliSerGliSerValSerSerArgAlaTirProTirPhe 750 2251 AlGGnOATCCATCGACCATCGACGrICAACTACTATATrGACCACCAGATAGIGCCGGCr MetVal AspProSerThrfleAspVaLAsnTirTirfleAspHisGlnEeVal ProAIa 770 2311 gocigaggatacicidctacticggagk: accgagaaacagcicaaggcggcggctacg AlaLeuArglleLeuSerTirPheGliValThrGluLisGInLeuLisAIaAlaAiaThr 790 2371 GlGCAUAGAAGCClCllCGACriCl ÍLVAAJ iLAAAUAAAlALfctcctccacccggctagc ValGInArgSerLeuPheAspPhePheAla SerLisLis * 803

Como resultado da presente invenção, é possível utilizar as sequências de aminoácidos das polimerases de ADN de Pyrodicíium para engendrar novos iniciadores degenerados para a descoberta de novos genes de polimerases de ADN texmofQicos até agora desconhecidos. A utilidade genérica do processo dos iniciadores degenerados está exemplificada no documento PCT publicado com o n° WO 92/06202 que aqui se considera incorporado por referência. Tal documento descreve a utilização de iniciadores degenerados para clonar o gene que codifica a 18

polimerase do ADN de Themosipho africanus. Antes da presente invenção havia já sido demonstrado que os métodos dos iniciadores degenerados eram convenientes para o isolamento de genes codificadores de novas enzimas polimerases de ADN termostáveis. O sucesso de tais métodos deve-se em parte à identificação de motivos conservados entre as polimerases de ADN termostáveis, por exemplo, de Thermus aqualicus e de Thermus thermophilus.

Assim sendo, devido à dissemelhança existente entre as sequências de aminoácidos de polimerases de ADN dos hipertennófilos de mais elevado grau, por exemplo, as espécies de Pyrodictium e dos microrganismos não hipertermófilos, as espécies de Thermus, os métodos anteriores dos iniciadores degenerados não eram convenientes para isolar e exprimir genes das polimerases de Pyrodictium. Os requerentes da presente invenção criam agora a possibilidade de se utilizar os métodos dos iniciadores degenerados para o isolamento dos genes que codifiquem novas enzimas polimerases de ADN provenientes de microrganismos altamente hipertermofílicos. Foi já descrito o gene que codifica a polimerase de ADN do microrganismo T. litoralis (Tli) hipertermofílico. Apesar de as polimerases de ADN de Tli, Pab e Poc conterem os motivos das sequências de aminoácidos que reflectem as polimerases de ADN de tipo eucariótico, as polimerases de ADN de Pab e de Poc têm apenas uma identidade limitada e pontual das sequências de aminoácidos, comparativamente com a polimerase de ADN de Tli. Dito de forma concreta, os alinhamentos da sequências de aminoácidos indicam que apenas há uma identidade de 37% a 39% entre as sequências da polimerase de ADN de Poc ou de Pab com a de Tli. Há regiões significativas de falta de identidade com a polimerase de ADN de Th nos 20 aminoácidos que precedem a região 1 (posição 438 a 458 nas SEQ ID Nos. 2 e 4) e nos 10 aminoácidos subsequentes. Além disso, há regiões significativas de falta de identidade com a polimerase de ADN de Th nos 10 a 15 aminoácidos que vêm antes e nos 10 a 15 aminoácidos que vem depois da região 4 (posição 611a 634 nas SEQ ED Nos. 2 e 4). Estas regiões e também outras parcelas do local activo da polimerase, são altamente conservadas nas polimerases de ADN de Poc e de Pab e contribuem de forma significativa para a extraordinária termostabilidade destas enzimas polimerases de ADN. A presente invenção, ao proporcionar sequências de ADN e aminoácidos para duas enzimas polimerases de Pyrodictium, permite pois isolar outras enzimas polimerases de ADN muitíssimo termofílicas e também as sequências codificadoras dessas enzimas. Outro alinhamento das sequências de P. occultum e de P abyssi com sequências de enzimas termostáveis conhecidas permite a identificação selectiva de outras novas enzimas adequadas para as RCP, eficientes a temperaturas de desnaturação de 100°C.

As sequências de ADN e de aminoácidos anteriormente indicadas e os compostos de ADN que codificam essas sequências podem ser utilizados para a concepção e a construção de vectores de expressão de ADN recombinantes para comandar a expressão da actividade das polimerases de ADN de Pyrodictium numa grande variedade de células hospedeiras. O composto de ADN que codifica a totalidade ou uma parte da sequência de ADN, ilustrada supra, também pode ser utilizado como sonda para identificar o ADN codificador de polimerases termostáveis, proveniente de outros arqueorganismos, em especial proveniente de espécies de Pyrodictium, e a sequência de aminoácidos ilustrada supra pode ser utilizada para a concepção de péptidos utilizáveis como imunogénios para a preparação de anticorpos que possam ser utilizados para identificar e purificar uma polimerase termostável.

Os vectores recombinantes que codificam uma sequência de aminoácidos codificadora de uma polimerase de ADN de Pyrodictium irão ser purificados normalmente antes de serem utilizados na técnica de ADN recombinante. A presente invenção .proporciona tal metodologia de purificação. 20- O peso molecular da polimerase de ADN purificada, proveniente do hospedeiro E. coli recombinante que exprime os genes das polimerases de P occultum ou P. abyssi, foi determinado pelo método anterior, tendo-se obtido um valor de cerca de 90 kDa. O cálculo do peso molecular desta mesma polimerase de ADN, quando determinado pela sequência deduzida de aminoácidos, levou à obtenção de um valor de cerca de 92,6 kDa.

Um aspecto importante da presente invenção é a produção de polimerase de ADN recombinante de Pyrodictium. Assim, a presente invenção proporciona também um processo ^para a preparação de polimerases de ADN termostáveis, em conformidade com a presente invenção, o qual compreende os passos seguintes: (a) criar em cultura uma célula hospedeira transformada com um vector de ADN que contenha uma sequência de ADN que codifique a referida polimerase de ADN termostável; e (b) isolar da cultura a polimerase de ADN termostável produzida na célula hospedeira.

Conforme se disse antes, o gene que codifica esta enzima foi clonado a partir do ADN genómico de duas espécies exemplificativas de Pyrodictium, a saber, P. occultum e P. abyssi. A sequência completa codificadora da polimerase do ADN de P. occultum (Poc) pode ser obtida ^facilmente num fragmento de restrição Nhel de -2,52 kb do plasmídeo pPoc4. Este plasmídeo foi depositado na Colecção Americana de Culturas Tipo (“American Type Culture Collection”, ATCC) em células hospedeiras de E. coli ‘Sure® Cells’ (Stratagene) a 11 de Maio de 1993 com o número de acesso 69309. A sequência codificadora completa da polimerase de ADN de P. abyssi (Pab) pode ser obtida facilmente num fragmento de restrição Sall de -3,74 kb do plasmídeo pPabl4. Este plasmídeo foi depositado na instituição ATCC em células hospedeiras de E. coli ‘Sure® Cells’ (Stratagene) a 11 de Maio de 1993 com o número de acesso 69310. A sequência codificadora completa e a sequência deduzida de aminoácidos das enzimas polimerases de ADN termostáveis de Pab e de Poc estão indicadas supra. A sequência total

21 codificadora do gene da polimerase de ADN não é no entanto necessária para produção de uni produto gémeo biologicamente activo com a actividade de polimerase de ADN. A disponibilidade do ADN que codifica a sequência da polimerase de ADN de Pyrodictium cria a oportunidade de se modificar a sequência codificadora, por foima a gerar formas de muteína (proteína mutante) que possuam também actividade de polimerase de ADN. As supressões efectuadas no terminal amino (N), de cerca de um terço da sequência codificadora, podem dar origem a um produto génico que seja bastante activo em ensaios com polimerases. Uma vez ^ que há determinadas formas da polimerase, encurtadas no terminal N, que são activas os arquétipos génicos utilizados para a expressão dessas polimerases podem conter as correspondentes formas mais curtas da sequência codificadora.

Para além das supressões no terminal N, cada um dos resíduos aminoácidos da cadeia peptídica que compreende a polimerase de Pyrodictium pode ser modificado por oxidação, por redução ou por meio de qualquer outra transformação e a proteína pode se clivada para dar origem a fragmentos que conservem a actividade. As alterações que não destruam a actividade não retiram a proteína da definição de uma proteína com a actividade de polimerase de Poc ou de Pab e portanto consideram-se especificamente incluídas no âmbito da presente invenção. E possível efectuar modificações da estrutura primária do gene da polimerase de ADN de Poc ou de Pab por supressão, adição ou alteração, de modo a modificar os aminoácidos incorporados na polimerase de ADN durante a tradução, sem destruição da actividade da polimerase de ADN, a alta temperatura, dessa proteína. Tais substituições e outras alterações têm como resultado a produção de proteínas com uma sequência de aminoácidos codificada por ADN abrangido no âmbito da presente invenção. De igual modo, é possível utilizar a sequência genómica clonada ou sequências sintéticas homólogas dos genes das polimerases de ADN de

Poc e de Pab para a expressão de polipeptidos de fusão com actividade da polimerase de ADN de Pyrodictmm ou para a expressão de uma proteína com uma sequência de aminoácidos idêntica à da polimerase de ADN do Poc ou do Pab natural.

Posto isto, a presente invenção proporciona a sequência completa de codificação das enzimas polimerases de ADN de Pab e de Poc, a partir da qual é possível construir os vectores de expressão aplicáveis a diversos sistemas hospedeiros, e é possível exprimir a sequência codificadora. Determinadas parcelas da sequência codificadora da polimerase da presente ^invenção também são úteis como sondas para a pesquisa de outras sequências codificadoras de polimerases termostáveis em inúmeras espécies. Assim sendo, há parcelas de ADN genómico, codificador de 4 a 6 aminoácidos pelo menos, que podem ser sintetizadas como sondas oligo-desoxirribonucleotídicas que codificam pelo menos 4 a 6 aminoácidos, e podem ser utilizadas para a pesquisa de outros ADN codificadores de uma polimerase termostável. Atendendo a que pode não haver uma correspondência exacta entre a sequência nucleotídica do gene da polimerase de ADN termostável de Pab e de Poc e o correspondente gene de outras espécies, são ^ normalmente necessários oligómeros que contêm aproximadamente 12 a 18 nucleótidos (codificadores da sequência de 4 a 6 aminoácidos) para se conseguir a hibridação em condições de rigor suficiente para eliminar resultados falsos positivos. As sequências que codificam 6 aminoácidos fornecem uma ampla informação para essas sondas. A presente invenção, ao proporcionar as sequências codificadoras e as sequências de aminoácidos para as polimerases de ADN de Pab c de Poc, facilita consequentemente o isolamento de outras enzimas polimerases termostáveis e as sequências codificadoras dessas enzimas. Dito de forma concreta, a presente invenção proporciona meios para a preparação de iniciadores e sondas para a identificação de ácidos nucleicos que codificam as enzimas polimerases de ADN contidas dentro de isolados de ADN provenientes de arquebactérias afins tais como os hipertermófílos extremos, incluindo outras espécies de Pyrodictium, P. brockii e espécies de Methanopyrus, tais como M. kandleri. Há várias dessas regiões de semelhança entre as sequências codificadoras das polimerases de ADN de Pab e de Poc. No caso das regiões com um comprimento de 9 codões é possível utilizar sondas correspondentes a essas regjões para identificar e isolar sequências que codificam enzimas polimerases termostáveis que sejam idênticas (e complementares) à sonda para uma ^^sequência contígua que possua pelo menos 5 codões. No caso da região com um comprimento de 6 codões é possível utilizar uma sonda correspondente a esta região para identificar e isolar sequências de ADN que codificam polimerases termostáveis que são idênticas à sonda para uma sequência contígua que possui pelo menos 4 codões.

Uma propriedade existente nas enzimas polimerases de ADN de Pyrodictium, mas que não existe na polimerase de ADN de Taq natural e na polimerase de ADN de Tth natural, é a actividade de exonuclease de 3’-* 5’. Considera-se desejável estas actividade de exonuclease ^de 3’-> 5’, uma vez que as bases mal incorporadas ou desencontradas da sequência sintetizada de ácidos nucleicos são eliminadas por esta actividade. Assim sendo, aumenta a fidelidade da RCP ao ser utilizada uma polimerase com a actividade de exonuclease de 3’-> 5’ (v.g., as enzimas polimerases de ADN de Pyrodictium). No entanto, a actividade de exonuclease de 3’-» 5’ existente nas enzimas polimerases de ADN de Pyrodictium também pode aumentar a amplificação espontânea não especifica na RCP, ao modificar a extremidade 3’ dos iniciadores. A actividade de exonuclease de 3’—» 5’ pode eliminar os ADN de cadeia simples, tal como sucede com os iniciadores ou com a matriz de cadeia simples. Dito em termos essenciais, cada nucleótido de 3’ de um iniciador ou dc uma matriz de cadeia simples é tratado pela enzima como sendo 24 desemparelhado e por isso é degradado. Para se evitar a degradação do iniciador na RCP é possível juntar fosforotioato às extremidades 3’ dos iniciadores. Os nucleótidos modificados pelo fosforotioato são mais resistentes à remoção pelas exonucleases de 3’-» 5’.

No caso de se pretender produzir uma enzima idêntica à polimerase de ADN de Pab ou de Poc natural, ou idêntica a um derivado ou um homólogo dessa enzima, a produção de uma forma recombinante de polimerase implica tipicamente a construção de um vector de expressão, a transformação de uma célula hospedeira com esse vector e a criação em cultura )da célula hospedeira transformada, em condições tais que tenha lugar essa expressão. Para a construção do vector de expressão obtém-se um ADN que codifique a enzima perfeitamente desenvolvida, (aqui utilizada de forma a conter todas as muteínas), ou um polipeptido de fusão da polimerase, compreendendo esse polipeptido de fusão uma sequência de aminoácidos obtida a partir das polimerases da presente invenção e ainda uma outra sequência de aminoácidos que não leve à destruição da actividade da polimerase, ou então uma outra sequência de aminoácidos clivável em condições controladas (tais como o tratamento com um peptidase) para se obter uma proteína activa. A sequência codificadora é então colocada em ligação > funcional com sequências de controlo adequadas num vector de expressão. O vector pode ser concebido para se replicar de forma autónoma na célula hospedeira ou para ser integrado no ADN cromossómico da célula hospedeira. O vector é utilizado para transformar um hospedeiro adequado e esse hospedeiro transformado é criado em cultura em condições convenientes para a expressão da polimerase recombinante de Pyrodicíhm. A polimerase de Pyrodiclium é isolada a partir do meio ou a partir das células; a recuperação e a purificação da proteína podem não ser operações necessárias em alguns casos, sempre que possam ser toleradas algumas impurezas.

Na construção de vectores adequados que contenham as desejadas sequências codificadoras e de controlo são utilizadas técnicas convencionais de ligação e de restrição que são bem conhecidas na especialidade (ver, por exemplo, Molecular Cloning Laboratoiy Manual 2a ed., Sambrook et al, 1989, Cold Spring Harbor Press, Nova Iorque, (NY), obra que aqui se considera incorporada por referência). Os plasmídeos isolados, as sequências de ADN ou os oligonucleótidos sintetizados são clivados, modificados e novamente ligados segundo a forma desejada. É possível acrescentar locais de restrição adequados, se não estiverem normalmente ^disponíveis, às extremidades da sequência codificadora, de modo a facilitar a construção de um vector de expressão, por métodos bem conhecidos na especialidade.

Para determinadas parcelas de vectores ou de sequências codificadoras, que exijam modificações das sequências, há diversos métodos de mutagénese específicos do local, dirigidos pelo iniciador. Por exemplo, e possível praticar a reacção em cadeia com polimerase (RCP) para se efectuar a mutagénese específica do local. A publicação ‘PCR Protocols’, ed. por Innis et ai, 1990, Academic Press, San Diego, CA e a publicação ‘PCR Technology’ ed. por Henry ^Erlich, 1989, Stockton Press, Nova Iorque, NY, descrevem métodos para clonar, modificar e sequenciar ADN por meio da RCP, considerando-se essas obras aqui incorporadas por referência.

As sequências de controlo, os vectores de expressão e os métodos de transformação vão depender do tipo de células hospedeiras utilizadas para exprimir o gene. De um modo geral, são utilizadas como hospedeiras as células de organismos procarióticos, de leveduras, de insectos ou de mamíferos. De um modo geral, os hospedeiros procarióticos são mais eficientes e mais convenientes para a produção de proteínas recombinanles e por tal motivo são preferíveis para a expressão de enzimas polimerases de ADN de Pyrodicxium. 0 hospedeiro procariótico mais frequentemente utilizado para exprimir proteínas recombinaules é o microrganismos E. coli. Para a clonagem e para a sequenciação e para a expressão de arquétipos sob o controlo dos principais promotores bacterianos é possível utilizar como hospedeiras as células MM294 da estirpe K12 de E. coli, que podem ser obtidas em “E. coli Genetic Stock Center” com a identificação GCSC#6135. No caso dos vcctores de expressão com a sequência de controlo PlNrbs é possível utilizar o lisogénio λ MC 100 da estirpe K12 de E. coli, com a designação N7N53CI857 SusPgo (ATCC 39531). Também são Células hospedeiras úteis as células DG116 de E. coli, depositadas na instituição ATCC (ATCC 53606) em 7 de Abril de 1987 e as células KB2 de E. coli depositadas na instituição ATCC (ATCC 53075) em 29 de Março de 1985. No caso dos recombinantes do bacteriófago Ml3, são utilizadas estirpes de E. coli sensíveis à infecção com 0 bacteriófago, tais como a estirpe DG98 da variante K12 de E. coli. A estirpe DG98 foi depositada na instituição ATCC (ATCC 39768) a 13 de Julho de 1984.

No entanto, também é possível utilizar outras estirpes microbianas diferentes de E. ^oli, tais como as estirpes de bacilos, por exemplo, Bacillus subtilis, diversas espécies de pseudomonas e ainda outras estirpes bacterianas, para a expressão recombinante de enzimas polimerases de ADN de Pyrodictium.

Para além das bactérias também é possível utilizar microrganismos eucarióticos, tais como leveduras, como células hospedeiras recombinantes. Ver, por exemplo, Stinchcomb et al., 1979, Nature 282:39; Teschempe et al, 1980, Gene 10:157; e Clarke et ai, 1983, Meth.

Enz. 101:300. O gene de Pyrodictium também pode ser expresso em culturas de células hospedeiras eucarióticas obtidas a partir de organismos multicelulares. Ver, por exemplo, Tissue Culture,

27

Academic Press, Cruz e Patterson, editores (1973). Como exemplos de linhagens celulares hospedeiras úteis refere-se as seleccionadas entre COS-7, COS-A2, CV-1, células de murinos, tais como os mielomas N51 dos murinos e as células VERO, HeLa e as células de ovário de criceto chinês (OCC). Também é possível utilizar como hospedeiras células de plantas, havendo disponíveis sequências de controlo compatíveis com células dc plantas, tais como o promotor da nopalina-sintase e as sequências do sinal de poliadenilação (Depicker et al., 1982, J. Mol, Appl. Gen. 1:561). \ Consoante as células hospedeiras utilizadas assim a transformação é efectuada utilizando técnicas convencionais adequadas a essas células. Pratica-se o tratamento com cálcio, utilizando para o efeito o cloreto de cálcio, conforme descrito por Cohen, 1972, Proc. Natl. Acad. Sei. USA 69:2110, no caso de procariotas ou de outras células que contenham barreiras importantes de paredes celulares. No caso das células de mamíferos, é preferível utilizar o método de precipitação com fosfato de cálcio, descrito por Graham e van der Eb, 1978, Virology 52:546. As transformações levadas a cabo em leveduras são realizadas em conformidade com o método de Van Solingen et ai, 1977, J. Bact. 130:946 e Hsiao et al. 1979, Proc. Natl. Acad. ►

Sei. USA 76:3829.

Uma vez ocorrida a expressão da polimerase de ADN de Pyrodictium numa célula hospedeira recombinante, pode eventualmente ser desejável a purificação da proteína Embora os procedimentos de purificação previamente descritos possam ser Utilizados para purificar a polimerase termostável recombinante da presente invenção, são preferíveis para o efeito os métodos de purificação cromatográficos por interaeção hidrofóbica. A cromatografia por interaeção hidrofóbica é uma técnica de separação segundo a qual as substâncias são separadas com base nas diferentes forças de interaeção hidrofóbica com um material de um

leito sem carga eléctrica onde haja grupos hidrofóbicos. De uma forma típica, em primeiro lugar equilibra-se a coluna em condições favoráveis A ligação hidrofóbica, v.g. com uma elevada força iónica. É possível recorrer a um gradiente salino decrescente para a eluição da amostra.

Foram já descritos protocolos pormenorizados para a purificação de polimerases de ADN termostáveis recombinantes, por exemplo, na patente de invenção PCT publicada com o n° WO 92/03556 com data de 5 de Março de 1992 e na patente de invenção WO 91/09950 publicada a 11 de Julho de 1991. Estas obras consideram-se aqui incorporadas por referência. Os métodos ali descritos para o microrganismo Thermotoga marítima são adequados. O Exemplo 9 (ver infra) descreve um protocolo preferencial para a purificação de enzimas polimerases de Pyrodictmm recombinantes.

Por razões de estabilidade a longo prazo guarda-se preferencialmente a enzima polimerase de ADN de Pyrodictium numa solução tampão que contenha um ou vários detergentes poliméricos não iónicos. Tais detergentes são geralmente seleccíonados entre os que possuam um peso molecular compreendido aproximadamente no intervalo entre 100 e 250 000 e de preferência entre cerca de 4 000 e 200 000 daltons e que estabilizem a enzima para valores de pH compreendidos entre 3,5 e cerca de 9,5 e de preferência entre cerca de 4 e cerca de 8,5. Como exemplos de tais detergentes refere-se aqueles que vêm explicitados nas páginas 295--298 da obra ‘McCutcheon’s Emulsifiers & Detergents’, edição norte-americana de 1983, publicada por McCutcheon Division of MC Publishing Co, 175 Rock Road, Glen Rock, NJ (E.U.A.), cujo conteúdo se considera aqui incorporado na totalidade por referência. De preferência, os detergentes são seleccíonados entre o conjunto constituído por éteres de álcoois graxos etoxilados e éteres Iauxílicos, fenóis alquílicos etoxilados, compostos derivados de octilfenoxi-polietoxi-etanol, álcoois de cadeia linear modificados e oxietilados e/ou oxipropilados, compostos de monooleatos dc polietileno-glicol, compostos polissorbatos e éteres de álcoois graxos fenólicos. São mais particularmente preferíveis os compostos ‘Tween 20’, que é um monolaurato de sorbitano polioxietilado (20) fornecido por “ICI Américas Inc.”, Wilmington, D.E., e o produto ‘Iconol™ NP-40’ que é um alquilfenol etoxilado (nonilico) fornecido por “BASF Wyandotte Corp.” Parsippany, NJ. A enzima termostável da presente invenção pode ser utilizada para qualquer finalidade ^em que seja necessária ou desejada a actividade dessa enzima. De acordo com um caso particularmente preferido, a enzima catalisa a reacção de amplificação dos ácidos nucleicos conhecida pela designação de RCP:

Embora o processo de RCP seja bem conhecido na especialidade (ver as patentes de invenção norte-americanas n- 4 683 195; 4 683 202 e 4 965 188, qualquer delas aqui incorporada por referência), e embora haja empresas comerciais, tais como ‘Peridn Elmer’ que comercializam reagentes de RCP e publicam protocolos de RCP, apresenta-se seguidamente alguma ^informação geral sobre RCP, com o intuito de tomar mais clara e de proporcionar uma melhor compreensão da presente invenção àqueles que não estejam familiarizados com os processos de RCP.

Para se amplificar por RCP uma sequência de um ácido nucleico relevante, numa determinada amostra, a sequência tem de estar acessível aos componentes do sistema de amplificação. Em geral, esta acessibilidade é garantida mediante o isolamento dos ácidos nucleicos a partir da amostra. São conhecidas na especialidade diversas técnicas para extracção de ácidos nucleicos a partir de amostras biológicas. Por exemplo, ver os trabalhos publicados por Higuchi et al. em 1989 na obra ‘PCR Technology’ (Erlich ed., Stockton Press, Nova Iorque).

Atendendo a que o ácido nucleico da amostra é, em primeiro lugar, desnaturado (presumindo que o ácido nucleico da amostra é de cadeia dupla) para dar início ao processo de RCP, e tendo em conta que o aquecimento simples de algumas amostras tem como consequência o desmembramento das células, então o isolamento do ácido nucleico a partir da amostra pode ser, por vezes, realizado conjuntamente com a separação das cadeias. A separação das cadeias pode, no entanto, ser realizada por qualquer método adequado de desnaturação, incluindo os métodos físicos, químicos ou enzimáticos. Uma desnaturação ^ térmica típica implica trabalhar com temperaturas compreendidas entre cerca de 80°C e 105°C durante períodos variáveis entre alguns segundos e cerca de 1 a 10 minutos.

Conforme se disse antes, a separação das cadeias pode ser realizada em conjunto com o isolamento do ácido nucleico da amostra ou então num passo separado. No caso preferido do processo de RCP, realiza-se a separação das cadeias aquecendo a mistura de reacção a uma temperatura suficientemente elevada durante um período eficaz para se conseguir a desnaturação da hélice dupla, mas não para provocar uma desnaturação irreversível da polimerase (ver a patente de invenção norte-americana n° 4 965 188). Contudo, independentemente da

I forma como é executada a separação das cadeias, uma vez estas separadas, o passo subsequente da RCP consiste em hibridar as cadeias separadas com iniciadores que flanqueiem a sequência em causa. Os iniciadores são depois prolongados para formarem cópias complementares das cadeias relevantes e o ciclo de desnaturação, hibridação e prolongamento é repetido tantas vezes quantas as necessárias para se obter a quantidade desejada de ácido nucleico amplificado.

Para que a amplificação por RCP tenha êxito, os iniciadores são concebidos por forma a que a posição em que cada iniciador hibrida junto a uma sequência dc cadeia dupla seja tal

que um produto de prolongamento sintetizado a partir de um iniciador, quando separado da matriz (complemento), sirva como uma nova matriz para o prolongamento do outro iniciador para se obter um segmento de ácido nucleico amplificado de comprimento definido. A amplificação de iniciadores, dependente da matriz, numa RCP, é catalisada por um agente de polimeiização na presença de quantidades adequadas dos quatro desoxirribonucleótido--trifosfatos (dATP, dGTP, dCTP e dTTP) num meio de reacção que contenha os sais convenientes, catiões de metais e um sistema de tamponamento do pH. O método de amplificação é útil não só para a produção de grandes quantidades de uma sequência específica de ácido nucleico, que seja conhecida, mas também para a produção de sequências de ácido nucleico sobre as quais se sabe que existem mas que não estão completamente especificadas. Apenas é necessário conhecer um número suficiente de bases nas duas extremidades da sequência com pormenorização suficiente para que possam ser preparados dois iniciadores oligonucleotídicos que hibridem com cadeias diferentes da sequência desejada em posições relativas ao longo da sequência, de tal modo que um produto de prolongamento sintetizado a partir de um iniciador, quando separado da matriz (complemento), possa servir como uma nova matriz para o prolongamento do outro iniciador numa sequência de ácido nucleico de comprimento definido. Quanto maior for o conhecimento sobre as bases das duas extremidades da sequência tanto maior pode ser a especificidade dos iniciadores para a sequência relevante de ácido nucleico e a eficiência do processo. E possível utilizar qualquer sequência de ácidos nucleicos, numa forma purificada ou não purificada, como ácido nucleico de partida, desde que contenha ou se presuma que possa conter a sequência desejada de ácidos nucleicos específicos. Assim, no processo pode ser utilizado, por exemplo, ADN ou ARN, incluindo o ARN mensageiro, podendo esses ADN ou

ARN ser de cadeia simples ou de cadeia dupla. Por exemplo, se a matriz for de ARN, um agente de polimerização adequado para converter o ARN numa sequência de ADN copiado, complementar (ADNc), é a transcriptase reversa (TR), tal como a TR dos vírus da mieloblastose das aves e a polimerase do ADN de Thermus íhermophilus, que é uma polimerase de ADN termostável com actividade de transcriptase reversa estudada e produzida por ”Hofímann-La Roche Inc.’ e comercializada por ‘Perkin Elmer’ (ver o pedido de patente de invenção PCT com o número WO 91/09950).

Se o ácido nucleico for de cadeia simples ou de cadeia dupla, a polimerase do ADN obtida a partir de Pyrodictium pode ser acrescentada no passo de desnaturação ou quando a temperatura estiver a ser reduzida ou já tiver sido atingido o domínio de valores para favorecer a hibridação. Embora a termostabilidade da polimerase de Pyrodictium permita que seja acrescentada à mistura de reacção em qualquer momento, é possível inibir bastante a amplificação de tipo não específico juntando a polimerase à mistura de reacção no momento em que a mistura ainda não tenha sido arrefecida abaixo da temperatura de hibridação rigorosa. Após a hibridação aquece-se então a mistura de reacção ou mantém-se a uma temperatura que I favoreça ou optimize a actividade da enzima, isto é, uma temperatura suficiente para aumentar a actividade da enzima com a finalidade de facilitar a síntese dos produtos de amplificação do iniciador a partir da matriz e do iniciador hibridados. Na verdade, a temperatura tem de ser suficiente para que tenha lugar a síntese de um produto de amplificação de cada iniciador que seja complementar de cada matriz de ácido nucleico, mas não pode ser tão elevada que desnature cada produto de amplificação a partir da sua matriz complementar (isto é, a temperatura é geralmente inferior a cerca de 80-90°C).

Consoante os ácidos nucleicos utilizados, assim a temperatura típica eficaz para esta reacção de síntese se encontra compreendida geralmente entre cerca de 40°C e 80°C e de

preferência enlre 50°C e 75°C. Mais preferencialmente a temperatura irá estar compreendida entre cerca de 65°C e 75°C no caso das enzimas polimerase de ADN de P. occultum e P. abyssi. O intervalo de tempo necessário para esta síntese pode variar entre cerca de 0,4 minuto e 40 minutos ou mais, dependendo essencialmente da temperatura, do comprimento do ácido nucleico e da enzima. O período de amplificação está compreendido normalmente entre cerca de 30 segundos e três minutos. Se o ácido nucleico for mais comprido irá ser necessário geralmente um intervalo de tempo mais longo para a síntese da cadeia complementar. * Os especialistas na matéria sabem que o processo da RCP é executado mais vulgarmente como processo automático, com uma enzima termostável. Neste processo a temperatura da mistura de reacção varia ciclicamente ao longo de uma região de desnaturação, uma região de recombinação do iniciador e uma região de reacção. Como exemplo de uma máquina especi-ficamente adaptada para ser utilizada como uma enzima termostável refere-se aquela que é comercializada por ‘Perkin Elmer’.

Os especialistas na matéria também devem ter presente o problema da contaminação de uma RCP pelos ácidos nucleicos amplificados provenientes de reacções anteriores. Os métodos para a redução deste problema vêm descritos no pedido de patente de invenção norte--americana com o número de série 609 157, documento que aqui se considera incorporado por referência. A amplificação por RCP pode gerar dímeros ou oligómeros do iniciador, produtos secundários de cadeia dupla que contenham as sequências de diversas moléculas do iniciador unidas topo a topo, cuja produção está negativamente correlacionada com a produção da sequência relevante amplificada. Pode ocorrer a formação de iniciadores não específicos e a formação de dímeros e de oligómeros do iniciador quando todos os reagentes da RCP são misturados, mesmo à temperatura ambiente ou a temperaturas abaixo desta, na ausência dos ciclos tcrmicos e na presença ou na ausência de um ADN relevante. Por exemplo, à temperatura de 37°C o Taq conserva aproximadamente 1 a 2% de actividade, embora a temperatura óptima seja da ordem de 75-80°C. Os métodos para resolver a amplificação não específica e a formação de dímeros do iniciador consistem em isolar pelo menos um reagente em relação aos outros, de uma maneira tal que os reagentes não se juntem todos antes do primeiro ciclo de amplificação. A patente de invenção PCT publicada com o n° WO 91/12342, documento que aqui se considera incorporado por referência, descreve métodos e composições para minimizar a amplificação não especifica e a formação de dímeros do iniciador.

Devido ao facto de a temperatura óptima de crescimento das espécies de Pyrodicthm ser muitíssimo elevada, a presente invenção proporciona composições que podem ser úteis para minimizarem a amplificação não especifica do iniciador. Dito de forma concreta, a temperatura óptima para o crescimento de Pyrodíctium occulíum e P. abyssi é de 100-105°C, aproximadamente 30 a 35°C mais elevada do que a mesma temperatura para o microrganismo Thermus aquaticus, por exemplo. Em consequência, admite-se que a actividade residual das polimerases de ADN de Pyrodictium à temperatura ambiente seja mínima e se possa eliminar a necessidade de isolar pelo menos um reagente antes do primeiro ciclo de RCP. Assim sendo, a presente invenção proporciona o potencial de uma amplificação não especifica reduzida a temperaturas de recombinação não rigorosas numa RCP, sem a utilização de barreiras de cera ou outros meios para isolar os reagentes.

Os especialistas na matéria concluem facilmente que a presente invenção proporciona novas composições para a prática de todos os métodos em que uma polimerase de ADN tenha utilidade. De acordo com uma variante preferível, as enzimas são úteis para amplificar sequências de ácidos nucleicos por RCP. Há outros métodos de amplificação, em particular aqueles que exigem um passo de desnaturação térmica, por exemplo, a RCLP (o mesmo que PLCR) (Barany, 1991, PCR Methods and Applications 1(1):5-13) ou a RCL nos espaços vazios (ver, por exemplo, a patente de invenção PCT publicada com o número 90/01069, cuja publicação foi efectuada a 8 de Fevereiro de 1990), que também irão tirar proveito da presente invenção. Os métodos de sequenciação cíclica (Caruthers et ai, 1989, BioTechniques 2:494-499 e Koop et ai, 1992, BioTechniques 14:442-447, documentos aqui incorporados por referência) irão tirar proveito particularmente das enzimas polimerase de ADN de Pab e de Poc sem actividade de exonuclease de 3 ’ -*5 ’. A presente invenção também proporciona estojos que contêm uma polimerase de ADN termostável da presente invenção, de preferência uma composição enzimática estável que contém a referida polimerase numa solução tampão que compreende um ou vários detergentes poliméricas não iónicos e facultativamente outros reagentes úteis para a execução de uma RCP, por exemplo, um conjunto de iniciadores, de sondas ou de precursores de nucleósido-trifosfatos. A polimerase de ADN de Pyrodictium é muito útil para a realização de diversos processos em que seja útil a amplificação de uma sequência de ácidos nucleicos por reacção em cadeia com polimerase. Tais métodos compreendem a clonagem, a sequenciação de ADN, a transcrição reversa e a RCP assimétrica. Além disso, as enzimas da invenção são adequadas para fins de diagnóstico, forenses e para aplicações de investigação. Seguiilamente são apresentados alguns exemplos apenas a título ilustrativo e com os quais não se pretende de forma alguma limitar o âmbito da invenção tal como reivindicada.

Exemplo 1

Construção de um banco de ADN genómico de Pyrodictium abyssi e identificação do gene da polimerase de Pab por meio de um ensaio da actividade da polixnerase de ADN termostável em manchas de colónias

Foram utilizadas células de Pyrodictium abyssi fornecidas pelo Dr. Karl O. Stetter, das Universidade de Regensburg, Regensburg, Alemanha. O isolado, AVZ (DSM6158) encontra-se descrito no trabalho de Pleyet al, de 1991, ‘System Applied Microbiology 14:245-253’, obra que aqui se considera incorporada por referência. Purificou-se o ADN pelo método descrito por Lawyer et al, 1989, J. Biological Chemistiy 264(11):6427-6437, obra que aqui se considera incorporada por referência Fez-se digerir parcialmente cerca de 25 pg de ADN de Pyrodictium abyssi com a enzima de restrição Sau3AI e fraccionou-se dimensionalmente por electroforese em gel. Foram utilizados 10 ng de fragmentos com um comprimento superior a 3,5 kb e inferior a 8,5 kb para clonagem no local BamHI do vector pUC19 (Clontech, Paio Alto, CA). O vector plasmídico pUC19 tem o promotor lac a montante do local de clonagem BamHI. O promotor pode induzir a expressão heteróloga de sequências promotoras clonadas às quais faltam os blocos de leitura ininterrupta. Os plasmídeos recombinantes foram transformadas dentro de células SURE de E. coli (Stratagene). Genótipo das células SURE®: mcrA, Δ (mcrBC-hsdRMS-mrr) 171, endAl, supE44, thi-1, λ-, gyrA96, relAl, lac, recB, recJ, sbcC, umuC:Tn5(kan®), urvC, (F’, proAB, lacl ΖΔΜ15, TblOftet*]).

Recorreu-se a um ensaio de filtração rápida para detecção da actividade das polimerase de ADN termofílicas e termorresistentes para a pesquisa do banco de ADN genómico de Pyrodictium abyssi (Sagner et al, 1991, Gene 97:119-123, obra que aqui se considera incorporada por referência). De acordo com o método, as colónias recombinantes são ligadas à membrana de nitrocelulose e são incubadas a uma temperatura elevada numa solução tampão de polimerização que contém os dNTP marcados com a[32P], As autorradiografias dos filtros secos permitem identificar directamente as colónias que exprimem a actividadc da polimerase de ADN termofílica. As colónias ligadas à membranas são aquecidas a 95°C para inactivar de forma irreversível as polimerases do ADN do hospedeiro e são depois incubadas a temperaturas elevadas para que seja revelada a presença da actividade de polimerase de ADN termofílica.

Foram aplicadas em placas aproximadamente 500 colónias por cada prato de Petri que ficaram a crescer de um dia para o outro a 37°C. A seguir fez-se uma réplica dessas colónias em placas sobre membranas de nitrocelulose, tendo ficado a crescer durante 4 horas. Voltou--se as membranas com a parte de cima para baixo sobre placas de gelose que foram mantidas durante 20 minutos à temperatura ambiente sobre papeis de filtro embebidos com uma mistura de clorofórmio/tolueno (1:1). As membranas que continham as colónias peimeabilizadas ficaram então a incubar a 95°C durante 5 minutos numa solução tampão de polimerização que continha 50 mM de Tris-HCl apH 8,8, 7 mM de MgCE, 3 mM de β-mercaptoetanol (βΜε), para inactivar toda a actividade de polimerase de ADN não termorresistente (v.g. E. coli). Imediatamente a seguir à inactivação as membranas foram transferidas para a solução tampão de polimerização que continha 50 mM de Tris-HCl a pH 8,8, 7 mM de MgCl2, 3 mM de β-mercaptoetanol (βΜε), 12μΜ de dCTP, 12μΜ de dGTP, 12μΜ de dATP, 12μΜ de dTTP e ot-[32P]-dGTP à razão de 1 pCi por mL. Após a incubação durante 30 minutos a 65°C efectuou-se a lavagem das membranas duas vezes durante 5 minutos numa solução que continha 5% (p/v) de TC A e 1% (p/v) de pirofosfato para se remover todo o a-[j2P]-dGTP não incorporado. Efectuou-se a análise das membranas por autorradiografia a -70°C. Ao fim de 3 dias surgiram 7 clones nas películas de membranas duplicadas impressionadas com o raio X. 38 A partir destes 7 clones efectuou-se o isolamento dos ADN plasmídicos e efectuou-se uma análise de restrição para se determinar o tamanho e a orientação dos fragmentos intercalares, comparativamente com o vector pUC19. A análise da sequência de ADN foi realizada com o maior clone, o pPabl4. Para se obter as sequências preliminares de ADN foram utilizados os iniciadores de sequenciação “universais” directo e inverso, respectivamente números 1212 e 1233, adquiridos a ‘New England BioLabs, Beverly, MA’. A partir da sequência preliminar de ADN foram concebidos outros iniciadores de sequenciação para a obtenção da sequência de ADN de regiões mais internas do segmento intercalar clonado. A análise da sequência de ADN foi realizada para as duas cadeias. .

Exemplo 2

Expressão do gene da polimerase de Pab O plasmídeo pDG168 é um vector ÀPL de clonagem e de expressão que compreende o promotor XPL e o local de ligação ao ribossoma N do gene (ver a patente de invenção norte--americana n° 4 711 845, documento que aqui se considera incorporado por referência), um 1 poliligador do local de restrição posicionado de modo a que as sequências clonadas no poliligador possam ser expressas sob o controlo do XPl-Nrbs e um terminador de transcrição do gene da toxina δ de Bacillus thuringiensis (ver a patente de invenção norte-americana n° 4 666 848, documento que aqui se considera incorporado por referência). O plasmídeo pDG168 também é portador de um gene RNA Π mutacionado que faz com que o plasmídeo seja sensível à temperatura para a série de cópias (ver a patente de invenção norte-americana n° 4 631 257, documento que aqui se considera incorporado por referência) e um gene de resistência a ampicilina em células DG116 da estirpe K21 de E. coli. A construção do plasmídeo pDG168 está descrita na patente de invenção PCT publicada com o número WO 91/09950 a 11 de Julho de 1991, no seu exemplo 6, documento que aqui se considera incorporado por referência).

Estes elementos actuam concertadamente para proporcionarem um vector de expressão útil e poderoso. A 30-32°C o número de cópias do plasmídeo é diminuto e numa célula hospedeira portadora de um gene repressor λ sensível à temperatura, tal como o cI857, o promotor PL não funciona. No entanto, a 37-41°C, o número de cópias do plasmídeo é 25 a 50 vezes maior do que a 30-32°C e o repressor cI857 é inactivado, permitindo que o promotor funcione. Assim, seleccionou-se o pDG168 para a construção de vectores de expressão para a polimerase de ADN do Pab. A análise da sequência de ADN do Pab 14 revelou a existência de um bloco de leitura ininterrupta de 813 aminoácidos com um códão de arranque ATG na posição nucleotídica 869 e com um códão de paragem TGA na posição nucleotídica 3280. A extremidade 5’ do gene de Pab foi mutagenisada com os iniciadores oligonucleotídicos AW397 (SEQ ÍD No. 5) e AW398 (SEQ ID n° 6) por amplificação por RCP (conforme adiante descrito). O iniciador ^AW397 (SEQ ID No. 5) é o iniciador directo que foi concebido para alterar a sequência de ADN do Pab no códão de arranque ATG para se introduzir o local de restrição Ndel. O iniciador AW397 (SEQ ID No. 5) também introduziu mutações no quinto e no sexto codões da sequência do gene da polimerase de Pab para ser mais compatível com o recurso a codões de E. coli, sem modificar a sequência de aminoácidos da proteína codificada. Escolheu-se o iniciador inverso AW398 (SEQ ID No. 6) por forma a conter um local Spel correspondente à posição 174 dos aminoácidos. Além disso, introduziu-se um local Kpnl a seguir ao local Spel. A mistura de RCP continha 10 ng de uma matriz de ADN de pPabl4 linearizado com Sall; 10 pmol de iniciadores AW397 (SEQ ID No. 5) e AW398 (SEQ ID No. 6); 50 μΜ de

40 cada um dos dATP, dCTP, dTTP e dGTP; 2 mM de MgCl2; 10 mM de Tris HC1 a pH 8,3; 50 mM de KC1 e uma unidade de polimerase de Taq em 50 pL de volume de reacção. O perfil térmico da reacção foi de 95°C durante 30 segundos, 65°C durante 30 segundos e 70°C durante 30 segundos, com amplificação durante 12 ciclos. O produto amplificado de 500 pb foi digerido com Ndel e Kpnl e carregado depois sobre um gel de agarose de ‘Seakem’ a 1% (p/v). O fragmento do produto da RCP foi purificado com o estojo ‘Geneclean’ (Bio 101, San Diego, CA) e subclonado no vector de expressão pDG168 que havia sido digerido com Ndel e Kpnl. O clone resultante recebeu a designação de pAWlll. As mutações desejadas foram confirmadas por análise com enzimas de restrição e por análise das sequências de ADN.

Modificou-se a extremidade 3’ do gene da polimerase de Pab por digestão com enzimas de restrição e mediante a utilização de uma hélice dupla oligonucleotídica sintética. Foi concebido um AW399 (SEQID No. 7) em conformidade com a extremidade 3’ do gene (pol) da polimerase de Pab a partir do local AílII na posição 785-786 dos aminoácidos. Também modifica o códão de paragem TGA para TAA. O AW400 (SEQ ID No. 8) é a cadeia complementar do AW399 (SEQ ID No. 7), com a excepção de ter uma extremidade coerente no seu terminal 5’.

I

Quando o AW399 (SEQ ID No. 7) se recombina com o AW400 (SEQ ID No. 8) produz uma hélice dupla sintética de 60 pb com extremidades Aflll/Xmal coerentes em 5’. A hélice dupla foi depois clonada no plasmídeo pPab2 que havia sido digerido com AfiH/Xmal. O plasmídeo resultante recebeu a designação de pAWl 13. O plasmídeo Pab2 foi um dos 7 clones isolados a partir do banco genómico, conforme descrito no Exemplo 1. O plasmídeo Pab2 contém o gene pol de Pab completo, mas é -250 pb mais curto do que o Pab 14 na extremidade 5’. Assim, falta-lhe um local AlfH de flanqueamento da extremidade 5’ que facilitou a estratégia de clonagem de substituição do fragmento AflII-Xmal da exUemidadc 3’ com a hclice dupla

sintética AW399 (SEQ ID No. 7)/AW400 (SEQ ID No. 8), conforme descrito supra. A sequência úe ADN do fragmento substituído foi confirmada por análise das sequências de ADN.

Finalmente, o fragmento de 1,89 kb da região do gene da polimerase de Pab, desde Spel até ao códão de paragem, foi isolado a partir de pAWl 13 por digestão com Spel e Xmal e purificado por electroforese em gel. Ligou-se o fragmento resultante com o plasmídeo pAWl 1 que havia sido digerido com Spel e Xmal.

Os parâmetros de ligação foram os seguintes: ADN à razão de 20 pg/mL, 20 miM de Tris HC1 a pH 7,4, 50 mM de NaCl, 10 mM de MgCk, 40 μΜ de ATP e 0,2 unidade Weiss de ligase de ADN das T4 por cada 20 pL de mistura de reacção a 16°C de um dia para o outro. As ligações foram transformadas dentro de células hospedeiras DG116. Os possíveis candidatos elegíveis foram estudados para se investigar a existência de locais apropriados de enzimas de restrição. O plasmídeo desejado recebeu a designação de pAWl 15.

Os oligonucleótidos utilizados neste exemplo são os que a seguir se indicam. AW397 SEQ ID No. 5 AW398 SEQ ID No. 6 φ AW399 SEQ ID No. 7 AW400 SEQ ID No. 8

5’-GGACCCATATGCCAGAAGCTATTGAATTCGTGCTCC 5 ’-GGCAGGTACCACTAGTTATGTCGGCAATAGGCTC 5’-TTAAGG€AGCATCATCTGGGCATAGGAGTCT-CTTCGACTTCTTCGCGGCAAAGAAGTAAC 5 ’-CCGGGTT ACTT CTTT GC CGCGAAGAAGT C G AAG AG ACT -CCTATGCCCAGATGATGCTGCC

Exemplo 3

Clonagem do gene da polimerase de ADN de Pvrodictium occultum (Poc)

Fez-se digerir ADN genómico de Pab e de Poc (0,5 pg de cada um) com HindlII e efectuou-se a separação por electroforese em gel através de um gel de agarose a 0,8% (p/v). 42

As células de Pyrodictiwn occultum foram fornecidas pelo Dr. Karl O. Stetter da Universidade de Regensburg, Regensburg, Alemanha. Puxificou-se o ADN pelo método descrito por I .awyer et ai, em 1989, na obra J. Biological Chemistry 264(11):6427-6437. que aqui se considera incorporada por referência. Os fragmentos de ADN no gel foram desnaturados por uma solução de NaCl 1,5 M e de NaOH 0,5 M durante 30 minutos e foram neutralizados numa solução de 1 M de Tris-HCl a pH 8,0 e 1,5 M de NaCl durante 30 minutos e foram depois transferidos para uma membrana de ‘nylon’ de tipo “Biodyne” (Pall Biosupport, East Hills, NY), utilizando para tal SSPE 20x (NaCl 3,6 M, NaP04 10 mM a pH 7,4, EDTA 20 mM a pH 7,4). O ADN acoplado à membrana foi depois hibridado com um produto de RCP de 240 pb marcado com 32P que codificou os aminoácidos 515-614 do gene da polimerase de Pab. A solução de pré-hibridação foi SSPE 6x, reagente de Denhardt 5x, 0,5% de DSS (p/v), ADN do esperma de salmão desmembrado e desnaturado à razão de 100 gg/mL. A solução de hi-bridação foi a mesma, com a excepção de se ter utilizado reagente de Denhardt 2x, e continha a sonda amplificada por RCP marcada com P, para uma contagem de 10 cpm. A pré--hibridação e a hibridação foram realizadas ambas a 55°C. A mancha de transferência foi lavada sequencialmente conforme a seguir se indica: SSPE 2x, 0,5% de DSS (p/v), 10 minutos à temperatura ambiente; SSPE 2x, 0,1% de DSS (p/v), 15 minutos à temperatura ambiente; 0,1% de SSPE (p/v), 0,1% de DSS (p/v), 5 minutos à temperatura ambiente.

Surgiu um sinal forte aproximadamente a 3,8 kb na digestão com HindIII. Isto sugeriu que o gene da polimerase da Poc possui homologia com o gene da polimerase da Pab. Em consequência, efectuou-se uma avaliação de diversos iniciadores de RCP, concebidos a partir da sequência do gene da polimerase da Pab, para amplificação de parcelas do gene da polimerase de Poc. Obteve-se um produto de RCP específico com um comprimento de 295 pb numa RCP em que se utilizou o par iniciador LS417 (SEQID No. 34) e LS396 (SEQID No. 35). LS417 SEQIDNo. 34

5’-GATAAAGATAGACAAGGTATAC

LS396 SEQIDNo. 35 5’-CGTATTCCTCGATTCTCTTT

AW394 SEQIDNo. 9 5’-GCTTATAGCCTTGTCCACGTTC

Efectuou-se a RCP com uma concentração final de tampão de RCP IX, 50 μΜ dos dNTP, 0,1 μΜ de cada um dos iniciadores, 1,25 unidades de Taq num volume total de 50pL. O tampão de RCP lx contém 20 mM de Tris a pH 8,4, 50 mM de KC1 e 2 mM de MgCb. A reacção de amplificação decorreu durante 35 ciclos. O produto de RCP de 295 pb foi depois submetido a uma análise das sequências de ADN. O resultado da análise das sequências de ADN demonstrou que o gene da polimerase da Poc tem uma identidade de 78% com o gene da polimerase da Pab nesta região. Foi concebida uma sonda oligonucleotídica AW394 (SEQID No. 9) específica da polimerase de Poc, utilizando para tal os dados da sequência de ADN. Utilizou-se então a sonda AW3904 (SEQ ED No. 9) marcada com 32P para pesquisa de um banco genómico de ADN de Poc para se obter os clones de polimerase de Poc. A construção do banco genómico de BNM de Poc foi feita como descrito no exemplo 1 para o banco genómico de ADN de Páb.

Foram seleccionadas cerca de 5 500 colónias resistentes à ampicilina, sobre filtros de nitrocelulose, e foram hibridadas com a sonda AW394 (SEQ ID No. 9) marcada com 32P. Isolou-se o ADN plasmídico a partir de 7 colónias que hibridaram com a sonda. As condições de pré-hibridação e de hibridação foram as anteriormente descritas. As condições de lavagem foram as seguintes: SSPE 6x, 0,1% de DSS (p/v) duranle 5 minutos à temperatura ambiente e depois SSPE 2x, 0,1% de DSS (p/v) durante 15 minutos a 55°C. Efectuou-se a análise pelas enzimas de restrição e a análise por RCP para se determinar o tamanho e a orientação do fragmento intercalar, comparativamente com o vector pUC19. Os resultados revelaram que o 44 pPoc 3 e o pPoc5 são clones idênticos. Os comprimentos da região de codificação, da região não traduzida da extremidade 5’ e da região não traduzida da extremidade 3’ de todos os clones de polimerase de Poc identificados estão indicados a seguir. Região de codificação Extremidade 5 ’ Extremidade 3’ pPocl 1,9 kb 0 3,6 kb pPoc2 1,9 kb 0 4,2 kb pPoc4 2,4 kb 0,4 kb 0,7 kb pPoc5 0,35 kb 0 4,5 kb pPocó 0,35 kb 0 3,2 kb pPoc8 0,7 kb 3 kb 0

Efectuou-se a análise das sequências de ADN no pPoc4. Foraim utilizados iniciadores de sequenciação universal e inversa para se obter informação preliminar sobre as sequências de ADN. A partir desta sequência de ADN foram concebidos outros iniciadores de sequenciação para se obter a sequência de ADN de regiões mais internas do fragmento intercalar. A análise das sequências de ADN foi efectuada para as duas cadeias.

Exemplo 4

Expressão de gene da polimerase de Poc

Realizou-se a mutagénese da extremidade 5’ do gene da polimerase de Poc no plasmídeo pPoc4 com os iniciadores oligonucleotídicos AW408 (SEQ ID No. 10) e AW409A (SEQ ID No. 11) por amplificação por RCP. O iniciador AW408 (SEQ ED No. 10) é um iniciador directo concebido para alterar a sequência de ADN do gene de Poc no códlo de arranque ATG para a introdução de um local de restrição Nsil. O iniciador AW408 (SEQ ID No. 10) também foi concebido para introduzir alterações no segundo, terceiro, quinto e sexto codões do gene de

Poc para proporcionar uma sequência mais compatível com o emprego de codões de E. coli sem modificação da sequência de aminoácidos da proteína codificada. Escolheu-se o iniciador inverso AW409A (SEQ ID No. 11) por forma a conter o local Xbal na posição 38 dos aminoácidos. Além disso, introduziu-se o local Kpnl a seguir ao local Xbal para subclonagem subsequente.

Utilizou-se o plasmídeo pPoc4, linearizado com Kpnl como matriz de RCP para amplificação, utilizando o par de iniciadores AW408 (SEQ ID No. 10)/AW409A (SEQ ID No. 11), assim se gerando um produto de RCP de 138 pb. O procedimento de amplificação por RCP foi o descrito anteriormente no Exemplo 2. O fragmento amplificado foi digerido com Nsil e depois tratado com Klenow para se criar uma extremidade de pontas a condizer no terminal clivado com Nsil e finalmente fez-se digerir com Kpnl. O fragmento rèsultante foi ligado ao vector de expressão pDG164 (que está descrito minuciosamente na patente de invenção PCT publicada com o número WO 91/09950, no seu exemplo 6B, documento que aqui se considera incorporado por referência), que havia sido digerido com Ndel, refeito com Klenow para preenchimento no apêndice e para gerar uma extremidade de pontas a condizer para ligação, e depois fez-se ► digerir com Kpnl. A ligação proporcionou uma sequência codificadora concatenada da extremidade 5’ do gene da polimerase de Poc sob controlo do promotor APL e do local de ligação ribossómico do gene 10 do bacteriófago T7. O arquétipo resultante recebeu a designação de pAW118.

Para se efectuar a subclonagem da extremidade 3’ do gene da polimerase da Poc introduziu-se o local Kpnl a seguir ao códão de paragem. Isto foi executado por um processo de RCP, conforme a seguir se descreve. Escolheu-se um iniciador directo por forma a conter um local EspI na posição 698-699 dos aminoácidos e concebeu-se o iniciador inverso por

46 forma a incorporar um local Kpnl imediatamente a seguir a um còdão de paragem alterado (TAA). O fragmento de 335 pb amplificado foi digerido com EspI e Kpnl e clonado num plasmídeo pPoc digerido com EspI e Kpnl. O arquétipo resultante recebeu a designação de pAW120.

Finalmente, a região Xbal do gene pol de Poc, através do códão de paragem, foi isolada a partir de pAW120 por digestão com Xbal e Kpnl. O fragmento resultante de 2,3 kb foi ligado ao pAWl 18 que havia sido digerido Xba e Kpnl. O produto de ligação foi transformado dentro de células hospedeiras DG116 para efeitos de expressão e recebeu a designação de pAW 121.

Os oligonucleótidos utilizados neste exemplo são os que a seguir se indica.

AW408 SEQID No. 10 GGACCATGCATGACTGAAACTATTGAATTCGTGCTG AW401A SEQIDNo.il GGAAGGTACCTGATCATCTAGAAGCAC GACACGTT AW410 SEQ ID No. 12 GGAAGCTGAGCAAGAGGATAGAGG AW411A SEQ ID No. 13 GGAAGGTACCTTATTTCTTTGAGGCGAAGAAG

Exemplo 5

Expressão do gene pol de Pab e do gene pol de Poc no vector do promotor de triptofano Tanto o gene pol de Pab como gene pol de Poc podem ser excessivamente expressos sob o controlo do promotor de Trp de E coli. Realizou-se a construção dos clones de expressão do modo seguinte: o promotor ÀPL no clone de expressão, pAW115, foi substituído por sequências do promotor de Trp que foram geradas por amplificação de RCP, utilizando o plasmídeo pLSG140 (o plasmídeo pLSGlO está descrito na patente de inyenção norte-americana n° 5 079 352, documento que aqui se considera incorporado por referência), que serviu de matriz, e utilizando também os iniciadores AW500 (SEQ ED No. 15) e AW501 (SEQ ED No. 15). O produto de RCP resultante foi digerido com NspV e Ndel e clonado no pAWll5 digerido

com NspV e Ndel para dar origem a um clone de expressão de pol do Pab, o pAWl 18, sob o controlo do promotor de Tip de E. coli. A existência de um local interno Ndel no gene pol do Poc de pAW121 complica a permuta do fragmento promotor de XPl digerido com NspV-Ndel e do fragmento promotor de Trp. Assim sendo, foram concebidos os iniciadores AW500 (SEQ 1D No. 14) e AW502 (SEQ ID No. 16) para amplificar o fragmento da sequência do promotor de Trp a partir de pLSGlO e foram concebidos os iniciadores AW503 (SEQ ID No. 17) e AW5G4 (SEQ ID No. 18) para amplificar o fragmento de Ndel-Xbal de 110 pb da extremidade 5’ a partir do pAW121. Os iniciadores AW502 (SEQ ID No. 16) e AW503 (SEQ ID No. 17) sobrepõem-se em 9 nucleótidos. Utilizando a RCP de prolongamento da sobreposição realizou-se a fusão do fragmento do promotor de Trp e dos fragmentos de 110 pb da extremidade 5’. O produto de RCP resultante foi digerido com NspV e Xbal e clonado no pAW121 que havia sido digerido com NspV e Xbal. O clone de expressão pol de Poc resultante recebeu a designação de pAW 123.

AW500 SEQ DD No. 14 TTTTTCGAAAGAAGAAAAAACC AW501 SEQ ID No. 15 TCTCATATGCTTATCGATACCC AW502 SEQ 3D No. 16 CATAAGCTT ATCGATACCCTT AW503 SEQ ID No. 17 AAGCTTATGACAGAGACTATAGAGTT AW504 SEQ ID No. 18 GTGGTCTAGAAGCACGACACGT

Exemplo 6

Avaliação da actividade da exonuclease de 3’ e 5’: Um ensaio de fidelidade Devido aos níveis extraordinários de amplificação conseguidos com o processo de RCP (da ordem de 1011 a 6 xlO12), para determinadas aplicações a exactidão da replicação (fidelidade)

t-

é importante. A fidelidade da RCP baseia-se num processo de dois passos: má inserção e má amplificação. Sc a polimerase do ADN inserir uma base incorrecta e o terminal resultante mal produzido em 3’ não for ampliado, este produto de amplificação truncado não pode ser amplificado uma vez que o local de ligação para o iniciador de jusante não se encontra presente. As polimerases do ADN amplificam um terminal 3’ mal produzido mais lentamente do que um terminal 3’ bem produzido. Além disso, os diferentes erros multiplicam-se a velocidades incomportáveis. Ver Kwok et ai, 1990, Nuc. Acids Res. 18:999-1005 e Huang et ai, 1992, Nuc. Acids res. 20:4567-4573.

As polimerases de ADN com actividade inerente correctora ou de exonuclease de 3’ para 5’ são capazes de melhorar a fidelidade mediante a remoção das bases mal inseridas antes da amplificação. Engendrou-se uma RCP conveniente e um ensaio de digestão com endonucleases de restrição para se avaliar a capacidade das polimerases de ADN com actividade de exonuclease de 3’ para 5’ para remoção dos nucleótidos mal inseridos no terminal 3’ antes da amplificação errónea. Foram concebidos vários iniciadores que foram quer perfeitamente aplicados quer imperfeitamente aplicados em 3’ (com cada combinação possível) ao primeiro nucleótido da sequência de reconhecimento da enzima de restrição BamHI no gene da polimerase do ADN do Therrmts aquaticus (Lawyer et al., 1989, J. Biol. Chem. 264:6427-6437 e patente de invenção norte-americana n° 5 079 352). Os iniciadores perfeitamente adaptados, o FR434 (SEQ ID No. 29) e o FR438 (SEQ ID No. 33), amplificam um produto de 151 pb que é completamente digerido com a enzima de restrição BamHI para gerar fragmentos de ADN de 132 pb e de 19 pb. O nucleótido do terminal 3’ do iniciador directo FR434 (SEQ ID No. 29) corresponde ao nucleótido 1778 do gene pol do ADN de Taq. Os iniciadores directos FR435 (SEQ ID No. 30), FR436 (SEQ ID No. 31) e FR437 (SEQ ID No. 32) possuem um único erro no terminal 3’ comparativamente com os produtos de amplificação do gene pol do ADN de Taq de tipo natural e

com o iniciador FR438 (SEQID No. 33) de tipo natural, correspondente respectivamente aos desemparelhamentos A:C, T:C e C:C. Qualquer incorrecção ou má amplificação a partir dos iniciadores FR 435 (SEQ ID No. 30), FR436 (SEQ ID No. 31) ou FR437 (SEQ ID No. 32) elimina o local de reconhecimento BamHI correspondente aos nucleótidos 1778 - 1783 do gene pol do ADN de Taq. Em alternativa, a correcção exonucleolítica remove os nucleótidos no terminal 3’ e permite a incorporação do resíduo correcto dG, daí resultando a acumulação de produtos de RCP que contêm agora o local da enzima de restrição BamHI de diagnóstico. Uma vez que a totalidade dos iniciadores FR435 (SEQ ID No. 30), FR436 (SEQ ID No. 31) ou FR437 (SEQ ID No. 32) estão desemparelhados no alvo original, este ensaio de digestão com endonuclease/RCP exige uma correcção exonucleolítica em cada ciclo para correcção dos iniciadores “mutantes” e para gerar um produto de RCP que contenha o local de clivagem BamHI de diagnóstico. A má amplificação que tem lugar em cada ciclo irá gerar uma matriz eficientemente copiada (agora mutante) no ciclo subsequente (a partir do prolongamento do iniciador FR438 (SEQ ID No. 33) que está perfeitamente adaptada à totalidade dos iniciadores da experiência. FR434 SEQ ID No. 29 5’-GCACCCCGCTTGGGCAGAG FR435 SEQ ID No. 30 5-GCACCCCGCTTGGGCAGAA FR436 SEQ ID No. 31 5'-GCACCCCGCTTGGGCAGAT FR437 SEQ ID No. 32 5'-GCACCCCGCTTGGGCAGAÇ FR438 SEQ ID No. 33 5'-TCCCGCCCCTCCTGGAAGAC O iniciador FR434 (SEQ ID No. 29) corresponde identicamente aos nucleótidos 1760 a 1778 do gene da polimérase do ADN de Taq e o iniciador FR438 (SEQ ID No. 33) é complementar dos nucleótidos 1891 a 1910 do gene da polimerase do ADN de Taq. Os iniciadores

/ 50 FR435 (SEQID No. 30), FR436 (SEQ ID No. 31) e FR437 (SEQ ID No. 32) correspondem identicamente aos nucleótidos 1760 a 1777 do gene da polimerase do ADN de Taq e contêm o nucleótido eirado no terminal 3’ que está indicado por asterisco e sublinhado na posição 1778.

As polimerases de ADN de Pab e de Poc recombinantes foram purificadas a partir das Células DG116 da estirpe kl2 de E. coli que alojam rcspectívamente os plasmídeos pAWl 15 ou pAW 121. A purificação implicou uma citólise, o tratamento térmico a 75-85°C, a precipitação da massa de ácidos nucleicos com Polimina P, a cromatografia em ‘Phenil Sepharose’ e a φ cromatografia em ‘Heparin Sepharose’, em conformidade com o Exemplo 9.

Recorrendo a este ensaio de fidelidade, as polimerases de ADN de Pab e de Poc recombinantes de tipo natural são capazes de corrigir os erros dos iniciadores FR435 (SEQ ED No. 30), FR436 (SEQ ID No. 31) e FR437 (SEQ ED No. 32) para gerarem um produto de RCP que contém o necessário local de clivagem BamHI, demonstrando a presença de actividade correctora exonucleolítica de 3’ para 5’.

Exemplo 7

Produção de mutantes de pol de Pab e de pol de Poc com actividade de exonuclease de 3’-> 5’ Foram construídos os genes pol de Pab e de Poc a que faltava a actividade da exonuclease de 3’ para 5’, recorrendo para tal à mutagénese dirigida ao local por RCP de amplificação da sobreposição para alterar os codões para Aspl87 e Glul89 para codificar a alanina. Dito de forma abreviada, a mutagénese por RCP de amplificação da sobreposição implica a geração de fragmentos de ADN, devido a terem incorporado iniciadores oligonucleotídicos complementares em RCP independentes (ver Higuchi et al., 1988. Nuc. Acids Res. 16:7351-7367 e Ho et ai, 1989, Gene 77:51-59, documentos que aqui se consideram incorporados por referencia,

como descrição minuciosa deste método). De acordo o método, estes fragmentos são combinados numa reacção subsequente de “fusão” em que as extremidades sobrepostas se recombinam, permitindo que a sobreposição em 3’ de cada cadeia sirva de iniciador para a amplificação de 3’ da cadeia complementar. O produto de fusão resultante é amplificado ainda mais por RCP. É possível introduzir alterações específicas na sequência nucleotídica, introduzindo substituições de nucleótidos nos iniciadores oligonucleotídicos sobrepostos.

A construção de um mutante de Pab sem actividade de exonuclease de 3’-> 5’ foi realizada conforme a seguir se descreve. Foram concebidos dois iniciadores sobrepostos AW493 (SEQ ID No. 20) e AW494 (SEQ ED No. 21) de modo a abrangerem Aspl87 e Glul89, em que tanto Aspl87 como Glul89 são substituídos por alanina. Os dois iniciadores externos AW492 (SEQ ID No. 19) e AW495 (SEQ ID No. 22) foram escolhidos por forma a ficarem localizados nos locais de restrição únicos Spel e Nsil respectivamente da posição 174-175 dos aminoácidos e na posição 304-305 dos aminoácidos, fazendo pois com que fosse possível ligar de novo o produto de fusão dentro do vector de expressão. Os produtos provenientes da RCP, utilizando os conjuntos de iniciadores AW492 (SEQ ID No. 19)/AW493 (SEQ ID No. 29) e AW494 (SEQ ID No. 21)/AW495 (SEQ ID No. 22), foram respectivamente os fragmentos de 70 pb e de 373 pb. Os dois fragmentos resultantes (sobreposição de 27 nucleótidos em 3’) foram fundidos, tendo sido desnaturados e recombinados numa reacção posterior de amplificação do iniciador. O produto de fusão de 416 pb foi amplificado ainda mais por RCP, utilizando os dois iniciadores externos AW492 (SEQ ID No. 19) e AW495 (SEQ ID No. 22). O fragmento mutagenízado de 416 pb foi depois cortado com Spel e Nsil e ligado de novo dentro do clone progenitor pAW115 que havia sido digerido também com Spel e Nsil. O clone mutante resultante recebeu a designação de ‘pexo-Pab’ e as mutações desejadas foram confirmadas por análise das sequências.

52

Constxuiu-se de igual modo o mutante de Poc sem actividade de exonuclease de 5’-» 3’, utilizando a mesma metodologia. O par de iniciadores em sobreposição que foi utilizado para a introdução da mutação é constituído por AW489 (SEQID No. 24) e AW490 (SEQ DD No. 25). Os dois iniciadores externos AW488 (SEQ ID No. 23) e AW491 (SEQ ED No. 26) estão localizados nos locais de restrição únicos Xbal e BssHII respectivamente nas posições 37-39 e 260-262 dos axninoáddos. Os produtos da RCP, utilizando os conjuntos de iniciadores AW488 (SEQ ED No. 23)/AW489 (SEQ ID No. 24) e AW490 (SEQ ED No. 25)/AW491 (SEQ ED No. ^ 26), foram respectivamente os fragmentos de 476 pb e de 243 pb. Estes dois fragmentos foram fundidos e submetidos a tuna amplificação por RCP utilizando os iniciadores externos AW488 (SEQ ED No. 23) e AW491 (SEQ ED No. 26). O fragmento mutagenizado foi depois cortado com Xbal e BssHII e ligado de novo dentro do clone progenitor pAW121. O clone mutante resultante recebeu a designação de ‘pexo-Poc’.

As actividades de exonuclease da polimerase do ADN do ‘exo-Pab’ e da polimerase do ADN do ‘exo-Poc’ foram determinadas recorrendo ao ensaio de correcção da incorporação de erros. Os resultados comprovaram que faltava a actividade de exonuclease de 3’-> 5’ tanto ao ^pol de exo-Pab como ao pol de exo-Poc.

AW492 SEQ ID No. 19 5'-TATTGCCGACATAACTAGTATAGA

AW493 SEQ ID No. 20 5'-ACTGTAGACCGCGATCGCGAACGCGAGC

AW494 SEQ ID No. 21 5’-CTCGCGTTCGCGATCGCGGTCTACAGTAAGAGAG

AW495 SEQ ID No. 22 5-TTATCTCATGCATTTCCTCC

AW488 SEQ ID No. 23 5-GTGTCGTGCTTCTAGACCA

AW489 SEQ ID No. 24 5-GCTATACACCGCGATCGCAAAAGCTACCAGC

AW490 SEQ ID No. 25 5'-GGTAGCTTTTGCGATCGCGGTGTATAGCAGGA

AW491 SEQ ID No. 26 5-TACGGGCGCGCTCCATTAG

Exemplo 8

Comparação da termostahilidade do pol de Pab. do pol de Poc e do pol de Taq na RCP A temperatura superior do crescimento de Pyrodictium do género hipertermofílico é de 110°C. Para se testar a termostabilidade do pol de Pab, do pol de Poc e do pol de Taq recombmantes purificados, no processo de RCP, foi realizada a experiência a seguir descrita. Utilizou-se 0,1 pg, 1 pg e 10 pg de ADN de MI3 (New England Biolabs, Beverly, MA) como matrizes para a análise por RCP por meio de Pab, Poc e Taq. As reacções foram submetidas a 25, 30, 35 e 40 ciclos de temperaturas de desnaturação de 95°C ou de 100°C. Foi gerado um produto de 350 pb por RCP utilizando os iniciadores BW36 (SEQ ED No. 27) e BW42 (SEQEDNo. 28).

BW36 SEQ IDNo. 27 5-CCGATAGTTTGAGTTCTTCTACTCAGGC

BW42 SEQ ID No. 28 5'-GAAGAAAGCGAAAGGAGCGGGCGCTAGGGC

Realizou-se a RCP com uma concentração final de tampão de RCP lx, 50 μΜ dos dNTP, 0,1 μΜ de cada um dos iniciadores, 0,25 unidades de Pab ou 0,1 unidades de Poc ou 1,25 unidades de Taq num volume total de reacção de 50pL.

Define-se uma unidade de polimerase do ADN de Pab e define-se uma unidade de polimerase do ADN de Poc, tal como sucede com a polimerase do ADN de Taq, como sendo a quantidade de enzima que irá incorporar 10 nmoles dos dNTP totais no material insolúvel em ácidos, durante 30 minutos a 74°C. As polimerases dos ADN de Poc e de Pab foram investigadas conforme descrito na patente de invenção norte-americana n° 4 889 818, documento que aqui se considera incorporado por referência, a propósito da polimerase do ADN de Taq, com as seguintes modificações dos componentes de reacção. Polimerase do ADN de Pab: Tris-HCl a pH 8,3 (25°C), 100 mM de KC1, 5 mM de MgCK Polimerase do

ADN de Poc: Tris-HCl a pH 8,0 (25°C), 10 mM de KC1, 5 mM de MgCl2. O tampão de RCP lx para o Pab contém: 20 mM de Tris-HCl a pH 8,4,100 mM de KCI, 1,5 mM de MgCl2- O tampão de RCP lx para o Poc contém: 20 mM de Tris-HCl a pH 8,4,10 mM de KCI, 1,0 mM de MgCl2. O tampão de RCP lx para o Taq contém: 20 mM de Tris a pH 8,4, 50 mM de KCI, 1,5 mM de MgCl2. O perfil de amplificação implicou a desnaturação a 95°C ou a 100°C durante 30 segundos e a recombinação e a amplificação do iniciador a 55°C durante 30 segundos. Os resultados comprovam que tanto o pol do Pab como o pol de Poc foram extraordinariamente termoiresistentes, funcionando eficientemente na RCP com temperaturas de desnaturação até 100°C. Pelo contrário, o pol de Taq não produziu nenhum produto nestas condições a 100°C.

Exemplo 9

Purificação da polimerase do ADN de Pyrodictium recombinante Purificou-se a polimerase do ADN de Pyrodictium recombinante conforme a seguir se descreve. Dito de forma abreviada, efectuou-se o descongelamento de células em 1 volume de tampão TE (50 mM de Tris-HCl a pH 7,5 e 1,0 mM de EDTA com 1 mM de DTT) e juntou-se os inibidores das proteases (FPMS [fluoreto de fenil-metd-sulfonilo] até à concentração de 2,4 mM, leupeptina à razão de 1 pg/mL e TLCK [cloridrato de (-)-l-cloro-3-tosilamido-7--amino-2-heptanona] até à concentração de 0,2 mM). Efectuou-se a lise das células num com-partimento de uma prensa continental ‘Aminco’ à pressão de 20000 psi e tratou-se com ultra-sons para reduzir a viscosidade. O produto tratado com ultra-sons foi diluído com tampão TE e inibidores de proteases até se obter uma massa de células com um peso húmido 5,5 x (ffacção I), ajustou-se para a concentração de 0,2 M de sulfato de amónio, levou-se rapidamente para a temperatura de 85°C e manteve-se a essa temperatura de 85°C durante 15 -7

minutos. O sobrenadante tratado termicamente foi rapidamente arrefecido para 0°C e efectuou-se a remoção das membranas das células de E. coli e das proteínas desnaturadas a seguir à centrifugação a 20000 x g durante 30 minutos. Recuperou-se e guardou-se o sobrenadante (Fracção Π) que continha a polimerase de ADN de Pyrodictium. Determina-se o nível necessário de Polimina P para fazer precipitar mais de 95% dos ácidos nucleicos por um processo de precipitação experimental (normalmente no intervalo entre 0,6% e 1% p/v). Acrescenta-se lentamente a quantidade desejada de Polimina P com agitação rápida a 0°C durante 30 minutos e depois efectua-se a centrifugação da suspensão a 20000 x g durante 30 minutos para se remover os ácidos nucleicos precipitados. Recuperou-se e guardou-se o sobrenadante (Fracção ΙΠ) que continha a polimerase de ADN de Pyrodictium.

Ajusta-se a Fracção ΙΠ para a concentração 0,3 M de sulfato de amónio e aplica-se a uma coluna de ‘Phenil-Sepharose’ que havia sido equilibrada em 50 mM de Tris-HCl a pH 7,5, 0,3 M de sulfato de amónio, 10 mM de EDTA e 1 mM de DTT. Lava-se a coluna com 2 a 4 volumes de coluna do mesmo tampão (A2so relativamente à linha de referência) e depois com 1 ou 2 volumes de coluna de tampão TE contendo 50 mM de KC1 para se remover as proteínas de E. coli mais contaminantes. Seguidamente efectua-se a eluição da polimerase de ADN de Pyrodictium, a partir da coluna, com uma solução tampão que contém 50 mM de Tris-HCl a pH 7,5, 2 M de ureia, 20% (p/v) de etileno-glicol, 10 mM de EDTA e 1 mM de DTT e junta-se as fraeções que contêm actividade de polimerase de ADN (fracção IV).

Consegue-se a purificação final da polimerase de ADN de Pyrodictium recombinante recorrendo à cromatografia em coluna de ‘Heparin-Sepharose’, à cromatografía de permuta aniónica ou à cromatografia em coluna de azul-de-‘Affiger. A polimerase do ADN de Pyrodictium recombinante pode ser submetida a uma operação de diafiltração em tampão de armazenagem 2,5x (50 mM de Tris-HCl a pH 8,0, 250 mM de KC1, 2,5 mM de DTT, 0,25 mM de F.DTA, 0,5% (p/v) de Tween 20), combinado com 1,5 volumes de glicerol estéril a 80% (p/v), sendo guardada a -20°C.

Exemplo 10

Termostabilidade da polimerase do ADN de Pvrodictium occultum Avaliou-se a estabilidade térmica da polimerase do ADN de Pyrodictium occultum medindo a sua actividade após incubações a 100°C durante intervalos de tempo variáveis. Efectuou-se a incubação da polimerase do ADN numa mistura concebida para simular as condições de amplificação por RCP, mas escolhida por forma a que não ocorresse a síntese de nenhum ADN. A mistura enzimática continha os seguintes reagentes: 10 mM de Tris-HCl a pH 8,0 50 mM de KC1 200 μΜ de dATP 1 mM de MgCl2 0,1 pg de ADN de cadeia simples 20 pmol de iniciador (oligómero de 30 bases)

Para se medir a actividade juntou-se 5 pL da mistura enzimática incubada a 45 pL da mistura de reacção constituída pelos reagentes seguintes: 10 mM de Tris a pH 8,0 6 mM de MgCl2 75 mM de KC1 1 mM de β-mercaptoetanol

200 pM de cada dATP, dTTP e dGTP

200 pg de [a-33P]dCTP 2,5 pg de ADN de esperma de salmão activado

Mediu-se a actividade como sendo a quantidade de dNMP incorporado em 10 minutos a 75°C.

Numa das experiências as incubações foram realizadas durante 0, 1, 2 e 4 horas. As misturas de reacção incubadas durante menos de 4 horas foram conservadas em gelo até estarem completas todas as incubações, pelo que todos os ensaios sobre actividade foram realizados conjuntamente. As actividades medidas estão indicadas a seguir e representam a fracção da actividade inicial que resta após cada incubação a temperatura elevada.

Horas Actividade relativa (%) 1 2 4 93 116 104

Efectuou-se uma experiência semelhante utilizando incubações com as durações de 0, 1, 2, 3, 4, 6, 7 e 8 horas a 100°C, estando o$ resultados indicados no quadro seguinte.

Actividade relativa (%) 86 82 86 67 82 104 104

Horas 1 2 3 4 6 7 8 Não foi observada nenhuma perda detectável de actividade mesmo ao fim de uma incubação de 8 horas a 100°C. Admite-se que seja idêntica a estabilidade térmica da polimerase de ADN de Pyrodictium abyssi.

Exemplo 11

Mutantes por supressão sem actividade de exonuclease Foram criadas polimerases de ADN mutantes por supressão no terminal amino (N), às quais faltava actividade de exonuclease mas que conservavam a actividade de polimerase. Foram produzidas três polimerase de ADN de Pab “mini” nas quais foram suprimidos 366, 386 e 403 aminoácidos, dando origem respectivamente a proteínas de 48,46 e 44 quilodalton (kDa). Os genes das polimerases mutantes foram criados e exprimidos conforme a seguir se descreve, i As subsequências das sequências de comprimento completo que codificam a polimerase de ADN de Pab foram amplificadas a partir do plasmídeo de expressão pAWl 15, tendo sido utilizados para tal os iniciadores indicados adiante. Cada um dos iniciadores de montante, AW594, AW593 e AW576, introduz um códão de arranque ATG, introduz um local de restrição Ndel antes do códão de arranque ATG e introduz algumas alterações nos primeiros 6 códões para proporcionar uma sequência mais compatível com o recurso a códões de E. coli sem modificação da sequência de aminoácidos da proteína codificada. O iniciador AW594 introduz o códão de arranque ATG entre as posições 367 e 368 dos aminoácidos, dando ^origem a um mutante por supressão de 366 aminoácidos. De igual forma, o iniciador AW593 introduz o códão de arranque ATG entre as posições 387 e 388 dos aminoácidos, daí resultando um mutante por supressão de 386 aminoácidos, e o iniciador AW576 introduz o códão de arranque ATG entre as posições 404 e 405 dos aminoácidos, daí resultando um mutante por supressão de 403 aminoácidos. Utilizou-se um iniciador de jusante simples, o AW577, para cada amplificação, que contém um local Apa I correspondente à posição 454 dos aminoácidos. As sequências dos iniciadores estão indicadas a seguir, sendo apresentadas de 5’ para 3’.

Iniciador SEOIDNo. Sequência AW594 36 TTCGCATATGCCATTTGCAATACAACTTTCGACAGTAACC AW593 37 TTCGCATATGGGTGTAGGTTTTCGTCTAGAATGGTAC AW576 38 CGCATATGAACGAACTGGTTCCCAACCGTGTCAAG AW577 39 GTCAGGGCCCACATTGTACTT

Cada amplificação foi realizada num volume de reacção de 50 pL, tendo sido utilizada como matriz uma quantidade de 100 pg de pAW115 linearizado, nas condições seguintes: 10 pmol de cada iniciador; 50 μΜ de cada dNTP, 1,5 mM de MgCb; 10 mM de Tris-HCl a ^pH 8,8; 10 mM de KC1 e 1 unidade de polimerase de ADN de UITma (Peridn Elmer, Norwlak, CT). O perfil de temperaturas para a amplificação foi de 20 ciclos, tendo consistido cada um deles num período de 30 segundos a 95°C e 30 segundos a 55°C.

Os produtos amplificados foram digeridos com Ndel e Apal e purificados por electro-forese em gel de agarose. Os produtos purificados foram clonados no pAW115 que havia sido digerido com Ndel e Apal, substituindo assim o fragmento original de 1364 bases com qualquer dos fragmentos intercalares amplificados de 266, 206 ou 155 bases. Os clones resultantes ^receberam as designações de pAW126 (mutante por supressão de 403 aminoácidos), pAW129 (mutante por supressão de 386 aminoácidos) e pAW130 (mutante por supressão de 366 aminoácidos). As sequências de ADN dos fragmentos substituídos foram confirmadas por anáhse das sequências de ADN.

Cada um dos vectores de expressão resultantes foi expresso em E. coli, essencialmente coníòime descrito nos exemplos anteriores. A expressão das proteínas de 48 kDa e dc 46 kDa foi moderada, ao passo que a expressão da proteína de 44 kDa foi bastante elevada. Os extractos impuros tratados termicamente, de cada proteína, revelaram actividade de polimerase, tendo sido utilizado para isso o ensaio de actividade descrito no Exemplo 10.

Depósitos na instituição ATCC 0 bacteriófago e as estirpes bacterianas a seguir indicadas foram depositados na Colecção Americana de Culturas Tipo, 12301 Parldawn drive, Rockville, Maryland, E.U.A. (‘ATCC’). Estes depósitos foram efectuados ao abrigo do disposto no Tratado de Budapeste Sobre o Reconhecimento Internacional de Depósitos de Microrganismos para Efeitos de Procedimentos de Patentes de Invenção e tendo em conta os regulamentos subjacentes (Tratado de Budapeste). Isto garante a manutenção de uma cultura viável durante 30 anos a partir da data de depósito. Os organismos podem ser facultados pela instituição ‘ATCC’ nos termos do Tratado de Budapeste e sujeitos a um acordo entre os requerentes e a instituição ‘ATCC’ que garanta uma disponibilidade sem restrições depois de concedida a pertinente patente de invenção norte--americana e/ou a publicação de patentes de invenção estrangeiras ou de pedidos de patentes de invenção estrangeiras. A disponibilidade das estirpes depositadas não deve ser tomada como uma licença para a prática da invenção em contravenção com os direitos garantidos pela autoridade de qualquer governo, em conformidade com as leis sobre patentes de invenção.

Designação do depósito ATCC N° Data do depósito PPabl4 69310 05/11/93 pPoc4 69309 05/11/93

Considera-se que a memória descritiva anterior é suficiente para habilitar um especialista na matéria a praticar a presente invenção. A presente invenção não fica limitada no seu âmbito pelas linhagens celulares depositadas, uma vez que o caso respeitante à variante depositada tem apenas o intuito de ilustrar de forma simples um dos aspectos da invenção e todas as linhagens celulares que sejam fimcionalmente equivalentes são consideradas como pertencentes ao âmbito desta invenção. O depósito de materiais ali efectuado não significa que se admita

que a memória descritiva aqui apresentada seja inadequada para permitir a prática de qualquer aspecto da invenção, incluindo o melhor modo para a sua prática, nem tão pouco são depósitos efectuados com o intuito de limitar o âmbito das reivindicações às ilustrações específicas que representam. Com efeito, há várias modificações da invenção, para além daquelas que aqui forain descritas, que são evidentes para os especialistas na matéria a partir da memória descritiva anterior e que se consideram abrangidas no âmbito das reivindicações anexas.

LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE:

(A) NOME: F. Hoffmann-La Roche AG (B) RUA: Grenzacherstrasse 124 (C) CIDADE: Basel

(D) ESTADO: BS (E) PAÍS: Suíça (F) CÓDIGO POSTAL: CH-4002 (G) TELEFONE: (0) 61 688 24 03 (H) TELEFAX: (0) 61 688 13 95 (I) TELEX: 962292/965542 hlr ch (ii) TÍTULO DA INVENÇÃO: (iii) NÚMERO DE SEQUÊNCIAS: 39 · (iv) FORMA LEGÍVEL POR COMPUTADOR: (A) SUPORTE: disquete

(B) COMPUTADOR: CP compatível com IBM

(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) PROGRAMA INFORMÁTICO: Patentln Release #1.0, Versão #1.25 (EPO) (vi) DADOS ANTERIORES DO PEDIDO: (A) NÚMERO DO PEDIDO: US 08/062 368 (B) DATA DE DEPÓSITO: 14-MAI-1993 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: I: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2430 pares de bases (B) TIPO: ácido nucleico <7 63 (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TEPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1: ATGCCAGAAG CTATAGAGTT CGIGCTCCTr GATTCAAGCT ACGAGATTGT AGGGAAAGAG 60 CCGGTAATCA TACTATGGGG TGrTAACGCTA GACGGTAAAC GCATAGTCCT ACTTGATAGG 120 AGGTTTAGGC CCTACITCTA TGCACTCATA TCCCGCGACT ACGAAGGTAA GGCCGAGGAG 180 GTAGTAGCFG CTATTAGAAG GCTAAGTATG GCAAAGAGCC (XATAATAGA AGCAAAGGTG 240 GTTAGTAAGA AGTACITCGG AAGGCCCCGT AAAGCAGTCA AAGTAACGAC AGTTATACOC 300 ^JAATCTGrCA GAGAATATAG AGAGGCIGTA AAAAAGCIGG AAGGCGIGGA AGACICTCTA 360 ^AAGCAGACA TAAGGTTCGC GATGAGGTAT CTATCGACA AGAAGCTCTA cxrGrrcAGA 420 GCATACCGTG TCAGAGCCGA GAACGCIGGA CGCAGCCCFG σπτοοσιυτ AGACrCGGTA 480 TACACTATAG TTGAGGACCC AGAGCCTATT GCGGACATAA CTAGTATAGA TATACCAGAG 310 ATGCGKJrGC TCGCGITCGA CATAGAGGTC TACAGTAAGA GAGGAAGCGC TAACOOGTCC 600 CGCGACCCGG TCATAATAAT CTCGATAAAG GACAGCAAGG GGAACGAGAA GCTACTAGAA 660 GCCAATAACT ACGACGACAG AAACGTGCTA CXjGGAATTTA TAGAGTACAT ACGCTCCm 720 GACCCAGACA TAATAGTAGG CTACAATAGC AACAATTTTG ACIGGCCATA CCTTATAGAA 780 CGTGCACACA GAATAGGAGT AAAGCICGAC GTGACAAGGC GIGITGGCGC AGAGCCAAGT 840 ATGAGCGTCT ATGGACATGT CTCAGTGCAG GGTAGGCTAA ACGTAGACCT CTACAACTAC 900 GTGGAGGAAA TGCATGAGAT AAAGGTAAAG ACGCTCGAGG AGGTCGCCGA ATACCTAGGC 960 GTTATGCGCA AGAGCGAGCG CGTACTAATA GAATGGTGGC GGATCCCAGA TTACTGGGAC 1020 GACGAGAAGA AAOGGCCGCT ACTGAAGCXJr TATGCCCTCG ACGAIUTGAG AGCCACCTAC 1080 mOCCTCGCCG AGAAGATACT CCCATTCGCA ATACAGCTIT CGACAGTAAC CGGIXjITCCr 1140 TTAGACCAAG TCGGGGCIAT GGGCGTAGGT TPCCGIUTAG AATGGTACCT TAIGAGAGCA 12» GOGCATGATA TGAAOGAGCT TGTCCCCAAC CGrTGTCAAGC GGCGdGAAGA GAGCTACAAG 1260 GGAGCAGTAG TACTAAAGCC CCTAAAGGGT GTCCATGAGA ACGTAGTAGT GOCGACnT 1320 AGCTCAATGT AOCOCAACAT AATGATAAAG TACAATGTGG GCCCTGACAC GATAATTGAC 1380 GACCCCTCAG AGTGCGAGAA GTACAGIGGA IGCTACGTAG cccocgaagt CGGGCACATG 1440 TTTAGGCGCT CGCCCHXGG CnUlTIAAG ACGJfGCTTG AGAAÇCTCAT AGCGCTGCGT 1300 AAGCAAGTAC GTGAAAAGAT GAAGGAGITC (XCCCAGATA GCCCAGAATA CCGGATATAC 1560 GATGAACGCC AGAAGGCACT CAAGCrKjCTA GCCAACGCTA GCTACGGCTA CATCGGATCG 1620 GFGCACGCTC GCTGGTACTG TAAACGCTGC GCAGAGGCTG TAACAGCCTG GGGCCGFTAAC 1680 CTGATACTCT CAGCAATAGA ATATGCTAGG AAGCTCGGCC TCAAAGTAAT ATACGGAGAC 1740 ACGGACTCCC TATTCGTAAC CTATGATATC GAGAAGGTAA AGAAGCTAAT AGAATTCGTC 1800 GAGAAACAGC TAGGCTTCGA GATAAAGATA GACAAGGTAT ACAAAAGAGT GTrCTTTACC 1860 GAGGCAAAGA AGCGCTACGT gggcctcctc GAGGACGGGC GTATGGACAT AGTAGGCITr 192)

GAGGCTGTTA GAGGCGACTG GTGTGAGCTA GCTAAAGAGG TGCAAGAGAA AGTAGCAGAG .64 1980 ATAATACTGA AGACGGGAGA CATAAATAGA GCCATAAGCT ACATAAGAGA GGIGGTGAGA 2040 AAGCTAAGAG AAGGCAAGAT ACCCATAACA AAGCTCGTAA TATGGAAGAC CTTGACAAAG 2100 AGAATCGAGG AATACGAGCA CX3AGGCGCCG CACGTTACIG CAGCACGGCG TATGAAAGAA 2160 GCAGGCTACG ATCTGGCACC GGGAGACAAG ATAGGCTACA TCATAGTTAA AGGACATGGC 2220 AGTATATCGA GTCGTGCCTA CCCGTACnT ATGGTAGACT CGTCTAAGGr TGACACAGAG 2280 TACTACATAG ACCACCAGAT AGTACCAGCA GCAATGAGGA TACrCTCATA CTTCGGGGTC 2340 ACAGAGAAGC AGCTTAAGGC AGCATCATCT GGGCATAGGA GTCTCTTCGA CITCTTCGCG 2400 GCAAAGAAGT AGCCCCGGCT CTCCAAACTA 2430 (2) INFORMAÇÃO PARA A SEQUÊNCIA ED NO:2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 803 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:2:

Met Pro Glu Ala Ee Glu Phe Vai Leu Leu Asp Ser Ser Er Ou Be 1 5 10 15 Vai Gli Lis Glu Pro Vai Be Ee Leu Trp Gli Vai Thr Leu Asp Gli | 20 25 30 Ais Arg Ee Vai Leu Leu Asp Aig Aig Phe Arg Pro Tir Phe Tir Ala 35 40 45 Leu Ee Ser Aig Asp Tir Glu Gli lis Ala Glu Glu Vd Vai Ala Ala 50 55 60 Ee Aig Aig Leu Ser Met Ala lis Ser Pro Be Ee Glu Ala Lis Vai 65 70 75 80 Vai Ser Tis lis Tn- Phe Gli Aig Pro Aig Lis Ala Vai Lis Vai Thr 85 90 95 Thr Vai Be Pro Glu Ser Vai Aig Glu Tir Aig Glu Ala Vai lis Lis 100 105 110 Leu Glu GE Vai Glu Asp Ser Leu Ou Ala Αφ Be Aig Phe Ala Met 115 120 125 Aig Ta- Leu Be Asp Lis Lis Leu Tir Pro Phe Thr Ala Tir Arg Vai 130 135 140

Aig Ala Ou Asn Ala GE Arg Ser Pro Gli Phe Alg Vai Αφ Ser Vai 145 150 155 160 Tir Tb He Vai Glu Αφ Pro Glu Pro De Ala Αφ De Tb Ser He 165 170 175 Αφ Ué Pro Ou Ma Aig Vai Leu Ala Phe Αφ De Gb Vai Tir Ser 180 185 190 Lis Aig GE Ser Pro Asn Pro Ser Aig Αφ Pro Vai De De De Ser 195 200 205 He Lis Asp Ser Lis GE Asn Glu Tis Leu Leu Glu Ala Asn Asn Tr 210 215 220 Αφ Αφ Aig Asn Vai Leu Arg Ou Phe De Glu Tir De Aig Ser Phe 225 230 235 240 ® Αφ Pro Αφ De De Vai GE Tir Asn Ser Asn Asn Phe Αφ Trp Pro 245 250 255 Tir Leu He Glu Aig Ala His Aig De GE Vai Lis Leu Αφ Vai Tb 260 265 270 Aig Aig Vai GE Ala Glu Pro Ser Ma Ser Vai Tir GE His Vai Ser 275 280 285 Vai Gh GE Aig Leu Asn Vai Αφ Leu Trr Asn Tir Vai Glu Glu Ma 290 295 300 · His Ou He T is Vai Tis Tb Leu Glu Glu Vai Ala Glu Tir Leu GE 305 310 315 320 Vai Met Arg Lis Ser Glu Aig Vai Leu De Glu Tip Trp Arg De Pro 325 330 Αφ Tir Tip Αφ Αφ Glu Lis Lis Arg Pro Leu Leu Lis Arg Tir Ala • 340 345 350 Leu Αφ Αφ Vai Aig Ala Tb Tir GE Leu Ala Glu Lis De Leu Pro 355 360 365 Phe Ala De Gin Leu Ser Tb Vai Tb GE Vai Pro Leu Αφ Gin Vai 370 375 380 GE Ala Met GE Vai GE Phe Aig Leu Glu Tip Tir Leu Ma Arg Ala 385 390 395 400 Ala His Αφ Met Asn Glu Leu Vai Pro Asn Aig Vai Tis Arg Arg Glu 405 410 415 Ou Ser Tir T is Qi Ala Vai Vai Leu Lis Pro Lai Lis GE Vai His 420 425 430 Ou Asn Vai Vai Vai Leu Αφ Phe Ser Ser Ma Tir Pro Asi De Ma 435 440 445

66

De Lis Tir Asn Vai GB Pro Αφ Thr De De Αφ Αφ Pro Ser Gb 450 455 460 Cis Ou Lis Tr Ser Gfi Cis Tr Vá Ala Pro Gb Vá Gfi His Met 465 470 475 480 Phe Aig Aig Ser Pro Ser Gfi Phe Phe Lis Thr Vá Leu Gb Asn Leu 485 490 495 De Ala Leu Aig Lis Gb Vá Aig Gb Lis Met Lis Gb Phe Pro Pro 500 505 510 Αφ Ser Pro Gb Tr Arg De Tr Αφ Gb Arg Gb Lis Ala Leu Lis 515 520 525 Vai Leu Ala Asn Ala Ser Tr Gfi Tr Met Gfi Tip Vá His Ala Arg 530 535 540 •τιρ Tr Cis Lis Aig Cis Ala Gu Ala Vá Thr Ala Trp GE Aig Asn 545 550 555 560 Leu De Leu Ser Ala De Gb Tr Ala Arg Lis Leu Gfi Leu Lis Vá 565 570 575 De Tir Gfi Αφ Thr Αφ Ser Leu Phe Vá Thr Tr Αφ De Gb Lis 580 585 590 Vai T is lis Leu De Gb Phe Vá Gb Lis Gb Leu Gfi Phe Gb De 595 600 605 lis De Αφ Lis Vai Tr Lis Aig Vá Phe Phe Tir Gb Ala Lis Lis 610 615 620 Aig Tir Vai Gfi Leu Leu Gb Αφ Gfi Arg Met Αφ De Vá Gfi Phe 625 630 635 640 Ou Ala Vai Arg Gfi Αφ Tip Cis Gb Leu Ala Lis Gb Vá Gb Gb • 645 650 655 T is Vai Ala Gb De De Leu Lis Thr Gfi Αφ De Asn Arg Ala De 660 665 670 Ser Tir De Arg Gb Vá Vá Aig Lis Leu Arg Gb Gfi Lis De Pro 675 680 685 De Thr Lis Leu Vai De Tip Lis Thr Leu Thr Lis Aig De Gb Gb 690 695 700 Tír Gb Hs Gb Ala Pro His Vá Thr- Ala Ala Arg Arg Met Tis Gb 705 710 715 720 Ala GE Tr Αφ Vai Ala Pro Gfi Αφ Tis De Gfi Tr De De Vá 725 730 735 Lis Gfi His GB Ser De Ser Ser Arg Ala Tr Pro Tr Phe Met Vá 740 745 750 67

Asp Ser Ser 755 lis Vai Asp Thr Ou 760 Tr Trr Se Asp Hs 765 On Ife Vai Pro Ala 770 Ala Mct Aig He Leu 775 Ser Ta: Phe GB Vai 780 Thr Gtu lis On Leu 785 Lis Ala Ala Ser Ser 790 Gfi Ks Aig Ser Leu 795 Phe Asp Phe Phe Ala 800

Ala Lãs Lis (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 3: (i) C ARACTERÍ STIC AS DA SEQUÊNCIA: (A) COMPRIMENTO: 2430 pares de bases . (B) TIPO: ácido nucleico (C) TBPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 3: ATGACAGAGA CTATAGAGTT CGIGCTGCTA GACTCTAGCT ACGAGATACT GGGGAAGGAG 60 (XGGTAGTAA TCCTCTGGGG GATAACGCIT GACGGTAAAC GTGrCGTGCr TCTAGACCAC 120 CGCITCCGCC CCTACTTCTA CGCCCTCATA GCCCGGGGCT ATGAGGATAT GGTGGAGGAG 180 ATAGCAGCIT CCATAAGGAG GCTTAGTGTG GICAAGAGTC CGATAATAGA TGCCAAGCCT 2« CITGATAAGA GGTACTTCGG CAGGCCCCGT AAGGCGGTGA AGATTACCAC TATGATACCC 300 GAGTCTGTTA GACACTACCG CGAGGCGGTG AAGAAGATAG AGGGIUTGGA GGACrCCCTC 360 ^bAGGCAGATA TAAGGTTTGC AATGAGATAT CTGATAGATA AGAGGCTCTA CGCGITCACG +20 GTTTACCGGC TCCCCGTAGA GGATGCGGGC CGCAATCCAG GCnÇCGTGT TGACCGTGTC 480 TACAAGGTTG CTGGCGACCC GGAGCCCCTA GCGGATATAA CGCGGATCGA ccttcccccg 510 ATGAGGCTGG TAGCmTGA TATAGAGGIG TATAGCAGGA GGGGÇAGCCC TAACCCIGCA 600 AGGGATCCAG TGATAATAGT GTCGCTGAGG GACAGCGAGG GCAAGGAGAG GCTCATAGAA 660 GCTGAAGGCC ATGACGACAG GAGGGITCrG AGGGAGTTCG TAGAGTACGT GAGAGCCTTC 720 GACCCCGACA TAATAGTGGG CTATAACAGT AACCACTTCG ACrGGCCXTTA CCTAATGGAG 780 CGCGCCCGTA GGCTCGGGAT TAACCICGAC GrTTACACGCC GIXjIXjGGGGC AGAGCCCACC 810 ACCAGCGTCT ACGGCCACGT CTCGGTGCAG GGTAGGCTGA ACGIGGACCT CTACGACTAT 900 GCCGAGGAGA TGCCGGAGAT AAAGATGAAG ACGCITGAGG AGGTAGCGGA GTAOCTAGGC 960 GTTATGAAGA AGAGCGAGCG TGTGATAATA GAGTGGTGGA GGATACCCGA GTACTGGGAT 1020 GACGAGAAGA AGAGGCAGCT GCTAGAGCGC TACGCGCTCG ACGATGIGAG GGCTACCTAC 1080 GGCCTCGCGG AAAAGATGCT ACCGTTCGCC ATACAGCTCT CCACTGTTAC GGGKjrGCCT 1140 CTCGACCAGG TAGGTGCTAT GGGCGTAGGC TTGCGCCTAG AGTGGTATCT CATGCGTGCA 1200 GCCTACGATA TGAACGAGCT GGTOCCGAAC CGGOTGGAGA GGAGGGGGGA GAGCTACAAG 1260 QGTGCAGTAG TGTTAAAGCC TCTCAAGGGA GICCATGAGA ATGTTGTGGT GcrcGAinr 020 AGITCCATOT AOXGAGCAT AATGATAAAG TACAACGTGG CXXCCGACAC TATAGICGAC 1380 GACCCCTCGG AGTGCCXAAA GTACGGCGGC TGCTATGrTAG CCOCOGAGGT OGGGCACCGG 1440 TTCCGTCCCT CXECGCCAGG CTICITCAAG ACCGTGCICG AGAACCTACT GAAGCTACGC 1500 CGACAGGTAA AGGAGAAGAT GAAGGAGTTT OIGCCICACA GCCCCGAGTA CAGGCTCTAC 1560 GATGAGCGCC AGAAGGCGCT CAAGGITCIT GCGAACGCGA GCTATGGCTA CATGGGGIGG 1620 AGCCATGCCC GCTGGTACTG CAAACGCTGC GCCGAGGCTG TCACAGCCTG GGGCCGTAAC 1680 CITATACTGA CAGCTÀTCGA GTATGCCAGG AAGCTCGGCC TAAAGGITAT ATATGGAGAC 1740 ACCGACTCCC TCTTOGTGGT CTATGACAAG GAGAAGGTIO AGAAGCIGAT AGAGITTGrC 1800 GAGAAGGAGC TGGGCITTGA GATAAAGATA GACAAGATCT ACAAGAAAGT GTTCTTCACG 1860 GAGGCTAAGA AGCGCTATGT AGGrcrccrc GAGGACGGAC CTATAGACAT CarGGGCTTT 1920 'gaagcagtcc GCGGCGACTG GTGCGAGCTG GCTAAGGAGG TGCAGGAGAA GGCGGCIGAG 1980 ATAGTGTTGA ATACGGGGAA CGTGGACAAG GCTATAAGCT ACATAAGGGA GGTAATAAAG 2040 CAGCTCCGCG AGGGCAAGGT GCCAATAACA AAGCITATCA TATGGAAGAC GCIGAGCAAG 2100 AGGATAGAGG AGTACGAGCA TGACGCGCrr CATGTGATGG CTGCACGGCG TATGAAGGAG 2160 GCAGGCTACG AGGKjTCTCC CGGCGATAAG GTGGGTACG TCATAGITAA GGGTAGCGGG 2220 AGTGTCTCCA GCAGGGCCTA CCCCTACITC ATGGITGATC CATCGACCAT CGACX7TCAAC 2280 TACTATATTG ACCACCAGAT AGIGCCGGCT GCIUTGAGGA TACTCIGCTA CITCGGAGTC 2340 ACCGAGAAAC AGCTCAAGGC GGCGGCTACG GTGCAGAGAA GCCIOTCGA cnoTCGcc 2400 TCAAAGAAAT ACOCCTCCA (XCGGCTAGC 2430 (2) INFORMAÇÃO PARA A SEQUENCIA Π) NO:4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 803 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ DD NO:4:

Met I Thr Ou Thr Se 5 Ou Phe Vai Leu Leu 10 Asp Ser Ser Tir Ou 15 Se Leu GK Lis Glu 20 Pio Vai Vai Be Leu 25 Tip cai He Thr Leu 30 Asp cai lis Aig Vai 35 Vai Leu Leu Αφ Hfis 40 Aig Phe Aig Pro Tír 45 Phe Tir Ala

Leu De Ala Aig GE Tír Glu Αφ Má Val Gb Gb De Ala Ala Sá 50 55 60 He Aig Arg Leu Ser Val Val Lis Sá Pro De De Αφ Ala Lis Pro 65 70 75 80 Leu Αφ Lis Aig Tír Phe GE Aig Pro Arg Lis Ala Val Lis De Thr 85 90 95 Thr Má De Pro G3u Sá Val Aig Hs Tir Atg Gb Ala Val lis Lis 100 105 110 De Ou GE Val Gíu Αφ Sá Leu Gb Ala Αφ De Arg Phe Ala Má 115 120 125 Aig Tu Leu De Αφ Lis Arg Leu Tir Pro Phe Thr Val Tu- Arg De do 135 140 ^É?ro Val Ou Αφ Ala GE Arg Asn Pro GE Phe Aig Val Αφ Aig Vá 145 150 155 160 Ur Lis Val Ala GE Αφ Pro Glu Pro Leu Ala Αφ De Thr Aig De 165 170 175 Asp Leu Pro Pro Má Arg Val Leu Ala Phe Αφ De Qu Val Tir Sá 180 185 190 Aig Atg GE Ser Pro Asi Pro Ala Aig Αφ Pro Val De De Vá Sá 195 200 205 Leu Aig Asp Ser Gb GE Lis Qu Aig Leu De Gb Ala Gb GE Hs 210 215 220 Asp Asp Aig Aig Val Leu Aig Gb Phe Val Gb Tir Val Aig Ala Phe 225 230 235 240 Asp Pto Αφ De De Val GE Tir Asn Sá Asn His Phe Αφ Tip Pro • 245 250 255 Tír Leu Má Ou Arg Ala Arg Arg Leu GE De Asn Leu Αφ Vá Thr 260 265 270 Aig Aig Val GE Ala GEi Pro Thr Thr Sá Val Tir GE His Vá Sá 275 280 285 Vai On GE Arg Leu Asn Val Asp Leu Tir Αφ Tir Ala Gb Gb Má 290 295 300 Pro Ou De Lis Má Lis Thr Leu Gb Gb Val Ala Qu Tir Leu GE 305 310 315 320 Vai Ma Lis Lis Sá Gb Arg Val De De Gb Trp Trp Arg De Pro 325 330 335 Gfu Tir Ttp Αφ Αφ Glu Lis Lis Arg Gb Leu Leu Gb Aig Tir Ala 340 345 350

Leu Asp Asp Vai Aig Ala Thr Tir Gfi Leu Ala Gu Lis Met Leu Pro 355 360 365 1¾ Ala He Gn Leu Ser Thr Vai Thr Gfi Vd Pro Leu Αφ Gn Vd 370 375 380 G Ala Met GE Vai Gfi Phe Aig Leu Gu Trp Tir Leu Met Aig Ala 385 390 395 400 Ala Tir Αφ Met Asn Gu Leu Vai Pro Asn Aig Vd Gu Aig Aig G 405 410 415 Ou Ser Tir Lis Gfi Ala Vai Vai Leu Lis Pro Leu Lis Gfi Vd Hs 420 425 430 Ou Asn Vai Vai Vai Leu Αφ Phe Ser Ser Met Tir Pro Ser De Met 435 440 445 ^^De T is Tir Asn Vai Gfi Pro Αφ Thr De Vd Αφ Αφ Pro Ser Gu 450 455 460 Cis Pro Lis Tir GE GE Cis Tir Vai Ala Pro Gu Vd Gfi Hs Arg 465 470 475 480 Phe Aig Aig Ser Pro Pro GE Phe Phe lis Thr Vd Leu Gu Asn Leu 485 490 495 Leu Tis Leu Aig Arg Gn Vai Tis Gu Lis Met Lis Gu Phe Pro Pro 500 505 510 Asp Ser Pro Gu Tir Aig Leu Tir Αφ Gu Aig Gn Lis Ala Leu Lis 515 520 525 Vai Leu Ala Asn Ala Ser Tir Gfi Tir Met Gfi Tip Ser LDs Ala Arg 530 535 540 Tip Tir Cis Lis Aig Cis Ala Gu Ala Vai Thr Ala Trp Gfi Aig Asn • 550 555 560 Leu De Leu Thr Ala De Gu Tir Ala Aig Lis Leu Gfi Leu Lis Vd 565 570 575 De Tir GE Αφ Thr Αφ Ser Leu Phe Vai Vd Tir Αφ Lis Gu Tis 580 585 590 Vai Gu lis Leu De Gu Phe Vai Gu lis Gu Leu Gfi Phe Gu De 595 600 605 Lis De Asp Lis De Tir Lis lis Vai Phe Phe Thr Gu Ala Tis Lis 610 615 620 Aig Tir Vai GE Leu Leu Gu Αφ Gfi Aig De Αφ De Vd G Phe 625 630 635 640 Ou Ala Vai Arg Gfi Αφ Tip Cis Gu Leu Ala Lis Gu Vd Gn Gu 645 650 655

Us Ala Ala Gtu Be Vai Leu Asn Thr Gli Asn Vai Αφ Us Ala Be 660 665 670 Ser Tír Be Arg Giu Vai Be Us Gin Teu Aig Ou Gli Lis Vá Pro 675 680 685 Be Thr Us Leu Be Be Trp Us Thr Leu Ser Us Arg Be Giu Giu 690 695 700 Tir Ou His Αφ Ala Pro His Vai Met Ala Ala Arg Arg Met Us GEi 705 710 715 720 Ala Gii Tir Gíu Vai Ser Pro GE Αφ Us Vai Gli Tir Vá Be Vá 725 730 735 Lis Oi Ser Gli Ser Vai Ser Ser Aig Ala Tir Pro Tír Phe Met Vá 740 745 750 φΑφ Pro Ser Thr Be Αφ Val Asn Tir Tir Be Αφ His Gin Be Vá 755 760 765 Pro Ala Ala Lai Arg Be Leu Ser Tir Phe Gli Vai Thr Gu Tis Gn 770 775 780 Leu Us Ala Ala Ala Thr Vai Gh Aig Ser Leu Phe Αφ Phe Phe Ala 785 790 795 800 Ser Lis Us (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 36 pares de bases (B) TEPO: ácido nucleico φ (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:5: GGACCCATAT GCCAGAAGCT ATTGAATTCG TGCTCC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:6; (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 34 pares de bases (B) TIPO: ácido nucleico

(C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQID NO:6: GGCAGGTACC ACTAGTTATG TCGGCAATAG GCTC 34 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 60 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 7. TTAAGGCAGC ATCATCTGGG CATAGGAGTC TCTTCGACTT CTTCGCGGCA AAGAAGTAAC 60 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:S: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 60 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:8: CCGGGTTACT TCTTTGCCGC GAAGAAGTCG AAGAGACTCC TATGCCCAGA TGATGCTGCC 60 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples ' (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:9: GCTTATAGCC TTGTCCACGT TC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 36 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 10 GGACCATGCA TGACTGAAAC TATTGAATTC GTGCTG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 11 GGAAGGTACC TGATCATCTA GAAGCACGAC ACGTT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ED NO: 12: GGAAGCTGAG CAAGAGGATA GAGG (2) INFORMAÇÃO PARA A SEQUÊNCIA ED NO. 13: ™ (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 13: GGAAGGTACC ΤΓΑΊΤΤΟΠΤ GAGGCGAAGA AG φ(2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 14:

TTTTTCGAAA GAAGAAAAAA CC 75 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 15: φ TCTCATATGC TTATCGATAC CC 22 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) Φ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 16: CATAAGCTTA TCGATACCT T 21 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 17: AAGCTTATGA CAGAGACTAT AGAGTT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TLPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 18: GTGGTCTAGA AGCACGACAC GT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 19: TATTGCCGAC ATAACTAGTA TAGA (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 28 pares de bases (B) TIPO: ácido nucleico (C.) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA; ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA; SEQ ID NO:20; ACTGTAGACC GCGATCGCGA ACGCGAGC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:21: (i) CARACTERÍSTICAS DA SEQUÊNCIA. (A) COMPRIMENTO; 34 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:21: CTCGCGTTCG CGATCGCGGT CTACAGTAAG AGAG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:22: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:22: TTATCTCATG CATTTCCTCC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:23: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO· 19 pares de bases (B) TIPO: ácido nucleico

78

(C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA. ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ED NO:23: GTGTCGTGCT TCTAGACCA 19 (2) INFORMAÇÃO PARA A SEQUÊNCIA ED NO:24: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 31 pares de bases (B) TEPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear

(ii) TEPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:24: GCTATACACC GCGATCGCAA AAGCTACCAG C 31 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:25: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:25:

GGTAGCTTTT GCGATCGCGG TGTATAGCAG GA 32 (2) INFORMAÇÃO PARA A SEQUÊNCIA DD NO:26: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 19 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:26: TACGGGCGCG CTCCATTAG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:27: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 28 pares de bases (B) TEPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ED NO:27: CCGATAGTTT GAGTTCTTCT ACTCAGGC (2) INFORMAÇÃO PARA A SEQUÊNCIA ED NO:28: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) 77 80

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:28: GAAGAAAGCG AAAGGAGCGG GCGCTAGGGC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:29: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 19 pares de bases (B) TIPO: ácido nucieico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ED NO:29: GCACCCCGCT TGGGCAGAG 30 19 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:30: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 19 pares de bases (B) TIPO: ácido nucieico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear

(ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:30: GCACCCCGCT TGGGCAGAA 19 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO 31: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 19 pares de bases (B) TIPO: ácido nucieico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear

(ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:31: GCACCCCGCT TGGGCAGAT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:32: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 19 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:32: GCACCCCGCT TGGGCAGAC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:33: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:33: TCCCGCCCCT CCTGGAAGAC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 34: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA. SEQ ID NO:34: GATAAAGATA GACAAGGTAT AC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:35: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:35: CGTATTCCTC GATTCTCTTT (2) INFORMAÇÃO PARA A SEQUÊNCIA ED NO:36: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 40 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico)

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:36: TTCGCATATG CCATTTGCAA TACAACTTTC GACAGTAACC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:37: (i) CARACTERÍSTICAS DA SEQUÊNCIA: 83 (A) COMPRIMENTO: 37 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simpies (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:37: TTCGCATATG GGTGTAGGTT TTCGTCTAGA ATGGTAC 37 φ(2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:38: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:38: CGCATATGAA CGAACTGGTT CCCAACCGTG TCAAG 35 (2) INFORMAÇÃO PARA A SEQUÊNCIA DD NO:39: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:39: GTCAGGGCCC ACATTGTACT T 21

Claims

Reivindicações 1. Polimerase de ADN termostável que possui a sequência de aminoácidos desde o terminal amino até ao terminal carboxi de SEQID No. 2 ou de SEQID No. 4. Fragmento encurtado no terminal N da polimerase tal como reivindicada na reivindicação 1, que possui a sequência de aminoácidos designada por SEQ ED No. 2 mas a que fala até um terço da sequência do terminal amino da sequência de aminoácidos designada por SEQ ID No. 2. Fragmento encurtado no terminal N da polimerase reivindicada de acordo com a reivindicação 2, a que falta actividade de exonuclease, de preferência um fragmento encurtado no terminal N, seleccionado entre o conjunto constituído por: (a) mutante por supressão de 366 aminoácidos que possui a sequência de aminoácidos desde a posição 1, que é a metionina, seguindo-se imediatamente os aminoácidos 368 a 803 da SEQ ID No. 2; (b) mutante por supressão de 386 aminoácidos que possui a sequência de aminoácidos desde a posição 1, que é a metionina, seguindo-se imediatamente os aminoácidos 388 a 803 da SEQ ID No. 2; ou (c) mutante por supressão de 403 aminoácidos que possui a sequência de aminoácidos desde a posição 1, que é a metionina, seguindo-se imediatamente os aminoácidos 405 a 803 da SEQ ID No. 2.
4. Fragmento encurtado no terminal N da polimerase reivindicada de acordo com a reivindicação 1, que possui a sequência de aminoácidos designada por SEQ ID No. 4 mas a que falta até um terço da sequência do terminal amino da sequência de aminoácidos designada por SEQ ID No. 4.

Derivado recombinante da polimerase de ADN termostável reivindicada de acordo com a reivindicação 1, enzima essa que possui supressões e adições na estrutura primária relativamente à sequência de aminoácidos designada por SEQ ID No. 2, em que essas modificações não destroem as propriedades enzimáticas da enzima termostável resultante, sendo essas propriedades as seguintes: (a) catalisa a combinação dos nucleósido-trisfosfatos para formarem uma cadeia de ácido nucleico complementar de uma cadeia matriz de ácido nucleico; (b) é capaz de funcionar eficientemente numa reacção em cadeia com polimerase a uma temperatura de desnaturação até 100°C; e (c) possui uma actividade de exonuclease de 3’ para 5’.
6. Derivado recombinante da polimerase de ADN termostável reivindicada de acordo com a reivindicação 1, enzima essa que possui supressões e adições na estrutura primária relativamente à sequência de aminoácidos designada por SEQ ID No. 4. em que essas modificações não destroem as propriedades enzimáticas da enzima termostável resultante, sendo essas propriedades as seguintes: (a) catalisa a combinação dos nucleósido-trisfosfatos para formarem uma cadeia de ácido nucleico complementar de uma cadeia matriz de ácido nucleico,

(b) é capaz de funcionar eficientemente numa reacção em cadeia com polimerase a uma temperatura de desnaturação até 100°C; e (c) possui uma actividade de exonuclease de 3’ para 5’.
7. Polimerase de ADN termostável reivindicada de acordo com uma qualquer das reivindicações 1 a 6, a qual possui uma actividade óptima entre 70°Ç e 80°C.

Enzima polimerase de ADN termostável reivindicada de acordo com uma qualquer das reivindicações 1 a 7, a qual é modificada por oxidação ou redução, pelo que esta modificação não destrói a actividade de polimerase de ADN da enzima termostável resultante.
9. ADN que codifica uma polimerase de ADN termostável reivindicada de acordo com uma qualquer das reivindicações 1 a 7.

ADN de acordo com a reivindicação 9 que possui a sequência nucleotídica designada por SEQ ID No. 1, ou uma sua subsequência que codifica uma enzima polimerase de ADN termostável reivindicada de acordo com a reivindicação 2.
11. ADN de acordo com a reivindicação 9 que possui a sequência nucleotídica designada por SEQ ID No. 2, ou uma sua subsequência que codifica uma enzima polimerase de ADN termostável reivindicada de acordo com a reivindicação 2.
12. Vector de ADN recombinante que compreende uma sequência de ADN que codifica uma polimerase de ADN termostável reivindicada de acordo com uma qualquer das reivindicações 1 a 7.

fy
13. Vector de ADN recombinante reivindicado de acordo com a reivindicação 12, o qual é o pPoc4 (ATCC n° 69309) ou o pPabl4 (ATCC n° 69310).
14. Célula hospedeira transfonnada com um vector de ADN que compreende uma sequência de ADN que codifica uma polimerase de ADN termostável reivindicada de acordo com uma qualquer das reivindicações 1 a 7.
15. Polipeptido que manifesta actividade de polimerase de ADN de Pyrodictium, produzido numa célula hospedeira tal como reivindicada na reivindicação 14.
16. Composição enzimática estável que compreende uma polimerase de ADN termostável tal como reivindicada numa qualquer das reivindicações 1 a 7, ou polipeptido reivindicado tal como na reivindicação 15 numa solução tampão que contém um ou vários reagentes poliméricos não iónicos.
17. Processo para preparação de uma polimerase de ADN termostável tal como reivindicada numa qualquer das reivindicações 1 a 7, ou polipeptido tal como reivindicado na reivindicação 15, processo esse que compreende um dos passos seguintes: (a) criar em cultura uma célula hospedeira transformada com um vector de ADN recom-binante que codifica uma polimerase de ADN termostável tal como reivindicada numa qualquer das reivindicações 1 a 7; (b) isolar a partir da cultura a polimerase de ADN termostável produzida na célula hospedeira. 5
18. Processo para amplificar um ácido nucleico, caracterizado pelo facto de se utilizar uma polimerase de ADN teimostável tal como reivindicada numa qualquer das reivindicações 1 a 7 ou um polipeptido tal como reivindicado na reivindicação 15.
19. Utilização de uma polimerase de ADN tcrmostável tal como reivindicada numa qualquer das reivindicações 1 a 7 ou de um polipeptido tal como reivindicado na reivindicação 15 para a amplificação de um ácido nucleico.
20. Estojo que contém uma polimerase de ADN termostável tal como reivindicada numa qualquer das reivindicações 1 a 7, ou um polipeptido tal como reivindicado na reivindicação 15, ou uma composição enzimática estável que compreende a referida polimerase numa solução tampão que contém um ou vários detergentes poliméricos não iónicos e facultativamente outros reagentes úteis para a realização de uma RCP, por exemplo, um conjunto de iniciadores, sondas ou precursores de nucleósido-trifosfatos.

A.O.P.í. Rua (lo Salitrç, 155. r/c-Drt. 1250 LISBOA