PT99848A - Processo para a preparacao de sequencias lider sinteticas - Google Patents

Processo para a preparacao de sequencias lider sinteticas Download PDF

Info

Publication number
PT99848A
PT99848A PT99848A PT9984891A PT99848A PT 99848 A PT99848 A PT 99848A PT 99848 A PT99848 A PT 99848A PT 9984891 A PT9984891 A PT 9984891A PT 99848 A PT99848 A PT 99848A
Authority
PT
Portugal
Prior art keywords
dna sequence
yeast
arg
leu
signal peptide
Prior art date
Application number
PT99848A
Other languages
English (en)
Inventor
Lars Christiansen
Original Assignee
Novo Nordisk As
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk As filed Critical Novo Nordisk As
Publication of PT99848A publication Critical patent/PT99848A/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/036Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/74Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor
    • C07K2319/75Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor containing a fusion for activation of a cell surface receptor, e.g. thrombopoeitin, NPY and other peptide hormones

Description

PROCESSO PARA A PREPARAÇÃO DE SEQUÊNCIAS
LlDER SINTÉTICAS"
Campo da Invenção A presente invenção refere-se a um método para a cons trução de sequências lider sintéticas para secreção de poli-péptidos heterólogos, em leveduras e sectores de expressão em leveduras para utilização naquele método.
Antecedentes da Invenção
As leveduras produzem um certo número de proteínas que são sintetizadas no interior das células mas cuja função se exerce no exterior da célula. Estas proteínas extracelu-lares são referidas como proteínas segregadas. Estas protej. nas segregadas são inicialmente expressas no interior da célula, como proteínas precursoras de pré-proteínas, contendo uma pré-sequência que assegura a direcção efectiva do produto expressado através da membrana do retículo endoplasmático. A pré-sequência, normalmente designada por péptido sinal, ge ralmente separa-se do produto desejado durante a transloca-ção. Uma vez penetrada no aparelho secretor a proteína é transportada para o aparelho de Golgi. A partir do aparelho de Golgi, a proteína pode seguir diferentes caminhos conducentes aos compartimentos, como, por exemplo, os vácuolos das células ou a membrana celular ou podem sair da célula para serem segregados no meio exterior -2 [Pfeffer, S. R. e Rothman, J. E., "Ann. Rev. Biochem., 56 (1987) 829-852]. Têm sido sugeridas diversas vias para a expressão e secreção, em leveduras, de proteínas heterõlogas para leveduras. O pedido de patente de invenção publicado nQ 88632 descreve um processo através do qual são expressas proteínas heterõlogas para leveduras, processadas e segregadas por transformação de uma levedura com um veículo de expressão con tendo ADN que codifica a proteína pretendida e um péptido sinal, preparação de uma cultura do organismo transformado , desenvolvimento da cultura e recolha da proteína no meio de cultura. 0 péptido sinal pode ser o péptido sinal da própria proteína pretendida, um péptido sinal heterõlogo ou um híbrido do péptido sinal heterõlogo com um péptido sinal natural.
Um problema que surgiu com a utilização de pèptidos sinal heterõlogos para levedura, é que o péptido sinal heterõ logo não assegura a translocação e/ou cisão apõs o péptido si^ nal. O MFCX1 de S. Cerevisiae (factor-^) ê sintetizado sob a forma de uma pré-proforma de 165 aminoãcidos compreendendo um prê-péptido ou péptido sinal de 19 aminoãcidos, seguido de uma sequência "lider" ou prõ-péptido de 64 aminoãcjl dos, que comporta trés sítios de glicosilação ligados a N se guidos por (Lys-Arg(Asp/Gln, Ala2_^ factor- à~ )4 (Kurjan, J. e Herskowitz, I., Cell 30 (1982) 933-943]. Tem sido muito utilizado o líder-sinal, parte de preproMFc< 1 para a obtenção da síntese e secreção de proteínas heterõlogas em S. cer-visiae. 0 uso de pèptidos sinal/líder homólogos para levedu- -3- -3-
ras é conhecido através da descrição da patante de invenção norte-americana nQ 4.546.082, dos pedidos de patente de invenção europeia publicados nQs. 116201, 123294, 123544, 163529 e 123289 e do pedido de patente de invenção dinamarquesa nQ 3614/83.
Na patente de invenção europeia nQ 103289 descreve--se a utilização de precursor do factor-^, de S. cerevisiae enquanto a W084/01153 indica a utilização do péptido sinal de invertase de Saccharomyces cera/isiae e a patente de inven ção dinamarquesa S 3614/83 refere a utilização do péptido s_i nal PH05 de Saccharomyces cerevisiae para secreção de proteí^ nas estranhas.
Na descrição da patente de invenção norte-americana nQ 4546082 e nas patentes de invenção europeias nQs 16201 , 123294, 123544 e 163529 descrevem-se processos em que é utilizado o sinal/líder do factor de Saccharomyces cerevisiae (Mí^C 1 ou MF Q(. 2) no processo de secreção das proteínas hete rólogas expressas em levedura. Foi demonstrada a proteína desejada pela fusão de uma sequência de ADN que codifica a sequência sinal/líder MFO£ 1 de S, cerevisiae na extremidade 5' do gene para a secreção e processamento da proteína desejada. A patente d einvenção europeia nQ 206783 descreve um sistema para a secreção de polipéptidos de S^ cerevisiae pelo qual foi truncada a sequência lider de factor- , para se eliminarem os quatro péptidos de factor- presentes na se quência líder natural de forma a deixar o próprio péptido l_í der ligado a um polipéptido heterólogo através do sítio de processamento do factor- , LysArgGluAlaGluAla. Esta cons^ -4- trução é indicada para um processo eficiente de pêptidcs menores (menos do que 50 aminoácidos).
Para secreção e processamento de polipéptidos maiores, a sequência lider de factor-^V. natural foi truncada por for ma a deixar um ou dois péptidos de factor-^ entre o pépti-do lider e o polipéptido.
Um dado número de proteínas segregadas são conduzidas por forma a estarem expostas a um sistema de prcessamento pro teolítico que consegue cindir a ligação peptídica na extremi dade carboxilo de dois aminoácidos básicos consecutivos. Esta actividade enzimática em S. cerevisiae é codificada pelo gene 2KEX ( Julius, D. A. et al., Cell, 37 (1984b) 1075). O processamento do produto pelo produto do gene 2KEX é necessário para a secreção do factor -1 de ligação de S_^ ceievisiae activo, (MF 1 ou factor ) mas não está envolvido na secreção do factor a de ligação de S. cerevisiae activo. A secreção e o processamento correcto de um polipéptido destinado a ser segregado são obtidos, em alguns casos, quando se cultiva uma levedura que é transformada com um vec tor construído do modo indicado nas referências citadas ante riormente. Contudo, em muitos casos, o nível de secreção é muito baixo ou nulo ou pode ser incorrecto ou incompleto o processamento proteolítico. Portanto, constitui um objectivo da presente invenção, proporcionar péptidos líder que garantam, mais eficientemente, a expressão e/ou o processamento de polipéptidos heterólogos.
Sumário da Invenção
Inesperadamente, descobriu-se a possibilidade de subis -5- -5-
tituir o péptido líder do factor- por diversas sequências diferentes de ADN, obtendo-se, desse modo, a secreção, em le vedura, de um péptido heterólogo.
Com base nesta observação, desenvolveu-se um método através do qual fragmentos aleatórios de ADN são clonados em vectores de levedura a jusante de uma sequência de ADN que codifica para um péptido sinal e a montante de uma sequência de ADN que codifica, para um polipéptido heterólogo. Após transformação com os vectores, são sondadas células de levedura, para a secreção do polipéptido heterólogo em causa.
Mais especificamente, a presente invenção refere-se a um método para a construção de uma sequência líder peptídica sintética para secreção de polipéptidos heterólogos em levedura, o qual consiste em: a) inserir um fragmento de ADN aleatório em um vector de expressão com a sequência seguinte: 51-SP-X-X -31-RS-5'-X -(NZT) -X -PS-*gene*-3' n m P q na qual SP representa uma sequência de ADN que codifica para um péptido sinal;
Xn representa uma sequência de ADN que codifica os aminoácidos, representando n zero ou um número inteiro de 1 a cerca de 10 aminoácidos; RS representa um sitio de reconhecimento de uma en donuclease da restrição para a inserção de fragmentos de ADN aleatórios, sitio esse situado na junção de X„ e X . n m' -6-
Xm representa uma sequência de ADN, que codifica pa ra m aminoácidos, representando m zero ou um número inteiro de 1 a 10, aproximadamente; (NZT) representa uma sequência de ADN que codifica para Asn-Xaa-Thr, representando p zero ou 1;
Xq representa uma sequência de ADN que codifica para q aminoácidos, representando q zero ou um número inteiro de 1 a 10 aminoácidos, aproximadamente ; PS representa uma sequência de ADN que codifica para um péptido que define um sítio de processamento de levedura; e *gene* representa uma sequência de ADN que codifica para um polipéptido heterõlogo; b) transformar uma célula hospedeira de levedura com o vec tor de expressão obtido no passo a); c) cultivar a célula hospedeira transformada, do passo b), sob condições apropriadas, d) sondar a cultura do passo c) para secreção do polipéptido heterõlogo.
No presente contexto, considera-se que a expressão "péptido lider" se refere a um péptido cuja função é permitir dirigir o polipéptido heterõlogo do retículo endoplasmático para o aparelho de Golgi e,posteriormente, para uma vesícu la secretora para secreção no meio (isto é, exportação do po lipéptido expresso através da parede celular ou pelo menos através da membrana celular no espaço periplasmático da célu la) . -7- -7-
A designação "sintético" aplicada em ligação com pé£ tidos líder, destina-se a indicar que o péptido líder construído de acordo com o método da presente invenção é um pé£ tido que não se encontra na natureza. A designação de "péptido sinal" é considerada como referindo a pré-sequência que é predominantemente hidrófoba na natureza e se apresente como uma sequência N-terminal da forma precursora de uma proteína extra-celular expressa na levedura. A função do péptido sinal é permitir a secreção da proteína heteróloga para entrar no retículo endoplasmáti co. 0 péptido sinal é normalmente cindido no decurso deste processo. 0 péptido sinal pode ser heterólogo ou homólogo para a levedura que produz a proteína, mas, como se referiu anteriormente, pode ser conseguida uma cisão mais eficaz do péptido sinal quando este é homólogo para a levedura em cau sa. A expressão "polipéptido heterólogo" destina-se a in dicar um polipéptido que não é produzido na natureza pela le vedura hospedeira. No método da presente invenção o polipép tido heterólogo preferido será tal que a sua secreção pelas células de levedura transformadas, possa ser facilmente detec tada, por exemplo, por métodos, convencionais aceites, como a sondagem imunológica de anticorpos reactivos com o polipéptido em causa (consultar, por exemplo, Sanibrook, Fritscn e Maniatis, Molecular Cloning: A Laboratory Manual, Nova Iorque, Cold Spring Harbor , 1989) ou por sondagem de uma acti-vidade biológica específica do polipéptido heterólogo. Um resultado positivo da sondagem indica que foi construído o péptido líder útil para a secreção de polipéptidos heterõlo-gos na levedura. -8- -8-
A expressão "um fragmento de ADN aleatório" destina -se a indicar qualquer sequência de ADN com um comprimento de pelo menos 3 nucleótidos, por exemplo, obtida por digestão de ADN genómico (de qualquer organismo) com endonuclea-se(s) de restrição e mediante a preparação de ADN sintético, por exemplo, pelo método de fosfoamidite, descrito por S. L. Beaucage e Μ. H. Caruthers, Tetrahedron Letters, 22 (1981) , 1859-1869. 0 péptido Ãsn-Xaa-Thr codificado por "(NZT) " é uma
Zr asparagina ligada ao sítio de glicosilação. "Xaa" representa qualquer dos aminoácidos conhecidos, com excepção de Pro.
Em outro aspecto, a presente invenção refere-se a um vector de clonagem por expressão de levedura consistindo na sequência seguinte: 5'-SP-X -31-RS-51-X -(NZT) -X -PS-*gene*-3· n m p q na qual SP, Xn, RS, X^ (NZT) , X^, PS e *gene* têm os significados definidos antes.
De acordo com o método descrito anteriormente, este vector pode ser utilizado para a construção de sequências pep tídicas lider.
Em um outro aspecto, a presente invenção refere-se a um vector de expressão de levedura que consiste na sequência seguinte:
5'-SP-X -ranDNA-X -(NZT) -PS-*gene*-3' n m p J na qual -9- -9-
SP, Xn, Xm, (NZT)p, Χ^, PS e *gene* têm os significa
dos definidos antes e ranDNA representa um fragmento de ADN aleatório, inserido em um sítio de reconhecimento de endonu clease de restrição situado na função de X com X . v n m
Neste vector, a sequência peptídica líder (logo que identificada pelo método desta invenção) poderá ser constituí da pela sequência X -ranDNA-X -(NZT) -X . Um vector destes n m p q pode ser utilizado para a produção de um polipéptido heterólo go com interesse.
Ainda em um outro aspecto, a presente invenção refere-se a um processo para a produção de polipéptidos heterólogos em leve dura, o qual consiste em efectuar a cultura de uma célula de levedura capaz de expressar um polipéptido heterólogo e que é transformada com um vector de expressão de levedura, tal como se descreveu anteriormente, que inclui uma sequência peptídica líder construída pelo método desta invenção, em um meio apropriado para obter a expressão e secreção do polipép tido heterólogo, após o que se recolhe o polipéptido heterólogo do meio.
Descrição Pormenorizada da Invenção O comprimento do fragmento de ADN aleatório inserido no vector de expressão não é particularmente crítico. Contu do, para se ter um comprimento manejável, de preferência o polipéptido terá um comprimento, de 16 a 600 pares de bases, aproximadamente. Com maior preferência, o fragmento terá um comprimento de cerca de 15 a cerca de 300 pares de bases. Pre sentemente, considera-se que o comprimento apropriado para o -10- fragmento é de 30 a 150 pares de bases, aproximadamente. O fragmento de ADN aleatório codifica de preferência uma grande proporção de aminoácidos polares. Estes são se-leccionados no grupo constituído por Glu, Asp, Lys, Arg, His, Thr, Ser, Asn e Gin.
No presente contexto, a expressão "uma grande propor ção de" entende-se que indica que o fragmento de ADN codifica um maior número de aminoácidos polares do que outras sequências de ADN com um comprimento correspondente. Indepen-dentemente disto ou adicionalmente, pode ser vantajoso que o fragmento codifique, pelo menos uma prolina.
Na sequência 5'-SP-X -31-RS-5'-X -(NZT) -X -PS-*ge-^ n m p q ne*-3', n e/ou m e/ou q são de preferência > 1 . Em particular todos de n, m e q são ^.-1.
Existem algumas provas (cf. WO 89/02463) que confir mam que a presença de um sítio de glicosilação, ligado a as- paragina na sequência líder, pode conferir uma maior eficiên cia de secreção ao péptido líder. Portanto, na sequência 5'-SP-X -3'-RS-5 '-X -(NZT) -X -PS-*gene*-3' é preferível que η n p q p represente 1. A sequência do péptido sinal (SP) pode codificar qual. quer péptido sinal que assegure uma direcção efectiva do po lipéptido heterólogo expresso no ciclo de secreção da célula. 0 péptido sinal pode ser um péptido sinal de ocorrência natu ral ou suas partes funcionais ou um péptido sintético. Veri^ ficou-se que, os péptidos sinal apropriados são os péptidos sinal de factor-^ , o péptido sinal de amilase de saliva de murino, um péptido sinal de carboxipeptidase modificado, o péptido BAR 1 de levedura, o péptido sinal de lipase de
Humicola lanuginosa ou um seu derivado. A sequência sinal , de amilase de saliva de murino está descrita em O. Hagenbii-chle et al., Nature, 289 (1981) 643-646. A sequência sinal de carboxipeptidase está descrita em L.A. Valls et al., Cell 48 (1987) 887-897. 0 péptido sinal BAR 1 está descrito na patente de invenção WO 87/02670. O péptido sinal de lipase de H. lanuginosa está descrita na patente de invenção europeia nQ 305216. O sítio de processamento de levedura codificado pela sequência de ADN PS pode, de forma apropriada, ser qualquer combinação emparelhada de Lys e Arg como Lys-Arg, Arg-Lys , Lys-Lys ou Arg-Arg, que permite o processamento do péptido heterólogo pela protease de KEX2 de Saccharomyces cerevisiae ou a protease correspondente de outras espécies de leveduras [D. A. Julius et al., Cell, 37 (1984) 1077 ff.]. Se o proce_s sarnento de KEX2 não for conveniente, por exemplo, se puder conduzir à cisão do produto polipeptidico, pode ser escolhido um sítio de processamento por outra protease em substitui, ção, comportando uma associação de aminoácidos que não exista no produto polipeptidico, por exemplo, o sítio de processamento para FXa, Ile-Glu-Gly-Arg (ver Sambrook, Fritsch e Maniatis, Molecular Cloning: A laboratory Manual, Nova Iorque Cold Spring Harbor, 1989). A proteína heteróloga produzida de acordo com o método da presente invenção pode ser qualquer proteína que, van tajosamente, possa ser produzida em leveduras. São exemplos destas proteínas a aprotimina, inibidor do ciclo do factor tecidular ou outros inibidores de protease, insulina ou precursores de insulina, hormona de crescimento humana ou bovina -12- -12-
interleucina, glucagon, activador de plasminogénio de tecido, factor ou ^ de crescimento transformante, fac tor de crescimento derivado de plaquetas, enzimas ou um seu análogo funcional. No presente contexto, a designação "anã logo funcional" refere-se a um polipéptido com uma função similar ã da proteína natural (isto é entendido como relati^ vo mais ã natureza do que ao grau de actividade biológica da proteína natural). 0 polipéptido pode ser estruturalmente similar ã proteína natural e pode ser derivado da proteína natural por adição de um ou mais aminoãcidos em qualquer ou em ambas as extremidades dos terminais C e N da proteína na tural, substituição de um ou mais aminoãcidos em um ou vã-rios sítios diferentes da sequência de aminoãcidos natural, supressão de um ou mais aminoãcidos em qualquer ou em ambas as extremidades da proteína natural ou em um ou vários sítios na sequência de aminoãcidos ou inserção de um ou mais aminoãcidos em um ou mais sítios na sequência de aminoãcidos natural. Estas modificações são bem conhecidas para várias das proteínas mencionadas anteriormente.
Podem preparar-se o fragmento de ADN aleatório e a sequência 5'-SP-Xn-3'-RS-5·-Xm-(NZT)p-Xg-PS-*gene*-3’, por via, sintética, aplicando métodos convencionais, por exemplo, o método de fosfoamidite descrito por S. L. Beaucage e Μ. H. Caruthers, Tetrahedron Letters, 22 (1981) 1859-1869, ou o método descrito por Matthes et al., EMBO JOURNAL, 3, (1984) 801-805. De acordo com o método de fosfoamidite, são sinteti zados oligonucleótidos, por exemplo, em um sintetizador automá tico de ADN, purificados e circularizados, ligados e clonados em um vector de expressão de levedura. Deve notar-se que a se -13 quência 5'-SP-X -3'-RS-5'-X -(NZT) -X -PS-*gene*-3' nào necessi ^ n m p q — ta de ser preparada numa única operação mas pode ser formada a partir de dois ou mais oligonucleótidos preparados por sín tese deste modo: 0 fragmento de ADN aleatório ou uma ou mais partes da sequência 5'-SP-Xn~31-RS-5'-X^-(NZT)p-Xg-PS-*gene*-31 pode tam bém ser de origem genómica ou de ADNc, por exemplo, obtido por preparação de uma biblioteca genómica de ADNc e sondagem relaivamente às sequências de ADN que codificam para as refe ridas partes (tipicamente SP ou *gene*) por hibridação, utilizando sondas oligonucleotídicas sintéticas, de acordo com técnicas convencionais (cf. Sambrook, Fritsch e Maniatis , Molecular Cloning: A laboratory Manual, Nova Iorque, Cold Spring Harbor, 1989). Neste caso, pode unir-se uma sequência genómica ou de ADNc, codificadora de um péptido sinal, a uma sequên cia genómica ou de ADNc codificadora da proteína heteróloga , após o que se pode modificar a sequência de ADN por inserção de oligonucleótidos sintéticos que codifiquem a sequência X --3'-RS-5'-Xm~(NZT)p-X^-PS de acordo com procedimentos bem conhecidos .
Finalmente, o fragmento de ADN aleatório e/ou a sequên cia, 5'SP-X -31-RS-5'-X (NZT) -X -PS-*gene*-3' poder ser de n m p q origem mista sintética e genómica, de origem mista sintética e ADNc ou de origem-mista genómica e ADNc preparada por circu larização de fragmentos de origem sintética, genómica ou ADNc (conforme for apropriado), correspondendo os fragmentos a diversas partes da sequência completa de ADN, de acordo com técnicas convencionais. Portanto, deve considerar-se que a sequência de ADN que codifica o péptido sinal ou o polipépt_i -14- -14-
do heterólogo pode ter origem genómica ou origem de ADNc , enquanto a sequência Xn~3'-RS-5'-X^-(NZT)^-X^-PS pode ser preparada por síntese.
As construções preferidas de ADN que codificam precursores de insulina estão apresentadas na lista de sequências ID nOs 1-13 ou suas modificações apropriadas. São exem pios de modificações apropriadas da sequência de ADN as subs^ tituições nucleotídicas que não originam outra sequência de aminoácidos da proteína, mas que podem corresponder ao uso do codão da levedura na qual a construção de ADN está inserida ou substituições nucleotídicas que originam uma sequência de aminoácidos diferente e, portanto, possivelmente, uma estru tura de proteína diferente. Outros exemplos de modificações possíveis são a inserção de três ou múltiplos de três nucleó tidos na sequência, adição de três ou múltiplos de três nu-cleótidos em qualquer das extremidades da sequência e a supressão de três ou múltiplos de três nucleótidos em qualquer das extremidades ou no interior da sequência. 0 sector de expressão recombinante transportando a sequência 5'-SP-Xn~31-RS-5'-Xm-(NZT)p-Xg-PS-*gene*-3' ou 5'-SP-X -ranDNA-X -(NZT) -X -PS-*gene*-3' oode ser qualquer n rr. p q vector capaz de replicação em leveduras. No vector, pode ser ligada, de forma operacional qualquer sequência de ADN a uma sequência de promocor apropriada. 0 promotor, pode ser qua_l quer uma sequência de ADN que exiba actividade transcricional nas leveduras e possa ser derivada de genes que codificam pro teínas homólogas ou heterõlogas para leveduras de preferência o promotor é derivado de um gene que codifica uma proteína homóloga para levedura. Exemplos de promotores apropriados -15- -15-
são o promotor MF 1 de Saccharomyces cerevisiae, TPI, ADH ou PGK.
As sequências citadas anteriormente podem também ser ligadas de forma operacional a um terminador apropriado, por exemplo o terminador TPI [cf. T. Alber e G. Kawasaki, J.
Mol. Appl. Genet.l, (1982) 419-434]. O vector de expressão recombinante da presente inven ção também inclui uma sequência de ADN que permite a replica-ção do vector na levedura. Exemplos destas sequências são os genes REP 1-3 de replicação e de origem de replicação de plasmídeo 2p de levedura. 0 vector pode ainda conter um marcador seleccionável, por exemplo, o gene TPI de Schizosac-charomyces pombe, como descrito por P. R. Russel, Gene, 40 (1985) 125-130.
Os processos utilizados para ligar a sequência 5'-SP-Xn 3 ' -RS-5'-Xm~(NZT)p-X^-PS-*gene*-3', o fragmento de ADN aleatõ rio, o promotor e o terminador, respectivamente, e inseri-los em vectores de levedura apropriados, contendo a informação ne cessaria para replicação de levedura, são bem conhecidos pelos especialistas na matéria (consultar, por exemplo, Sambrook , Fritsch e Maniatis, op. cit.).
Deve considerar-se que o vector pode ser construído quer preparando primeiro uma construção de ADN que contenha a sequência 5'-SP-Xn~RS-5'-Xm~(NZT)p-Xg-PS-*gene*-3' completa e subsequentemente, inserindo este fragmento num vector de expres são apropriado, quer inserindo sequencialmente fragmentos de ADN que contenham a informação genética para os elemntos ind^ viduais (tais como o péptido sinal, a sequência Xn~3'-RS-5'-X^--(NZT)p-Xg ou o polipéptido heterólogo) seguido de ligação. A levedura utilizada no método da presente invenção pode ser qualquer levedura apropriada que, em cultura, produz grandes quantidades do polipéptido heterólogo em causa.
Como exemplos de leveduras apropriadas podem referir--se as estirpes das espécies de leveduras Saccharomyces ceri-visiae, Saccharomyces Kluyveri, Schizosaccharomyces pombe ou Saccharomyces uvarum. Pode efectuar-se a transformação de cé lulas de levedura, por exemplo, pela formação de protoplasma, seguida pela transformação de forma convencional. 0 meio uti. lizado para cultivar as células pode ser qualquer meio apropriado para o desenvolvimento de levedura. A proteína heteró Ioga segregada, uma proporção significativa do que pode estar presente no meio numa forma correctamente processada, pode ser recolhida do meio por técnicas convencionais, incluindo a sepa ração das células de levedura do meio, por centrifugação ou filtração, precipitação dos componentes proteínaoeos do sobre nadante ou filtrado por meio de um sal, por exemplo, sulfato de amónio, seguida de purificação por uma diversidade de técni cas cromatográficas, por exemplo, cromatografia de permuta ió nica, cromatografia de afinidade e outos.
Breve Descrição dos Desenhos A presente invenção é melhor ilustrada, com referência aos desenhos apensos:
Fig. 1 - representa esquematicamente a construção de pMT742<^;
Fig. 2 - representa o esquema da construção de pLaC202;
Fig. 3 - mostra a sequência de ADN e a sequência de amino-ácidos derivada no sítio de clonagem em pLaC202 para fragmen tos de ADN aleatórios (deve notar-se que a sequência está cin -17 dida no único sitio Ciai e que a ligação, sem inserção de ADN aleatório, poderá conduzir ? uma nudança na cadeia de leitura;
Fig. 4 - mostra em esquema a construção defLSC6315Dψ A presente invenção é descrita melhor nos exemplos que seguem que não devem ser considerados como limitando o âm bito da presente invenção, tal como é reivindicada.
Exemplos
Materiais plasmidicos e de ADN
Todos os plasmídeos são do tipo C-POT. Estes plasmí deos estão descritos no pedido de patente de invenção europeia nQ 171142 e são caracterizados por conterem o gene (POT) de triose-fosfato-isomerase de Schizosacclarcinyces pombe com a fi nalidade de esraoilização e selecção de plasmídeos. A estir pe de E. coli depositada com o número 39685 da ATCC permite dispor-se de um plasmídeo contendo o gene POT. Os plasmídeos comportam ainda o promotor e o terminador de triose-íosfato--isomerase de S. cerevisiae (prpp-j· e TTpjp · Eles são idênticos a pMT742 [Egem-Mitani et al., Gene, 73 (1988) 113-120; ver fig. 1] excepto para a região definida pelos sítios de restri ção Sph-Xbal que abrangem o PTpi e a região que codifica para sinal/líder/produto. O PTpi foi modificado no que se refere à sequência encontrada em pMT742, apenas com a finalidade de facilitar o trabalho de construção. Foi eliminado um sítio de restrição Sphl interno por cisão com Sphl, remoção das caudas de ca deia simples e re-ligação. -18-
Além disso, as sequências de ADN a montante e sem qua]. quer impacto no promotor, foram removidas por tratamento com exonuclease Bal31, seguida da adição de um adaptador de sítio de restrição Sphl. Esta construção do promotor presente em um fragmento de 373 pares de bases Sphl-EcoRI é designada PTPI ^ e' ^uan<^° utilizada em plasmídeos já descritos, esta modificação do promotor é indicada pela adição de um ^ ao nome do plasmídeo, por exemplo, pMT742 (fig. 1) . 0 conjunto de vários fragmentos de ADN teve lugar , ocasionalmente, em um plasmídeo de E. coli mais pequeno do tipo pT7, anteriormente descrito (ver WO 89/02463) modificado apenas no que se refere a pTpj< do modo descrito anteriormente, isto é, pT7 L. Para a clonagem aleatória, descrita em seguida, foi utilizado ADN genómico de origens diversas. Iso lou-se ADN de cerevisiae da estirpe MT 633 (depositada a 7 de Dezembro de 1990 na Deutsche Sammlung von Mikroorganismen und Zellkulturen ao abrigo do Tratado de Budapeste sobre o reconhecimento internacional do depósito de microrganismos pa ra os fins de procedimento de patentes de invenção "International Recognition of the Deposit of Microorganisms for the Purpose of Patent Procedure" com o número de depósito DSM 6278). ADN de A. oryzae foi isolada da estirpe A1560 (IFO 4177).
Finalmente foram utilizados muitos fragmentos de ADN sintéticos, tendo sido todos sintetizados em um sintetizador de ADN automático (Applied Biosystems modelo 380A) utilizando fosforamidite e reagentes comerciais [S. L. Beaucage e M, H. Caruthers, Tetrahedron Letters, 22 (1981) 1859-1869]. Os oligonucleótidos foram purificados por electroforese em gel de -19- -19-
poliacrilamida, sob condições de desnaturação. Antes da cir cularização de pares complementares dessas cadeias simples de ADN, estas foram quinisadas por polinucleótido-quinase e ATP.
Todos os outros materiais e métodos utilizados são de conhecimento corrente (J. Sambrook et al., Molecular Clo-ning, A Laboratory Manual, Cold Spring Harbor, Nova Iorque , Cold Spring Harbor, Press, 1989).
Exemplo 1
Construção de pLaC202 0 fragmento de 490 pares de bases, Sphl-Apal de pT7 196 k (ver WO89/02463, fig. 5) e o fragmento Hinfl-Xbal, de 179 pares de bases, de pT7.^£Ml3 ver WO89/02463, fig. 1) juntaram-se no fragmento Xbal-Sphl, de 11 kb, de pMT742, atra vis de um adaptador sintético:
N0R367/373: CAACCATCGATAACACCACTTTGGCTAAGAG
CCGGGTTGGTAGCTATTGTGGTGAAACCGATTCTCTAA originando o plasmídeo pLaC202 (figuras 2 e 3 e Lista de sequências ID η® 1).
Este vector que contém um sítio Ciai único, constitui uma variante do Vector de clonagem de ADN aleatório na qual o gene do produto codifica para o precursor de insulina MI3 (B( 1-29)-Ala-Ala-Lys-A( 1-21)). Os exemplos seguintes dizem respeito aos líderes clonados através desta construção. -20- -20-
Exemplo 2
Isolou-se ADN total da estirpe MT663, de S. ceievisiae e digeriu-se com Taql, HinPI ou Taql+HinPI. Separam-se os digestos em gel de agarose a 1% de acordo com o tamanho e isolaram-se os fragmentos menoresque 600 pares de base de cada uma das três digestões. O pLaC202, digerido previamente com Ciai, impedido de auto-ligação com fosfatase alcalina de intestino de vitela (CIAP), desfosforilação, foi misturado com os conjuntos de fragmentos, descritos antes, e ligado. A estirpe MT172 de E. coli [MT172=MC1000 m+r ara+ leuB-6; (ver M. Casadaban e S. Cohen, J. Mol. Biol., 138 (1980) p.179)] foi transformada com a mistura de ligação, citada an- £ teriormente, obtendo-se 5000 transformantes Ap , aproximada-mente, por cada uma das misturas. Prepararam-se plasmídeos recombinantes de cada um dos três tipos em conjuntos abrangendo todos os 5000 transformantes. Estes conjuntos de plasmídeos foram utilizados para transformar a estirpe MT663 de S. cereviisiae e os transformantes TPI foram sondados por imu-nologia para a secreção de MI3.
Entre o surpreendente grande número de transformantes positivos, as oito aparentemente mais deficientes foram isoladas de novo e destas foi isolado o conteúdo plasmídico.
Como resultado deste procedimento, esperava-se que a maioria dos transformantes de levedura obtidas, tivessem uma população heterogénea de plasmídeos e, para se obterem clones verdadeiros, procedeu-se a um passo de re-isolamento de plasmídeos: As preparações dos plasmídeos de cada uma das oito -21 transformantes de levedura re-isoladas, foram usadas para
D transformar a estirpe MT172 de E. coli em A^. Os plasmí-deos provenientes de 12 transformantes de E. coli, para ca da um dos 8 isolados de levedura, foram utilizados, indivi^ dualmente, para transformar levedura da estirpe MT663 os TPI e os transformantes que segregam M13 foram identificados por sondagem por imunologia. A sequenciação das inserções dos oito isolados derivados de pLaC202 mostrou três sequências diferentes, duas das quais, pLS(.63i5 e pLSC5210, suportam mais eficientemente a secreção de MI3. As sequências de ADN clonadas e as regiões flanqueadoras estão representadas na Lista de Sequências ID nOs 2 e 4, respectivamente.
Exemplo 3
Modificações de pLSC6315
Foi escolhido pLSC6315 para posterior modificação da sequência líder sintética clonada. 0 pLSC6315 foi digerido com endonuclease Apal seguido de tratamento com endonuclease Bal31. Após a extracção com fenol digeriu-se o ADN resultante, com Xbal e isolaram-se fra£ mentos de ADN mais pequenos que o fragmento original de 367 p.b Apal-Xbal. 0 pLaC202 foi digerido com Ciai e as caudas de CG de cadeia única geradas foram removidas, seguindo-se a digestão por Xbal e isolamento do fragmento XbaI-C3«M"] [" indica que as caudas de cadeia única foram separadas). -22- -22-
Este fragmento foi misturado com fragmentos pLSC6415 isolados anteriormente, e ligado (fig. 6).
Repetiram-se a transformação e a técnica de sondagem descritas no Exemplo 2 e isolaram-se pLSC3615D3 e pLSC6315D7 como plasmídeos suportando a secreção de M13 mais eficientemente do que o pLSC6315 original (ver Listas de Sequências ID nQs 6 e 8, respectivamente).
Exemplo 4
Construção de pLA01-5
Tratou-se ADN de Aspergillus oryzae da estirpe Λ1560 do modo descrito anteriormente no Exemplo 2 para ADN de S_;_ cere-visiae e procedeu-se ã clonagem e reclonagem exactamente do modo descrito no Exemplo 2 com a excepção de se ter reduzido o número de transformantes de E. coli na primeira clonagem, pa ra aproximadamente 30u0 por mistura de ligação . Esta experiên cia resultou no isolamento de cinco clones de ADN de A. oryzae que no contexto de pLaC202 medeia a secreção do precursor de insulina M13 de S. cerevisiae. A sequenciação das inserções mostrou cinco sequências diferentes, duas das quais (pLA02 e pLA05) são mais suficientes no que se refere ã secreção de M13.As sequência das inser ções de ADN EM PLA02 e pLA05 estão presentes, conjuntamente com as regiões flanqueadoras, na Lista de Sequências ID números 10 e 12, respectivamente. -23- -23-
Exemplo 5
Estirpes de levedura, comportando os plasmídeos descri tos anteriormente, desenvolveram-se em meio YPD (Sherman, F. et al., Methods in Yeast Genetics, Cold Spring Habor Labora-tory, 1981) . Para cada estirpe, agitaram-se 6 culturas indi^ viduais, durante 60 horas com um D^qq final de 15, aproxima damente. Após centrifugação removeu-se o sobrenadante que se submeteu a análise or HPLC para determinação da concentração do precursor de insulina segregado de acordo com o método de^ crito por Leo Snel et al., Chromatographia 24, (1987), 329-332.
No Quadro 1 os níveis de expressão do precursor de in sulina, MI3, pela utilização de sequências líder isoladas de acordo com a presente invenção, são expressos em percentagem do nível obtido com transformantes de pMT742 k utilizando o MF (1) líder de S. cerevisiae.
Quadro pMT742 100% pLSC6315 100% pLSC5210 60% pLSC6315D3 175% pLSC6315D7 120% pLA02 120% pLA05 60% -24- -24-
LISTA DE SEQUÊNCIAS 1) INFORMAÇÃO GERAL:
(i) REQUERENTE: Novo Nordisk A/S (ii) TÍTULO DA INVENÇÃO: Processo para a preparação de sequências líder sintéticas (iii) N0MERO DE SEQUÊNCIAS: 13 (iv) ENDEREÇO: (A) ENDEREÇO: Novo Nordisk A/S, Patent Department (B) RUA: Novo Alie (C) CIDADE: Bagsvaerd (E) PAÍS: Dinamarca (F) ZIP: DK-2880 (v) FORMA DE LEITURA COMPUTARIZADA: (A) TIPO DE MEIO: Disco Floppy (B) COMPUTADOR: IBM PC compatível
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patent In Release φΐ.0, Version#1.25 (vi) DADOS HABITUAIS DO PEDIDO: (A) NCMERO DO PEDIDO:
(B) DATA DO DEPÓSITO (C) CLASSIFICAÇÃO:
(Viii) AGENTE/INFORMAÇÃO DO AGENTE (A) NOME: Thalsoe-Madsen, Birgit (C) REFERÊNCIA N0MERO: 3540.2 04-WO (ix) INFORMAÇÃO PARA TELECOMUNICAÇÃO: (A) TELEFONE: +45 4444 8888 (B) TELEFAX: +45 4449 3256 (C) TELEX: 37304 -25 2) INFORMAÇÃO PARA SEQ,ID NO:l: (i) CARACTERlSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 335 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:l: GAATTCATTC AAGAATAGTT CAAACAAGAA GATTACAAAC TATCAATTC ATACACAATA 60 TAAACGATTA AAAGAATGAA AGTCTTCCTG CTGCTTTCCC TCATTGGATT CTGCTGGGCC 120 CAACCATCGA TAACACCACT TTGGCTAAGA GATTCGTTAA CCAACACTTG TGCGGÍTCCC 180 ACTTGGTTGA AGCTTTGTAC TTGGTTTGCG GTGAAAGAGG TTTCTTCTAC ACTCCTAAGG 240 CTGCTAAGGG TATTGTCGAA CAATGCTGTA CCTCCATCTG CTCCTTGTAC CAATTGGAAA 300 ACTACTGCAA CTAGACGCAG CCCGCAGGCT CTAGA 335 (2) INFORMAÇÃO PARA A SEQ ID NO:2: (i) CARACTERlSTICAS DA SEQUÊNCIA. (A) COMPRIMENTO: 492 pares de bases (B) TIPO: ácido nucleico (C) CADEIA : única (D) : TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc (ix) CONFIGURAÇÃO:
(A) NOME/CHAVE: CDS (B) SITUAÇÃO: 76..468 -26- -26-
(ix) CONFIGURAÇÃO: (A) NOME/CHAVE· sin._péptido (B) SITUAÇÃO: 76..309 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: mat. péptido (B) CONFIGURAÇÃO: 310..468 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:2: GAATTCATTC AAGAATAGTT CAAACAAGAA GATTACAAAC TATCAATTTC ATACACAATA 60 TAAACGATTA AAAGA ATG AAA GTC TTC CTG CTG CTT TCC CTC ATT GGA TTC 111
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe -78 -75 -70 TGC TGG GCC CAA CCA TCG ATA GAT GGA ACA CAT TTT CCG AAC AAC AAT 159 Cys Trp Ala Gin Pro Ser Ile Asp Gly Thr His Phe Pro Asn Asn Asn -65 -60 -55 GTC CCA ATA GAC ACA AGA AAA GAA GGA CTA CAG CAT GAT TAC GAT ACA 207 Vai Pro Ile Asp Thr Arg Lys Glu Gly Leu Gin His Asp Tyr Asp Thr -50 -45 -40 -35 GAA ATT TTG GAG CAC ATT GGA AGC GAT GAG TTA ATT TTG AAT GAA GAG 255 Glu Ile Leu Glu His Ile Gly Ser Asp Glu Leu Ile leu Asn Glu Glu -30 -25 -20 TAT GTT ATT GAA AGA ACT TTC CAA GCC GAT ATC GAT AAC ACT TTG GCT 303 Tyr Vai Ile Glu Arg Thr Leu Gin Ala Ile Asp Asn Thr Thr Leu Ala -15 -10 -5 AAG AGA TTC GTT AAC CAA CAC TTG TGC GGT TCC CAC TTG GTT GAA GCT 351 Lys Arg Phe Vai Asn Gin His Leu Cys Gly Ser His Leu Vai Glu Ala 15 10 -27-
Lr. TTG TAC TTG GTT TGC GGT GAA AGA GGT TTC TTC TAC ACT CCT AAG GCT 399 Leu Tyr Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala 15 20 25 30 GCT AAG GGT ATT GTC GAA CAA TGC TGT ACC TCC ATC TGC TCC TTG TAC 447 Ala Lys Glu Ile Vai Glu Gin Cys Cys Thr Ser Ile Cys Ser Leu Thr 35 40 45 CAA TTG GAA AAC TAC TGC AAC TAGACGCAGC CCGCAGGCCTC TAGA 492 Gin Leu Glu Asn Tyr Cys Asn 50 (2) INFORMAÇÃO PARA A SEQ ID NO:3: (i) Características da sequência: (A) COMPRIMENTO: 131 aminoácidos (B) TIPO: aminoãcido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:3:
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe Cys Trp Ala Gin -78 -75 -70 -65 Pro Ser Ile Asp Gly Thr His Phe Pro Asn Asn Asn Vai Pro Ile Asp -60 -55 -50 Thr Arg Lys Glu Gly Leu Gin His Asp Tyr Asp Thr Glu Ile Leu Glu -45 -40 -35 His Ile Gly Ser Asp Glu Leu Ile Leu Asn Glu Glu Tyr Vai Ile Glu -30 -25 -20 -15 Arg Thr Leu Gin Ala Ile Asp Asn Thr Thr Leu Ala Lys Arg Phe Vai -10 1 -5 -28-
L
Asn Gin His Leu Cys Gly Ser His Leu Vai Glu Ala Leu Tyr Leu Vai 5 10 15
Cys Gly Glu Arg Gly Phe Ph* Tyr Thr Pro Lys Ala Ala Lys Gly Ile 20 25 30
Vai Glu Gin Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gin Leu Glu Asn 35 40 45 50
Tyr Cys Asn (2) INFORMAÇÃO PARA A SEQ ID NO:4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 420 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA:cDNA (ix) CONFIGURAÇÃO:
(A) NOME/CHAVE: CDS (B) SITUAÇÃO: 76..396 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: sig_péptido (B) SITUAÇÃO: 76..237 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: mat._péptido (B) SITUAÇÃO: 238..396 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:4:
GAATTCATTC AAGAATAGTT CAAACAAGAA GATTACAAAC TATCAATTTC 60
ATACACAATA -29- /
V TAAACGATTA AAAGA ATG AAA GTC TTC CTG CTG CTT TCC CTC ATT GGA TTC 111
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe -54 -50 -45 TGC TGG GCC CAA CCA TCG CTA TTG GAG TCA CTT ACG CTC GTT GAT GTT 159 Cys Trp Ala Gin Pro Ser Leu Leu Glu Ser Leu Thr Leu Vai asp Vai -40 -35 -30 GAC CGA CTG TCG GAT ATT GAT GTA CTT GTT GAG TCT GAA ACG CTT GTG 207 Asp Ala Leu Ser Asp Ile Asp Vai Leu Vai Glu Ser Glu Thr Leu Vai -25 -20 -15 CTT GTC GAT AAC ACC ACT TTG GCT AAG AGA TTC GTT AAC CAA CAC TTG 25 5 Leu Vai Asp Asn Thr Thr Leu Ala Lys Arg Phe Vai Asn Gin His Leu -10 -5 1 5 TGC GGT TCC CAC TTG GTT GAA GCT TTG TAC TTG GTT TGC GGT GAA AGA 303 Cys Gly Ser His Leu Vai Glu Ala Leu Tyr Leu Vai Cys Gly Glu Arg 10 15 20 GGT TTC TTC TAC ACT CCT AAG GCT GCT AAG GGT ATT GTC GAA CAA TGC 351 Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys Gly Ile Vai Glu Gin Cys 25 30 35 TGT ACC TCC ATC TGC TCC TTG TAC CAA TTG GAA AAC TAC TGC AAC 396 Cys Thr Ser Ile Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 40 45 50 TAGACGCAGC CCGCAGGCTC TAGA 420 ,2) INFORMAÇÃO PARA A SEQ ID NO:5: (i) CARACTERlSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 107 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear -30- -30-
(ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:5:
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe Cys Trp Ala Gin -54 -50 -45 -40 Pro Ser Leu Leu Glu Ser Leu Thr Leu Vai Asp Vai Asp Ala Leu Ser -35 -30 -25 Asp Ile Asp Vai Leu Vai Glu Ser Glu Thr Leu Vai Leu Vai Asp Asn -20 -15 -10 Thr Thr Leu Ala Lys Arg Phe Vai Asn Gin His Leu Cys Gly Ser His -5 1 5 10 Leu Vai Glu Ala Leu Thr Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr 15 20 25 Thr Pro Lys Ala Ala Lys Gly Ile Vai Glu Gin Cys Cys Thr Ser Ile 30 35 40 Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 45 50 (2) INFORMAÇÃO PARA A SEQ ID NO:6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 453 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: única
(D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: cDNA (ix) CONFIGURAÇÃO:
(A) NOME:CHAVE: CDS (B) SITUAÇÃO: 76..420 -31- -31-
(ix) CONFIGURAÇÃO: (A) NOME/CHAVE: sig-péptido (B) SITUAÇÃO: 76..270 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: mat.péptido (B) SITUAÇÃO: 271..420 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:6: GAATTCATTC AAGAATAGTT CAAACAAGAA GATTACAAAC TATCAATTTC ATACACAATA 60 TAAACGATTA AAAGA ATG AAA GTC TTC CTG CTG CTT TCC CTC ATT GGA TTC 111
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe -65 -60 -55 TGC TGG GCC CAA CAA ATA GAC ACA AGA AAA GAA GGA CTA CAG CAT GAT 159 Cys Trp Ala Gin Pro Ile Asp Thr Arg Lys Glu Gly Leu Gin His Asp -50 -45 -40 TAC GAT ACA GAA ATT TTG GAG CAC ATT GGA AGC GAT GAG TTA ACC CCG 207 Tyr Asp Thr Glu Ile Leu Glu His Ile Gly Ser Asp Glu Leu Thr Pro -35 -30 -25 AAT GAA GAG TAT GTT ATT GAA AGA ACT TTG CCA GCC ATC GAT AAC ACC 255 Asn Glu Glu Tyr Vai Ile Glu Arg Thr Leu Gin Ala Ile Asp Asn Thr -20 -15 -10 ACT TTG GCA AAG AGA TTC GTT AAC CAA CAC TTG TGC GGT TCC CAC TTG 303 Thr Leu Ala Lys Arg Phe Vai Asn Gin His Leu Cys Gly Ser His Leu -5 1 5 10 GTT GAA GCT TTG TAC TTG GTT TGC GGT GAA AGA GGT TTC TTC TAC ACT 351 Vai Glu Ala Leu Tyr Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr 15 20 25 -32-
L / * CCT AAG GCT GCT AAG GGT ATT GTC GAA CAA TGC TGT ACC TCC ATC TGC 399 Pro Lys Ala Ala Lys Gly Ile Vai Glu Gin Cys Cys Thr Ser Ile Cys 30 35 40 TCC TTG TAC CAA TTG GAA AAC TACTGCAACT AGACGCAGCC CGCAGGCTCT 450 Ser Leu Tyr Gin Leu Glu Asn 45 50 AGA 453 (2) INFORMAÇÃO PARA A SEQ ID NO:7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 115 aminoácidos (B) TIPO: arainoácido (D): TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 7: Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe Cys Trp Ala Gin -65 -60 -55 -50 Pro Ile Asp Thr Arg Lys Glu Gly Leu Gin His Asp Tyr Asp Th r Glu -45 -40 -35 Ile Leu Glu His Ile Gly Ser Asp Glu Leu Thr Pro Asn Glu Glu Tyr -30 -25 -20 Vai Ile Glu Arg Thr Leu Gin Ala Ile Asp Asn Thr Thr Leu Ala Lys -15 -10 -5 Arg Phe Vai Asn Gin His Leu Cis Gly Ser His Leu Vai Glu Ala Leu 1 5 10 15 Tyr Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala 20 25 30 -33-
Lr
Lys Gly Ile Vai Glu Gin Cys Cys Thr Ser Ile Cys Ser Leu Tvr Gin 35 40 45
Leu Glu Asn 50 (2) INFORMAÇÃO PARA A SEQ ID NO:8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 459 pares de bases (B) TIPO : ácido nucleico (C) CADEIA: única (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: cDNA (ix) CONFIGURAÇÃO:
(A) NOME/CHAVE: CDS (B) SITUAÇÃO: 76..435 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: sÍg_?éptido (B) SITUAÇÃO: 76..276 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: mat._péptido (B) SITUAÇÃO: 277..435 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:8:
GAATTCATTC AAGAATAGTT CAAACAAGAA GATTACAAC TATCAATTTC ATACACAATA 60 TAAACGATTA AAAGA ATG AAA GTC TTC CTG CTG CTT TCC CTC ATT GGA TTC 111
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe -67 -65 -60 -34- TGC TGG GCC CAA CCT GTC CCA ATA GAC ACA AGA AAA GAA GGA CTA CAG 159 Cys Trp Ala Gin Pro Vai Pro Ile Asp Thr Arg Lys Glu Gly Leu Gin -55 -50 -45 -40 CAT GAT TAC GAT ACA GAA ATT TTG GAG CAC ATT GGA AGC GAT GAG TTA 207 His Asp Tyr Asp Thr Glu Ile Leu Glu His Ile Gly Ser Asp Glu Leu -35 -3 0 -25 ACC CCG AAT GAA GAG TAT GTT ATT GAA AGA ACT TTG CAA GCC ATC GAT 255 Thr Pro Asn Glu Glu Tyr Vai Ile Glu Arg Thr Leu Gin Ala Ile Asp -20 -15 -10 AAC ACC ACT TTG GCT AAG AGA TTC GTT AAC CAA CAC TTG TGC GGT TCC 303 Asn Thr Thr Leu Ala Ly s Arg Phe Vai Asn Gin His Leu Cys Gly Ser -5 1 5 CAC TTG GTT GAA GCT TTG TAC TTG GTT TGC GGT GAA AGA GGT TTC TTC 351 His Leu Vai Glu Ala Leu Tyr Leu Vai Cys Gly Glu Arg Gly Phe Phe 10 15 20 25 TAC ACT CCT AAG GCT GCT AAG GGT ATT GTC GAA CAA TGC TGT ACC TCC 399 Tyr Thr Pro Lys Ala Ala Lys Gly Ile Vai Glu Gin Cys Cys Thr Ser 30 35 40 ATC TGC TCC TTG TAC CAA TTG GAA AAC TAC TGC AAC TAGACGCAGC 445 Ile Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 45 50 CCGCAGGCTC TAGA 459 (2) INFORMAÇÃO PARA A SEQ ID NO:9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: 120 aminoácidos (A) COMPRIMENTO: 120 aminoácidos (B) TIPO: aminoácido -35- (C) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:9:
MetLys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe Cys Trp Ala Gin
-67 -65 -60 Pro Vai Pro Ile Asp Thr Arg Lys -50 -45 Thr Glu Ile Leu Glu His Ile Gly -35 -30 Glu Tyr Vai Ile Glu Arg Thr Leu -15 Ala Lys Arg Phe Vai Asn Gin His 1 5 Ala Leu Tyr Leu Vai Cys Gly Glu 15 20 Ala Ala Lys Gly Ile Vai Glu Gin 30 35 Tyr Gin Leu Glu Asn Tyr Cys Asn 50 -55
Glu Gly Leu Gin His Asp Tyr Asp -40
Ser Asp Glu Leu Thr Pro Asn Glu -25 -20
Gin Ala Ile Asp Asn Thr Thr Leu -10 -5
Leu Cys Gly Ser His Leu Vai Glu 10
ArgGly Phe Phe Tyr Thr Pro Lys 25
Cys Cys Thr Ser Ile Cys Ser Leu 40 45 (2) INFORMAÇÃO PARA A SEQ ID NO:10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 408 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: única (D) TOPOLOGIA: linear -36 - -36 -
(ii) TIPO DE MOLÉCULA: cDNA (ix) CONFIGURAÇÃO:
(A) NOME/CHAVE: CDS (B) SITUAÇÃO: 76..384 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: siç-péptido (B) SITUAÇÃO: 76.225 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: mat-péptido (B) SITUAÇÃO: 226..384 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:10: GAATTCATTC AAGAATAGTT CAAACAAGAA GATTACAAAC TATCAATTTC ATACACAATA 60 TAAACGATTA AAAGA ATG AAA GTC TTC CTG CTG CTT TCC CTC ATT GGA TTC 111
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe -50 -45 -40 TGC TGG GCC CAA CCA TCG ATC TTG GAT TAT GTT GAC TTG GGT GCG GAA 159 Cys Trp Ala Gin Pro Ser Ile Leu Asp Tyr Vai Asp Leu Gly Ala Glu -35 -30 -25 CTG ATC TCC ATT CGT GGG TAT GAT AAC CTC AAC GAC GCG ATC GAT AAC 207 Leu Ile Ser Ile Arg Gly Tyr Asp Asn Leu Asn Asp Ala Ile Asp Asn -20 -15 -10 ACC ACT TTG GCT AAG AGA TTC GTT AAC CAA CAC TTG TGC GGT TCC CAC 255 Thr Thr Leu Ala Lys Arg Phe Vai Asn Gin His Leu Cys Gly Ser His -5 1 5 10 -37-
Lr TTG GTT GAA GCT TTG TAC TTG GTT TGC GGT GAA AGA GGT TTC TTC TAC 303 Leu Vai Glu Ala Leu Tyr Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr 15 20 25 ACT CCT AAG GCT GCT AAG GGT ATT GTC GAA CAA TGC TGT ACC TCC ATC 351 Thr Pro Lys Ala Ala Lys Gly Ile Vai Glu Gin Cys Cys Thr Ser Ile 30 35 40 GTC TCC TTG TAC CAA TTG GAA AAC TAC TGC AAC TAGACGCAGC CCGCAGGCTC 40* Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 45 50 408
TAGA (2) INFORMAÇÃO PARA A SEQ ID NO:11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 103 aminoãcidos (B) TIPO aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULAS: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:11:
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe Cys Trp Ala Gin -50 -45 -40 -35 Pro Ser Ile Leu Asp Tyr Vai Asp Leu Gly Ala Glu Leu Ile Ser Ile -30 -25 -20 Arg Gly Tyr Asp Asn Leu Asn Asp Ala Ile Asp Asn Thr Thr Leu Ala -15 -10 -5 Lys Arg Phe Vai Asn Gin His Leu Cys Gly Ser His Leu Vai Glu Ala 10 1 5
L
BAD ORIGINAL -38-
Leu Tyr Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala 15 20 25 30
Ala Lys Gly Ile Vai Glu Gin Cys Cys Thr Ser Ile Cys Ser Leu Tyr 35 40 45
Gin Leu Glu Asn Tyr Cys Asn 50 (2) INFORMAÇÃO PARA SEQ ID NO:12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 372 pares de bases (B) TIPO: ácido nucleico (C) CADEIA: única (D) : TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: cDNA (ix) CONFIGURAÇÃO:
(A) NOME/CHAVE: CDS (B) SITUAÇÃO: 76..348 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: sig_péptldo (B) SITUAÇÃO: 76..189 (ix) CONFIGURAÇÃO: (A) NOME/CHAVE: mat_péptido (B) SITUAÇÃO: 190..348 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:12:
GAATTCATTC AAGGAATAGTT CAAACAAGAA GATTACAAAC TATCAATTTC 60
ATACACAATA -39- TAACGATTA AAAGA ATG AAA GTC TTC CTG CTG CTT TCC CTC ATT GGA TTC 111 Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe -38 -35 -30 TGC TGG GCC CAA CCA TCG CAC ACT ACC ATC GGC ACC GCA ACT GAC AAA 159 Cys Trp Ala Gin Pro Ser His Thr Thr Ile Gly Thr Ala Thr Asp Lys -25 -20 -15 AAC ATC GAT AAC ACC ACT TTG GCT AAG AGA TTC GTT AAC CAA CAC TTG 207 Asn Ile Asp Asn Thr Thr Leu Ala Lys Arg Phe Vai Asn Gin His Leu -10 -5 -1 5 TGC GGT TCC CAC TTG GTT GAA GCT TTG TAC TTG GTT TGC GGT GAA AGA 255 Cys Gly Cer His Leu Vai Glu Ala Leu Tyr Leu Vai Cys Gly Glu Arg 10 15 20 GGT TTC TTC TAC ACT CCT AAG GCT GCT AAG GGT ATT GTC GAA CAA TGC 303 Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys Gly Ile Vai Glu Gin Cys 25 30 35* TGT ACC TCC ATC TGC TCC TTG TAC CAA TTG GAA AAC TAC TGC AAC 348 Cys Thr Ser Ile Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 40 45 50 TAGACGCAGC CCGCAGGCT TAGA 372 (2) INFORMAÇÃO PARA A SEQ ID NO:13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 91 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína -4Q- (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:13:
Met Lys Vai Phe Leu Leu Leu Ser Leu Ile Gly Phe Cys Trp Ala Gin -38 -35 -30 -25
Pro Ser His Thr Thr Ile Gly Thr Ala Thr Asp Lys Asn Ile Asp Asn -20 -15 -10
Thr Thr Leu Ala Lys Arg Phe Vai Asn Gin His Leu Cys Gly Ser His -5 15 10
Leu Vai Glu Ala Leu Tyr Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr 15 20 25
Thr Pro Lys Ala Ala Lys Gly Ile Vai Glu Gin Cys Cys Thr Ser Ile 30 35 40
Cys Ser Leu Tyr Gin Leu Glu Asn Tyr Cys Asn 50 45

Claims (28)

1
R E IVINDICAÇÕES 1.- Processo para a preparação de sequências peptí-dicas líder sintéticas para segregarem polipeptidos heterólogos em leveduras, caracterizado pelo facto: a) de se inserir um fragmento de ADN aleatório em um vector de expressão de uma levedura contendo uma sequência de fórmula geral 5'-SP-X -3'-RS-5'-X -(NZT) -X -PS-*gene*-3' n m p q na qual SP representa uma sequência de ADN que codifica para um péptido sinal; representa uma sequência de ADN que codifica n aminoácidos, representando, n zero ou um 2
número inteiro de 1 a cerca de 10 aminoácidos; RS representa um sitio de reconhecimento de uma endonuclease de restrição para inserção de fragmentos de ADN aleatórios, cujo sítio citado é proporcionado na junção da sequência repre sentada por X^ e da sequência representada por X ; m X representa uma sequência de ADN que codifica m aminoácidos, e m representa zero ou um número inteiro de 1 a cerca de 10; (NZT)p representa uma sequência de ADN que codifica para Asn-Xaa-Thr, representando p zero ou 1; X representa uma sequência de ADN que codifica para q aminoácidos, reprensentado q zero ou um número inteiro de 1 a cerca de 10; PS representa uma sequência de ADN que codifica para um péptido que delimita um sítio de processamento de levedura; e *gene* representa uma sequência de ADN que codi fica para um polipeptido heterólogo; b) de se transformar, com o vector de expressão, ob tido na fase a), uma célula de levedura hospe deira ; 3
c) de se cultivar, sob condições apropriadas, a célu la hospedeira transformada obtida na fase b); e d) de se separar a cultura obtida na fase c) para a segregação do polipeptido heterólogo.
2. - Processo de acordo com a reivindicação 1, carac terizado pelo facto de o fragmento de ADN aleatório inserido no vector ser de origem genómica ou sintética.
3. - Processo de acordo com uma qualquer das reivindicações 1 ou 2, caracterizado pelo facto de o fragmento de ADN aleatório ter um comprimento de 6 a cerca de 600 pares de ba ses.
4.- Processo de acordo com uma qualquer das reivindicações 1 a 3, caracterizado pelo facto de o fragmento de ADN aleatório codificar para uma proporção elevada de aminoácidos polares.
5. - Processo de acordo com uma qualquer das reivin dicações 1 a 4, caracterizado pelo facto de o fragmento de ADN aleatório codificar pelo menos uma prolina.
6. - Processo de acordo com a reivindicação 1, carac terizado pelo facto de os símbolos n e/ou m e/ou representarem um nú
mero igual ou maior do que 1.
7,- Processo de acordo com a reivindicação 1, carac terizado pelo facto de o símbolo p representar o número 1. 3.- Processo de acordo com a reivindicação 1, carac terizado pelo facto de SP representar uma sequência de ADN que codifica para o péptido sinal de factor-Qi, o péptido sinal de amilase de saliva de murganho, o péptido sinal de carboxipepti-dase, o péptido sinal BARl de levedura, ou o péptido sinal de lipase de Humicola lanuginosa ou um seu derivado.
9.- Processo de acordo com a reivindicação 1, carac terizado pelo facto de PS representar uma sequência de ADN que codifica para Lys-Arg, Arg-Lvs, Lys-Lys, Arg-Arg ou Ile-Glu--Gly-Arg.
10.- Processo de acordo com a reivindicação 1, carac terizado pelo facto de se escolher o polipeptido heterólogo no grupo constituído por aprotinina, inibidor da via do factor de tecido ou outros inibidores de protease, insulina ou precursores de insulina, hormona de crescimento humana ou bovina, inter leucina, glucagon, activador do plasminogénio de tecido, factor de crescimento transformante ou p , factor de crescimento de rivado de plaquetas, enzimas ou um seu análogo funcional. 5
11.- Processo de acordo ccm a reivindicação 1, ca- racterizado pelo facto de o vector de clonagem de expressão de levedura conter a sequência de fórmula geral 5'-SP-X -3'-RS-5'-X - (NZT) -X -PS-*gene*-3 ' n m p q ^ na qual SP representa uma sequência de ADN que codifica para um péptido sinal; representa uma sequência de ADN que codifica n aminoácidos, representando n zero ou um número inteiro de 1 a cerca de 10 aminoácidos; RS representa um sítio de reconhecimento de uma endonuclease de restrição, proporcionado na junção de X e X ; n m Xm representa uma sequência de ADN que codifica m aminoácidos representando m zero ou um número inteiro de 1 a cerca de 10; (NZT)^ representa uma sequência de ADN que codi fica para Asn-Xáa-Thr, e p representa zero ou 1; Xq representa uma sequência de ADN que codifica para q aminoácidos, representando q zero ou um número inteiro de 1 a cerca de 10; PS representa uma sequência de ADN que codifica para um péptido que define um sítio de processa mento de levedura; e 6 ί *gene* representa uma sequência de ADN que codi fica para um péptido heterólogo.
12. - Processo de acordo com a reivindicação 11, ca-racterizado pelo facto de os símbolos n e/ou m e/ou q representarem o número 1 ou um número maior do que 1.
13. - Processo de acordo com a reivindicação 11, ca racterizado pelo facto de o símbolo p representar o número 1.
14. - Processo de acordo com a reivindicação 11, ca racterizado pelo facto de SP representar uma sequência de ADN que codifica para o péptido sinal de factor-Cyi , o péptido sinal de amilase de saliva de murganho, o péptido sinal de car-boxipeptidase ou o péptido sinal BARl de levedura.
15. - Processo de acordo com a reivindicação 11, ca racterizado pelo facto de PS representar uma sequência de ADN que codifica para Lys-Arg, Arg-Lys, Arg-Arg, Lys-Lys ou Ile-Glu-Gly-Arg.
16.- Processo de acordo com a reivindicação 11, ca racterizado pelo facto de se escolher o polipeptído heterólo-go no grupo constituído por aprotinina, inibidor da via extrínseca ou outros inibidores de protease, insulina ou precursores 7
de insulina, hormona de crescimento humana ou bovina, interleu-cina, glucagon, activador de plasminogénio de tecido, factor de crescimento transformante^ ou ^ , factor de crescimento derivado de plaquetas, enzimas, ou um seu análogo funcional.
17,- Processo de acordo com a reivindicação 1, ca- racterizado pelo facto de o vector de expressão de levedura con ter a sequência de fórmula geral 5'-SP-X -ranDNA-X - (NZT) -X -PS-*gene*-3’ n m p <3 na qual SP representa uma sequência de ADN que codifica para um péptido sinal; Xn representa uma sequência de ADN que codifica para n aminoácidos, representando n zero ou ura número inteiro de 1 a cerca de 10 aminoácidos ; ranADN representa um fragmento aleatório de ADN inserido em um sítio de reconhecimento de uma endonuclease de restrição proporcionado na junção das sequências representados por X e X ; n m' Xm representa uma sequência de ADN que codifica para m aminoácidos, representando m zero ou um número inteiro de 1 a cerca de 10; (NZT)p representa uma sequência de ADN que codi. 8 Ο fica para Asn-Xaa-Thr, representando p zero ou 1; X representa uma sequência de ADN que codifica q aminoácidos, representando q zero ou um número inteiro de 1 a cerca de 10; PS representa uma sequência de ADN que codifica para um péptido que define um sítio de processa mento de levedura; e *gene* representa uma sequência de ADN que codi fica para um polipeptido heterõlogo, codificando a sequência representada por Xn-Xq para a sequência líder.
18. - Processo de acordo com a reivindicação 17, ca-racterizado pelo facto de o fragmento de ADN aleatório inserido no vector ser de origem genómica ou sintética.
19. - Processo de acordo com uma das reivindicações 17 ou 18, caracterizado pelo facto de o fragmento de ADN aleatório ter um comprimento de 6 a cerca de 600 pares de bases.
20. - Processo de acordo com uma qualquer das reivin dicações 17 a 19, caracterizado pelo facto de o fragmento de ADN aleatório codificar para uma grande proporção de aminoácidos polares. 9
21,- Processo de acordo com uma qualquer das reivin dicações 17 a 20, caracterizado pelo facto de o fragmento de ADN aleacório codificar para pelo menos uma prolina.
22. - Processo de acordo com a reivindicação 17, ca-racterizado pelo facto de n e/ou m e/ou q serem iguais a 1 ou representarem números maiores do que 1,
23. - Processo de acordo com a reivindicação 17, ca racterizado pelo facto de o símbolo p representar 1.
24. - Processo de acordo com a reivindicação 17, ca-racterizado pelo facto de SP representar uma sequência de ADN que codifica.para o péptido sinal de factor-^t, o péptido sinal de amilase de saliva de murganho, o péptido sinal de carboxipe£ tidase, o péptido sinal BARl de levedura, o péptido sinal de li pase de Humicola lanuginosa,ou um seu derivado.
25. - Processo de acordo com a reivindicação 17, ca racterizado pelo facto de PS representar uma sequência de ADN que codifica Lys-Arg, Arg-Lys, Arg-Arg, Lys-Lys ou Ile-Glu-Gly--Arg.
26.- Processo de acordo com a reivindicação 1, ca-racterizado pelo facto de se escolher o polipeptido heterólogo 10
no grupo constituído por aprotinina, inibidor da via extrínseca do factor de tecido ou outros inibidores de protease, insulina ou precursores de insulina, hormona de crescimento humana ou bovina, interleucina, glucagon, activador de plasminogénio de tecido, factor de crescimento transformante ou p , factor de crescimento derivado de plaquetas, enzimas, ou um seu anãlo go funcional.
27. - Célula de levedura, caracterizada pelo facto de ser capaz de exprimir um polipeptido heterólogo e de ser transformada com um vector de expressão de levedura obtido de acordo com uma qualquer das reivindicações 11 a 16.
28. - Célula de levedura, caracterizada pelo facto de ser capaz de exprimir um polipeptido heterólogo e de ser transformada com um vector de expressão de levedura obtido de acordo com uma qualquer das reivindicações 17 a 26.
29. - Processo para a preparação de polipeptidos he-terólogos em levedura, caracterizado pelo facto de se cultivar uma célula de levedura capaz de exprimir um polipeptido heterólogo e que foi transformada com um vector de expressão de levedura de acordo com uma qualquer das reivindicações 17 a 26, incluindo uma sequência peptídica líder preparada de acordo com o processo descrito na reivindicação 1, em um meio apropriado 11
cara a crrer.^ao aa expressão e secreção de un rclict :ciioectazo r.e ro.oco s —3, em sepuraa, se recanerar do mele teròlocc citado antes. Λ Afant· Oficial α· Propriedade Indusiriaí
BAD ORIGINAL L·-__—___
12
ιι '.r QU V o lt Descreve-se um processo para a preparação de sequên cias líder sintéticas para segregarem polipeptidos heterõlogos em leveduras, que consiste na inserção de um fragmento de ADN aleatório em um vector de expressão de uma levedura que contém uma sequência de fórmula geral 5'-SP—X -3'-RS-5'-X - (NZT) -X -PS-*gene*-3’ n m p q em transformar uma célula de levedura hospedeira com o vector de expressão obtido, em cultivar a célula hospedeira transformada sob condições apropriadas e em separar a cultura obtida para a segregação do polipeptido heterõloço.
PT99848A 1990-12-19 1991-12-18 Processo para a preparacao de sequencias lider sinteticas PT99848A (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DK300090A DK300090D0 (da) 1990-12-19 1990-12-19 Fremgangsmaade til fremstilling af leadersekvenser

Publications (1)

Publication Number Publication Date
PT99848A true PT99848A (pt) 1993-06-30

Family

ID=8118017

Family Applications (1)

Application Number Title Priority Date Filing Date
PT99848A PT99848A (pt) 1990-12-19 1991-12-18 Processo para a preparacao de sequencias lider sinteticas

Country Status (17)

Country Link
EP (1) EP0563175A1 (pt)
JP (1) JPH06503957A (pt)
KR (1) KR930703450A (pt)
AU (1) AU660161B2 (pt)
CA (1) CA2098731A1 (pt)
CZ (1) CZ119293A3 (pt)
DK (1) DK300090D0 (pt)
FI (1) FI932831A (pt)
HU (1) HUT68751A (pt)
IE (1) IE914433A1 (pt)
IL (1) IL100408A0 (pt)
MX (1) MX9102684A (pt)
NZ (1) NZ241011A (pt)
PT (1) PT99848A (pt)
SK (1) SK62593A3 (pt)
WO (1) WO1992011378A1 (pt)
ZA (1) ZA919932B (pt)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI92601C (fi) * 1992-03-11 1994-12-12 Marja Makarow Menetelmä hyötyproteiinien erittämiseksi hiivoista
US5538863A (en) * 1993-07-01 1996-07-23 Immunex Corporation Expression system comprising mutant yeast strain and expression vector encoding synthetic signal peptide
US5639642A (en) * 1994-06-16 1997-06-17 Novo Nordisk A/S Synthetic leader peptide sequences
IL114160A (en) * 1994-06-17 2006-12-31 Novo Nordisk As Dna constructs encoding heterologous proteins and processes for the heterologous protein production in yeast
US6500645B1 (en) 1994-06-17 2002-12-31 Novo Nordisk A/S N-terminally extended proteins expressed in yeast
HRP940432B1 (en) * 1994-08-05 2003-10-31 Pliva Pharm & Chem Works Dna sequences encoding biosynthetic insulin precursors and process for preparation of insulin
NZ303162A (en) 1995-03-17 2000-01-28 Novo Nordisk As Enzyme preparations comprising an enzyme exhibiting endoglucanase activity appropriate for laundry compositions for textiles
BR9707807A (pt) 1996-03-01 1999-07-27 Novo Nordisk As Uso de uma composição farmacêutica composição farmacêutica processo de tratar doenças ou distúrbios associados com a regulação do apetite prejudicado e uso de um peptideo
DE69739319D1 (de) 1996-12-13 2009-04-30 Novartis Vaccines & Diagnostic Verfahren zur Expression von PDGF oder IGR Proteinen in Hefe
JP2003525570A (ja) 1998-01-23 2003-09-02 ノボ ノルディスク アクティーゼルスカブ 酵母において所望のポリペプチドを産生する方法
DE60044728D1 (de) 1999-12-29 2010-09-02 Novo Nordisk As VERFAHREN ZUR HERSTELLUNG VON INSULINVORLäUFERN UND ANALOGEN VON INSULINVORLÄUFERN MIT VERBESSERTER FERMENTATIONSAUSBEUTE IN HEFE
AT410217B (de) * 2000-06-15 2003-03-25 Cistem Biotechnologies Gmbh Vektor und ein verfahren zur expression und selektion randomisierter peptid-sequenzen
ES2432967T3 (es) 2001-03-22 2013-12-05 Novo Nordisk Health Care Ag Derivados del Factor VII de coagulación
ATE532858T1 (de) 2001-09-27 2011-11-15 Novo Nordisk Healthcare Ag Menschliche gerinnungsfaktor-vii-polypeptide
ES2381110T3 (es) 2003-09-09 2012-05-23 Novo Nordisk Health Care Ag Polipéptidos de factor VII de coagulación
JP2007532096A (ja) 2003-11-14 2007-11-15 ノボ ノルディスク アクティーゼルスカブ アシル化されたインスリンの製造方法
ES2369895T3 (es) 2003-12-03 2011-12-07 Novo Nordisk A/S Insulina monocatenaria.
WO2005078116A1 (fr) * 2004-01-16 2005-08-25 Qiuyun Liu Methode permettant d'isoler de peptides antibacteriens et peptides isoles
ES2357550T3 (es) 2005-04-18 2011-04-27 Novo Nordisk A/S Variantes de la il-21.
CN102660614A (zh) 2005-08-16 2012-09-12 诺沃-诺迪斯克有限公司 制备成熟胰岛素多肽的方法
US20090055942A1 (en) 2005-09-14 2009-02-26 Novo Nordisk Healthcare A/G Human Coagulation Factor VII Polypeptides
ATE482977T1 (de) 2006-02-27 2010-10-15 Novo Nordisk As Insulinderivate
EP2069502B1 (en) 2006-09-27 2014-02-26 Novo Nordisk A/S Method for making maturated insulin polypeptides
WO2009021955A1 (en) 2007-08-13 2009-02-19 Novo Nordisk A/S Rapid acting insulin analogues
ES2526924T3 (es) 2007-08-15 2015-01-16 Novo Nordisk A/S Insulinas con una fracción acilo que comprende unidades repetitivas de aminoácidos que contienen alquilenglicol
EP2178912B1 (en) 2007-08-15 2015-07-08 Novo Nordisk A/S Insulin analogues with an acyl and aklylene glycol moiety
EP2406282A1 (en) 2009-03-11 2012-01-18 Novo Nordisk A/S Interleukin-21 variants having antagonistic binding to the il-21 receptor
AU2010272483B2 (en) 2009-07-17 2016-07-21 Omeros Corporation MASP isoforms as inhibitors of complement activation
EP2504355B1 (en) 2009-11-25 2015-07-22 Novo Nordisk A/S Method for making polypeptides
WO2011067283A1 (en) 2009-12-01 2011-06-09 Novo Nordisk A/S Novel peptidyl alpha-hydroxyglycine alpha-amidating lyases
ES2543634T3 (es) 2010-01-22 2015-08-20 Novo Nordisk A/S Proceso para preparación de FGF-21 con grado de O-glicosilación bajo
JP6148013B2 (ja) 2010-03-05 2017-06-14 リグショスピタレト 補体活性化のキメラ抑制分子
AU2011282988A1 (en) * 2010-07-28 2013-01-31 Smartcells, Inc. Recombinantly expressed insulin polypeptides and uses thereof
US11787844B2 (en) 2012-02-09 2023-10-17 Var2 Pharmaceuticals Aps Targeting of chondroitin sulfate glycans
JP2015532307A (ja) 2012-10-15 2015-11-09 ノヴォ・ノルディスク・ヘルス・ケア・アーゲー 凝固因子viiポリペプチド
EP3004156A1 (en) 2013-06-07 2016-04-13 Novo Nordisk A/S Method for making mature insulin polypeptides
US20160376330A1 (en) * 2014-02-28 2016-12-29 Novo Nordisk A/S Mating factor alpha pro-peptide variants
CN112789504A (zh) 2018-07-13 2021-05-11 瓦克特诊断有限责任公司 使用重组疟疾蛋白var2csa分离胎儿来源的循环细胞

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK463887D0 (da) * 1987-09-07 1987-09-07 Novo Industri As Gaerleader
CA1340772C (en) * 1987-12-30 1999-09-28 Patricia Tekamp-Olson Expression and secretion of heterologous protiens in yeast employing truncated alpha-factor leader sequences
JP3092811B2 (ja) * 1988-07-23 2000-09-25 デルタ バイオテクノロジー リミテッド ペプチドおよびdna配列
DK105489D0 (da) * 1989-03-03 1989-03-03 Novo Nordisk As Polypeptid

Also Published As

Publication number Publication date
AU660161B2 (en) 1995-06-15
CZ119293A3 (en) 1994-02-16
ZA919932B (en) 1992-08-26
FI932831A0 (fi) 1993-06-18
WO1992011378A1 (en) 1992-07-09
CA2098731A1 (en) 1992-06-19
IE914433A1 (en) 1992-07-01
HUT68751A (en) 1995-07-28
NZ241011A (en) 1993-04-28
SK62593A3 (en) 1993-10-06
DK300090D0 (da) 1990-12-19
AU9134891A (en) 1992-07-22
MX9102684A (es) 1992-06-01
FI932831A (fi) 1993-06-18
EP0563175A1 (en) 1993-10-06
IL100408A0 (en) 1992-09-06
JPH06503957A (ja) 1994-05-12
HU9301801D0 (en) 1993-10-28
KR930703450A (ko) 1993-11-30

Similar Documents

Publication Publication Date Title
PT99848A (pt) Processo para a preparacao de sequencias lider sinteticas
AU630450B2 (en) Fusion proteins containing n-terminal fragments of human serum albumin
EP0116201B1 (en) Secretory expression in eukaryotes
US4870008A (en) Secretory expression in eukaryotes
RU2143495C1 (ru) Способ получения гетерологичного белка
JP3730255B2 (ja) イーストにおいて発現されたn末端に伸長した蛋白質
US5639642A (en) Synthetic leader peptide sequences
FI87801C (fi) Foerfarande foer framstaellning av maenniskoinsulinprekursorer samt i foerfarandet anvaenda dna-sekvensen och plasmider
EP0399666A1 (en) Fusion proteins containing N-terminal fragments of human serum albumin
WO1984004330A1 (en) Secretion of exogenous polypeptides from yeast
IE851331L (en) Insulin precursors
US5010010A (en) Production of human parathyroid hormone from microorganisms
WO1993012237A1 (en) Process for producing/secreting a protein by a transformed mould using expression/secretion regulating regions derived from an aspergillus endoxylanase ii gene
JP2001507574A (ja) 酵母で発現されたn末端伸長タンパク質
ES2242969T3 (es) Vector para la expresion de proteinas con prolongacion n-terminal en celulas de levadura.

Legal Events

Date Code Title Description
BB1A Laying open of patent application

Effective date: 19930125

FC3A Refusal

Effective date: 19990225