<Desc/Clms Page number 1>
Système d'expression, vecteur d'intégration et cellule transformée par ce vecteur d'intégration
L'invention concerne un système d'expression utilisable pour la production extracellulaire de protéases aspartiques microbiennes et, plus particulièrement, d'aspergillopepsines.
L'invention concerne également un vecteur d'intégration contenant ce système d'expression et une cellule transformée par ce vecteur d'intégration.
Les protéases aspartiques microbiennes sont classées dans le système international selon la référence E. C. 3.4. 23.6. Elles sont également nommées protéases acides ou protéases carboxyles. Ces enzymes hydrolysent, sous des conditions acides, les liaisons peptidiques des protéines en formant des peptides. Elles ont un pH optimum inférieur à 5. Ces enzymes ont de nombreuses applications industrielles.
Les protéases aspartiques microbiennes sont naturellement produites par certaines souches de champignons filamenteux et notamment par des souches d'Aspergillus. Malheureusement, les protéases aspartiques microbiennes ne sont pas produites par ces souches de manière efficace et industriellement rentable, leur productivité étant faible. C'est pourquoi une production efficace a longtemps été recherchée.
Dans ce contexte, on a proposé un système d'expression comprenant la séquence du promoteur de l'oc-amylase d'Aspergillus oryzae, la séquence de la protéase aspartique de Mucor miehei, la séquence du terminateur de la glucoamylase d'Aspergillus niger (BIO/TECHNOLOGY (1987) 6, pages 1419-1422). Ce système introduit dans Aspergillus oryzae permet d'obtenir la protéase aspartique.
Cependant, la protéase aspartique obtenue est hyperglycosylée.
Ceci modifie les propriétés essentielles de cette enzyme de façon préjudiciable.
Par ailleurs, on a décrit un système d'expression utilisable pour la production de chymosine bovine. Ce système comprend la
<Desc/Clms Page number 2>
séquence du promoteur de la glucoamylase d'Aspergillus niger, la séquence du peptide signal de la glucoamylase d'Aspergillus niger, la séquence codante de la chymosine bovine et la séquence du terminateur de la glucoamylase d'Aspergillus niger. Une souche transformée d'Aspergillus niger, contenant ce système d'expression, permet d'obtenir la chymosine bovine. Cependant, avec ce système d'expression, le rendement final obtenu est faible, car les protéases produites par la souche transformée hydrolysent la chymosine bovine.
De plus, aucune mention n'est faite à l'application possible d'un tel système d'expression pour la production d'une enzyme microbienne et en particulier d'une protéase aspartique microbienne.
A l'heure actuelle, un système d'expression permettant d'obtenir l'expression et une sécrétion particulièrement efficace d'une protéase aspartique microbienne par une souche transformée de champignon filamenteux contenant ce système d'expression et permettant également d'obtenir une protéase aspartique microbienne normalement glycosylée, n'est pas connu.
La présente invention a pour premier but de fournir un système d'expression permettant d'obtenir une protéase aspartique microbienne, et particulièrement une protéase acide fongique, et plus particulièrement une aspergillopepsine, en grande quantité dans le milieu de culture, où une souche transformée contenant ce système d'expression est cultivée.
La présente invention a également pour premier but de fournir un système d'expression permettant d'obtenir une protéase aspartique microbienne, et particulièrement une protéase acide fongique, et plus particulièrement une aspergillopepsine, normalement glycosylée, c'est-à-dire ayant des caractéristiques et des propriétés aussi proches que possible de celles de l'enzyme native (sauvage).
Par"protéase aspartique microbienne", on entend une enzyme qui catalyse la réaction d'hydrolyse de protéines en peptides et qui a un pH optimum inférieur à 5. Ces enzymes ont un site catalytique acide. Ces enzymes sont classées dans le système international selon la référence B. C. 3.4. 23.6. Cette définition inclut
<Desc/Clms Page number 3>
les enzymes naturelles et les enzymes modifiées, telles que les enzymes dont la séquence de nucléotides (qui code pour cette enzyme) ou la séquence d'acides aminés a été modifiée par des techniques de génie génétique ou par des techniques de mutagénèse.
Habituellement, la protéase aspartique microbienne est une protéase aspartique fongique. D'excellents résultats ont été obtenus avec l'aspergillopepsine.
La présente invention a également pour but de fournir un vecteur d'intégration et un plasmide contenant le système d'expression décrit ci-dessus.
La présente invention a également pour but de fournir une souche transformée d'Aspergillus, et plus particulièrement une souche transformée d'Aspergillus foetidus, qui exprime et sécrète dans son milieu de culture la protéase aspartique microbienne avec un haut niveau de productivité. Selon l'invention, la sécrétion de la protéase aspartique microbienne est substantiellement extracellulaire.
De plus, la présente invention présente de nombreux avantages lorsque la protéase aspartique microbienne provient de la souche sauvage d'Aspergillus qui a été mise en oeuvre lors de la transformation. En effet, la transformation est, dans ce cas, parfaitement homologue et ne présente donc aucun des inconvénients qu'entraine une transformation hétérologue, telle que notamment une hyperglycosylation de l'enzyme. Par"transformation homologue", on entend un mode de transfert génétique mettant en jeu une cellule microbienne et une molécule d'ADN qui pénètre cette cellule et peut recombiner le génome cellulaire, la molécule d'ADN provenant d'une cellule microbienne appartenant au même genre. De préférence, la molécule d'ADN provient d'une cellule microbienne appartenant à la même espèce.
De manière particulièrement préférée, la molécule d'ADN provient d'une cellule microbienne elle-même.
La présente invention a également pour but de fournir un procédé de production de protéase aspartique microbienne mettant en oeuvre une souche de champignon filamenteux qui produit une grande quantité de protéase aspartique microbienne de façon extra-
<Desc/Clms Page number 4>
cellulaire, de plus la protéase aspartique microbienne obtenue est glycosylée de la même manière que l'enzyme native.
La présente invention a également pour but de fournir une molécule d'ADN comprenant la séquence de nucléotides qui code pour le promoteur de la glucoamylase d'Aspergillus foetidus.
La présente invention a également pour but de fournir une molécule d'ADN comprenant la séquence de nucléotides qui code pour la protéase aspartique microbienne, et particulièrement pour la protéase acide fongique, et plus particulièrement pour l'aspergillopepsine.
La présente invention a également pour but de fournir une molécule d'ADN comprenant la séquence de nucléotides qui code pour l'aspergillopepsine dérivée d'une souche d'Aspergillus foetidus, et particulièrement de la souche d'Aspergillus foetidus SE4.
La présente invention a également pour but de fournir une protéase aspartique microbienne, et particulièrement une protéase acide fongique et plus particulièrement une aspergillopepsine produite par une souche d'Aspergillus foetidus, et particulièrement par la souche d'Aspergillus foetidus SE4.
La présente invention a également pour but de fournir une protéase aspartique microbienne produite par une souche transformée comprenant le système d'expression. La souche peut être une souche d'Aspergillus foetidus, et particulièrement de la souche d'Aspergillus foetidus SE4.
A cet effet, l'invention concerne un système d'expression utilisable pour la production extracellulaire d'une protéase
EMI4.1
aspartique microbienne, caractérisé en ce qu'il comprend : - la séquence du promoteur de la glucoamylase, - la séquence d'un signal de sécrétion, - la séquence d'un propeptide, et - la séquence mature de la protéase aspartique microbienne.
De préférence, le système d'expression comprend également la séquence d'un terminateur.
L'invention concerne un système d'expression utilisable pour la production extracellulaire d'une protéase aspartique microbienne, caractérisé en ce qu'il comprend au moins :
<Desc/Clms Page number 5>
- la séquence du promoteur de la glucoamylase, - la séquence du signal de sécrétion de la protéase aspartique microbienne,
EMI5.1
- la séquence du propeptide de la protéase aspartique micro- bienne, - la séquence mature de la protéase aspartique microbienne, et - la séquence d'un terminateur.
De préférence, dans le système d'expression selon l'invention la séquence du terminateur est celle du terminateur de la glucoamylase.
L'invention concerne, de préférence, un système d'expression utilisable pour la production extracellulaire d'une protéase acide fongique, caractérisé en ce qu'il comprend au moins : - la séquence du promoteur de la glucoamylase d'Aspergillus foetidus SE4,
EMI5.2
- la séquence du signal de sécrétion de la protéase acide fongique d'Aspergillus foetidus SE4, - la séquence du propeptide de la protéase acide fongique d'Aspergillus foetidus SE4, - la séquence mature de la protéase acide fongique d'Aspergillus foetidus SE4, et - la séquence du terminateur de la glucoamylase d'Aspergillus foetidus SE4.
Par"système d'expression", on entend une unité moléculaire capable d'être intégrée dans le génome d'un champignon filamenteux et capable de fournir à ce champignon l'information génétique nécessaire à la biosynthèse de la protéase aspartique microbienne.
Par"promoteur de la glucoamylase", on entend le ou les promoteur (s) de transcription. Le promoteur qui est constitué d'une séquence d'ADN montrant une forte activité de transcription, peut être précédé par des séquences d'ADN qui stimulent la transcription, telles que des séquences connues sous le nom de "enhancers"ou"Upstream Activating Sequences". Le promoteur contient des séquences de contrôle de transcription qui influent sur l'expression de l'ADN codant fusionné. La séquence du promo-
<Desc/Clms Page number 6>
teur de la glucoamylase comprend les séquences qui contrôlent la transcription et qui interviennent lors de l'expression de la glucoamylase.
Par la"séquence du signal de sécrétion"de la protéase aspartique microbienne, on entend une séquence d'ADN correspondant à une séquence d'acides aminés qui est naturellement liée de façon opérationnelle à la terminaison aminée de la séquence du propeptide de la protéase aspartique microbienne. Dans cette demande, la partie du gène de structure, qui code pour le peptide signal, est nommé"séquence du signal de sécrétion de la protéase aspartique microbienne" ; la partie du gène de structure, qui code pour le propeptide, est nommé"séquence du propeptide de la protéase aspartique microbienne" ; et la partie de gène de structure, qui code pour la protéase aspartique microbienne en tant
EMI6.1
que telle, est nommé"séquence mature de la protéase aspartique microbienne".
L'ensemble de ces trois séquences, c'est-à-dire séquence du signal de sécrétion, séquence du propeptide et séquence mature, code pour la preproenzyme. Dans cette demande, la séquence du signal de sécrétion peut provenir de n'importe quelle protéine qui est produite de façon extracellulaire par un microorganisme. N'importe quelle séquence de signal de sécrétion fonctionnelle dans un champignon filamenteux peut convenir. Comme exemple de séquence de signal de sécrétion d'origine fongique, on peut citer la séquence du signal de sécrétion d'une enzyme produite par un champignon filamenteux de façon substantiellement extracellulaire.
Parmi celles-ci, on peut citer la séquence du signal de sécrétion d'une protéase, d'une cellulase, d'une amylase, d'une glucoamylase et, en particulier, de la glucoamylase d'Aspergillus niger, de la cellulase de Trichoderma reesei, de la protéase aspartique de Mucor miehei.
Par la"séquence du propeptide"de la protéase aspartique microbienne, on entend une séquence d'ADN correspondant à une séquence d'acides aminés qui est naturellement liée de façon opérationnelle à la terminaison aminée de la séquence mature de la protéase aspartique microbienne. La séquence du propeptide liée à la séquence mature de la protéase aspartique microbienne
<Desc/Clms Page number 7>
code pour la proenzyme ou zymogène.
Par"séquence mature"de la protéase aspartique microbienne, on entend la partie de la séquence qui est traduite en protéine active, c'est-à-dire la séquence codante de la protéase aspartique microbienne qui correspond au gène de structure de la protéase aspartique microbienne sans la séquence du signal de sécrétion et sans la séquence du propeptide. La séquence codante (gène de structure) comprend la séquence du signal de sécrétion, la séquence du propeptide et la séquence mature de l'aspergillopepsine.
Par"terminateur", on entend le ou les terminateur (s) de transcription. La séquence du terminateur de la glucoamylase est une séquence d'ADN qui agit pour terminer la transcription de la glucoamylase. La séquence du terminateur contient également des séquences de polyadénylation qui stabilisent le mARN. Dans cette demande, n'importe quel terminateur fonctionnel dans un champignon filamenteux peut convenir. Des terminateurs sont connus de l'homme du métier.
Comme exemples de terminateur d'origine fongique connu, on peut citer le terminateur trpC, celui d'une glucoamylase, celui d'une amylase, celui d'une alpha-amylase, celui d'une protéase aspartique, celui d'une phosphatase acide, celui d'une lipase, celui d'une cellulase, celui d'une enzyme glycolytique, celui d'une isomérase, celui d'une glucanase, celui d'une hydrolase, celui d'une déhydrogénase, et en particulier, le terminateur trpC d'Aspergillus nidulans, le terminateur de la glucoamylase d'Aspergillus niger, celui de l'alpha-amylase d'Aspergillus niger, celui de la protéase aspartique de Hucor miehei, celui de la phosphatase acide d'Aspergillus niger, celui d'une alcool-déhydrogénase d'Aspergillus nidulans.
Habituellement, la séquence du promoteur de la glucoamylase provient d'un champignon filamenteux, de même que la séquence du signal de sécrétion de la protéase aspartique microbienne, la séquence du propeptide de la protéase aspartique microbienne, la séquence mature de la protéase aspartique microbienne et que la séquence du terminateur de la glucoamylase.
Ces séquences, c'est-à-dire la séquence du promoteur de la
<Desc/Clms Page number 8>
glucoamylase, la séquence du signal de sécrétion de la protéase aspartique microbienne, la séquence du propeptide de la protéase aspartique microbienne, la séquence mature de la protéase aspartique microbienne et la séquence du terminateur de la glucoamylase, proviennent d'une souche d'un champignon filamenteux identique ou différente.
Généralement, elles proviennent d'une souche d'Aspergillus, de Penicillium, de Rhizopus, d'Endothia ou de Mucor.
Habituellement, elles proviennent d'une souche d'Aspergillus. De préférence, elles proviennent d'une souche appartenant au groupe Aspergillus niger, telle que notamment une souche d'Aspergillus niger, d'Aspergillus foetidus, d'Aspergillus awamori ou d'Aspergillus saitoi. De manière particulièrement préférée, elles proviennent d'une souche d'Aspergillus niger ou d'une souche d'Aspergillus foetidus. De préférence, elles proviennent d'une souche d'Aspergillus foetidus. De manière particulièrement préférée, elles proviennent de la souche d'Aspergillus foetidus SE4.
Des souches d'Aspergillus niger et des souches d'Aspergillus foetidus, d'où peuvent provenir l'une ou l'autre des séquences décrites précédemment, sont connues, telles que notamment la souche d'Aspergillus niger NRRL 3 (AGRICULTURAL RESEARCH SERVICE CULTURE COLLECTION (NRRL), 1815 North University Street, Peoria, Illinois 61604, USA), la souche d'Aspergillus niger ATCC 13496 (AMERICAN TYPE CULTURE COLLECTION, 12301 Parklawn drive, Rockville, Maryland 20852-1776, USA), la souche d'Aspergillus niger ATCC 22343, la souche d'Aspergillus niger ATCC 46890, la souche d'Aspergillus foetidus ATCC 10254, la souche d'Aspergillus foetidus ATCC 14916.
Dans une variante préférée de l'invention, la séquence du signal de sécrétion de la protéase aspartique microbienne, la séquence du propeptide de la protéase aspartique microbienne et la séquence mature de la protéase aspartique microbienne proviennent du même champignon filamenteux.
D'excellents résultats ont été obtenus avec un système d'expression, selon l'invention, comprenant la séquence du signal
<Desc/Clms Page number 9>
de sécrétion de l'aspergillopepsine de la souche d'Aspergillus foetidus SE4, la séquence du propeptide de l'aspergillopepsine de la souche d'Aspergillus foetidus SE4 et la séquence mature de l'aspergillopepsine de la souche d'Aspergillus foetidus SE4.
Dans une variante préférée de l'invention, la séquence du promoteur de la glucoamylase et la séquence du terminateur de la glucoamylase proviennent du même champignon filamenteux. De bons résultats ont été obtenus avec un système d'expression, selon l'invention, comprenant la séquence du promoteur de la glucoamylase de la souche d'Aspergillus foetidus et la séquence du terminateur de la souche d'Aspergillus foetidus. D'excellents résultats ont été obtenus avec un système d'expression, selon l'invention, comprenant la séquence du promoteur de la glucoamylase de la souche d'Aspergillus foetidus SE4 et la séquence du terminateur de la souche d'Aspergillus foetidus SE4. La molécule d'ADN comprenant la séquence de nucléotides SEQ ID NO : 7 code pour le promoteur de la souche d'Aspergillus foetidus SE4.
La molécule d'ADN comprenant la séquence de nucléotides SEQ ID NO : 8 code pour le terminateur de la souche d'Aspergillus foetidus SE4.
Dans une variante particulièrement préférée de l'invention, la séquence du promoteur de la glucoamylase, la séquence du signal de sécrétion de la protéase aspartique microbienne, la séquence du propeptide de la protéase aspartique microbienne, la séquence mature de la protéase aspartique microbienne et la séquence du terminateur de la glucoamylase proviennent du même champignon filamenteux.
De préférence dans le système d'expression selon l'invention, la séquence du promoteur est positionnée en amont de la séquence du signal de sécrétion. La séquence du signal de sécrétion elle-même est positionnée en amont de la séquence du propeptide, la séquence du propeptide est positionnée en amont de la séquence mature, cette séquence mature est positionnée en amont de la séquence du terminateur. Ces positionnements sont choisis de telle sorte que, dans des conditions appropriées, ils permettent l'expression de la protéase aspartique microbienne sous le contrôle des signaux de transcription, c'est-à-dire du
<Desc/Clms Page number 10>
promoteur et du terminateur.
De préférence, les séquences comprises dans le système d'expression sont liées de façon opérationnelle. La séquence du promoteur de glucoamylase est liée de façon opérationnelle à la séquence du signal de sécrétion de la protéase aspartique microbienne. La séquence du signal de sécrétion de la protéase aspartique microbienne est liée de façon opérationnelle à la séquence du propeptide de la protéase aspartique microbienne. La séquence du propeptide de la protéase aspartique microbienne est liée de façon opérationnelle à la séquence mature de la protéase aspartique microbienne. La séquence mature de la protéase aspartique microbienne est liée de façon opérationnelle à la séquence du terminateur.
L'invention concerne également un procédé de préparation d'un système d'expression comprenant au moins la séquence du promoteur de la glucoamylase, la séquence du signal de sécrétion de la protéase aspartique microbienne, la séquence du propeptide de la protéase aspartique microbienne, la séquence mature de la protéase aspartique microbienne, et la séquence du terminateur.
Ce procédé comprend : - l'isolement de la séquence du signal de sécrétion de la protéase aspartique microbienne, de la séquence du propeptide de la protéase aspartique microbienne et de la séquence mature de la protéase aspartique microbienne à partir de l'ADN génomique d'un microorganisme qui produit cette protéase aspartique microbienne, et - l'introduction de la séquence du signal de sécrétion de la protéase aspartique microbienne, de la séquence du propeptide de la protéase aspartique microbienne et de la séquence mature de la protéase aspartique microbienne dans un vecteur contenant la séquence du promoteur de la glucoamylase et la séquence du terminateur,
cette introduction étant faite dans un site choisi de telle sorte que le positionnement des séquences permet l'expression de la protéase aspartique microbienne sous le contrôle dudit promoteur et dudit terminateur.
L'invention concerne également un vecteur d'intégration
<Desc/Clms Page number 11>
contenant le système d'expression tel que défini ci-dessus, et apte à permettre l'expression de la protéase aspartique microbienne.
Le principe de l'invention s'applique également à un vecteur d'expression contenant le système d'expression tel que défini ci-dessus, et apte à permettre l'expression de la protéase aspartique microbienne.
Par "vecteur d'intégration", on entend toute séquence d'ADN qui comprend un réplicon et d'autres régions d'ADN (séquences de nucléotides) et qui est fonctionnelle indépendamment de l'hôte comme une unité d'expression génique complète. Par"unité d'expression génique complète", on entend le gène de structure et la ou les régions (s) du promoteur et la ou les région (s) de régulation nécessaire pour la transcription et la traduction. Par "gène de structure", on entend la séquence codante qui est utilisée pour la transcription en ARN et permet la synthèse de la protéine par l'hôte.
De préférence, ce vecteur d'intégration est un plasmide. De bons résultats ont été obtenus avec le plasmide pFASPEP.
L'invention concerne également une cellule transformée (cellule hôte) par le vecteur d'intégration défini ci-dessus.
Cette cellule transformée est choisie de telle sorte que la séquence du promoteur de glucoamylase et la séquence du terminateur comprises dans le système d'expression soient reconnues par cette cellule transformée, c'est-à-dire qu'elles sont compatibles et fonctionnelles pour cette cellule transformée, la séquence du promoteur de la glucoamylase et la séquence du terminateur comprises dans le système d'expression remplissent leurs fonctions respectives de signal de transcription, comme respectivement un promoteur et un terminateur, pour la cellule transformée.
Habituellement, la cellule transformée est une cellule de champignon filamenteux. Généralement, la cellule transformée est une cellule d'Aspergillus. De préférence, la cellule transformée est une cellule d'Aspergillus oryzae, une cellule d'Aspergillus saitoi ou une cellule appartenant au groupe des souches
<Desc/Clms Page number 12>
d'Aspergillus niger. De manière particulièrement préférée, la cellule transformée est une cellule appartenant au groupe des souches d'Aspergillus niger, telle qu'une cellule d'Aspergillus niger, d'Aspergillus foetidus, d'Aspergillus awamori, ou est une cellule d'Aspergillus saitoi. De bons résultats ont été obtenus avec une cellule transformée d'Aspergillus niger.
D'excellents résultats ont été obtenus avec une cellule transformée d'Aspergillus foetidus, et plus particulièrement avec une cellule transformée de la souche d'Aspergillus foetidus SE4.
Des souches d'aspergillus niger et des souches d'Aspergillus foetidus, qui peuvent être utilisées comme cellule transformée (cellule hôte), sont connues, telles que notamment la souche d'Aspergillus niger NRRL 3 (AGRICULTURAL RESEARCH SERVICE CULTURE COLLECTION (NRRL), 1815 North University Street, Peoria, Illinois 61604, USA), la souche d'Aspergillus niger ATCC 13496 (AMERICAN TYPE CULTURE COLLECTION, 12301 Parklawn drive, Rockville, Maryland 20852-1776, USA), la souche d'Aspergillus niger ATCC 22343, la souche d'Aspergillus niger ATCC 46890, la souche d'Aspergillus foetidus ATCC 10254, la souche d'Aspergillus foetidus ATCC 14916.
Dans une variante préférée de l'invention, la cellule transformée par le vecteur d'intégration dérive de la souche d'où provient la séquence du promoteur de la glucoamylase ou la séquence du terminateur, séquence comprise dans le système d'expression. De manière particulièrement préférée, la cellule transformée par le vecteur d'intégration dérive de la souche d'où proviennent la séquence du signal de sécrétion de la protéase aspartique microbienne, la séquence du propeptide de la protéase aspartique microbienne et la séquence mature de la protéase aspartique microbienne. D'excellents résultats ont été obtenus avec une cellule transformée d'Aspergillus foetidus SE4.
Cette cellule transformée par un vecteur d'intégration contient un système d'expression selon l'invention, ce système d'expression comprenant la séquence du promoteur de la glucoamylase d'Aspergillus foetidus SE4 et la séquence du terminateur de la glucoamylase d'Aspergillus foetidus SE4. Les meilleurs résultats
<Desc/Clms Page number 13>
ont été obtenus avec une cellule transformée par le vecteur d'intégration pFASPEP.
Par"champignon filamenteux", on entend les microorganismes eucaryotes qui comprennent toutes les formes filamenteuses de la division Eumycota. Dans cette division sont inclus les groupes Zygomycètes, Ascomycètes, Basidiomycètes et les champignons imparfaits incluant les Hyphomycètes. Les genres suivants sont compris dans cette définition : Aspergillus, Trichoderma, Neurospora, Podospora, Endothia, Mucor, Cochiobolus, Pyricularia, Penicillium, Humicola.
L'invention concerne également la souche purifiée et isolée d'Aspergillus foetidus SE4tra. Cette souche transformée SE4tra est obtenue à partir de la souche SE4. Elle diffère de cette souche SE4 par le fait qu'elle contient une ou plusieurs copies du plasmide pFASPEP intégré dans son génome.
La souche d'Aspergillus foetidus SE4 a été obtenue à partir de la souche d'Aspergillus foetidus ATCC 14916 par mutagénèse et sélectionnée sur la base d'une production améliorée en glucoamylase.
L'invention concerne également le promoteur de la glucoamylase d'Aspergillus foetidus.
L'invention concerne également une molécule d'ADN comprenant la séquence de nucléotides SEQ ID NO : 7 qui code pour le promoteur de la glucoamylase d'Aspergillus foetidus SE4.
L'invention concerne également la protéase aspartique microbienne dérivée d'une souche d'Aspergillus foetidus. De préférence, la protéase aspartique microbienne est une aspergillopepsine. De manière particulièrement préférée, elle dérive de la souche d'Aspergillus foetidus SE4.
L'invention concerne également une molécule d'ADN comprenant la séquence de nucléotides qui code pour une protéase aspartique microbienne dérivée d'une souche d'Aspergillus foetidus. De préférence, la protéase aspartique microbienne est une aspergillopepsine. De manière particulièrement préférée, elle dérive de la souche d'Aspergillus foetidus SE4.
L'invention concerne également une molécule d'ADN comprenant
<Desc/Clms Page number 14>
la séquence de nucléotides qui code pour l'aspergillopepsine dérivée d'une souche d'Aspergillus foetidus, et particulièrement de la souche d'Aspergillus Foetidus SE4.
L'invention concerne également une protéase aspartique microbienne produite par une cellule transformée avec le système d'expression de la présente invention.
De préférence, la protéase aspartique microbienne est une protéase acide fongique. De manière particulièrement préférée, il s'agit d'une aspergillopepsine.
De préférence, la protéase aspartique microbienne dérive d'une souche d'Aspergillus foetidus. De manière particulièrement préférée, elle dérive de la souche d'Aspergillus foetidus SE4.
L'invention concerne également un procédé pour la production extracellulaire de protéase aspartique microbienne caractérisé en ce qu'il comprend les étapes suivantes : - transformation d'une cellule par un vecteur d'intégration contenant un système d'expression tel que défini ci-dessus dans des conditions permettant l'expression et la sécrétion de la protéase aspartique microbienne, - culture de la cellule transformée dans un milieu de culture adéquat, et - récupération de la protéase aspartique microbienne sécrétée.
Le milieu de fermentation obtenu après la culture de la cellule transformée contient la majeure partie de la protéase aspartique microbienne. En effet, la protéase aspartique microbienne est substantiellement sécrétée dans le milieu de culture par la souche transformée. La protéase aspartique microbienne obtenue par le procédé de l'invention est extracellulaire.
La protéase aspartique microbienne obtenue par le procédé de l'invention est glycosylée de la même manière que l'enzyme native. Son poids moléculaire est proche de celui de la protéase aspartique microbienne produite par le microorganisme non transformé.
Les protéases aspartiques microbiennes ont de nombreuses applications industrielles, telles que, par exemple, dans les industries alimentaires, les industries pharmaceutiques et les
<Desc/Clms Page number 15>
industries chimiques. On exploite leur capacité à hydrolyser les protéines sous des conditions acides.
Les protéases aspartiques microbiennes peuvent être utilisées, en industries alimentaires, lors de la fabrication de certains fromages et de certains produits de panification.
Les protéases aspartiques microbiennes peuvent être utilisées comme médicament pour aider à la digestion.
Elles sont notamment employées pour épiler et dégraisser la peau de certains animaux pour obtenir des cuirs de qualité supérieure.
Les protéases aspartiques microbiennes peuvent être utilisées lors de la fabrication d'hydrolysats de protéines. Dans ce cadre, on peut citer la préparation de milieu de culture, la préparation d'hydrolysas de farine de poisson et de protéines de soja solubles.
De plus, en mélange avec la glucoamylase, les protéases aspartiques microbiennes, telles que notamment les protéases acides fongiques, sont utilisées lors de la fabrication d'éthanol à partir de matières premières brutes contenant des sucres fermentescibles (grains, résidus agricoles), telle que décrite dans la demande de brevet WO 92/20777 de SOLVAY ENZYMES, Inc.
La figure 1 représente la carte de restriction du plasmide pUCASPEP.
La figure 2 représente la carte de restriction du plasmide pFGA1.
La figure 3 représente la carte de restriction du plasmide pFGA2.
La figure 4 représente la carte de restriction du plasmide pFGA2MUT.
La figure 5 représente la carte de restriction du plasmide pFASPEP.
La figure 6 (figure 6a et figure 6b) représente la séquence de nucléotides (SEQ ID NO : 7) codant pour le promoteur de la glucoamylase d'Aspergillus foetidus SE4.
La figure 7 représente la séquence de nucléotides (SEQ ID NO : 8) codant pour le terminateur de la glucoamylase d'Aspergillus
<Desc/Clms Page number 16>
foetidus SE4.
Les symboles et abréviations utilisés dans ces figures sont explicités dans le tableau 1.
TABLEAU 1
EMI16.1
<tb>
<tb> Symbole <SEP> Signification
<tb> Abréviation
<tb> AMPR <SEP> gène <SEP> apportant <SEP> la <SEP> résistance <SEP> à <SEP> l'ampicilline
<tb> ORI <SEP> origine <SEP> de <SEP> réplication <SEP> dans <SEP> E. <SEP> coli
<tb> ASPEPSIN <SEP> séquence <SEP> codante <SEP> de <SEP> l'aspergillopepsine
<tb> d'Aspergillus <SEP> foetidus <SEP> SE4
<tb> 5'GA <SEP> promoteur <SEP> de <SEP> la <SEP> glucoamylase <SEP> d'Aspergillus
<tb> foetidus <SEP> SE4
<tb> 3'GA <SEP> terminateur <SEP> de <SEP> la <SEP> glucoamylase <SEP> d'Aspergillus
<tb> foetidus <SEP> SE4
<tb> GA <SEP> séquence <SEP> codante <SEP> de <SEP> la <SEP> glucoamylase <SEP> d'Aspergillus
<tb> foetidus <SEP> SE4
<tb>
La présente invention est illustrée par les exemples suivants.
Exemple 1 Isolement de la séquence codante de l'aspergillopepsine d'Aspergillus foetidus SE4
On réalise une culture de la souche d'Aspergillus foetidus ATCC 14916 sur un milieu nutritif liquide ACM ("Aspergillus Complete Medium") qui contient 2 % (poids/volume) d'extrait de malt, 0,1 X (poids/volume) de peptone (DIFCO) et 2 % (poids/volume) de glucose. Après une incubation de 48 heures à 32 oC, le mycélium est récolté.
Le mycélium de la souche d'Aspergillus foetidus ATCC 14916 est soumis à un traitement de mutagénèse par ultra-violet selon la technique décrite dans PONTECORVO, G., ROPER, J. A., HEMMONS, L. M., MACDONALD, K. D., and BUFTON, A. W. J., Advances in Genetics 5 (1953), pages 141-238.
Les souches traitées sont étalées sur un milieu nutritif
<Desc/Clms Page number 17>
gélosé POTATO DEXTROSE AGAR (DIFCO) auquel a été ajouté l'amidon (5 X en poids/volume). Après une incubation de 48 heures à 32 oC, les colonies présentant le halo d'hydrolyse d'amidon le plus grand sont prélevées et repiquées sur le milieu nutritif gélosé.
On isole une souche produisant beaucoup de glucoamylase. Cette souche nommée SE4 présente des conidies brunes décolorées.
On réalise une culture de la souche d'Aspergillus foetidus SE4 sur le milieu nutritif liquide ACM. Après une incubation de 48 heures à 32 OC, le mycélium est récolté.
L'ADN génomique de la souche d'Aspergillus foetidus SE4 est isolé selon la technique décrite dans GARBER, R. C. and YODER, O. L., Anal. Biochem. 135 (1983), pages 416-422.
On réalise le mélange suivant :
EMI17.1
<tb>
<tb> 820 <SEP> distillée <SEP> 62 <SEP> pi
<tb> Tampon <SEP> PCR <SEP> (10x) <SEP> 10 <SEP> pi
<tb> dNTPs <SEP> (2,5 <SEP> mM <SEP> chacun) <SEP> 8 <SEP> pi
<tb> Oligonucléotide <SEP> SEQ <SEP> ID <SEP> NO <SEP> : <SEP> 1 <SEP> (20 <SEP> pM) <SEP> 5 <SEP> pi
<tb> Oligonucléotide <SEP> SEQ <SEP> ID <SEP> NO <SEP> :
<SEP> 3 <SEP> (20 <SEP> pH) <SEP> 5 <SEP> pi
<tb> ADN <SEP> génomique <SEP> (dilutions <SEP> 10-1 <SEP> à <SEP> 10-4) <SEP> 10 <SEP> pi
<tb> Taq-polymérase <SEP> (5 <SEP> U/pl) <SEP> 0,2 <SEP> pi
<tb>
Le tampon PCR, sous la citation" (lOx) Reaction Buffer composition", l'abréviation dNTPs, qui signifie tous les nucléotides dATP, dTTP, dGTP et dCTP, et le produit Taq-polymérase sont décrits dans la notice du kit vendu sous le nom"GENEAMP DNA AMPLIFICATION REAGENT KIT with AMPLITAQ Recombinant Taq DNA Polymerase" (PERKIN ELMER CETUS).
L'ADN génomique isolé de la souche d'Aspergillus foetidus SE4, est mis en oeuvre dans ce mélange à une concentration de 1 ug/pl.
La séquence codante de l'aspergillopepsine d'Aspergillus foetidus SE4 a été isolée selon la technique de la"PCR" (technique de la"Polymerase Chain Reaction"décrite dans SAIKI, R. K., et al., SCIENCE, 239 (1988), pages 487-491).
Les séquences des oligonucléotides synthétiques mis en oeuvre lors de cette étude sont les suivantes :
<Desc/Clms Page number 18>
EMI18.1
SEQ ID NO : 1 5'-TGATGATCAGGATCCGGCGGCCGCACCTCAGCAATGGTCGTCTTCAGCAAAACCGCTGCCCTC-3'
BamHI NotI SEQ ID NO : 2 5'-CTGGGATTCGCCGCTCAGGCTTAGATTATCAAGCTTCATTCTAGAGACGACGACGAC-3'
HindIII XbaI SEQ ID NO : 3 5'-GTCGTCGTCGTCTCTAGAATGAAGCTTGATAATCTAAGCCTGAGCGGCGAATCCCAG-3'
La séquence SEQ ID NO : 3 est le complément de la séquence SEQ ID NO : 2.
La séquence de l'oligonucléotide SEQ ID NO : 1 contient les informations pour les sites de restriction BamHI et NotI, les informations pour la partie finale de la région 5'non traduite de la glucoamylase d'Aspergillus foetidus SE4 et le debut de la séquence codante de l'aspergillopepsine.
La séquence de l'oligonucléotide SEQ ID NO : 2 et, son complément, l'oligonucléotide SEQ ID NO : 3 contiennent les nucléotides qui correspondent à la fin de la séquence codante de l'aspergillopepsine et les informations supplémentaires pour les sites de restriction HindIII et XbaI.
La technique utilisée pour construire les oligonucléotides synthétiques est décrite dans BEAUCAGE, S. L. et al (1981), Tetrahedron Letters, 22, pages 1859-1882 et en utilisant des P-cyanoéthyl phosphoramidites dans un appareil de BIOSEARCH CYCLONE SYNTHESIZER.
EMI18.2
Les conditions suivies pour la"PCR"sont les suivantes : 2 minutes à 95 OC, puis 40 cycles d'une série comprenant 1 minute à 95 OC, 1 minute à 50 GC et 2 minutes à 72 OC, puis 10 minutes à 72 OC, puis une température de 20 OC est maintenue. Tous les autres paramètres utilisés pour cette"PCR"correspondent à ceux décrits dans la notice du kit vendu sous le nom"GENEAMP DNA AMPLIFICATION REAGENT KIT with AMPLITAQ Recombinant Taq DNA
<Desc/Clms Page number 19>
Polymerase" (PERKIN ELMER CETUS).
Un fragment d'ADN d'environ 1,35 kb (1 kb = 1 000 paires de bases) a été isolé comme décrit ci-dessus. Il a été comparé à l'aide de la technique de l'analyse par restriction analyse décrite dans Molecular Cloning-a laboratory manual-MANIATIS et al., (Cold Spring Harbor Laboratory) 1982, pages 374-379] à la séquence de l'aspergillopepsine A produite par la souche d'Aspergillus awamori UVK143f. Cette séquence de l'aspergillopepsine A a été publiée par Berka R. M. et al., GENE, 86,1990, pages 153-162 et corrigée par Berka R. M. et al., GENE, 96,1990, page 313. Aucune différence essentielle n'a été trouvée.
Le fragment d'ADN ainsi obtenu est digéré avec les enzymes de restriction BamHI et XbaI, puis est ligaturé, selon la technique de ligation décrite dans Molecular Cloning-a laboratory manual-SAMBROOK et al. - second edition, 1989, page 1.68-1. 69, avec le plasmide pUC18 (CLONTECH laboratories, NO 6110-1), qui a été préalablement digéré aux sites BamHI et XbaI. Le vecteur pUCASPEP (figure 1) est ainsi obtenu.
Exemple 2 Construction du plasmide pFGA2MUT
Le plasmide pFGA2MUT (figure 4) contient le gène de la glucoamylase d'Aspergillus foetidus SE4 dans lequel on a créé un site de clonage NotI entre le promoteur et la partie codante du gène de la glucoamylase, et un site de clonage HindIII entre la partie codante et le terminateur du gène de la glucoamylase. Ces deux sites de clonage NotI et HindIII sont créés par mutagénèse, comme décrit ci-après.
Le gène de la glucoamylase d'Aspergillus foetidus SE4 est isolé selon la description suivante.
L'ADN chromosomique de la souche d'Aspergillus foetidus SE4 est isolé selon la technique de GARBER et al., comme décrit à l'exemple 1. Cet ADN chromosomique isolé est digeré partiellement avec l'enzyme de restriction SauIIIA et les fragments ayant une taille de 8 à 10 kb sont isolés et purifiés par un gradient de sucrose (15 à 40 X) selon la technique décrite dans AUSUBEL, F. M. et al. (1989), Current Protocols in Molecular Biology (John
<Desc/Clms Page number 20>
VILLEY and Sons), pages 5. 3. 2-5. 3.8. Ces fragments isolés et purifiés sont introduits dans le plasmide pBR322 (CLONTECH LABORATORIES catalogue nO 6210-1), qui a été préalablement digéré par l'enzyme de restriction BamHI. On transforme ensuite la souche d'E. coli DH5a [décrite par HANAHAN, D., J. Mol. Biol.
(1983) 166, page 557, et vendue par BETHESDA RESEARCH LABORATORIES (BRL), catalogue B. R. L. Focus (1986) 8, page 9).
Environ 15 000 clones d'E. coli transformés sont criblés à l'aide de la technique d'hybridation (SAHBROOK et al., pages 9. 52-9. 55) en utilisant l'oligonucléotide synthétique suivant (SEQ ID NO : 4) : 5'-GATTCATGGTTGAGCAACGAAGCGA-3'
On se base sur la séquence de nucléotides publiée par BOEL et al., EMBO J. 3 (1984), pages 1097-1102.
On isole une colonie qui hybride avec cet oligonucléotide.
On analyse les sites de restriction et on constate que cette souche contient le gène complet de la glucoamylase, c'est-à-dire le promoteur, la région codante ainsi que le signal de sécrétion, et le terminateur.
Le fragment de 8,7 kp a été introduit, comme décrit cidessus, dans le plasmide pBR322 au site BamHI.
On crée ainsi le vecteur pFGA1 (figure 2), qui contient un insert d'ADN d'Aspergillus de 8,7 kb. Cet insert est la seule différence entre le plasmide pBR322 et le vecteur pFGA1.
On construit, comme suit, un plasmide qui est dérivé du vecteur pFGA1 et qui contient un insert moins grand que celui du vecteur pFGA1. Le vecteur pFGA1 est digéré par l'enzyme de restriction EcoRI, puis, à partir de ceci, on isole le fragment EcoRI d'une taille d'environ 5 kb contenant le promoteur, la région codante et le terminateur de la glucoamylase d'Aspergillus foetidus SE4 en suivant la méthode décrite par ZHU et al., 1985.
Ce fragment EcoRI est ensuite inseré, en suivant la technique décrite dans SAMBROOK et al., pages 1.68-1. 69, dans le plasmide pUC18, qui a été préalablement digéré par l'enzyme de restriction EcoRI. On crée ainsi le vecteur pFGA2 (figure 3).
<Desc/Clms Page number 21>
Les séquences nucléotidiques du promoteur et du terminateur de la glucoamylase d'Aspergillus foetidus SE4 ont été déterminées par la méthode de terminaison de chaînes utilisant des dideoxynucléotides, de SANGER et al. (1977) Proc. Natl. Acad. Sci. USA 74, p. 5463-5467.
L'analyse de cette séquence montre la présence d'un promoteur et d'un terminateur. On identifie la séquence de nucléotides (SEQ ID NO : 7) codant pour le promoteur de la glucoamylase d'Aspergillus foetidus SE4. On identifie la séquence de nucléotides (SEQ ID N0 : 8) codant pour le terminateur de la glucoamylase d'Aspergillus foetidus SE4.
Les nucléotides qui n'ont pas été déterminés avec certitude, ont été représentés par le symbole N.
La figure 6 représente la séquence de nucléotides codant pour le promoteur de la glucoamylase d'Aspergillus foetidus SE4.
La figure 7 représente la séquence de nucléotides codant pour le terminateur de la glucoamylase d'Aspergillus foetidus SE4.
Les oligonucléotides synthétiques utilisés pour initier les réactions d'élongation par la T7 DNA polymérase ont été synthétisés par la méthode de BEAUCAGE et al. (1981) Tetrahedron letters 22 : 1859-1882. Le séquençage a été effectué suivant le protocole donné par le fournisseur du kit de séquençage (PHARHACIA), en procédant à une dénaturation de l'ADN double brin par traitement avec du NaOH.
La stratégie de séquençage est décrite par SAHBROOK, 1989, p 13.15 et 13.17. Les gels de polyacrylamide pour le séquençage ont été effectués suivant la technique décrite par SAMBROOK, 1989, p 13.45-13. 58.
On construit, comme suit, un plasmide qui est dérivé du plasmide pFGA2 et qui contient le gène de la glucoamylase d'Aspergillus foetidus SE4 dans lequel le promoteur et le terminateur sont séparés de la partie codante par des sites de restriction NotI et HindIII. On crée ainsi deux sites de restriction NotI et HindIII dans le plasmide pFGA2, qui contient le promoteur et le terminateur. Le promoteur et le terminateur de la
<Desc/Clms Page number 22>
glucoamylase d'Aspergillus foetidus SE4 sont séparés par des sites de restriction NotI et HindIII créés par deux mutagénèses dirigées suivant la procédure décrite dans la notice technique du kit de mutagénèse (BIORAD)"MUTA-GENE PHAGEMID in vitro Mutagenesis Kit".
Les oligonucléotides synthétiques utilisés au cours de cette procédure sont les suivants, respectivement SEQ ID NO : 5 et SEQ ID NO : 6 : 5'-GCCTGAGCTTCATCCCCAGCGCGGCCGCATCATTACACCTCAGCAATGT-3'
NotI 5'-TGACTGACACCTGGCGGTGAAAGCTTCAATCAATCCATTTCGCTATAGTT-3'
HindIII
On obtient ainsi le vecteur pFGA2MUT qui contient le site de restriction NotI au début de la région 5'non traduite du gène de la glucoamylase et le site de clivage HindIII après le stop-codon dans la région 3'non traduite de la glucoamylase.
Exemple 3 Construction du vecteur d'intégration
Le plasmide pUCASPEP tel qu'obtenu à l'exemple 1, est digeré partiellement avec l'enzyme de restriction HindIII, puis complétement avec l'enzyme de restriction NotI. Ainsi, un fragment de 1,3 kb contenant la séquence codante de l'aspergillopepsine et la région 5'non traduite du gène de la glucoamylase d'Aspergillus foetidus SE4, est isolé en suivant la technique décrite par ZHU, J. D. et al., BIOTECHNOLOGY, 3,1985, pages 1014-1016.
La digestion partielle et complète des plasmides avec des enzymes de restriction est effectuée en suivant la technique décrite par SAHBROOK et al. 1989, chapitres 5.28-5. 32.
Ce fragment est introduit dans le site de clonage NotI-HindIII du plasmide pFGA2MUT, obtenu comme décrit à l'exemple 2. Ce plasmide contient le promoteur et le terminateur du gène de la glucoamylase d'Aspergillus foetidus SE4, séparés par les sites de clonage NotI et HindIII, crées par mutagènèse
<Desc/Clms Page number 23>
dirigée, comme décrit à l'exemple 2. La partie codante de la glucoamylase est donc remplacée par la partie codante de l'aspergillopepsine.
Le vecteur pFASPEP (figure 5) est ainsi obtenu. Ce vecteur pFASPEP contient la séquence codante de l'aspergillopepsine sous le contrôle des signaux de transcription de la glucoamylase d'Aspergillus foetidus. Ce vecteur contient le système d'expression qui comprend les séquences suivantes : - la séquence du promoteur de la glucoamylase d'Aspergillus foetidus SE4,
EMI23.1
- la séquence du signal de sécrétion de l'aspergillopepsine d'Aspergillus foetidus SE4, - la séquence du propeptide de l'aspergillopepsine d'Aspergillus foetidus SE4, - la séquence mature de l'aspergillopepsine d'Aspergillus foetidus SE4, et - la séquence du terminateur de la glucoamylase d'Aspergillus foetidus SE4.
Exemple 4 Transformation de la souche d'Aspergillus foetidus SE4
Le vecteur pFASPEP, tel qu'obtenu à l'exemple 3, est ensuite introduit dans la souche d'Aspergillus foetidus SE4 (dont l'obtention est décrite à l'exemple 1) par cotransformation comme décrite dans CARREZ et al., GENE, 94 (1990), pages 147-154.
Le plasmide p3SR2, qui contient le gène de l'acétamidase d'Aspergillus nidulans (amdS), est utilisé comme marqueur selectif.
Le plasmide p3SR2 est décrit dans Hynes, M. J., et al., Mol.
Cell. Biol., 3 (1983), pages 1430-1439. On effectue la transformation avec ce plasmide sur des protoplastes selon la technique décrite par KELLY, J. M. and HYNES, M. J., EMBO J. 4 (1985), pages 475-479.
Lors de la transformation, on utilise 10 fois plus de vecteur pFASPEP que de plasmide p3SR2.
Environ 100 souches transformées sont analysées. Ces souches transformées sont sélectionnées sur le milieu gélosé Y contenant
<Desc/Clms Page number 24>
du lait écrémé pour détecter la production d'aspergillopepsine.
Les colonies des souches transformées qui sécrètent l'aspergillopepsine dans le milieu de culture, sont entourées d'un halo après 1 jour d'incubation à 34 oC.
Le milieu gélosé Y est formé du milieu CZAPEK DOX AGAR (DIFCO) auquel on ajoute 2 X (poids/poids) de lait écrémé (BACTO SKIK MILK de DIFCO), 0,3 % (poids/poids) de produit PHYTAGEL (SIGMA) dans un tampon citrate-phosphate 0,05 M à pH 3,0.
Environ 30 Z des souches transformées sécrètent l'aspergillopepsine, elles ont donc intégré, dans leur génome, le vecteur de sélection p3SR2 et le vecteur d'intégration pFASPEP.
Exemple 5 Isolement et purification des souches transformées
Les souches transformées ainsi obtenues sont isolées et repiquées sur un milieu gélosé POTATO DEXTROSE AGAR (DIFCO).
Elles sont mises en culture à 32 OC jusqu'à sporulation.
Les souches transformées produisant le plus d'aspergillopepsine sont isolées et repiquées sur un milieu gélosé POTATO
EMI24.1
DEXTROSE AGAR (DIFCO). 40 souches transformées sont mises en culture à 32 oC sur ce milieu jusqu'à sporulation.
Les protoplastes transformés comme décrits à l'exemple 4, peuvent contenir plusieurs noyaux par cellule. Les souches transformées peuvent donc être hétérozygotes. Il est donc nécessaire de purifier ces souches transformées à partir de spores isolées contenant un seul noyau par cellule.
Les spores sont récoltées, diluées dans de l'eau physiologique puis étalées sur le milieu gélosé A contenant du lait écrémé, tel que décrit à l'exemple 4, de telle sorte que des colonies individuelles soient obtenues. Les colonies venant d'une seule spore et présentant un halo large sont repiquées de nouveau sur le milieu gélosé POTATO DEXTROSE AGAR. Ces colonies sont mises en culture à 32 oC sur ce milieu gélosé jusqu'à sporulation.
Les conidies purifiées des souches transformées sont récoltées et conservées. Ces souches transformées d'Aspergillus foetidus, ainsi obtenues, sont dénommées SE4tra.
<Desc/Clms Page number 25>
Exemple 6 Production d'aspergillopepsine par la souche transformée d'Aspergillus foetidus SE4tra
Les conidies purifiées, obtenues à l'exemple 5, sont mises en culture dans un milieu liquide riche contenant de l'extrait de malt (DIFCO) (2 X en poids), de la peptone (DIFCO) (0,1 X en poids), de l'amidon hydrolysé (10 X en poids) et du carbonate de calcium (2 % en poids). Le pH du milieu de culture est ajusté à un pH 6 par l'addition d'ammoniac. La culture est réalisée à 32 OC sous agitation et est suivie durant 7 jours.
Puis, la culture obtenue est centrifugée à 5 000 tours/minute pendant 15 minutes (BECKMAN JA-10). On mesure l'activité enzymatique (aspergillopepsine) du surnageant après 4, 5,6 et 7 jours de culture.
On mesure l'activité enzymatique selon une technique modifiée par rapport à la technique décrite par ICHISHIMA (Methods in Enzymology, vol. XIX, Proteolytic Enzymes, eds G.
PERLMANN and L. LORAND, 1970, pages 397-399). La solution contenant le substrat est une solution aqueuse comprenant 2 X (poids/volume) de caséine, le pH de cette solution est ajusté à un pH de 2,7 par l'addition d'HCl concentré. Les réactifs suivants sont mis en oeuvre : 0,4 M de TCA (acide trichloroacétique), 0,4 M de Na2C03 et le réactif de FOLIN-CIOCALTEAU (MERCK). Les réactifs commerciaux sont dilués 1 : 5 fois avec de l'eau distillée avant leur utilisation. Une solution standard de tyrosine est également préparée. L'échantillon de surnageant est dilué dans un tampon acétate-HCl 0,1 H (pH 2,7). Cet échantillon dilué est mélangé avec la solution de substrat comprenant la caséine dans une proportion de 1 : 1. Ce mélange est incubé à 30 OC durant 10 minutes.
La réaction est arrêtée par l'addition d'un volume de TCA 0,4 M. Cette solution est centrifugée 10 minutes à 12 500 tours par minute (centrifugeuse BECKHAN JA-10). A 0,2 ml du surnageant de centrifugation, on ajoute 1 ml de Na2C03 0,4 M et 0,2 ml de réactif de FOLIN-CIOCALTEAU. Cette solution est incubée à 30 OC durant 25 minutes. Ensuite, on mesure l'absorbance à 660 nm.
<Desc/Clms Page number 26>
L'activité enzymatique est exprimée en umoles d'équivalents de tyrosine produits par minute durant l'hydrolyse de la caséine à un pH de 2,7 à 30"C, déterminées par l'augmentation de l'absorbance mesurée à 660 nm.
Les résultats d'activité enzymatique obtenus sont comparés avec ceux de la souche d'Aspergillus foetidus non transformée (souche SE4). La production d'aspergillopepsine de la souche transformée (souche SE4tra) en comparaison avec celle de la souche non transformée (souche SE4) est multipliée par un facteur d'environ 40.
On observe donc une forte augmentation de la production d'aspergillopepsine.
La production d'aspergillopepsine est substantiellement extracellulaire.
Exemple 7 Estimation du poids moléculaire de l'aspergillopepsine produite par la souche transformée SE4tra
L'aspergillopepsine produite par la souche transformée SE4tra est analysée par la technique SDS-PAGE, selon la méthode décrite dans Anal. Biochem. 78,1977, pages 459-482 et Biochemistry 12,1973, pages 871-890, en utilisant le système PHAST SYSTEM (LKB-PHARMACIA).
Pour ce faire, on effectue sur le surnageant tel qu'obtenu à l'exemple 6, une précipitation au moyen d'acide trichloroacétique (10 X v/v final). Le précipité obtenu est repris dans un tampon composé de 10 mM TRIS/HC1 (pH-8, 0) (tris (hydroxyméthyl) aminométhane acidifié avec HCl), 1 mM EDTA (acide éthylènediamine tétraacétique), 2,5 X (poids/volume) SDS (sodium dodécyle sulfate), 5 X (volume/volume) ss-mercaptoéthanol et 0,01 % (poids/volume) de bleu de bromophénol.
4 pl du précipité repris dans le tampon sont déposés sur un gel de polyacrylamide. Le système de gel utilisé est le système PHAST SYSTEM avec des gels contenant un gradient de polyacrylamide de 10-15 Z (v/v) en présence de SDS. Les conditions d'électrophorèse sont celles prescrites par le fournisseur. Une coloration du gel au bleu de Coomassie fait apparaître un poly-
<Desc/Clms Page number 27>
peptide d'un poids moléculaire d'environ 43 KDaltons.
Par cette analyse, on remarque que la taille de l'aspergillopepsine produite par la souche transformée correspond à la taille de l'aspergillopepsine native produite par la souche non transformée.
Exemple 8 Profil d'activité en fonction pH pour l'aspergillopepsine produite par la souche transformée SE4tra
On mesure l'activité enzymatique de l'aspergillopepsine à différents pH (de 1,5 à 3,5) à une température de 30 Oc en tampon acétate-HCl 0,1 M en présence de caséine. L'incubation dure 10 minutes. Les conditions appliquées sont celles décrites à l'exemple 6.
On met en oeuvre le surnageant obtenu à l'exemple 6. Ce surnageant est dilué de 50 à 500 fois dans le tampon acetate-cl 0,1 M en fonction du pH et de l'activité enzymatique du surnageant.
Les résultats sont rassemblés dans le tableau 2.
Au cours de cet essai l'activité enzymatique maximale a été mesurée pour l'échantillon placé à un pH d'environ 3,0 et à une température de 30 oc. Par définition on a donc attribué à cet échantillon une activité relative de 100 Z.
Cet exemple montre que l'aspergillopepsine présente une activité enzymatique optimale mesurée à une température d'environ 30 oc dans une gamme de pH comprise entre 2,5 et 3,5.
<Desc/Clms Page number 28>
TABLEAU 2
EMI28.1
<tb>
<tb> pH <SEP> Activité <SEP> relative
<tb> en <SEP> X
<tb> 1,5 <SEP> 1
<tb> 2,0 <SEP> 39
<tb> 2,5 <SEP> 80
<tb> 2,7 <SEP> 93
<tb> 3,0 <SEP> 100
<tb> 3,5 <SEP> 85
<tb>
Le profil d'activité en fonction du pH de l'aspergillopepsine produite par la souche transformée est similaire à celui de l'aspergillopepsine produite par la souche non transformée, c'est-à-dire l'enzyme native.
Exemple 9 Profil d'activité en fonction de la température pour l'aspergillopepsine produite par la souche transformée SE4tra
On mesure l'activité enzymatique de l'aspergillopepsine à différentes températures (de 40 à 65 OC) à un pH de 2,7 en tampon acétate-HCl 0,1 M en présence de caséine. L'incubation dure 10 minutes. Les conditions appliquées sont celles décrites à l'exemple 6.
On met en oeuvre le surnageant tel qu'obtenu à l'exemple 6.
Ce surnageant est dilué de 50 à 1 000 fois dans le tampon acétate-HCl 0,1 M en fonction du pH et de l'activité enzymatique du surnageant.
Les résultats sont rassemblés dans le tableau 3.
Au cours de cet essai l'activité enzymatique maximale a été mesurée pour l'échantillon placé à un pH d'environ 2,7 et à une température de 55 go. Par définition on a donc attribué à cet échantillon une activité relative de 100 X.
Cet exemple montre que l'aspergillopepsine présente une activité enzymatique optimale mesurée à un pH d'environ 2,7 dans une gamme de température comprise entre 50 et 60 OC.
<Desc/Clms Page number 29>
TABLEAU 3
EMI29.1
<tb>
<tb> température <SEP> Activité <SEP> relative
<tb> oc <SEP> X
<tb> 40 <SEP> 46
<tb> 45 <SEP> 66
<tb> 50 <SEP> 90
<tb> 55 <SEP> 100
<tb> 60 <SEP> 88
<tb> 65 <SEP> 39
<tb>
Le profil d'activité en fonction du température de l'aspergillopepsine produite par la souche transformée est similaire à celui de l'aspergillopepsine produite par la souche non transformée, c'est-à-dire l'enzyme native.
Les exemples 7,8 et 9 montrent que l'aspergillopepsine obtenue selon l'invention est glycosylée de la même manière que l'enzyme native. En effet, les caractéristiques de l'aspergillopepsine produites par la souche transformée sont similaires à celles de l'aspergillopepsine produites par la souche non transformée.
<Desc/Clms Page number 30>
LISTE DE SEQUENCES (1) INFORMATIONS GENERALES : (i) DEPOSANT : (A) NOM : SOLVAY (Société Anonyme) (B) RUE : rue du Prince Albert, 33 (C) VILLE : Bruxelles (E) PAYS : Belgique (F) CODE POSTAL : 1050 (G) TELEPHONE : (02) 509.61. 11 (ii) TITRE DE L'INVENTION : Système d'expression, vecteur d'intégration et cellule transformée par ce vecteur d'intégration (iii) NOMBRE DE SEQUENCES : 8 (iv) FORME LISIBLE PAR ORDINATEUR : (A) TYPE DE SUPPORT : Floppy disk (B) ORDINATEUR : IBM PC compatible (C) SYSTEME D'EXPLOITATION : PC-DOS : MS-DOS (2) INFORMATION POUR LA SEQ ID NO : 1 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 63 paires de bases (B) TYPE : acide nucléique (C) NOMBRE DE BRINS : simple (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (oligonucléotide synthétique) (xi) DESCRIPTION DE LA SEQUENCE :
SEQ ID NO : 1 :
EMI30.1
<tb>
<tb> TGATGATCAG <SEP> GATCCGGCGG <SEP> CCGCACCTCA <SEP> GCAATGGTCG <SEP> TCTTCAGCAA <SEP> AACCGCTGCC <SEP> 60
<tb> CTC <SEP> 63
<tb>
<Desc/Clms Page number 31>
(2) INFORMATION POUR LA SEQ ID NO : 2 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 57 paires de bases (B) TYPE : acide nucléique (C) NOMBRE DE BRINS : simple (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (oligonucléotide synthétique) (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 2 : CTGGGATTCG CCGCTCAGGC TTAGATTATC AAGCTTCATT CTAGAGACGA CGACGAC 57 (2) INFORMATION POUR LA SEQ ID NO : 3 : (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 57 paires de bases (B) TYPE : acide nucléique (C) NOMBRE DE BRINS : simple (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (oligonucléotide synthétique) (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 3 : GTCGTCGTCG TCTCTAGAAT GAAGCTTGAT AATCTAAGCC TGAGCGGCGA ATCCCAG 57 (2) INFORMATION POUR LA SEQ ID NO : 4 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 25 paires de bases (B) TYPE : acide nucléique (C) NOMBRE DE BRINS : simple (D) CONFIGURATION : linéaire
<Desc/Clms Page number 32>
(ii) TYPE DE MOLECULE : acide nucléique (oligonucléotide synthétique) (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 4 : GATTCATGGT TGAGCAACGA AGCGA 25 (2) INFORMATION POUR LA SEQ ID NO : 5 : (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 49 paires de bases (B) TYPE : acide nucléique (C) NOMBRE DE BRINS : simple (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (oligonucléotide synthétique) (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 5 : GCCTGAGCTT CATCCCCAGC GCGGCCGCAT CATTACACCT CAGCAATGT 49 (2) INFORMATION POUR LA SEQ ID NO : 6 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 50 paires de bases (B) TYPE : acide nucléique (C) NOMBRE DE BRINS : simple (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (oligonucléotide synthétique) (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 6 : TGACTGACAC CTGGCGGTGA AAGCTTCAAT CAATCCATTT CGCTATAGTT 50
<Desc/Clms Page number 33>
EMI33.1
(2) INFORMATION POUR LA SEQ ID NO : 7 : (i) CARACTERISTIQUES DE LA SEQUENCE :
(A) LONGUEUR : 2045 paires de bases (B) TYPE : acide nucléique (C) NOMBRE DE BRINS : simple (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : ADN génomique (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 7 :
EMI33.2
<tb>
<tb> GAATTCCCGA <SEP> CATCGGTCAT <SEP> TGGCCTCCTC <SEP> GCTGATCTCC <SEP> CTTTGGTACA <SEP> GTCGGCTACC <SEP> 60
<tb> AATGCTCTCG <SEP> AGGATTGCCT <SEP> GAACATTGAC <SEP> ATTCGGCGTC <SEP> CGGCCGGGAC <SEP> CACCGCGGAC <SEP> 120
<tb> TCGAAGCTGC <SEP> CTGTGCTGGT <SEP> CTGGATCTTT <SEP> GGCGGAGGCT <SEP> TTGAACTTGG <SEP> TTCAAAGGCG <SEP> 180
<tb> ATGTATGATG <SEP> GTACAACGAT <SEP> GGTATCATCG <SEP> TCGATAGACA <SEP> AGAACATGCC <SEP> TATCGTGTTT <SEP> 240
<tb> GTAGCAATGA <SEP> ATTATCGCGT <SEP> GGGAGGTTTC <SEP> GGGTTCTTGC <SEP> CCGGAAAGGA <SEP> GATCCTGGAG <SEP> 300
<tb> GACGGGTCCG <SEP> CGAACCTAGG <SEP> GCTCCTGGAC <SEP> CAACGCCTTG <SEP> CCCTGCAGTG <SEP> GGTTGCCGAC <SEP>
360
<tb> AACATCGAGG <SEP> CCTTTGGTGG <SEP> AGACCCGGAC <SEP> AAGGTGACGA <SEP> TTTGGGGAGA <SEP> ATCAGCAGGA <SEP> 420
<tb> GCCATTCGTT <SEP> TGACTAGATG <SEP> ACTTGTACGA <SEP> CGGAAACATC <SEP> ACTTACAAGG <SEP> ATAAGCCCTT <SEP> 480
<tb> GTTCCGGGGG <SEP> GCCATCATGG <SEP> ACTCCGGTAG <SEP> TGTTGTTCCC <SEP> GCAGACCCCG <SEP> TCGATGGGGT <SEP> 540
<tb> CAAGGGACAG <SEP> CAAGTATATG <SEP> ATGCGGTAGT <SEP> GGAATCTGCA <SEP> GGCTGTTCCT <SEP> CTTCTAACGA <SEP> 600
<tb> CACCCTAGCT <SEP> TGTCTGCGTG <SEP> AACTAGACTA <SEP> CACCGACTTC <SEP> CTCAATGCGG <SEP> CAAACTCCGT <SEP> 660
<tb> GCCAGGCATT <SEP> TTAAGCTACC <SEP> ATTCTGTGGC <SEP> GTTATCATAT <SEP> GTGCCTCGAC <SEP> CGGACGGGAC <SEP> 720
<tb> GGCGTTGTCG <SEP> GCATCACCGG <SEP> ACGTTTTGGG <SEP> CAAAGCAGGG <SEP> AAATATGCTC <SEP> GGGTCCCGTT <SEP> 780
<tb>
<Desc/Clms Page number 34>
EMI34.1
<tb>
<tb> CATCGTGGGC <SEP> GACCAAGAGG <SEP> ATGAGGGGAC
<SEP> CTTATTCGCC <SEP> TTGTTTCAGT <SEP> CCAACATTAC <SEP> 840
<tb> GACGATCGAC <SEP> GAGGTGGTCG <SEP> ACTACCTGGC <SEP> CTCATACTTC <SEP> TTCTATGACG <SEP> CTAGCCGAGA <SEP> 900
<tb> GCAGCTTGAA <SEP> GAACTAGTGG <SEP> CCCTGTACCC <SEP> AGACACCACC <SEP> ACGTACGGGT <SEP> CTCCGTTCAG <SEP> 960
<tb> ACAGCGCGGC <SEP> CAACAACTGG <SEP> TATCCGCAAT <SEP> TTAAGCGATT <SEP> GGCCGCCATT <SEP> CTCGGCGACT <SEP> 1020
<tb> TGGTCTTCAC <SEP> CATTACCGGC <SEP> GGGCATTCCT <SEP> CTCGTATGCA <SEP> GAGGAAATCT <SEP> CCCCTGATCT <SEP> 1080
<tb> TCCGAACTGG <SEP> TCGTACCTGG <SEP> CGACCTATGA <SEP> CTATGGCACC <SEP> CCAGTTCTGG <SEP> GGACCTTCCA <SEP> 1140
<tb> CGGAAGTGAC <SEP> CTGCTGCAGG <SEP> TGTTCTATGG <SEP> GATCAAGCCA <SEP> AACTATGCAG <SEP> CTAGTTCTAG <SEP> 1200
<tb> CCACACGTAC <SEP> TATCTGAGCT <SEP> TTGTGTATAC <SEP> GCTGGATCCG <SEP> AACTCCAACC <SEP> GGGGGGAGTA <SEP> 1260
<tb> CATTGAGTGG <SEP> CCGCAGTGGA <SEP> AGGAATCGCG
<SEP> GCAGTTGATG <SEP> AATTTCGGAG <SEP> CGAACGACGC <SEP> 1320
<tb> CAGTCTCCTT <SEP> ACGGATGATT <SEP> TCCGCAACGG <SEP> GACATATGAG <SEP> TTCATCCTGC <SEP> AGAATACCGC <SEP> 1380
<tb> GGCGTTCCAC <SEP> ATCTGATGCC <SEP> ATTGGCGGAG <SEP> GGGTCCGGAC <SEP> GGTCAGGAAC <SEP> TTAGCCTTAT <SEP> 1440
<tb> GAGATGAATG <SEP> ATGGACGTGT <SEP> CTGGCCTCGG <SEP> AAAAGGATAT <SEP> ATGGGATCAT <SEP> GATAGTACTA <SEP> 1500
<tb> GCCATATTAA <SEP> TGAAGGGCAT <SEP> ATACCACGCG <SEP> TTGGACCTGC <SEP> GTTATAGCTT <SEP> CCCGTTAGTT <SEP> 1560
<tb> ATAGTACCAT <SEP> CGTTATACCA <SEP> GCCAATCAAG <SEP> TCACCACGCA <SEP> CGACCGGGGA <SEP> CGGCGAATCC <SEP> 1620
<tb> CCGGGAATTG <SEP> AAAGAAATTG <SEP> CATCCCAGGC <SEP> CAGTGAGGCA <SEP> GCGATTGGCC <SEP> ACCTCTCCAA <SEP> 1680
<tb> GGCACAGGGC <SEP> CATTCTGCAG <SEP> CGCTGGTGGA <SEP> TTCATCGCAA <SEP> TTTCCCCCGG <SEP> CCCGGCCCGA <SEP> 1740
<tb> CACCGCTATA <SEP> GGCTGGTTCT <SEP>
CCCACACCAT <SEP> CGGAGATTCG <SEP> TCGCCTAATG <SEP> TCTCGTCCGT <SEP> 1800
<tb> TCACAAGCTG <SEP> AAGAGCTTGA <SEP> AGTGGCGAGA <SEP> TGTCTCTGCA <SEP> GGAATTCAAG <SEP> CTAGATGCTA <SEP> 1860
<tb>
<Desc/Clms Page number 35>
EMI35.1
<tb>
<tb> AGCGATATTG <SEP> CATGGCAATA <SEP> TGTGTTGATG <SEP> CATGTGCTTC <SEP> TTCCTTCAGC <SEP> TTCCCCTCGT <SEP> 1920
<tb> GCAGATGAGG <SEP> TTTGGCTATA <SEP> AATTGAAGTG <SEP> GTTGGTCGGG <SEP> GTTCCGTGAG <SEP> GGGCTGAAGT <SEP> 1980
<tb> GCTTCCTCCC <SEP> TTTTAGACGC <SEP> AACTGAGAGC <SEP> CTGAGCTTCA <SEP> TCCCCAGCAT <SEP> CATTACACCT <SEP> 2040
<tb> CAGCA <SEP> 2045
<tb>
(2) INFORMATION POUR LA SEQ ID NO : 8 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 836 paires de bases (B) TYPE : acide nucléique (C) NOMBRE DE BRINS : simple (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : ADN génomique (xi) DESCRIPTION DE LA SEQUENCE :
SEQ ID NO : 8 :
EMI35.2
<tb>
<tb> CAATCAATCC <SEP> ATTTCGCTAT <SEP> AGTTAAAGGA <SEP> TGGGGATGAG <SEP> GGCAATTGGT <SEP> TATATGATCA <SEP> 60
<tb> TGTATGTAGT <SEP> GGGTGTGCAT <SEP> AATAGTAGTG <SEP> AAATGGAAGC <SEP> CAGTCATGTG <SEP> ATTGTAATCG <SEP> 120
<tb> ACCGACGGAA <SEP> TTGAGGATAT <SEP> CCGGAAATAC <SEP> AGACACCGTG <SEP> AAAGCCATGG <SEP> TCTTTCCTTC <SEP> 180
<tb> GTGTAGAAGA <SEP> CCAGACAGAC <SEP> AGTCCCTGAT <SEP> TTACCCTTGC <SEP> ACAAAGCACT <SEP> AGAAAATTAG <SEP> 240
<tb> CATTCCATCC <SEP> TTCTCTGCTT <SEP> GCTCTGCTGA <SEP> TATCACTGTC <SEP> ATTCAATGCA <SEP> TAGCCATGAG <SEP> 300
<tb> CTCATCTTAG <SEP> ATCCAAGCAC <SEP> GTAAATTCCA <SEP> TAGCCGAGGT <SEP> CCACAGTGGA <SEP> GCAGCAACAT <SEP> 360
<tb> TCCCCATCAT <SEP> TGCTTTTCCC <SEP> CCAGGGGNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> 420
<tb> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP>
NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> 480
<tb> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> 540
<tb>
<Desc/Clms Page number 36>
EMI36.1
<tb>
<tb> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> 600
<tb> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> 660
<tb> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> 720
<tb> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> 780
<tb> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNNNN <SEP> NNNNNNNGAA <SEP> GAATTC <SEP> 836
<tb>
<Desc / Clms Page number 1>
Expression system, integration vector and cell transformed by this integration vector
The invention relates to an expression system which can be used for the extracellular production of microbial aspartic proteases and, more particularly, of aspergillopepsins.
The invention also relates to an integration vector containing this expression system and a cell transformed by this integration vector.
Microbial aspartic proteases are classified in the international system according to reference E. C. 3.4. 23.6. They are also called acid proteases or carboxyl proteases. These enzymes hydrolyze, under acidic conditions, the peptide bonds of proteins by forming peptides. They have an optimum pH of less than 5. These enzymes have numerous industrial applications.
Microbial aspartic proteases are naturally produced by certain strains of filamentous fungi and in particular by strains of Aspergillus. Unfortunately, microbial aspartic proteases are not efficiently and industrially produced by these strains, their productivity being low. This is why efficient production has long been sought after.
In this context, an expression system has been proposed comprising the sequence of the aspergillus oryzae oc-amylase promoter, the aspartic protease sequence of Mucor miehei, the glucoamylase terminator sequence of Aspergillus niger ( BIO / TECHNOLOGY (1987) 6, pages 1419-1422). This system introduced into Aspergillus oryzae makes it possible to obtain the aspartic protease.
However, the aspartic protease obtained is hyperglycosylated.
This adversely affects the essential properties of this enzyme.
Furthermore, an expression system has been described which can be used for the production of bovine chymosin. This system includes the
<Desc / Clms Page number 2>
Aspergillus niger glucoamylase promoter sequence, Aspergillus niger glucoamylase signal peptide sequence, bovine chymosin coding sequence and Aspergillus niger glucoamylase terminator sequence. A transformed strain of Aspergillus niger, containing this expression system, makes it possible to obtain bovine chymosin. However, with this expression system, the final yield obtained is low, because the proteases produced by the transformed strain hydrolyze bovine chymosin.
In addition, no mention is made of the possible application of such an expression system for the production of a microbial enzyme and in particular of a microbial aspartic protease.
At present, an expression system making it possible to obtain the expression and a particularly effective secretion of a microbial aspartic protease by a transformed strain of filamentous fungus containing this expression system and also making it possible to obtain a protease microbial aspartic normally glycosylated, is not known.
The main object of the present invention is to provide an expression system making it possible to obtain a microbial aspartic protease, and in particular a fungal acid protease, and more particularly an aspergillopepsin, in large quantity in the culture medium, where a transformed strain containing this expression system is cultivated.
The first object of the present invention is also to provide an expression system making it possible to obtain a microbial aspartic protease, and particularly a fungal acid protease, and more particularly an aspergillopepsin, normally glycosylated, that is to say having characteristics and properties as close as possible to those of the native (wild) enzyme.
By "microbial aspartic protease" is meant an enzyme which catalyzes the hydrolysis reaction of proteins into peptides and which has an optimum pH of less than 5. These enzymes have an acidic catalytic site. These enzymes are classified in the international system according to reference B. C. 3.4. 23.6. This definition includes
<Desc / Clms Page number 3>
natural enzymes and modified enzymes, such as enzymes whose nucleotide sequence (which codes for this enzyme) or the amino acid sequence has been modified by genetic engineering techniques or by mutagenesis techniques.
Usually the microbial aspartic protease is a fungal aspartic protease. Excellent results have been obtained with aspergillopepsin.
The present invention also aims to provide an integration vector and a plasmid containing the expression system described above.
The present invention also aims to provide a transformed strain of Aspergillus, and more particularly a transformed strain of Aspergillus foetidus, which expresses and secretes in its culture medium the microbial aspartic protease with a high level of productivity. According to the invention, the secretion of microbial aspartic protease is substantially extracellular.
In addition, the present invention has many advantages when the microbial aspartic protease comes from the wild strain of Aspergillus which was used during the transformation. In fact, the transformation is, in this case, perfectly homologous and therefore does not have any of the drawbacks that a heterologous transformation entails, such as in particular hyperglycosylation of the enzyme. By "homologous transformation" is meant a mode of genetic transfer involving a microbial cell and a DNA molecule which penetrates this cell and can recombine the cellular genome, the DNA molecule originating from a microbial cell belonging to the same kind. Preferably, the DNA molecule comes from a microbial cell belonging to the same species.
Particularly preferably, the DNA molecule originates from a microbial cell itself.
The present invention also aims to provide a method for producing microbial aspartic protease using a strain of filamentous fungus which produces a large amount of microbial aspartic protease in an extra-
<Desc / Clms Page number 4>
moreover, the microbial aspartic protease obtained is glycosylated in the same way as the native enzyme.
The present invention also aims to provide a DNA molecule comprising the nucleotide sequence which codes for the promoter of the glucoamylase of Aspergillus foetidus.
The present invention also aims to provide a DNA molecule comprising the nucleotide sequence which codes for the microbial aspartic protease, and particularly for the fungal acid protease, and more particularly for aspergillopepsin.
Another object of the present invention is to provide a DNA molecule comprising the nucleotide sequence which codes for aspergillopepsin derived from a strain of Aspergillus foetidus, and in particular from the strain of Aspergillus foetidus SE4.
The present invention also aims to provide a microbial aspartic protease, and particularly a fungal acid protease and more particularly an aspergillopepsin produced by a strain of Aspergillus foetidus, and particularly by the strain of Aspergillus foetidus SE4.
The present invention also aims to provide a microbial aspartic protease produced by a transformed strain comprising the expression system. The strain may be a strain of Aspergillus foetidus, and particularly of the strain of Aspergillus foetidus SE4.
To this end, the invention relates to an expression system which can be used for the extracellular production of a protease.
EMI4.1
microbial aspartic, characterized in that it comprises: - the sequence of the glucoamylase promoter, - the sequence of a secretion signal, - the sequence of a propeptide, and - the mature sequence of the microbial aspartic protease.
Preferably, the expression system also includes the sequence of a terminator.
The invention relates to an expression system which can be used for the extracellular production of a microbial aspartic protease, characterized in that it comprises at least:
<Desc / Clms Page number 5>
- the glucoamylase promoter sequence, - the sequence of the microbial aspartic protease secretion signal,
EMI5.1
- the propeptide sequence of the microbial aspartic protease, - the mature sequence of the microbial aspartic protease, and - the sequence of a terminator.
Preferably, in the expression system according to the invention, the terminator sequence is that of the glucoamylase terminator.
The invention preferably relates to an expression system which can be used for the extracellular production of a fungal acid protease, characterized in that it comprises at least: the sequence of the glucoamylase promoter from Aspergillus foetidus SE4,
EMI5.2
the sequence of the secretion signal of the fungal acid protease of Aspergillus foetidus SE4, the sequence of the propeptide of the fungal acid protease of Aspergillus foetidus SE4, the mature sequence of the fungal acid protease of Aspergillus foetidus SE4, and - the sequence of the Aspergillus foetidus SE4 glucoamylase terminator.
By "expression system" is meant a molecular unit capable of being integrated into the genome of a filamentous fungus and capable of providing this fungus with the genetic information necessary for the biosynthesis of the microbial aspartic protease.
By "glucoamylase promoter" is meant the transcription promoter (s). The promoter, which consists of a DNA sequence showing strong transcription activity, can be preceded by DNA sequences which stimulate transcription, such as sequences known as "enhancers" or "Upstream Activating Sequences ". The promoter contains transcription control sequences which influence the expression of the fused coding DNA. The sequence of the promo-
<Desc / Clms Page number 6>
Glucoamylase contains the sequences which control transcription and which are involved in the expression of glucoamylase.
By the "secretion signal sequence" of the microbial aspartic protease is meant a DNA sequence corresponding to an amino acid sequence which is naturally operably linked to the amino terminus of the aspartic protease propeptide sequence microbial. In this application, the part of the structural gene, which codes for the signal peptide, is named "sequence of the secretion signal of microbial aspartic protease"; the part of the structural gene, which codes for the propeptide, is called "microbial aspartic protease propeptide sequence"; and the structural gene part, which codes for microbial aspartic protease as
EMI6.1
as such, is named "mature sequence of microbial aspartic protease".
All of these three sequences, that is to say secretion signal sequence, propeptide sequence and mature sequence, code for the preproenzyme. In this application, the sequence of the secretion signal can come from any protein which is produced extracellularly by a microorganism. Any functional secretory signal sequence in a filamentous fungus may be suitable. As an example of a secretion signal sequence of fungal origin, mention may be made of the secretion signal sequence of an enzyme produced by a filamentous fungus in a substantially extracellular manner.
Among these, there may be mentioned the sequence of the secretion signal of a protease, a cellulase, an amylase, a glucoamylase and, in particular, of the glucoamylase of Aspergillus niger, of the cellulase of Trichoderma reesei, aspartic protease from Mucor miehei.
By the "propeptide sequence" of microbial aspartic protease is meant a DNA sequence corresponding to an amino acid sequence which is naturally operably linked to the amino terminus of the mature sequence of microbial aspartic protease. The propeptide sequence linked to the mature microbial aspartic protease sequence
<Desc / Clms Page number 7>
code for the proenzyme or zymogen.
By "mature sequence" of microbial aspartic protease, is meant the part of the sequence which is translated into active protein, that is to say the coding sequence of microbial aspartic protease which corresponds to the structural gene for aspartic protease microbial without the secretory signal sequence and without the propeptide sequence. The coding sequence (structural gene) includes the secretory signal sequence, the propeptide sequence and the mature aspergillopepsin sequence.
By "terminator" is meant the transcription terminator (s). The glucoamylase terminator sequence is a DNA sequence that acts to terminate the transcription of glucoamylase. The terminator sequence also contains polyadenylation sequences which stabilize the mRNA. In this application, any functional terminator in a filamentous fungus may be suitable. Terminators are known to those skilled in the art.
Examples of terminators of known fungal origin include the terminator trpC, that of a glucoamylase, that of an amylase, that of an alpha-amylase, that of an aspartic protease, that of an acid phosphatase , that of a lipase, that of a cellulase, that of a glycolytic enzyme, that of an isomerase, that of a glucanase, that of a hydrolase, that of a dehydrogenase, and in particular, the terminator trpC of Aspergillus nidulans, the terminator of Aspergillus niger glucoamylase, that of Aspergillus niger alpha-amylase, that of Hucor miehei aspartic protease, that of Aspergillus niger acid phosphatase, that of an alcohol dehydrogenase from Aspergillus nidulans.
Usually the glucoamylase promoter sequence originates from a filamentous fungus, as does the microbial aspartic protease secretion signal sequence, the microbial aspartic protease propeptide sequence, the microbial aspartic protease sequence and as the glucoamylase terminator sequence.
These sequences, i.e. the promoter sequence of the
<Desc / Clms Page number 8>
glucoamylase, the sequence of the microbial aspartic protease secretion signal, the sequence of the microbial aspartic protease propeptide, the mature microbial aspartic protease sequence and the glucoamylase terminator sequence, originate from a strain of a fungus identical or different filamentous.
Generally, they come from a strain of Aspergillus, Penicillium, Rhizopus, Endothia or Mucor.
Usually they come from a strain of Aspergillus. Preferably, they come from a strain belonging to the Aspergillus niger group, such as in particular a strain of Aspergillus niger, Aspergillus foetidus, Aspergillus awamori or Aspergillus saitoi. In a particularly preferred manner, they come from a strain of Aspergillus niger or from a strain of Aspergillus foetidus. Preferably, they come from a strain of Aspergillus foetidus. In a particularly preferred manner, they come from the strain of Aspergillus foetidus SE4.
Strains of Aspergillus niger and strains of Aspergillus foetidus, from which one or the other of the sequences described above may originate, are known, such as in particular the strain of Aspergillus niger NRRL 3 (AGRICULTURAL RESEARCH SERVICE CULTURE COLLECTION (NRRL), 1815 North University Street, Peoria, Illinois 61604, USA), the strain of Aspergillus niger ATCC 13496 (AMERICAN TYPE CULTURE COLLECTION, 12301 Parklawn drive, Rockville, Maryland 20852-1776, USA), the strain of Aspergillus niger ATCC 22343, the strain of Aspergillus niger ATCC 46890, the strain of Aspergillus foetidus ATCC 10254, the strain of Aspergillus foetidus ATCC 14916.
In a preferred variant of the invention, the sequence of the microbial aspartic protease secretion signal, the sequence of the microbial aspartic protease propeptide and the mature microbial aspartic protease sequence originate from the same filamentous fungus.
Excellent results have been obtained with an expression system according to the invention comprising the signal sequence
<Desc / Clms Page number 9>
secretion of Aspergillopepsin from the Aspergillus foetidus SE4 strain, the sequence of the Aspergillopepsin propeptide from the Aspergillus foetidus SE4 strain and the mature Aspergillopepsin sequence from the Aspergillus foetidus SE4 strain.
In a preferred variant of the invention, the sequence of the glucoamylase promoter and the sequence of the glucoamylase terminator originate from the same filamentous fungus. Good results have been obtained with an expression system according to the invention comprising the sequence of the glucoamylase promoter of the Aspergillus foetidus strain and the sequence of the terminator of the Aspergillus foetidus strain. Excellent results have been obtained with an expression system, according to the invention, comprising the glucoamylase promoter sequence of the Aspergillus foetidus SE4 strain and the terminator sequence of the Aspergillus foetidus SE4 strain. The DNA molecule comprising the nucleotide sequence SEQ ID NO: 7 codes for the promoter of the strain of Aspergillus foetidus SE4.
The DNA molecule comprising the nucleotide sequence SEQ ID NO: 8 codes for the terminator of the strain of Aspergillus foetidus SE4.
In a particularly preferred variant of the invention, the sequence of the glucoamylase promoter, the sequence of the secretion signal of microbial aspartic protease, the sequence of the propeptide of microbial protease protease, the mature sequence of microbial aspartic protease and the Glucoamylase terminator sequence originate from the same filamentous fungus.
Preferably in the expression system according to the invention, the promoter sequence is positioned upstream of the secretion signal sequence. The secretion signal sequence itself is positioned upstream of the propeptide sequence, the propeptide sequence is positioned upstream of the mature sequence, this mature sequence is positioned upstream of the terminator sequence. These positions are chosen so that, under appropriate conditions, they allow the expression of the microbial aspartic protease under the control of the transcription signals, that is to say of the
<Desc / Clms Page number 10>
promoter and terminator.
Preferably, the sequences included in the expression system are operably linked. The glucoamylase promoter sequence is operably linked to the microbial aspartic protease secretion signal sequence. The sequence of the microbial aspartic protease secretion signal is operably linked to the microbial aspartic protease propeptide sequence. The microbial aspartic protease propeptide sequence is operably linked to the mature microbial aspartic protease sequence. The mature sequence of microbial aspartic protease is operably linked to the terminator sequence.
The invention also relates to a method for preparing an expression system comprising at least the sequence of the glucoamylase promoter, the sequence of the secretion signal of microbial aspartic protease, the sequence of the propeptide of microbial aspartic protease, the mature sequence of microbial aspartic protease, and terminator sequence.
This process comprises: - the isolation of the microbial aspartic protease secretion signal sequence, the microbial aspartic protease propeptide sequence and the microbial aspartic protease sequence from the genomic DNA of a microorganism which produces this microbial aspartic protease, and - the introduction of the secretion signal sequence of the microbial aspartic protease, of the propeptide sequence of the microbial aspartic protease and of the mature sequence of the microbial aspartic protease into a vector containing the glucoamylase promoter sequence and the terminator sequence,
this introduction being made in a site chosen so that the positioning of the sequences allows the expression of the microbial aspartic protease under the control of said promoter and said terminator.
The invention also relates to an integration vector.
<Desc / Clms Page number 11>
containing the expression system as defined above, and capable of allowing expression of the microbial aspartic protease.
The principle of the invention also applies to an expression vector containing the expression system as defined above, and capable of allowing the expression of the microbial aspartic protease.
By "integration vector" is meant any DNA sequence which comprises a replicon and other regions of DNA (nucleotide sequences) and which is functional independently of the host as a complete gene expression unit. By "complete gene expression unit" is meant the structural gene and the region (s) of the promoter and the regulatory region (s) necessary for transcription and translation. By "structural gene" is meant the coding sequence which is used for transcription into RNA and allows the synthesis of the protein by the host.
Preferably, this integration vector is a plasmid. Good results have been obtained with the plasmid pFASPEP.
The invention also relates to a cell transformed (host cell) by the integration vector defined above.
This transformed cell is chosen so that the glucoamylase promoter sequence and the terminator sequence included in the expression system are recognized by this transformed cell, that is to say that they are compatible and functional for this. transformed cell, the glucoamylase promoter sequence and the terminator sequence included in the expression system fulfill their respective transcription signal functions, as a promoter and a terminator, respectively, for the transformed cell.
Usually the transformed cell is a filamentous fungus cell. Generally, the transformed cell is an Aspergillus cell. Preferably, the transformed cell is an Aspergillus oryzae cell, an Aspergillus saitoi cell or a cell belonging to the group of strains
<Desc / Clms Page number 12>
of Aspergillus niger. In a particularly preferred manner, the transformed cell is a cell belonging to the group of strains of Aspergillus niger, such as a cell of Aspergillus niger, of Aspergillus foetidus, of Aspergillus awamori, or is a cell of Aspergillus saitoi. Good results have been obtained with a transformed cell of Aspergillus niger.
Excellent results have been obtained with a transformed cell of Aspergillus foetidus, and more particularly with a transformed cell of the strain of Aspergillus foetidus SE4.
Strains of aspergillus niger and strains of Aspergillus foetidus, which can be used as transformed cell (host cell), are known, such as in particular the strain of Aspergillus niger NRRL 3 (AGRICULTURAL RESEARCH SERVICE CULTURE COLLECTION (NRRL), 1815 North University Street, Peoria, Illinois 61604, USA), Aspergillus niger ATCC 13496 (AMERICAN TYPE CULTURE COLLECTION, 12301 Parklawn drive, Rockville, Maryland 20852-1776, USA), Aspergillus niger ATCC 22343, the Aspergillus niger ATCC 46890 strain, the Aspergillus foetidus ATCC 10254 strain, the Aspergillus foetidus ATCC 14916 strain.
In a preferred variant of the invention, the cell transformed by the integration vector is derived from the strain from which the glucoamylase promoter sequence or the terminator sequence originates, a sequence included in the expression system. In a particularly preferred manner, the cell transformed by the integration vector derives from the strain from which the sequence of the secretion signal of the microbial aspartic protease originates, the sequence of the propeptide of the microbial aspartic protease sequence and the mature sequence of the protease microbial aspartic. Excellent results have been obtained with a transformed cell of Aspergillus foetidus SE4.
This cell transformed with an integration vector contains an expression system according to the invention, this expression system comprising the sequence of the Aspergillus foetidus SE4 glucoamylase promoter and the sequence of the Aspergillus foetidus glucoamylase terminator SE4. The best results
<Desc / Clms Page number 13>
were obtained with a cell transformed by the integration vector pFASPEP.
By "filamentous fungus" is meant eukaryotic microorganisms which include all filamentous forms of the Eumycota division. In this division are included the groups Zygomycetes, Ascomycetes, Basidiomycetes and imperfect fungi including Hyphomycetes. The following genera are included in this definition: Aspergillus, Trichoderma, Neurospora, Podospora, Endothia, Mucor, Cochiobolus, Pyricularia, Penicillium, Humicola.
The invention also relates to the purified and isolated strain of Aspergillus foetidus SE4tra. This transformed strain SE4tra is obtained from the strain SE4. It differs from this strain SE4 in that it contains one or more copies of the plasmid pFASPEP integrated into its genome.
The Aspergillus foetidus SE4 strain was obtained from the Aspergillus foetidus ATCC 14916 strain by mutagenesis and selected on the basis of improved glucoamylase production.
The invention also relates to the promoter of Aspergillus foetidus glucoamylase.
The invention also relates to a DNA molecule comprising the nucleotide sequence SEQ ID NO: 7 which codes for the promoter of the Aspergillus foetidus SE4 glucoamylase.
The invention also relates to the microbial aspartic protease derived from a strain of Aspergillus foetidus. Preferably, the microbial aspartic protease is an aspergillopepsin. In a particularly preferred manner, it derives from the strain of Aspergillus foetidus SE4.
The invention also relates to a DNA molecule comprising the nucleotide sequence which codes for a microbial aspartic protease derived from a strain of Aspergillus foetidus. Preferably, the microbial aspartic protease is an aspergillopepsin. In a particularly preferred manner, it derives from the strain of Aspergillus foetidus SE4.
The invention also relates to a DNA molecule comprising
<Desc / Clms Page number 14>
the nucleotide sequence which codes for aspergillopepsin derived from a strain of Aspergillus foetidus, and in particular from the strain of Aspergillus Foetidus SE4.
The invention also relates to a microbial aspartic protease produced by a cell transformed with the expression system of the present invention.
Preferably, the microbial aspartic protease is a fungal acid protease. In a particularly preferred manner, it is an aspergillopepsin.
Preferably, the microbial aspartic protease is derived from a strain of Aspergillus foetidus. In a particularly preferred manner, it derives from the strain of Aspergillus foetidus SE4.
The invention also relates to a process for the extracellular production of microbial aspartic protease, characterized in that it comprises the following steps: - transformation of a cell by an integration vector containing an expression system as defined above under conditions allowing the expression and the secretion of the microbial aspartic protease, - culture of the transformed cell in an adequate culture medium, and - recovery of the secreted microbial aspartic protease.
The fermentation medium obtained after culturing the transformed cell contains most of the microbial aspartic protease. Indeed, the microbial aspartic protease is substantially secreted into the culture medium by the transformed strain. The microbial aspartic protease obtained by the process of the invention is extracellular.
The microbial aspartic protease obtained by the process of the invention is glycosylated in the same way as the native enzyme. Its molecular weight is close to that of the microbial aspartic protease produced by the unprocessed microorganism.
Microbial aspartic proteases have many industrial applications, such as, for example, in the food, pharmaceutical and pharmaceutical industries.
<Desc / Clms Page number 15>
chemical industries. We exploit their ability to hydrolyze proteins under acidic conditions.
Microbial aspartic proteases can be used in the food industry when making certain cheeses and bread products.
Microbial aspartic proteases can be used as a drug to aid digestion.
They are used in particular to depilate and degrease the skin of certain animals to obtain superior quality leathers.
Microbial aspartic proteases can be used in the manufacture of protein hydrolysates. In this context, there may be mentioned the preparation of culture medium, the preparation of fish meal hydrolysas and soluble soy proteins.
In addition, as a mixture with glucoamylase, microbial aspartic proteases, such as in particular fungal acid proteases, are used during the production of ethanol from raw materials containing fermentable sugars (grains, agricultural residues), such as described in patent application WO 92/20777 from SOLVAY ENZYMES, Inc.
FIG. 1 represents the restriction map of the plasmid pUCASPEP.
FIG. 2 represents the restriction map of the plasmid pFGA1.
FIG. 3 represents the restriction map of the plasmid pFGA2.
FIG. 4 represents the restriction map of the plasmid pFGA2MUT.
FIG. 5 represents the restriction map of the plasmid pFASPEP.
FIG. 6 (FIG. 6a and FIG. 6b) represents the nucleotide sequence (SEQ ID NO: 7) coding for the promoter of the glucoamylase of Aspergillus foetidus SE4.
FIG. 7 represents the nucleotide sequence (SEQ ID NO: 8) coding for the terminator of Aspergillus glucoamylase
<Desc / Clms Page number 16>
fetus SE4.
The symbols and abbreviations used in these figures are explained in table 1.
TABLE 1
EMI16.1
<tb>
<tb> Symbol <SEP> Meaning
<tb> Abbreviation
<tb> AMPR <SEP> gene <SEP> bringing <SEP> the <SEP> resistance <SEP> to <SEP> ampicillin
<tb> ORI <SEP> origin <SEP> from <SEP> replication <SEP> in <SEP> E. <SEP> coli
<tb> ASPEPSIN <SEP> sequence Coding <SEP> <SEP> from <SEP> aspergillopepsin
<tb> of Aspergillus <SEP> fetus <SEP> SE4
<tb> 5'GA <SEP> promoter <SEP> from <SEP> the <SEP> glucoamylase <SEP> of Aspergillus
<tb> fetuses <SEP> SE4
<tb> 3'GA <SEP> terminator <SEP> from <SEP> the <SEP> glucoamylase <SEP> of Aspergillus
<tb> fetuses <SEP> SE4
<tb> GA <SEP> sequence Coding <SEP> <SEP> from <SEP> the <SEP> glucoamylase <SEP> of Aspergillus
<tb> fetuses <SEP> SE4
<tb>
The present invention is illustrated by the following examples.
Example 1 Isolation of the Aspergillopepsin Coding Sequence from Aspergillus foetidus SE4
A culture of the strain of Aspergillus foetidus ATCC 14916 is carried out on a liquid nutritive medium ACM ("Aspergillus Complete Medium") which contains 2% (weight / volume) of malt extract, 0.1 X (weight / volume) peptone (DIFCO) and 2% (w / v) glucose. After an incubation of 48 hours at 32 oC, the mycelium is harvested.
The mycelium of the Aspergillus foetidus ATCC 14916 strain is subjected to an ultraviolet mutagenesis treatment according to the technique described in PONTECORVO, G., ROPER, JA, HEMMONS, LM, MACDONALD, KD, and BUFTON, AWJ, Advances in Genetics 5 (1953), pages 141-238.
The treated strains are spread on a nutritive medium
<Desc / Clms Page number 17>
POTATO DEXTROSE AGAR agar (DIFCO) to which the starch has been added (5 X w / v). After a 48-hour incubation at 32 ° C, the colonies with the largest starch hydrolysis halo are removed and subcultured on the agar nutrient medium.
We isolate a strain producing a lot of glucoamylase. This strain named SE4 presents discolored brown conidia.
A culture of the strain of Aspergillus foetidus SE4 is carried out on the liquid nutrient medium ACM. After an incubation of 48 hours at 32 OC, the mycelium is harvested.
The genomic DNA of the Aspergillus foetidus SE4 strain is isolated according to the technique described in GARBER, R. C. and YODER, O. L., Anal. Biochem. 135 (1983), pages 416-422.
The following mixture is produced:
EMI17.1
<tb>
<tb> 820 <SEP> distilled <SEP> 62 <SEP> pi
<tb> Buffer <SEP> PCR <SEP> (10x) <SEP> 10 <SEP> pi
<tb> dNTPs <SEP> (2.5 <SEP> mM <SEP> each) <SEP> 8 <SEP> pi
<tb> Oligonucleotide <SEP> SEQ <SEP> ID <SEP> NO <SEP>: <SEP> 1 <SEP> (20 <SEP> pM) <SEP> 5 <SEP> pi
<tb> Oligonucleotide <SEP> SEQ <SEP> ID <SEP> NO <SEP>:
<SEP> 3 <SEP> (20 <SEP> pH) <SEP> 5 <SEP> pi
<tb> DNA <SEP> genomics <SEP> (dilutions <SEP> 10-1 <SEP> to <SEP> 10-4) <SEP> 10 <SEP> pi
<tb> Taq-polymerase <SEP> (5 <SEP> U / pl) <SEP> 0.2 <SEP> pi
<tb>
The PCR buffer, under the citation "(10) Reaction Buffer composition", the abbreviation dNTPs, which means all the nucleotides dATP, dTTP, dGTP and dCTP, and the product Taq-polymerase are described in the instructions for the kit sold under the name "GENEAMP DNA AMPLIFICATION REAGENT KIT with AMPLITAQ Recombinant Taq DNA Polymerase" (PERKIN ELMER CETUS).
The genomic DNA isolated from the Aspergillus foetidus SE4 strain is used in this mixture at a concentration of 1 μg / μl.
The coding sequence for Aspergillopepsin from Aspergillus foetidus SE4 was isolated using the "PCR" technique ("Polymerase Chain Reaction" technique described in SAIKI, RK, et al., SCIENCE, 239 (1988), pages 487-491).
The sequences of the synthetic oligonucleotides used in this study are as follows:
<Desc / Clms Page number 18>
EMI18.1
SEQ ID NO: 1 5'-TGATGATCAGGATCCGGCGGCCGCACCTCAGCAATGGTCGTCTTCAGCAAAACCGCTGCCCTC-3 '
BamHI NotI SEQ ID NO: 2 5'-CTGGGATTCGCCGCTCAGGCTTAGATTATCAAGCTTCATTCTAGAGACGACGACGAC-3 '
HindIII XbaI SEQ ID NO: 3 5'-GTCGTCGTCGTCTCTAGAATGAAGCTTGATAATCTAAGCCTGAGCGGCGAATCCCAG-3 '
The sequence SEQ ID NO: 3 is the complement of the sequence SEQ ID NO: 2.
The sequence of the oligonucleotide SEQ ID NO: 1 contains the information for the BamHI and NotI restriction sites, the information for the final part of the 5 'untranslated region of Aspergillus foetidus SE4 glucoamylase and the start of the sequence coding for aspergillopepsin.
The sequence of the oligonucleotide SEQ ID NO: 2 and, its complement, the oligonucleotide SEQ ID NO: 3 contain the nucleotides which correspond to the end of the coding sequence of aspergillopepsin and the additional information for the HindIII restriction sites and XbaI.
The technique used to construct the synthetic oligonucleotides is described in BEAUCAGE, S.L. et al (1981), Tetrahedron Letters, 22, pages 1859-1882 and using P-cyanoethyl phosphoramidites in a BIOSEARCH CYCLONE SYNTHESIZER apparatus.
EMI18.2
The conditions followed for the "PCR" are as follows: 2 minutes at 95 OC, then 40 cycles of a series comprising 1 minute at 95 OC, 1 minute at 50 GC and 2 minutes at 72 OC, then 10 minutes at 72 OC , then a temperature of 20 OC is maintained. All the other parameters used for this "PCR" correspond to those described in the instructions for the kit sold under the name "GENEAMP DNA AMPLIFICATION REAGENT KIT with AMPLITAQ Recombinant Taq DNA
<Desc / Clms Page number 19>
Polymerase "(PERKIN ELMER CETUS).
An approximately 1.35 kb DNA fragment (1 kb = 1000 base pairs) was isolated as described above. It was compared using the restriction analysis technique described in Molecular Cloning-a laboratory manual-MANIATIS et al., (Cold Spring Harbor Laboratory) 1982, pages 374-379] to the sequence of l aspergillopepsin A produced by the Aspergillus awamori strain UVK143f. This sequence of aspergillopepsin A was published by Berka RM et al., GENE, 86.1990, pages 153-162 and corrected by Berka RM et al., GENE, 96.1990, page 313. No essential difference is was found.
The DNA fragment thus obtained is digested with the restriction enzymes BamHI and XbaI, then is ligated, according to the ligation technique described in Molecular Cloning-a laboratory manual-SAMBROOK et al. - second edition, 1989, page 1.68-1. 69, with the plasmid pUC18 (CLONTECH laboratories, NO 6110-1), which was previously digested at the BamHI and XbaI sites. The vector pUCASPEP (FIG. 1) is thus obtained.
Example 2 Construction of the plasmid pFGA2MUT
Plasmid pFGA2MUT (FIG. 4) contains the Aspergillus foetidus SE4 glucoamylase gene in which a NotI cloning site has been created between the promoter and the coding part of the glucoamylase gene, and a HindIII cloning site between the part coding and terminator of the glucoamylase gene. These two cloning sites NotI and HindIII are created by mutagenesis, as described below.
The Aspergillus foetidus SE4 glucoamylase gene is isolated as described below.
The chromosomal DNA of the Aspergillus foetidus SE4 strain is isolated according to the technique of GARBER et al., As described in Example 1. This isolated chromosomal DNA is partially digested with the restriction enzyme SauIIIA and the fragments having a sizes from 8 to 10 kb are isolated and purified by a sucrose gradient (15 to 40 X) according to the technique described in AUSUBEL, FM et al. (1989), Current Protocols in Molecular Biology (John
<Desc / Clms Page number 20>
VILLEY and Sons), pages 5. 3. 2-5. 3.8. These isolated and purified fragments are introduced into the plasmid pBR322 (CLONTECH LABORATORIES catalog No. 6210-1), which has been previously digested with the restriction enzyme BamHI. The E. strain is then transformed. coli DH5a [described by HANAHAN, D., J. Mol. Biol.
(1983) 166, page 557, and sold by BETHESDA RESEARCH LABORATORIES (BRL), catalog B. R. L. Focus (1986) 8, page 9).
About 15,000 clones of E. transformed coli are screened using the hybridization technique (SAHBROOK et al., pages 9. 52-9. 55) using the following synthetic oligonucleotide (SEQ ID NO: 4): 5'-GATTCATGGTTGAGCAACGAAGCGA-3 ''
It is based on the nucleotide sequence published by BOEL et al., EMBO J. 3 (1984), pages 1097-1102.
A colony is isolated which hybridizes with this oligonucleotide.
The restriction sites are analyzed and it is found that this strain contains the complete glucoamylase gene, that is to say the promoter, the coding region as well as the secretion signal, and the terminator.
The 8.7 kp fragment was introduced, as described above, into the plasmid pBR322 at the BamHI site.
The vector pFGA1 (FIG. 2) is thus created, which contains an 8.7 kb Aspergillus DNA insert. This insert is the only difference between the plasmid pBR322 and the vector pFGA1.
A plasmid which is derived from the vector pFGA1 and which contains a smaller insert than that of the vector pFGA1 is constructed as follows. The vector pFGA1 is digested with the restriction enzyme EcoRI, then, from this, the EcoRI fragment with a size of approximately 5 kb containing the promoter, the coding region and the terminator of Aspergillus glucoamylase is isolated. fetidus SE4 following the method described by ZHU et al., 1985.
This EcoRI fragment is then inserted, following the technique described in SAMBROOK et al., Pages 1.68-1. 69, in the plasmid pUC18, which was previously digested with the restriction enzyme EcoRI. The vector pFGA2 is thus created (FIG. 3).
<Desc / Clms Page number 21>
The nucleotide sequences of the Aspergillus foetidus SE4 glucoamylase promoter and terminator were determined by the chain termination method using dideoxynucleotides, of SANGER et al. (1977) Proc. Natl. Acad. Sci. USA 74, p. 5463-5467.
Analysis of this sequence shows the presence of a promoter and a terminator. The nucleotide sequence (SEQ ID NO: 7) coding for the promoter of the Aspergillus foetidus SE4 glucoamylase is identified. The nucleotide sequence (SEQ ID NO: 8) coding for the terminator of Aspergillus foetidus SE4 glucoamylase is identified.
Nucleotides which have not been determined with certainty have been represented by the symbol N.
FIG. 6 represents the nucleotide sequence coding for the promoter of the glucoamylase of Aspergillus foetidus SE4.
Figure 7 shows the nucleotide sequence encoding the terminator of Aspergillus foetidus SE4 glucoamylase.
The synthetic oligonucleotides used to initiate the elongation reactions with T7 DNA polymerase were synthesized by the method of BEAUCAGE et al. (1981) Tetrahedron letters 22: 1859-1882. The sequencing was carried out according to the protocol given by the supplier of the sequencing kit (PHARHACIA), by denaturing the double-stranded DNA by treatment with NaOH.
The sequencing strategy is described by SAHBROOK, 1989, p 13.15 and 13.17. The polyacrylamide gels for sequencing were carried out according to the technique described by SAMBROOK, 1989, p 13.45-13. 58.
A plasmid is derived, as follows, which is derived from the plasmid pFGA2 and which contains the glucoamylase gene from Aspergillus foetidus SE4 in which the promoter and the terminator are separated from the coding part by NotI and HindIII restriction sites. Two restriction sites NotI and HindIII are thus created in the plasmid pFGA2, which contains the promoter and the terminator. The promoter and terminator of the
<Desc / Clms Page number 22>
Aspergillus foetidus SE4 glucoamylase are separated by NotI and HindIII restriction sites created by two mutagenesis directed according to the procedure described in the technical notice for the "MUTA-GENE PHAGEMID in vitro Mutagenesis Kit" mutagenesis kit (BIORAD).
The synthetic oligonucleotides used during this procedure are the following, respectively SEQ ID NO: 5 and SEQ ID NO: 6: 5'-GCCTGAGCTTCATCCCCAGCGCGGCCGCATCATTACACCTCAGCAATGT-3 '
NotI 5'-TGACTGACACCTGGCGGTGAAAGCTTCAATCAATCCATTTCGCTATAGTT-3 '
HindIII
The vector pFGA2MUT is thus obtained which contains the NotI restriction site at the start of the 5 ′ untranslated region of the glucoamylase gene and the HindIII cleavage site after the stop codon in the 3 ′ untranslated region of glucoamylase.
Example 3 Construction of the integration vector
The plasmid pUCASPEP as obtained in Example 1 is partially digested with the restriction enzyme HindIII, then completely with the restriction enzyme NotI. Thus, a 1.3 kb fragment containing the coding sequence of aspergillopepsin and the 5 ′ untranslated region of the Aspergillus foetidus SE4 glucoamylase gene, is isolated according to the technique described by ZHU, JD et al., BIOTECHNOLOGY, 3.1985, pages 1014-1016.
The partial and complete digestion of the plasmids with restriction enzymes is carried out according to the technique described by SAHBROOK et al. 1989, chapters 5.28-5. 32.
This fragment is introduced into the NotI-HindIII cloning site of the plasmid pFGA2MUT, obtained as described in Example 2. This plasmid contains the promoter and the terminator of the Aspergillus foetidus SE4 glucoamylase gene, separated by the cloning sites NotI and HindIII, created by mutagenesis
<Desc / Clms Page number 23>
directed, as described in Example 2. The coding part of glucoamylase is therefore replaced by the coding part of aspergillopepsin.
The vector pFASPEP (FIG. 5) is thus obtained. This vector pFASPEP contains the coding sequence of aspergillopepsin under the control of the transcription signals of the glucoamylase of Aspergillus fetus. This vector contains the expression system which comprises the following sequences: the sequence of the Aspergillus foetidus SE4 glucoamylase promoter,
EMI23.1
- the aspergillopepsin secretion signal sequence of Aspergillus foetidus SE4, - the aspergillopepsin propeptide sequence of Aspergillus foetidus SE4, - the mature aspergillopepsin sequence of Aspergillus foetidus SE4, and - the sequence of the Aspergillus foetidus SE4 glucoamylase terminator.
Example 4 Transformation of the Aspergillus foetidus SE4 strain
The vector pFASPEP, as obtained in Example 3, is then introduced into the strain of Aspergillus foetidus SE4 (the production of which is described in Example 1) by cotransformation as described in CARREZ et al., GENE, 94 (1990), pages 147-154.
The plasmid p3SR2, which contains the acetamidase gene from Aspergillus nidulans (amdS), is used as a selective marker.
The plasmid p3SR2 is described in Hynes, M. J., et al., Mol.
Cell. Biol., 3 (1983), pages 1430-1439. Transformation is carried out with this plasmid on protoplasts according to the technique described by KELLY, J. M. and HYNES, M. J., EMBO J. 4 (1985), pages 475-479.
During the transformation, the vector pFASPEP is used 10 times more than the plasmid p3SR2.
About 100 transformed strains are analyzed. These transformed strains are selected on the agar medium Y containing
<Desc / Clms Page number 24>
skim milk to detect the production of aspergillopepsin.
The colonies of the transformed strains which secrete aspergillopepsin into the culture medium are surrounded by a halo after 1 day of incubation at 34 oC.
The agar medium Y is formed from the CZAPEK DOX AGAR medium (DIFCO) to which 2 X (weight / weight) of skimmed milk (BACTO SKIK MILK from DIFCO), 0.3% (weight / weight) of PHYTAGEL product (SIGMA) are added. in 0.05 M citrate-phosphate buffer at pH 3.0.
About 30% of the transformed strains secrete aspergillopepsin, so they have integrated into their genome the selection vector p3SR2 and the integration vector pFASPEP.
Example 5 Isolation and purification of the transformed strains
The transformed strains thus obtained are isolated and subcultured on a POTATO DEXTROSE AGAR agar medium (DIFCO).
They are cultured at 32 OC until sporulation.
The transformed strains producing the most aspergillopepsin are isolated and subcultured on a POTATO agar medium.
EMI24.1
DEXTROSE AGAR (DIFCO). 40 transformed strains are cultured at 32 oC on this medium until sporulation.
The protoplasts transformed as described in example 4, can contain several nuclei per cell. The transformed strains can therefore be heterozygous. It is therefore necessary to purify these transformed strains from isolated spores containing a single nucleus per cell.
The spores are harvested, diluted in physiological water and then spread on the agar medium A containing skimmed milk, as described in Example 4, so that individual colonies are obtained. Colonies coming from a single spore and presenting a broad halo are subcultured again on the agar medium POTATO DEXTROSE AGAR. These colonies are cultured at 32 oC on this agar medium until sporulation.
The purified conidia of the transformed strains are harvested and stored. These transformed strains of Aspergillus foetidus, thus obtained, are called SE4tra.
<Desc / Clms Page number 25>
Example 6 Production of Aspergillopepsin by the transformed strain of Aspergillus foetidus SE4tra
The purified conidia, obtained in Example 5, are cultured in a rich liquid medium containing malt extract (DIFCO) (2 X by weight), peptone (DIFCO) (0.1 X by weight ), hydrolyzed starch (10% by weight) and calcium carbonate (2% by weight). The pH of the culture medium is adjusted to pH 6 by the addition of ammonia. The culture is carried out at 32 OC with stirring and is followed for 7 days.
Then, the culture obtained is centrifuged at 5,000 rpm for 15 minutes (BECKMAN JA-10). The enzymatic activity (aspergillopepsin) of the supernatant is measured after 4, 5.6 and 7 days of culture.
The enzymatic activity is measured according to a technique modified compared to the technique described by ICHISHIMA (Methods in Enzymology, vol. XIX, Proteolytic Enzymes, eds G.
PERLMANN and L. LORAND, 1970, pages 397-399). The solution containing the substrate is an aqueous solution comprising 2 X (weight / volume) of casein, the pH of this solution is adjusted to a pH of 2.7 by the addition of concentrated HCl. The following reagents are used: 0.4 M of TCA (trichloroacetic acid), 0.4 M of Na 2 CO 3 and the reagent of FOLIN-CIOCALTEAU (MERCK). Commercial reagents are diluted 1: 5 times with distilled water before use. A standard tyrosine solution is also prepared. The supernatant sample is diluted in 0.1 H acetate-HCl buffer (pH 2.7). This diluted sample is mixed with the substrate solution comprising casein in a proportion of 1: 1. This mixture is incubated at 30 ° C. for 10 minutes.
The reaction is stopped by adding a volume of 0.4 M TCA. This solution is centrifuged for 10 minutes at 12,500 rpm (BECKHAN JA-10 centrifuge). To 0.2 ml of the centrifugation supernatant, 1 ml of 0.4 M Na2CO3 and 0.2 ml of FOLIN-CIOCALTEAU reagent are added. This solution is incubated at 30 OC for 25 minutes. Then, the absorbance at 660 nm is measured.
<Desc / Clms Page number 26>
The enzymatic activity is expressed in umoles of tyrosine equivalents produced per minute during the hydrolysis of casein at a pH of 2.7 at 30 ° C, determined by the increase in absorbance measured at 660 nm.
The results of enzymatic activity obtained are compared with those of the non-transformed Aspergillus foetidus strain (strain SE4). The production of aspergillopepsin of the transformed strain (strain SE4tra) in comparison with that of the untransformed strain (strain SE4) is multiplied by a factor of about 40.
There is therefore a strong increase in the production of aspergillopepsin.
The production of aspergillopepsin is substantially extracellular.
Example 7 Estimation of the molecular weight of the aspergillopepsin produced by the transformed strain SE4tra
The aspergillopepsin produced by the transformed strain SE4tra is analyzed by the SDS-PAGE technique, according to the method described in Anal. Biochem. 78.1977, pages 459-482 and Biochemistry 12.1973, pages 871-890, using the PHAST SYSTEM (LKB-PHARMACIA).
To do this, precipitation is carried out on the supernatant as obtained in Example 6 using trichloroacetic acid (10 X v / v final). The precipitate obtained is taken up in a buffer composed of 10 mM TRIS / HCl (pH-8.0) (tris (hydroxymethyl) aminomethane acidified with HCl), 1 mM EDTA (ethylenediamine tetraacetic acid), 2.5 X (weight / volume ) SDS (sodium dodecyl sulfate), 5 X (volume / volume) ss-mercaptoethanol and 0.01% (weight / volume) of bromophenol blue.
4 μl of the precipitate taken up in the buffer are deposited on a polyacrylamide gel. The gel system used is the PHAST SYSTEM with gels containing a polyacrylamide gradient of 10-15 Z (v / v) in the presence of SDS. The electrophoresis conditions are those prescribed by the supplier. Coomassie blue gel coloring reveals a poly-
<Desc / Clms Page number 27>
peptide with a molecular weight of approximately 43 KDaltons.
By this analysis, it is noted that the size of the aspergillopepsin produced by the transformed strain corresponds to the size of the native aspergillopepsin produced by the untransformed strain.
Example 8 Activity Profile as a Function of pH for Aspergillopepsin Produced by the Transformed Strain SE4tra
The enzymatic activity of aspergillopepsin is measured at various pHs (from 1.5 to 3.5) at a temperature of 30 ° C. in 0.1 M acetate-HCl buffer in the presence of casein. The incubation lasts 10 minutes. The conditions applied are those described in Example 6.
The supernatant obtained in Example 6 is used. This supernatant is diluted 50 to 500 times in the 0.1 M acetate-cl buffer depending on the pH and the enzymatic activity of the supernatant.
The results are collated in Table 2.
During this test, the maximum enzymatic activity was measured for the sample placed at a pH of approximately 3.0 and at a temperature of 30 ° C. By definition, therefore, a relative activity of 100% was assigned to this sample.
This example shows that aspergillopepsin has an optimal enzymatic activity measured at a temperature of around 30 ° C. in a pH range between 2.5 and 3.5.
<Desc / Clms Page number 28>
TABLE 2
EMI28.1
<tb>
<tb> pH <SEP> Activity <SEP> relative
<tb> in <SEP> X
<tb> 1.5 <SEP> 1
<tb> 2.0 <SEP> 39
<tb> 2.5 <SEP> 80
<tb> 2.7 <SEP> 93
<tb> 3.0 <SEP> 100
<tb> 3.5 <SEP> 85
<tb>
The activity profile as a function of the pH of the aspergillopepsin produced by the transformed strain is similar to that of the aspergillopepsin produced by the untransformed strain, that is to say the native enzyme.
Example 9 Activity Profile as a Function of Temperature for Aspergillopepsin Produced by the Transformed Strain SE4tra
The enzymatic activity of aspergillopepsin is measured at different temperatures (from 40 to 65 ° C.) at a pH of 2.7 in 0.1 M acetate-HCl buffer in the presence of casein. The incubation lasts 10 minutes. The conditions applied are those described in Example 6.
The supernatant is used as obtained in Example 6.
This supernatant is diluted 50 to 1000 times in the 0.1 M acetate-HCl buffer depending on the pH and the enzymatic activity of the supernatant.
The results are collated in Table 3.
During this test, the maximum enzymatic activity was measured for the sample placed at a pH of about 2.7 and at a temperature of 55 gb. By definition, we therefore attributed to this sample a relative activity of 100 X.
This example shows that aspergillopepsin has an optimal enzymatic activity measured at a pH of about 2.7 in a temperature range between 50 and 60 OC.
<Desc / Clms Page number 29>
TABLE 3
EMI29.1
<tb>
<tb> temperature <SEP> Activity <SEP> relative
<tb> oc <SEP> X
<tb> 40 <SEP> 46
<tb> 45 <SEP> 66
<tb> 50 <SEP> 90
<tb> 55 <SEP> 100
<tb> 60 <SEP> 88
<tb> 65 <SEP> 39
<tb>
The temperature profile of the aspergillopepsin produced by the transformed strain is similar to that of the aspergillopepsin produced by the untransformed strain, that is to say the native enzyme.
Examples 7, 8 and 9 show that the aspergillopepsin obtained according to the invention is glycosylated in the same way as the native enzyme. Indeed, the characteristics of aspergillopepsin produced by the transformed strain are similar to those of aspergillopepsin produced by the untransformed strain.
<Desc / Clms Page number 30>
SEQUENCE LIST (1) GENERAL INFORMATION: (i) DEPOSITOR: (A) NAME: SOLVAY (Société Anonyme) (B) RUE: rue du Prince Albert, 33 (C) CITY: Brussels (E) COUNTRY: Belgium (F) POSTAL CODE: 1050 (G) TELEPHONE: (02) 509.61. (Ii) TITLE OF THE INVENTION: Expression system, integration vector and cell transformed by this integration vector (iii) NUMBER OF SEQUENCES: 8 (iv) FORM READABLE BY COMPUTER: (A) TYPE OF SUPPORT : Floppy disk (B) COMPUTER: IBM compatible PC (C) OPERATING SYSTEM: PC-DOS: MS-DOS (2) INFORMATION FOR SEQ ID NO: 1: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH : 63 base pairs (B) TYPE: nucleic acid (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (synthetic oligonucleotide) (xi) DESCRIPTION OF THE SEQUENCE:
SEQ ID NO: 1:
EMI30.1
<tb>
<tb> TGATGATCAG <SEP> GATCCGGCGG <SEP> CCGCACCTCA <SEP> GCAATGGTCG <SEP> TCTTCAGCAA <SEP> AACCGCTGCC <SEP> 60
<tb> CTC <SEP> 63
<tb>
<Desc / Clms Page number 31>
(2) INFORMATION FOR SEQ ID NO: 2: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 57 base pairs (B) TYPE: nucleic acid (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (synthetic oligonucleotide) (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2: CTGGGATTCG CCGCTCAGGC TTAGATTATC AAGCTTCATT CTAGAGACGA CGACGAC 57 (2) INFORMATION FOR SEQ ID NO: 3: (i) CHARACTERISTICS FROM THE SEQUENCE:
(A) LENGTH: 57 base pairs (B) TYPE: nucleic acid (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (synthetic oligonucleotide) (xi) DESCRIPTION OF THE SEQUENCE : SEQ ID NO: 3: GTCGTCGTCG TCTCTAGAAT GAAGCTTGAT AATCTAAGCC TGAGCGGCGA ATCCCAG 57 (2) INFORMATION FOR SEQ ID NO: 4: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 25 base pairs (B) TYPE: nucleic acid (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear
<Desc / Clms Page number 32>
(ii) TYPE OF MOLECULE: nucleic acid (synthetic oligonucleotide) (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4: GATTCATGGT TGAGCAACGA AGCGA 25 (2) INFORMATION FOR SEQ ID NO: 5: (i) CHARACTERISTICS OF THE SEQUENCE :
(A) LENGTH: 49 base pairs (B) TYPE: nucleic acid (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (synthetic oligonucleotide) (xi) DESCRIPTION OF THE SEQUENCE : SEQ ID NO: 5: GCCTGAGCTT CATCCCCAGC GCGGCCGCAT CATTACACCT CAGCAATGT 49 (2) INFORMATION FOR SEQ ID NO: 6: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 50 base pairs (B) TYPE: nucleic acid ( C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (synthetic oligonucleotide) (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6: TGACTGACAC CTGGCGGTGA AAGCTTCAAT CAATCCATTT CGCTATAGTT 50
<Desc / Clms Page number 33>
EMI33.1
(2) INFORMATION FOR SEQ ID NO: 7: (i) CHARACTERISTICS OF THE SEQUENCE:
(A) LENGTH: 2045 base pairs (B) TYPE: nucleic acid (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: genomic DNA (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO : 7:
EMI33.2
<tb>
<tb> GAATTCCCGA <SEP> CATCGGTCAT <SEP> TGGCCTCCTC <SEP> GCTGATCTCC <SEP> CTTTGGTACA <SEP> GTCGGCTACC <SEP> 60
<tb> AATGCTCTCG <SEP> AGGATTGCCT <SEP> GAACATTGAC <SEP> ATTCGGCGTC <SEP> CGGCCGGGAC <SEP> CACCGCGGAC <SEP> 120
<tb> TCGAAGCTGC <SEP> CTGTGCTGGT <SEP> CTGGATCTTT <SEP> GGCGGAGGCT <SEP> TTGAACTTGG <SEP> TTCAAAGGCG <SEP> 180
<tb> ATGTATGATG <SEP> GTACAACGAT <SEP> GGTATCATCG <SEP> TCGATAGACA <SEP> AGAACATGCC <SEP> TATCGTGTTT <SEP> 240
<tb> GTAGCAATGA <SEP> ATTATCGCGT <SEP> GGGAGGTTTC <SEP> GGGTTCTTGC <SEP> CCGGAAAGGA <SEP> GATCCTGGAG <SEP> 300
<tb> GACGGGTCCG <SEP> CGAACCTAGG <SEP> GCTCCTGGAC <SEP> CAACGCCTTG <SEP> CCCTGCAGTG <SEP> GGTTGCCGAC <SEP>
360
<tb> AACATCGAGG <SEP> CCTTTGGTGG <SEP> AGACCCGGAC <SEP> AAGGTGACGA <SEP> TTTGGGGAGA <SEP> ATCAGCAGGA <SEP> 420
<tb> GCCATTCGTT <SEP> TGACTAGATG <SEP> ACTTGTACGA <SEP> CGGAAACATC <SEP> ACTTACAAGG <SEP> ATAAGCCCTT <SEP> 480
<tb> GTTCCGGGGG <SEP> GCCATCATGG <SEP> ACTCCGGTAG <SEP> TGTTGTTCCC <SEP> GCAGACCCCG <SEP> TCGATGGGGT <SEP> 540
<tb> CAAGGGACAG <SEP> CAAGTATATG <SEP> ATGCGGTAGT <SEP> GGAATCTGCA <SEP> GGCTGTTCCT <SEP> CTTCTAACGA <SEP> 600
<tb> CACCCTAGCT <SEP> TGTCTGCGTG <SEP> AACTAGACTA <SEP> CACCGACTTC <SEP> CTCAATGCGG <SEP> CAAACTCCGT <SEP> 660
<tb> GCCAGGCATT <SEP> TTAAGCTACC <SEP> ATTCTGTGGC <SEP> GTTATCATAT <SEP> GTGCCTCGAC <SEP> CGGACGGGAC <SEP> 720
<tb> GGCGTTGTCG <SEP> GCATCACCGG <SEP> ACGTTTTGGG <SEP> CAAAGCAGGG <SEP> AAATATGCTC <SEP> GGGTCCCGTT <SEP> 780
<tb>
<Desc / Clms Page number 34>
EMI34.1
<tb>
<tb> CATCGTGGGC <SEP> GACCAAGAGG <SEP> ATGAGGGGAC
<SEP> CTTATTCGCC <SEP> TTGTTTCAGT <SEP> CCAACATTAC <SEP> 840
<tb> GACGATCGAC <SEP> GAGGTGGTCG <SEP> ACTACCTGGC <SEP> CTCATACTTC <SEP> TTCTATGACG <SEP> CTAGCCGAGA <SEP> 900
<tb> GCAGCTTGAA <SEP> GAACTAGTGG <SEP> CCCTGTACCC <SEP> AGACACCACC <SEP> ACGTACGGGT <SEP> CTCCGTTCAG <SEP> 960
<tb> ACAGCGCGGC <SEP> CAACAACTGG <SEP> TATCCGCAAT <SEP> TTAAGCGATT <SEP> GGCCGCCATT <SEP> CTCGGCGACT <SEP> 1020
<tb> TGGTCTTCAC <SEP> CATTACCGGC <SEP> GGGCATTCCT <SEP> CTCGTATGCA <SEP> GAGGAAATCT <SEP> CCCCTGATCT <SEP> 1080
<tb> TCCGAACTGG <SEP> TCGTACCTGG <SEP> CGACCTATGA <SEP> CTATGGCACC <SEP> CCAGTTCTGG <SEP> GGACCTTCCA <SEP> 1140
<tb> CGGAAGTGAC <SEP> CTGCTGCAGG <SEP> TGTTCTATGG <SEP> GATCAAGCCA <SEP> AACTATGCAG <SEP> CTAGTTCTAG <SEP> 1200
<tb> CCACACGTAC <SEP> TATCTGAGCT <SEP> TTGTGTATAC <SEP> GCTGGATCCG <SEP> AACTCCAACC <SEP> GGGGGGAGTA <SEP> 1260
<tb> CATTGAGTGG <SEP> CCGCAGTGGA <SEP> AGGAATCGCG
<SEP> GCAGTTGATG <SEP> AATTTCGGAG <SEP> CGAACGACGC <SEP> 1320
<tb> CAGTCTCCTT <SEP> ACGGATGATT <SEP> TCCGCAACGG <SEP> GACATATGAG <SEP> TTCATCCTGC <SEP> AGAATACCGC <SEP> 1380
<tb> GGCGTTCCAC <SEP> ATCTGATGCC <SEP> ATTGGCGGAG <SEP> GGGTCCGGAC <SEP> GGTCAGGAAC <SEP> TTAGCCTTAT <SEP> 1440
<tb> GAGATGAATG <SEP> ATGGACGTGT <SEP> CTGGCCTCGG <SEP> AAAAGGATAT <SEP> ATGGGATCAT <SEP> GATAGTACTA <SEP> 1500
<tb> GCCATATTAA <SEP> TGAAGGGCAT <SEP> ATACCACGCG <SEP> TTGGACCTGC <SEP> GTTATAGCTT <SEP> CCCGTTAGTT <SEP> 1560
<tb> ATAGTACCAT <SEP> CGTTATACCA <SEP> GCCAATCAAG <SEP> TCACCACGCA <SEP> CGACCGGGGA <SEP> CGGCGAATCC <SEP> 1620
<tb> CCGGGAATTG <SEP> AAAGAAATTG <SEP> CATCCCAGGC <SEP> CAGTGAGGCA <SEP> GCGATTGGCC <SEP> ACCTCTCCAA <SEP> 1680
<tb> GGCACAGGGC <SEP> CATTCTGCAG <SEP> CGCTGGTGGA <SEP> TTCATCGCAA <SEP> TTTCCCCCGG <SEP> CCCGGCCCGA <SEP> 1740
<tb> CACCGCTATA <SEP> GGCTGGTTCT <SEP>
CCCACACCAT <SEP> CGGAGATTCG <SEP> TCGCCTAATG <SEP> TCTCGTCCGT <SEP> 1800
<tb> TCACAAGCTG <SEP> AAGAGCTTGA <SEP> AGTGGCGAGA <SEP> TGTCTCTGCA <SEP> GGAATTCAAG <SEP> CTAGATGCTA <SEP> 1860
<tb>
<Desc / Clms Page number 35>
EMI35.1
<tb>
<tb> AGCGATATTG <SEP> CATGGCAATA <SEP> TGTGTTGATG <SEP> CATGTGCTTC <SEP> TTCCTTCAGC <SEP> TTCCCCTCGT <SEP> 1920
<tb> GCAGATGAGG <SEP> TTTGGCTATA <SEP> AATTGAAGTG <SEP> GTTGGTCGGG <SEP> GTTCCGTGAG <SEP> GGGCTGAAGT <SEP> 1980
<tb> GCTTCCTCCC <SEP> TTTTAGACGC <SEP> AACTGAGAGC <SEP> CTGAGCTTCA <SEP> TCCCCAGCAT <SEP> CATTACACCT <SEP> 2040
<tb> CAGCA <SEP> 2045
<tb>
(2) INFORMATION FOR SEQ ID NO: 8: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 836 base pairs (B) TYPE: nucleic acid (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: genomic DNA (xi) DESCRIPTION OF THE SEQUENCE:
SEQ ID NO: 8:
EMI35.2
<tb>
<tb> CAATCAATCC <SEP> ATTTCGCTAT <SEP> AGTTAAAGGA <SEP> TGGGGATGAG <SEP> GGCAATTGGT <SEP> TATATGATCA <SEP> 60
<tb> TGTATGTAGT <SEP> GGGTGTGCAT <SEP> AATAGTAGTG <SEP> AAATGGAAGC <SEP> CAGTCATGTG <SEP> ATTGTAATCG <SEP> 120
<tb> ACCGACGGAA <SEP> TTGAGGATAT <SEP> CCGGAAATAC <SEP> AGACACCGTG <SEP> AAAGCCATGG <SEP> TCTTTCCTTC <SEP> 180
<tb> GTGTAGAAGA <SEP> CCAGACAGAC <SEP> AGTCCCTGAT <SEP> TTACCCTTGC <SEP> ACAAAGCACT <SEP> AGAAAATTAG <SEP> 240
<tb> CATTCCATCC <SEP> TTCTCTGCTT <SEP> GCTCTGCTGA <SEP> TATCACTGTC <SEP> ATTCAATGCA <SEP> TAGCCATGAG <SEP> 300
<tb> CTCATCTTAG <SEP> ATCCAAGCAC <SEP> GTAAATTCCA <SEP> TAGCCGAGGT <SEP> CCACAGTGGA <SEP> GCAGCAACAT <SEP> 360
<tb> TCCCCATCAT <SEP> TGCTTTTCCC <SEP> CCAGGGGNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> 420
<tb> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP>
NNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> 480
<tb> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> 540
<tb>
<Desc / Clms Page number 36>
EMI36.1
<tb>
<tb> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> 600
<tb> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> 660
<tb> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> 720
<tb> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> 780
<tb> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNNNNN <SEP> NNNNNNNGAA <SEP> GAATTC <SEP> 836
<tb>