CA1203763A - Hydrid protein coded by a dna fragment - Google Patents

Hydrid protein coded by a dna fragment

Info

Publication number
CA1203763A
CA1203763A CA000445905A CA445905A CA1203763A CA 1203763 A CA1203763 A CA 1203763A CA 000445905 A CA000445905 A CA 000445905A CA 445905 A CA445905 A CA 445905A CA 1203763 A CA1203763 A CA 1203763A
Authority
CA
Canada
Prior art keywords
dna
gene
sequence
fragments
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
CA000445905A
Other languages
French (fr)
Inventor
Patrick Charnay
Pierre Tiollais
Francis Galibert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institut National de la Sante et de la Recherche Medicale INSERM
Original Assignee
Institut National de la Sante et de la Recherche Medicale INSERM
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR7921811A external-priority patent/FR2464269B1/en
Priority claimed from FR8009039A external-priority patent/FR2480779B2/en
Application filed by Institut National de la Sante et de la Recherche Medicale INSERM filed Critical Institut National de la Sante et de la Recherche Medicale INSERM
Priority to CA000445905A priority Critical patent/CA1203763A/en
Application granted granted Critical
Publication of CA1203763A publication Critical patent/CA1203763A/en
Expired legal-status Critical Current

Links

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

L'invention se rapporte à une protéine hybride susceptible d'être codée par le fragment ADN inséré dans le vecteur.The invention relates to a hybrid protein capable of being encoded by the DNA fragment inserted into the vector.

Description

r)376~
i "SEQUENCE NUCLEOTIDIQUE CODANT L'ANTIGENE DE SURFACE DU
VIRUS DE L'HEPATITE B, VECTEUR CONTENANT LADITE SEQUENCE
NUCLEOTITIQUE, PROCEDE PERMETTANT SON OBTENTION ET ANTIGENE
OBTENU "

L'invention est relative à un acide nucléique comprenant une séquence nucléotidique capable de coder une séquence peptidique immunogène correspondant à l'antigène de surface du virus de l'hépatite virale B, et aux poly-5 peptides et peptides obtenus.
Elle concerne également un procédé permettant d'obtenir un tel acide nucléique.
L'hépatite B est une maladie virale fréquente tout particulierement en Afrique Tropicale, en Asie du 10 Sud-Est et en Extrême-Orient.
L'agent étiologique est un virus (HBV) ou par-ticule de Dane, comprenant une enveloppe (antigène Australia ou antigène HBs), une capside (antigène HBc), une polymérase endogène et une molécule d'ADN circulaire 15 partiellement simple brin : le brin le plus long de cette molécule d'ADN comporte près de 3 200 nucléotides (SUMMERS
J., O'CONNELL A. et MILLMAN I. (1975~ Proc. Nat. Acad.
Sci. USA 7~, 4 597-4 601).
L'ADN polymérase endogène peut etre utilisée 20 pour réparer in vitro le brin le plus court (T. A. LANDERS, H. B. GREENBERT et J. S~ ROBINSON, J. VIROL., 23, 1977, p. 368-376).
L'anaiyse électrophorétique des protéines de l'enveloppe a montré la présence de 2 à 7 polypeptides 25 dont les principaux sont appelés : polyp~ptide I et poly-peptide II (PETERSON D. L.~ ROBERTS I. M. et VYAS G. N.
(1977) Pr~.Nat~ Acad. Sci., USA, 74, 1 530~1 534, et PETERSON D. L., CHIEN D. Y., VYAS G. N., NITECKI D. et BOND H. (1978) In Viral Hepatitis, ed. G. VYAS, S. COHEN
30 et R. SCHMID, The Franklin Institute Press, Philadelphie, 56g-573).

~.~

~21a 3~63 Le polypeptide I a un poids moléculaire de 22 000 à 26 000 daltons. Le polypeptide II est glycosilé et a un poids moléculaire de 28 000 à 30 000 daltons. La composi-tion en acides aminés de ces deux polypeptides est très S semblable, Les séquences que forment, respectivement, leurs 15 prerniers amino-acides (à partir de l'ex-trémité N-terminale) et leurs 3 derniers amino-acides sont identiques, de sorte que l'hypothèse a été ~or-mulée que le polypeptide II pourrait ne différer du polypeptide I que par une glycosilation.
L'étude du virus est extremement dif-ficile dans la mesure où l'on ne dispose d'aucun système de culture cellulaire permettant la propagation du virus.
Cette difficulté a déjà en partie été contournée, plus particulièrement en ce qui concerne le sérotype ayw.
~ 'ADN entier (~énome) du virus a été identifié et cloné, nota~ment dans E. coli, après son insertion préala-ble d~ns le site unique EcoRI d'un vecteur ~gt.WES. ~B,selon la technique par FRITSCH A., POURCEL C., CHARNAY P. et TIOLLAIS P. (1978) C. R. Acad. de Paris, 287, 1 4S3-1 456).
A ce ~our,la séquence des polypeptides I
et II eux-mêmes, la localisation dans l'ADN viral de la séquence codant ces peptides n'ont pas été réalisées.
L'invention a pour but l'obtention d'une séquen-25 ce d'ADN beaucoup plus petite que l'ADN viral lui-même, contenant la séquence apte à coder la séquence peptidique douée de propriétés immunogènes permettant, lorsqu'elle est introduite dans l'organisme d'un hôte vivant, d'in-duire la fabrication par ce dernier d'anticorps suscepti-30 bles de protéger ultérieurernent ce meme hote à l'égard du virus de l'hépatite virale B, notamment lorsque celui-ci se trouve à l'état virulent.
L'invention découle non seulement de l'analyse nucléotidique complète du génome de la particule de Dane ~L~d~ a 6~

à laquelle ont procédé les inventeurs, mais à l'idée qu'ils ont eue pour identifier le gène codant (ci-après dénommé
"gène S") des susdits polypeptides, de rechercher dans la structure nucléotidique complète ainsi préétablie du gé-nome de la particule de Dane, celles des séquences de nu-cléotides susceptibles de coder les séquences peptidiques proximales et terminales connues de ces polypeptides.
On rappellera que PETERSON et collaborateurs ont rapporté, notamment dans les articles dont les réfé-rences ont été rappelées plus ~aut, que la séquence proxi-male (premier amino-acide N-terminal) des 15 premiers amino-acides s'analysait en principe comme suit :
met glu asn ile thr ser gly phe leu gly pro leu leu val ser et que la séquence terminale de ces mêmes polypeptides (dernier amino-acide C-terminal) était la suivante :
val tyr ile La figure 1 est une carte schématique du génome de la particule de Dane~ Celui-ci comporte deux ~rins b1 et b2 ; le plus court d'entre eux (~2) étant normalement dépourvu de la partie représentée par une ligne entrait interrompu dans le dessinO
Il est connu que cet ADN ne comporte qu'un seul site EcoRI.
La flèche f1 donne le sens de la numérotation des nucléo~ides dont est composé le brin le plus long b1, et la flèche f2 donne le sens de la transcription de l'ADN
du virus, notamment par la machinerie cellulaire des cel-lules envahies par le virus de l'hépatite B, pour ce qui . concerne l'expression du gène S.
Le site EcoRI peut donc être numéroté 0 ou, comme on l'a maintenant déterminé de ~açon plus exacte pour celui des virus de l'hépatite B appartenant au séro-type ayw, 3 182.
Le cercle en t.rait plein intérieur e donne l'é-chelle en % de longueur de l'ADN et permet de préciser les 12~3763 positions de certaines de ses parties.
Les nombres 3', 5' et 5', 3' à la partie iné-rieure de la carte visent les extrémités terminales por-teuses de memes nombres dans les représentations conven-tionnelles des extrémités des chaines d'acide nucléique.
Selon l'invention, il a été montré que le "gène S" constituait essentiellement le fra~ment du brin le plus long b1 situé entre les positions 73,6 et 95,1 de la carte schématique de la figure 1. Les abréviations "Start" et "Stop" représentent les points d'initiation et d'arret de la transcription du "gène S".
La ~igure 2 est représentative de la partie terminale du susdit génome, comprise notamment entre les positions 60,4 et 100 ~en % de longueur de l'ADN). Chacune des lettres figurant dans la figure 2 correspond de façon conventionnelle à l'un des 4 nucléotides de base de l'ADN :
A : Adénine G : Guanine T : Thymine C : Cytosine Les lignes inférieures, clans chaque paire de li-gnes dont est constituée la figure 2, correspondent à
l'acide nucléique correspondant à la chalne nucléotidique b~.
La technique d'analyse utilisée pour établir la carte plus détaillée dont témoigne la figure 2, sera briè-vement rappelée ci-après.
La caractérisation de la séquence nucléotidique du "gène S" telle qu'elle est proposée dans le cadre de la présente invention, et dont les extrémités proximale p "S" et terminale t "S" sont indiquées dans la figure 2, résulte de la constatation que :
- les 14 premierstriplets (dans le sens de la lecture f2) à partir du nucléotide numéroté 3 030 vis-à-vis de l'extrémité terminale EcoRI , sont respectivement 3~3 c~pables de coder les 14 preniersr~no-acides de la séquence proxi-male des 15 prenuers amino~cides des susdits poIypeptides, - les 4 derniers triplets GTA TAC ATT TAA lus sur la chaine complémentaire b2 à la chaine transcrite bl correspondent respectivement aux 3 amino-acides terminaux des susdits polypeptides et à un codon d'arrêt :
- cette séquence de nucléotides (678 nucléotides) ne comprend aucun codon d'arrêt, du moins lorsque l'on adopte le cadre de lecture impliquant que le premier tri-plet "lu" sur l'ADN par la machinerie cellulaire soit AUG,(correspondant sur le brin complémentaire à ATG) , - la traduction complète de l'information géné-tique commençant avec le codon initial ATG conduit à un polypeptide théorique de 226 amino-acides, ayant un poids moléculaire de 25 422 daltons.
La structure nucléotidique du "gène S" ainsi que la cha1ne polypeptidique résultant de la traduction du "gène S" sont représentées à la figure 3.
Ces valeurs sont t~ut à fait conformes aux don-nées analytiques qui résultent de la mobilité électropho-rétique du polypeptide I sur des gels de polyacrylamide qui ont déjà été décrits par les auteurs précedents (ré-férences 9-12 selon la bibliographie figurant à la fin de la description de la présente demande de brevet).
La différence observée au niveau du 15ème amino-acide de la séquence pepti~ique proximale du polypeptide I :
leucine selon les cartes des figures 2 et 3 mentionnees ci-dessus, et non sérine selon les constatations des sus-dits auteurs, peut peut-être etre attribuée au fait que ces auteurs ont travaillé avec un variant génétique diffé-rent de celui ayant fait l'objet de la présente étude. On notera que la différence peut d'ailleurs etre rapportée à
la substitution d'un seul nucléotide dans le triplet con-cerné "rrTA" dans le "gène S" particulier représenté dans les cartes des figures 2 et 3, au lieu de "TCA", l'un des ~ ~3 triplets susceptibles d'etre traduits en sérine.
L'invention concerne donc plu5 particulièrement les fragments d'acide nucléique qui peuvent être excisés de 1'ADN de la particule de Dane, ces fragments étant plus particulièremenk caractérisés en ce qu'ils contiennent la partie du "gène S~ susceptible de coder la partie de la protéine de l'enveloppe du virus qui est responsable des propriétés immunologiques du virus de l'hépatite B.
A ce titre, l'invention concerne donc un acide nucléique comportant au plus de l'ordre de 1 000-1 100 nu-cléotides, plus particulièrement caractérisé en ce qu'il est apte à coder une séquence peptidique immunogène, elle-meme apte à induire in vivo la production d'anticorps ac-tifs à l'égard du virus de l'hépatite B, cette séquence peptidique contenant essentiellement la structure repré-sentée à la figure 3, ou toute séquence peptidique ayant des propriétés immunogènes équivalentes.
L'invention concerne également un vecteur en vue de l'expression de ladite séquence nucléotidique dans un micro-organisme ou dans des cellules eucaryotes à con-dition que la fusion génétique ait été effectuée en con-servant la phase de lecture du "gène S'~.
Les séquences nucléotidiques utilisées confor-mes à l'invention présentent l'une par rapport à l'autre une variabilité conduisant, lors de leur expression, à la formation de déterminants variant selon le sous-type du virus de l'hépatite B (sous-types d, w, y, r du groupe a).
Pour l'une des séquences peptidiques représen-tées à la figure 3, on observera que le premier acide ami-né de la séquence susdite O méthionine, est N-terminal et que l'amino-acide de l'extrémite opposée : isoleucine, est C-terminal~
L'invention concerne encore, plus particulière-ment, la séquence nucléotidique représentée à la figure 4 codant la séquence peptidique telle qu'elle résulte de la ~%~3~6;~

figure 5 ou toute séquence peptidique analogue douée de propriétés immunogènes équivalentes.
Il va de soi que par "séquence peptidique équi-valente", mentionnée ci-dessus, il faut entendre toute sé-quence peptidique dans laquelle certaines parties peuventn'être pas rigoureusement identiques aux parties corres-pondantes~de la séquence peptidique représentée dans les figures 3 et 5, ces variations pouvant être dues à des mu-tations locales n'affectant pas le caractère immunogène général de la protéine ou à des modifications de structure tenant aux différents sérotypes sous lesquels les protéi-nes du genre en question sont susceptibles de se présenter (notamment sérotypes adw, adr et a~r).
L'invention concerne plus particulièrement la séquence nucléotidique contenant la séquence peptidique telle qu'elle est représentée à la figure 6 ou toute sé-quence peptidique analogue douée de propriétés immunogènes équivalentes.
L'invention concerne plus particulièrement encore les séquences peptidiques suivantes :
Alanine ~lutamine ~lycine-Thréonine-S~kinP
Thréonine-Alanine~Glutamine-Glycine-Thréonine-Se'rine Thréonine-Thréonine-Alanine-Glutamine-Glycine-Thréonine-Sérine Dans le premier peptide sus-indiqué l'extrémité
alanine est N-terminale et l'extremité sérine est C-tenminale.
Dans le deuxième et troisième peptides sus-indi~ués, l'extrémité thréonine est N-terminale et l'extré-mité sérine est C-terminale.
A titre d'exemple, on peut notamment préparer le pentapeptide en partant de la sérine C-terminale à laquelle on accroche la thréonine par la méthode de Castro décrite dans T~trahédron Letters, 1975, n14, page 1219-1222. Ensuite les aci-des aminés glycine, glutamine, alanine sont rajoutés par la méthode dite de l'anhydride mixte répetée (methode rema) décrite par Beierman dans Chemistry and ~iology oE Peptides, E~. J. ~eienhofer, Ann. Arbour 37~3 Science Publ., Ann. Arb. Mich. 351 (1972).
L'invention concerne egalement les produits résul-tant de la fixation du pentapeptide sur une molécule porteu-se plus grosse, notamment de type polypeptide ou protéine, les compositions contenant ce pentapeptide en produits de fixation, no-tamr~nt en association avec un véhicule pharmaceutiquement acceptable, et plus particulièrement des vaccins contre l'hépatite B. Ces vëhicules pharmaceutiques sont appropries, de façon en soi classique, au mcde d'ad-ministration choisi, noL~ nt par voie orale, parentérale, rectale ou par nébulisation sur des muqueuses, notamment nasales.
L'hexapeptide et le polypeptide a 7 acides aminés peuvent être synthétisés par des techniques de synthèse peptidique classiques.
Ces peptides sont, selon la présente invention, tenus pour être le site anti~énique des polypeptides de plus grande taille dont question plus haut et responsables du pouvoir vaccinant de l'enveloppe virale (Journal of Biol. Stand. 1976, 4, 295-304, RAO et VYAS "Biochemical Characterization of Hepatitis B Surface Anti~en in Relation to Serologic Activity").
L'invention concerne égaleme~t encore les frag-ments d'ADN susceptibles de coder :La production de tels pentapeptide, hexapeptide et polypeptide à 7 acides aminés.
Il s'agit :
- pour le pentapeptide, notamment du polynucléo-tide de formule:
5 ' GCT CAA GGA ACC TCT 3 ' 3' GGA GTT CCT TGG AGA 5' - pour l'hexapeptide, n~tamment du polynucléoti-de de formule :
5' ACT GCT CAA GGA ACC TCT 3' 3' TGA CGA GTT CCT TGG AGA 5' - pour le polypeptide à 7 acides aminés du poly-nucléotide de formule :
5' ACT ACT GCT CAA GGA ACC TCT 3' 76~

3' TGA TGA CGA GTT CCT TGG AGA 5' ou dans chacun des trois cas, du polynucléotide complémen-taire relatif aux trois polynucléotides respectifs précé-dents ou encore tout polynucléotide dans lequel chacun des triplets peut etre remplacé par tout triplet analogue capable de coder la production du même amino-acide.
T, I acide nucléique selon l'invention peut encore etre caractérisé en ce qu'il comporte au moins l'un des deux brins mutuellement complémentaire d'une séquence d'ADN telle que représentée dans la figure 4 tdans laquel-le figurent également les nombres correspondant aux posi-tions des premiers nucléotides de chacun des fragments suc-cessifs de 10 nucléotides représentés vis-à-vis de la po-sition Eco~I non représentée dans la figure : il va de soi que ces nombres n'interviennent pas au niveau de la - CaraCtériSatiQn de la séquence nucléotidique du genre en question). Ce fragment d'ADN est délimité par deux sites HincII.
On appréciera que cette séquence nucléotidique correspond à l'information génétique dont la traduction conduit à la séquence peptidique représentée à la figure 5.
L'invention concerne naturellement les séquences nucléotidiques équivalentes à simple brin ou à double brin, dont notamment le brin ayant la structure qui découle de ~5 la succession des lignes inférieures de la figure 4, l'ADN
à double brin correspondant, ou les ARN messagers corres-pondants, notamment celui représenté par les enchainements complémentaires de nucléotides constitués par les lignes inférieures des paires de lignes de la figure 4 (sens de la flèche f2).
De même entrent dans le champ de l'invention les chaines nucléotid.iques qui se différencient des précéden-tes par certains triplets O~l petites séquences de triplets, dans la mesure où ces séquences nucléotidiques restent aptes à coder un polypeptide conservant les activités ~Z03~6;~

immunogènes caractéristiques des virus de l'hépatite vi-rale B. D'une facon générale, il s'agit de chaines de nu-cléotides qui, le cas échéant, après dénaturation de l'ADN
à double brin pour produire les acides nucléiques à simple brin correspondants, restent suceptibles de s'hybrider sur au moins environ 90 X de leur longueur avec l'un des brins de l'ADN de la figure 4.
Des acides nucléiques préférés selon l'invention sont encore ceux qui peuvent être excisés à partir de l'ADN de l'hepatite virale et ~ui, lorsqu'ils sont à dou-ble brin, sont caractérisés par l'existence à l'un de leurs bouts d'une extrémité HincII, HhaI, AvaI ou EcoRI
et à leur autre bout par une extrémité AvaIII, HincII ou HhaI.
Les positions de ces diverses extrémités vis-à-vis du site EcoRT sont schématisées dans la ~igure 2.
L'acide nucléique selon l'invention est destiné
à l'incorporation dans un vecteur permettant son expres-sion dans une bactérie et dans les cellules eucaryotes, notamment en vue de la production d'une protéine ou d'un peptide susceptible d'induire dans l'organisme d'un hôte vivant la production d'anticorps actifs contre le virus de l'hépatite virale B. La protéine ou le peptide résul-tant de la traduction de la séquence nucléotidique selon '-l~invention peuvent être utilisés comme agent vaccinant ou comme agent servant pour le diagnostic.
L~acide nucléique selon l'invention peut égale-ment etre utilise comme sonde pour dépister la présence ou non dans des échantillons de sang ou de sérum d'épreuve, de particule de Dane, d'antigène HBs ou de fragments de celui-ci, etc. (par technique classique d`hybridation ADN-ADN).
D'autres caractéristiques de l'invention résul-teront encore de la description brève qui suit des techni-ques d'analyse, d'identiEication et d'obtention de fragments d'ADN conformes à 1'invention. Référence seranaturellement faite aux dessins dont les figures ont dé~à
été prises en considération dans ce qui précède. Les chif-fres ou nombres entre parenthèses correspondent aux réfé-rences de la bibliographie annexée à la pr~sente descrip-tion.
` L'invention concerne aussi des vecteurs particu-liers permettant l'expression des séquences nucléotidiques décrites ci-dessus, notamment sous la forme d'une protéine hybride dans laquelle ùn Eragment protéique présentant les caractères immunologiques de HBsA~ jouxte une molécule porteuse conférant à l'ensemble des propriétés immunogènes ou immunoréactives, susceptibles d'induire la production d'anticorps protecteurs à l'égard de l'infection virale dans l'organisme de l'hote dans lequel cette protéine a au préalable été introduite.
En particulier, l~invention concerne un vecteur -phage ou plasmide - contenant au moins une partie de l'o-péron lactose, plus particulièrement le promoteur et le gène Z de cet opéron, ce vecteur étant caractérisé en ce qu'il est modifié pour l'insertion, en phase, dans un site approprié du gène Z, tel que le site ~coRI de l'un quel-conque des fragments d'ADN du brevet principal, notamment ceux contenant la plus grande partie du "gène S". Elle con-cerne également ceux de ces vecteurs modifiés, dans les-quels une partie au moins du fra~ment d'ADN codant pour la plus grande partie de la ~-galactosidase serait rempla-; cée par un fragment d'ADN apte à coder pour toute autre molécule porteuse non immunogène, ou dont les éventuelles propriétés immunologiques, si celles-ci existent, n'inter-fèrent pas avec celles de la partie peptidique présentant les propriétés immunologiques de HBsAg, par exemple essen-tiellement celle qui s'etend dans la direction de la lec-ture à partir de son site HhaI~
L'invention est également plus particulièrement ~L2~3763 relative à une protéine hybride caractérisée en ce qu'elle contient une séquence polypeptidique présentant les proprié-tés immunologiques spécifiques-de HBsAg, jouxtant une se-quence polypeptidique constituée par la majeure partie de la ~-galactosidase, qui ~oue le rôle de protéine-porteuse.
L'invention ne s'étend pas seulement à cette mo-lécule hybride particulière, dont le rôle essentiel est de constituer un modèle d'une protéine construite selon les techniques du génie génétique et douee des propriétés immunogènes et immunoréactives caractéristiques de l'anti-gène HBsAg, mais également à toute autre protéine hybride dans laquelle tout ou partie de 1~ partie ~-galactosidase peut etre remplacée par toute autre molécule porteuse non in~unogène, ou dont les éventuelles propriétés immunologi-ques, si celles-ci existent, n'interfèrent pas avec celles de la partie peptidique présentant les propriétés immuno-logiques de HBsA~.
~ 'autres caractéristiques de l'invention appa-raitront encore au cours de la description d'exemples pré-férés, en combinaison avec les dessins dans lesquels :
- les igures la et lh illustrent schématique-ment les étapes successives de la fabrication d'un vecteur du type plasmide incorporant un fragment de HBV VNA, -les figures 2a à 2c illustrent schématiquement les structures initiales du vecteur utilisé (figure 2a) final du vecteur modifié obtenu (figure 2b) et celle de la protéine hybride résultant de l'expression de ce vec-teur modifié dans E. coli (figure 2c).
A ~ SE~UENCES NUCLEOTIDIOUES
Les produits et méthodes utilisés - Les enæymes et les produits chimiques utilisés ________ ____ _____________ ______________ _ Les enzymes de restriction utilisées : BamHI, HhaI, HincII, HaeIII, XbaI, MboI, HinfI, HpaII, XhoI, sont celles fabriquées par BIOLABS. On a utilisé l'ADN-polymé-rase I de BOEHRINGER. La phosphatase alcaline bactérienne 3~6~

et la polynucléotide-kinase ont été fournies par P. L. BIOCHEMICALS. Les agents chimiques étaient les sui-vants :
. Diméthyl sulfate (ALDRICH), . Hydrazine (EASTMAN KODAK), Acrylamide et bis-acrylamide (2 fois cristal-lisés - SERVA), . Dideoxy nucléotide triphosphates et deoxynucléotide triphosphates ~P. L.
~IOCHEMICALS), . Pipéridine IMERCK3 redistillée sous vide.
- Préparation d'ADN HBV
_ _ _ _ _ _ _ _ . _ _ _ _ _ _ _ _ _ _ _ _ Le génome HBV entier ~sous-type aYw) a été clo-né dans E. coli en mettant en jeu le site unique de res-triction ECoRI du vecteur ~gt.WES. ~B (14). L'ADN clonéest dénommé ci-après "Eco HBV DNA".
Le bactériophage recombinant a été amplifié en bolte de Pétri sur Agar et on a extrait l'ADN recherché
de façon en soi connue~ Après digestion de l'ADN par l'en-zyme de restriction EcoRI , on a purifié la séquence Eco H~V DNA par ultracentrifugation, dans un gradient de su-crose, selon la technique décrite clans les références bi-bliographiques (16, 17).
- Préparation de fragment:s d'ADN marqués 5,32p ____________________________________________ 10 à 20 picomoles d'Eco HBV DNA ont été complè-tement hydrolysés par les différentes enzymes de restric-tion, dans les conditions recommandées par le ~abricant.
Les fragments d'ADN ont été déphosphorylés par la phos-phatase alcaline, celle-ci ayant ensuite été inactivée par un traitement alcalin. L'ADN a alors été précipite à l'éthanol, selon la technique décrite dans l'article (18). Après redissolution dans un tampon à base de sper-midine, les ADN ont été marqués à leurs extrémités 5' avec un ATP {~32p} (3 000 Ci/mM fabriqué par NEW ENGLAND
NUCLEAR) et avec de la polynucléotide-Xinase (selon la ~v~ ~ ~

technique visée à l'article (19).
Les fragments d'ADN d~ restriction ont été sépa-rés par électrophorèse sur gel de polyacrylamide, puis élués. Les extrémités marquées ont fait l'objet de ségré-gatio~ par électrophorèse sur gel de polyacrylamide defaçon connue en soi, après restriction avec une autre en-zyme ou par dénaturation des fragments d'ADN du genre en question.
- Détermination de la structure des séquences ___________________________________________ de nucléotide de 1'ADN
_____________________ La structure primaire des fragments d'ADN â dou-ble brin ou simple brin a été déterminée essentiellement selon la technique décrite par MAXAM et GILBERT (19).
L'on a aussi eu.recours à la méthode des inhibiteurs ter-minaux de chalnes décrites par SANGER et al. (20) et adap-tée par MAAT et SMITH t21), pour ce qui est des fragments à double brin marqués à l'une de leurs extrémités 5'.
Les produits de réaction chimique et enzymati-que ont été analysés par électrophorèse dans des gels de séquence d'acrylamide à 8,16 ou 25 X, de 1 mm d'épaisseur.
L~s techniques et les résultats de l'analYse Afin de déterminer si le génome HBV est capa-ble de coder les polypeptides I et II, tous les fragments HaeIII (sites de restriction HaeIII du génome HBV repré-sentés sur la figure l par de petites 1èches) ont étémarqués à leurs extrémités 5'. Des parties substantielles de leurs structures primaires ont été déterminées par la méthode de MAXAM et GILBERT. Les séquences de nucléotides susceptibles de coder les séquences d'amino-acide proxi-males et terminales des polypeptides I et II ont été lo-calisées dans les fragments HaeIII E et HaeIII F, préala-blement localisés sur la carte de restriction du génome H~V (selon la technique décrite dans la référence (17)o Ce sont ces séquences de nucléotides qui ont été considé-rées comme consistant en les extrémités du "gène S"

15occupant elles-mêmes les positions 73,6 et 95,1 vis-à-vis du site de restriction EcoRI tfigure 1) pour les raisons déjà indiquées.
La séquence de nucléotides entre ces deux posi-tions a été analysée en ayant recours aux techniques chi-miques connues, notamment par la méthode de dégradation chimique à l'hydrazine diméthyl sulfate et la méthode des terminaisons de chaines. On a eu recours, parmi les réac-tions chimiques variées proposées par MAX~M et GILBERT à
une dépurination partielle par l'acide formique et au cli-vage par la pipéridine, méthodes qui donnent des bandes d'intensité égale sur les autoradiogrammes pour les frag-ments terminés par une guanine et une adénine. On a éga-lement utilisé les réactions à l'hydrazine suivies d'un clivage à la pipéridine, pour obtenir des bandes d'égale intensité, pour les nucleotides cytosine et thymidine :
le fractionnement électrophorétique des produits de ces deux réactions donne pour toutes les bases une tache dans l'une ou l'autre des colonnes de gel utilisées. Cette procédure facilite la lecture de l'autoradiogramme du gel.
La réaction à l'hydrazine en présence de chlorure de so-dium spécifique pour la cytosine permet de distinguer ce nucléotide de la thymidine et la réaction au diméthyl sulfate suivie d'un clivage par la pipéridine spécifi~ue de la guanine permet de distinguer ce dernier nucléoti-de de l'adénine.
De façon à s'assurer du plus grand possible de-gré de précision, des séquences distinctes de nucléoti-des formant différents fragments se chevauchant mutuelle-ment ont été produites par hydrolyse d'Eco HBV DNA pardiverses enæymes de restriction :
BamHi, HinfI, HpaII, HaeIII et HinclI.
De cette façon l'analyse de chacun des sites de restriction utilisés comme points de départ de premiers fragments étudiés a été confirmée par l'analyse des ~2~3~63 fragments distincts dans lesquels les sites de restriction des premiers fragments se trouvaient compris entre les nouvelles extrémités de ces fragments distincts.
Le "gène S" représenté à la figure 3, qui com-mence par le codon d'initiation ATG, comprend 227 triplets, dont un codon d'arrêt TAA. Les 3 codons correspondant aux 3 acides aminés de l'extrémité carboxy terminale du poly-peptide correspondant sont situés dans le même cadre de lecture, immédiatement avant le codon d'arrêt TAA. L'un des deux autres cadres de lecture (respectivement décalés vis-à-vis du précédent de 1 et 2 nucléotides) est égale-ment dépourvu de codon d'arret, mais code une protéine tout à fait di~férente des polypeptidesI et II sus-mentionnés. Le troisième cadre de lecture comprend 10 co-dons d'arret (5 TAG, 4 TGA, 1 ~AA) . Sur l'autre brin 15 d 'ADN, les trois cadres de lecture se trouvent respective-ment fermés par 11, 11, et 6 c~dons d'arret distribués le long de la séquence d'ADN.
Comme on l'a déjà indiqué plus haut, la traduc-tion complète de l'information génétique débutant par le codon d'initiation ATG conduit à un polypeptide théori-que de 226 amino-acides correspondant à un poids molécu-laire de 25 422 daltonsO
Il est intéressant de souligner que la séquence nucléotidique correspondant au "gène S" devrait normale-ment etre lue entièrement au cours de la traduction.
Sont également parties de l'invention des chai-nes de nucléotides du type du "gène S~' ri_dessus décrit, qui comporte depetites séquences supplémentaires pouvant contenir jusqu'à une centaine de nucléotides ou qui au contraire peuvent en etre dépourvues, sans que soit pour autant altérée l'information génétique correspondante (22, 23).
Les dif~érents fragments de l'invention qui ont été définis plus haut peuvent etre obtenus à partir de la séquence d'ADN dite Eco HBV DNA, en ayant recours aux 6;;~ `

enzymes de restriction correspondantes et aux techniques de fractionnement connues des fragments d'ADN, notamment sur gel de polyacrylamide et en mettant à profit leurs migrations sur des distances qui sont fonction de leurs poids moléculaires. Ainsi peut-on par exemple obtenir le fragment dont l'une des extrémités est délimitée par un site EcoRI et l'autre par un site AvaIII en opérant une restriction Eco HBV DNA par l'enzyme AvaIII, le frag-ment recherché consistant dans le plus petit fragment obtenu (un seul site AvaIII dans Eco HBV DNA).
Le fragment délimité par des extrémités opposées EcoRI et HhaI est obtenu par hydrolyse d'Eco HBV DNA par EcoRI d'abord, puis par hydrolyse partielle par l'enzyme de restriction HhaI. L'on récupère alors parmi les pro-duits de restriction celui qui contient le site AvaIII.
Ces techniques de restriction n'ont évidemmentété proposées qu'à titre d'exemple, étant bien entendu que le spécialiste est à même de déterminer les ordres de traitement par les enzymes de restriction pour isoler, à partir notamment d'Eco ~BV DNA, les fragments ayant les extrémités de restriction utiles.
A toutes fins utiles, on rappellera que ces opérations de restriction peuvent être réalisées au sein d'un tampon Tris 10 mM ; pH 7,8 ; MgC12 6 mM ; ~-mercapto-éthanol 6 mM, le même milieu contenant en outre et de pré-férence 50 mM de NaCl lorsque EcoRI est utilisé.
Comme il a déjà été dit, l'invention concerne l'utilisation des fragments d'ADN décrits à titre de son-de permettant le diagnostic de la présence dans un sérum de particules de Dane ou particules dérivées de la pré-cédente, porteuses d'un ADN susceptible de coder une pro-téine immunogène caractéristique de l'hépatite B.
L'ADN selon l'invention peut également être in-corporé à un vecteur permettant, à condition que l'incor-poration ait été réalisée en phase, l'expression de cet ~3~63 18ADN dans une bacterie ou autre micro-organisme, ou dans des cellules eucaryotes.
B - VECTEURS CONTENANT ~NE SEQUENCE NUCLEOTIDIOUE DE
L'ANTIGENE HBs Construction d'un bactérioPhaqe recombinant ~lac HBs-1 Les produits au niveau des différentes étapes de cette construction sont visés dans les figures la et lh.
Ils sont également visés par les numéros la à lh.
On a indiqué dans la figure la les positions du 10 "gène S" et de certains sites d'enzyme de restriction.
Après traitement de DNA ~ HBV avec l'enzyme de restriction HhaI, on separe un fragment d'ADN (lb) conte~
nant 1 084 paires de bases, et plus particulièrement la totalité du "gène S", par électrophorèse sur gel d'agarose 15 et électro-élution (figure lb). On prépare, à partir de ce sous-fragment, traité au préalable par l'endonucléase Sl, un ~ous-fragment ~lc) ~figure lc), résultant de l'al-longement du sous-fragment ~lb) à ses extrémités, par des éléments d'ADN dénommés ';EcoRI linXers" de ~ormule :
5' GGAATTCC
CCTTAAGG 3' Le fragment obtenu est, après formation des extrémités cohésives EcoRI, clôné dans le plasmide pBR322.
Le plasmide obtenu dénommé ci-après pBRHBs (fi-25 gure ld), ne contient qu'un seul site de restriction XbaI
situe à proximité de la tête du'bène S".
Par digestion du plasmide recombinant pBRHBs avec un mélange d'enzymes EcoRI et XbaI on produit un fragment d'ADN comprenant approximativement 980 paires 30 de bases et comportant la majeure partie du "gène S"
(figure le). Ce fragment est séparé et purifié par elec-trophorèse sur un gel d'agarose. Le fragment obtenu est à nouveau traité avec l' endonuclease Sl, puis à nouveau pourvu d'extrémités EcoRI au moyen des susdits "EcoRI
35 linkers'l, puis soumis à un traitement avec l'endonucléase ~219:~76~

EcoRI pour reformer les extrémités cohésives correspon-dantes~ Le fragment de la figure le qui comprend environ 980 paires de bases est alors inséré par fusion in vitro dans le site EcoRI du plasmide pBR322, pour former le plasmide pXbaHBs (figure lf). Ce plasmide est clôné de façon usuellecomme le plasmide pBR322.
Plusieurs clones ont été obtenus.
On extrait et purifie, après traitement avec EcoRI des ADN de trois de ces clônes, pXbaHBs-1, pXbaHBs-2 pXbaHBs-3 (figure lg), les fragments appelés ci-après - "fragments HBs" tfigure lh).
Les séquences nucléotidiques des extrémités des susdits fragments ~normalement obtenues à l'intérieur du "gène S") sont déterminées en ayant recours à la procédure décrite par MAXAM et GILBERT (Proc. Nat. Acad. Sci. USA
79, 560-564 (1977). Ces déterminations ont révélé que les sequences des nucléotides des extrémités terminales, cor-respondant au "gène S" n'étaient pas identiques dans les trois clônes (figure lg), les différences sont vraisem-blablement dues à des hétérogénéités produites au coursde la digestion par l'endonucléase Sl.
Les deux fragments provenant de pYbaHBs-1 et p~baBHs-2 sont insérés par fusion in vitro dans le génome du bactériophage ~plac 5-1 (21), lequel n'a qu'un seul site EcbRI situé à proximité de l'extrémité du gène lac Z.
Du fait du cadre de lecture du gène lac Z, tel qu'il peut etre déduit de la séquence d'amino-acides de la ~-galactosidase (23), on constate -et l'expérience le con-firmera- que l'insertion du fragment HBs de pXbaHBs-1 dans le site EcoRI du gène lac Z de ~plac 5-1 doit condui-re à la conservation de la phase de lecture adéquate du "gène S". Au contraire, l'insertion du fragment HBs de pXbaHBs-2 devait se révéler ne pas pouvoir etre inserée dans le précédent vecteur avec conservation du cadre de 3S lecture approprié. Il a néanmoins été utilisé comme témoin dans des expériences postérieures.
Ces opérations ont été réalisées en ayant re-cours à des techniques connues. En particulier les l'frag-ments HBs" de pXbaHBs-1, pXbaHBs-2 ont été insérés au moyen 5 d'une ligase dans l'ADN de ~plac 5-1 qui avaient au préa-lable été clivés par EcoRI. Les mélanges des fragments de ADN obtenus ont été ensuite utilisés pour transfecter la souche C600RecBC rk mk de E. coli. Les clônes de bacté-riophage devenus lac~ du fait de l'insertion des fragments 10 HBs dans les sites EcoRI du gène lacZ sont amplifiés et purifiés selon la méthode décrite en (21).
Les ADN des différents hactériophages ont été
extraits et les orientations des fragments d'ADN insérés déterminées par analyse électrophorétique de leurs frag-lS ments de restriction 9amHI. L'on peut ainsi déterminer quedeux rhages appelés ~lac~Bs-l et ~lacHBs-2 corres-pondant au plasmide pXbaHBs-1 et pXbaHBs-2 contenaient un fragment HBs correctement orienté.
La figure 2a est une carte schématique du vec-20 teur ~plac 5-1 avant sa modification par le fragment HBs-1, issu du pXbaHBs-1.
La figure 2c est une carte schématique d'une partie de ce meme vecteur montrant :la modification intro-duite dans son gène Z par insertion dans son site EcoRI du 2S susdit fra~ment HBs-1.
La figure 2c schématlse les structures du po-lypeptidehybride obtenu comme résultat de l'expression du vecteur modifié de la figure 2b.
L'expression a été obtenu par transfecti~n d'une 30 souche de bactérie de E. cGli, notamment d'une souche Hfr~lacX74.
Des souches de E. coli, notamment une souche de E. coli Hfr~lacX74 ont été transformées par plac 5-1, ~lacHBs-1 et ~lacHBs-2 respectivement. Après culture les 35 cellules sont lysées et les lysats obtenus analysés par 3~

électrophorèse sur gel de polyacrylamide SDS (24~ et les protéines sont détectées par coloration au bleu de coomas-sie. On constate la presence d'une bande plus intense parmi les produits d'~xpression de ~plac 5 1 au niveau de la po-5 sition correspondante, pour un témoin, à celle de la ~-galactosidase (poids moléculaire de 116 24B) et d'une ban-de distincte parmi les produits d'expression de ~lacHBs-1 ~non présent parmi les produits d'expression de ~lacHBs-2) correspondant à une nouvelle protéine ayant un poids molé-10 culaire de l~ordre de 135 000-141 000.
Les protéines synthétisées par les bactéries transfectées ~ant par ~lacHBs-1 que par ~ac 5-1 sont marquées par la (355) méthi~nine. La mise en présence de ces protéines avec un serum anti-HBsAg et la réalisation d'un 15 autoradiogramme du gel de polyacrylamide SDS révèlent la presence parmi les produits d'expression du seul ~lacHBs-1 d'une bande à laquelle ne correspond pas de bande équiva-lente parmi les produits d'expression des autres vecteurs.
Cette bande disparait de façon spécifique lorsque l'immuno-20 précipitation est réalisée en présence de H~sAg non marqué.On observe encore la meme bande parmi les produits d'ex-pression ~lacHBs-1, lorsque l'immunoprécipitation est réa-lisée avec un antisérum à l'égard de la ~-galactosidase.
La structure présumée de la partie de protéine 25 hybride obtenue, au niveau de la fusion entre le gène lacZ
et le fragment HBs-1 résulte de la figure 2c qui fait appa-raitre le fragment "~-gal", correspondant à la ~-galactosi-dase (1 005 acides aminés), le fragment HBsAg (lg2 acides aminés), ces fragments étant séparés par un acide aminé
30 prolyne, correspondant à une partie de "EcoRI linker" con-tenu dans le ~ecteur ~lacHBs-l.
C - PROCEDE DE FABRICATION D'UNE MOLECULE IMMUNOGENEMETTANT

~L~ ~6~

EN O~UVRE LE VECTEUR SELON L'INVENTION
L'inventiGn peut par conséquent permettre la production d'une protéine de masse moléculaire plu5 faible que les polypeptides I ou II susvisés, douée des mêmes 5 propriétés immunogènes.
Les résultats démontrent que E. coli, ou tout autre micro-organisme approprié, tel qu'une bact~érie ou une culture de cellule eucaryote, peut être infecté par le ~lacHBs-l et synthétiser une protéine ayant un poids 10 moléculaire de l'ordre de 138 000 et possédant les déter- -~
minants antigéniques à la fois de HBsAg et de la ~-galac-tosidase. Cette molécule est représentative des polypep-tides hybrides qui peuvent être obtenus par le procédé
selon l'invention, dans lequel HBsAg est relié à une pro-15 téine support (resultant de la substitution partielle ou totale du fragment ~-galactosidase~, ces hybrides possé-dant néanmoins les propriétés antigéniques de HBsAg. Ces nouvelles molécules sont utiles pour la production de vac-cins actifs contre l'hépatite-virale B.
Comme il va de soi, et comme il résulte d'ail-leurs déjà de ce qui précède, l'invention ne se limite nullement à ceux de ses modes d'application et de réalisa-tion qui ont été plus spécialement envisagés , elle en em-brasse, au contraire, toutes les variantes.
En annexe de cette description figure la biblio-graphie, et en particulier les références qui ont été ci-tées dans le cadre de la présente description.

~3763 REFER~NCES
1 - Blumberg, B. S. (1977) Science 197, 17-25
r) 376 ~
i "NUCLEOTIDE SEQUENCE ENCODING THE SURFACE ANTIGEN OF
HEPATITIS B VIRUS, VECTOR CONTAINING SAID SEQUENCE
NUCLEOTITIC, PROCESS FOR PROVIDING SAME AND ANTIGEN
GOT "

The invention relates to a nucleic acid comprising a nucleotide sequence capable of encoding a immunogenic peptide sequence corresponding to the antigen viral hepatitis B virus, and poly-5 peptides and peptides obtained.
It also relates to a method allowing to obtain such a nucleic acid.
Hepatitis B is a common viral disease especially in tropical Africa, in Asia of 10 South-East and the Far East.
The etiological agent is a virus (HBV) or par-Dane's ticule, comprising an envelope (antigen Australia or HBs antigen), a capsid (HBc antigen), an endogenous polymerase and a circular DNA molecule 15 partially single-stranded: the longest strand of this DNA molecule contains nearly 3,200 nucleotides (SUMMERS
J., O'CONNELL A. and MILLMAN I. (1975 ~ Proc. Nat. Acad.
Sci. USA 7 ~, 4,597-4,601).
Endogenous DNA polymerase can be used 20 to repair the shortest strand in vitro (TA LANDERS, HB GREENBERT and J. S ~ ROBINSON, J. VIROL., 23, 1977, p. 368-376).
The electrophoretic analysis of proteins the envelope showed the presence of 2 to 7 polypeptides 25 of which the main ones are called: polyp ~ ptide I and poly-peptide II (PETERSON DL ~ ROBERTS IM and VYAS GN
(1977) Pr ~. Nat ~ Acad. Sci., USA, 74, 1530 ~ 1534, and PETERSON DL, CHIEN DY, VYAS GN, NITECKI D. and BOND H. (1978) In Viral Hepatitis, ed. G. VYAS, S. COHEN
30 and R. SCHMID, The Franklin Institute Press, Philadelphia, 56g-573).

~. ~

~ 21a 3 ~ 63 Polypeptide I has a molecular weight of 22,000 at 26,000 daltons. Polypeptide II is glycosilated and has a molecular weight from 28,000 to 30,000 daltons. The composition amino acids of these two polypeptides is very S similar, The sequences that form, respectively, their first 15 amino acids (from the ex-N-terminal) and their last 3 amino acids are identical, so the assumption was ~ or-mule that polypeptide II might not differ of polypeptide I only by glycosilation.
The study of the virus is extremely dif-difficult since no system is available cell culture allowing the spread of the virus.
This difficulty has already been partially overcome, more particularly with regard to the ayw serotype.
~ The entire DNA (~ enome) of the virus has been identified and cloned, nota ~ ment in E. coli, after its prior insertion-ble in the unique EcoRI site of a vector ~ gt.WES. ~ B, depending on the technique by FRITSCH A., POURCEL C., CHARNAY P. and TIOLLAIS P. (1978) CR Acad. de Paris, 287, 1 4S3-1 456).
At this ~ our, the sequence of polypeptides I
and II themselves, the localization in the viral DNA of the sequence encoding these peptides have not been performed.
The object of the invention is to obtain a sequence 25 this much smaller DNA than the viral DNA itself, containing the sequence capable of encoding the peptide sequence endowed with immunogenic properties allowing, when is introduced into the body of a living host, duire the latter's manufacture of antibodies susceptible 30 wounds to protect later this same host with regard to viral hepatitis B virus, especially when it this is in a virulent state.
The invention follows not only from the analysis complete nucleotide of the Dane particle genome ~ L ~ d ~ a 6 ~

inventors did, but the idea that they had to identify the coding gene (hereinafter referred to as "S gene") of the above polypeptides, to search in the complete pre-established nucleotide structure of the ge-name of the Dane particle, those of the sequences of nu-cleotides capable of encoding peptide sequences known proximal and terminal of these polypeptides.
It will be recalled that PETERSON and collaborators have reported, especially in the articles whose references rences were recalled more ~ aut, than the proxi-male (first N-terminal amino acid) of the first 15 amino acids can in principle be analyzed as follows:
met glu asn ile thr ser gly phe leu gly pro leu leu val ser and that the terminal sequence of these same polypeptides (last C-terminal amino acid) was:
val tyr ile Figure 1 is a schematic map of the genome of Dane's particle ~ This one has two ~ rins b1 and b2; the shortest of them (~ 2) being normally devoid of the part represented by a line entered interrupted in the drawingO
It is known that this DNA contains only one EcoRI site.
The arrow f1 gives the direction of the numbering nucleos ~ ides of which the longest strand b1 is composed, and the arrow f2 gives the direction of DNA transcription of the virus, in particular by cellular machinery of those Hepatitis B virus invaded . concerns the expression of the S gene.
The EcoRI site can therefore be numbered 0 or, as has now been determined from a more exact ~
for that of the hepatitis B viruses belonging to the sero-ayw type, 3 182.
The circle in full interior line gives the scale in% of DNA length and makes it possible to specify the 12 ~ 3763 positions of some of its parts.
The numbers 3 ', 5' and 5 ', 3' at the ine of the card are aimed at the terminal ends turers of the same numbers in the agreed representations the ends of the nucleic acid chains.
According to the invention, it has been shown that the "S gene" essentially constituted the fra ~ ment of the strand the longest b1 located between positions 73.6 and 95.1 from the schematic map of figure 1. Abbreviations "Start" and "Stop" represent the initiation points and stopping the transcription of the "S gene".
The ~ igure 2 is representative of the part terminal of the above genome, in particular between the positions 60.4 and 100 ~ in% of DNA length). Each of the letters in figure 2 correspond so conventional to one of the 4 basic DNA nucleotides:
A: Adenine G: Guanine T: Thymine C: Cytosine The lower lines, in each pair of li-genes of which figure 2 is made up, correspond to the nucleic acid corresponding to the nucleotide chain b ~.
The analytical technique used to establish the more detailed map as shown in figure 2, will be brief vely recalled below.
Characterization of the nucleotide sequence of the "S gene" as proposed in the context of the present invention, and whose proximal ends p "S" and terminal t "S" are indicated in FIG. 2, results from the observation that:
- the first 14 triplets (in the direction of the reading f2) from the nucleotide numbered 3,030 opposite EcoRI terminal end screws, are respectively 3 ~ 3 able to encode the 14 no-acid priers of the proxi- sequence male of the 15 amino acid prenuers of the above poIypeptides, - the last 4 GTA TAC ATT TAA triplets read on the complementary chain b2 to the transcribed chain bl correspond respectively to the 3 terminal amino acids the above polypeptides and a stop codon:
- this nucleotide sequence (678 nucleotides) does not include a stop codon, at least when adopts the reading framework implying that the first tri-plet "read" on DNA by cellular machinery, ie AUG, (corresponding on the complementary strand to ATG), - the complete translation of the general information tick starting with the initial ATG codon leads to a theoretical polypeptide of 226 amino acids, having a weight molecular strength of 25,422 daltons.
The nucleotide structure of the "S gene" as well as the polypeptide chain resulting from the translation of the "S gene" are shown in Figure 3.
These values are fully consistent with the data.
analytical results which result from electropho-of the polypeptide I on polyacrylamide gels which have already been described by the previous authors (re-References 9-12 according to the bibliography at the end of the description of this patent application).
The difference observed at the level of the 15th amino-acid of the proximal peptide sequence of polypeptide I:
leucine according to the maps of Figures 2 and 3 mentioned above, and not serine according to the above findings so-called authors, can perhaps be attributed to the fact that these authors worked with a different genetic variant rent from that which was the subject of this study. We note that the difference can also be related to substitution of a single nucleotide in the triplet con-identified "rrTA" in the particular "S gene" represented in the cards of Figures 2 and 3, instead of "TCA", one of the ~ ~ 3 triples likely to be translated into serine.
The invention therefore relates more particularly nucleic acid fragments that can be excised of DNA from the Dane particle, these fragments being more particularly characterized in that they contain the part of the "S ~ gene capable of encoding the part of the envelope protein of the virus which is responsible immunological properties of the hepatitis B virus As such, the invention therefore relates to an acid nucleic acid comprising at most of the order of 1000-1 100 nu-cleotids, more particularly characterized in that it is able to encode an immunogenic peptide sequence, it-even able to induce the production of antibodies in vivo hepatitis B virus, this sequence peptide containing essentially the structure represented seen in FIG. 3, or any peptide sequence having equivalent immunogenic properties.
The invention also relates to a vector in view of the expression of said nucleotide sequence in a microorganism or in eukaryotic cells to con-dition that the genetic fusion was carried out in con-serving the reading phase of the "S 'gene ~.
The nucleotide sequences used conform my to the invention present in relation to each other variability leading, when expressed, to formation of determinants varying according to the subtype of hepatitis B virus (subtypes d, w, y, r of group a).
For one of the peptide sequences represented tées in Figure 3, it will be observed that the first amino acid born from the above sequence O methionine, is N-terminal and that the amino acid of the opposite end: isoleucine, is C-terminal ~
The invention also relates, more particularly-ment, the nucleotide sequence shown in Figure 4 encoding the peptide sequence as it results from the ~% ~ 3 ~ 6; ~

Figure 5 or any analogous peptide sequence endowed with equivalent immunogenic properties.
It goes without saying that by "equid peptide sequence valente ", mentioned above, you must hear any peptide sequence in which certain parts may not be strictly identical to the corresponding parts ~ of the peptide sequence represented in the Figures 3 and 5, these variations possibly being due to local tations not affecting immunogenicity general protein or structural changes due to the different serotypes under which the proteins of the genre in question are likely to arise (notably serotypes adw, adr and a ~ r).
The invention relates more particularly to nucleotide sequence containing the peptide sequence as shown in Figure 6 or any se-analogue peptide sequence with immunogenic properties equivalent.
The invention relates more particularly still the following peptide sequences:
Alanine ~ lutamine ~ lycine-Threonine-S ~ kinP
Threonine-Alanine ~ Glutamine-Glycine-Threonine-Se'rine Threonine-Threonine-Alanine-Glutamine-Glycine-Threonine-Serine In the first peptide mentioned above, the end alanine is N-terminal and the serine end is C-tenminal.
In the second and third peptides above-indi ~ ués, the threonine end is N-terminal and the extreme serine mite is C-terminal.
By way of example, one can in particular prepare the pentapeptide starting from the C-terminal serine to which we hang the threonine by the method of Castro described in T ~ trahédron Letters, 1975, n14, page 1219-1222. Then the aci-amines glycine, glutamine, alanine are added by the method called repeated mixed anhydride (rema method) described by Beierman in Chemistry and ~ iology oE Peptides, E ~. J. ~ eienhofer, Ann. Arbor 37 ~ 3 Science Publ., Ann. Arb. Mich. 351 (1972).
The invention also relates to the products both of the fixation of the pentapeptide on a carrier molecule getting larger, especially of the polypeptide or protein type, the compositions containing this pentapeptide in fixing products, no-tamr ~ nt in combination with a pharmaceutically acceptable vehicle, and more particularly vaccines against hepatitis B. These vehicles pharmaceuticals are appropriate, in a conventional manner, to the mcde of ad-chosen administration, no oral, parenteral, rectal or by nebulization on mucous membranes, especially nasal.
The hexapeptide and the polypeptide has 7 amino acids can be synthesized by synthesis techniques classic peptide.
According to the present invention, these peptides are held to be the anti ~ enic site of the polypeptides of larger size which question higher and responsible the immunizing power of the viral envelope (Journal of Biol. Stand. 1976, 4, 295-304, RAO and VYAS "Biochemical Characterization of Hepatitis B Surface Anti ~ en in Relation to Serologic Activity ").
The invention also relates ~ t still the frag-DNA elements likely to encode: The production of such pentapeptide, hexapeptide and polypeptide with 7 amino acids.
It's about :
- for pentapeptide, in particular polynucleo-formula formula:
5 'GCT CAA GGA ACC TCT 3' 3 'GGA GTT CCT TGG AGA 5' - for the hexapeptide, in particular polynucleoti-of formula:
5 'ACT GCT CAA GGA ACC TCT 3' 3 'TGA CGA GTT CCT TGG AGA 5' - for the polypeptide with 7 amino acids of the poly-nucleotide of formula:
5 'ACT ACT GCT CAA GGA ACC TCT 3' 76 ~

3 'TGA TGA CGA GTT CCT TGG AGA 5' or in each of the three cases, complementary polynucleotide silent relating to the three respective polynucleotides preceding teeth or any polynucleotide in which each triplets can be replaced by any similar triplet able to code the production of the same amino acid.
T, I nucleic acid according to the invention can also be characterized in that it comprises at least one of two strands mutually complementary to a sequence DNA as shown in Figure 4 t in which the numbers corresponding to the posi-tions of the first nucleotides of each of the suc-stops of 10 nucleotides shown opposite the po-Eco ~ I sition not shown in the figure: it goes from these numbers do not occur at the level of the - CaraCtériSatiQn of the nucleotide sequence of the genus in question). This DNA fragment is delimited by two sites HincII.
It will be appreciated that this nucleotide sequence corresponds to genetic information whose translation leads to the peptide sequence shown in FIG. 5.
The invention naturally relates to the sequences single-strand or double-strand equivalent nucleotides, including the strand having the structure which follows from ~ 5 the succession of the lower lines of figure 4, DNA
with corresponding double strand, or the corresponding messenger RNAs layering, in particular that represented by the sequences complementary to nucleotides formed by the lines lower of the pairs of lines of figure 4 (direction of arrow f2).
Likewise, the scope of the invention nucleotide chains which differ from the previous ones tes by certain triples O ~ l small sequences of triplets, insofar as these nucleotide sequences remain able to encode a polypeptide conserving the activities ~ Z03 ~ 6; ~

immunogens characteristic of hepatitis vi viruses rale B. Generally speaking, these are nu-cleotides which, if necessary, after denaturation of DNA
double stranded to produce single nucleic acids corresponding strand, remain susceptible to hybridize on at least about 90 X of their length with one of the strands of the DNA of FIG. 4.
Preferred nucleic acids according to the invention are still the ones who can be circumcised from DNA from viral hepatitis and ~ ui, when they are double ble strand, are characterized by the existence of one of their ends of a HincII, HhaI, AvaI or EcoRI end and at their other end by an AvaIII, HincII or HhaI.
The positions of these various ends with respect to EcoRT site screws are shown schematically in ~ igure 2.
The nucleic acid according to the invention is intended incorporation into a vector allowing its expression-sion in bacteria and in eukaryotic cells, especially for the production of a protein or a peptide capable of inducing in the organism of a host living producing antibodies active against the virus viral hepatitis B. The resulting protein or peptide both of the translation of the nucleotide sequence according to '-the invention can be used as a vaccine agent or as an agent for diagnosis.
The nucleic acid according to the invention can also be used as a probe to detect the presence or not in blood or test serum samples, Dane particle, HBs antigen or fragments of this one, etc. (by classical DNA hybridization technique-DNA).
Other characteristics of the invention result from will be further from the following brief description of the techniques analysis, identification and obtaining ques DNA fragments according to the invention. Reference seranaturally made to the drawings whose figures have d ~
have been taken into account in the above. The figures fres or numbers in parentheses correspond to references references of the bibliography annexed to this ~ descrip-tion.
`The invention also relates to particular vectors linkers allowing expression of nucleotide sequences described above, especially in the form of a protein hybrid in which a protein eragment presenting the immunological characteristics of HBsA ~ adjoins a molecule carrier conferring on all immunogenic properties or immunoreactive, likely to induce production protective antibodies against viral infection in the host organism in which this protein has previously been introduced.
In particular, the invention relates to a vector -phage or plasmid - containing at least part of the o peron lactose, more particularly the promoter and the Z gene of this operon, this vector being characterized in that that it is modified for insertion, in phase, into a site appropriate for the Z gene, such as the ~ coRI site of any one conquers DNA fragments from the main patent, including those containing most of the "S gene". She con-also identifies those of these modified vectors, in the-which at least part of the DNA DNA coding for most of the ~ -galactosidase would be replaced ; created by a DNA fragment able to code for any other non-immunogenic carrier molecule, or whose possible immunological properties, if these exist, do not do not work with those of the peptide part presenting the immunological properties of HBsAg, for example essential that which extends in the direction of the read ture from its HhaI site ~
The invention is also more particularly ~ L2 ~ 3763 relating to a hybrid protein characterized in that it contains a polypeptide sequence having the properties HBsAg-specific immunological tees, adjoining a polypeptide sequence consisting of the major part of ~ -galactosidase, which ~ plays the role of carrier protein.
The invention does not extend only to this mo-the particular hybrid school, whose essential role is to constitute a model of a protein constructed according to the techniques of genetic engineering and endowed with properties immunogenic and immunoreactive characteristics of the anti HBsAg gene, but also to any other hybrid protein in which all or part of 1 ~ part ~ -galactosidase can be replaced by any other non-carrier molecule in ~ unogenic, or whose possible immunological properties that, if these exist, do not interfere with those of the peptide part having the immuno-HBsA ~ logic.
~ 'other features of the invention appear-will arise again during the description of pre-fairies, in combination with the drawings in which:
- the figures la and lh illustrate schematically -the successive stages in the production of a vector of the plasmid type incorporating a fragment of HBV VNA, FIGS. 2a to 2c schematically illustrate the initial structures of the vector used (Figure 2a) final of the modified vector obtained (Figure 2b) and that of the hybrid protein resulting from the expression of this vector altered in E. coli (Figure 2c).
A ~ SE ~ NUCLEOTIDIOUES UENCES
Products and methods used - The enæymes and the chemicals used ________ ____ _____________ ______________ _ Restriction enzymes used: BamHI, HhaI, HincII, HaeIII, XbaI, MboI, HinfI, HpaII, XhoI, are those manufactured by BIOLABS. We used DNA-polymer shave I from BOEHRINGER. Bacterial alkaline phosphatase 3 ~ 6 ~

and the polynucleotide kinase were provided by PL BIOCHEMICALS. The chemical agents were the following before:
. Dimethyl sulfate (ALDRICH), . Hydrazine (EASTMAN KODAK), Acrylamide and bis-acrylamide (2 times crystal-read - SERVA), . Dideoxy nucleotide triphosphates and deoxynucleotide triphosphates ~ PL
~ IOCHEMICALS), . IMERCK3 piperidine redistilled under vacuum.
- Preparation of HBV DNA
_ _ _ _ _ _ _ _. _ _ _ _ _ _ _ _ _ _ _ _ The entire HBV genome ~ subtype aYw) has been clo-born in E. coli by bringing into play the unique site of ECoRI triction of the vector ~ gt.WES. ~ B (14). The cloned DNA is hereinafter called "Eco HBV DNA".
The recombinant bacteriophage was amplified by petri dish on Agar and extracted the DNA
in a manner known per se ~ After digestion of DNA by the EcoRI restriction zyme, the Eco sequence was purified H ~ V DNA by ultracentrifugation, in a gradient of su-crose, using the technique described in the bi-bliographic (16, 17).
- Preparation of fragment: s of DNA labeled 5.32 p ____________________________________________ 10 to 20 picomoles of Eco HBV DNA have been completed hydrolyzed by the various restriction enzymes tion, under the conditions recommended by the ~ abricant.
The DNA fragments have been dephosphorylated by phos-alkaline phatase, which was then inactivated by alkaline treatment. DNA was then precipitated with ethanol, according to the technique described in the article (18). After redissolution in a sper-based buffer midin, DNAs have been tagged at their 5 'ends with an ATP {~ 32p} (3,000 Ci / mM manufactured by NEW ENGLAND
NUCLEAR) and with polynucleotide-Xinase (according to ~ v ~ ~ ~

technique referred to in article (19).
The restriction DNA fragments were separated res by electrophoresis on polyacrylamide gel, then eluted. The marked ends have been segregated gatio ~ by electrophoresis on polyacrylamide gel defaçon known per se, after restriction with another en-zyme or by denaturing DNA fragments of the genus in question.
- Determination of the structure of the sequences ___________________________________________ of nucleotide DNA
_____________________ The primary structure of the DNA fragments â dou-wheat strand or single strand was determined essentially according to the technique described by MAXAM and GILBERT (19).
The terrestrial inhibitor method has also been used.
chalnes minerals described by SANGER et al. (20) and adapt-ted by MAAT and SMITH t21), with regard to fragments with double strand marked at one of their 5 'ends.
Chemical and enzymatic reaction products that were analyzed by electrophoresis in gels of acrylamide sequence at 8.16 or 25 X, 1 mm thick.
Techniques and results of the analysis In order to determine if the HBV genome is capa-ble to encode polypeptides I and II, all fragments HaeIII (HaeIII restriction sites of the HBV genome represented felt in Figure l by small arrows) have been marked at their 5 'ends. Substantial parts of their primary structures were determined by the MAXAM and GILBERT method. Nucleotide sequences likely to encode proxi- amino acid sequences males and terminals of polypeptides I and II have been lo-tagged in the HaeIII E and HaeIII F fragments, previously located on the genome restriction map H ~ V (according to the technique described in reference (17) o It is these nucleotide sequences that have been considered as consisting of the ends of the "S gene"

15 themselves occupying positions 73.6 and 95.1 opposite vis the EcoRI restriction site tfigure 1) for reasons already given.
The nucleotide sequence between these two posi-tions has been analyzed using chi-known mics, in particular by the method of degradation hydrazine dimethyl sulfate chemical and the method of chain endings. Among the reactions, various chemical options offered by MAX ~ M and GILBERT to partial depurination with formic acid and piperidine methods, which give bands of equal intensity on autoradiograms for frag-with a guanine and an adenine. We also The reactions to hydrazine followed by a piperidine cleavage, to obtain equal bands intensity, for cytosine and thymidine nucleotides:
the electrophoretic fractionation of the products of these two reactions gives a stain in all bases either of the gel columns used. This procedure facilitates the reading of the autoradiogram of the gel.
The reaction to hydrazine in the presence of sodium chloride dium specific for cytosine makes it possible to distinguish this thymidine nucleotide and the reaction to dimethyl sulfate followed by cleavage by specific piperidine of guanine makes it possible to distinguish this latter nucleoti-adenine.
In order to ensure the greatest possible If desired, separate nucleotide sequences forming different mutually overlapping fragments-have been produced by hydrolysis of Eco HBV DNA by various restriction enzymes:
BamHi, HinfI, HpaII, HaeIII and HinclI.
In this way the analysis of each of the sites of restriction used as prime starting points fragments studied was confirmed by analysis of ~ 2 ~ 3 ~ 63 separate fragments in which restriction sites the first fragments were between new ends of these distinct fragments.
The "S gene" shown in Figure 3, which includes menced by the initiation codon ATG, comprises 227 triplets, including a TAA stop codon. The 3 codons corresponding to 3 amino acids from the carboxy terminus of the poly-corresponding peptide are located in the same frame of reading, immediately before the TAA stop codon. Mon of the other two reading frames (respectively offset vis-à-vis the previous 1 and 2 nucleotides) is equal-lacks a stop codon, but encodes a protein quite different from polypeptidesI and II above-mentioned. The third reading frame includes 10 co-stop donations (5 TAG, 4 TGA, 1 ~ AA). On the other strand 15 of DNA, the three reading frames are found respectively-closed by 11, 11, and 6 c ~ stop donations distributed along the DNA sequence.
As already indicated above, the translation complete genetic information starting with the ATG initiation codon leads to a theoretical polypeptide than 226 amino acids corresponding to a molecular weight area of 25,422 daltonsO
It is interesting to note that the sequence nucleotide corresponding to the "S gene" should normal-should be read entirely during translation.
Are also parts of the invention of the chai-nes of nucleotides of the type of the "S ~ gene" described above, which has small additional sequences that can contain up to a hundred nucleotides or which otherwise can be without it, without being altered the corresponding genetic information (22, 23).
The various fragments of the invention which have been defined above can be obtained from the DNA sequence called Eco HBV DNA, using 6 ;; ~ `

corresponding restriction enzymes and techniques known fractionation of DNA fragments, in particular on polyacrylamide gel and using their migrations over distances which are a function of their molecular weights. So we can for example get the fragment, one end of which is delimited by one EcoRI site and the other by an AvaIII site by operating Eco HBV DNA restriction by the enzyme AvaIII, the frag-ment sought consisting of the smallest fragment obtained (a single AvaIII site in Eco HBV DNA).
The fragment delimited by opposite ends EcoRI and HhaI is obtained by hydrolysis of Eco HBV DNA by EcoRI first, then by partial hydrolysis by the enzyme HhaI restriction. We then recover among the pro-restriction products that which contains the AvaIII site.
These restriction techniques have obviously only been proposed as an example, it being understood that the specialist is able to determine the orders restriction enzyme treatment to isolate, from Eco ~ BV DNA in particular, the fragments having the useful restriction ends.
For all intents and purposes, it will be recalled that these restriction operations can be performed within 10 mM Tris buffer; pH 7.8; 6 mM MgC12; ~ -mercapto-6 mM ethanol, the same medium additionally containing and pre-50 mM NaCl ference when EcoRI is used.
As has already been said, the invention relates to the use of the DNA fragments described as sound-allowing the diagnosis of the presence in a serum Dane particles or particles derived from the pre-cedent, carrying a DNA capable of coding a pro-immunogenic tein characteristic of hepatitis B.
The DNA according to the invention can also be in-embodied in a vector allowing, provided that the incorporation poration was carried out in phase, the expression of this ~ 3 ~ 63 18 DNA in a bacteria or other microorganism, or in eukaryotic cells.
B - VECTORS CONTAINING ~ NE NUCLEOTIDIOUS SEQUENCE OF
THE HBs ANTIGEN
Construction of a recombinant bacteriophaqe ~ lac HBs-1 Products at the different stages of this construction are referred to in Figures la and lh.
They are also targeted by the numbers la to lh.
The positions of the 10 "S gene" and certain restriction enzyme sites.
After treatment of DNA ~ HBV with the enzyme HhaI restriction, we separate a DNA fragment (lb) from ~
with 1,084 base pairs, and more specifically the entire "S gene", by agarose gel electrophoresis 15 and electro-elution (Figure lb). We prepare, from this sub-fragment, previously treated with endonuclease Sl, a ~ ous-fragment ~ lc) ~ figure lc), resulting from the al-along the sub-fragment ~ lb) at its ends, by DNA elements called "EcoRI linXers" from ~ ormule:
5 'GGAATTCC
CCTTAAGG 3 ' The fragment obtained is, after formation of the EcoRI cohesive ends, cloned into the plasmid pBR322.
The plasmid obtained hereinafter called pBRHBs (fig.
25 gure ld), contains only one XbaI restriction site located near the head of the "bene S".
By digestion of the recombinant plasmid pBRHBs with a mixture of EcoRI and XbaI enzymes a DNA fragment comprising approximately 980 pairs 30 bases and containing most of the "S gene"
(figure le). This fragment is separated and purified by elec-trophoresis on an agarose gel. The fragment obtained is again treated with endonuclease Sl, then again provided with EcoRI ends by means of the above "EcoRI
35 linkers'l, then subjected to endonuclease treatment ~ 219: ~ 76 ~

EcoRI to reform the corresponding cohesive ends dantes ~ The fragment of figure le which includes approximately 980 base pairs are then inserted by in vitro fusion in the EcoRI site of the plasmid pBR322, to form the plasmid pXbaHBs (Figure lf). This plasmid is cloned with as usual, like the plasmid pBR322.
Several clones were obtained.
It is extracted and purified, after treatment with EcoRI of the DNAs of three of these clones, pXbaHBs-1, pXbaHBs-2 pXbaHBs-3 (figure lg), the fragments called below - "HBs fragments" tfigure lh).
The nucleotide sequences of the ends of above fragments ~ normally obtained inside the "S gene") are determined using the procedure described by MAXAM and GILBERT (Proc. Nat. Acad. Sci. USA
79, 560-564 (1977). These determinations revealed that the terminal end nucleotide sequences, cor-corresponding to the "S gene" were not identical in the three clones (figure lg), the differences are really probably due to heterogeneities produced during digestion by the endonuclease S1.
The two fragments from pYbaHBs-1 and p ~ baBHs-2 are inserted by in vitro fusion into the genome bacteriophage ~ plac 5-1 (21), which has only one EcbRI site located near the end of the lac Z gene.
Because of the lac Z gene reading frame, as it can be deduced from the amino acid sequence of the ~ -galactosidase (23), we see -and experience will confirm that the insertion of the HBs fragment of pXbaHBs-1 in the EcoRI site of the lac Z gene of ~ plac 5-1 must lead re the conservation of the adequate reading phase of the "S gene". On the contrary, the insertion of the HBs fragment of pXbaHBs-2 should turn out not to be able to be inserted in the previous vector with conservation of the frame of 3S appropriate reading. It was nevertheless used as witness in later experiences.
These operations were carried out with courses in known techniques. In particular the frag-pXbaHBs-1 HBs "elements, pXbaHBs-2 were inserted using 5 of a ligase in the DNA of ~ plac 5-1 which had previously lable was cleaved by EcoRI. Mixtures of fragments of DNA obtained was then used to transfect the E. coli strain C600RecBC rk mk. Clones of bacteria riophage become lac ~ due to the insertion of fragments 10 HBs in the EcoRI sites of the lacZ gene are amplified and purified according to the method described in (21).
The DNA of the various haceriophages has been extracts and orientations of inserted DNA fragments determined by electrophoretic analysis of their frag-Restriction elements 9amHI. We can thus determine that two lines called ~ lac ~ Bs-l and ~ lacHBs-2 corres-laying on the plasmid pXbaHBs-1 and pXbaHBs-2 contained a HBs fragment correctly oriented.
Figure 2a is a schematic map of the vector 20 teur ~ plac 5-1 before its modification by the HBs-1 fragment, from pXbaHBs-1.
Figure 2c is a schematic map of a part of this same vector showing: the intro-picks up its Z gene by insertion into its EcoRI site of 2S abovementioned HBs-1.
Figure 2c schematically shows the structures of the po-The polypeptide hybrid obtained as a result of the expression of the modified vector of Figure 2b.
The expression was obtained by transfecti ~ n of a 30 strain of E. cGli bacteria, including a strain Hfr ~ lacX74.
E. coli strains, including a strain of E. coli Hfr ~ lacX74 were transformed by plac 5-1, ~ lacHBs-1 and ~ lacHBs-2 respectively. After cultivation 35 cells are lysed and the lysates obtained analyzed by 3 ~

SDS polyacrylamide gel electrophoresis (24 ~ and proteins are detected by staining with coomas blue sie. We see the presence of a more intense band among the expression products of ~ plac 5 1 at the level of the 5 sition corresponding, for a witness, to that of the ~ -galactosidase (molecular weight 116 24B) and a ban-of distinct among the expression products of ~ lacHBs-1 ~ not present among the expression products of ~ lacHBs-2) corresponding to a new protein having a molecular weight 10 cular in the range of 135,000-141,000.
Proteins synthesized by bacteria transfected ~ ant by ~ lacHBs-1 than by ~ ac 5-1 are marked by the (355) methi ~ nine. The bringing together of these proteins with an anti-HBsAg serum and making a 15 autoradiogram of SDS polyacrylamide gel reveals the presence among expression products of only ~ lacHBs-1 a band to which there is no equivalent band slow among the expression products of other vectors.
This band disappears specifically when the immuno-20 precipitation is carried out in the presence of unlabelled H ~ sAg. The same band is still observed among the products of ex-pressure ~ lacHBs-1, when immunoprecipitation is re-edged with an antiserum with respect to ~ -galactosidase.
The presumed structure of the protein part 25 hybrid obtained, at the level of the fusion between the lacZ gene and the HBs-1 fragment results from FIG. 2c which appears raitre the fragment "~ -gal", corresponding to the ~ -galactosi-dase (1,005 amino acids), the HBsAg fragment (lg2 acids amino), these fragments being separated by an amino acid 30 prolyne, corresponding to a part of "EcoRI linker"
held in the ~ ector ~ lacHBs-l.
C - METHOD FOR MANUFACTURING AN IMMUNOGENEMETTING MOLECULE

~ L ~ ~ 6 ~

IN OPERATING THE VECTOR ACCORDING TO THE INVENTION
The inventiGn can therefore allow the low molecular weight protein production than the aforementioned polypeptides I or II, endowed with the same 5 immunogenic properties.
The results demonstrate that E. coli, or all other suitable microorganism, such as bacteria or a eukaryotic cell culture, can be infected with the ~ lacHBs-l and synthesize a protein having a weight 10 molecular of the order of 138,000 and having deter- - ~
antigenic minants of both HBsAg and ~ -galac-tosidase. This molecule is representative of polypep-hybrid tides which can be obtained by the process according to the invention, in which HBsAg is linked to a pro-15 support tine (resulting from partial substitution or of the ~ -galactosidase ~ fragment, these hybrids have however, the antigenic properties of HBsAg. These new molecules are useful for the production of vac-cins active against viral hepatitis B.
As it goes without saying, and as it results from their already from the above, the invention is not limited in no way to those of its modes of application and implementation which have been more specifically envisaged, it brews, on the contrary, all variants.
Annexed to this description is the library spelling, and in particular the references which have been tees in the context of this description.

~ 3763 REFER ~ NCES
1 - Blumberg, BS (1977) Science 197, 17-25

2 - Dane D. S., Cameron C. H., and Brigss M. (1970 Lancet 1, 695-698 2 - Dane DS, Cameron CH, and Brigss M. (1970 Lancet 1, 695-698

3 - Who Technical Report series, number 602 (1976) 3 - Who Technical Report series, number 602 (1976)

4 - Summers J., O'Connel A., and Millman I. (1975) Proc.
Nat. Acad. Sci. VSA 72, 4 597-4 601
4 - Summers J., O'Connel A., and Millman I. (1975) Proc.
Nat. Acad. Sci. VSA 72, 4,597-4,601

5 - Hruska J. F., Clayton D. A., Ru~enstein J. L. R. and Robinson W. S. (1977) J. Virol. 21, 666-682 5 - Hruska JF, Clayton DA, Ru ~ enstein JLR and Robinson WS (1977) J. Virol. 21, 666-682

6 - Landers T. A., Greenberg H. B. and Robinson W. S.
(1977) J. Virol. 23, 368-376
6 - Landers TA, Greenberg HB and Robinson WS
(1977) J. Virol. 23, 368-376

7 - Charnay P., Pourcel C., ~ouise A., Fritsch A. and Tiollais P. (1979) Proc. Nat. Acad. Sci. USA, 76 7 - Charnay P., Pourcel C., ~ ouise A., Fritsch A. and Tiollais P. (1979) Proc. Nat. Acad. Sci. USA, 76

8 - Dreesman G. R., Hollinger ~. B., Surians J. R., Fujioka R. B., Brunschwig J. P. and Melnick J. L.
(1972) J. Virol. 10, 469-476
8 - Dreesman GR, Hollinger ~. B., Surians JR, Fujioka RB, Brunschwig JP and Melnick JL
(1972) J. Virol. 10, 469-476

9 - Gerin J. L. (1974) in Mecanisms of virus disease Ed. W. S. Robinson, C. R; ~'ox pp 215-24 Menlo Park :
W. A. Benjamin
9 - Gerin JL (1974) in Mecanisms of virus disease Ed. WS Robinson, C. R; ~ 'ox pp 215-24 Menlo Park:
WA Benjamin

10 - Dreesman G. R., Chairez R., Suare~ M., Hollinger F. B.
Courtney R. J. and Melnick J. L,. (1975) J. Virol. 16, 25 11 - Shih J. W. ~nd Gerin J. L. (1977) J. Virol. 21, 12 - Peterson D. L., Rober~s I. M. and Vyas G. N. (1977) Proc. Nat. Aca~. Sci. USA 74, 1 530-1 534 13 - Peterson D. L., Chien D. Y., Vyas G. N., Nitecki D.
and Bond ~. (1978~ in Viral Hepatitis, Ed. G. Vyas, S. Cohen and R. Schmid, The Franklin Institute Press, Philadelphie, 569-573 14 - Fritsch A., Pourcel C., Charnay P. and Tiollais PO
(1978) C. R. Acad. Sc. Paris 287, 1 ~53-1 456 35 15 - Burrell C. J., Maclcay P., Greenaway P. J., ~13~63 Hofschneider P. H. and Murray IC. (1979) Nature 279 43-~7 16 - Tiollais P., Perricaudet M., Pettersson U. and Philipson L. (1976) Gène 1, 49-63 5 17 - Herissé J., Courtois G., and Galibert F. (1978) Gène 4, 279~294 18 - Kroeker W. D. and Las~kowski M. S. R. (1977) Anal.
Biochem. 79, 63--72 19 - Maxam A. M. and Gilbert W. 51977) Proc. Nat. Acad.
Sci. VSA 74, 560-564 20 - Sanger F., Nicklen S. and Coulson A. R. ~1977) Proc.
Nat. Acad. Sci. USA 74, 5 463-5 467 21 - Maat J. and Smith A. J. W. (1978) Nucleic Acid. Res.
5, 4 537-~ 545 15 22 - Berget S. M., Moore C. and Sharp P. A. (1977) Proc.
Nat. acad. Sci. USA 74, 3 171-3 175 23 -Chow L. T., Gelinas Ro Eo~ Broker T. R., and Roberts J.
~1977), Cell 12, 1-~
24 - Shiraishi H., Kohama T., Shirachi R. and Ishida N.
11977) J. Gen. Virol. 36, 207-210 25 - Struck D. K., Lennarz W. J., and Brew K. (1978) J.
8iol. Chem. 253, 5 7~6-5 794 26 - Reddy V. B., Thimmappaya B., Dhar R., Subramanian K. N.
Zain B. S., Pan J., Celma C. L. and Weissman S. M.
(1978) Science 200, 494-502 27 - Fiers W., Contreras R;, Hargeman G., Rogiers R., Van de Voorde A., Van Henverswyn H., Van Herreweghe J., Volchaerts G. and Ysebaert M. (1978) Nature 273,
10 - Dreesman GR, Chairez R., Suare ~ M., Hollinger FB
Courtney RJ and Melnick J. L ,. (1975) J. Virol. 16, 25 11 - Shih JW ~ nd Gerin JL (1977) J. Virol. 21, 1,219-1,222 12 - Peterson DL, Rober ~ s IM and Vyas GN (1977) Proc. Nat. Aca ~. Sci. USA 74, 1530-1 534 13 - Peterson DL, Chien DY, Vyas GN, Nitecki D.
and Bond ~. (1978 ~ in Viral Hepatitis, Ed. G. Vyas, S. Cohen and R. Schmid, The Franklin Institute Press, Philidelphia, 569-573 14 - Fritsch A., Pourcel C., Charnay P. and Tiollais PO
(1978) CR Acad. Sc. Paris 287, 1 ~ 53-1 456 35 15 - Burrell CJ, Maclcay P., Greenaway PJ, ~ 13 ~ 63 Hofschneider PH and Murray IC. (1979) Nature 279 43- ~ 7 16 - Tiollais P., Perricaudet M., Pettersson U. and Philipson L. (1976) Gene 1, 49-63 5 17 - Herissé J., Courtois G., and Galibert F. (1978) Gene 4, 279 ~ 294 18 - Kroeker WD and Las ~ kowski MSR (1977) Anal.
Biochem. 79, 63--72 19 - Maxam AM and Gilbert W. 51977) Proc. Nat. Acad.
Sci. VSA 74, 560-564 20 - Sanger F., Nicklen S. and Coulson AR ~ 1977) Proc.
Nat. Acad. Sci. USA 74, 5 463-5 467 21 - Maat J. and Smith AJW (1978) Nucleic Acid. Res.
5, 4,537- ~ 545 15 22 - Berget SM, Moore C. and Sharp PA (1977) Proc.
Nat. Acad. Sci. USA 74, 3 171-3 175 23 -Chow LT, Gelinas Ro Eo ~ Broker TR, and Roberts J.
1977), Cell 12, 1- ~
24 - Shiraishi H., Kohama T., Shirachi R. and Ishida N.
11977) J. Gen. Virol. 36, 207-210 25 - Struck DK, Lennarz WJ, and Brew K. (1978) J.
8iol. Chem. 253, 5 7 ~ 6-5 794 26 - Reddy VB, Thimmappaya B., Dhar R., Subramanian KN
Zain BS, Pan J., Celma CL and Weissman SM
(1978) Science 200, 494-502 27 - Fiers W., Contreras R ;, Hargeman G., Rogiers R., Van de Voorde A., Van Henverswyn H., Van Herreweghe J., Volchaerts G. and Ysebaert M. (1978) Nature 273,

11~ 117 30 28 ~ Sanger F., Air ~. M., Barrell 8. G., Brown N. L., Coulson A. R., Fiddes J. C., Hutchison III C. A., Slo~e P. M. and Smith M.

(1977) Nature 265, 687-691 29 - Barrell B. G., Shaw D. C., Walker J. E., Northrop F. D., Godson G. N. and Fiddes J. C. (1978) Biochem. Soc.
Trans. 6 63-67 30 - Szmuness W., Am. J. Path. 81, 629-649 (1975) 31 - Sninsky J. J., Siddiqui A., Robinson W. S. and Cohen S. N., Nature 279, 346-348 (1979) 32 - Valenzuela P. et al., Nature 280, 815-819 (1979) 5 33 - Charnay P. et al., Nucl. Acids Res. 7, 335-346 (1979) 34 - Galibert F., Mandart E., Fitoussi F., Tiollais P.
and Charnay P., Nature 281, 646-650 (1979) 35 - Pasek M. et al., Nature 282, 575-579 (1979) 36 - Vyas G. N., Williams E. W., Klaus G. G. B. and Bond. H.
J. Immunol. 108, 1 114-1 118 (1972) 37 - Hollinger F. B., Dreesman G. R., Sanchez Y., Cabral G.
and Melnick J. L., in Viral Hepatitis (Ed. Vyas G. N.
Cohen S. N. and Schmid R.) Franklin Institute, Philadelphie, (1978) 15 38 - Purcell R. H., and Gerin J. L., Am. J. Med. Sci. 270, 395-399 (1975) 39 - Hilleman M. R. et al., Am. J. Med. Sci. 270, 401-404 (1975) 40 - Maupas P., Coursaget P., Goudeau A. and Drucker J., Lancet 1, 1 367-1 370 (1976) 41 - Emtage J. S. et al., Nature 283, 171-174 (1980) 42 - Itakura K. et al., Science 198t 1 056-1 063 (1977) 43 - Goeddel D. V. et al., Prox. Nat. Acad. Sci. USA 76, 106-110 (1979) 25 44 - Pourcel C., Mar~hal C~, Louise A., Fritsch A. and Tiollais P., Molec. Gen. ~enet. 170, 161-169 (1979) 45 - Bolivar F. et al., Gene 2, 95-113 (1977) 46 - Fowler A. V. and Zabin I., Proc. Nat. Acad. Sci. USA
74, 1 507-1 510 (1977) 30 47 - Laemmli U. K., Nature 227, 680-685 (1970) 48 - Bur~ess R. R., J. Biol. Chem. 244, 6 168-6 176 (1969) 49 - Bonner W. M. and Laskey R. A., Eur. J. Biochem. 46, 83-88 (1974) 50 - Laskey R. A. and Mills A. D., Eur. J. Biochem. 56, 335-341 (1975) I

~37~i3 51 - Iwakura Y., Ito K. and Ishihama A., Molec. Gen. Genet.
133, 1-23 ~197~) 52 - Talwai G. P., et al., Proc. Nat. Acad. Sci. USA 73, 21~-222 (1976) La presente demande est une demande divisionnaire de la demande no. serie 359,303, deposee le 29 aouût, 1980.
11 ~ 117 30 28 ~ Sanger F., Air ~. M., Barrell 8. G., Brown NL, Coulson AR, Fiddes JC, Hutchison III CA, Slo ~ e PM and Smith M.

(1977) Nature 265, 687-691 29 - Barrell BG, Shaw DC, Walker JE, Northrop FD, Godson GN and Fiddes JC (1978) Biochem. Soc.
Trans. 6 63-67 30 - Szmuness W., Am. J. Path. 81, 629-649 (1975) 31 - Sninsky JJ, Siddiqui A., Robinson WS and Cohen SN, Nature 279, 346-348 (1979) 32 - Valenzuela P. et al., Nature 280, 815-819 (1979) 5 33 - Charnay P. et al., Nucl. Acids Res. 7, 335-346 (1979) 34 - Galibert F., Mandart E., Fitoussi F., Tiollais P.
and Charnay P., Nature 281, 646-650 (1979) 35 - Pasek M. et al., Nature 282, 575-579 (1979) 36 - Vyas GN, Williams EW, Klaus GGB and Bond. H.
J. Immunol. 108, 1 114-1 118 (1972) 37 - Hollinger FB, Dreesman GR, Sanchez Y., Cabral G.
and Melnick JL, in Viral Hepatitis (Ed. Vyas GN
Cohen SN and Schmid R.) Franklin Institute, Philadelphia, (1978) 15 38 - Purcell RH, and Gerin JL, Am. J. Med. Sci. 270, 395-399 (1975) 39 - Hilleman MR et al., Am. J. Med. Sci. 270, 401-404 (1975) 40 - Maupas P., Coursaget P., Goudeau A. and Drucker J., Lancet 1, 1 367-1 370 (1976) 41 - Emtage JS et al., Nature 283, 171-174 (1980) 42 - Itakura K. et al., Science 198t 1 056-1 063 (1977) 43 - Goeddel DV et al., Prox. Nat. Acad. Sci. USA 76, 106-110 (1979) 25 44 - Pourcel C., Mar ~ hal C ~, Louise A., Fritsch A. and Tiollais P., Molec. Gen. ~ enet. 170, 161-169 (1979) 45 - Bolivar F. et al., Gene 2, 95-113 (1977) 46 - Fowler AV and Zabin I., Proc. Nat. Acad. Sci. USA
74, 1 507-1 510 (1977) 30 47 - Laemmli UK, Nature 227, 680-685 (1970) 48 - Bur ~ ess RR, J. Biol. Chem. 244, 6 168-6 176 (1969) 49 - Bonner WM and Laskey RA, Eur. J. Biochem. 46, 83-88 (1974) 50 - Laskey RA and Mills AD, Eur. J. Biochem. 56, 335-341 (1975) I

~ 37 ~ i3 51 - Iwakura Y., Ito K. and Ishihama A., Molec. Gen. Broom.
133, 1-23 ~ 197 ~) 52 - Talwai GP, et al., Proc. Nat. Acad. Sci. USA 73, 21 ~ -222 (1976) This application is a divisional application of request no. series 359.303, filed on August 29, 1980.

Claims (3)

Les réalisations de l'invention au sujet desquelles un droit exclusif de propriété ou de privilège est revendiqué, sont définies comme il suit: The embodiments of the invention about which an exclusive right of property or privilege is claimed, are defined as follows: 1. La protéine hybride susceptible d'être codée par le fragment d'ADN inséré dans le vecteur. 1. The hybrid protein capable of being coded by the DNA fragment inserted into the vector. 2. Protéine hybride selon la revendication 1 con-tenant une séquence polypeptidique présentant les propriétés immunologiques spécifiques de HBsAg, jouxtant une séquence polypeptidique constituée par la majeure partie de la .beta.-galac-tosidase. 2. Hybrid protein according to claim 1.
holding a polypeptide sequence having the properties immunologicals specific for HBsAg, adjoining a sequence polypeptide consisting of most of the .beta.-galac-tosidase.
3. Protéine hybride selon la revendication 2, caractérisée en ce que tout ou partie de la partie .beta.-galacto-sidase est remplacée par toute autre molécule porteuse non immunogène, ou dont les éventuelles propriétés immunologiques, si celles-ci existent, n'interfèrent pas avec celles de la partie peptidique présentant les propriétés immunologiques de HBsAg. 3. Hybrid protein according to claim 2, characterized in that all or part of the .beta.-galacto- part sidase is replaced by any other non-carrier molecule immunogenic, or whose possible immunological properties, if these exist, do not interfere with those of the peptide part presenting the immunological properties of HBsAg.
CA000445905A 1979-08-30 1984-01-23 Hydrid protein coded by a dna fragment Expired CA1203763A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CA000445905A CA1203763A (en) 1979-08-30 1984-01-23 Hydrid protein coded by a dna fragment

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
FR7921811A FR2464269B1 (en) 1979-08-30 1979-08-30 NUCLEOTIDE SEQUENCE ENCODING HEPATITIS B VIRUS SURFACE ANTIGEN, PROCESS FOR OBTAINING SAME AND ANTIGEN OBTAINED
FR7921811 1979-08-30
FR8009039A FR2480779B2 (en) 1979-08-30 1980-04-22 VECTOR CONTAINING A NUCLEOTIDE SEQUENCE OF THE SURFACE ANTIGEN OF HEPATITIS B VIRUS AND METHOD FOR MANUFACTURING AN IMMUNOGENIC MOLECULE USING THE SAME
FR8009039 1980-04-22
CA000359303A CA1163585A (en) 1979-08-30 1980-08-29 Nucleotidic sequence coding the surface antigen of the hepatitis b virus, carrier containing the nucleotidic sequence, preparation process and antigen so obtained
CA000445905A CA1203763A (en) 1979-08-30 1984-01-23 Hydrid protein coded by a dna fragment

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CA000359303A Division CA1163585A (en) 1979-08-30 1980-08-29 Nucleotidic sequence coding the surface antigen of the hepatitis b virus, carrier containing the nucleotidic sequence, preparation process and antigen so obtained

Publications (1)

Publication Number Publication Date
CA1203763A true CA1203763A (en) 1986-04-29

Family

ID=27166803

Family Applications (1)

Application Number Title Priority Date Filing Date
CA000445905A Expired CA1203763A (en) 1979-08-30 1984-01-23 Hydrid protein coded by a dna fragment

Country Status (1)

Country Link
CA (1) CA1203763A (en)

Similar Documents

Publication Publication Date Title
CA1163585A (en) Nucleotidic sequence coding the surface antigen of the hepatitis b virus, carrier containing the nucleotidic sequence, preparation process and antigen so obtained
EP0038765B1 (en) Vaccine against viral hepatitis b, method and transformed eucaryotic cells for the preparation of this vaccine
Valenzuela et al. The nucleotide sequence of the hepatitis B viral genome and the identification of the major viral genes
EP0934416B1 (en) Feline polynucleotide vaccine formula
EP0914442B1 (en) Avian polynucleotide vaccine formula
CA2201282C (en) Viral material and nucleotide fragments associated with multiple sclerosis useful for diagnostic, preventive and therapeutic purposes
CH646456A5 (en) METHOD FOR PRODUCING DNA COMPRISING THE GENOME OF HEPATITIS B VIRUS AND VECTOR COMPRISING SAME
JPS60193925A (en) Lyophilized pharmaceutical preparation vaccine
EP0106828B1 (en) Recombinant dna molecules encoding for hepatitis b surface antigen, their preparation and derived vaccines
EP0791063B1 (en) Carrier protein having an adjuvant effect, immunogenic complex containing same, preparation method therefor, nucleotide sequence and vaccine
EP0246291A1 (en) PURIFIED ANTIGENS HAVING VACCINATING PROPERTIES AGAINST B. PERTUSSIS, MEANS, PARTICULARLY RECOMBINANT DNAs FOR PRODUCING THEM, AND VACCINE COMPOSITIONS CONTAINING THEM
CA2311297C (en) Erythrovirus and its applications
CA1203763A (en) Hydrid protein coded by a dna fragment
FR2464269A1 (en) Nucleic acid coding for hepatitis B antigen - and corresp. peptides, vectors and hybrid proteins
FR2521165A1 (en) DNA FRAGMENTS ENCODING AN IMMUNOGENIC PEPTIDE LIKELY TO INTRODUCE IN VIVO SYNTHESIS OF ANTI-POLIOVIRUS ANTIBODIES
USRE34705E (en) Nucleotidic sequence coding the surface antigen of the hepatitis B virus, vector containing said nucleotidic sequence, process allowing the obtention thereof and antigen obtained thereby
US6096879A (en) Nucleotide sequence comprising the genome of hepatitis B virus, nucleotide sequence coding the surface antigen of the hepatitis B virus, vectors containing the nucleotide sequences, process for the preparation thereof, and antigen obtained thereby
CH666278A5 (en) Nucleic acid coding for hepatitis B antigen
FR2606281A1 (en) HEPATITIS B VIRUS ANTIGEN AND METHOD FOR THE PRODUCTION THEREOF
US6416996B1 (en) Nucleotide sequence comprising the genome of hepatitis b virus, nucleotide sequence coding the surface antigen of the hepatitis b virus, vectors containing the nucleotide sequences, process for the preparation thereof, and antigen obtained thereby
FR2661921A1 (en) PAPILLOMAVIRUS PROBE (HPV66), IN PARTICULAR FOR IN VITRO DIAGNOSIS OF PAPILLOMAVIRUS INFECTIONS, ACCOMPLISHING FOR GENITAL NEOPLASIA, GENETICALLY AND IMMUNOLOGICALLY RELATED TO THIS PAPILLOMAVIRUS.
EP0323861B1 (en) Peptides containing an immunogenic site of the polio virus of the sabin strain
JP3305342B2 (en) Method for producing hepatitis B virus protein
BE890393A (en) SYNTHETIC DEOXYRIBONUCLEIC ACID AND METHOD FOR OBTAINING SAME
FR2557457A1 (en) Method of preparing tuberculin L antigen

Legal Events

Date Code Title Description
MKEX Expiry