BE1022949A1 - Composition immunogene - Google Patents

Composition immunogene Download PDF

Info

Publication number
BE1022949A1
BE1022949A1 BE20155390A BE201505390A BE1022949A1 BE 1022949 A1 BE1022949 A1 BE 1022949A1 BE 20155390 A BE20155390 A BE 20155390A BE 201505390 A BE201505390 A BE 201505390A BE 1022949 A1 BE1022949 A1 BE 1022949A1
Authority
BE
Belgium
Prior art keywords
seq
cdtb
protein
cdta
difficile
Prior art date
Application number
BE20155390A
Other languages
English (en)
Other versions
BE1022949B1 (fr
Inventor
Cindy Castado
Original Assignee
Glaxosmithkline Biologicals Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1411306.2A external-priority patent/GB201411306D0/en
Priority claimed from GB201411371A external-priority patent/GB201411371D0/en
Application filed by Glaxosmithkline Biologicals Sa filed Critical Glaxosmithkline Biologicals Sa
Application granted granted Critical
Publication of BE1022949B1 publication Critical patent/BE1022949B1/fr
Publication of BE1022949A1 publication Critical patent/BE1022949A1/fr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/33Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Clostridium (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/02Bacterial antigens
    • A61K39/08Clostridium, e.g. Clostridium tetani
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/02Local antiseptics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55555Liposomes; Vesicles, e.g. nanoparticles; Spheres, e.g. nanospheres; Polymers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55572Lipopolysaccharides; Lipid A; Monophosphoryl lipid A
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55577Saponins; Quil A; QS21; ISCOMS
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/70Multivalent vaccine

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

La présente invention concerne des compositions Figure 1- Cytotoxicité des CDTb seules candidates sur des cellules HT29.
immunogËnes comprenant la CDTb isolée de Clostridium difficile. En particulier, la protéine CDTb isolée de Clostridium difficile a été mutée pour modifier la capacité de former des pores, pour modifier la capacité d'heptamèrisation, ou est une protéine CDTb tronquée avec le peptide signal et le prodomaine éliminés et également le domaine de liaison aux récepteurs éliminé et/ou le domaine de liaison t la CDTa éliminé. L'invention concerne également des protéines de fusion comprenant une protéine CDTa et une protéine CDTb. Des vaccins comprenant de telles compositions immunogËnes et leurs utilisations thérapeutiques forment également une partie de l'invention.

Description

COMPOSITION IMMUNOGENE
Contexte
Clostridium difficile (C. difficile) est la cause la plus importante des infections intestinales nosocomiales et est la cause majeure de la colite pseudomembraneuse chez les êtres humains (Bartlett et al., Am. J. Clin. Nutr. 11 suppl: 2521-6 (1980)) . Le taux de mortalité global associé pour les individus infectés par C. difficile a été calculé comme étant de 5,99 % dans les 3 mois du diagnostic, avec une mortalité supérieure associée à un âge avancé, de 13,5 % chez les patients âgés de plus de 80 ans (Karas et al., Journal of Infection 561: 1-9 (2010)) . Le traitement actuel pour une infection à C. difficile est l'administration d'antibiotiques (métronidazole et vancomycine) ; toutefois, il a été mis en évidence des souches qui sont résistantes à ces antibiotiques (Shah et al., Expert Rev. Anti Infect. Ther. 8(5), 555-564 (2010)). Par conséquent, il existe un besoin de compositions immunogènes capables d'induire des anticorps contre, et/ou une réponse immunitaire protectrice contre, C. difficile. L'entérotoxicité de C. difficile est principalement due à l'action de deux toxines, la toxine A et la toxine B. Ce sont toutes les deux des cytotoxines puissantes (Lyerly et al., Current Microbiology 21: 29-32 (1990).
Il a été démontré que des fragments de la toxine A, en particulier des fragments du domaine C-terminal, peuvent mener à une réponse immunitaire protectrice chez des hamsters (Lyerly et al, Current Microbiology 21: 29-32 (1990)), WO 96/12802 et WO 00/61762.
Certaines souches, mais pas toutes, expriment également la toxine binaire de Clostridium difficile (CDT). Similaire à de nombreuses autres toxines binaires, la CDT est composée de deux composants - un composant actif du point de vue enzymatique (« toxine binaire A » ou « CDTa ») et un composant de transport et de liaison inerte du point de vue catalytique (« toxine binaire B » ou « CDTb ») . Le composant inerte du point de vue catalytique facilite la translocation de la CDTa dans la cellule cible.
La CDTa est dotée d'une activité ADP-ribosylante, qui transfère le radical ADP-ribose du NAD/NADPH à l'actine monomère (actine G) dans la cellule cible et empêchant ainsi sa polymérisation en actine F et entraînant la rupture du cytosquelette et la mort éventuelle de la cellule (Sundriyal et al., Protein expression and Purification 74 (2010) 42-48).
Le document WO 2013/112867 (Merck) décrit des vaccins dirigés contre Clostridium difficile comprenant des protéines recombinantes de toxine A, toxine B et CDTa de C. difficile, comprenant toutes des mutations définies spécifiquement par rapport aux séquences natives des toxines qui sont décrites comme réduisant ou éliminant substantiellement la toxicité, en combinaison avec la toxine binaire B (CDTb).
Les présents inventeurs ont découvert que les protéines CDTb comprenant des mutations conçues pour modifier la capacité de former des pores de la CDTb ou pour modifier la capacité d'heptamérisation de la CDTb présentent des caractéristiques améliorées. Résumé de 1'invention
Dans un premier aspect de l'invention, il est proposé une composition immunogène comprenant une protéine CDTb isolée de Clostridium difficile, où la protéine CDTb isolée de Clostridium difficile a été mutée pour modifier la capacité de former des pores.
Dans un deuxième aspect de l'invention, il est proposé une composition immunogène comprenant une protéine CDTb isolée de Clostridium difficile qui est une protéine CDTb tronquée avec le peptide signal et le prodomaine éliminés et également le domaine de liaison au récepteur éliminé et/ou le domaine de liaison à la CDTa éliminé.
Dans un troisième aspect de l'invention, il est proposé une composition immunogène comprenant une protéine CDTb de Clostridium difficile, où la protéine CDTb isolée de Clostridium difficile a été mutée pour modifier la capacité d'heptamérisation.
Dans un quatrième aspect de l'invention, il est proposé une composition immunogène comprenant une protéine de fusion comprenant une protéine CDTa pleine longueur et une protéine CDTb.
Dans un cinquième aspect, la présente invention propose un vaccin comprenant la composition immunogène de l'un quelconque des quatre premiers aspects et un excipient pharmaceutiquement acceptable.
Dans un sixième aspect, la présente invention propose la composition immunogène de l'un quelconque des quatre premiers aspects ou le vaccin du cinquième aspect, pour une utilisation dans le traitement ou la prévention d'une maladie, par exemple d'une maladie à C. difficile.
Dans un septième aspect, la présente invention propose l'utilisation de la composition immunogène de l'un quelconque des quatre premiers aspects ou du vaccin du cinquième aspect dans la préparation d'un médicament destiné à la prévention ou au traitement d'une maladie, par exemple d'une maladie à C. difficile.
Dans un huitième aspect, la présente invention propose un procédé de prévention ou de traitement d'une maladie à C. difficile comprenant l'administration d'une composition immunogène de l'un quelconque des quatre premiers aspects ou du vaccin du cinquième aspect à un sujet mammifère.
Dans un neuvième aspect, la présente invention propose de nouveaux polypeptides et nucléotides tels que définis ici.
Dans un autre aspect, la présente invention propose un procédé pour le traitement ou la prévention d'une affection ou d'une maladie provoquée en totalité ou en partie par C. difficile. Le procédé comprend l'administration à un sujet en ayant besoin d'une quantité thérapeutiquement efficace des protéines telles que décrites ici, de la composition immunogène de l'invention ou des vaccins de l'invention.
BREVE DESCRIPTION DES DESSINS
Figure 1 - Cytotoxicité de CDTb candidates seules sur des cellules HT29 : données de l'exemple 7. Les C37, C123, C124, C126 et C128 auxquelles il est fait référence sur la figure 1 sont les protéines CDTb telles que décrites dans les exemples 2, 4 et 6, dont les séquences sont présentées dans le résumé des séquences (tableau A) .
Figure 2 - Cytotoxicité de CDTb candidates mélangées avec de la CDTa entière sur des cellules HT29 : données de l'exemple 7. Les C37, C123, C124, C126 et C128 auxquelles il est fait référence sur la figure 1 sont les protéines CDTb telles que décrites dans les exemples 2, 4 et 6, dont les séquences sont présentées dans le résumé des séquences (tableau A). La « CDTa entière » est la protéine CDTa C34 dont la séquence est présentée dans le résumé des séquences (tableau A).
Figure 3 - Mesures de la diffusion dynamique de la lumière du rayon hydrodynamique des constructions de CDTb KO pour la formation de pores C123, C126 et de la construction de CDTb KO pour 1'heptamérisation C128. Le rayon moyen donne une indication de l'homogénéité de l'échantillon, alors que le pic du rayon 1 est une estimation du rayon hydrodynamique de la protéine d'intérêt.
Figure 4 - Diagramme montrant une immunogénicité anti-CDTb chez des souris immunisées avec la CDTa de C. difficile ou.la CDTb de C. difficile, formulée dans les deux cas avec un adjuvant.
Figure 5 - Diagramme montrant une immunogénicité anti-CDTa chez des souris immunisées avec la CDTa de C. difficile ou la CDTb de C. difficile, formulée dans les deux cas avec un adjuvant.
Figure 6 - Titres d'inhibition de la cytotoxicité dans des cellules HCT116 provenant de souris immunisées avec la CDTa de C. difficile ou la CDTb de C. difficile, formulée dans les deux cas avec un adjuvant.
Figure 7 - Titres d'inhibition de la cytotoxicité dans des cellules HT29 provenant de souris immunisées avec la CDTa de C. difficile ou la CDTb de C. difficile, formulée dans les deux cas avec un adjuvant.
Figure 8 - Cytotoxicité de CDTb candidates seules (figure 8a) ou mélangées avec la CDTa entière (figure 8b) sur des cellules HT29 : données provenant de l'exemple 7. Les C37, C123, C124, C126 et C128 sont les protéines CDTb telles que décrites dans les exemples 2, 4 et 6, dont les séquences sont présentées dans le résumé des séquences (tableau A). La « CDTa entière » est la protéine CDTa C34 dont la séquence présentée dans le résumé des séquences (tableau A) . Les C149, C152, C164, C166, C116, C117 sont les protéines CDTb telles que décrites dans les exemples 4 et 5 .
Figure 9 - Cytotoxicité de CDTb candidates seules (figure 9a) ou mélangées avec la CDTa entière (figure 9b) sur des cellules HCT116 (telles que décrites dans l'exemple 12).
Figure 10 - Cytotoxicité de protéines de fusion CDTa-CDTb mélangées avec la CDTa entière activée sur des cellules HT29 (telles que décrites dans l'exemple 13).
Figure 11 - Cytotoxicité de protéines de fusion CDTa-CDTb mélangées avec la CDTb entière sur des cellules HT29 (telles que décrites dans l'exemple 13).
Figure 12 - Diagramme montrant l'immunogénicité anti-CDTa chez des souris immunisées avec des protéines CDTb ou des fusions CDTa-CDTb (voir l'exemple 14).
Figure 13 - Diagramme montrant l'immunogénicité anti-CDTb chez des souris immunisées avec des protéines CDTb ou des fusions CDTa-CDTb (voir l'exemple 14).
Figure 14 - Titres d'inhibition de la cytotoxicité dans des cellules HT29 et HCT116, des souris immunisées avec des protéines CDTb ou des fusions CDTa-CDTb (voir l'exemple 15).
Description détaillée
La toxine binaire de Clostridium difficile comprend deux protéines différentes, CDTa et CDTb. La CDTa comprend deux domaines, le domaine C-terminal qui est responsable de l'activité ADP-ribosyl-transférase alors que le domaine N-terminal est responsable de l'interaction avec la CDTb.
Durant une infection, la CDTb est activée par un clivage protéolytique avec une protéase de type chymotrypsine pour produire une protéine CDTb à laquelle il manque le prodomaine (qualifiée de CDTb"). Veuillez noter qu'il manque également à la CDTb" la séquence signal de la CDTb. Une protéine CDTb à laquelle il manque la séquence signal mais à laquelle il ne manque pas le prodomaine est qualifiée de CDTb'. Après l'activation protéolytique, la CDTb s'oligomérise et se lie à la CDTa pour former la toxine binaire complète de C. difficile (CDT) . La liaison de la toxine binaire aux récepteurs cellulaires mène à l'endocytose médiée par les récepteurs. Lorsque l'endosome s'acidifie, le domaine de liaison de la CDTb subit des changements conformationnels qui permettent à l'oligomère de la CDTb de former un pore, la formation des pores déclenche la translocation du domaine de 1'ADP-ribosyl-transférase (CDTa) dans la cellule cible.
Dans un aspect, la présente invention propose une composition immunogène comprenant une protéine CDTb isolée de Clostridium difficile qui a été mutée pour modifier la capacité de formation des pores.
Le terme « protéine CDTb qui a été mutée pour modifier la capacité de formation des pores » se rapporte à une protéine CDTb qui a été mutée pour modifier la capacité de la protéine CDTb à former un pore.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile a été mutée pour réduire la capacité de formation des pores.
La capacité de formation des pores peut être analysée selon les procédés décrits dans The J. of Biol. Chem. 2001, vol. 276 : 8371-8376, PNAS 2004, vol. 101 : 16756-16761, ou The J. of Biol. Chem. 2008, vol. 283 : 3904-3914
Dans cet aspect, la protéine CDTb isolée de Clostridium difficile peut avoir été mutée pour éviter la formation de la structure en tonneau bêta qui est composée de brins bêta partagés par chacun des monomères de la CDTb contenus dans l'heptamère qui se forme lors de 1 ' oligomérisation de la CDTb. Dans cet aspect, la protéine CDTb peut être une protéine CDTb tronquée avec le peptide signal éliminé. Dans cet aspect, la protéine CDTb peut être une protéine CDTb tronquée avec le peptide signal éliminé et le prodomaine éliminé.
Le terme « protéine CDTb tronquée avec le peptide signal éliminé » se rapporte à une protéine CDTb avec essentiellement la totalité du peptide signal éliminé (par conséquent qui ne comprend pas les acides aminés correspondant à essentiellement la totalité du peptide signal). Par exemple, le terme « protéine CDTb tronquée avec le peptide signal éliminé » se rapporte à une protéine CDTb avec au moins 25 des acides aminés du peptide signal éliminés. Il peut rester quelques acides aminés du peptide signal. Par exemple, 2, 5, 10, 15 ou 20 acides aminés du peptide signal peuvent demeurer.
Le terme « protéine CDTb tronquée avec le peptide signal éliminé et le prodomaine éliminé » se rapporte à une protéine CDTb avec essentiellement la totalité du peptide signal et du prodomaine éliminés (par conséquent qui ne comprend pas les acides aminés correspondant à essentiellement la totalité du peptide signal et essentiellement la totalité du prodomaine). Par exemple, le terme « protéine CDTb tronquée avec le peptide signal éliminé et le prodomaine éliminé » se rapporte à une protéine CDTb avec la totalité du peptide signal éliminé et au moins 85 des acides aminés du prodomaine éliminés. Il peut rester quelques acides aminés du peptide signal et/ou du prodomaine. Par exemple, 2, 5, 10, 15 ou 20 acides aminés du peptide signal peuvent demeurer. Par exemple, 2, 5, 10, 15 ou 20 acides aminés du prodomaine peuvent demeurer. Le peptide signal de la CDTb correspond aux acides aminés 1 à 48 (englobant les acides aminés 1 à 42) de SEQ ID NO : 3 ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile, par exemple les acides aminés 1 à 42 de la séquence d'acides aminés de la CDTb provenant de la souche CD196 (Perelle, M. et al., Infect. Immun., 65 (1997), pp. 1402-1407). Le prodomaine de la CDTb correspond aux acides aminés 48 à 211 (englobant les acides aminés 48 à 166) de SEQ ID NO : 3 ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile comprend une mutation au niveau de la position 455 de SEQ ID NO : 3 ou son équivalent dans une souche différente de C. difficile. Dans un autre mode de réalisation de cet aspect, la protéine CDTb isolée de Clostridium difficile comprend une mutation au niveau de la position 426 de SEQ ID NO : 3 ou son équivalent dans une souche différente de C. difficile. Dans un autre mode de réalisation de cet aspect, la protéine CDTb isolée de Clostridium difficile comprend une mutation au niveau de la position 453 de SEQ ID NO : 3 ou son équivalent dans une souche différente de C. difficile. Dans un autre mode de réalisation de cet aspect, la protéine CDTb isolée de Clostridium difficile comprend une mutation au niveau de la position 426 et une mutation au niveau de la position 453 de SEQ ID NO : 3 ou son équivalent dans une souche différente de C. difficile.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile comprend au moins une mutation choisie dans le groupe constitué de F455R, F455G, E426A et D453A. « F455R » signifie que la phénylalanine (F) au niveau de la position 455 de la séquence de la CDTb dans SEQ ID NO : 3 est mutée en arginine (R). « F455G » signifie que la phénylalanine (F) au niveau de la position 455 de la séquence de la CDTb dans SEQ ID NO : 3 est mutée en glycine (G). « E426A » signifie que le glutamate (E) au niveau de la position 426 de la séquence de la CDTb dans SEQ ID NO : 3 est muté en alanine (A) . « D453A » signifie que l'aspartate (D) au niveau de la position 453 de la séquence de la CDTb dans SEQ ID NO : 3 est muté en alanine (A). Dans un mode de réalisation de cet aspect, la protéine CDTb isolée de Clostridium difficile comprend la mutation F455R ou son équivalent dans une souche différente de C. difficile. Dans un mode de réalisation de cet aspect, la protéine CDTb isolée de Clostridium difficile comprend la mutation F455G ou son équivalent dans une souche différente de C. difficile. Dans un mode de réalisation de cet aspect, la protéine CDTb isolée de Clostridium difficile comprend les mutations E426A et D453A ou leurs équivalents dans une souche différente de C. difficile.
Dans un mode de réalisation, la protéine CDTb isolée de
Clostridium difficile est ou comprend (i) SEQ ID NO : 10 ou SEQ ID NO : 11 ou SEQ ID NO : 25 ou SEQ ID NO : 26 ; ou (ii) un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100% d'identité de séquence avec SEQ ID NO : 10 ou SEQ ID NO : 11 ou SEQ ID NO : 25 ou SEQ ID NO : 26 ; ou (iii) un fragment de la CDTb comportant au moins 30, 50, 80,
100, 120, 150, 200, 250 ou 300 acides aminés consécutifs de SEQ ID NO : 10 ou SEQ ID NO : 11 ou SEQ ID NO : 25 ou SEQ ID NO : 26.
Dans un mode de réalisation, la protéine CDTb isolée de
Clostridium difficile est ou comprend (i) SEQ ID NO : 43 ou SEQ ID NO : 44 ; ou (ii) un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 43 ou SEQ ID NO : 44 ; ou (iii) un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250 ou 300 acides aminés consécutifs de SEQ ID NO : 43 ou SEQ ID NO : 44.
Dans un tel aspect, il est proposé une composition immunogène dans laquelle la protéine CDTb isolée de Clostridium difficile est un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 10 ou SEQ ID NO : 11 ou SEQ ID NO : 25 ou SEQ ID NO : 26.
Dans un tel aspect, il est proposé une composition immunogène dans laquelle la protéine CDTb isolée de Clostridium difficile est un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 43 ou SEQ ID NO : 44.
Dans un autre aspect, il est proposé une composition immunogène dans laquelle la protéine CDTb isolée de Clostridium difficile est un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 ou 850 acides aminés consécutifs de SEQ ID NO : 10 ou SEQ ID NO : 11 ou SEQ ID NO : 25 ou SEQ ID NO : 26.
Dans un autre aspect, il est proposé une composition immunogène dans laquelle la protéine CDTb isolée de Clostridium difficile est un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600 ou 650 acides aminés consécutifs de SEQ ID NO : 43 ou SEQ ID NO : 44.
La présente invention propose également une composition immunogène comprenant une protéine CDTb isolée de Clostridium difficile qui est une protéine CDTb tronquée avec le peptide signal et le prodomaine éliminés et également le domaine de liaison aux récepteurs éliminé et/ou le domaine de liaison à la CDTa éliminé.
Le terme « protéine CDTb tronquée avec le peptide signal et le prodomaine éliminés et également le domaine de liaison aux récepteurs et/ou' le domaine de liaison à la CDTa éliminés » signifie une protéine CDTb tronquée avec le peptide signal et le prodomaine éliminés, dans laquelle également le domaine de liaison aux récepteurs et/ou le domaine de liaison à la CDTa ont été éliminés. Il se rapporte à SEQ ID NO : 3 ou à un fragment ou variant de celle-ci avec essentiellement la totalité du peptide signal et du prodomaine éliminés (par conséquent, qui ne comprend pas les acides aminés correspondant à essentiellement la totalité du peptide signal et essentiellement la totalité du prodomaine) et aussi essentiellement la totalité du domaine de liaison aux récepteurs éliminé et/ou essentiellement la totalité du domaine de liaison à la CDTa éliminé (par conséquent, qui ne comprend pas les acides aminés correspondant à essentiellement la totalité du domaine de liaison aux récepteurs et/ou qui ne comprend pas les acides aminés correspondant à essentiellement la totalité du domaine de liaison à la CDTa) . Par exemple, le terme « protéine CDTb tronquée avec le peptide signal éliminé et le prodomaine éliminé » se rapporte à une protéine CDTb avec la totalité du peptide signal éliminé et au moins 85 des acides aminés du prodomaine éliminés. Il peut rester quelques acides aminés du peptide signal, du prodomaine, du domaine de liaison aux récepteurs ou du domaine de liaison à la CDTa. Par exemple, 2, 5, 10, 15 ou 20 acides aminés du peptide signal peuvent demeurer. Par exemple, 2, 5, 10, 15 ou 20 acides aminés du prodomaine peuvent demeurer. Par exemple, 2, 5, 10, 15 ou 20 acides aminés du domaine de liaison aux récepteurs peuvent demeurer. Par exemple, 2, 5, 10, 15 ou 20 acides aminés du domaine de liaison à la CDTa peuvent demeurer.
Le peptide signal de la CDTb correspond aux acides aminés 1 à 48 (englobant les acides aminés 1 à 42) de SEQ ID NO : 3 ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile, par exemple, les acides aminés 1 à 42 de la séquence d'acides aminés de la CDTb provenant de la souche CD196 (Perelle, M. et al., Infect. Immun., 65 (1997), pp. 1402-1407).
Le prodomaine de la CDTb correspond aux acides aminés 48 à 211 (englobant les acides aminés 48 à 166) de SEQ ID NO : 3 ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile.
Dans un mode de réalisation, le domaine de liaison aux récepteurs ' de la CDTb correspond aux acides aminés 620 à 87 6 de SEQ ID NO : 3, ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile. Dans un autre mode de réalisation, le domaine de liaison aux récepteurs correspond aux acides aminés 636 à 876 de SEQ ID NO : 3 ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile.
Le domaine de liaison à la CDTa de la CDTb correspond aux acides aminés 212 à 296 de SEQ ID NO : 3 ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile.
Dans un mode de réalisation de cet aspect, la composition immunogène comprend une protéine CDTb isolée de Clostridium difficile qui est une protéine CDTb tronquée avec le peptide signal et le prodomaine éliminés et également soit le domaine de liaison aux récepteurs éliminé soit le domaine de liaison à la CDTa éliminé.
Dans un autre mode de réalisation de cet aspect, la composition immunogène comprend une protéine CDTb isolée de Clostridium difficile qui est une protéine CDTb tronquée avec le peptide signal et le prodomaine éliminés et également le domaine de liaison aux récepteurs éliminé et le domaine de liaison à la CDTa éliminé.
De façon appropriée, la protéine CDTb isolée de Clostridium difficile est ou comprend (i) SEQ ID NO : 8 ou SEQ ID NO : 9 ou SEQ ID NO : 37 ; (ii) un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 8 ou SEQ ID NO : 9 ou SEQ ID NO : 37 ; ou (iii) un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750 ou 800 acides aminés consécutifs de SEQ ID NO : 8 ou SEQ ID NO : 9 ou SEQ ID NO : 37.
De façon appropriée, la protéine CDTb isolée de Clostridium difficile est ou comprend (i) SEQ ID NO : 8 ou SEQ ID NO : 9 ou SEQ ID NO : 37 ; (ii) un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 8 ou SEQ ID NO : 9 ou SEQ ID NO : 37 ; ou (iii) un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350 ou 400 acides aminés consécutifs de SEQ ID NO : 8 ou au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500 ou, 550 acides aminés consécutifs de SEQ ID NO : 9 ou au moins 30, 50, 80, 100, 120, 150, 200, 250 ou 300 acides aminés consécutifs de SEQ ID NO : 37.
Dans un tel aspect, il est proposé une composition immunogène dans laquelle la protéine CDTb isolée de Clostridium difficile est un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 8 ou SEQ ID NO : 9 ou SEQ ID NO : 37.
Dans un autre aspect, il est proposé une composition immunogène dans laquelle la protéine CDTb isolée de Clostridium difficile est un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550 acides aminés consécutifs de SEQ ID NO : 8 ou SEQ ID NO : 9 ou SEQ ID NO : 37.
Dans un troisième aspect de l'invention, il est proposé une composition immunogène comprenant une protéine CDTb isolée de Clostridium difficile où la protéine CDTb isolée de Clostridium difficile a été mutée pour modifier la capacité d'heptamérisation.
La protéine CDTb qui a été mutée pour modifier la capacité d'heptamérisation signifie que la protéine CDTb a été mutée pour modifier sa capacité à s'auto-assembler en un repliement heptamère. Cette heptamérisation est permise par le partage des brins bêta provenant de chaque monomère de la CDTb afin de former une structure en tonneau bêta. Dans cet aspect, la protéine CDTb peut être une protéine CDTb tronquée avec le peptide signal éliminé. Dans cet aspect, la protéine CDTb peut être une protéine CDTb tronquée avec le peptide signal éliminé et le prodomaine éliminé.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile a été mutée pour réduire la capacité d'heptamérisation.
La capacité de la protéine CDTb à s ' heptamériser peut être mesurée en utilisant une technique telle que la diffusion dynamique de la lumière (DLS) . La DLS peut être utilisée pour évaluer le rayon hydrodynamique en solution des protéines CDTb purifiées, en plus de fournir des informations sur l'homogénéité et pour détecter la présence d'agrégats de poids moléculaire élevé (comme les heptamères) au sein d'un échantillon de protéines. Ceci est basé sur le calcul du coefficient de diffusion des différentes espèces qui sont obtenues en mesurant la fluctuation de la diffusion de la lumière, qui dépend de la taille moléculaire et de la forme des protéines, et des autres constituants mineurs de l'échantillon.
En se basant sur une analyse profonde d'un modèle structural tridimensionnel obtenu pour la CDTb, une boucle dans le domaine d'oligomérisation peut être potentiellement impliquée dans 1 ' heptamérisation de la CDTb. Dans cette boucle, il a été identifié quatre acides aminés présentant des interactions électrostatiques potentielles avec des acides aminés contenus dans d'autres monomères de la CDTb heptamère. Ces résidus sont Asp537, Glu539, Asp540 et Lys541 de SEQ ID NO : 3.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile comprend au moins une mutation et/ou une troncature dans le domaine d'oligomérisation qui modifie la capacité d'heptamérisation.
Le domaine d'oligomérisation correspond aux acides aminés 297 à 619 de SEQ ID NO : 3, ou leurs équivalents dans une protéine CDTb isolée d'une souche différente de C. difficile.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile comprend au moins une mutation et/ou une troncature dans la région de la CDTb comprenant les acides aminés 533 à 542 de SEQ ID NO : 3 ou dans la région équivalente dans une souche différente de C. difficile.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile comprend au moins une mutation au niveau de Asp537, Glu539, Asp540 et Lys541 de SEQ ID NO : 3 ou leurs équivalents dans une souche différente de C. difficile. Dans un mode de réalisation, de façon appropriée l'un quelconque ou plusieurs de Asp537, Glu539, Asp540 et/ou Lys541 est/sont muté (s) en Gly ou un autre petit résidu.
Dans un autre mode de réalisation, le domaine d'oligomérisation est tronqué. Par exemple, les acides aminés 533 à 542 de SEQ ID NO : 3, ou leurs équivalents dans une protéine CDTb isolée d'une souche différente de C. difficile, peuvent être délétés et éventuellement remplacés par d'autres résidus, par exemple par 3, 4, 5 résidus Gly et/ou Ala ou plus. Dans un mode de réalisation, les acides aminés 533 à 542 de SEQ ID NO : 3, ou leurs équivalents dans une protéine CDTb isolée d'une souche différente de C. difficile, peuvent être délétés et éventuellement remplacés par 3 résidus Gly ou 3 résidus Ala.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile comprend des mutations dans quatre acides aminés. Par exemple, la protéine CDTb comprend la mutation D537G-E539G-D540G-K541G ou leurs équivalents dans une souche différente de C. difficile. « D537G » signifie que l'aspartate au niveau de la position 537 de la séquence de la CDTb dans SEQ ID NO : 3 est muté en glycine. « E539G » signifie que le glutamate au niveau de la position 539 de la séquence de la CDTb dans SEQ ID NO : 3 est muté en glycine. « D540G » signifie que l'aspartate au niveau de la position 540 de la séquence de la CDTb dans SEQ ID NO : 3 est muté en glycine. « K541G » signifie que la lysine au niveau de la position 541 de la séquence de la CDTb dans SEQ ID NO : 3 est mutée en glycine.
Dans un autre mode de réalisation de cet aspect, la protéine CDTb isolée de Clostridium difficile comprend une mutation dans laquelle les acides aminés 533 à 542 de SEQ ID NO : 3, ou leurs équivalents dans une protéine CDTb isolée d'une souche différente de C. difficile, sont remplacés par 3 résidus Gly.
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile est ou comprend (i) SEQ ID NO : 12 ou SEQ ID NO : 13 ; ou (ii) un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 12 ou SEQ ID NO : 13 ; ou (iii) un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 ou 850 acides aminés consécutifs de SEQ ID NO : 12 ou SEQ ID NO : 13.
Dans un tel aspect, il est proposé une composition immunogène dans laquelle la protéine CDTb isolée de Clostridium difficile est un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 12 ou SEQ ID NO : 13.
Dans un autre aspect, il est proposé une composition immunogène dans laquelle la protéine CDTb isolée de Clostridium difficile est un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 ou 850 acides aminés consécutifs de SEQ ID NO : 12 ou SEQ ID NO : 13.
Les protéines CDTb et CDTa varient dans la séquence d'acides aminés entre les différentes souches, pour cette raison la numérotation des acides aminés peut différer entre les souches. Pour cette raison, le terme « équivalents dans une souche différente » se rapporte aux acides aminés qui correspondent à ceux d'une souche de référence (par exemple, C. difficile R20291 à partir de laquelle SEQ ID NO : 1 et SEQ ID NO : 3 sont dérivées), mais qui sont trouvés dans une toxine provenant d'une souche différente et qui peuvent être ainsi numérotés différemment. Une région d'acides aminés « équivalents » peut être déterminée par l'alignement des séquences des toxines provenant des souches différentes. Les exemples de souches de C. difficile produisant des toxines binaires comprennent CD196, CCUG 20309, R8637, IS81, IS93, IS51, IS58, R6786, R7605, R10456 et R5989. Sauf indication contraire, les numéros des acides aminés fournis ici se rapportent à ceux de la souche de référence R20291, telle que représentée par SEQ ID NO : 1 (CDTa) et SEQ ID NO : 3 (CDTb).
Dans un mode de réalisation, la protéine CDTb isolée de Clostridium difficile est un monomère de CDTb. Dans un autre mode de réalisation, la protéine CDTb isolée de Clostridium difficile est un multimère de CDTb. Dans un autre mode de réalisation, la protéine CDTb isolée de Clostridium difficile est un heptamère de CDTb.
Dans un mode de réalisation, la composition immunogène ne comprend pas/ne comprend pas en outre une protéine CDTa isolée de Clostridium difficile.
La présente invention propose une composition immunogène comprenant une protéine CDTb isolée de Clostridium difficile comme seul antigène de C. difficile. Tel qu'utilisé ici, le terme « comme seul antigène de C. difficile » signifie que la composition immunogène ne comprend pas également un autre antigène provenant de C. difficile, par exemple une composition immunogène ne comprenant pas également une protéine de toxine A, toxine B ou CDTa.
Dans un mode de réalisation, la composition immunogène comprend/comprend en outre une protéine CDTa isolée de Clostridium difficile.
De façon appropriée, la protéine CDTa isolée de Clostridium difficile est une protéine CDTa tronquée. « Une protéine CDTa tronquée » telle qu'utilisée ici signifie une protéine CDTa qui n'atteint pas sa pleine longueur ou sa forme correcte, et ainsi à laquelle il manque certains des résidus d'acides aminés qui sont présents dans la CDTa pleine longueur de SEQ ID NO : 1 ou un équivalent dans une souche différente, et qui ne peut pas effectuer la fonction pour laquelle elle a été prévue parce que sa structure en est incapable, par exemple l'activité ADP-ribosyl-transférase et/ou l'interaction avec la CDTb. Un dosage approprié de l'activité ADP-ribosyl-transférase est décrit dans PLOS pathogens 2009, vol 5(10) : el000626.
De façon appropriée, la protéine CDTa isolée de Clostridium difficile est une protéine CDTa tronquée qui ne comprend pas le domaine C-terminal. Le terme « protéine CDTa tronquée qui ne comprend pas le domaine C-terminal » se rapporte à un fragment ou un variant de SEQ ID NO : 1 qui ne comprend pas une partie substantielle du domaine C-terminal, il peut rester quelques acides aminés du domaine C-terminal, par exemple, 2, 5, 10, 15, 20, 25, 30, 35 ou 50 acides aminés du domaine C-terminal peuvent demeurer. Le domaine C-terminal correspond aux acides aminés 269 à 463 de SEQ ID NO : 1 ou leurs équivalents dans une protéine CDTa isolée d'une souche différente de C. difficile. Dans ce mode de réalisation, la protéine CDTa tronquée de Clostridium difficile est ou comprend de façon appropriée (i) SEQ ID NO : 18 ou SEQ ID NO : 19 ; (i) un variant de la CDTa présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 18 ou SEQ ID NO : 19 ; ou (iii) un fragment de la CDTa comportant au moins 30, 50, 80, 100, 120, 150, ou 190 acides aminés consécutifs de SEQ ID NO : 18 ou SEQ ID NO : 19.
Dans un mode de réalisation, la protéine CDTa tronquée qui ne comprend pas le domaine C-terminal est un variant de la CDTa présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 20. Dans un autre mode de réalisation, la protéine CDTa tronquée qui ne comprend pas le domaine C-terminal est un variant de la CDTa comportant au moins 30, 50, 80, 100, 120, 150, ou 190 acides aminés consécutifs de SEQ ID NO : 20.
Dans un autre mode de réalisation de l'un quelconque des aspects de l'invention, la protéine CDTa isolée de Clostridium difficile contient de façon appropriée une mutation qui réduit son activité ADP-ribosyl-transférase. Par exemple, la protéine CDTa isolée de Clostridium difficile comporte une mutation de glutamate en un autre acide aminé au niveau de la position 428 de SEQ ID NO : 1 ou une mutation équivalente dans une autre souche de C. difficile. Le terme « comporte une mutation au niveau de la position 428 » se rapporte à des protéines CDTa qui comportent une mutation au niveau de cet emplacement exact mais également à une protéine CDTa qui est isolée d'une souche différente et qui comporte une mutation au niveau d'une position équivalente. La protéine CDTa varie dans la séquence des acides aminés entre les différentes souches, pour cette raison la numérotation des acides aminés peut différer entre les souches, ainsi une protéine CDTa provenant d'une souche différente peut comporter un glutamate correspondant qui n'est pas le numéro 428 dans la séquence. Dans un mode de réalisation, la protéine CDTa isolée de Clostridium difficile comporte une mutation de glutamate en glutamine au niveau de la position 428 de SEQ ID NO : 1.
Dans un autre mode de réalisation de l'un quelconque des aspects de l'invention, la protéine CDTa isolée de Clostridium difficile comporte de façon appropriée une mutation de glutamate en un acide aminé différent au niveau de la position 430 de SEQ ID NO : 1 ou une mutation équivalente dans une autre souche de C. difficile. Le terme « comporte une mutation au niveau de la position 430 » se rapporte à des protéines qui comportent cet emplacement exact mais également à une protéine CDTa qui est isolée d'une souche différente et qui comporte une mutation au niveau d'une position équivalente. Dans un mode de réalisation, la protéine CDTa isolée de Clostridium difficile comporte une mutation de glutamate en glutamine au niveau de la position 430 de SEQ ID NO : 1.
Dans un autre mode de réalisation de l'un quelconque des aspects de l'invention, la protéine CDTa isolée de Clostridium difficile est ou comprend de façon appropriée (i) SEQ ID NO : 21 ; SEQ ID NO : 22 ; SEQ ID NO : 23 ; ou SEQ ID NO : 24 ; ou (ii) un variant de la CDTa présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 21 ; SEQ ID NO : 22 ; SEQ ID NO : 23 ; ou SEQ ID NO : 24 ; ou (iii) un fragment de la CDTa comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350 ou 400 acides aminés consécutifs de SEQ ID NO : 21 ; SEQ ID NO : 22 ; SEQ ID NO : 23 ; ou SEQ ID NO : 24.
Dans un autre mode de réalisation de l'un quelconque des aspects de l'invention, la protéine CDTa isolée de Clostridium difficile est ou comprend de façon appropriée (i) SEQ ID NO : 22 ; ou (ii) un variant de la CDTa présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 22 ; ou (iii) un fragment de la CDTa comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350 ou 400 acides aminés consécutifs de SEQ ID NO : 22.
Protéines de fusion comprenant une protéine CDTa et une protéine CDTb
Dans un autre aspect, l'invention propose des compositions immunogènes comprenant une protéine de fusion comprenant une protéine CDTa pleine longueur et une protéine CDTb. Dans cet aspect, « CDTa pleine longueur » signifie la CDTa pleine longueur de SEQ ID NO : 36 ou l'équivalent dans une autre souche de C. difficile, ou un variant de CDTa présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 36
Un « polypeptide de fusion » ou une « protéine de fusion » se rapporte à une protéine comportant au moins deux polypeptides hétérologues (par exemple, au moins deux polypeptides de Clostridium difficile) liés de façon covalente, soit directement soit par l'intermédiaire d'un lieur (« linker ») d'acides aminés. Cela peut également se rapporter à une protéine comportant au moins deux polypeptides hétérologues liés de façon non covalente. Les polypeptides formant la protéine de fusion sont généralement liés de l'extrémité C-terminale à l'extrémité N-terminale, bien qu'ils puissent être liés de l'extrémité C-terminale à l'extrémité C-terminale, de l'extrémité N-terminale à l'extrémité N-terminale, ou de l'extrémité N-terminale à l'extrémité C-terminale. Les polypeptides de la protéine de fusion peuvent être dans un ordre quelconque. Ce terme se rapporte également à des variants modifiés de façon conservative, des variants polymorphes, des allèles, des mutants, des fragments immunogènes, et des homologues interespèces des antigènes qui constituent la protéine de fusion.
Le terme « fusionné » se rapporte à la liaison, par exemple la liaison covalente entre deux polypeptides dans une protéine de fusion. Les polypeptides sont généralement joints par l'intermédiaire d'une liaison peptidique, soit directement l'un à l'autre soit par l'intermédiaire d'un lieur (« linker ») d'acides aminés. Eventuellement, les peptides peuvent être joints par l'intermédiaire de liaisons covalentes non peptidiques connues de l'homme du métier.
Une séquence de lieur (« linker ») peptidique peut être employée pour séparer les premier et second composants peptidiques d'une distance suffisante pour assurer que chaque polypeptide se replie dans ses structures secondaire et tertiaire. Une telle séquence de lieur (« linker ») peptidique est incorporée dans la protéine de fusion en utilisant des techniques classiques bien connues de l'état de l'art. Les séquences appropriées des lieurs (« linker ») peptidiques peuvent être choisies en se basant sur les facteurs suivants : (1) leur capacité à adopter une conformation étendue flexible ; (2) leur incapacité à adopter une structure secondaire qui pourrait interagir avec les épitopes fonctionnels sur les premier et second polypeptides ; et (3) le manque de résidus hydrophobes ou chargés qui pourraient réagir avec les épitopes fonctionnels des polypeptides. Les séquences des lieurs (« linker ») peptidiques préférées contiennent des résidus Gly, Asn et Ser. D'autres acides aminés presque neutres, tels que Thr et Ala, peuvent être également utilisés dans la séquence du lieur (« linker »). Les séquences d'acides aminés qui peuvent être employées de façon utile en tant que lieurs (« linker ») comprennent celles divulguées dans Maratea et al., Gene 40: 39-46 (1985) ; Murphy et al., Proc. Natl. Acad. Sci. USA 83: 8258-8262 (1986) ; brevet US No. 4 935 233 et brevet US No. 4 751 180. La séquence du lieur (« linker ») peut généralement avoir une longueur de 1 à environ 50 acides aminés, par exemple 1, 5, 10, 15, 20, 25, 30, 35 ou 40 acides aminés en longueur. Des séquences de lieurs (« linker ») ne sont pas requises lorsque les premier et second polypeptides comportent des régions d'acides aminés N-terminales non essentielles qui peuvent être utilisées pour séparer les domaines fonctionnels et empêcher les interférences stériques.
Dans cet aspect, la protéine de fusion peut comprendre de façon appropriée un lieur (« linker ») . Un exemple d'un lieur (« linker ») approprié comprend ou est constitué de six résidus Gly consécutifs.
Dans cet aspect, la protéine CDTa est de façon appropriée la première dans la fusion. Ceci signifie que la protéine CDTa est placée en position N-terminale de la protéine de fusion par rapport à la position de la protéine CDTb. Ceci améliore l'aptitude au traitement de la fusion CDTa-CDTb.
Dans un mode de réalisation, la protéine CDTa comporte une mutation de la cystéine en un autre acide aminé au niveau de la position 45 de SEQ ID NO : 1 ou l'acide aminé équivalent dans une autre souche de C. difficile. Le terme « comporte une mutation au niveau de la position 45 » se rapporte aux protéines CDTa qui comportent une mutation au niveau de cet emplacement exact de SEQ ID NO : 1 mais également à une protéine CDTa qui est isolée d'une souche différente et qui comporte une mutation au niveau d'une position équivalente. Dans un mode de réalisation, la protéine CDTa comporte une mutation de cystéine en tyrosine au niveau de la position 45. Cette mutation est réalisée afin de prévenir/éviter la formation d'un pont disulfure entre deux protéines CDTa.
Dans un mode de réalisation, la protéine CDTa pleine longueur comprend une ou plusieurs mutations qui réduisent son activité ADP-ribosyl-transférase.
Par exemple, la protéine CDTa peut comporter l'un quelconque des ensembles de mutations divulgués dans le document WO 2013/112867. Par exemple, la protéine CDTa peut comprendre au moins deux mutations choisies parmi les mutations suivantes au niveau des positions 2, 67, 69, 253, 255, 258, 302, 307, 342, 345, 356, 359, 382, 385 et 387 (correspondant aux positions 3, 68, 70, 254, 256, 259, 303, 308, 343, 346, 357, 360, 383, 386 et 388 de la séquence de SEQ ID NO : 36 de la présente demande :) C2A, Y67A, Y69A, Y253A, R255A, Y258A, R302A, Q307E, N342A, S345F, F356A, R359A, Y382A, E385Q, E385A, E387Q, et E387D telles que divulguées dans le document WO2013/112867. « C2A » signifie que la cystéine au niveau de la position 2 de la séquence de la protéine CDTb divulguée dans le document WO 2013/112867 (correspondant à la position 3 de SEQ ID NO : 36 de la présente demande) est mutée en alanine, et les autres mutations énumérées dans ce groupe devront être comprises de façon similaire. Dans certains modes de réalisation, les mutations de CDTa sont choisies parmi : C2A, R302A, S345F, E385Q, E385A, E387Q, et E387D. Dans des modes de réalisation de cet aspect de l'invention, la protéine CDTa comprend un ensemble de mutations choisies dans le groupe constitué de : (a) S345F, E385Q et E387Q ; (b) R302A, E385A, E387D ; (c) C2A, S345F, E385Q et E387Q ; (d) R302A, S345F, E385Q et E387Q ; (e) Y67A, Y69A, et R255A ; (f) R359A, Y67A, et Q307E ; (g) Y258A, F356A, S345F ; et (h) N342A, Y253A et Y382A.
Dans un mode de réalisation, la protéine CDTa comprend une mutation qui réduit son activité ADP-ribosyl-transférase.
Le terme « la protéine CDTa comprend une mutation qui réduit son activité ADP-ribosyl-transférase » se rapporte à une protéine CDTa qui comprend une mutation au niveau d'une seule position qui seule est prévue pour réduire son activité ADP-ribosyl-transférase. La protéine CDTa peut comprendre éventuellement d'autres mutations non prévues spécifiquement pour réduire son activité ADP-ribosyl-transférase. Les mutations prévues spécifiquement pour réduire l'activité ADP-ribosyl-transférase comprennent E428Q et E430Q (numérotation des acides aminés en référence à SEQ ID NO : 1) ou C2A, Y67A, Y69A, Y253A, R255A, Y258A, R302A, Q307E, N342A, S345F, F356A, R359A, Y382A, E385Q, E385A, E387Q, et E387D telles que divulguées dans le document WO 2013/112867 (numérotation des acides aminés correspondant aux positions 3, 68, 70, 254, 256, 259, 303, 308, 343, 346, 357, 360, 383, 386 et 388 en référence à SEQ ID NO : 36).
Par exemple, la protéine CDTa comporte une mutation du glutamate en un autre acide aminé au niveau de la position 428 de SEQ ID NO : 1 ou l'acide aminé équivalent dans une autre souche de C. difficile. Le terme « comporte une mutation au niveau de la position 428 » se rapporte aux protéines CDTa qui comporte une mutation au niveau de cet emplacement exact de SEQ ID NO : 1 mais également à une protéine CDTa qui est isolée d'une souche différente et qui comporte une mutation au niveau d'une position équivalente. La protéine CDTa varie dans la séquence d'acides aminés entre les différentes souches, pour cette raison la numérotation des acides aminés peut différer entre les souches, ainsi une protéine CDTa provenant d'une souche différente peut comporter un glutamate correspondant qui n'est pas le numéro 428 dans la séquence. Dans un mode de réalisation, la protéine CDTa comporte une mutation du glutamate en glutamine au niveau de la position 428. Dans un autre mode de réalisation, la protéine CDTa comporte de façon appropriée une mutation du glutamate en un acide aminé différent au niveau de la position 430 de SEQ ID NO : 1 ou l'acide aminé équivalent dans une autre souche de C. difficile. Le terme « comporte une mutation au niveau de la position 430 » se rapporte aux protéines qui comportent cet emplacement exact mais également à une protéine CDTa qui est isolée d'une souche différente et qui comporte une mutation au niveau d'une position équivalente. Dans un mode de réalisation, la protéine CDTa comporte une mutation du glutamate en glutamine au niveau de la position 430.
Dans un mode de réalisation, la protéine CDTa pleine longueur est ou comprend de façon appropriée (i) SEQ ID NO : 39 ; ou (ii) un variant de la CDTa présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 39 ; ou (iii) un fragment de la CDTa comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350 ou 400 acides aminés consécutifs de SEQ ID NO : 39.
Dans un autre mode de réalisation, la protéine CDTa pleine longueur est ou comprend de façon appropriée . (i) une séquence d'acides aminés tels que représentée par SEQ ID NO : 40, 42 ou 67 dans le document WO 2013/112867 ; ou (ii) un variant de la CDTa présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec l'une quelconque des séquences en (i) ; ou (iii) un fragment de la CDTa comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350 ou 400 acides aminés consécutifs de l'une quelconque des séquences en (i) .
Dans un mode de réalisation, la protéine CDTb est une protéine CDTb pleine longueur. Dans cet aspect, « CDTb pleine longueur » signifie la CDTb pleine longueur de SEQ ID NO : 7, c'est-à-dire la CDTb avec le prodomaine éliminé.
Dans ce mode de réalisation de cet aspect, la protéine de fusion comprenant une protéine CDTa pleine longueur et une protéine CDTb est ou comprend de façon appropriée (i) SEQ ID NO : 14 ; ou (ii) une protéine de fusion variante présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 14 ; ou (iii) un fragment comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 ou 850 acides aminés consécutifs de SEQ ID NO : 14.
Dans un autre mode de réalisation, la protéine CDTb est une protéine CDTb tronquée avec le domaine de liaison à la CDTa éliminé. Le terme « avec le domaine de liaison à la CDTa éliminé » se rapporte à un fragment ou un variant de SEQ ID NO : 3, ou son équivalent dans une autre souche de C. difficile, avec essentiellement la totalité du domaine de liaison à la CDTa éliminé (par conséquent, qui ne comprend pas les acides aminés correspondant à essentiellement la totalité du domaine de liaison à la CDTa) . Par exemple, le terme « protéine CDTb tronquée avec le domaine de liaison à la CDTa éliminé » se rapporte à une protéine CDTb comportant au moins 65 des acides aminés du domaine de liaison à la CDTa éliminés. Il peut rester quelques acides aminés du domaine de liaison à la CDTa. Par exemple, 2, 5, 10, 15 ou 20 acides aminés du domaine de liaison à la CDTa peuvent demeurer.
Le domaine de liaison à la CDTa de la CDTb correspond aux acides aminés 212 à 295 de SEQ ID NO : 3 ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile.
Dans ce mode de réalisation, la protéine CDTb tronquée avec le domaine de liaison à la CDTa éliminé est ou comprend de façon appropriée (i) SEQ ID NO : 9 ; ou (ii) une protéine de fusion variante présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 9 ; ou (iii) un fragment comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350 ou 400 acides aminés consécutifs de SEQ ID NO : 9.
Dans ce mode de réalisation, la protéine de fusion comprenant une protéine CDTa pleine longueur et une protéine CDTb tronquée avec le domaine de liaison à la CDTa éliminé est ou comprend de façon appropriée (i) SEQ ID NO : 15 ; ou (ii) une protéine de fusion variante présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 15 ; ou (iii) un fragment comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 ou 850 acides aminés consécutifs de SEQ ID NO : 15.
Dans un autre mode de réalisation, la protéine CDTb est une protéine CDTb tronquée comprenant le domaine de liaison aux récepteurs. Le terme « protéine CDTb tronquée comprenant le domaine de liaison aux récepteurs » se rapporte à un fragment ou un variant de SEQ ID NO : 3, ou ses équivalents dans une autre souche de C. difficile, avec essentiellement la totalité sauf le domaine de liaison aux récepteurs éliminée (par conséquent qui ne comprend pas les acides aminés correspondant à essentiellement la totalité de la protéine sauf le domaine de liaison aux récepteurs), il peut rester quelques acides aminés en plus du domaine de liaison aux récepteurs, par exemple, 2, 5, 10, 15 ou 20 acides aminés sauf/en plus du domaine de liaison aux récepteurs. Dans une version, le domaine de liaison aux récepteurs correspond aux acides aminés 620 à 87 6 de SEQ ID NO : 3, ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile. Dans une autre version, le domaine de liaison aux récepteurs correspond aux acides aminés 636 à 876 de SEQ ID NO : 3 ou leurs équivalents dans une protéine de toxine binaire isolée d'une souche différente de C. difficile.
Dans ce mode de réalisation, la protéine CDTb est ou comprend de façon appropriée (i) SEQ ID NO : 27 ou SEQ ID NO : 28 ; ou (i) un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 27 ou SEQ ID NO : 28 ; ou (iii) un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150 ou 200 acides aminés consécutifs de SEQ ID NO : 27 ou SEQ ID NO : 28.
Dans ce mode de réalisation, la protéine de fusion comprenant une protéine CDTa pleine longueur et une protéine CDTb tronquée comprenant le domaine de liaison aux récepteurs est ou comprend de façon appropriée (i) SEQ ID NO : 16 ou SEQ ID NO : 17 ; ou (ii) une protéine de fusion variante présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 16 ou SEQ ID NO : 17 ; ou (iii) un fragment comportant au moins 30, 50, 80, 100, 120, 150, 200, 250, 300, 350 ou 400 acides aminés consécutifs de SEQ ID NO : 16 ou SEQ ID NO : 17.
Dans un autre aspect, l'invention propose de nouveaux polypeptides et nucléotides tels que définis ici.
Dans un mode de réalisation, l'invention propose un polypeptide comprenant une séquence d'acides aminés représentée par l'une quelconque de SEQ ID NO : 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 25, 26, 37, 43, 44, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 66, 67 ou 71.
Dans un mode de réalisation de l'un quelconque des aspects de l'invention, la composition immunogène déclenche des anticorps qui neutralisent la CDTa ou la CDTb ou les deux. Dans un autre mode de réalisation, la composition déclenche des anticorps qui neutralisent la toxine binaire. Si une composition déclenche des anticorps contre une toxine, ceux-ci peuvent être mesurés en immunisant des souris avec la composition immunogène, en prélevant les sérums et en analysant les titres anti-toxine des sérums en utilisant un test ELISA. Les sérums devront être comparés à un échantillon de référence obtenu à partir de souris qui n'ont pas été immunisées. La composition de l'invention déclenche des anticorps qui neutralisent la CDTa si les sérums dirigés contre le polypeptide donnent un résultat ELISA de plus de 10 %, 20 %, 30 %, 50 %, 70 %, 80 %, 90 %, ou 100 % supérieur à l'échantillon de référence.
Dans un autre mode de réalisation, la composition immunogène de l'invention déclenche une réponse immunitaire protectrice chez un hôte mammifère contre des souches de C. difficile. Dans un mode de réalisation, l'hôte mammifère est choisi dans le groupe constitué de souris, de lapins, de cobayes, de primates non humains, de singes et d'êtres humains. Dans un mode de réalisation, l'hôte mammifère est une souris. Dans un autre mode de réalisation, l'hôte mammifère est un être humain.
Si une composition immunogène déclenche une réponse immunitaire protectrice chez un hôte mammifère contre des souches de C. difficile, celle-ci peut être déterminée en utilisant un test de stimulation (« challenge ») . Dans un tel test, l'hôte mammifère est vacciné avec la composition immunogène et stimulé (« challenge ») par exposition à C. difficile, le temps pendant lequel le mammifère survit après la stimulation (« challenge ») est comparé au temps pendant lequel le mammifère de référence qui n'a pas été immunisé avec la composition immunogène survit. Une composition immunogène déclenche une réponse immunitaire protectrice si un mammifère immunisé avec la composition immunogène survit au moins 10 %, 20 %, 30 %, 50 %, 80 %, 80 %, 90 %, ou 100 % plus longtemps qu'un mammifère de référence qui n'a pas été immunisé après la stimulation (« challenge ») avec C. difficile.
Toxine A et Toxine B
Dans un mode de réalisation de l'un quelconque des aspects de l'invention, les compositions immunogènes de l'invention comprennent en outre une protéine de toxine A isolée de Clostridium difficile et/ou une protéine de toxine B isolée de C. difficile.
Le terme « protéine de toxine A isolée de Clostridium difficile » se rapporte à une protéine avec la séquence d'acides aminés de SEQ ID NO : 2 9, ou à un fragment ou un variant de SEQ ID NO : 29. Dans un mode de réalisation, la protéine de toxine A isolée de Clostridium difficile est un fragment comprenant 50, 100, 150, 200, 250, 300, 500, 750, 1000, 1250, 1500, 1750, 2000 ou 2500 acides aminés consécutifs de SEQ ID NO : 29. Dans un mode de réalisation, la protéine de toxine A isolée de Clostridium difficile est un variant présentant 80 %, 85 %, 90 %, 92 %, 95 %, 98 %, 99 % ou 100 % d'identité avec SEQ ID NO : 29.
Le terme « protéine de toxine B isolée de Clostridium difficile » se rapporte à une protéine avec la séquence d'acides aminés de SEQ ID NO : 30, ou à un fragment ou un variant de SEQ ID NO : 30. Dans un mode de réalisation, la protéine de toxine B isolée de Clostridium difficile est un fragment comprenant 50, 100, 150, 200, 250, 300, 500, 750, 1000, 1250, 1500, 1750 ou 2000 acides aminés consécutifs de SEQ ID NO : 30. Dans un mode de réalisation, la protéine de toxine B isolée de Clostridium difficile est un variant présentant 80 %, 85 %, 90 %, 92 %, 95 %, 98 %, 99 % ou 100 % d'identité avec SEQ ID NO : 30.
Dans un mode de réalisation, la protéine de toxine A isolée de Clostridium difficile comprend un fragment de domaine répétitif. Le terme « domaine répétitif de la toxine A » se rapporte au domaine C-terminal de la protéine de toxine A provenant de C. difficile, comprenant des séquences répétées. Le domaine répétitif de la toxine A se rapporte aux acides aminés 1832 à 2710 de la toxine A provenant de la souche VPI10463 (ATCC43255) et leurs équivalents dans une souche différente. La séquence des acides aminés 1832 à 2710 provenant de la souche VPI10463 (ATCC43255) correspond aux acides aminés 1832 à 2710 de SEQ ID NO : 29.
Dans un autre mode de réalisation, la protéine de toxine A isolée de Clostridium difficile comprend un fragment du domaine N-terminal de la toxine A. Le domaine N-terminal de la toxine A se rapporte aux acides aminés 1 à 1831 de la toxine A provenant de la souche VPI10463 (ATCC43255) et leurs équivalents dans une souche différente. La séquence des acides aminés 1 à 1831 de la toxine A provenant de la souche VPI10463 (ATCC43255) correspond aux acides aminés 1 à 1831 de SEQ ID NO : 29.
Dans un mode de réalisation, la protéine de toxine B isolée de Clostridium difficile comprend un fragment de domaine répétitif de la toxine B. Le terme « domaine répétitif de la toxine B » se rapporte au domaine C-terminal de la protéine de toxine B provenant de C. difficile. Ce domaine se rapporte aux acides aminés 1834 à 2366 provenant de la souche VPI10463 (ATCC43255) et leurs équivalents dans une souche différente. La séquence des acides aminés 1834 à 2366 provenant de la souche VPI10463 (ATCC43255) correspond aux acides aminés 1834 à 2366 de SEQ ID NO : 30.
Dans un autre mode de réalisation, la protéine de toxine B isolée de Clostridium difficile comprend un fragment du domaine N-terminal de la toxine B. Le domaine N-terminal de la toxine B se rapporte aux acides aminés 1 à 1833 de la toxine B provenant de la souche VBI10463 (ATCC43255) et leurs équivalents dans une souche différente. La séquence des acides aminés 1 à 1833 de la toxine B provenant de la souche VBI10463 (ATCC43255) correspond aux acides aminés 1 à 1833 de SEQ ID NO : 30.
Les toxines A et B de C. difficile sont des protéines conservées, toutefois, la séquence diffère dans une petite quantité entre les souches, en outre la séquence d'acides aminés pour les toxines A et B dans les différentes souches peut différer dans le nombre des acides aminés.
Pour ces raisons, les termes domaine répétitif de la toxine A et/ou domaine répétitif de la toxine B peuvent se rapporter à une séquence qui est un variant présentant 90 %, 95 %, 98 %, 99 % ou 100 % d'identité de séquence avec les acides aminés 1832 à 2710 de SEQ ID NO : 29 ou un variant présentant 90 %, 95 %, 98 %, 99 % ou 100 % d'identité de séquence avec des acides aminés 1834 à 2366 de SEQ ID NO : 30. De façon similaire, les termes domaine N-terminal de la toxine A et/ou domaine N-terminal de la toxine B se rapportent à une séquence qui est un variant présentant 90 %, 95 %, 98 %, 99 % ou 100 % d'identité de séquence avec les acides aminés 1 à 1831 de SEQ ID NO : 29 ou un variant présentant 90 %, 95 %, 98 %, 99 % ou 100 % d'identité de séquence avec les acides aminés 1 à 1833 de SEQ ID NO : 30.
En outre, la numérotation des acides aminés peut différer entre les domaines C-terminaux de la toxine A (ou de la toxine B) provenant d'une souche et de la toxine A (ou de la toxine B) provenant d'une autre souche. Pour cette raison, le terme « équivalents dans une souche différente » se rapporte aux acides aminés qui correspondent à ceux d'une souche de référence (par exemple, C. difficile VPI10463) , mais qui se trouvent dans une toxine provenant d'une souche différente et qui peuvent ainsi être numérotés différemment. Une région d'acides aminés « équivalents » peut être déterminée en alignant les séquences des toxines provenant des souches différentes. Les numéros des acides aminés fournis ici se rapportent à ceux de la souche VPI10463 (et sont tels que représentés par SEQ ID NO : 29 et SEQ ID NO : 30) .
Dans un autre mode de réalisation de l'un quelconque des aspects de l'invention, la protéine de toxine A isolée de C. difficile et la protéine de toxine B isolée de C. difficile forment une protéine de fusion. Dans un mode de réalisation, la protéine de fusion est identique à 80 %, 85 %, 90 %, 95 %, 98 %, 99 % ou 100 % avec une séquence choisie dans le groupe constitué de SEQ ID NO : 31, 32, 33, 34, et 35. Dans un autre mode de réalisation, la protéine de fusion est un fragment d'au moins 800, 850, 900 ou 950 acides aminés consécutifs d'une séquence choisie dans le groupe constitué de SEQ ID NO : 31, 32, 33, 34, et 35.
Fragments
Le terme « fragment » tel que défini ici peut se rapporter à un fragment comprenant un épitope de lymphocyte T. Les épitopes de lymphocytes T sont des séquences courtes consécutives d'acides aminés qui sont reconnues par les lymphocytes T (par exemple, les lymphocytes T CD4+ ou CD8+). L'identification des épitopes de lymphocytes T peut être obtenue à l'aide d'expériences de cartographie des épitopes qui sont bien connues de l'homme du métier (voir, par exemple, Paul, Fundamental Immunology, 3rd ed., 243-247 (1993) ; Beipbarth et al. Bioinformatics 2005 21(Suppl. 1): Î29-Î37).
Le terme « fragment » lorsqu'il est utilisé en relation avec un polypeptide comprenant un marqueur histidine comprend le polypeptide sans le marqueur histidine, par exemple à partir duquel le marqueur histidine a été clivé. Par exemple, des fragments appropriés de polypeptides comprenant une séquence d'acides aminés représentée par l'une quelconque des séquences ID NO : 5, 7 à 28 ou 36 à 42 (dont chacune comprend un marqueur histidine) comprennent le polypeptide correspondant sans le marqueur histidine représenté par les séquences ID NO : 47 à 76, tels que présentés dans la concordance suivante :
De façon appropriée, les fragments de l'invention sont des fragments immunogènes. Les « fragments immunogènes » selon la présente invention comprendront généralement au moins 9 acides aminés consécutifs provenant de la séquence polypeptidique pleine longueur (par exemple, au moins 10) , comme au moins 12 acides aminés consécutifs (par exemple, au moins 15 ou au moins 20 acides aminés consécutifs), en particulier au moins 50 acides aminés consécutifs, comme au moins 100 acides aminés consécutifs (par exemple, au moins 200 acides aminés consécutifs). De façon appropriée, les fragments immunogènes comporteront au moins 20 %, comme au moins 50 %, au moins 70 % ou au moins 80 % de la longueur de la séquence polypeptidique pleine longueur.
Il faudra comprendre que dans une population non consanguine diversifiée, comme les êtres humains, les différents types HLA signifient que des épitopes spécifiques peuvent ne pas être reconnus par tous les membres de la population. Par conséquent, pour maximiser le taux de reconnaissance et l'échelle de la réponse immunitaire contre un polypeptide, il est généralement souhaitable qu'un fragment immunogène contienne une pluralité des épitopes provenant de la séquence pleine longueur (de façon appropriée tous les épitopes).
Variants « Variants » ou « variants modifiés de façon conservative » s'applique à des séquences à la fois d'acides aminés et d'acide nucléique. En ce qui concerne des séquences d'acide nucléique particulières, les variants modifiés de façon conservatives se rapportent à ces acides nucléiques qui codent pour des séquences d'acides aminés identiques ou essentiellement identiques. Lorsque l'acide nucléique ne code pas pour une séquence d'acides aminés, « variants modifiés de façon conservative » se rapportent à des séquences essentiellement identiques.
En ce qui concerne les variants d'une séquence de protéine, l'homme du métier comprendra que des substitutions, des délétions ou des additions individuelles sur le polypeptide, qui modifient, ajoutent ou délètent un seul acide aminé ou un petit pourcentage d'acides aminés est un « variant modifié de façon conservative » où la/les modification(s) entraîne(nt) la substitution d'un acide aminé par un acide aminé fonctionnellement similaire ou la substitution/délétion/ addition de résidus qui n'ont pas d'impact substantiel sur la fonction biologique du variant.
Les tableaux de substitutions conservatives fournissant des acides aminés fonctionnellement similaires sont bien connus de l'état de l'art. De tels variants modifiés de façon conservative sont en plus de et n'excluent pas les variants polymorphes, les homologues inter-espèces, et les allèles de l'invention.
Un polypeptide de l'invention (comme une protéine CDTa ou une protéine CDTb) peut contenir un certain nombre de substitutions conservatives (par exemple, 1 à 50, comme 1 à 25, en particulier 1 à 10, et spécialement 1 résidu d'acide aminé peut être modifié) lors d'une comparaison à la séquence de référence. En général, de telles substitutions conservatives se situent au sein de l'un des groupements d'acides aminés précisés ci-dessous, bien que dans certaines circonstances d'autres substitutions puissent être possibles sans affecter substantiellement les propriétés immunogènes de l'antigène. Les huit groupes suivants contiennent chacun des acides aminés qui sont généralement des substitutions conservatives à un autre : 1) Alanine (A), Glycine (G) ; 2) Acide aspartique (D), Acide glutamique (E) ; 3) Asparagine (N), Glutamine (Q) ; 4) Arginine (R), Lysine (K) ; 5) Isoleucine (I), Leucine (L), Méthionine (M), Valine (V) ; 6) Phénylalanine (F), Tyrosine (Y), Tryptophane (W) ; 7) Sérine (S), Thréonine (T) ; et 8) Cystéine (C), Méthionine (M) (voir, par exemple, Creighton, Proteins 1984).
De façon appropriée, de telles substitutions ne surviennent pas dans la région d'un épitope, et par conséquent, elles n'ont pas d'impact significatif sur les propriétés immunogènes de 1'antigène.
Les variants de polypeptides peuvent également comprendre ceux dans lesquels des acides aminés supplémentaires sont insérés comparativement à la séquence de référence, par exemple, de telles insertions peuvent survenir au niveau de 1 à 10 emplacements (comme 1 à 5 emplacements, de façon appropriée 1 ou 2 emplacements, en particulier 1 emplacement) et peuvent, par exemple, impliquer l'addition de 50 acides aminés au moins au niveau de chaque emplacement (comme 20 ou moins, en particulier 10 ou moins, spécialement 5 ou moins) . De façon appropriée, de telles insertions ne surviennent pas dans la région d'un épitope, et par conséquent, n'ont pas d'impact significatif sur les propriétés immunogènes de l'antigène. Un exemple d'insertion comprend une séquence courte de résidus d'histidine (par exemple, 2 à 6 résidus) pour aider l'expression et/ou la purification de l'antigène en question.
Les variants de polypeptides comprennent ceux dans lesquels des acides aminés ont été délétés comparativement à la séquence de référence, par exemple, de telles délétions peuvent survenir au niveau de 1 à 10 emplacements (comme 1 à 5 emplacements, de façon appropriée 1 ou 2 emplacements, en particulier 1 emplacement) et peuvent, par exemple, impliquer la délétion de 50 acides aminés ou moins au niveau de chaque emplacement (comme 20 ou moins, en particulier 10 ou moins, spécialement 5 ou moins). De façon appropriée, de telles délétions ne surviennent pas dans la région d'un épitope, et par conséquent, n'ont pas d'impact significatif sur les propriétés immunogènes de 1'antigène. L'homme du métier comprendra qu'un variant de polypeptide particulier peut comprendre des substitutions, des délétions et des additions (ou l'une quelconque de leurs combinaisons).
Les variants présentent de préférence au moins environ 70 % d'identité, de manière davantage préférée au moins environ 80 % d'identité et de façon préférée entre toutes au moins environ 90 % d'identité (comme au moins environ 95 %, au moins environ 98 % ou au moins environ 99 %) avec la séquence de référence associée.
Les termes « identique » ou pourcentage « d'identité », dans le contexte de deux séquences ou plus d'acides nucléiques ou de polypeptides, se rapportent à deux séquences ou sous-séquences ou plus qui sont identiques ou qui comportent un pourcentage précisé de résidus d'acides nucléiques ou de nucléotides qui sont identiques (c'est-à-dire, 70 % d'identité, éventuellement 75 %, 80 %, 85 %, 90 %, 95 %, 98 % ou 99 % d'identité sur une région précisée), lors d'une comparaison et d'un alignement pour une correspondance maximale sur une fenêtre de comparaison, ou une région désignée telle que mesurée en utilisant, par exemple, des algorithmes de comparaison de séquence ou par un alignement manuel et un examen visuel. De telles séquences sont alors dites être « essentiellement identiques ». Cette définition se rapporte également au complémentaire d'une séquence à tester. Eventuellement, l'identité existe sur une région qui a une longueur d'au moins environ 25 à environ 50 acides aminés ou nucléotides, ou éventuellement sur une région qui a une longueur de 75 à 100 acides aminés ou nucléotides. De façon appropriée, la comparaison est effectuée sur une fenêtre correspondant à la longueur entière de la séquence de référence.
Pour une comparaison de séquences, généralement une séquence agit comme une séquence de référence, à laquelle les séquences à tester sont comparées. Lors de l'utilisation d'un algorithme de comparaison de séquences, les séquences à tester et de référence sont entrées dans un ordinateur, les coordonnées des sous-séquences sont désignées, si nécessaire, et les paramètres du programme de l'algorithme des séquences sont désignés. Les paramètres par défaut du programme peuvent être utilisés, ou des variantes de paramètres peuvent être désignées. L'algorithme de comparaison de séquences calcule alors les pourcentages d'identité des séquences pour les séquences à tester par rapport à la séquence de référence, en se basant sur les paramètres du programme.
Une « fenêtre de comparaison », telle qu'utilisée ici, fait référence à un segment dans lequel une séquence peut être comparée à une séquence de référence du même nombre de positions consécutives après que les deux séquences sont alignées de façon optimale. Les procédés d'alignement de séquences pour comparaison sont bien connus de l'état de l'art. L'alignement optimal de séquences pour comparaison peut être conduit, par exemple, par l'algorithme des homologies locales de Smith & Waterman, Adv. Appl. Math. 2: 482 (1981), par l'algorithme d'alignement des homologies de Needleman & Wunsch, J. Mol. Biol. 48: 443 (1970), par le procédé de recherche de similarités de Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85: 2444 (1988), par des mises en œuvre informatisées de ces algorithmes (GAP, BESTFIT, FASTA, et TFASTA dans le Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI), ou par un alignement manuel et un examen visuel (voir, par exemple, Current Protocols in Molecular Biology (Ausubel et al., eds. 1995 supplément)).
Un exemple d'un algorithme utile est PILEUP. PILEUP crée un alignement de séquences multiples provenant d'un groupe de séquences apparentées en utilisant des alignements progressifs par paires pour montrer la relation et le pourcentage d'identité de séquence. Il trace également un arbre ou dendogramme montrant les relations de regroupement utilisées pour créer l'alignement. PILEUP utilise une simplification du procédé d'alignement progressif de Feng & Doolittle, J. Mol. Evol. 35: 351-360 (1987). Le procédé utilisé est similaire au procédé décrit par Higgins & Sharp, CABIOS 5: 151-153 (1989). Le programme peut aligner jusqu'à 300 séquences, chacune d'une longueur maximale de 5000 nucléotides ou acides aminés. La procédure d'alignements multiples débute avec l'alignement par paires des deux séquences les plus similaires, produisant un groupe de deux séquences alignées. Ce groupe est ensuite aligné avec la séquence suivante la plus apparentée ou le groupe de séquences alignées. Deux groupes de séquences sont alignés par une simple extension de l'alignement par paires de deux séquences individuelles. L'alignement final est obtenu par une série d'alignements progressifs par paires. Le programme est exécuté en désignant des séquences spécifiques et leurs coordonnées d'acides aminés ou de nucléotides pour des régions de comparaison de séquences et en désignant les paramètres du programme. En utilisant PILEUP, une séquence de référence est comparée à d'autres séquences à tester pour déterminer la relation du pourcentage d'identité de séquence en utilisant les paramètres suivants : poids de brèche par défaut (3,00), poids de longueur de brèche par défaut (0,10), et brèches des extrémités pondérées. PILEUP peut être obtenu à partir du progiciel d'analyse de séquences GCG, par exemple, version 7.0 (Devereaux et al., Nue. Acids Res. 12: 387-395 (1984) .
Un autre exemple d'algorithme qui est approprié pour déterminer le pourcentage d'identité de séquence et la similarité de séquence consiste en les algorithmes BLAST et BLAST 2.0, qui sont décrits dans Altschul et al., Nue. Acids Res. 25: 33893402 (1977) et Altschul et al., J. Mol. Biol. 215: 403-410 (1990), respectivement. Le logiciel pour effectuer les analyses BLAST est disponible au public par l'intermédiaire du National Center for Biotechnology Information (site web à www.ncbi.nlm.nih.gov/). Cet algorithme implique d'abord l'identification des paires de séquences de score élevé (HSP) en identifiant des mots courts d'une longueur W dans la séquence de requête, qui soit correspondent soit satisfont un certain score de seuil à valeur positive T lorsqu'ils sont alignés avec un mot de la même longueur dans une séquence de la base de données. Il est fait référence à T comme au seuil de score du mot voisin (Altschul et al., ci-dessus). Ces correspondances initiales de mots voisins agissent comme des semences pour initier des recherches afin de trouver des HSP plus longues les contenant. Les correspondances des mots sont étendues dans les deux directions le long de chaque séquence aussi loin que le score d'alignement cumulatif peut être augmenté. Les scores cumulatifs sont calculés en utilisant, pour les séquences nucléotidiques, les paramètres M (score de récompense pour une paire de résidus correspondants ; toujours >0) et N (score de pénalité pour les résidus ne correspondant pas ; toujours < 0) . Pour les séquences d'acides aminés, une matrice de score est utilisée pour calculer le score cumulatif. L'extension des correspondances des mots dans chaque direction est stoppée lorsque : le score d'alignement cumulatif se situe d'un quantité X en dehors de sa valeur maximale obtenue ; le score cumulatif va jusqu'à zéro ou en dessous, à cause de l'accumulation d'un ou de plusieurs alignements de résidus à score négatif ; ou l'extrémité de l'une ou l'autre séquence est atteint. Les paramètres W, T, et X de l'algorithme BLAST déterminent la sensibilité et la vitesse de l'alignement. Le programme .BLASTN (pour les séquences nucléotidiques) utilise par défaut une longueur de mots (W) de 11, une espérance (E) de 10, M = 5, N = -4 et une comparaison des deux brins. Pour les séquences d'acides aminés, le programme BLASTP utilise par défaut une longueur de mots de 3, et une espérance (E) de 10, et la matrice de score BLOSUM62 (voir Henikoff &amp; Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915 (1989)), des alignements (B) de 50, une espérance (E) de 10, M = 5, N = -4, et une comparaison des deux brins. L'algorithme BLAST effectue également une analyse statistique de la similarité entre deux séquences (voir, par exemple, Karlin &amp; Altschul, Proc. Nat'l. Acad. Sci. USA 90: 5873-5787 (1993)). Une mesure de similarité fournie par l'algorithme BLAST est la plus petite somme des probabilités (P(N)), qui fournit une indication de la probabilité selon laquelle une correspondance entre deux séquences nucléotidiques ou d'acides aminés pourrait survenir par hasard. Par exemple, un acide nucléique est considéré comme similaire à une séquence de référence si la plus petite somme des probabilités dans une comparaison de l'acide nucléique à tester à l'acide nucléique de référence est inférieure à environ 0,2, de manière davantage préférée inférieure à environ 0,01, et de manière préférée entre toutes inférieure à environ 0,001.
IDENTIFICATION ET CARACTERISATION DES POLYNUCLEOTIDES
Les polynucléotides codant pour les protéines CDTa, CDTb, de toxine A et de toxine B de Clostridium difficile de l'invention peuvent être identifiés, préparés et/ou manipulés en utilisant l'une quelconque de toute une diversité de techniques bien établies. Par exemple, un polynucléotide peut être identifié, comme il est décrit plus en détail ci-dessous, par criblage d'une micropuce d'ADNc. De tels criblages peuvent être effectués, par exemple, en utilisant une micropuce Synteni (Palo Alto, CA) selon les instructions du fabricant (et essentiellement comme il est décrit par Schena et al., Proc. Natl. Acad. Sci. USA 93: 10614-10619 (1996) et Heller et al., Proc. Natl. Acad. Sci. USA 94: 2150-2155 (1997)). En variante, les polynucléotides peuvent être amplifiés à partir d'ADNc préparé à partir de cellules exprimant les protéines décrites ici, comme des cellules de M. tuberculosis. Ces polynucléotides peuvent être amplifiés par l'intermédiaire d'une réaction en chaîne de la polymérase (PCR). Pour cette approche, des amorces spécifiques des séquences peuvent être conçues en se basant sur les séquences fournies ici, et elles peuvent être achetées ou synthétisées.
Une partie amplifiée d'un polynucléotide peut être utilisée pour isoler un gène pleine longueur à partir d'une banque appropriée (par exemple, une banque d'ADNc de M. tuberculosis) en utilisant des techniques bien connues. Dans ces techniques, une banque (d'ADNc ou génomique) est criblée en utilisant une ou plusieurs sondes ou amorces polynucléotidiques appropriées pour l'amplification. De préférence, une banque est choisie par la taille pour inclure des molécules plus grosses. Des banques amorcées de façon aléatoire peuvent être également préférées pour l'identification des régions en 5' et en amont des gènes.
Les banques génomiques sont préférées pour obtenir des introns et étendre les séquences en 5'.
Pour les techniques d'hybridation, une séquence partielle peut - être marquée (par exemple, par déplacement de coupure ou marquage des extrémités par 32P) en utilisant des techniques bien connues. Une banque bactérienne ou de bactériophages est alors généralement criblée par hybridation de filtres contenant des colonies bactériennes dénaturées (ou de tapis contenant des plaques de phages) avec la sonde marquée (voir Sambrook et al., Molecular Cloning: A Laboratory Manual (2000)). Les colonies ou les plaques s'hybridant sont sélectionnées et soumises à une expansion, et l'ADN est isolé pour une autre analyse. Les clones d'ADNc peuvent être analysés pour déterminer la quantité de séquence supplémentaire, par exemple, par PCR en utilisant une amorce issue de la séquence partielle et une amorce issue du vecteur. Des cartes de restriction et des séquences partielles peuvent être générées pour identifier un ou plusieurs clones se chevauchant. La séquence complète peut être ensuite déterminée en utilisant des techniques classiques, qui peuvent impliquer la production d'une série de clones de délétion. Les séquences chevauchantes résultantes peuvent être ensuite assemblées en une seule séquence contiguë. Une molécule d'ADNc pleine longueur peut être produite par ligature des fragments appropriés, en utilisant des techniques bien connues.
En variante, il existe de nombreuses techniques d'amplification pour l'obtention d'une séquence codante pleine longueur à partir d'une séquence d'ADNc partielle. Dans ces techniques, l'amplification est généralement réalisée par l'intermédiaire d'une PCR. L'un quelconque de toute une diversité de kits disponibles dans le commerce peut être utilisé pour effectuer l'étape d'amplification. Les amorces peuvent être conçues en utilisant, par exemple, un logiciel bien connu de l'état de l'art. Les amorces ont de préférence une longueur de 22 à 30 nucléotides, présentent une teneur en GC d'au moins 50 % et s'hybrident à la séquence cible à des températures d'environ 68 °C à 72 °C. La région amplifiée peut être séquencée comme il a été décrit ci-dessus, et les séquences chevauchantes sont assemblées en une séquence contiguë.
Une telle technique d'amplification est la PCR inverse (voir Triglia et al., Nucl. Acids Res. 16: 8186 (1988)), qui utilise des enzymes de restriction pour produire un fragment dans la région connue du gène. Le fragment est ensuite circularisé par ligature intramoléculaire et utilisé en tant que matrice pour la PCR avec des amorces divergentes dérivées de la région connue. Dans cette variante d'approche, les séquences adjacentes à une séquence partielle peuvent être récupérées par amplification avec une amorce spécifique d'une séquence lieur (« linker ») et une amorce spécifique d'une région connue. Les séquences amplifiées sont généralement soumises à une seconde série d'amplification avec la même amorce du lieur (« linker ») et une seconde amorce spécifique de la région connue. Une variation de cette procédure, qui emploie deux amorces qui initient l'extension dans des directions opposées à partir de la séquence connue, est décrite dans le document WO 96/38591. Une autre technique de ce type est connue comme « l'amplification rapide des extrémités d'ADNc » ou RACE. Cette technique implique l'utilisation d'une amorce interne et d'une amorce externe, qui s'hybride à une région polyA ou une séquence de vecteur, pour identifier les séquences qui sont en 5' et 3' d'une séquence connue. D'autres techniques comprennent la PCR de capture (Lagerstrom et al., PCR Methods Applic. 1: 111-19 (1991)) et la walking-PCR (Parker et al., Nucl. Acids. Res. 19: 3055-60 (1991)). D'autres procédés employant une amplification peuvent être également employés pour obtenir une séquence d'ADNc pleine longueur.
Dans certains cas, il est possible d'obtenir une séquence d'ADNc pleine longueur par analyse des séquences fournies dans une base de données de marqueurs de séquences exprimées (EST), telle que celle disponible auprès de GenBank. Les recherches d'EST chevauchants peuvent être généralement réalisées en utilisant des programmes bien connus (par exemple, les recherches de NCBI BLAST) , et ces EST peuvent être utilisés pour générer une séquence pleine longueur contiguë. Les séquences d'ADN pleine longueur peuvent être également obtenues par analyse de fragments génomiques.
EXPRESSION DES POLYNUCLEOTIDES DANS DES CELLULES HOTES
Les séquences polynucléotidiques ou des fragments de celles-ci qui codent pour les protéines CDTa, CDTb, de toxine A et de toxine B de Clostridium difficile, ou des protéines de fusion ou leurs équivalents fonctionnels, peuvent être utilisées dans des molécules d'ADN recombinant pour diriger l'expression d'un polypeptide dans des cellules hôtes appropriées. Du fait de la dégénérescence intrinsèque du code génétique, d'autres séquences d'ADN qui codent pour essentiellement la même séquence d'acides aminés ou une séquence d'acides aminés fonctionnellement équivalente peuvent être produites et ces séquences peuvent être utilisées pour cloner et exprimer un polypeptide donné.
Comme le comprendra l'homme du métier, il peut être avantageux dans certains cas de produire des séquences nucléotidiques codant pour des polypeptides qui possèdent des codons n'existant pas à l'état naturel. Par exemple, les codons préférés par un hôte procaryote ou eucaryote particulier peuvent être sélectionnés pour augmenter le taux d'expression de la protéine ou pour produire un transcrit d'ARN recombinant doté de propriétés souhaitables, comme une demi-vie qui est plus longue que celle d'un transcrit produit à partir de la séquence existant à l'état naturel.
En outre, les séquences polynucléotidiques peuvent être modifiées en utilisant des procédés généralement connus de l'état de l'art afin de modifier les séquences codant pour les polypeptides pour diverses raisons, y compris mais sans y être limités, des changements qui modifient le clonage, le traitement, et/ou l'expression du produit génique. Par exemple, la réorganisation d'ADN par fragmentation aléatoire et un réassemblage par PCR des fragments géniques et des oligonucléotides synthétiques peuvent être utilisés pour modifier les séquences nucléotidiques. En outre, une mutagenèse dirigée peut être utilisée pour insérer de nouveaux sites de restriction, modifier les profils de glycosylation, changer la préférence des codons, produire des variants d'épissage, ou introduire des mutations, et ainsi de suite.
Des séquences d'acide nucléique naturelles, modifiées, ou recombinantes peuvent être ligaturées en une séquence hétérologue pour coder pour une protéine de fusion. Par exemple, pour cribler des banques de peptides à la recherche d'inhibiteurs d'une activité de polypeptide, il peut être utile de coder pour une protéine chimérique qui peut être reconnue par un anticorps disponible dans le commerce. Une protéine de fusion peut être également modifiée pour contenir un site de clivage localisé entre la séquence codante du polypeptide et la séquence de la protéine hétérologue, si bien que le polypeptide peut être clivé et purifié à distance du radical hétérologue.
Les séquences codant pour un polypeptide souhaité peuvent être synthétisées, en totalité ou en partie, en utilisant des procédés chimiques bien connus de l'état de l'art (voir Caruthers, M. H. et al., Nucl. Acids Res. Symp. Ser. pp. 215223 (1980), Horn et al., Nucl. Acids Res. Symp. Ser. pp. 225232 (1980)) . En variante, la protéine elle-même peut être produite en utilisant des procédés chimiques pour synthétiser la séquence d'acides aminés d'un polypeptide, ou d'une partie de celle-ci. Par exemple, la synthèse de peptides peut être effectuée en utilisant diverses techniques sur phase solide (Roberge et al., Science 269: 202-204 (1995)) et une synthèse automatisée peut être obtenue, par exemple, en utilisant le synthétiseur de peptides ABI 431A (Perkin Elmer, Palo Alto, CA).
Un peptide nouvellement synthétisé peut être essentiellement purifié par une chromatographie liquide haute performance préparative (par exemple, Creighton, Proteins, Structures and Molecular Principles (1983)) ou d'autres techniques comparables disponibles dans l'état de l'art. La composition des peptides synthétiques peut être confirmée par l'analyse des acides aminés ou le séquençage (par exemple, la procédure de dégradation d'Edman). En variante, la séquence d'acides aminés d'un polypeptide, ou d'une partie quelconque de celle-ci, peut être modifiée durant la synthèse directe et/ou combinée en utilisant des procédés chimiques avec des séquences provenant d'autres protéines, ou d'une partie quelconque de celles-ci, pour produire un polypeptide variant.
Afin d'exprimer un polypeptide souhaité, les séquences nucléotidiques codant pour le polypeptide, ou des équivalents fonctionnels, peuvent être insérées dans un vecteur d'expression approprié, c'est-à-dire, un vecteur qui contient les éléments nécessaires à la transcription et la traduction de la séquence codante insérée. Les procédés qui sont bien connus de l'homme du métier peuvent être utilisés pour construire des vecteurs d'expression contenant des séquences contenant les séquences codant pour un polypeptide d'intérêt et les éléments de contrôle de la transcription et de la traduction appropriés. Ces procédés comprennent les techniques d'ADN recombinant in vitro, les techniques de synthèse, et la recombinaison génétique in vivo. Ces techniques sont décrites dans Sambrook et al., Molecular Cloning, A Laboratory Manual (2000), et Ausubel et al., Current Protocols in Molecular Biology (mis à jour annuellement).
Divers systèmes de vecteur d'expression/hôte peuvent être utilisés pour contenir et exprimer des séquences polynucléotidiques. Ceux-ci comprennent, mais sans y être limités, des micro-organismes comme des bactéries transformées par des vecteurs d'expression d'ADN recombinant de bactériophage, de plasmide ou de cosmide ; des levures transformées par des vecteurs d'expression de levures ; des systèmes de cellules d'insectes infectées par des vecteurs d'expression de virus (par exemple, des baculovirus) ; des systèmes de cellules végétales transformées par des vecteurs d'expression de virus (par exemple, le virus de la mosaïque du chou-fleur, CaMV ; le virus de la mosaïque du tabac, TMV) ou par des vecteurs d'expression bactériens (par exemple, les plasmides Ti ou pBR322) ; ou des systèmes de cellules animales.
Les « éléments de contrôle » ou les « séquences régulatrices » présents dans un vecteur d'expression sont ces régions non traduites du vecteur - amplificateurs, promoteurs, régions non traduites en 5' et 3' - qui interagissent avec les protéines cellulaires de l'hôte pour réaliser la transcription et la traduction. Ces éléments peuvent varier en force et spécificité. Selon le système de vecteur et l'hôte utilisés, un nombre quelconque d'éléments de contrôle de la transcription et de la traduction appropriés, y compris des promoteurs constitutifs et inductibles, peuvent être utilisés. Par exemple, lors d'un clonage dans des systèmes bactériens, des promoteurs inductibles, tels que le promoteur hybride lacZ du phagemide PBLUESCRIPT (Stratagene, La Jolla, Californie) ou du plasmide PSP0RT1 (Gibco BRL, Gaithersburg, MD) et analogues peuvent être utilisés. Dans les systèmes de cellules de mammifères, des promoteurs provenant de gènes de mammifères ou de virus de mammifères sont généralement préférés. S'il est nécessaire de produire une lignée cellulaire qui contient des copies multiples de la séquence codant pour un polypeptide, des vecteurs basés sur le SV40 ou l'EBV peuvent être utilisés de façon avantageuse avec un marqueur sélectionnable approprié.
Dans les systèmes bactériens, un certain nombre de vecteurs d'expression peuvent être sélectionnés selon l'utilisation prévue pour le polypeptide exprimé. Par exemple, lorsque de grandes quantités sont nécessaires, par exemple pour l'induction d'anticorps, des vecteurs qui dirigent une expression à taux élevés de protéines de fusion qui sont facilement purifiées, peuvent être utilisés. Ces vecteurs comprennent, mais n'y sont pas limités, les vecteurs de clonage et d'expression multifonctionnels d'E. coli comme BLUESCRIPT (Stratagene), dans lesquels la séquence codant pour le polypeptide d'intérêt peut être ligaturée dans le vecteur dans le cadre de lecture avec des séquences pour la Met amino-terminale et les 7 résidus subséquents de la β-galactosidase si bien qu'il est produit une protéine hybride ; les vecteurs pIN (Van Heeke &amp; Schuster, J. Biol. Chem. 264: 5503-5509 (1989)) ; et analogues. Les vecteurs pGEX (Promega, Madison, Wis ; GE Healthcare) peuvent être également utilisés pour exprimer des polypeptides étrangers sous la forme de protéines de fusion avec de la glutathion-S-transférase (GST). En général, ces protéines de fusion sont solubles et peuvent être facilement purifiées à partir des cellules lysées par adsorption sur des billes de glutathion-agarose suivie d'une élution en présence de glutathion libre. Les protéines fabriquées dans ces systèmes peuvent être conçues pour inclure des sites de clivage de l'héparine, de la thrombine, de la protéase facteur XA si bien que le polypeptide d'intérêt cloné peut être libéré du radical GST à volonté.
Dans les levures, Saccharomyces cerevisiae ou Pichia comme Pichia pastoris par exemple, un certain nombre de vecteurs contenant des promoteurs constitutifs ou inductibles comme le facteur alpha, l'alcool oxydase, et le PGH, peuvent être utilisés. D'autres vecteurs contenant des promoteurs constitutifs ou inductibles comprennent GAP, PGK, GAL et ADH. Pour des descriptions, voir Ausubel et al. (ci-dessus) et Grant et al., Methods Enzymol. 153: 516-544 (1987) et Romas et al. Yeast 8 423-88 (1992).
Dans les cas où des vecteurs d'expression végétaux sont utilisés, l'expression des séquences codant pour les polypeptides peut être dirigée par l'un quelconque de tout un nombre de promoteurs. Par exemple, des promoteurs viraux comme les promoteurs 35S et.19S du CaMV peuvent être utilisés seuls ou en combinaison avec la séquence de tête oméga issue du TMV (Takamatsu, EMBO J. 6: 307-311 (1987)). En variante, des promoteurs végétaux comme la petite sous-unité de RUBISCO ou des promoteurs de choc thermique peuvent être utilisés (Coruzzi et al., EMBO J. 3: 1671-1680 (1984) ; Broglie et al., Science 224: 838-843 (1984) ; et Winter et al., Results Probl. Cell Differ. 17: 85-105 (1991)). Ces constructions peuvent être introduites dans des cellules végétales par transformation directe d'ADN ou transfection médiée par un agent pathogène. Ces techniques sont décrites dans un certain nombre de descriptions généralement disponibles (voir, par exemple, Hobbs dans McGraw Hill Yearbook of Science and Technology pp. 191-196 (1992)).
Un système d'insectes peut être également utilisé pour exprimer un polypeptide d'intérêt. Par exemple, dans un tel système, le virus de la polyédrose nucléaire d'Autographa californica (AcNPV) est utilisé en tant que vecteur pour exprimer des gènes étrangers dans des cellules de Spodoptera frugiperda ou dans des larves de Trichoplusia. Les séquences codant pour le polypeptide peuvent être clonées dans une région non essentielle du virus, comme le gène de la polyédrine, et placées sous le contrôle du promoteur de la polyédrine. Une insertion réussie de la séquence codant pour le polypeptide rendra le gène de la polyédrine inactif et produira un virus recombinant auquel il manque la protéine de l'enveloppe. Les virus recombinants peuvent être ensuite utilisés pour infecter, par exemple, des cellules de S. frugiperda ou des larves de Trichoplusia dans lesquelles le polypeptide d'intérêt peut être exprimé (Engelhard et al., Proc. Natl. Acad. Sci. U.S.A. 91 : 3224-3227 (1994)).
Dans des cellules hôtes de mammifères, un certain nombre de systèmes d'expression à base de virus sont généralement disponibles. Par exemple, dans les cas où un adénovirus est utilisé en tant que vecteur d'expression, les séquences codant pour un polypeptide d'intérêt peuvent être ligaturées dans un complexe de transcription/traduction de l'adénovirus constitué du promoteur tardif et de la séquence de tête tripartite. L'insertion dans une région non essentielle El ou E3 du génome viral peut être utilisée pour obtenir un virus viable qui est capable d'exprimer le polypeptide dans des cellules hôtes infectées (Logan &amp; Shenk, Proc. Natl. Acad. Sci. U.S.A. 81: 3655-3659 (1984)). En outre, des amplificateurs de la transcription, comme l'amplificateur du virus du sarcome de Rous (RSV), peuvent être utilisés pour augmenter l'expression dans des cellules hôtes de mammifères. Des procédés et des protocoles pour travailler avec des vecteurs d'adénovirus sont décrits dans Wold, Adenovirus Methods and Protocols, 1998. Des références supplémentaires concernant l'utilisation de vecteurs d'adénovirus peuvent être trouvées dans Adenovirus: A Medical Dictionary, Bibliography, and Annotated Research Guide to Internet References, 2004.
Des signaux d'initiation spécifiques peuvent être également utilisés pour obtenir une traduction plus efficace des séquences codant pour un polypeptide d'intérêt. Ces signaux comprennent le codon d'initiation ATG et les séquences adjacentes. Dans les cas où des séquences codant pour le polypeptide, son codon d'initiation, et des séquences en amont sont insérés dans le vecteur d'expression approprié, aucun signal de contrôle de la transcription ou de la traduction supplémentaire n'est nécessaire. Toutefois, dans les cas où seulement une séquence codante, ou une partie de celle-ci, est insérée, des signaux de contrôle de la traduction exogènes y compris le codon d'initiation ATG, devront être fournis. En outre, le codon d'initiation devra être dans le cadre de lecture correct pour assurer la traduction de l'insert entier. Les éléments de la traduction exogènes et les codons d'initiation peuvent être d'origines diverses, à la fois naturelles et synthétiques. L'efficacité de l'expression peut être amplifiée par l'inclusion d'amplificateurs qui sont appropriés pour le système cellulaire particulier qui est utilisé, comme ceux décrits dans la littérature (Scharf. et al., Results Probl. Cell Differ. 20: 125-162 (1994)) .
En outre, une souche de cellules hôtes peut être choisie pour sa capacité à moduler l'expression des séquences insérées ou à traiter la protéine exprimée de la façon souhaitée. Ces modifications du polypeptide comprennent, mais n'y sont pas limitées, l'acétylation, la carboxylation, la glycosylation, la phosphorylation, la lipidation, et l'acylation. Un traitement post-traductionnel qui clive une forme « prépro » de la protéine peut être également utilisé pour faciliter l'insertion, le repliement et/ou la fonction corrects. Différentes cellules hôtes comme CHO, HeLa, MDCK, HEK293, et WI38, qui comportent une machinerie cellulaire spécifique et des mécanismes caractéristiques de telles activités post-traductionnelles, peuvent être choisies pour assurer la modification et le traitement corrects de la protéine étrangère.
Pour une production à rendement élevé sur le long terme de protéines recombinantes, une expression stable est généralement préférée. Par exemple, des lignées cellulaires qui expriment de façon stable un polynucléotide d'intérêt peuvent être transformées en utilisant des vecteurs d'expression qui peuvent contenir des origines de réplication virales et/ou des éléments d'expression endogènes et un gène de marqueur sélectionnable sur le même vecteur ou sur un vecteur séparé. A la suite de l'introduction du vecteur, les cellules peuvent être laissées pour se développer pendant 1 à 2 jours dans un milieu enrichi avant de les passer à un milieu sélectif. L'objectif du marqueur sélectionnable est de conférer une résistance à la sélection, et sa présence permet la croissance et la récupération de cellules qui expriment avec succès les séquences introduites. Les clones résistants des cellules transformées de façon stable peuvent être soumis à une prolifération en utilisant des techniques de culture tissulaire appropriées au type cellulaire.
Un nombre quelconque de systèmes de sélection peuvent être utilisés pour récupérer des lignées cellulaires transformées. Ceux-ci comprennent, mais n'y sont pas limités, les gènes de la thymidine kinase du virus herpès simplex (Wigler et al., Cell 11: 223-32 (1977)) et de l'adénine phosphoribosyl-transférase (Lowy et al., Cell 22: 817-23 (1990)) qui peuvent être employés dans des cellules tk.sup. ou aprt.sup., respectivement. En outre, une résistance à des antimétabolites, des antibiotiques ou des herbicides peut être utilisée comme la base de la sélection ; par exemple, dhfr qui confère une résistance au méthotrexate (Wigler et al., Proc. Natl. Acad. Sci. U.S.A. 77: 3567-70 (1980)) ; npt, qui confère une résistance aux aminoglycosides, néomycine et G-418 (Colbere-Garapin et al., J. Mol. Biol. 150: 1-14 (1981)) ; et als ou pat, qui confèrent une résistance au chlorsulfuron et à la phosphinotricine acétyltransférase, respectivement (Murry, ci-dessus). D'autres gènes sélectionnables ont été décrits, par exemple, trpB, qui permet aux cellules d'utiliser l'indole à la place du tryptophane, ou hisD, qui permet aux cellules d'utiliser l'histinol à la place de l'histidine (Hartman &amp; Mulligan, Proc. Natl. Acad. Sci. U.S.A. 85: 8047-51 (1988)). Récemment, l'utilisation de marqueurs visibles a gagné une certaine popularité avec des marqueurs tels que des anthocyanines, la β-glucuronidase et son substrat GUS, et la luciférase et son substrat la luciférine, étant largement utilisés non seulement pour identifier des transformants, mais également pour quantifier la quantité d'expression d'une protéine transitoire ou stable attribuable à un système de vecteur spécifique (Rhodes et al., Methods Mol. Biol. 55: 121-131 (1995)).
Bien que la présence/1'absence de l'expression du gène marqueur suggère que le gène d'intérêt est également présent, sa présence et son expression peuvent avoir à être confirmées. Par exemple, si la séquence codant pour un polypeptide est insérée au sein de la séquence d'un gène marqueur, les cellules recombinantes contenant des séquences peuvent être identifiées par l'absence de la fonction du gène marqueur. En variante, un gène marqueur peut être placé en tandem avec une séquence codant pour un polypeptide sous le contrôle d'un seul promoteur. L'expression du gène marqueur en réponse à une induction ou une sélection indique habituellement aussi bien l'expression du gène en tandem.
En variante, les cellules hôtes qui contiennent et expriment une séquence polynucléotidique souhaitée peuvent être identifiées par diverses procédures connues de l'homme du métier. Ces procédures comprennent, mais n'y sont pas limitées, des hybridations ADN-ADN ou ADN-ARN et des techniques de dosages biologiques ou immunologiques de protéines qui comprennent des technologies basées sur des membranes, des solutions ou des puces pour la détection et/ou la quantification d'acides nucléiques ou de protéines.
Divers protocoles de détection et de mesure de l'expression de produits codés par des polynucléotides, utilisant des anticorps soit polyclonaux soit monoclonaux spécifiques du produit sont connus de l'état de l'art. Les exemples comprennent un test ELISA (enzyme-linked immunosorbent assay), un test radioimmunologique (RIA), et le tri des cellules activées par fluorescence (FACS). Un test immunologique basé sur des anticorps monoclonaux à deux sites utilisant des anticorps monoclonaux réactifs contre deux épitopes non interférant sur un polypeptide donné peut être préféré pour certaines applications, mais un test de liaison compétitive peut être également employé. Ces tests et d'autres sont décrits, entre autres, dans Hampton et al., Serological Methods, a Laboratory Manual (1990) et Maddox et al., J. Exp. Med. 158: 1211-1216 (1983).
Une large diversité de marqueurs et de techniques de conjugaison sont connus de l'homme du métier et peuvent être utilisés dans divers tests pour des acides nucléiques et des acides aminés. Les moyens de production de sondes d'hybridation ou de PCR marquées pour la détection de séquences apparentées à des polynucléotides comprennent l'oligomarquage, le déplacement de coupure, le marquage des extrémités ou l'amplification par PCR en utilisant un nucléotide marqué. En variante, les séquences, ou des parties quelconques de celles-ci, peuvent être clonées dans un vecteur pour la production d'une sonde d'ARNm. De tels vecteurs sont connus de l'état de l'art, sont disponibles dans le commerce, et peuvent être utilisés pour synthétiser des sondes d'ARN in vitro par l'addition d'une ARN polymérase appropriée telle que T7, T3, ou SP6 et des nucléotides marqués. Ces procédures peuvent être conduites en utilisant divers kits disponibles dans le commerce. Les molécules rapporteurs ou les marqueurs appropriés, qui peuvent être utilisés, comprennent des radionucléides, des enzymes, des agents fluorescents, chimioluminescents ou chromogènes ainsi que des substrats, des cofacteurs, des inhibiteurs, des particules magnétiques, et analogues.
Les cellules hôtes transformées avec une séquence polynucléotidique d'intérêt peuvent être cultivées dans des conditions appropriées pour l'expression et la récupération de la protéine à partir de la culture cellulaire. La protéine produite par une cellule recombinante peut être sécrétée ou contenue au niveau intracellulaire selon la séquence et/ou le vecteur utilisé. Comme le comprendra l'homme du métier, des vecteurs d'expression contenant des polynucléotides peuvent être conçus pour contenir des séquences signal qui dirigent la sécrétion du polypeptide codé à travers la membrane d'une cellule procaryote ou eucaryote. D'autres constructions recombinantes peuvent être utilisées pour joindre des séquences codant pour un polypeptide d'intérêt à une séquence nucléotidique codant pour un domaine de polypeptide qui facilitera la purification des protéines solubles. De tels domaines facilitant la purification comprennent, mais n'y sont pas limités, des peptides chélateurs de métaux tels que des modules histidine-tryptophane qui permettent la purification sur des métaux immobilisés, des domaines de protéine A qui permettent la purification sur des immunoglobulines immobilisées, et le domaine utilisé dans le système de purification par extension/affinité FLAGS (Immunex Corp., Seattle, Wash.). L'inclusion de séquences lieurs (« linker ») clivables telles que celles spécifiques du facteur XA ou de 1 ' entérokinase (Invitrogen. San Diego, Californie) entre le domaine de purification et le polypeptide codé peut être utilisée pour faciliter la purification. Un tel vecteur d'expression permet l'expression d'une protéine de fusion contenant un polypeptide d'intérêt et un acide nucléique codant pour 6 résidus d'histidine précédant un site de clivage de thiorédoxine ou d'entérokinase. Les résidus d'histidine facilitent la purification sur IMIAC (chromatographie d'affinité sur ions métalliques immobilisés) comme il est décrit dans
Porath et al., Prot. Exp. Purif. 3: 263-281 (1992) alors que le site de clivage de 1'entérokinase fournit un moyen de purifier le polypeptide souhaité à partir de la protéine de fusion. Une discussion sur les vecteurs qui contiennent des protéines de fusion est fournie dans Kroll et al., DNA Cell Biol. 12: 441453 (1993)) .
COMPOSITIONS DE POLYPEPTIDES
En général, un polypeptide pour l'utilisation dont fait l'invention (par exemple, les protéines CDTa, CDTb, de toxine A et de toxine B de Clostridium difficile) sera un polypeptide isolé (c'est-à-dire, séparé de ces composants avec lesquels il peut être habituellement trouvé dans la nature).
Par exemple, une protéine existant à l'état naturel est isolée si elle est séparée de certains ou de la totalité des matériaux coexistants dans le système naturel. De préférence, de tels polypeptides sont au moins purs à environ 90 %, de manière davantage préférée au moins purs à environ 95 % et de manière préférée entre toutes au moins purs à environ 99 %. Un polynucléotide est considéré comme étant isolé si, par exemple, il est cloné dans un vecteur qui ne fait pas partie de l'environnement naturel.
Les polypeptides peuvent être préparés en utilisant l'une quelconque de diverses techniques bien connues. Les polypeptides recombinants codés par des séquences d'ADN comme il a été décrit ci-dessus peuvent être facilement préparés à partir des séquences d'ADN en utilisant l'un quelconque de divers vecteurs d'expression connus de l'homme du métier. L'expression peut être obtenue dans une cellule hôte appropriée quelconque qui a été transformée ou transfectée avec un vecteur d'expression contenant une molécule d'ADN qui code pour un polypeptide recombinant. Les cellules hôtes appropriées comprennent des procaryotes, des levures, et des cellules eucaryotes supérieures, comme des cellules de mammifères et des cellules végétales. De préférence, les cellules hôtes employées sont E. coli, des levures ou une lignée cellulaire de mammifère comme COS ou CHO. Les surnageants provenant des systèmes hôte/vecteur appropriés qui sécrètent la protéine ou le polypeptide recombinant dans le milieu de culture peuvent être d'abord concentrés en utilisant un filtre disponible dans le commerce. A la suite de la concentration, le concentré peut être appliqué sur une matrice de purification appropriée comme une matrice d'affinité ou une résine échangeuses d'ions. Finalement, une ou plusieurs étapes de CLHP en phase inverse peuvent être employées pour encore purifier un polypeptide recombinant.
Les polypeptides pour une utilisation dans l'invention, leurs fragments immunogènes, et d'autres variants comportant moins d'environ 100 acides aminés, et généralement moins d'environ 50 acides aminés, peuvent être également produits par des moyens de synthèse, en utilisant des techniques bien connues de l'homme du métier. Par exemple, de tels polypeptides peuvent être synthétisés en utilisant l'une quelconque des techniques en phase solide disponibles dans le commerce, comme le procédé de synthèse sur phase solide de Merrifield, où des acides aminés sont ajoutés séquentiellement à une chaîne d'acides aminés croissante. Voir Merrifield, J. Am. Chem. Soc. 85: 2149-2146 (1963). L'appareillage pour la synthèse automatisée de polypeptides est disponible dans le commerce auprès de fournisseurs tels que Perkin Elmer/Applied BioSystems Division (Foster City, CA) , et il peut fonctionner selon les instructions du fabricant.
Au sein de certains modes de réalisation spécifiques, un polypeptide peut être une protéine de fusion qui comprend de multiples polypeptides tels que décrits ici, ou qui comprend au moins un polypeptide tel que décrit ici et une séquence non apparentée, des exemples de telles protéines comprenant des protéines du tétanos, de la tuberculose et de l'hépatite (voir, par exemple, Stoute et al., New Engl. J. Med. 336: 86-91 (1997)). Un partenaire de fusion peut, par exemple, aider à fournir des épitopes auxiliaires T (un partenaire de fusion immunologique), de préférence des épitopes auxiliaires T reconnus par les êtres humains, ou il peut aider à exprimer la protéine (un amplificateur d'expression) à des rendements supérieurs par rapport à la protéine recombinante native. Certains partenaires de fusion préférés sont des partenaires de fusion à la fois immunologiques et amplificateurs de l'expression. D'autres partenaires de fusion peuvent être choisis de façon à augmenter la solubilité de la protéine ou à permettre à la protéine d'être ciblée vers des compartiments intracellulaires souhaités. Encore d'autres partenaires de fusion comprennent des marqueurs d'affinité, qui facilitent la purification de la protéine.
Les protéines de fusion peuvent être généralement préparées en utilisant des techniques classiques, y compris une conjugaison chimique. De préférence, une protéine de fusion est exprimée sous la forme d'une protéine recombinante, permettant la production de taux accrus, par rapport à une protéine non fusionnée, dans un système d'expression. En bref, des séquences d'ADN codant pour les composants polypeptidiques peuvent être assemblées séparément, et ligaturées dans un vecteur d'expression approprié. L'extrémité 3' de la séquence d'ADN codant pour un composant polypeptidique est ligaturée, avec ou sans lieur (« linker ») peptidique, à l'extrémité 5' d'une séquence d'ADN codant pour le second composant polypeptidique de telle façon que les cadres de lecture des séquences sont en phase. Ceci permet la traduction en une seule protéine de fusion qui conserve l'activité biologique des deux composants polypeptidiques.
Une séquence de lieur (« linker ») peptidique peut être employée pour séparer les premier et second composants polypeptidiques d'une distance suffisante pour s'assurer que chaque polypeptide se replie dans ses structures secondaire et tertiaire. Une telle séquence de lieur (« linker ») peptidique est incorporée dans la protéine de fusion en utilisant des techniques classiques bien connues de l'état de l'art. Des séquences de lieurs (« linker ») peptidiques appropriées peuvent être choisies en se basant sur les facteurs suivants : (1) leur capacité à adopter une conformation étendue flexible ; (2) leur incapacité à adopter une structure secondaire qui pourrait interagir avec des épitopes fonctionnels sur les premier et second polypeptides ; et (3) le manque de résidus hydrophobes ou chargés qui pourraient réagir avec les épitopes fonctionnels des polypeptides. Les séquences de lieurs (« linker ») peptidiques préférées contiennent des résidus Gly, Asn et Ser. D'autres acides aminés presque neutres, comme Thr et Ala, peuvent être également utilisés dans la séquence lieur(« linker ») . Les séquences d'acides aminés qui peuvent être employées utilement en tant que lieurs (« linker ») comprennent celles divulguées dans Maratea et al., Gene 40: 39-46 (1985) ; Murphy et al., Proc. Natl. Acad. Sci. USA 83: 8258-8262 (1986) ; brevet US No. 4 935 233 et brevet US No. 4 751 180. La séquence lieur (« linker ») peut généralement avoir une longueur de 1 à environ 50 acides aminés. Des séquences lieurs (« linker ») ne sont pas nécessaires lorsque les premier et second polypeptides comportent des régions d'acides aminés N-terminales non essentielles qui peuvent être utilisées pour séparer les domaines fonctionnels et prévenir les interférences stériques.
Adjuvants
Dans un autre mode de réalisation de l'un quelconque des aspects de l'invention, la composition immunogène comprend en outre un adjuvant. Dans un mode de réalisation, l'adjuvant comprend de 1'hydroxyde d'aluminium ou du phosphate d'aluminium. En variante, la composition immunogène de l'invention peut comprendre un adjuvant exempt d'aluminium, la composition immunogène est formulée avec un adjuvant qui est exempt d'aluminium ou de sels d'aluminium, c'est-à-dire, un adjuvant ou un système d'adjuvant exempt d'aluminium.
Dans certains modes de réalisation, la composition immunogène est formulée avec un adjuvant comprenant une fraction de saponine immunologiquement active présentée sous la forme d'un liposome. L'adjuvant peut comprendre en outre un lipopolysaccharide. L'adjuvant peut comprendre du QS21. Par exemple, dans un mode de réalisation, l'adjuvant contient du QS21 dans une formulation liposomiale. Dans un mode de réalisation, le système d'adjuvant comprend du 3D-MPL et du QS21. Par exemple, dans un mode de réalisation, l'adjuvant contient du 3D-MPL et du QS21 dans une formulation liposomiale. Eventuellement, le système d'adjuvant contient également du cholestérol. Dans un mode de réalisation spécifique, l'adjuvant comprend du QS21 et du cholestérol. Eventuellement, le système d'adjuvant contient de la 1,2-dioléoyl-sn-glycéro-3-phosphocholine (DOPC). Par exemple, un système d'adjuvant spécifique contient du cholestérol, de la DOPC, du 3D-MPL et du QS21.
Dans un exemple spécifique, la composition immunogène comprend un adjuvant formulé dans une dose qui comprend : d'environ 0,1 à environ 0,5 mg de cholestérol ; d'environ 0,25 à environ 2 mg de DOPC ; d'environ 10 pg à environ 100 pg de 3D-MPL ; et d'environ 10 pg à environ 100 pg de QS21. Dans un autre exemple spécifique, la composition immunogène comprend un adjuvant formulé dans une dose qui comprend : d'environ 0,1 à environ 0,5 mg de cholestérol ; d'environ 0,25 à environ 2 mg de DOPC ; d'environ 10 pg à environ 70 pg de 3D-MPL ; et d'environ 10 pg à environ 70 pg de QS21. Dans une formulation spécifique, l'adjuvant est formulé dans une seule dose qui contient : environ 0,25 mg de cholestérol ; environ 1,0 mg de DOPC ; environ 50 pg de 3D-MPL ; et environ 50 pg de QS21. Dans d'autres modes de réalisation, la composition immunogène est formulée avec une dose fractionnée (c'est-à-dire, une dose qui est une fraction des formulations à doses simples précédentes, comme une moitié de la quantité précédente des composants (cholestérol, DOPC, 3D-MPL et QS21), 1/4 de la quantité précédente des composants, ou une autre dose fractionnée (par exemple, 1/3, 1/6, etc.) de la quantité précédente des composants.
Dans un mode de réalisation, les compositions immunogènes selon l'invention comprennent un adjuvant contenant des combinaisons de lipopolysaccharide et de saponines de Quillaja qui ont été divulguées auparavant, par exemple dans le document EP 0671948. Ce brevet a démontré une forte synergie lorsqu'un lipopolysaccharide (3D-MPL) a été combiné avec une saponine de Quillaja (QS21). L'adjuvant peut comprendre en outre des oligonucléotides immunostimulants (par exemple, CpG) ou un support.
Une saponine particulièrement appropriée pour une utilisation dans la présente invention est Quil A et ses dérivés. Quil A est une préparation de saponine isolée de l'arbre d'Amérique du Sud Quillaja Saponaria Molina et elle a été décrite pour la première fois par Dalsgaard et al. en 1974 ("Saponin adjuvants", Archiv. für die gesamte Virusforschung, Vol. 44, Springer Verlag, Berlin, p243-254) comme étant dotée d'une activité d'adjuvant. Il a été isolé de Quil A par CLHP des fragments purifiés qui conservent l'activité d'adjuvant sans la toxicité associée à Quil A (EP 0 362 278), par exemple QS7 et QS21 (également connus en tant que QA7 et QA21) . QS21 est une saponine naturelle dérivée de l'écorce de Quillaja saponaria Molina, qui induit les lymphocytes T cytotoxiques CD8+ (LTC), les cellules Thl et une réponse prédominante en anticorps IgG2a et elle représente une saponine préférée dans le contexte de la présente invention.
Lorsque l'adjuvant comprend une fraction de saponine immunologiquement active présentée sous la forme d'un liposome, l'adjuvant peut comprendre en outre un stérol. De façon appropriée, le stérol est fourni dans un rapport de saponine/stérol de 1/1 à 1/100 p/p, comme de 1/1 à 1/10 p/p ; ou 1/1 à 1/5 p/p.
Dans un mode de réalisation spécifique, QS21 est fourni dans sa composition la moins réactogène où il est neutralisé par un stérol exogène, comme le cholestérol par exemple. Il existe plusieurs formes particulières de compositions moins réactogènes dans lesquelles QS21 est neutralisé par un cholestérol exogène. Dans un mode de réalisation spécifique, la saponine/stérol est sous la forme d'une structure liposomiale (WO 96/33739, exemple 1) . Dans ce mode de réalisation, les liposomes contiennent de façon appropriée un lipide neutre, par exemple la phosphatidylcholine, qui est de façon appropriée non cristalline à température ambiante, par exemple la phosphatidylcholine de jaune d'œuf, la dioléoyl-phosphatidylcholine (DOPC) ou la dilauryl-phosphatidylcholine. Les liposomes peuvent également contenir un lipide chargé qui augmente la stabilité de la structure liposome-QS21 pour des liposomes composés de lipides saturés. Dans ces cas, la quantité de lipide chargé est de façon appropriée de 1 à 20 % p/p, de préférence 5 à 10 %. Le rapport du stérol sur le phospholipide est de 1 à 50 % (mol/mol) , de façon appropriée 20 à 25 %.
Les stérols appropriés comprennent le β-sitostérol, le stigmastérol, 1'ergostérol, 1'ergocalciférol et le cholestérol. Dans un mode de réalisation particulier, la composition de l'adjuvant comprend du cholestérol en tant que stérol. Ces stérols sont bien connus de l'état de l'art, par exemple le cholestérol est divulgué dans l'Index Merck, llème édition, page 341, comme un stérol existant à l'état naturel trouvé dans la graisse animale.
Lorsque la fraction de saponine active est QS21, le rapport du QS21/stérol sera généralement de l'ordre de 1/100 à 1/1 (p/p), de façon appropriée entre 1/10 et 1/1 (p/p) , et de préférence 1/5 à 1/1 (p/p) . De façon appropriée, un excès de stérol est présent, le rapport du QS21/stérol étant au moins de 1/2 (p/p). Dans un mode de réalisation, le rapport du QS21/stérol est de 1/5 (p/p). Le stérol est de façon appropriée du cholestérol.
Dans un mode de réalisation, l'invention fournit une dose d'une composition immunogène comprenant de la saponine immunologiquement active, de préférence du QS21, à un taux d'environ 1 à environ 70 pg par dose, par exemple dans une quantité d'environ 50 pg.
Dans un mode de réalisation, l'invention propose une dose d'une composition immunogène comprenant de la saponine immunologiquement active, de préférence du QS21, à un taux de 60 pg ou inférieur, par exemple entre 1 et 60 pg. Dans un mode de réalisation, la dose de la composition immunogène comprend du QS21 à un taux approximativement autour de 50 pg, par exemple entre 45 et 55 pg, de façon appropriée entre 46 et 54 pg ou entre 47 et 53 pg ou entre 48 et 52 pg ou entre 49 et 51 pg, ou 50 pg.
Dans un autre mode de réalisation, la dose de la composition immunogène comprend du QS21 à un taux autour de 25 pg, par exemple entre 20 et 30 pg, de façon appropriée entre 21 et 29 pg . ou entre 22 et 28 pg ou entre 23 et 27 pg ou entre 24 et 26 pg, ou 25 pg.
Dans un autre mode de réalisation, la dose de la composition immunogène comprend du QS21 à un taux autour de 10 pg, par exemple entre 5 et 15 pg, de façon appropriée entre 6 et 14 pg, par exemple entre 7 et 13 pg ou entre 8 et 12 pg ou entre 9 et 11 pg, ou 10 pg.
De façon spécifique, un volume de dose vaccinale de 0,5 ml contient 25 pg ou 50 pg de QS21 par dose. De façon spécifique, un volume de dose vaccinale de 0,5 ml contient 50 pg de QS21 par dose.
Dans des compositions comprenant un lipopolysaccharide, le lipopolysaccharide peut être présent dans une quantité d'environ 1 à environ 70 pg par dose, par exemple dans une quantité d'environ 50 pg.
Le lipopolysaccharide peut être un dérivé non toxique du lipide A, particulièrement le monophosphoryl-lipide A ou plus particulièrement le monophosphoryl-lipide A 3-désacylé (3D-MPL).
Le 3D-MPL est vendu sous le nom de MPL par GlaxoSmithKline Biologicals S.A. et il est fait référence à ce dernier par MPL ou 3D-MPL. Voir, par exemple, les brevets US No. 4 436 727 ; 4 877 611 ; 4 866 034 et 4 912 094. Le 3D-MPL favorise principalement les réponses des lymphocytes T CD4+ avec un phénotype IFN-γ (Thl). Le 3D-MPL peut être produit selon les procédés divulgués dans le document GB 2 220 211 A. Du point de vue chimique, il s'agit d'un mélange de monophosphoryl-lipide A 3-désacylé avec 3, 4, 5 ou 6 chaînes acylées. De préférence, dans les compositions de la présente invention, du 3D-MPL à petites particules est utilisé. Le 3D-MPL à petites particules a une taille de particule telle qu'il peut être stérilisé par filtration à travers un filtre de 0,22 μιη. De telles préparations sont décrites dans le document WO 94/21292.
Par conséquent, l'invention fournit une dose d'une composition immunogène comprenant du lipopolysaccharide, de préférence le 3D-MPL, à un taux de 75 pg ou inférieur, par exemple entre 1 et 60 pg.
Dans un mode de réalisation, la dose de la composition immunogène comprend du 3D-MPL à un taux autour de 50 pg, par exemple entre 45 et 55 pg, de façon appropriée entre 46 et 54 pg ou entre 47 et 53 pg ou entre 48 et 52 pg ou entre 49 et 51 pg, ou 50 pg.
Dans un mode de réalisation, la dose de la composition immunogène comprend du 3D-MPL à un taux autour de 25 pg, par exemple entre 20 et 30 pg, de façon appropriée entre 21 et 29 pg ou entre 22 et 28 pg ou entre 23 et 27 pg ou entre 24 et 26 pg, ou 25 pg.
Dans un autre mode de réalisation, la dose de la composition immunogène comprend du 3D-MPL à un taux autour de 10 pg, par exemple entre 5 et 15 pg, de façon appropriée entre 6 et 14 pg, par exemple entre 7 et 13 pg ou entre 8'et 12 pg ou entre 9 et 11 pg, ou 10 pg.
Dans un mode de réalisation, le volume de la dose est de 0,5 ml. Dans un autre mode de réalisation, la composition immunogène est dans un volume approprié pour une dose dont le volume est supérieur à 0,5 ml, par exemple 0,6, 0,7, 0,8, 0,9 ou 1 ml. Dans un autre mode de réalisation, la dose humaine- est située entre 1 ml et 1,5 ml.
De façon spécifique, un volume de dose vaccinale de 0,5 ml contient 25 pg ou 50 pg de 3D-MPL par dose. De façon spécifique, un volume de dose vaccinale de 0,5 ml contient 50 pg de 3D-MPL par dose.
La dose de la composition immunogène selon un aspect quelconque de l'invention se rapporte de façon appropriée à une dose humaine. Par le terme « dose humaine », il est signifié une dose qui est dans un volume approprié pour un usage humain. De façon générale, celle-ci se situe entre 0,3 et 1,5 ml. Dans un mode de réalisation, une dose humaine est de 0,5 ml. Dans un autre mode de réalisation, une dose humaine est supérieure à 0,5 ml, par exemple 0,6, 0,7, 0,8, 0,9 ou 1 ml. Dans un autre mode de réalisation, une dose humaine se situe entre 1 ml et 1,5 ml.
Les compositions appropriées de l'invention sont celles dans lesquelles des liposomes sont préparés initialement sans MPL (comme il est décrit dans le document WO 96/33739) , et le MPL est ensuite ajouté, de façon appropriée sous la forme de petites particules de moins de 100 nm ou des particules susceptibles d'être soumises à une stérilisation par filtration à travers une membrane de 0,22 pm. Par conséquent, le MPL n'est pas contenu au sein de la membrane vésiculaire (connu comme le MPL à l'extérieur). Les compositions dans lesquelles le MPL est contenu au sein de la membrane vésiculaire (connu comme le MPL à l'intérieur) forment également un aspect de l'invention. Le polypeptide comprenant un fragment de la toxine A de C. difficile et/ou un fragment de la toxine B de C. difficile peut être contenu au sein de la membrane vésiculaire ou contenu à l'extérieur de la membrane vésiculaire.
Dans un mode de réalisation spécifique, le QS21 et le 3D-MPL sont présents dans la même concentration finale par dose de la composition immunogène, c'est-à-dire que le rapport du QS21/3D-MPL est de 1/1. Dans un aspect de ce mode de réalisation, une dose de composition immunogène comprend un taux final de 25 pg de 3D-MPL et de 25 pg de QS21 ou de 50 pg de 3D-MPL et de 50 pg de QS21.
Dans un mode de réalisation, l'adjuvant comprend une émulsion huile dans l'eau. Dans un mode de réalisation, l'adjuvant comprend une émulsion huile dans l'eau, où l'émulsion huile dans l'eau comprend une huile métabolisable, un tocol et un émulsifiant. Par exemple, l'émulsion huile dans l'eau peut comprendre une phase huileuse qui incorpore une huile métabolisable, et un composant supplémentaire de la phase huileuse, comme un tocol. L'émulsion huile dans l'eau peut également contenir un composant aqueux, comme une solution saline tamponnée (par exemple, la solution tampon phosphate). En outre, l'émulsion huile dans l'eau contient généralement un émulsifiant. Dans un mode de réalisation, l'huile métabolisable est le squalène. Dans un mode de réalisation, le tocol est 1'alpha-tocophérol. Dans un mode de réalisation, l'émulsifiant est un émulsifiant tensioactif non ionique (comme le monooléate de polyoxyéthylène sorbitane, Polysorbate® 80, TWEEN80™). Dans des exemples de modes de réalisation, l'émulsion huile dans l'eau contient du squalène et de 1'alpha-tocophérol dans un rapport qui est égal ou inférieur à 1 (p/p). L'huile métabolisable dans l'émulsion huile dans l'eau peut être présente dans une quantité de 0,5 à 10 mg. Le tocol dans l'émulsion huile dans l'eau peut être présent dans une quantité de 0,5 à 11 mg. L'agent émulsifiant peut être présent dans une quantité de 0,4 à 4 mg.
Pour qu'une composition huile dans l'eau quelconque soit appropriée pour une administration à un être humain, la phase huileuse du système de l'émulsion doit comprendre une huile métabolisable. La signification du terme huile métabolisable est bien connue de l'état de l'art. Métabolisable peut être défini comme « pouvant être transformé par le métabolisme » (Dorland's Illustrated Medical Dictionary, W.B. Sanders Company, 25th édition (1974)). L'huile peut être toute huile végétale, huile de poisson, huile animale ou huile de synthèse, qui n'est pas toxique envers le receveur et qui peut être transformée par le métabolisme. Les noix, les graines, et les grains sont des sources communes d'huiles végétales. Les huiles de synthèse font également partie de cette invention et peuvent comprendre des huiles disponibles dans le commerce comme NEOBEE® (triglycérides capryliques/capriques fabriqués en utilisant du glycérol provenant de sources d'huiles végétales et d'acides gras à chaîne moyenne (MCT) provenant des huiles de noix de coco ou huile de palme) et d'autres. Une huile métabolisable particulièrement appropriée est le squalène. Le squalène (2,6,10,15,19,23-hexaméthyl-2,6,10,14,18,22-tétracôsahexaène) est une huile insaturée qui se trouve dans de grandes quantités dans l'huile de foie de requin, et dans des quantités inférieures dans l'huile d'olive, l'huile de germe de blé, l'huile de son de riz, et les levures, et elle est une huile particulièrement préférée pour une utilisation dans cette invention. Le squalène est une huile métabolisable en vertu du fait qu'il est un intermédiaire dans la biosynthèse du cholestérol (Index Merck index, lOème Edition, entrée no. 8619).
De façon appropriée, l'huile métabolisable est présente dans la composition de l'adjuvant dans une quantité de 0,5 à 10 mg, de préférence 1 à 10, 2 à 10, 3 à 9, 4 à 8, 5 à 7, ou 5 à 6 mg (par exemple 2 à 3, 5 à 6, ou 9 à 10 mg) , de façon spécifique environ 5,35 mg ou environ 2,14 mg par dose.
Les tocols sont bien connus de l'état de l'art et sont décrits dans le document EP 0382271. De façon appropriée, le tocol est . 1'alpha-tocophérol ou l'un de ses dérivés comme le succinate d'alpha-tocophérol (également connu sous le nom de succinate de vitamine E). Ledit tocol est de façon appropriée présent dans une quantité de 0,5 à 11 mg, de préférence 1 à 11, 2 à 10, 3 à 9, 4à8, 5à7, 5à6mg (par exemple 10 à 11, 5 à 6, 2,5 à 3,5 ou 1 à 3 mg) . Dans un mode de réalisation spécifique, le tocol est présent dans une quantité d'environ 5,94 mg ou environ 2,38 mg par dose. L'émulsion huile dans l'eau comprend en outre un agent émulsifiant. L'agent émulsifiant peut être de façon appropriée du monooléate de polyoxyéthylène sorbitane. Dans un mode de réalisation particulier, l'agent émulsifiant peut être le
Polysorbate® 80 (monooléate de polyoxyéthylène (20) sorbitane) ou le Tween® 80.
Ledit agent émulsifiant est présent de façon appropriée dans la composition de l'adjuvant dans une quantité de 0,1 à 5, 0,2 à 5, 0,3 à 4, 0,4 à 3 ou 2 à 3 mg (par exemple 0,4 à 1,2, 2 à 3 ou 4 à 5 mg) d'agent émulsifiant. Dans un mode de réalisation spécifique, l'agent émulsifiant est présent dans une quantité d'environ 0,97 mg ou environ 2,425 mg.
Dans un mode de réalisation, les quantités des composants spécifiques présents dans la composition sont les quantités présentes dans une dose humaine de 0,5 ml. Dans un autre mode de réalisation, la composition immunogène est dans un volume approprié pour une dose humaine, lequel volume est supérieur à 0,5 ml, par exemple 0,6, 0,7, 0,8, 0,9 ou 1 ml. Dans un autre mode de réalisation, la dose humaine se situe entre 1 ml et 1,5 ml.
Lorsque l'adjuvant est sous une forme liquide et qu'il doit être combiné à une forme liquide d'une composition polypeptidique, la composition de l'adjuvant dans une dose humaine sera une fraction du volume final prévu de la dose humaine, par exemple approximativement la moitié du volume final prévu de la dose humaine, par exemple un volume de 350 μΐ pour une dose humaine prévue de 0,7 ml, ou un volume de 250 μΐ pour une dose humaine prévue de 0,5 ml. La composition de l'adjuvant est diluée lorsqu'elle est combinée avec la composition de l'antigène polypeptidique pour fournir la dose humaine finale du vaccin. Le volume final d'une telle dose dépendra naturellement du volume initial de la composition de l'adjuvant et du volume de la composition de l'antigène polypeptidique ajoutée à la composition de l'adjuvant. Dans une variante de mode de réalisation, un adjuvant liquide est utilisé pour reconstituer une composition polypeptidique lyophilisée. Dans ce mode de réalisation, la dose humaine de la composition de l'adjuvant est approximativement égale au volume final de la dose humaine. La composition de l'adjuvant liquide est ajoutée au flacon contenant la composition polypeptidique lyophilisée. La dose humaine finale peut varier entre 0,5 et 1,5 ml.
Le procédé de production d'émulsions huile dans l'eau est bien connu de l'homme du métier. De façon courante, le procédé comprend le mélange de la phase huileuse contenant le tocol avec un tensioactif comme une solution de PBS/monooléate de polyoxyéthylène sorbitane, suivi d'une homogénéisation en utilisant un homogénéiseur. Il sera clair pour l'homme du métier qu'un procédé comprenant le passage du mélange deux fois à travers une aiguille de seringue sera approprié pour homogénéiser des petits volumes de liquide. Egalement, le procédé d'émulsification dans un microfluidiseur (machine M110S Microfluidics, maximum de 50 passages, pendant une période de 2 minutes à une pression maximale d'entrée de 6 bars (pression de sortie d'environ 850 bars)) pourra être adapté par l'homme du métier pour produire des volumes inférieurs ou supérieurs d'émulsions. L'adaptation pourra être obtenue par une expérimentation de routine comprenant la mesure de l'émulsion résultante jusqu'à l'obtention d'une préparation avec des gouttelettes d'huile du diamètre requis.
Dans une émulsion huile dans l'eau, l'huile et l'émulsifiant devront être dans un support aqueux. Le support aqueux peut être, par exemple, de la solution tampon phosphate.
De préférence, les systèmes d'émulsion huile dans l'eau de la présente invention présentent une petite taille de gouttelettes d'huile située dans la plage submicronique. De façon appropriée, les tailles des gouttelettes se situeront dans la plage de 120 à 750 nm, de manière davantage préférée des tailles de 120 à 600 nm de diamètre. De manière préférée entre toutes, l'émulsion huile dans l'eau contient des gouttelettes d'huile dont au moins 70 % en intensité sont inférieures à 500 nm de diamètre, de manière davantage préférée au moins 80 % en intensité sont inférieures à 300 nm de diamètre, de manière davantage préférée au moins 90 % en intensité se situent dans la plage de 120 à 200 nm de diamètre.
Dans un mode de réalisation, la composition immunogène n'est pas 3 pg ou 10 pg de l'une quelconque de SEQ ID NO : 1 à 7 combinés avec un adjuvant comprenant une émulsion huile dans l'eau comportant 0,125 ml d'émulsion SB62 (volume total), 5,35 mg de squalène, 5,94 mg de DL-a-tocophérol et 2,425 mg de polysorbate 80 par dose de 0,5 ml dose. Dans un mode de réalisation, la composition immunogène n'est pas 3 pg ou 10 pg de l'une quelconque de SEQ ID NO : 1 à 7 combinés avec un adjuvant comprenant une émulsion huile dans l'eau comportant 5,35 mg de squalène, 5,94 mg de DL-a-tocophérol et 2,425 mg de polysorbate 80 par dose de 0,5 ml. Dans un mode de réalisation, la composition immunogène ne contient pas un adjuvant comprenant une émulsion huile dans l'eau comportant du squalène, du DL-a-tocophérol et du polysorbate 80.
Compositions immunogènes et vaccins de l'invention
Dans un mode de réalisation, la composition immunogène a un volume de 0,5 à 1,5 ml.
Dans un mode de réalisation, la composition immunogène comprend en outre des antigènes supplémentaires. Dans un mode de réalisation, les antigènes supplémentaires sont des antigènes dérivés d'une bactérie choisie dans le groupe constitué de S. pneumoniae, H. influenzae, N. meningitidis, E. coli, M. catarrhalis, Clostridium tetani (tétanos), Corynebacterium diphtheriae (diphtérie), Bordetella pertussis (coqueluche), S. epidermidis, entérocoques, S. aureus, et Pseudomonas aeruginosa.
Dans un autre mode de réalisation, la composition immunogène de l'invention peut comprendre d'autres antigènes de C. difficile, par exemple, les protéines de la couche S (WO 01/73030) . Eventuellement, la composition immunogène comprend en outre un saccharide de C. difficile.
Il est en outre fourni un vaccin comprenant une composition immunogène de l'invention et un excipient pharmaceutiquement acceptable.
Les préparations vaccinales contenant des compositions immunogènes de la présente invention peuvent être utilisées pour protéger un mammifère sensible à une infection par C. difficile ou pour traiter un mammifère souffrant d'une infection par C. difficile, au moyen de l'administration dudit vaccin par voie systémique ou mucosale. Ces administrations peuvent comprendre une injection par les voies intramusculaire, intrapéritonéale, intradermique ou sous-cutanée ; ou par une administration mucosale aux systèmes oral/alimentaire, respiratoire, urogénital. Bien que le vaccin de l'invention puisse être administré sous la forme d'une dose simple, ses composants peuvent être également coadministrés ensemble en même temps ou à des temps différents (par exemple, des conjugués saccharidiques pneumococciques pourront être administrés séparément, en même temps ou 1 à 2 semaines après l'administration de l'un quelconque des composants protéiniques bactériens du vaccin pour une coordination des réponses immunitaires l'une par rapport à l'autre). En plus d'une seule voie d'administration, 2 voies différentes d'administration peuvent être utilisées. Par exemple, les saccharides ou les conjugués saccharidiques peuvent être administrés par voie intramusculaire (IM) ou intradermique (ID) et les protéines bactériennes peuvent être administrées par voie intranasale (IN) ou intradermique (ID) . En outre, les vaccins de l'invention peuvent être administrés par IM pour les doses de sensibilisation et IN pour les doses de rappel.
La teneur en toxines dans le vaccin se situera généralement dans la plage de 1 à 250 pg, de préférence 5 à 50 pg, le plus généralement dans la plage de 5 à 25 pg. A la suite d'une vaccination initiale, les sujets peuvent recevoir une ou plusieurs immunisations de rappel espacées de façon adéquate. La préparation de vaccins est décrite de façon générale dans Vaccine Design ("The subunit and adjuvant approach" (eds Powell M.F. &amp; Newman M.J.) (1995) Plénum Press New York). L'encapsulation au sein de liposomes est décrite par Fullerton, brevet US 4 235 877.
Dans un aspect de l'invention, il est proposé un kit vaccinal, comprenant un flacon contenant une composition immunogène de l'invention, éventuellement sous forme lyophilisée, et comprenant en outre un flacon contenant un adjuvant tel que décrit ici. Il est envisagé dans cet aspect de l'invention, que l'adjuvant soit utilisé pour reconstituer la composition immunogène lyophilisée.
Un autre aspect de l'invention est un procédé de prévention ou de traitement d'une infection par C. difficile comprenant l'administration à l'hôte d'une dose immunoprotectrice de la composition immunogène ou du vaccin ou du kit de l'invention.
Dans un mode de réalisation, il est proposé un procédé de prévention ou de traitement d'épisodes primaires et/ou -de récurrence d'une infection par C. difficile comprenant l'administration à l'hôte d'une dose immunoprotectrice de la composition immunogène ou du vaccin ou du kit de l'invention.
Dans un mode de réalisation de l'invention, il est proposé une composition immunogène ou un vaccin de l'invention pour une utilisation dans le traitement ou la prévention d'une affection ou d'une maladie provoquée par C. difficile. Une « maladie de C. difficile » signifie une maladie provoquée en totalité ou en partie par C. difficile. Dans un autre mode de réalisation de l'invention, il est proposé une composition immunogène ou un vaccin de l'invention pour une utilisation dans le traitement ou la prévention d'une affection ou d'une maladie provoquée en totalité ou en partie par une souche de C. difficile choisie dans le groupe constitué de 078, 019, 023, 027, 033, 034, 036, 045, 058, 059, 063, 066, 075, 078, 080, 111, 112, 203, 250 et 571. De préférence, la souche est la souche 078.
Tel qu'utilisé ici, « traitement » signifie la prévention de l'apparition des symptômes de l'affection ou de la maladie chez un sujet, la prévention de la récurrence des symptômes de l'affection ou de la maladie chez un sujet, le retard de la récurrence des symptômes de l'affection ou de la maladie chez un sujet, la diminution de la gravité ou de la fréquence des symptômes de l'affection ou de la maladie chez un sujet, le ralentissement ou l'élimination de la progression de l'affection et l'élimination partielle ou totale des symptômes de la maladie ou de l'affection chez un sujet.
Dans un autre aspect de l'invention, il est proposé une utilisation d'une composition immunogène ou d'un vaccin de l'invention dans la préparation d'un médicament destiné à la prévention ou au traitement d'une maladie de C. difficile. Dans un autre mode de réalisation, la maladie est une maladie provoquée par une souche de C. difficile choisie dans le groupe constitué de 078, 019, 023, 027, 033, 034, 036, 045, 058, 059, 063, 066, 075, 078, 080, 111, 112, 203, 250 et 571. De préférence, la souche est la souche 078.
Dans un autre aspect de l'invention, il est proposé un procédé de prévention ou de traitement d'une maladie de C. difficile comprenant l'administration de la composition immunogène de l'invention ou du vaccin de l'invention à un sujet mammifère comme un sujet humain. Dans un autre mode de réalisation, la maladie est une maladie provoquée par une souche de C. difficile choisie dans le groupe constitué de 078, 019, 023, 027, 033, 034, 036, 045, 058, 059, 063, 066, 075, 078, 080, 111, 112, 203, 250 et 571. De préférence, la souche est la souche 078. Généralités « Autour » ou « approximativement » sont définis comme se situant à plus ou moins 10 % du chiffre donné pour les objectifs de 1'invention.
Le terme « comprend » signifie « inclut ». Ainsi, sauf si le contexte requiert le contraire, le mot « comprend », et des variations telles que « comprennent » et « comprenant » seront compris comme impliquant l'inclusion d'un composé ou d'une composition indiquée (par exemple, acide nucléique, polypeptide, antigène) ou d'une étape, ou d'un groupe de composés ou d'étapes, mais pas l'exclusion de tout autre composé, composition, étape, - ou groupe de ceux-ci. L'abréviation, « e.g. » est dérivée du latin exempli gratia, et est utilisée ici pour indiquer un exemple non limitatif. Ainsi, l'abréviation « e.g. » est synonyme du terme « par exemple ».
La numérotation des acides aminés utilisée ici est dérivée des séquences pour la CDTa, la CDTb, la toxine A et la toxine B présentées ici en tant que SEQ ID NO : 1, SEQ ID NO : 3, SEQ ID NO : 29 et SEQ ID NO : 30, respectivement, qui doivent être considérées comme des séquences de référence pour ces protéines.
Les modes de réalisation ici concernant les « compositions vaccinales » de l'invention sont également applicables aux modes de réalisation concernant les « compositions immunogènes » de l'invention, et vice versa.
Sauf indication contraire, tous les termes techniques et scientifiques utilisés ici ont la même signification que celle couramment comprise par l'homme du métier dans le domaine auquel cette divulgation appartient. Les définitions des termes courants en biologie moléculaire peuvent se trouver dans Benjamin Lewin, Genes V, publié par Oxford University Press, 1994 (ISBN 0-19-854287-9) ; Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, publié par Blackwell Science Ltd., 1994 (ISBN 0-632-02182-9) ; et Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, publié par VCH Publishers, Inc., 1995 (ISBN 1-56081569-8).
Les termes au singulier « un », « une », « le » et « la » comprennent les articles pluriels sauf si le contexte indique clairement le contraire. De façon similaire, le terme « ou » est censé comprendre « et » sauf si le contexte indique clairement le contraire. Le terme « pluralité » se rapporte à deux ou plus. Il doit en outre être compris que toutes les tailles de bases ou tailles d'acides aminés, et toutes les valeurs de poids moléculaire ou de masse moléculaire, données pour les acides nucléiques ou les polypeptides sont approximatives, et sont fournies pour la description. En outre, les limitations numériques données en ce qui concerne les concentrations ou les taux d'une substance, comme un antigène, peuvent être approximatives.
Toutes les références ou les demandes de brevet citées au sein de ce mémoire de brevet sont incorporées par référence ici dans leur intégralité.
Pour que cette invention soit mieux comprise, les exemples suivants sont présentés. Ces exemples ont uniquement des objectifs d'illustration, et ils ne doivent pas être interprétés comme limitant la portée de l'invention d'une manière quelconque.
EXEMPLES L'adjuvant AS01B auquel il est fait référence est un adjuvant contenant 50 pg de QS21 présenté sous la forme d'un liposome, 50 pg de 3D-MPL, 0,25 mg de cholestérol et 1,0 mg de DOPC par dose de 0,5 ml. Une dose de 50 pl appropriée pour immuniser des souris contient 5 pg de QS21, 5 pg de 3D-MPL, 0,025 mg de cholestérol et 0,1 mg de DOPC.
Exemple 1 - Conception des antigènes de toxine binaire
La toxine binaire (autre nom : toxine ADP-ribosyl-transférase) est composée de deux composants : le composant enzymatique, nommé CDTa et le composant de transport et de liaison, nommé CDTb.
En se basant sur les données de la littérature et les informations disponibles pour les composants d'autres toxines binaires bactériennes, la CDTb a pu être divisée en cinq domaines. Le premier est le prodomaine, son clivage par une enzyme dotée d'une activité chymotrypsine permet 1'heptamérisation de la protéine mature. Le deuxième domaine permet la liaison à la CDTa. Les troisième et quatrième sont impliqués dans 1'oligomérisation et l'insertion membranaire. Finalement, le dernier domaine est le domaine de liaison aux récepteurs de la cellule hôte. CDTb mature
Afin d'éviter l'étape d'activation par la chymotrypsine dans le traitement de la CDTb, il a été tenté d'exprimer seulement la protéine CDTb mature (sans son peptide signal et son prodomaine).
Dans la littérature (Protein Expression and Purification, 2010, vol. 74 : 42-48), la CDTb mature a été décrite comme démarrant au niveau de la Leucine 210 de SEQ ID NO : 3. Cette CDTb mature a été nommée CDTb". D'autres données expérimentales suggèrent que la CDTb démarre au niveau de la Sérine 212 de SEQ ID NO : 3. Ce résultat a été supporté par l'analyse d'une structure tridimensionnelle modélisée de la CDTb. Ce modèle a été construit en utilisant SwissModel (Bioinformatics, 2006, vol. 22 : 195-201). La matrice utilisée pour la modélisation par homologie a été le composant B de Bacillus anthracis, nommé antigène protecteur ou PA (numéro d'accession de la banque de données des protéines : 3TEW).
Domaine de liaison aux récepteurs seul de la CDTb
Le modèle de structure tridimensionnelle par homologie obtenu pour la CDTb en utilisant l'antigène PA provenant de B. anthraxis est exact pour les quatre premiers domaines de la CDTb mais pas pour le domaine de liaison aux récepteurs (ces domaines de la CDTb et du PA sont trop différents). Pour concevoir des constructions exprimant le domaine de liaison aux récepteurs seul, la partie C-terminale du quatrième domaine a été analysée sur le modèle de structure tridimensionnelle afin de décider où le dernier domaine démarrera.
Deux versions du domaine de liaison aux récepteurs de la CDTb ont été conçues. Dans la première, ce domaine démarre juste après la structure tridimensionnelle modélisée du quatrième domaine. Dans cette version, le domaine de liaison aux récepteurs de la CDTb comportera probablement un long peptide flexible dans sa partie N-terminale. La seconde version du domaine de liaison aux récepteurs démarre où les structures bidimensionnelles prédites effectuées sur la partie C-terminale de la CDTb (prédictions faites en utilisant le programme Psipred, Bioinformatics, 2000, vol. 16 : 404-405) deviennent plus compactes après un manque de structures secondaires prédites. Ceci pourrait indiquer le début d'un nouveau domaine structural. Dans cette seconde version, aucun peptide flexible n'est présent au niveau de la partie N-terminale du domaine de liaison aux récepteurs isolé de la CDTb.
Mutations du motif de liaison au Ca2+ de la CDTb
En suivant les informations de la littérature, des mutations dans le domaine de liaison au Ca2+ du composant B de la toxine Iota de Clostridium perfringens (Ib) abolissent la liaison avec le composant A de cette toxine binaire (la) . Ces mutations pourraient être très intéressantes dans le cas d'une composition vaccinale contenant un mélange de protéine CDTb mature et de protéine CDTa de type sauvage.
En utilisant un alignement de séquences de protéines multiples, ces mutations ont été localisées sur la séquence de la CDTb et mutées. Cela concerne les résidus Asp220, Asp222 et Asp224 de SEQ ID NO : 3. Ils ont été mutés sur les résidus Ala.
Prodomaine de la CDTb
Afin de tenter de diminuer les problèmes de dégradation observés avec la construction C55 (CDTb avec le prodomaine éliminé) dans du gel, quelques tests de coexpression ont été évalués. L'hypothèse de travail en effectuant ceci est d'améliorer le repliement de la CDTb mature.
Deux limites du prodomaine ont été proposées. La première démarre au niveau du résidu 43 de la CDTb de SEQ ID NO : 3 (après le clivage du peptide signal) et finit au niveau du résidu Met211 (étant donné que le premier résidu déterminé expérimentalement de la CDTb mature est Ser212) . Le second prodomaine a été conçu en se basant sur la structure tridimensionnelle prédite de la CDTb. Le lieur (« linker ») existant entre le prodomaine et le premier domaine structural de la protéine CDTb mature est éliminé dans cette construction.
Exemple 2 - Clonage, expression et purification de la protéine CDTb de C. difficile
Plasmide d'expression et souche recombinante : C37 et C55 (telles que présentées dans le tableau A).
Les gènes codant pour la protéine tronquée de CDTb sans le peptide signal (Pro-CDTb', C37) et un marqueur His à l'extrémité C-terminale ont été clonés dans le vecteur d'expression pGEX-6pl (GE Healthcare) en utilisant les sites de restriction
BamHI/Xhol en utilisant des procédures classiques. Ce vecteur comprenait de la GST (glutathion-S-transférase) en tant que partenaire de fusion à l'extrémité N-terminale de la CDTb' (GST-Pro-CDTb') . La construction finale a été produite par la transformation de la souche d'E. coli BL21 (DE3) avec le vecteur d'expression recombinant selon le procédé classique avec des cellules traitées au CaCl2 (Hanahan D. « Plasmid transformation by Simanis. » Dans Glover, D. M. (Ed) , DNA cloning. IRL Press London. (1985): p. 109-135.).
Les gènes codant pour la protéine tronquée de CDTb sans peptide signal ni prodomaine (CDTb" : C55) et un marqueur His à l'extrémité C-terminale ont été clonés dans le vecteur d'expression pET24b(+) (Novagen) en utilisant les sites de restriction Ndel/Xhol en utilisant des procédures classiques. Les constructions finales ont été produites par la transformation de la souche modifiée d'E. coli B834 (DE3) avec les vecteurs d'expression recombinants appropriés selon le procédé classique avec des cellules traitées au· CaCl2 (Hanahan D. « Plasmid transformation by Simanis. » Dans Glover, D. M. (Ed), DNA cloning. IRL Press London. (1985): p. 109-135.).
Souche hôte BL21(DE3). BL21(DE3) est un dérivé non auxotrophe pour la méthionine de B834. Les souches avec la désignation (DE3) sont lysogènes pour un prophage λ qui contient une T7 ARN polymérase inductible par IPTG. Les lysogènes λ DE3 sont conçus pour l'expression de protéines à partir de vecteurs pET. Cette souche est également déficiente en protéases Ion et ompT. Génotype : souche E. coli BL21::DE3, F" ompT hsdSB(rB_ mB~) gai dcm (DE3). B834 est la souche parentale pour BL21. Ces hôtes déficients en protéases sont auxotrophes pour la méthionine. Les lysogènes λ DE3 sont conçus pour l'expression de protéines à partir de vecteurs pET. Cette souche est également déficiente en protéases Ion et ompT.
Modification : inclusion du gène PGL pour éviter la phosphogluconoylation dans le locus de la biotine (la souche est auxotrophe pour la biotine). Génotype : souche B834::DE3, F- ompT hsdSB{xB - mB-) gai dcm met (DE3)
Modification : Δ(bioA-bioD) : :PGL Expression des protéines recombinantes :
Des transformants d'E. coli ont été prélevés d'une plaque de gélose et utilisés pour inoculer 200 ml de bouillon LBT ± 1 % (p/v) de glucose +/- kanamycine (50 pg/ml) ou ampicilline (100 pg/ml) pour obtenir une D.0.6oonm entre 0,1 et 0,2. Les cultures ont été incubées pendant une nuit à 37 °C, 250 tr/min.
Les cultures d'une nuit ont été diluées au 1/20 dans 500 ml de milieu LBT contenant +/- kanamycine (50 pg/ml) ou ampicilline (100 pg/ml) et cultivées à 37 °C à une vitesse d'agitation de 250 tr/min pour atteindre une D.O.620 de 0,5/0,6. A une D.O. à 600 nm autour de 0,6, les cultures ont été refroidies avant l'induction de l'expression de la protéine recombinante par l'addition de 1 mM d'isopropyl-p-D-l-thiogalactopyranoside (IPTG ; EMD Chemicals Inc., numéro de catalogue : 5815) et incubées pendant une nuit à 23 °C, 250 tr/min.
Après les inductions pendant une nuit (autour de 16 heures), les D.O. à 600 nm ont été évaluées après l'induction et les cultures ont été centrifugées à 14 000 tr/min pendant 15 minutes et les culots ont été congelés à -20 °C séparément.
Purification C37 (SEQ ID NO: 5)
Le culot bactérien a été remis en suspension dans 50 mM de tampon bicine (pH 8,0) contenant 500 mM de NaCl, 5 mM de TCEP (Thermo Scientific Pierce, chlorhydrate de (2-carboxyéthyl)-phosphine) et un mélange d'inhibiteurs de protéases (Complété, Roche). Les bactéries ont été lysées en utilisant un système de presse de French 3 X 20 000 PSI. Les composants solubles (surnageant) et insolubles (culot) ont été séparés par centrifugation à 20 000 g pendant 30 min à 4 °C.
La protéine marquée par 6-His a été purifiée dans des conditions natives sur IMAC. Les composants solubles ont été chargés sur une colonne GE Histrap de 5 ml (GE) pré-équilibrée avec le même tampon que celui utilisé pour la remise en suspension des bactéries. Après le chargement sur la colonne, la colonne a été lavée avec un tampon bicine à 50 mM pH 8,0, contenant 150 mM de NaCl, 25 mM d'imidazole, 1 mM de TCEP. L'élution a été effectuée en utilisant un tampon bicine à 50 mM pH 8,0 contenant 150 mM de NaCl, 250 mM d'imidazole, 1 mM de TCEP.
Après une étape de dessalage (BIORAD Bio-Gel P6 Desalting) dans 50 mM de tampon bicine pH 8,0 contenant 150 mM de NaCl et 1 mM de TCEP, le produit a été traité (pendant une nuit à 4°C) avec des protéases PreScission (GE-Healthcare) afin de cliver le marqueur GST. Après un traitement d'une nuit, 0,2 % de Tween 20 a été ajouté au mélange de digestion.
Ensuite la protéine a été passée à travers une colonne d'affinité pour la GST (GE GSTrap FF) pré-équilibrée avec du tampon bicine à 50 mM pH 8,0 contenant 150 mM de NaCl, 1 mM de TCEP, 0,2 % de Tween 20 et 20 mM de glutathion réduit, afin d'éliminer le marqueur clivé, la protéine de fusion non clivée et les protéases PreScission.
La protéine dépourvue de la GST a été recueillie dans la fraction non retenue et chargée à nouveau sur une colonne GE Histrap de 5 ml (GE) pré-équilibrée avec 50 mM de tampon bicine pH 8,0 contenant 150 mM de NaCl, 1 mM de TCEP, 0,2 % de Tween20. Après le chargement sur la colonne, la colonne a été lavée avec du tampon bicine à 50 mM pH 8,0, contenant 150 mM de NaCl, 0,2 % de Tween 20, 1 mM de TCEP et 10 mM d'imidazole. L'élution a été effectuée en utilisant un tampon bicine à 50 mM pH 8,0 contenant 150 mM de NaCl, 0,2 % de Tween 20, 1 mM de TCEP et 500 mM d'imidazole.
Après une étape de dessalage (BIORAD Bio-Gel P6 Desalting) dans 50 mM de tampon bicine pH 8,0 contenant 150 mM de NaCl, 1 mM de TCEP et 0,2 % de Tween 20, le produit a été traité avec de l'a-chymotrypsine (provenant de pancréas bovin - Sigma), ceci suivi d'un traitement par un inhibiteur de la trypsine (provenant de blanc d'œuf - Sigma) . L'activation complète de la CDTb par la chymotrypsine a été suivie par SDS-PAGE.
Le produit totalement activé a été chargé sur une chromatographie SEC (SUPERDEX™ 75) dans 50 mM de tampon bicine pH 8,0 contenant 300 mM de NaCl, 1 mM de TCEP. Les fractions contenant l'antigène CDTb ont été sélectionnées sur la base de la pureté par SDS-PAGE. La concentration de la protéine a été déterminée en utilisant le dosage des protéines de Lowry RC/DC de Bio-Rad. Le vrac purifié a été stérilisé par filtration sur 0,22 μπι et stocké à -80 °C. C55 (SEQ ID NO: 7)
Le culot bactérien a été remis en suspension dans 50 mM de tampon bicine (pH 8,0) contenant 150 mM de NaCl, 5 mM de TCEP (Thermo Scientific Pierce, chlorhydrate de (2-carboxyéthyl)-phosphine) , 0,4 % d'Empigen et un mélange d'inhibiteurs de protéases (Complété, Roche). Les bactéries ont été lysées en utilisant un système de presse de French 3 X 20 000 PSI. Les composants solubles (surnageant) et insolubles (culot) ont été séparés par centrifugation à 20 000 g pendant 30 min à 4 °C.
La protéine marquée par 6-His a été purifiée dans des conditions natives sur IMAC. Les composants solubles ont été chargés sur une colonne GE Histrap de 5 ml (GE) pré-équilibrée avec 50 mM de tampon bicine (pH 8,0) contenant 150 mM de NaCl, 0,15 % d'Empigen, 1 mM de TCEP. Après le chargement sur la colonne, la colonne a été lavée avec un tampon bicine à 50 mM pH 8,0, contenant 150 mM de NaCl, 0,2 % de Tween 20, 20 mM d'imidazole et 1 mM de TCEP. L'élution a été effectuée en utilisant un tampon bicine à 50 mM pH 8,0 contenant 150 mM de NaCl, 0,2 % de Tween 20, 500 mM d'imidazole et 1 mM de TCEP.
Après l'étape de dessalage (BIORAD Bio-Gel P6 Desalting) dans du tampon bicine à 50 mM pH 8,0 contenant 300 mM de NaCl, 1 mM de TCEP, le produit a été chargé sur une chromatographie SEC (SUPERDEX™ 75) dans le même tampon. Les fractions contenant l'antigène CDTb ont été sélectionnées sur la base de la pureté par SDS-PAGE. La concentration de la protéine a été déterminée en utilisant le dosage de protéines de Lowry RC/DC de Bio-Rad. Le vrac purifié a été stérilisé par filtration sur 0,22 pm et stocké à -80 0C.
Exemple 3 - Clonage, expression et purification de la protéine CDTa
Plasmide d'expression et souche recombinante : CDTa pleine longueur (C34, C44, C49, C50, C54, C67, C68, C69, C107, C108, C110 telles que présentées dans le tableau A)
Les gènes codant pour la protéine pleine longueur sans peptide signal de la CDTa avec et sans mutations (voir le tableau A) et un marqueur His à l'extrémité C-terminale ont été clonés dans le vecteur d'expression pET24b( + ) (Novagen) en utilisant les sites de restriction Ndel/Xhol en utilisant des procédures classiques. Les constructions finales ont été produites par la transformation de la souche dΈ. coli HMS174 (DE3) ou BLR (DE3) pLysS (C34) avec chaque vecteur d'expression recombinant selon le procédé classique avec des cellules traitées au CaCl2 (Hanahan D. « Plasmid transformation by Simanis. » In Glover, D. M. (Ed) , DNA cloning. IRL Press London. (1985): p. 109-135.).
Souche hôte : HMS 174 (DE3). Les souches HMS174 fournissent la mutation recA dans un contexte K-12. Les souches avec la désignation (DE3) sont lysogènes pour un prophage λ qui contient une T7 ARN polymérase inductible par IPTG. Les lysogènes λ DE3 sont conçus pour l'expression de protéines à partir de vecteurs pET. Génotype : F” recAl hsdR (rKi2‘ mKi2+) (Rif R) . BLR(DE3) pLysS. BLR est un dérivé recA de BL21. Les souches avec la désignation (DE3) sont lysogènes pour un prophage λ qui contient une T7 ARN polymérase inductible par IPTG. Les lysogènes λ DE3 sont conçus pour l'expression de protéines à partir de vecteurs pET. Cette souche est également déficiente en protéases Ion et ompT, les souches pLysS expriment le T7 lysozyme qui supprime en outre l'expression de base de la T7 ARN polymérase avant l'induction. Génotype : souche E. coli BLR::DE3, F' ompT hsdSB(rs~ me-) gai dcm (DE3) Δ (srl-recA) 306 : : Tnl 0 pLysS (CamR, TetR) .
Expression des protéines recombinantes :
Les transformants d'E. coli ont été prélevés sur une plaque de gélose et utilisés pour inoculer 200 ml de bouillon LBT ± 1 % (p/v) de glucose + kanamycine (50 pg/ml) pour obtenir une D. 0.6oonm entre 0,1 et 0.2. Les cultures ont été incubées pendant une nuit à 37 °C, 250 tr/min.
Chaque culture d'une nuit a été diluée au 1/20 dans 500 ml de milieu LBT contenant de la kanamycine (50 pg/ml) et cultivée à 37 °C à une vitesse d'agitation de 250 tr/min jusqu'à l'obtention d'une D.O. 620 de 0,5/0,6. A une D.0.6oonm autour de 0,6, les cultures ont été refroidies avant l'induction de l'expression de la protéine recombinante par l'addition de 1 mM d'isopropyl-p-D-l-thiogalactopyranoside (IPTG ; EMD Chemicals Inc., numéro de catalogue : 5815) et incubées pendant une nuit à 23 °C, 250 tr/min. ’
Après une induction pendant une nuit (autour de 16 heures), les D. 0.6oonm ont été évaluées après l'induction et les cultures ont été centrifugées à 14 000 tr/min pendant 15 minutes et les culots ont été congelés à -20 °C séparément.
Plasmide d'expression et souche recombinante : extrémité N-terminale de la CDTa (C49 et C50 telles que présentées dans le tableau A)
Les gènes codant pour la protéine de l'extrémité N-terminale, sans le peptide signal de la CDTa (voir le tableau A) et un marqueur His à l'extrémité C-terminale ont été clonés dans le vecteur d'expression pET24b(+) (Novagen) en utilisant les sites de restriction Ndel/Xhol en utilisant des procédures classiques. Les constructions finales ont été produites par la transformation de la souche d'E. coli HMS174 (DE3) avec chaque vecteur d'expression recombinant séparément selon le procédé classique avec des cellules traitées au CaCl2 (Hanahan D. « Plasmid transformation by Simanis. » Dans Glover, D. M. (Ed), DNA cloning. IRL Press London. (1985): p. 109-135.).
Souche hôte :
HMS 174 (DE3). Les souches HMS174 fournissent la mutation recA dans un contexte K-12. Les souches avec la désignation (DE3) sont lysogènes pour un prophage λ qui contient une T7 ARN polymérase inductible par IPTG. Les lysogènes λ DE3 sont conçus pour l'expression de protéines à partir de vecteurs pET. Génotype : F- recAl hsdR(ΐκΐ2~ πΐκΐ2+) (Rif R) .
Expression des protéines recombinantes :
Les transformants d'E. coli ont été prélevés à partir d'une plaque de gélose et utilisés pour inoculer 200 ml de bouillon LBT ± 1 % (p/v) de glucose + kanamycine (50 pg/ml) pour obtenir une D.O. 600nm entre 0,1 et 0,2. Les cultures ont été incubées pendant une nuit à 37 °C, 250 tr/min.
Cette culture d'une nuit a été diluée au 1/20 dans 500 ml de milieu LBT contenant de la kanamycine (50 pg/ml) et cultivée à 37 °C à une vitesse d'agitation de 250 tr/min jusqu'à l'obtention d'une D.O. 620 de 0,5/0,6. A une D.O. 600nm autour de 0,6, la culture a été refroidie avant l'induction de l'expression de la protéine recombinante par l'addition de 1 mM d ' isopropyl^-D-l-thiogalactopyranoside ( IPTG ; EMD Chemicals Inc., numéro de catalogue : 5815) et incubée pendant une nuit à 23 °C, 250 tr/min.
Après une incubation d'une nuit (autour de 16 heures), la D. 0.6oonm a été évaluée après induction et la culture a été centrifugée à 14 000 tr/min pendant 15 minutes et les culots ont été congelés à -20 °C séparément.
Purification
La procédure suivante a été utilisée pour purifier les constructions C34, C44, C49, C50, C54, C67, C69, C107 et C110. Les culots bactériens ont été remis en suspension dans des tampons bicine à 20 mM ou 50 mM (pH 7,5 ou pH 8,0), contenant 500 mM de NaCl, 0 mM ou 5 mM de TCEP (Thermo Scientific Pierce, (chlorhydrate de 2-carboxyéthyl)phosphine)) et un mélange d'inhibiteurs de protéases (Complété, Roche, sans EDTA). Les bactéries ont été lysées en utilisant un système de presse de French 3 X 20 000 PSI. Les composants solubles (surnageant) et insolubles (culot) ont été séparés par centrifugation à 20 000 g pendant 30 min à 4 °C.
Les protéines marquées par 6-His ont été purifiées dans des conditions natives sur IMAC. Les composants solubles ont été chargés sur une colonne GE Histrap de 5 ml (GE) pré-équilibrée avec le même tampon que celui utilisé pour la remise en suspension des bactéries. Après le chargement sur la colonne, la colonne a été lavée avec un tampon bicine à 20 mM ou 50 mM (pH 7,5 ou pH 8,0), contenant 500 mM de NaCl, 10 mM d'imidazole, 5 mM de TCEP. L'élution a été effectuée en utilisant un tampon bicine à 50 mM pH 7,6, 500 mM de NaCl, 1 mM de TCEP et de l'imidazole (250 mM ou 500 mM).
Après les étapes de dessalage (BIORAD Bio-Gel P6 Desalting) et de concentration (Amicon Ultra 10 kDa) , le produit a été chargé sur une chromatographie SEC (SUPERDEX™ 75 ou 200) dans du tampon bicine à 20 mM ou 50 mM (pH 7,5 ou pH 8,0), 150 mM de NaCl, 1 mM de TCEP, pour une autre étape de purification.
Les fractions contenant l'antigène CDTa ont été sélectionnées sur la base de la pureté par SDS-PAGE. La concentration des protéines a été déterminée en utilisant le dosage de protéines de Lowry RC/DC de Bio-Rad. Le vrac purifié a été stérilisé par filtration sur 0,22 pm et stocké à -80 °C.
Exemple 4 - Conception, clonage, expression et purification de la protéine CDTb de C. difficile avec une capacité à former des pores modifiée
Une première stratégie a été évaluée afin de diminuer la cytotoxicité observée pour la CDTb seule : éviter la possibilité pour la CDTb de modifier sa structure dans un endosome afin de former un pore dans la membrane de cet endosome. Les deux stratégies suivies dans cette approche ont été basées sur des données de publications disponibles pour les composants B provenant de la toxine binaire de Bacillus anthracis (C123 et C149) et de Clostridium botulinum (C126, C152, C164 et C166). Les protéines CDTb suivantes ont été conçues :
*Prend en compte le codon de départ Met et le marqueur His Clonage et production
Marqueur His à l'extrémité C-terminale / clonage dans le vecteur pGEX-6pl dans le site BamHl-Xhol / Souches B834(DE3) : génotype : souche d'E. coli BL21::DE3, F- ompT hsdSB(rB- mB-) gai dcm (DE3) .
B834 est la souche parentale pour BL2. Ces hôtes déficients en protéases sont auxotrophes pour la méthionine. Les lysogènes λ DE3 sont conçus pour l'expression de protéines à partir de vecteurs pET et pGEX. Cette souche est également déficiente en protéases Ion et ompT. Antibiotique de la sélection : ampicilline : 50 pg/ml/ production pendant une nuit à 16 °C
Purification (C123, C126, C149 et C152) :
Presse de French avec tampon de lyse : 50 mM de Bicine - 500 mM de NaCl - 5 mM de TCEP - Complété - pH 8,0 Ni-NTA GE Histrap 5 ml (profinia) + dessalage
Equilibrée : 50 mM de Bicine - 500 mM de NaCl, 1 mM de TCEP -pH 8,0
Lavage : 50 mM de Bicine - 150 mM de NaCl, 1 mM de TCEP - imidazole 0 mM - pH 8,0
Elution : 50 mM de Bicine - 150 mM de NaCl, 1 mM de TCEP - imidazole 250 mM - pH 8,0
Dessalage : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP -pH 8, 0
Clivage par Prescission (marqueur GST) : .+ 375 μΐ (500 UI/ 250 μΐ) : 750 UI
Une nuit à 4 °C + addition de Tween 20 à 0,2 % de concentration finale . GSTrap FF (1 ml)
Equilibrée dans le tampon : 50 mM de Bicine - 150 mM de NaCl -1 mM de TCEP - 0,2 % de Tween 20 - pH 8,0 Maintenir la FT
Tampon de lavage : identique au tampon d'équilibrage
Tampon de dilution : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - 0,2 % de Tween 20 - 250 mM d'imidazole - pH 8,0 IMAC GE 5 ml + dessalage
Equilibrée dans le tampon : 50 mM de Bicine - 150 mM de NaCl -1 mM de TCEP - 0,2 % de Tween 20 - pH 8,0
Tampon de lavage : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - 10 mM d'imidazole - 0,2 % de Tween20 - pH 8,0
Tampon de dilution : 50 mM de Bicine - 150 mM de NaCl- 1 mM de TCEP - 250 mM d'imidazole - 0,2 % de Tween 20 - pH 8,0
Tampon de dessalage : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - 0,2 % de Tween 20 - pH 8,0
Dosage RC/DC
Activation : traitement à la chymotrypsine :
100 pg de chymotrypsine (1 pg/μΐ) activent 1 mg de protéine (42 mg + 3,6 mg de chymotrypsine dans 12,5 ml de volume final) 50 min à TA + inactivation : inhibiteur de la chymotrypsine 12,6 mg SEC Superdex 200
Equilibrée : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP -pH 8,0 '
Concentration sur IMAC GE 1 ml + dessalage
Equilibrée dans le tampon : 50 mM de Bicine - 150 mM de NaCl -1 mM de TCEP - pH 8,0
Tampon de lavage : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - pH 8,0
Tampon dilution : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - 250 mM d'imidazole - pH 8,0
Tampon de dessalage : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - pH 8,0
Filtration sur 0,22 pm, dosage RC/DC
La purification de C164 a été réalisée conformément au schéma 1 suivant :
Presse de French avec le tampon de lyse : 50 mM de Bicine - 500 mM de NaCl - 5 mM de TCEP - Complété - pH 8,0 -benzonase
Ni-NTA GE Histrap 5ml
Equilibrée : 50 mM de Bicine -150 mM de NaCl, 1 mM de TCEP - pH 8,0 Lavage : 50 mM de Bicine -150 mM de NaCl -1 mM de TCEP - imidazole 10 mM - pH 8,0 Elution : 50 mM de Bicine -150 mM de NaCl, 1 mM de TCEP - imidazole 250 mM - pH 8,0
Groupe A = lavage 10 mM Groupe B = élution 250 mM
SEC Superdex 200 SEC Superdex 200
Equilibrée : 50 mM de Bicine - Equilibrée : 50 mM de Bicine -
150 mM de NaCl -1 mM de TCEP 150 mM de NaCl -1 mM de TCEP - pH 8,0 - pH 8,0
Filtration sur 0,22 μπι, dosage RC/DC Filtration sur 0,22 pm, dosage RC/DC
Schéma 1
La purification de C166 a été réalisée conformément au schéma 2 suivant :
Presse de French avec le tampon de lyse : 50 mM de Bicine - 500 mM de NaCI - 5 mM de TCEP - pH 7,5
Nr-NTA GE Histraplml
Equilibrée : 50 mM de Bicine - 500 mM de NaCI, 1 mM de TCEP - pH 7,5 Lavage : 50 mM de Bicine -500 mM de NaCI, 1 mM de TCEP - imidazole 10 mM - pH 7,5 Elution : 50 mM de Bicine -150 mM de NaCI -1 mM de TCEP - 500 mM d'imidazole - pH 7,5
SEC : Superdex 200 xk16/60 120ml 50 mM de Bicine -150 mM de NaCI -1 mM de TCEP - pH 7,5
0,22μπι
* Dosage de Lowry RC/DC
Schéma 2
Caractérisation :
La diffusion dynamique de la lumière est utilisée pour évaluer le rayon hydrodynamique en solution des protéines CDTb purifiées, en plus de fournir des informations sur l'homogénéité et de détecter la présence d'agrégats de poids moléculaire élevé au sein d'un échantillon de protéines. Ceci est basé sur le calcul du coefficient de diffusion des différentes espèces qui sont obtenues en mesurant la fluctuation de la diffusion de la lumière, qui dépend de la taille moléculaire et de la forme des protéines, et des autres constituants mineurs de l'échantillon.
Les échantillons des protéines ont été analysés sur un lecteur de plaque Dynapro (Wyatt technology), en utilisant cinq acquisitions de 15 secondes à 25 °C.
Tampon a : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - pH 8, 0
Les résultats sont présentés sur la figure 3.
Exemple 5 - Conception, clonage, expression et purification de la protéine CDTb de C. difficile avec le peptide signal et le prodomaine éliminés et également le domaine de liaison aux récepteurs éliminé et/ou le domaine de liaison à la CDTa éliminé
La raison d'exprimer les différents domaines structuraux de la CDTb seuls a été de comprendre lequel mène au problème de dégradation et d'agrégation. Deux domaines ont été évalués en utilisant cette stratégie : le domaine de liaison aux récepteurs et le domaine de liaison à la CDTa ont été éliminés sur la construction C116 et C117, respectivement. Les domaines « d'oligomérisation » et « d'insertion membranaire » de la CDTb n'ont pas été exprimés séparément parce qu'ils sont potentiellement associés au niveau structural. Les protéines CDTb suivantes ont été conçues :
*Prend en compte le codon de départ de Met et le marqueur His Clonage et production
Marqueur His à l'extrémité C-terminale / clonage dans le vecteur pET24b dans le site Ndel-Xhol / Souches B834(DE3): génotype : souche d'E. coli BL21::DE3, F- ompT hsdSB(rB- mB-) gai dcm (DE3). B834 est la souche parentale pour BL2. Ces hôtes déficients en protéases sont auxotrophes pour la méthionine. Les lysogènes λ DE3 sont conçus pour l'expression de protéines à partir de vecteurs pET. Ce vecteur est également déficient en protéases
Ion et ompT. Antibiotique de la sélection : kanamycine : 50 pg/ml/ production pendant une nuit à 16 °C.
Purification et caractérisation C116
Presse de French
Tampon de lyse : 50 mM de Bicine - 500 mM de NaCl - 5 mM de TCEP - Complété - pH 8,0 Ni-NTA GE Histrap 5 ml
Equilibrée : 8 M d'urée - 50 mM de Bicine - 500 mM de NaCl - 1 mM de TCEP - pH 8,0 .
Lavage : 8 M d'urée - 50 mM de Bicine - 500 mM de NaCl - 1 mM de TCEP - 5 mM d'imidazole - pH 8,0 Repliement sur colonne Histrap
Gradient : 100 min à 1 ml/min : 8M à 50 mM de Bicine - 150 mM de NaCl - 1 mM de TECP - pH 8,0 1 mM de TCEP à 0 M d'urée 50 mM de Bicine - 150 mM de NaCl - 1 mM de TECP - pH 8,0
Elution 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - imidazole 500 mM - pH 7,5 SEC : Superdex 200
50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - pH 7,5 0,22 μτη - Dosage de Lowry RC/DC C117
Presse de French avec le tampon,de lyse : 50 mM de Bicine - 500 mM de NaCl - 5 mM de TCEP, Complété - pH 8,0 Ni-NTA GE Histrap 5 ml (profinia)
Equilibrée : 50 mM de Bicine - 500 mM de NaCl - 1 mM de TCEP -pH 8, 0
Lavage : 50 mM de Bicine - 500 mM de NaCl - 1 mM de TCEP - imidazole 0 mM - pH 8,0
Elution : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - imidazole 500 mM - pH 7,5 SEC Superdex 200
Equilibrée : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP -pH 7,5
Filtration sur 0,22 pm, dosage RC/DC
Exemple 6 - Conception, clonage, expression et purification de la protéine CDTb de C. difficile avec la capacité d'heptamérisation modifiée
Une seconde stratégie a été utilisée afin de diminuer la cytotoxicité observée pour la CDTb seule : éviter 1'heptamérisation de la CDTb. Un modèle tridimensionnel d'un complexe heptamère de la CDTb a été conçu. En utilisant ce modèle, une boucle a été identifiée comme interagissant potentiellement entre les monomères. Deux approches ont été évaluées : l'élimination de cette boucle (C127) ou la mutation des résidus contenus dans cette boucle qui sont probablement impliqués dans l'interaction entre les monomères (C128). Les protéines suivantes ont été conçues :
*Prend en compte le codon de départ de Met et le marqueur His
Clonage et production
Marqueur His à l'extrémité C-terminale / clonage dans le vecteur pET24b dans le site Ndel-Xhol / Souches B834(DE3) : génotype : souche d'E. coli BL21::DE3, F- ompT hsdSB(rB- mB-) gai dcm (DE3) . B834 est la souche parentale pour BL2. Ces hôtes déficients en protéases sont auxotrophes pour la méthionine. Les lysogènes λ DE3 sont conçus pour l'expression de protéines à partir de vecteurs pET. Cette souche est également déficiente en protéases Ion et ompT. Antibiotique de la sélection : kanamycine : 50 yg/ml/ production pendant une nuit à 16 °C.
Purification et caractérisation Presse de French avec le tampon de lyse : 50 mM de Bicine - 150 mM de NaCl - 0,4 % d'Empigen - 5 mM de TCEP - Complété - pH 8,0 Ni-NTA GE Histrap 1 ml (profinia)
Equilibrée : 50 mM de Bicine - 150 mM de NaCl - 0,15 % d'Empigen - 1 mM de TCEP - pH 8,0
Lavage : 50 mM de Bicine - 150 mM de NaCl - 0,2 % de Tween 20 -1 mM de TCEP - imidazole 10 mM - pH 8,0
Elution : 50 mM de Bicine - 150 mM de NaCl - 0,2 % de Tween 20 -1 mM de TCEP - imidazole 500 mM - pH 8,0
Dessalage G-25 : 50 mM de Bicine - 150 mM de NaCl - 0,2 % de Tween 20 - 1 mM de TCEP - pH 8,0
Activation par chymotrypsine SEC : Superdex 200 XK16/60 (120 ml)
Equilibrée : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP -pH 8,0
Concentration : GE-HisTrap (1 ml) + dessalage 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - pH 8,0 0,22 μιη - Dosage de Lowry RC/DC Caractérisation :
La diffusion dynamique de la lumière est utilisée pour évaluer le rayon hydrodynamique en solution des protéines CdtB purifiées, en plus de fournir des informations sur l'homogénéité et de détecter la présence d'agrégats de poids moléculaire élevé au sein d'un échantillon de protéines. Ceci est basé sur le calcul du coefficient de diffusion des différentes espèces qui sont obtenues en mesurant la fluctuation de la diffusion de la lumière, qui dépend de la taille moléculaire et de la forme des protéines, et des autres constituants mineurs de l'échantillon.
Les échantillons des protéines ont été analysés sur un lecteur de plaque Dynapro (Wyatt technology), en utilisant cinq acquisitions de 15 secondes à 25 °C
Tampon a : 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - pH 8,0.
Exemple 7 - Cytotoxicité des protéines CDTb sur des cellules HT29
Les sous-unités de la CDTb activées par la chymotrypsine (C37) seules apparaissent cytotoxiques sur des cellules HT29. Ceci suggère que la formation des pores pourrait être responsable de la cytotoxicité.
Une seconde génération de conception d'antigène a été produite afin d'inhiber l'étape de formation des pores en perturbant les interactions hydrophobes entre les feuillets bêta des protéines individuelles.
Cette sous-unité B de la toxine binaire (partie liant les cellules) des toxines binaires a été ajoutée seule ou mélangée avec la sous-unité A (partie enzymatique) sur des cellules épithéliales de côlon humain (cellules HT29) pour évaluer leur cytotoxicité résiduelle.
La cytotoxicité des C123, C126, C128, C164, C166, C116, C117, C149 et C152 candidates a été testée sur des lignées cellulaires HT2 9.
Test de cytotoxicité de la toxine binaire
Des cellules épithéliales de côlon humain (cellules HT29) ont été cultivées à 37 °C avec 5 % de CO2 dans du DMEM + 10 % de sérum bovin foetal + 1 % de glutamine + 1 % d'antibiotiques (pénicilline-streptomycine-amphotéricine) et elles ont été ensemencées dans des plaques de culture tissulaire noires de 96 puits (Greiner Bio-one, référence : 655090) à une densité de 4 x 103 cellules/puits pour les HT29.
Après 24 h, 50 μΐ du milieu cellulaire ont été prélevés des puits.
Les toxines binaires candidates à caractériser ont été diluées afin d'atteindre 2 pg/ml de CDTa et 6 pg/ml de CDTb. En outre, des dilutions au 1/3 ont été réalisées dans la microplaque (NUNC, référence : 163320). 50 μΐ des dilutions en série des préparations des toxines binaires ont été ajoutés aux plaques noires et les microplaques ont été incubées à 37 °C avec 5 % de CO2 pendant 6 jours.
Après 6 jours, le mélange de la toxine binaire et du milieu a été prélevé des puits et 100 μΐ de colorant Hoechst (BD Pharmingen, référence : 561908) dilué au 1/500 dans de la solution tampon phosphate (PBS) ont été ajoutés dans chaque puits pendant 2 heures dans l'obscurité à température ambiante.
Après la coloration, le colorant Hoechst a été éliminé des puits et la fluorescence des cellules a été mesurée en utilisant un micros'cope Axiovision.
La cytotoxicité est exprimée en pourcentage de surface couverte de coloration fluorescente dans chaque puits. Aucun effet cytotoxique (100 % de récupération) n'est obtenu avec les cellules seules. Et un taux supérieur de cytotoxicité est obtenu avec la toxine binaire totalement activée (CDTa C34 + CDTb C37) . Les résultats sont présentés sur la figure 1, la figure 2 et la figure 8.
Exemple 8 - Analyse des protéines CDTb par DLS
La diffusion dynamique de la lumière (DLS) a été utilisée pour évaluer le rayon hydrodynamique en solution des protéines CDTb purifiées C123, C126 et C128, en plus de fournir des informations sur l'homogénéité et de détecter la présence d'agrégats de poids moléculaire élevé au sein d'un échantillon de protéines. Ceci est basé sur le calcul du coefficient de diffusion des différentes espèces qui sont obtenues en mesurant la fluctuation de la diffusion de la lumière, qui dépend de la taille moléculaire et de la forme des protéines, et des autres constituants mineurs de l'échantillon.
Les échantillons de protéines suivants ont été analysés sur un lecteur de plaque Dynapro (Wyatt technology), en utilisant cinq acquisitions de 15 secondes à 25 °C.
Toutes les protéines sont dans un tampon composé de 50 mM de Bicine - 150 mM de NaCl - 1 mM de TCEP - pH 8,0. Les mesures ont été effectuées sur le vrac purifié maintenu à 4 °C qui n'avait pas été congelé.
Comme il est montré sur la figure 3, à la fois la construction C126 KO pour la formation des pores et la construction C128 KO pour 1'heptamérisation présentent un rayon hydrodynamique de la population principale autour de 3 nm ce qui pourrait être cohérent avec un monomère. La construction C123 KO pour 1'heptamérisation est trouvée sous la forme d'un oligomère ou d'un agrégat homogène de poids moléculaire élevé, avec un rayon hydrodynamique de 15,7 nm.
Le fait que les rayons hydrodynamiques moyens des échantillons totaux sont proches du rayon des populations principales, conjointement avec leur faible polydispersité, suggèrent que les protéines purifiées marquées par his C123, C126 et C128 présentent une distribution homogène des tailles.
Exemple 9 - Conception, clonage, expression et purification d'une protéine de fusion de CDTb de C. difficile comprenant une protéine CDTa pleine longueur et une protéine CDTb
Il y a deux avantages majeurs pour une fusion de CDTa et de CDTb : le premier est un seul traitement pour obtenir 2 protéines. Le second : la CDTa est plus facile que la CDTb à produire -> le placement de la CDTa comme premier partenaire de la fusion pourrait potentiellement avoir un effet positif sur l'aptitude globale au traitement de la fusion. Dans la C139, les deux protéines matures CDTa (sans son peptide signal) et CDTb (sans son peptide signal et sans son prodomaine) ont été fusionnées.
Dans la C139, le partenaire CDTa est muté au niveau de la position 428 (un glutamate est muté en une glutamine) afin de muter l'activité cytotoxique de la CDTa, et le partenaire CDTa de cette fusion est muté en position 45 (une Cys a été mutée en un résidu Tyr) afin d'éviter la dimérisation observée de la CDTa.
Dans la C145, la partie CDTa de la fusion est la même que pour la C139. Le domaine de liaison à la CDTa du partenaire CDTb a été éliminé afin d'éviter potentiellement l'interaction entre ce domaine et le partenaire CDTa. Entre les deux partenaires, un lieur(« linker ») /espaceur (6 résidus Gly) a été ajouté afin d'améliorer la flexibilité structurale entre les partenaires et de permettre un repliement correct indépendant des deux protéines.
Le domaine de liaison aux récepteurs de la CDTb présente un très bon rendement d'expression, est homogène mais moins immunogène que la CDTb mature. Nous avons essayé d'augmenter 1''immunogénicité de ce domaine en le fusionnant au partenaire CDTa mature. Deux limites différentes ont été conçues pour ce domaine de liaison aux récepteurs si bien que 2 fusions ont été évaluées. Dans la C155 et la C156, le partenaire CDTa est le même que pour la C139 et la C145. Dans la C156, entre les deux partenaires de la fusion, un espaceur/lieur (« linker ») a été ajouté (6 résidus Gly) . Ce lieur (« linker ») n'a pas été nécessaire dans la construction C155 parce que le domaine de liaison aux récepteurs de la CDTb utilisé dans la C155 débute par un long peptide non structuré et flexible qui pourra être utilisé en tant que lieur(« linker ») /espaceur.
Les protéines de fusion suivantes ont été conçues :
*Prend en compte le codon de départ de Met et le marqueur His
Clonage et production Comme pour 1'exemple 5.
Exemple 10 - Evaluation du poids moléculaire des constructions de CDTb et de fusion CDTa-CDTb L'ultracentrifugation analytique peut être utilisée pour déterminer l'homogénéité et la distribution des tailles en solution des différentes espèces au sein d'un échantillon de protéines en mesurant la vitesse à laquelle les molécules se déplacent en réponse à une force centrifuge. Ceci est basé sur le calcul des coefficients de sédimentation des différentes espèces qui sont obtenues par une expérience de vitesse de sédimentation, qui dépendent de leur forme et masse moléculaire. 1. Les échantillons des protéines sont centrifugés dans une ultracentrifugeuse analytique Beckman-Coulter ProteomeLab XL-1 à 8000 tr/min, 25000 tr/min ou 42000 tr/min selon la taille de la protéine cible, après que la centrifugeuse AN-βθΤί a été équilibrée à 15 °C. 2. Pour le recueil des données, des balayages sont enregistrés à 280 nm toutes les 5 minutes. 3. L'analyse des données est effectuée en utilisant le programme SEDFIT pour la détermination de la distribution C(S). La détermination du volume partiel spécifique des protéines est effectuée avec le logiciel SEDNTERP pour leur séquence d'acides aminés. Sednterp peut être également utilisé pour déterminer la viscosité et la densité du tampon. 4. Le poids moléculaire des différentes espèces peut être déterminé à partir du tracé de la distribution C(S) (concentration en fonction du coefficient de sédimentation), en considérant qu'il s'agit d'une meilleure représentation des données brutes que la distribution C (M) (concentration en fonction du poids moléculaire) pour caractériser la distribution des tailles d'un mélange.
Exemple 11 - Immunisation de souris avec des protéines sous-unitaires CDTa et CDTb de C. difficile dans une formulation d'ASOlB
Immunisation des souris
Des groupes de 25 souris Balb/C femelles ont été immunisées par IM aux jours 0, 14 et 28 avec 5 pg des sous-unités purifiées de la toxine binaire CDTa et CDTb. Ces antigènes ont été injectés dans une formulation d'ASOlB.
Les titres ELISA anti-CDTa et anti-CDTb ont été déterminés dans des sérums individuels prélevés au jour 42 (14 Post-III) . Les résultats sont présentés sur les figures 4 et 5.
Un test d'inhibition de la cytotoxicité de la toxine binaire a été également effectué sur les sérums Post-III groupés (jour 42). Les résultats sont présentés sur les figures 6 et 7. Réponse ELISA anti-CDTa et anti-CDTb : Protocole Les sous-unités CDTa entière (C34) ou CDTb entière (C37) ont été déposées à 1 pg/ml (pour la CDTa) ou 2 pg/ml (pour la CDTb) dans de la solution tampon phosphate (PBS) sur des plaques de microtitrage à liaison élevée (Nunc MAXISORP™) , pendant une nuit à 4 °C. Les plaques ont été bloquées avec du PBS-BSA à 1 % pendant 30 min à TA sous agitation. Les antisérums des souris sont prédilués au 1/500 dans du PBS-BSA à 0,2 %-TWEEN™ à 0,05 % et ensuite, d'autres dilutions au demi ont été réalisées dans les microplaques et incubées à TA pendant 30 min. Après lavage, les anticorps de souris liés ont été détectés en utilisant des anticorps anti-souris conjugués à de la peroxydase de Jackson ImmunoLaboratories Inc. (référence : 115-035-003) dilués au 1/5000 dans du PBS-BSA à 0,2 %-Tween à 0,05 %. Les anticorps de détection ont été incubés pendant 30 min à température ambiante (TA) sous agitation. La couleur a été développée en utilisant 4 mg d'O-phénylènediamine (OPD) + 5 μΐ de H2O2 pour 10 ml de 0,1 M de tampon citrate pH 4,5 pendant 15 minutes dans l'obscurité à température ambiante. La réaction a été stoppée avec 50 μΐ de HCl, et la densité optique (DO) a été lue à 490 nm par rapport à 620 nm.
Les taux des anticorps anti-CDTa ou anti-CDTb sont exprimés en titres intermédiaires. Un GMT a été calculé pour les 25 échantillons dans chaque groupe de traitement.
Test d'inhibition de la cytotoxicité de la toxine binaire Des cellules épithéliales de côlon humain (cellules HT29 ou HCT-116) ont été cultivées à 37 °C avec 5 % de CO2 dans du DMEM + 10 % de sérum bovin fœtal + 1 % de glutamine + 1 % d'antibiotiques (pénicilline-streptomycine-amphotéricine) et elles ont été ensemencées dans des plaques de culture tissulaire noires de 96 puits (Greiner Bio-one, référence : 655090) à une densité de 4.104 cellules/puits pour les HT29 et 1.104 cellules/puits pour les HCT116.
Après 24 h, le milieu cellulaire a été prélevé des puits.
Les antisérums des souris ont été prédilués au 1/50 dans le milieu cellulaire et ensuite, d'autres dilutions au tiers ont été réalisées dans la microplaque (NUNC, référence : 163320) . 50 μΐ des dilutions en série des antisérums de souris groupés ont été ajoutés aux plaques noires. 50 μΐ d'un mélange de CDTa (25 ng/ml) et de CDTb activée par chymotrypsine (75 ng/ml) ont été ensuite ajoutés et les plaques noires ont été incubées à 37 °C avec 5 % de CO2 pendant 6 jours.
Après 6 jours, le mélange des antisérums et de la toxine a été prélevé des puits et 100 μΐ de colorant Hoescht (BD Pharmingen, référence : 561908) dilué au 1/500 dans de la solution tampon phosphate (PBS) ont été ajoutés dans chaque puits pendant 2 heures dans l'obscurité à température ambiante.
Après la coloration, le colorant Hoescht a été éliminé des puits et la fluorescence des cellules a été mesurée en utilisant un microscope Axiovision.
La surface couverte par la coloration fluorescente a été déterminée dans chaque puits et les titres d'inhibition de la cytotoxicité ont été définis comme l'inverse de la dilution induisant une inhibition de 50 % du signal fluorescent.
Exemple 12 - Cytotoxicité des protéines CDTb sur des cellules HCT116
Les sous-unités CDTb activées par chymotrypsine (C37) seules apparaissent cytotoxiques sur des cellules HCT116. Ceci suggère que la formation des pores pourrait être responsable de la cytotoxicité.
Une seconde génération de conception d'antigène a été produite afin d'inhiber l'étape de formation des pores par perturbation des interactions hydrophobes entre les feuillets bêta des protéines individuelles.
Cette sous-unité B de la toxine binaire (partie liant les cellules) des toxines binaires a été ajoutée seule ou mélangée avec la sous-unité A de la toxine binaire (partie enzymatique) sur des cellules épithéliales de côlon humain (HCT116) pour évaluer leur cytotoxicité résiduelle.
La cytotoxicité des C123, C126, C128, C164, C166, C116, C117, C149 et C152 candidates a été testée sur des lignées cellulaires HCT116.
Test de cytotoxicité de la toxine binaire
Des cellules épithéliales de côlon humain (cellules HCT116) ont été cultivées à 37 °C avec 5 % de CO2 dans du DMEM + 10 % de sérum bovin fœtal + 1 % de glutamine + 1 % d'antibiotiques (pénicilline-streptomycine-amphotéricine) et elles ont été ensemencées dans des plaques de culture tissulaire noires de 96 puits (Greiner Bio-one, référence : 655090) à une densité de 103 cellules/puits pour les HCT116.
Après 24 h, 50 μΐ du milieu cellulaire ont été prélevés des puits.
Les toxines binaires candidates à caractériser ont été diluées afin d'atteindre 2 pg/ml de la CDTa et 6 pg/ml de la CDTb. D'autres dilutions au tiers ont été réalisées dans la microplaque (NUNC, référence : 163320) . 50 μΐ des dilutions en série des préparations de toxines binaires ont été ajoutés aux plaques noires et les microplaques ont été incubées à 37 °C avec 5 % de CO2 pendant 6 jours.
Après 6 jours, les mélanges de toxine binaire et de milieu ont été prélevés des puits et 100 μΐ de colorant Hoechst (BD Pharmingen, référence : 561908) dilué au 1/500 dans de la solution tampon phosphate (PBS) ont été ajoutés dans chaque puits pendant 2 heures dans l'obscurité à température ambiante.
Après la coloration, le colorant Hoechst a été éliminé des puits et la fluorescence des cellules a été mesurée en utilisant un microscope Axiovision.
La cytotoxicité est exprimée en pourcentage de surface couverte de coloration fluorescente dans chaque puits. Aucun effet cytotoxique (100 % de récupération) n'est obtenu avec les cellules seules. Et un taux supérieur de cytotoxicité est obtenu avec la toxine binaire entière activée (CDTa C34 + CDTb C37). Les résultats sont présentés sur la figure 9.
Exemple 13 - Cytotoxicité des protéines de fusion CDTa-CDTb sur des cellules HT29
La cytotoxicité des fusions C139, C145, C155 et C156 a été testée sur des lignées cellulaires HT29. La cytotoxicité résiduelle potentielle associée à la sous-unité CdtB a été évaluée par surcharge avec de la sous-unité CdtA entière. La cytotoxicité résiduelle potentielle associée à la sous-unité CdtA a été évaluée par surcharge avec la sous-unité CdtB entière. L CDTa pleine longueur et la CDTb pleine longueur ont été utilisées en tant que témoins.
Test de cytotoxicité de la toxine binaire
Des cellules épithéliales de côlon humain (cellules HT29) ont été cultivées à 37 °C avec 5 % de CO2 dans du DMEM + 10 % de sérum bovin fœtal + 1 % de glutamine + 1 % d'antibiotiques (pénicilline-streptomycine-amphotéricine) et elles ont été ensemencées dans des plaques de culture tissulaire noires de 96 puits (Greiner Bio-one, référence : 655090) à une densité de 4 x 103 cellules/puits pour les HT29.
Après 24 h, 50 μΐ du milieu cellulaire ont été prélevés des puits.
Les toxines binaires candidates à caractériser ont été diluées afin d'atteindre 2 μg/ml de la CDTa et 6 pg/ml de la CDTb. D'autres dilutions au tiers ont été réalisées dans la microplaque (NUNC, référence : 163320). 50 μΐ des dilutions en série des préparations des toxines binaires ont été ajoutés aux plaques noires et les microplaques ont été incubées à 37 °C avec 5 % de CO2 pendant 6 jours.
Après 6 jours, le mélange de la toxine binaire et du milieu a été prélevé du puits et 100 μΐ de colorant Hoechst (BD Pharmingen, référence : 561908) dilué au 1/500 dans de la solution tampon phosphate (PBS) ont été ajoutés dans chaque puits pendant 2 heures dans l'obscurité à température ambiante.
Après la coloration, le colorant Hoechst a été éliminé des puits et la fluorescence des cellules a été mesurée en utilisant un microscope Axiovision.
La cytotoxicité est exprimée en pourcentage de surface couverte de coloration fluorescente dans chaque puits. Aucun effet cytotoxique (100 % de récupération) n'est obtenu avec les cellules seules. Et un taux supérieur de cytotoxicité est obtenu avec la toxine binaire entière activée (CDTa C34 + CDTb C37). Aucune des fusions n'a été cytotoxique et il n'a été observé aucune cytotoxicité résiduelle associée à la sous-unité CDTb des fusions. Il n'a été observé aucune cytotoxicité résiduelle associée à la sous-unité CDTa dans la fusion CdtA entière-CDTb entière (C139). Une cytotoxicité résiduelle très faible associée à la sous-unité CDTa a été observée avec les 3 fusions n' incluant pas la CdtB pleine longueur (C145, C155, C156).
Les résultats sont présentés sur les figures 10 et 11.
Exemple 14 - Immunisation de souris avec des protéines CDTb ou des fusions CDTa-CDTb de C. difficile dans une formulation d'ASOlB
Immunisation des souris
Des groupes de 12 souris Balb/C femelles ont été immunisées par IM aux jours 0, 14 et 28 avec 1 pg des sous-unités purifiées de la toxine binaire CDTa et CDTb mais avec 2 pg des fusions CDTa-CDTb. Ces antigènes ont été injectés dans une formulation d'ASOlB.
Les titres ELISA anti-CDTa et anti-CDTb ont été déterminés dans des sérums individuels prélevés au jour 42 (14 Post-III). Les résultats sont présentés sur les figures 12 et 13.
Un test d'inhibition de la cytotoxicité de la toxine binaire a été également réalisé sur des sérums Post-III groupés (jour 42) sur des lignées cellulaires HT29 et HCT116. Les résultats sont présentés sur la figure 14. Réponse ELISA anti-CDTa et anti-CDTb : Protocole Les sous-unités CDTa mutée E-428 (C44) ou CDTb non activée (C46) ont été déposées à 1 pg/ml dans de la solution tampon phosphate (PBS) sur des plaques de microtitrage à liaison élevée (Nunc MAXISORP™) , pendant une nuit à 4 °C. Les plaques ont été bloquées avec du PBS-BSA à 1 % pendant 30 min à TA sous agitation. Les antisérums des souris sont prédilués au 1/500 dans du PBS-BSA à 0,2 %-TWEEN™ à 0,05 % et ensuite, d'autres dilutions au demi ont été réalisées dans les microplaques et incubées à TA pendant 30 min. Après le lavage, l'anticorps de souris lié a été détecté en utilisant un anticorps anti-souris conjugué à de la peroxydase de Jackson ImmunoLaboratories Inc. (référence : 115035-003) dilué au 1/5000 dans du PBS-BSA à 0,2 %-Tween à 0,05 %. Les anticorps de détection ont été incubés pendant 30 min à température ambiante (TA) sous agitation. La couleur a été développée en utilisant 4 mg d'O-phénylènediamine (OPD) + 5 μΐ de H2O2 pour 10 ml de tampon citrate à 0,1 M pH 4,5 pendant 15 minutes dans l'obscurité à température ambiante. La réaction a été stoppée avec 50 μΐ de HCl, et la densité optique (DO) a été lue à 490 nm par rapport à 620 nm.
Le taux des anticorps anti-CDTa ou anti-CDTb’ est exprimé en titres intermédiaires. Un GMT a été calculé pour les 12 échantillons dans chaque groupe de traitement.
Les titres en anticorps anti-CdtA obtenus sont représentés sur la figure 12.
Les titres en anticorps anti-CdtB obtenus sont représentés sur la figure 13.
Exemple 15 - Test d'inhibition de la cytotoxicité de la CDTb et de la fusion CDTa-CDTb
Test d'inhibition de la cytotoxicité de la toxine binaire Des cellules épithéliales de côlon humain (cellules HT29 ou HCT-116) ont été cultivées à 37 °C avec 5 % de CO2 dans du DMEM + 10 % de sérum bovin fœtal + 1 % de glutamine + 1 % d'antibiotiques (pénicilline-streptomycine-amphotéricine) et elles ont été ensemencées dans des plaques de culture tissulaire noires de 96 puits (Greiner Bio-one, référence : 655090) à une densité de 4.103 cellules/puits pour les HT29 et 1.103 cellules/puits pour les HCT116.
Après 24 h, le milieu cellulaire a été prélevé des puits.
Les antisérums des souris ont été prédilués au 1/50 dans du milieu cellulaire et ensuite, d'autres dilutions au tiers ont été réalisées dans la microplaque (NUNC, référence : 163320) . 50 μΐ des dilutions en série des antisérums de souris groupés ont été ajoutés aux plaques noires. 50 μΐ d'un mélange de CDTa (25 ng/ml) et de CDTb activée par chymotrypsine (75 ng/ml) ont été ensuite ajoutés et les plaques noires ont été incubées à 37 °C avec 5 % de CO2 pendant 6 jours.
Après 6 jours, le mélange des antisérums et de la toxine a été prélevé des puits et 100 μΐ de colorant Hoescht (BD Pharmingen, référence : 561908) dilué au 1/500 dans de la solution tampon phosphate (PBS) ont été ajoutés dans chaque puits pendant 2 heures dans l'obscurité à température ambiante.
Après la coloration, le colorant Hoescht a été éliminé des puits et la fluorescence des cellules a été mesurée en utilisant un microscope Axiovision.
La surface couverte de coloration fluorescente a été déterminée dans chaque puits et les titres d'inhibition de la cytotoxicité ont été définis comme l'inverse de la dilution induisant une inhibition de 50 % du signal fluorescent.
Les résultats sont présentés sur la figure 14. Résumé des séquences (tableau A)
LISTAGE DE SEQUENCES SEQ ID 1 - Séquence polypeptidique pleine longueur de la CDTa
MKKFRKHKRISNCISILLILYLTLGGLLPNNIYAQDLQSYSEKVCNTTYKAPIERPEDFLKD
KEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQTRNYFYDYQIEANSREKEYK
ELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISLEKFNEFKETIQNKLFKQDGF
KDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTLIEQGYSIKIDKIVRIVIDGK
HYIKAEASVVSSLDFKDDVSKGDSWGKANYNDWSNKLTPNELADVNDYMRGGYTAINNYLIS
NGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEFGLTLTSPEYDFNKLENIDAF
KSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGSPGAYLSAIPGYAGEYEVLLN
HGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID 2 - Séquence polynucléotidique pleine longueur de la CDTa
ATGAAAAAATTTAGGAAACATAAAAGGATTAGTAATTGTATATCTATATTGTTGATATTATA
TCTAACTTTAGGTGGTTTGTTACCTAATAACATTTATGCACAAGACTTACAAAGCTATAGTG
AAAAAGTTTGCAATACTACTTACAAGGCTCCTATAGAAAGACCAGAAGATTTTCTTAAAGAT
AAAGAAAAGGCTAAAGAATGGGAAAGAAAAGAAGCAGAAAGAATAGAGCAAAAACTTGAAAG
ATCTGAAAAAGAAGCATTAGAATCATATAAAAAAGATTCTGTAGAAATAAGTAAATATTCTC
AGACAAGAAATTAT T T T TAT GAT TATCAAATAGAAGCAAAT TC TC GAGAAAAAGAATATAAA
GAACTTCGAAATGCTATATCAAAAAATAAAATAGATAAACCTATGTATGTCTATTATTTTGA
ATCTCCAGAAAAATTTGCATTTAATAAAGTAATAAGAACAGAAAATCAAAACGAAATTTCAT
TAGAAAAATTTAATGAGTTTAAAGAAACTATACAAAACAAATTATTTAAGCAAGATGGATTT
AAAGATATTTCTTTATATGAACCTGGAAAAGGTGATGAAAAACCTACACCATTACTTATGCA
CTTAAAATTACCTAGAAATACTGGTATGTTACCATATACAAATACTAACAATGTAAGTACAT TAATAGAGCAAGGATATAGTATAAAAATAGATAAAATTGTTCGTATAGTTATAGATGGGAAG ,
CACTATATTAAAGCAGAAGCATCTGTTGTAAGTAGTCTTGATTTTAAAGATGATGTAAGTAA
GGGGGATTCTTGGGGTAAAGCAAATTATAATGATTGGAGTAATAAATTAACACCTAATGAAC
TTGCTGATGTAAATGATTATATGCGTGGAGGATATACTGCAATTAATAATTATTTAATATCA
AATGGTCCAGTAAATAATCCTAACCCAGAATTAGATTCTAAAATCACAAACATTGAAAATGC
ATTAAAACGTGAACCTATTCCAACTAATTTAACTGTATATAGAAGATCTGGTCCTCAAGAAT
TTGGTTTAACTCTTACTTCCCCTGAATATGATTTTAACAAACTAGAAAATATAGATGCTTTT
AAATCAAAATGGGAAGGACAAGCACTGTCTTATCCAAACTTTATTAGTACTAGTATTGGTAG
TGTGAATATGAGTGCATTTGCTAAAAGAAAAATAGTACTACGTATAACTATACCTAAAGGTT
CTCCTGGAGCTTATCTATCAGCTATTCCAGGTTATGCAGGTGAATATGAAGTGCTTTTAAAT
CATGGAAGCAAATTTAAAATCAATAAAATTGATTCTTACAAAGATGGTACTATAACAAAATT
AATTGTTGATGCAACATTGATACCTTAA SEQ ID 3 - Séquence polypeptidique pleine longueur de la CDTb
MKIQMRNKKVLSFLTLTAIVSQALVYPVYAQTSTSNHSNKKKEIVNEDILPNNGLMGYYFTD EHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWTGRIIPSKDGEYTLSTDRDDVL MQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLSSPNLYWELDGMKKIIPEENLF LRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAVKWEDS FAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEARDPLVAAYPIVGVGMEKLIIS TNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAVQDSNG ESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQIGNNLS PGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQIKLETTQVSGNFGTKNSSGQI VTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKTPELTIGEAIEKAFGAT KKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLERGMNILIKTPTYFT NFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSN ' SIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNST PEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRV EATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDR ELLVLSVD SEQ ID 4 - Séquence polynucléotidique pleine longueur de la CDTb
AT GAAAATACAAAT GAGGAATAAAAAGGTAT TAAGT T TT TTAACAC T TACAGCTATAGT TAG TCAAGCACTAGTATATCCTGTATATGCTCAAACTAGTACAAGTAATCATTCTAATAAGAAAA AAGAAATTGTAAATGAAGATATACTCCCAAACAATGGATTAATGGGATATTATTTCACAGAT GAGCACTTTAAAGATTTAAAATTAATGGCACCCATAAAAGATGGTAATTTAAAATTTGAAGA AAAGAAAG TAGATAAAC T T C T GGATAAAGACAAAT CAGATG TAAAAT C TATAC GAT GGACAG GAAGAATAATTCCTTCTAAGGATGGTGAATATACATTATCAACTGATAGAGATGATGTCTTA ATGCAAGTAAATACTGAGAGTACTATATCAAATACACTTAAAGTTAATATGAAAAAGGGTAA AGAATATAAAGTTAGAATAGAGC TACAAGATAAAAAT T TAGGTTCAATAGATAATT TATCAT CACCTAATCTTTATTGGGAATTAGATGGTATGAAGAAAATTATACCAGAAGAAAATTTATTC TTAAGAGATTATTCTAATATAGAAAAAGATGATCCATTTATCCCAAATAACAATTTCTTTGA CCCAAAGTTGATGTCTGATTGGGAAGACGAAGATTTGGATACAGATAATGATAATATACCAG
ATTCATATGAACGAAATGGATATACTATTAAGGACTTAATTGCAGTTAAGTGGGAAGATAGT TTTGCAGAACAAGGCTATAAGAAATATGTATCAAATTATTTAGAGTCAAATACTGCTGGAGA TCCATATACAGATTATGAAAAAGCTTCAGGTTCTTTTGACAAGGCTATAAAGACTGAAGCAA GAGATCCGTTAGTTGCAGCATATCCAATTGTTGGAGTAGGTATGGAAAAATTAATTATATCT ACAAATGAACATGCCTCTACTGATCAAGGTAAAACTGTTTCCAGAGCTACTACTAACAGTAA AACTGAATCTAATACAGCTGGTGTGTCTGTTAATGTAGGATATCAAAATGGATTCACAGCTA AT GTAAC TACAAAT TAT T CCCATACAACAGATAAT T CAAC TGC T GTT CAAGATAGTAATGGA GAATCATGGAATACTGGATTAAGTATAAACAAAGGAGAATCTGCATATATAAATGCAAATGT TAGATATTACAACACAGGTACTGCACCTATGTACAAAGTGACACCAACAACAAATTTAGTGT TAGATGGAGATACATTATCAACTATCAAAGCACAAGAAAATCAAATTGGCAATAATCTATCT CCTGGAGATACTTATCCCAAAAAAGGGCTTTCACCTCTAGCTCTTAACACAATGGATCAATT TAGCTCTAGACTGATTCCTATAAATTATGATCAATTAAAAAAATTAGATGCTGGAAAGCAAA TTAAATTAGAAACAACACAAGTAAGTGGAAATTTTGGTACAAAAAATAGTTCTGGACAAATA GTAACAGAAGGAAATAGTTGGTCAGACTATATAAGTCAAATTGACAGTATTTCTGCATCTAT TATATTAGATACAGAGAATGAATCTTACGAAAGAAGAGTTACTGCTAAAAATTTACAGGATC CAGAAGATAAAACACCTGAACTTACAATTGGAGAAGCAATTGAAAAAGCTTTTGGCGCTACT AAAAAAGATGGTTTGTTATATTTTAATGATATACCAATAGATGAAAGTTGTGTTGAACTCAT ATTTGATGATAATACAGCCAATAAGATTAAAGATAGTTTAAAAACTTTGTCTGATAAAAAGA TATATAATGTTAAACTTGAAAGAGGAATGAATATACTTATAAAAACACCAACTTACTTTACT AATTTTGATGATTATAATAATTACCCTAGTACATGGAGTAATGTCAATACTACGAATCAAGA TGGTTTACAAGGCTCAGCAAATAAATTAAATGGTGAGACGAAGATTAAAATCCCTATGTCTG AGCTAAAACCTTATAAACGTTATGTTTTTAGTGGATATTCAAAGGATCCTTTAACATCTAAT TCAATAATTGTAAAGATAAAAGCAAAAGAAGAGAAAACGGATTATTTGGTACCAGAACAAGG ATATACAAAAT T TAGT TAT GAAT T T GAAAC TAC T GAAAAAGAT T C T T C TAATATAGAGATAA CATTAATTGGTAGTGGTACAACATACTTAGATAACTTATCTATTACAGAGCTAAATAGTACT CCTGAAATACTTGATGAACCAGAAGTTAAAATTCCAACTGACCAAGAAATAATGGATGCACA TAAAATATATTTTGCAGATTTAAATTTTAATCCAAGTACAGGAAATACTTATATAAATGGTA TGTATTTTGCACCAACACAAACTAATAAAGAAGCTCTCGATTATATCCAAAAATATAGAGTT GAAGCTACTTTACAATATTCTGGATTTAAAGATATTGGAACTAAAGATAAAGAAATGCGTAA TTATTTAGGAGATCCAAATCAGCCTAAAACTAATTATGTTAATCTTAGGAGTTATTTTACAG GTGGAGAAAATATTATGACATACAAGAAATTAAGAATATATGCAATTACTCCAGACGATAGA GAGTTATTAGTTCTTAGTGTTGATTAG SEQ ID 5 - Construction de CDTb C37. Séquence polypeptidique de la CDTb' (moins le peptide signal) ligaturée à la protéine glutathion-S-transférase (GST soulignée)
MSPILGYWKIKGLVQPTRLLLEYLEEKYEEHLYERDEGDKWRNKKFELGLEFPNLPYYIDGD νΚΕΤΟΞΜΑΙΙΕΥΙΑΡΚΗΝΜΙ^ΟΡΚΕΡΑΕΙΕΜΕΕΰΑνΕΡΙΡΥΰνΒΕΙΑΥΞΚΡΡΕΤΈΚνΡΓΕΞ KLPEMLKMFEPRLCHKTYLNGDHVTHPPFMLYDALPWLYMDPMCLPAFPKLVCFKKRIEAI PQIDKYLKSSKYIAWPLQGWQATFGGGPHPPKSPLEVLFQGPLGSHMEIVNEDILPNNGLMG YYFTDEHFKDLKLMAPIKPGNLKFEEKKVDKLLPKPKSPVKSIRWTGRIIPSKDGEYTLSTP RDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLSSPNLYWELPGMKKIIP EENLFLRPYSNIEKDPPFIPNNNFFPPKLMSDWEPEDLPTDNDNIPPSYERNGYTIKDLIAV KWEPSFAEQGYKKYVSNYLESNTAGPPYTPYEKASGSFPKAIKTEARPPLVAAYPIVGVGME KLIISTNEHASTPQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTPNSTAV QDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQI GNNLSPGPTYPKKGLSPLALNTMPQFSSRLIPINYPQLKKLPAGKQIKLETTQVSGNFGTKN SSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKTPELTIGEAIEK AFGATKKDGLLYFNDIPIPESCVELIFDDNTANKIKPSLKTLSPKKIYNVKLERGMNILIKT PTYFTNFPPYNNYPSTWSNVNTTNQPGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKD PLTSNSIIVKIKAKEEKTPYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSIT ELNSTPEILPEPEVKIPTPQEIMPAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALPYI QKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAI TPDPRELLVLSVPHHHHHH SEQ ID 6 - Construction de CDTb C37. Séquence polynucléotidique de la CDTb' (moins le prodomaine) ligaturée à la protéine glutathion-S-transférase (GST soulignée) atgtcccctatactaqgttattqqaaaattaaqgqccttqtqcaacccactcqacttctttt qqaatatcttqaaqaaaaatatqaagagcatttqtatqaqcqcqatqaaqqtqataaatqqc gaaacaaaaagtttgaattgggtttgqaqtttcccaatcttccttattatattgatqqtqat gttaaattaacacagtctatggccatcatacgttatataqctgacaagcacaacatqttggg tqqttqtccaaaaqaqcqtgcaqagatttcaatgcttqaaqqaqcggttttgqatattaqat acqqtqtttcqagaattgcatatagtaaagactttqaaactctcaaagttgattttcttagc aaqctacctqaaatqctgaaaatqttcgaagatcqtttatqtcataaaacatatttaaatgg tgatcatgtaacccatcctgacttcatgttgtatgacqctcttgatgttgttttatacatgg acccaatgtgcctggatgcgttcccaaaattagtttgttttaaaaaacgtattgaagctatc ccacaaattgataagtacttgaaatccagcaagtatatagcatggcctttgcagggctggca agccacgtttggtggtggcgaccatcctccaaaatcggatctggaagttctgttccaggggc ccctgggatcccatatggaaattgtgaatgaagatattctgccgaataatggtctgatggga tactactttaccgatgaacattttaaagatctgaaactgatggcaccgattaaagatggcaa tctgaaatttgaagaaaaaaaagtggataaactgctggataaagataaaagtgatgtgaaaa gcattcgttggaccggtcgtattattccgagcaaagatggtgaatacaccctgagcaccgat cgtgatgatgttctgatgcaggttaataccgaaagcaccattagcaataccctgaaagtgaa tatgaaaaaaggcaaagaatataaagtgcgcattgaactgcaggataaaaatctgggtagca ttgataatctgagcagcccgaatctgtattgggaactggatggtatgaaaaaaatcattccg gaagaaaacctgtttctgcgcgattatagcaatattgaaaaagatgatccgtttattccgaa taataacttttttgatccgaaactgatgagcgattgggaagatgaagatctggataccgata atgataatattccggatagctatgaacgcaatggctataccattaaagatctgattgccgtg aaatgggaagatagctttgcagaacagggctataagaaatatgtgagcaattatctggaaag caataccgcaggcgatccgtataccgattatgaaaaagcaagcggcagctttgataaagcca ttaaaaccgaagcacgtgatccgctggttgcagcatatccgattgttggtgttggtatggaa aaactgattattagcaccaatgaacatgcaagcaccgatcagggtaaaaccgttagccgtgc aaccaccaatagcaaaaccgaaagcaatacagccggtgttagcgttaatgttggttatcaga atggttttaccgccaatgtgaccaccaattatagccataccaccgataatagcaccgcagtt caggatagcaatggtgaaagctggaataccggtctgagcattaacaaaggtgaaagcgcata tatcaatgccaatgtgcgctattataacaccggcaccgcaccgatgtataaagttaccccga ccaccaatctggttctggatggtgataccctgagtaccattaaagcacaagaaaatcagatt ggcaataatctgagtccgggtgatacctatccgaaaaaaggtctgagtccgctggcactgaa taccatggatcagtttagcagccgtctgattccgattaactatgatcagctgaaaaaactgg atgccggtaaacaaatcaaactggaaaccacccaggttagcggtaattttggcaccaaaaat tcaagcggtcagattgttaccgaaggtaatagctggtcagattatatcagccagattgatag cattagcgccagcattattctggatacagaaaatgaaagctatgaacgtcgtgtgaccgcaa aaaatctgcaggacccggaagataaaacaccggaactgaccattggtgaagcaattgaaaaa gcatttggtgccaccaaaaaagatggcctgctgtattttaacgatattccgattgatgaaag ctgcgtggaactgatttttgatgataataccgccaataaaatcaaagatagcctgaaaaccc tgagcgacaaaaaaatctataatgtgaaactggaacgcggtatgaatattctgattaaaacc ccgacctattttaccaattttgatgattataacaattatccgagcacttggagcaatgtgaa taccaccaatcaggatggtctgcagggtagcgcaaataaactgaatggtgaaaccaaaatca aaattccgatgagcgaactgaaaccgtataaacgttatgtgtttagcggctatagcaaagat ccgctgaccagcaatagcattattgtgaaaatcaaagccaaagaagaaaaaaccgattatct ggttccggaacagggttataccaaatttagctatgaatttgaaaccaccgaaaaagatagca gtaatattgaaattaccctgattggtagcggcaccacctatctggataatctgagtattacc gaactgaatagcacaccggaaattctggatgaaccggaagtgaaaattccgaccgatcaaga aattatggatgcccataaaatctattttgccgatctgaactttaatccgagcaccggcaata cctatattaacggcatgtattttgcaccgacccagaccaataaagaagccctggattatatt cagaaatatcgtgttgaagccaccctgcagtatagcggttttaaagatattggcaccaaaga taaagaaatgcgtaattatctgggcgatccgaatcagccgaaaaccaattatgttaatctgc gcagctattttaccggtggcgaaaacattatgacctacaaaaaactgcgcatttatgccatt acaccggatgatcgtgaactgctggttctgagcgttgatcaccaccatcatcatcattaa SEQ ID NO : 7 - Séquence d'acides aminés de la CDTb avec le prodomaine éliminé (CDTb", aa 212 à 876) (C55) MSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYT DYEKASGSFDKAIKTEARDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTES NTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYY NTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSR LIPINYDQLKKLDAGKQIKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILD TENESYERRVTAKNLQDPEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDD NTANKIKDSLKTLSDKKIYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQ GSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTK FSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIY FADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLG DPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVDHHHHHH ' SEQ ID NO : 8 - C116
MSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYT DYEKASGSFDKAIKTEARDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTES NTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYY NTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSR LIPINYDQLKKLDAGKQIKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILD
TENESYERRVTAKNLQDPEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDD
NTANKIKDSLKTLSDKKIYNVKLERGMNILIKTPGGHHHHHH SEQ ID NO : 9 - C117
MAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTN
YSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDT
LSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQIKLET
TQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKT
PELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVK
LERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPY
KRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGS
GTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAP
TQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENI
MTYKKLRIYAITPDDRELLVLSVDHHHHHH SEQ ID NO : 10 - Séquence de la CDTb C123 avec la mutation F455R.
MSPILGYWKIKGLVQPTRLLLEYLEEKYEEHLYERDEGDKWRNKKFELGLEFPNLPYYIDGD VKLTQSMAIIRYIADKHNMLGGCPKERAEISMLEGAVLDIRYGVSRIAYSKDFETLKVDFLS KLPEMLKMFEDRLCHKTYLNGDHVTHPDFMLYDALDWLYMDPMCLDAFPKLVCFKKRIEAI PQIDKYl·KSSKYIAWPLQGWQATFGGGDHPPKSDLEVLFQGPLGSHMEIVNEDILPNNGLMG YYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWTGRIIPSKDGEYTLSTD RDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLSSPNLYWELDGMKKIIP EENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAV KWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEARDPLVAAYPIVGVGME KLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAV QDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQI GNNLSPGDTYPKKGLSPLALNTMDQRSSRLIPINYDQLKKLDAGKQIKLETTQVSGNFGTKN SSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKTPELTIGEAIEK AFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLERGMNILIKT PTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKD PLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSIT ELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYI
QKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAI
TPDDRELLVLSVDHHHHHH SEQ ID NO : 11 - Séquence de la CDTb C126 dans laquelle les résidus 426 (Glutamate) et 453 (Aspartate) ont été tous les deux mutés en alanine.
MSPILGYWKIKGLVQPTRLLLEYLEEKYEEHLYERDEGDKWRNKKFELGLEFPNLPYYIDGD
VKLTQSMAIIRYIADKHNMLGGCPKERAEISMLEGAVLDIRYGVSRIAYSKDFETLKVDFl·S
KLPEMLKMFEDRLCHKTYLNGDHVTHPDFMLYDALDWLYMDPMCLDAFPKLVCFKKRIEAI
PQIDKYl·KSSKYIAWPLQGWQATFGGGDHPPKSDLEVLFQGPLGSHMEIVNEDILPNNGLMG
YYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWTGRIIPSKDGEYTLSTD rddvlmqvntestisntlkvnmkkGkeykvrielqdknlgsidnlsspnlyweldgmkkiip
EENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAV KWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEARDPLVAAYPIVGVGME KLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAV QDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDTLSTIKAQANQI GNNLS PGDTYPKKGLS PLALNTMAQFS SRLIPINYDQLKKLDAGKQIKLETTQVSGNFGTKN SSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKTPELTIGEAIEK AFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLERGMNILIKT PTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKD PLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSIT ELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYI QKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAI TPDDRELLVLSVDHHHHHH SEQ ID NO : 12 - C127
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT GRIIPSKDGEYTLSTDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA VTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVL DGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQI
' KLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAgggPEL TIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLER GMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRY VFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTT YLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQT NKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTY KKLRIYAITPDDRELLVLSVDHHHHHH SEQ ID NO : 13 - C128
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT
GRIIPSKDGEYTLSTDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS
SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP
DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA
RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA
NVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLV
LDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQ IKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQg
PgggTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKK
IYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMS ELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEI .
TLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYING
MYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFT
GGENIMTYKKLRIYAITPDDRELLVLSVDHHHHHH SEQ ID NO : 14 - C139
MVYNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPSDWEDEDLDTDND
NIPDSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIK
TEARDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNG
FTANVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTT
NLVLDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDA
GKQIKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKN
LQDPEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLS
DKKIYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKI
PMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSN
IEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTY
INGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRS
YFTGGENIMTYKKLRIYAITPDDRELLVLSVDGGHHHHHH SEQ ID NO : 15 - C145
MVYNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPGGGGGGAYPIVGV GMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTDNS TAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDTLSTIKAQE NQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQIKLETTQVSGNFG TKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKTPELTIGEA IEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLERGMNIL IKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGY SKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNL SITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEAL DYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRI YAITPDDRELLVLSVDGGHHHHHH SEQ ID NO : 16 - C155
MVYNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPTNFDDYNNYPSTW
SNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEK
TDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIP
TDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDI
GTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVDGGHH
HHHH SEQ ID NO : 17 - C156
MVYNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADWDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPGGGGGGNTTNQDG
LQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGY
TKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHK
IYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNY
LGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVDGGHHHHHH SEQ ID NO : 18 - C49
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSHHHHHH SEQ ID NO : 19 - C50
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSHHHHHH SEQ ID NO : 20 - Séquence polypeptidique du domaine N-terminal de la CDTa (résidu 44 au résidu 240) .
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIHHHHHH SEQ ID NO : 21 - C67
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADWDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAG3Y3VLLNHGSKFKINKIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 22 - C69
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFIFTSIGSVNMSAFAKAKIVLRITIPKGS
PGAYLSAIPGYAGQYQVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 23 - C107
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFIFTSIGSVNMSAFAKAKIVLRITIPKGS
PGAYLSAIPGYAGEYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 24 - C108
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFIFTSIGSVNMSAFAKAKIVLRITIPKGS
PGAYLSAIPGYAGEYQVLLNHGSKFKIN
KIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 25 - C149
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT GRIIPSKDGEYTLSTDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA NVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLV LDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQRSSRLIPINYDQLKKLDAGKQ IKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQD PEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKK IYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMS ELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEI TLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYING MYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFT GGENIMTYKKLRIYAITPDDRELLVLSVDHHHHHH SEQ ID NO : 26 - C152
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT
GRIIPSKDGEYTLSTDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS
SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP
DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA
RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA
NVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLV
LDGDTLSTIKAQANQIGNNLSPGDTYPKKGLSPLALNTMAQFSSRLIPINYDQLKKLDAGKQ
IKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQD
PEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKK
IYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMS
ELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEI
TLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYING
MYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFT
GGENIMTYKKLRIYAITPDDRELLVLSVDHHHHHH SEQ ID NO : 27 - C52
MTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLT
SNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELN
STPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKY
RVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPD
DRELLVLSVDGGHHHHHH SEQ ID NO : 28 - C53
MNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTD
YLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTD
QEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGT
KDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVDGGHHHH
HH
SEQ ID NO : 29 - Séquence d'acides aminés de la toxine A
MSLISKEELIKLAYSIRPRENEYKTILTNLDEYNKLTTNNNENKYLQLKKLNESIDVFMN KYKTSSRNRALSNLKKDILKEVILIKNSNTSPVEKNLHFVWIGGEVSDIALEYIKQWADI NAEYNIKLWYDSEAFLVNTLKKAIVESSTTEALQLLEEEIQNPQFDNMKFYKKRMEFIYD
RQKRFINYYKSQINKPTVPTIDDIIKSHLVSEYNRDETVLESYRTNSLRKINSNHGIDIR ANSLFTEQELLNIYSQELLNRGNLAAASDIVRLLALKNFGGVYLDVDMLPGIHSDLFKTI SRPSSIGLDRWEMIKLEAIMKYKKYINNYTSENFDKLDQQLKDNFKLIIESKSEKSEIFS KLENLNVSDLEIKIAFALGSVINQALISKQGSYLTNLVIEQVKNRYQFLNQHLNPAIESD NNFTDTTKIFHDSLFNSATAENSMFLTKIAPYLQVGFMPEARSTISLSGPGAYASAYYDF INLQENTIEKTLKASDLIEFKFPENNLSQLTEQEINSLWSFDQASAKYQFEKYVRDYTGG .SLSEDNGVDFNKNTALDKNYLLNNKIPSNNVEEAGSKNYVHYIIQLQGDDISYEATCNLF SKNPKNSIIIQRNMNESAKSYFLSDDGESILELNKYRIPERLKNKEKVKVTFIGHGKDEF NTSEFARLSVDSLSNEISSFLDTIKLDISPKNVEVNLLGCNMFSYDFNVEETYPGKLLLS IMDKITSTLPDVNKNSITIGANQYEVRINSEGRKELLAHSGKWINKEEAIMSDLSSKEYI FFDSIDNKLKAKSKNIPGLASISEDIKTLLLDASVSPDTKFILNNLKLNIESSIGDYIYY EKLEPVKNIIHNSIDDLIDEFNLLENVSDELYELKKLNNLDEKYLISFEDISKNNSTYSV RFINKSNGESVYVETEKEIFSKYSEHITKEISTIKNSIITDVNGNLLDNIQLDHTSQVNT LNAAFFIQSLIDYSSNKDVLNDLSTSVKVQLYAQLFSTGLNTIYDSIQLVNLISNAVNDT INVLPTITEGIPIVSTILDGINLGAAIKELLDEHDPLLKKELEAKVGVLAINMSLSIAAT VASIVGIGAEVTIFLLPIAGISAGIPSLVNNELILHDKATSVVNYFNHLSESKKYGPLKT EDDKILVPIDDLVISEIDFNNNSIKLGTCNILAMEGGSGHTVTGNIDHFFSSPSISSHIP SLSIYSAIGIETENLDFSKKIMMLPNAPSRVFWWETGAVPGLRSLENDGTRLLDSIRDLY PGKFYWRFYAFFDYAITTLKPVYEDTNIKIKLDKDTRNFIMPTITTNEIRNKLSYSFDGA GGTYSLLLSSYPISTNINLSKDDLWIFNIDNEVREISIENGTIKKGKLIKDVLSKIDINK NKLIIGNQTIDFSGDIDNKDRYIFLTCELDDKISLIIEINLVAKSYSLLLSGDKNYLISN LSNTIEKINTLGLDSKNIAYNYTDESNNKYFGAISKTSQKSIIHYKKDSKNILEFYNDST LEFNSKDFIAEDINVFMKDDINTITGKYYVDNNTDKSIDFSISLVSKNQVKVNGLYLNES VYSSYLDFVKNSDGHHNTSNFMNLFLDNISFWKLFGFENINFVIDKYFTLVGKTNLGYVE FICDNNKNIDIYFGEWKTSSSKSTIFSGNGRNVWEPIYNPDTGEDISTSLDFSYEPLYG IDRYINKVLIAPDLYTSLININTNYYSNEYYPEIIVLNPNTFHKKVNINLDSSSFEYKWS TEGSDFILVRYLEESNKKILQKIRIKGILSNTQSFNKMSIDFKDIKKLSLGYIMSNFKSF NSENELDRDHLGFKIIDNKTYYYDEDSKLVKGLININNSLFYFDPIEFNLVTGWQTINGK KYYFDINTGAALTSYKIINGKHFYFNNDGVMQLGVFKGPDGFEYFAPANTQNNNIEGQAI VYQSKFLTLNGKKYYFDNNSKAVTGWRIINNEKYYFNPNNAIAAVGLQVIDNNKYYFNPD TAIISKGWQTVNGSRYYFDTDTAIAFNGYKTIDGKHFYFDSDCWKIGVFSTSNGFEYFA PANTYNNNIEGQAIVYQSKFLTLNGKKYYFDNNSKAVTGLQTIDSKKYYFNTNTAEAATG WQTIDGKKYYFNTNTAEAATGWQTIDGKKYYFNTNTAIASTGYTIINGKHFYFNTDGIMQ
IGVFKGPNGFEYFAPANTDANNIEGQAILYQNEFLTLNGKKYYFGSDSKAVTGWRIINNK
KYYFNPNNAIAAIHLCTINNDKYYFSYDGILQNGYITIERNNFYFDANNESKMVTGVFKG
PNGFEYFAPANTHNNNIEGQAIVYQNKFLTLNGKKYYFDNDSKAVTGWQTIDGKKYYFNL
NTAEAATGWQTIDGKKYYFNLNTAEAATGWQTIDGKKYYFNTNTFIASTGYTSINGKHFY
FNTDGIMQIGVFKGPNGFEYFAPANTDANNIEGQAILYQNKFLTLNGKKYYFGSDSKAVT
GLRTIDGKKYYFNTNTAVAVTGWQTINGKKYYFNTNTSIASTGYTIISGKHFYFNTDGIM
QIGVFKGPDGFEYFAPANTDANNIEGQAIRYQNRFLYLHDNIYYFGNNSKAATGWVTIDG
NRYYFEPNTAMGANGYKTIDNKNFYFRNGLPQIGVFKGSNGFEYFAPANTDANNIEGQAI
RYQNRFLHLLGKIYYFGNNSKAVTGWQTINGKVYYFMPDTAMAAAGGLFEIDGVIYFFGV
DGVKAPGIYG
SEQ ID NO : 30 - Séquence d'acides aminés de la toxine B
MSLVNRKQLEKMANVRFRTQEDEYVAILDALEEYHNMSENTVVEKYLKLKDINSLTDIYI DTYKKSGRNKALKKFKEYLVTEVLELKNNNLTPVEKNLHFVWIGGQINDTAINYINQWKD VNSDYNVNVFYDSNAFLINTLKKTVVESAINDTLESFRENLNDPRFDYNKFFRKRMEIIY DKQKNFINYYKAQREENPELIIDDIVKTYLSNEYSKEIDELNTYIEESLNKITQNSGNDV RNFEEFKNGESFNLYEQELVERWNLAAASDILRISALKEIGGMYLDVDMLPGIQPDLFES IEKPSSVTVDFWEMTKLEAIMKYKEYIPEYTSEHFDMLDEEVQSSFESVLASKSDKSEIF SSLGDMEASPLEVKIAFNSKGIINQGLISVKDSYCSNLIVKQIENRYKILNNSLNPAISE DNDFNTTTNTFIDSIMAEANADNGRFMMELGKYLRVGFFPDVKTTINLSGPEAYAAAYQD LLMFKEGSMNIHLIEADLRNFEISKTNISQSTEQEMASLWSFDDARAKAQFEEYKRNYFE GSLGEDDNLDFSQNIVVDKEYLLEKISSLARSSERGYIHYIVQLQGDKISYEAACNLFAK TPYDSVLFQKNIEDSEIAYYYNPGDGEIQEIDKYKIPSIISDRPKIKLTFIGHGKDEFNT DIFAGFDVDSLSTEIEAAIDLAKEDISPKSIEINLLGCNMFSYSINVEETYPGKLLLKVK DKISELMPSISQDSIIVSANQYEVRINSEGRRELLDHSGEWINKEESIIKDISSKEYISF NPKENKITVKSKNLPELSTLLQEIRNNSNSSDIELEEKVMLTECEINVISNIDTQIVEER IEEAKNLTSDSINYIKDEFKLIESISDALCDLKQQNELEDSHFISFEDISETDEGFSIRF INKETGESIFVETEKTIFSEYANHITEEISKIKGTIFDTVNGKLVKKVNLDTTHEVNTLN AAFFIQSLIEYNSSKESLSNLSVAMKVQVYAQLFSTGLNTITDAAKWELVSTALDETID LLPTLSEGLPIIATIIDGVSLGAAIKELSETSDPLLRQEIEAKIGIMAVNLTTATTAIIT SSLGIASGFSILLVPLAGISAGIPSLVNNELVLRDKATKWDYFKHVSLVETEGVFTLLD DKIMMPQDDLVISEIDFNNNSIVLGKCEIWRMEGGSGHTVTDDIDHFFSAPSITYREPHL SIYDVLEVQKEELDLSKDLMVLPNAPNRVFAWETGWTPGLRSLENDGTKLLDRIRDNYEG
EFYWRYFAFIADALITTLKPRYEDTNIRINLDSNTRSFIVPIITTEYIREKLSYSFYGSG GTYALSLSQYNMGINIELSESDVWIIDVDNWRDVTIESDKIKKGDLIEGILSTLSIEEN KIILNSHEINFSGEVNGSNGFVSLTFSILEGINAIIEVDLLSKSYKLLISGELKILMLNS NHIQQKIDYIGFNSELQKNIPYSFVDSEGKENGFINGSTKEGLFVSELPDWLISKVYMD DSKPSFGYYSNNLKDVKVITKDNVNILTGYYLKDDIKISLSLTLQDEKTIKLNSVHLDES GVAEILKFMNRKGNTNTSDSLMSFLESMNIKSIFVNFLQSNIKFILDANFIISGTTSIGQ FEFICDENDNIQPYFIKFNTLETNYTLYVGNRQNMIVEPNYDLDDSGDISSTVINFSQKY LYGIDSCVNKWISPNIYTDEINITPVYETNNTYPEVIVLDANYINEKINVNINDLSIRY VWSNDGNDFILMSTSEENKVSQVKIRFVNVFKDKTLANKLSFNFSDKQDVPVSEIILSFT PSYYEDGLIGYDLGLVSLYNEKFYINNFGMMVSGLIYINDSLYYFKPPVNNLITGFVTVG DDKYYFNPINGGAASIGETIIDDKNYYFNQSGVLQTGVFSTEDGFKYFAPANTLDENLEG EAIDFTGKLIIDENIYYFDDNYRGAVEWKELDGEMHYFSPETGKAFKGLNQIGDYKYYFN SDGVMQKGFVSINDNKHYFDDSGVMKVGYTEIDGKHFYFAENGEMQIGVFNTEDGFKYFA HHNEDLGNEEGEEISYSGILNFNNKIYYFDDSFTAWGWKDLEDGSKYYFDEDTAEAYIG LSLINDGQYYFNDDGIMQVGFVTINDKVFYFSDSGIIESGVQNIDDNYFYIDDNGIVQIG VFDTSDGYKYFAPANTVNDNIYGQAVEYSGLVRVGEDVYYFGETYTIETGWIYDMENESD KYYFNPETKKACKGINLIDDIKYYFDEKGIMRTGLISFENNNYYFNENGEMQFGYINIED KMFYFGEDGVMQIGVFNTPDGFKYFAHQNTLDENFEGESINYTGWLDLDEKRYYFTDEYI AATGSVIIDGEEYYFDPDTAQLVISE SEQ ID NO : 31 - Fl
MGWQTIDGKKYYFNTNTAIASTGYTIINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN
NIEGQAILYQNEFLTLNGKKYYFGSDSKAVTGWRIINNKKYYFNPNNAIAAIHLCTINNDKY
YFSYDGILQNGYITIERNNFYFDANNESKMVTGVFKGPNGFEYFAPANTHNNNIEGQAIVYQ
NKFLTLNGKKYYFDNDSKAVTGWQTIDGKKYYFNLNTAEAATGWQTIDGKKYYFNLNTAEAA
TGWQTIDGKKYYFNTNTFIASTGYTSINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN
NIEGQAILYQNKFLTLNGKKYYFGSDSKAVTGLRTIDGKKYYFNTNTAVAVTGWQTINGKKY
YFNTNTSIASTGYTIISGKHFYFNTDGIMQIGVFKGPDGFEYFAPANTDANNIEGQAIRYQN
RFLYLHDNIYYFGNNSKAATGWVTIDGNRYYFEPNTAMGANGYKTIDNKNFYFRNGLPQIGV
FKGSNGFEYFAPANTDANNIEGQAIRYQNRFLHLLGKIYYFGNNSKAVTGWQTINGKVYYFM
PDTAMAAAGGLFEIDGVIYFFGVDGVKAPGFVSINDNKHYFDDSGVMKVGYTEIDGKHFYFA
ENGEMQIGVFNTEDGFKYFAHHNEDLGNEEGEEISYSGILNFNNKIYYFDDSFTAWGWKDL
EDGSKYYFDEDTAEAYIGLSLINDGQYYFNDDGIMQVGFVTINDKVFYFSDSGIIESGVQNI
DDNYFYIDDNGIVQIGVFDTSDGYKYFAPANTVNDNIYGQAVEYSGLVRVGEDVYYFGETYT
IETGWIYDMENESDKYYFNPETKKACKGINLIDDIKYYFDEKGIMRTGLISFENNNYYFNEN
GEMQFGYINIEDKMFYFGEDGVMQIGVFNTPDGFKYFAHQNTLDENFEGESINYTGWLDLDE
KRYYFTDEYIAATGSVIIDGEEYYFDPDTAQLVISE SEQ ID NO : 32 - F2
MGWQTIDGKKYYFNTNTAIASTGYTIINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN NIEGQAILYQNEFLTLNGKKYYFGSDSKAVTGWRIINNKKYYFNPNNAIAAIHLCTINNDKY YFSYDGILQNGYITIERNNFYFDANNESKMVTGVFKGPNGFEYFAPANTHNNNIEGQAIVYQ NKFLTLNGKKYYFDNDSKAVTGWQTIDGKKYYFNLNTAEAATGWQTIDGKKYYFNLNTAEAA TGWQTIDGKKYYFNTNTFIASTGYTSINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN NIEGQAILYQNKFLTLNGKKYYFGSDSKAVTGLRTIDGKKYYFNTNTAVAVTGWQTINGKKY YFNTNTSIASTGYTIISGKHFYFNTDGIMQIGVFKGPDGFEYFAPANTDANNIEGQAIRYQN RFLYLHDNIYYFGNNSKAATGWVTIDGNRYYFEPNTAMGANGYKTIDNKNFYFRNGLPQIGV FKGSNGFEYFAPANTDANNIEGQAIRYQNRFLHLLGKIYYFGNNSKAVTGWQTINGKVYYFM PDTAMAAAGGLNQIGDYKYYFNSDGVMQKGFVSINDNKHYFDDSGVMKVGYTEIDGKHFYFA ENGEMQIGVFNTEDGFKYFAHHNEDLGNEEGEEISYSGILNFNNKIYYFDDSFTAWGWKDL EDGSKYYFDEDTAEAYIGLSLINDGQYYFNDDGIMQVGFVTINDKVFYFSDSGIIESGVQNI DDNYFYIDDNGIVQIGVFDTSDGYKYFAPANTVNDNIYGQAVEYSGLVRVGEDVYYFGETYT IETGWIYDMENESDKYYFNPETKKACKGINLIDDIKYYFDEKGIMRTGLISFENNNYYFNEN GEMQFGYINIEDKMFYFGEDGVMQIGVFNTPDGFKYFAHQNTLDENFEGESINYTGWLDLDE KRYYFTDEYIAATGSVIIDGEEYYFDPDTAQLVISE SEQ ID NO : 33 - F3
MGWQTIDGKKYYFNTNTAIASTGYTIINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN NIEGQAILYQNEFLTLNGKKYYFGSDSKAVTGWRIINNKKYYFNPNNAIAAIHLCTINNDKY YFSYDGILQNGYITIERNNFYFDANNESKMVTGVFKGPNGFEYFAPANTHNNNIEGQAIVYQ NKFLTLNGKKYYFDNDSKAVTGWQTIDGKKYYFNLNTAEAATGWQTIDGKKYYFNLNTAEAA TGWQTIDGKKYYFNTNTFIASTGYTSINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN NIEGQAILYQNKFLTLNGKKYYFGSDSKAVTGLRTIDGKKYYFNTNTAVAVTGWQTINGKKY YFNTNTSIASTGYTIISGKHFYFNTDGIMQIGVFKGPDGFEYFAPANTDANNIEGQAIRYQN RFLYLHDNIYYFGNNSKAATGWVTIDGNRYYFEPNTAMGANGYKTIDNKNFYFRNGLPQIGV
FKGSNGFEYFAHHNEDLGNEEGEEISYSGILNFNNKIYYFDDSFTAWGWKDLEDGSKYYFD EDTAEAYIGLSLINDGQYYFNDDGIMQVGFVTINDKVFYFSDSGIIESGVQNIDDNYFYIDD NGIVQIGVFDTSDGYKYFAPANTVNDNIYGQAVEYSGLVRVGEDVYYFGETYTIETGWIYDM ENESDKYYFNPETKKACKGINLIDDIKYYFDEKGIMRTGLISFENNNYYFNENGEMQFGYIN IEDKMFYFGEDGVMQIGVFNTPDGFKYFAHQNTLDENFEGESINYTGWLDLDEKRYYFTDEY IAATGSVIIDGEEYYFDPDTAQLVISE SEQ ID NO : 34 - F4
MGWQTIDGKKYYF.NTNTAIASTGYTIINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN NIEGQAILYQNEFLTLNGKKYYFGSDSKAVTGWRIINNKKYYFNPNNAIAAIHLCTINNDKY YFSYDGILQNGYITIERNNFYFDANNESKMVTGVFKGPNGFEYFAPANTHNNNIEGQAIVYQ NKFLTLNGKKYYFDNDSKAVTGWQTIDGKKYYFNLNTAEAATGWQTIDGKKYYFNLNTAEAA TGWQTIDGKKYYFNTNTFIASTGYTSINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN NIEGQAILYQNKFLTLNGKKYYFGSDSKAVTGLRTIDGKKYYFNTNTAVAVTGWQTINGKKY YFNTNTSIASTGYTIISGKHFYFNTDGIMQIGVFKGPDGFEYFAPANTDANNIEGQAIRYQN RFLYLHDNIYY FGNN S KAATGWVTIDGNRYYFEPNTAMGANGYKTIDNKNFYFRNGLPQIGV FKGSNGFEYFAPANTDANNIEGQAIRYQNRFLHLLGKIYYFGNNSKAVTGWQTINGKVYYFM PDTAMAAAGGETIIDDKNYYFNQSGVLQTGVFSTEDGFKYFAPANTLDENLEGEAIDFTGKL IIDENIYYFDDNYRGAVEWKELDGEMHYFSPETGKAFKGLNQIGDYKYYFNSDGVMQKGFVS INDNKHYFDDSGVMKVGYTEIDGKHFYFAENGEMQIGVFNTEDGFKYFAHHNEDLGNEEGEE ISYSGILNFNNKIYYFDDSFTAWGWKDLEDGSKYYFDEDTAEAYIGLSLINDGQYYFNDDG IMQVGFVTINDKVFYFSDSGIIESGVQNIDDNYFYIDDNGIVQIGVFDTSDGYKYFAPANTV NDNIYGQAVEYSGLVRVGEDVYYFGETYTIETGWIYDMENESDKYYFNPETKKACKGINLID DIKYYFDEKGIMRTGLISFENNNYYFNENGEMQFGYINIEDKMFYFGEDGVMQIGVFNTPDG FKYFAHQNTLDENFEGESINYTGWLDLDEKRYYFTDEYIAATGSVIIDGEEYYFDPDTAQLV ISE SEQ ID NO : 35 - F5
MGWQTIDGKKYYFNTNTAIASTGYTIINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN
NIEGQAILYQNEFLTLNGKKYYFGSDSKAVTGWRIINNKKYYFNPNNAIAAIHLCTINNDKY
YFSYDGILQNGYITIERNNFYFDANNESKMVTGVFKGPNGFEYFAPANTHNNNIEGQAIVYQ
NKFLTLNGKKYYFDNDSKAVTGWQTIDGKKYYFNLNTAEAATGWQTIDGKKYYFNLNTAEAA
TGWQTIDGKKYYFNTNTFIASTGYTSINGKHFYFNTDGIMQIGVFKGPNGFEYFAPANTDAN
NIEGQAILYQNKFLTLNGKKYYFGSDSKAVTGLRTIDGKKYYFNTNTAVAVTGWQTINGKKY YFNTNTSIASTGYTIISGKHFYFNTDGIMQIGVFKGPDGFEYFAPANTDANNIEGQAIRYQN RFLYLHDNIYYFGNNSKAATGWVTIDGNRYYFEPNTAMGANGYKTIDNKNFYFRNGLPQIGV FKGSNGFEYFAPANTDANNIEGQAIRYQNRFLHLLGKIYYFGNNSKAVTGWQTINGKVYYFM PDTAMAAAGGLFEIDGVIYFFGVDGVKAPGIYGGGFVSINDNKHYFDDSGVMKVGYTEIDGK HFYFAENGEMQIGVFNTEDGFKYFAHHNEDLGNEEGEEISYSGILNFNNKIYYFDDSFTAVV GWKDLEDGSKYYFDEDTAEAYIGLSLINDGQYYFNDDGIMQVGFVTINDKVFYFSDSGIIES GVQNIDDNYFYIDDNGIVQIGVFDTSDGYKYFAPANTVNDNIYGQAVEYSGLVRVGEDVYYF GETYTIETGWIYDMENESDKYYFNPETKKACKGINLIDDIKYYFDEKGIMRTGLISFENNNY YFNENGEMQFGYINIEDKMFYFGEDGVMQIGVFNTPDGFKYFAHQNTLDENFEGESINYTGW LDLDEKRYYFTDEYIAATGSVIIDGEEYYFDPDTAQLVISE SEQ ID NO : 36 - Séquence polypeptidique de la construction de CDTa C34
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGEYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 37 - Construction de CDTb C118. CDTb sans le peptide signal, sans le prodomaine, sans le domaine de liaison à la CDTa et sans le domaine de liaison aux récepteurs MAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTN YSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDT LSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQIKLET TQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKT PELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVK LERGMNILIKTPGGHHHHHH - SEQ ID NO : 38 - Construction de CDTb C46. Séquence polypeptidique de la CDTb' (moins le peptide signal)
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT GRIIPSKDGEYTLSTDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA NVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLV LDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQ IKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQD PEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKK IYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMS ELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEI TLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYING MYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFT GGENIMTYKKLRIYAITPDDRELLVLSVDHHHHHH SEQ ID NO : 39 - Construction C44. Séquence polypeptidique de la CDTa avec la mutation E428Q.
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGqYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 40 - Construction C54. Séquence polypeptidique de la CDTa avec la mutation E430Q.
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGEYqVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 41 - C68
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFISTSIGSVNMSAFAKAKIVLRITIPKGS
PGAYLSAIPGYAGgYgVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 42 - Séquence d'acides aminés de la CDTa sans le peptide signal, avec six mutations (R345A, Q350A, N385A, R402A, S388F, E428Q, aa 44 à 463) (C110)
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFES PEKFAFNKVIRTENQNEISL EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFIFTSIGSVNMSAFAKAKIVLRITIPKGS PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPHHHHHH SEQ ID NO : 43 - Séquence d'acides aminés de C164 (KO pour la formation des pores avec la mutation F455R sur la CdtB sans prodomaine)
MSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYT
DYEKASGSFDKAIKTEARDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTES
NTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYY
NTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQRSSR
LÏPINYDQLKKLDAGKQIKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILD
TENESYERRVTAKNLQDPEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDD
NTANKIKDSLKTLSDKKIYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQ
GSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTK
FSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIY
FADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLG
DPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVD SEQ ID NO : 44 - Séquence d'acides aminés de C166 (KO pour la formation des pores avec les mutations E426A-D453A sur la CdtB sans le prodomaine)
MSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYT DYEKASGSFDKAIKTEARDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTES NTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYY NTGTAPMYKVTPTTNLVLDGDTLSTIKAQANQIGNNLSPGDTYPKKGLSPLALNTMAQFSSR LIPINYDQLKKLDAGKQIKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILD TENESYERRVTAKNLQDPEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDD NTANKIKDSLKTLSDKKIYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQ GSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTK FSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIY FADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLG DPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVD SEQ ID NO : 45 - Séquence d'acide nucléique de C164 (KO pour la formation des pores avec la mutation F455R sur la CdtB sans prodomaine)
ATGAGCGATTGGGAAGATGAAGATCTGGATACCGATAATGATAATATTCCGGATAGCTATGA
ACGCAATGGCTATACCATTAAAGATCTGATTGCCGTGAAATGGGAAGATAGCTTTGCAGAAC
AGGGCTATAAGAAATATGTGAGCAATTATCTGGAAAGCAATACCGCAGGCGATCCGTATACC
GATTATGAAAAAGCAAGCGGCAGCTTTGATAAAGCCATTAAAACCGAAGCACGTGATCCGCT
GGTTGCAGCATATCCGATTGTTGGTGTTGGTATGGAAAAACTGATTATTAGCACCAATGAAC
ATGCAAGCACCGATCAGGGTAAAACCGTTAGCCGTGCAACCACCAATAGCAAAACCGAAAGC
AATACAGCCGGTGTTAGCGTTAATGTTGGTTATCAGAATGGTTTTACCGCCAATGTGACCAC
CAATTATAGCCATACCACCGATAATAGCACCGCAGTTCAGGATAGCAATGGTGAAAGCTGGA
ATACCGGTCTGAGCATTAACAAAGGTGAAAGCGCATATATCAATGCCAATGTGCGCTATTAT
AACACCGGCACCGCACCGATGTATAAAGTTACCCCGACCACCAATCTGGTTCTGGATGGTGA
TACCCTGAGTACCATTAAAGCACAAGAAAATCAGATTGGCAATAATCTGAGTCCGGGTGATA
CCTATCCGAAAAAAGGTCTGAGTCCGCTGGCACTGAATACCATGGATCAGCGCAGCAGCCGT
CTGATTCCGATTAACTATGATCAGCTGAAAAAACTGGATGCCGGTAAACAAATCAAACTGGA
AACCACCCAGGTTAGCGGTAATTTTGGCACCAAAAATTCAAGCGGTCAGATTGTTACCGAAG
GTAATAGCTGGTCAGATTATATCAGCCAGATTGATAGCATTAGCGCCAGCATTATTCTGGAT
ACAGAAAATGAAAGCTATGAACGTCGTGTGACCGCAAAAAATCTGCAGGACCCGGAAGATAA
AACACCGGAACTGACCATTGGTGAAGCAATTGAAAAAGCATTTGGTGCCACCAAAAAAGATG GCCTGCTGTATTTTAACGATATTCCGATTGATGAAAGCTGCGTGGAACTGATTTTTGATGAT '
AATACCGCCAATAAAATCAAAGATAGCCTGAAAACCCTGAGCGACAAAAAAATCTATAATGT
GAAATTAGAACGCGGTATGAATATTCTAATTAAAACCCCGACCTATTTTACCAATTTTGATG
ATTATAACAATTATCCGAGCACTTGGAGCAATGTGAATACCACCAATCAGGATGGTCTGCAG
GGTAGCGCAAATAAACTGAATGGTGAAACCAAAATCAAAATTCCGATGAGCGAACTGAAACC
GTATaAACGTTATGTGTTTAGCGGCTATAGCAAAGATCCGCTGACCAGCAATAGCATTATTG
TGAAAATCAAAGCCAAAGAAGAAAAAACCGATTATCTGGTTCCGGAACAGGGTTATACCAAA
TTTAGCTATGAATTTGAAACCACCGAAAAAGATAGCAGTAATATTGAAATTACCCTGATTGG
TAGCGGCACCACCTATCTGGATAATCTGAGTATTACCGAACTGAATAGCACACCGGAAATTC
TGGATGAACCGGAAGTGAAAATTCCGACCGATCAAGAAATTATGGATGCCCATAAAATCTAT
TTTGCCGATCTGAACTTTAATCCGAGCACCGGCAATACCTATATTAACGGCATGTATTTTGC
ACCGACCCAGACCAATAAAGAAGCCCTGGATTATATTCAGAAATATCGTGTTGAAGCCACCC TGCAGTATAGCGGTTTTAAAGATATTGGCACCAAAGATAAAGAAATGCGTAATTATCTGGGC .
GATCCGAATCAGCCGAAAACCAATTATGTTAATCTGCGCAGCTATTTTACCGGTGGCGAAAA
CATTATGACCTACAAAAAACTGCGCATTTATGCCATTACACCGGATGATCGTGAACTGCTGG
TTCTGAGCGTTGATCA SEQ ID NO : 46 - Séquence d'acide nucléique de C166 (KO pour la formation des pores avec les mutations E426A-D453A sur la CdtB sans prodomaine)
ATGAGCGATTGGGAAGATGAAGATCTGGATACCGATAATGATAATATTCCGGATAGCTATGA
ACGCAATGGCTATACCATTAAAGATCTGATTGCCGTGAAATGGGAAGATAGCTTTGCAGAAC
AGGGCTATAAGAAATATGTGAGCAATTATCTGGAAAGCAATACCGCAGGCGATCCGTATACC
GATTATGAAAAAGCAAGCGGCAGCTTTGATAAAGCCATTAAAACCGAAGCACGTGATCCGCT
GGTTGCAGCATATCCGATTGTTGGTGTTGGTATGGAAAAACTGATTATTAGCACCAATGAAC
ATGCAAGCACCGATCAGGGTAAAACCGTTAGCCGTGCAACCACCAATAGCAAAACCGAAAGC
AATACAGCCGGTGTTAGCGTTAATGTTGGTTATCAGAATGGTTTTACCGCCAATGTGACCAC
CAATTATAGCCATACCACCGATAATAGCACCGCAGTTCAGGATAGCAATGGTGAAAGCTGGA
ATACCGGTCTGAGCATTAACAAAGGTGAAAGCGCATATATCAATGCCAATGTGCGCTATTAT
AACACCGGCACCGCACCGATGTATAAAGTTACCCCGACCACCAATCTGGTTCTGGATGGTGA
TACCCTGAGTACCATTAAAGCACAAGCRAATCAGATTGGCAATAATCTGAGTCCGGGTGATA
CCTATCCGAAAAAAGGTCTGAGTCCGCTGGCACTGAATACCATGGCGCAGTTTAGCAGCCGT
CTGATTCCGATTAACTATGATCAGCTGAAAAAACTGGATGCCGGTAAACAAATCAAACTGGA
AACCACCCAGGTTAGCGGTAATTTTGGCACCAAAAATTCAAGCGGTCAGATTGTTACCGAAG
GTAATAGCTGGTCAGATTATATCAGCCAGATTGATAGCATTAGCGCCAGCATTATTCTGGAT
ACAGAAAATGAAAGCTATGAACGTCGTGTGACCGCAAAAAATCTGCAGGACCCGGAAGATAA
AACACCGGAACTGACCATTGGTGAAGCAATTGAAAAAGCATTTGGTGCCACCAAAAAAGATG
GCCTGCTGTATTTTAACGATATTCCGATTGATGAAAGCTGCGTGGAACTGATTTTTGATGAT
AATACCGCCAATAAAATCAAAGATAGCCTGAAAACCCTGAGCGACAAAAAAATCTATAATGT
GAAATTAGAACGCGGTATGAATATTCTAATTAAAACCCCGACCTATTTTACCAATTTTGATG
ATTATAACAATTATCCGAGCACTTGGAGCAATGTGAATACCACCAATCAGGATGGTCTGCAG
GGTAGCGCAAATAAACTGAATGGTGAAACCAAAATCAAAATTCCGATGAGCGAACTGAAACC
GTATAAACGTTATGTGTTTAGCGGCTATAGCAAAGATCCGCTGACCAGCAATAGCATTATTG
TGAAAATCAAAGCCAAAGAAGAAAAAACCGATTATCTGGTTCCGGAACAGGGTTATACCAAA
TTTAGCTATGAATTTGAAACCACCGAAAAAGATAGCAGTAATATTGAAATTACCCTGATTGG
TAGCGGCACCACCTATCTGGATAATCTGAGTATTACCGAACTGAATAGCACACCGGAAATTC
TGGATGAACCGGAAGTGAAAATTCCGACCGATCAAGAAATTATGGATGCCCATAAAATCTAT
TTTGCCGATCTGAACTTTAATCCGAGCACCGGCAATACCTATATTAACGGCATGTATTTTGC
ACCGACCCAGACCAATAAAGAAGCCCTGGATTATATTCAGAAATATCGTGTTGAAGCCACCC
TGCAGTATAGCGGTTTTAAAGATATTGGCACCAAAGATAAAGAAATGCGTAATTATCTGGGC
GATCCGAATCAGCCGAAAACCAATTATGTTAATCTGCGCAGCTATTTTACCGGTGGCGAAAA
CATTATGACCTACAAAAAACTGCGCATTTATGCCATTACACCGGATGATCGTGAACTGCTGG
TTCTGAGCGTTGATCAC SEQ ID 47 - Construction CDTb C37. Séquence polypeptidique de la CDTb' (moins le peptide signal) ligaturée à la protéine glutathion-S-transférase (GST soulignée), sans le marqueur his.
MSPILGYWKIKGLVQPTRLLLEYLEEKYEEHLYERDEGDKWRNKKFELGLEFPNLPYYIDGD
VKLTQSMAIIRYIADKHNMLGGCPKERAEISMLEGAVLDIRYGVSRIAYSKDFETLKVDFLS
KLPEMLKMFEDRLCHKTYLNGDHVTHPDFMLYDALDWLYMDPMCLDAFPKLVCFKKRIEAI
PQIDKYLKSSKYIAWPLQGWQATFGGGDHPPKSDLEVLFQGPLGSHMEIVNEDILPNNGLMG YYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWTGRIIPSKDGEYTLSTD RDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLSSPNLYWELDGMKKIIP EENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAV KWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEARDPLVAAYPIVGVGME KLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAV QDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQI GNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQIKLETTQVSGNFGTKN SSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKTPELTIGEAIEK AFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLERGMNILIKT PTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKD PLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSIT ELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYI QKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAI TPDDRELLVLSVD SEQ ID NO : 48 - Séquence d'acides aminés de la CDTb avec le prodomaine éliminé (CDTb", aa 212 à 876) (C55) , sans le marqueur his
MSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYT DYEKASGSFDKAIKTEARDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTES NTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYY NTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSR LIPINYDQLKKLDAGKQIKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILD TENESYERRVTAKNLQDPEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDD NTANKIKDSLKTLSDKKIYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQ GSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTK FSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIY FADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLG DPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVD SEQ ID NO : 49 - C116 sans le marqueur his
MSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYT DYEKASGSFDKAIKTEARDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTES NTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYY NTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSR LIPINYDQLKKLDAGKQIKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILD TENESYERRVTAKNLQDPEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDD NTANKIKDS LKTLS DKKIYNVKLERGMNILIKT PGG SEQ ID NO : 50 - C117 sans le marqueur his
MAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTN YSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDT LSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQIKLET TQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKT PELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVK LERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPY KRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGS GTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAP TQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENI MTYKKLRIYAITPDDRELLVLSVD SEQ ID NO : 51 - Séquence de la CDTb C123 avec la mutation F455R, sans le marqueur his.
MSPILGYWKIKGLVQPTRLLLEYLEEKYEEHLYERDEGDKWRNKKFELGLEFPNLPYYIDGD VKLTQSMAIIRYIADKHNMLGGCPKERAEISMLEGAVLDIRYGVSRIAYSKDFETLKVDFl·S KLPEMLKMFEDRLCHKTYLNGDHVTHPDFMLYDALDWLYMDPMCLDAFPKLVCFKKRIEAI PQIDKYLKSSKYIAWPLQGWQATFGGGDHPPKSDLEVLFQGPLGSHMEIVNEDILPNNGLMG YYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWTGRIIPSKDGEYTLSTD RDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLSSPNLYWELDGMKKIIP EENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIPDSYERNGYTIKDLIAV KWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEARDPLVAAYPIVGVGME KLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTDNSTAV QDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDTLSTIKAQENQI GNNLSPGDTYPKKGLSPLALNTMDQRSSRLIPINYDQLKKLDAGKQIKLETTQVSGNFGTKN
SSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKTPELTIGEAIEK
AFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLERGMNILIKT
PTYFTNFPPYNNYPSTWSNVNTTNQPGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKP
PLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSIT
ELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYI
QKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAI
TPDDRELLVLSVD SEQ ID NO : 52 - Séquence de la CDTb C126 dans laquelle les résidus 426 (Glutamate) et 453 (Aspartate) ont été tous les deux mutés en alanine, sans le marqueur his.
MSPILGYWKIKGLVQPTRLLLEYLEEKYEEHLYERDEGDKWRNKKFELGLEFPNLPYYIDGD νΚΣ,ΤαΞΜΑΙΙΕΥΙΑΡΚΗΝΜΕΰΰΟΡΚΕΡΑΕΙΕΜΕΕΰΑνΕΡΙΡΥΰνΞΕΙΑΥΕΙ^ΕΤΕΚνΡΓΙΕ KLPEMLKMFEPRLCHKTYLNGPHVTHPPFMLYPALPWLYMPPMCLPAFPKLVCFKKRIEAI PQIPKYLKSSKYIAWPLQGWQATFGGGPHPPKSPLEVLFQGPLGSHMEIVNEPILPNNGLMG YYFTPEHFKPLKLMAPIKPGNLKFEEKKVPKLLPKPKSPVKSIRWTGRIIPSKPGEYTLSTP RPPVLMQVNTESTISNTLKVNMKKGKEYKVRIELQPKNLGSIPNLSSPNLYWELPGMKKIIP EENLFLRPYSNIEKPPPFIPNNNFFPPKLMSPWEPEPLPTPNPNIPPSYERNGYTIKPLIAV KWEPSFAEQGYKKYVSNYLESNTAGPPYTPYEKASGSFPKAIKTEARPPLVAAYPIVGVGME KLIISTNEHASTPQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTPNSTAV QPSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLPGPTLSTIKAQANQI GNNLSPGPTYPKKGLSPLALNTMAQFSSRLIPINYPQLKKLPAGKQIKLETTQVSGNFGTKN SSGQIVTEGNSWSPYISQIPSISASIILPTENESYERRVTAKNLQPPEPKTPELTIGEAIEK AFGATKKPGLLYFNPIPIPESCVELIFPPNTANKIKPSLKTLSPKKIYNVKLERGMNILIKT PTYFTNFPPYNNYPSTWSNVNTTNQPGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKP PLTSNSIIVKIKAKEEKTPYLVPEQGYTKFSYEFETTEKPSSNIEITLIGSGTTYLPNLSIT ELNSTPEILPEPEVKIPTPQEIMPAHKIYFAPLNFNPSTGNTYINGMYFAPTQTNKEALPYI QKYRVEATLQYSGFKPIGTKPKEMRNYLGPPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAI TPPPRELLVLSVP SEQ ID NO : 53 - C127 sans le marqueur his
MEIVNEPILPNNGLMGYYFTPEHFKPLKLMAPIKPGNLKFEEKKVPKLLPKPKSPVKSIRWT
GRIIPSKPGEYTLSTPRPPVLMQVNTESTISNTLKVNMKKGKEYKVRIELQPKNLGSIPNLS
SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP
DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA
RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA
VTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVL
DGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQI
KLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAgggPEL
TIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLER
GMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRY
VFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTT
YLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQT
NKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTY
KKLRIYAITPDDRELLVLSVD SEQ ID NO : 54 - C128 sans le marqueur his
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT
GRIIPSKDGEYTLSTDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS
SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP
DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA
RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA
NVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLV
LDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQ IKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQg
PgggTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKK
IYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMS
ELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEI
TLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYING
MYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFT
GGENIMTYKKLRIYAITPDDRELLVLSVD SEQ ID NO : 55 - C139 sans le marqueur his
MVYNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPSDWEDEDLDTDND
NIPDSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIK
TEARDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNG
FTANVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTT
NLVLDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDA
GKQIKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKN
LQDPEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLS
DKKIYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKI
PMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSN
IEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTY
INGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRS
YFTGGENIMTYKKLRIYAITPDDRELLVLSVDGG SEQ ID NO : 56 - C145 sans le marqueur his
MVYNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPGGGGGGAYPIVGV
GMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTNYSHTTDNS
TAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDTLSTIKAQE
NQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQIKLETTQVSGNFG
TKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKTPELTIGEA
IEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVKLERGMNIL
IKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGY
SKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNL
SITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEAL
DYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRI
YAITPDDRELLVLSVDGG SEQ ID NO : 57 - C155 sans le marqueur his
MVYNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPTNFDDYNNYPSTW SNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEK TDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIP TDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDI GTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVDGG SEQ ID NO : 58 - C156 sans le marqueur his
MVYNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIPGGGGGGNTTNQDG LQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGY TKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHK IYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNY LGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVDGG SEQ ID NO : 59 - C49 sans le marqueur his
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVS SEQ ID NO : 60 - C50 sans le marqueur his
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSS SEQ ID NO : 61 - Séquence polypeptidique du domaine N-terminal de la CDTa (résidu 44 au résidu 240) sans le marqueur his.
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKI SEQ ID NO : 62 - C67 sans le marqueur his
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAG3Y3VLLNHGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID NO : 63 - C69 sans le marqueur his
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL IEQGYSIKIDKIVRIVIDGKHYIKAEASWS SLDFKDDVSKGDSWGKANYNDWSNKLTPNEL ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFIFTSIGSVNMSAFAKAKIVLRITIPKGS PGAYLSAIPGYAGQYQVLLNHGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID NO : 64 - C107 sans le marqueur his
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFIFTSIGSVNMSAFAKAKIVLRITIPKGS
PGAYLSAIPGYAGEYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID NO : 65 - Cl08 sans le marqueur his
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFIFTSIGSVNMSAFAKAKIVLRITIPKGS
PGAYLSAIPGYAGEYQVLLNHGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID NO : 66 - Cl49 sans le marqueur his
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT
GRIIPSKDGEYTLSTDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS
SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP
DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA
RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA
NVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLV
LDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQRSSRLIPINYDQLKKLDAGKQ
IKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQD
PEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKK
IYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMS
ELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEI
TLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYING
MYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFT
GGENIMTYKKLRIYAITPDDRELLVLSVD SEQ ID NO : 67 - C152 sans le marqueur his
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT
GRIIPSKDGEYTLS TDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS
SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP
DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA
RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA
NVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLV
LDGDTLSTIKAQANQIGNNLSPGDTYPKKGLSPLALNTMAQFSSRLIPINYDQLKKLDAGKQ IKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQD '
PEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKK
IYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMS
ELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEI
TLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYING
MYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFT
GGENIMTYKKLRIYAITPDDRELLVLSVD SEQ ID NO : 68 - C52 sans le marqueur his MTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLT SNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELN STPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKY RVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPD DRELLVLSVDGG . SEQ ID NO : 69 - C53 sans le marqueur his
MNTTNQDGLQGSANKLNGETKIKIPMSELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTD
YLVPEQGYTKFSYEFETTEKDSSNIEITLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTD
QEIMDAHKIYFADLNFNPSTGNTYINGMYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGT
KDKEMRNYLGDPNQPKTNYVNLRSYFTGGENIMTYKKLRIYAITPDDRELLVLSVDGG SEQ ID NO : 70 - Séquence polypeptidique de la construction de CDTa C34 sans le marqueur his
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGEYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID NO : 71 - Construction de CDTb C118. CDTb sans le peptide signal, sans le prodomaine, sans le domaine de liaison à la CDTa et sans le domaine de liaison aux récepteurs, sans le marqueur his
MAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTANVTTN YSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLVLDGDT LSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQIKLET TQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQDPEDKT PELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKKIYNVK LERGMNILIKTPGG SEQ ID NO : 72 - Construction de CDTb C46. Séquence polypeptidique de la CDTb' (moins le peptide signal) sans le marqueur his .
MEIVNEDILPNNGLMGYYFTDEHFKDLKLMAPIKDGNLKFEEKKVDKLLDKDKSDVKSIRWT GRIIPSKDGEYTLSTDRDDVLMQVNTESTISNTLKVNMKKGKEYKVRIELQDKNLGSIDNLS SPNLYWELDGMKKIIPEENLFLRDYSNIEKDDPFIPNNNFFDPKLMSDWEDEDLDTDNDNIP DSYERNGYTIKDLIAVKWEDSFAEQGYKKYVSNYLESNTAGDPYTDYEKASGSFDKAIKTEA RDPLVAAYPIVGVGMEKLIISTNEHASTDQGKTVSRATTNSKTESNTAGVSVNVGYQNGFTA NVTTNYSHTTDNSTAVQDSNGESWNTGLSINKGESAYINANVRYYNTGTAPMYKVTPTTNLV LDGDTLSTIKAQENQIGNNLSPGDTYPKKGLSPLALNTMDQFSSRLIPINYDQLKKLDAGKQ IKLETTQVSGNFGTKNSSGQIVTEGNSWSDYISQIDSISASIILDTENESYERRVTAKNLQD PEDKTPELTIGEAIEKAFGATKKDGLLYFNDIPIDESCVELIFDDNTANKIKDSLKTLSDKK IYNVKLERGMNILIKTPTYFTNFDDYNNYPSTWSNVNTTNQDGLQGSANKLNGETKIKIPMS ELKPYKRYVFSGYSKDPLTSNSIIVKIKAKEEKTDYLVPEQGYTKFSYEFETTEKDSSNIEI TLIGSGTTYLDNLSITELNSTPEILDEPEVKIPTDQEIMDAHKIYFADLNFNPSTGNTYING MYFAPTQTNKEALDYIQKYRVEATLQYSGFKDIGTKDKEMRNYLGDPNQPKTNYVNLRSYFT GGENIMTYKKLRIYAITPDDRELLVLSVD ' SEQ ID NO : 73 - Construction C44. Séquence polypeptidique de la CDTa avec la mutation E428Q, sans le marqueur his.
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGqYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID NO : 74 - Construction C54. Séquence polypeptidique de la CDTa avec la mutation E430Q, sans le marqueur his.
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYRRSGPQEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPNFISTSIGSVNMSAFAKRKIVLRITIPKGS
PGAYLSAIPGYAGEYqVLLNHGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID NO : 75 - C68 sans le marqueur his
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFISTSIGSVNMSAFAKAKIVLRITIPKGS
PGAYLSAIPGYAGQYQVLLNHGSKFKINKIDSYKDGTITKLIVDATLIP SEQ ID NO : 76 - Séquence d'acides aminés de la CDTa sans le peptide signal, avec six mutations (R345A, Q350A, N385A, R402A, S388F, E428Q, aa 44 à 463) (C110 sans le marqueur his)
MVCNTTYKAPIERPEDFLKDKEKAKEWERKEAERIEQKLERSEKEALESYKKDSVEISKYSQ
TRNYFYDYQIEANSREKEYKELRNAISKNKIDKPMYVYYFESPEKFAFNKVIRTENQNEISL
EKFNEFKETIQNKLFKQDGFKDISLYEPGKGDEKPTPLLMHLKLPRNTGMLPYTNTNNVSTL
IEQGYSIKIDKIVRIVIDGKHYIKAEASWSSLDFKDDVSKGDSWGKANYNDWSNKLTPNEL
ADVNDYMRGGYTAINNYLISNGPVNNPNPELDSKITNIENALKREPIPTNLTVYARSGPAEF
GLTLTSPEYDFNKLENIDAFKSKWEGQALSYPAFIFTSIGSVNMSAFAKAKIVLRITIPKGS
PGAYLSAIPGYAGQYEVLLNHGSKFKINKIDSYKDGTITKLIVDATLIP

Claims (19)

  1. REVENDICATIONS
    1. Composition immunogène comprenant une protéine CDTb isolée de Clostridium difficile où la protéine CDTb isolée de Clostridium difficile a été mutée par une mutation au niveau de la position 426 et une mutation au niveau de la position 453, pour modifier la capacité à former des pores dans laquelle la protéine CDTb isolée de Clostridium difficile comprend (i) SEQ ID NO : 10 ou SEQ ID NO : 11 ou SEQ ID NO : 25 ou SEQ ID NO : 26 ; ou (ii) un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 10 ou SEQ ID NO : 11 ou SEQ ID NO : 25 ou SEQ ID NO : 26 ; ou (iii) un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250 ou 300 acides aminés consécutifs de SEQ ID NO : 10 ou SEQ ID NO : 11 ou SEQ ID NO : 25 ou SEQ ID NO : 26 ; ou (iv) SEQ ID NO : 43 ou SEQ ID NO : 44 ; ou (V) un variant de la CDTb présentant au moins 80 %, 85 %, 88 %, 90 %, 92 %, 95 %, 98 %, 99 %, 100 % d'identité de séquence avec SEQ ID NO : 43 ou SEQ ID NO : 44 ; ou (vi) un fragment de la CDTb comportant au moins 30, 50, 80, 100, 120, 150, 200, 250 ou 300 acides aminés consécutifs de SEQ ID NO : 43 ou SEQ ID NO : 44.
  2. 2. Composition immunogène selon la revendication 1, dans laquelle la protéine CDTb isolée de Clostridium difficile comprend au moins une mutation choisie dans le groupe constitué de F455R, F455G, E426A et D453A.
  3. 3. Composition immunogène selon la revendication 1, dans laquelle la protéine CDTb isolée de Clostridium difficile comprend les mutations E426A et D453A.
  4. 4. Composition immunogène selon l’une quelconque des revendications précédentes comprenant en outre une protéine CDTa isolée de Clostridium difficile
  5. 5. Composition immunogène selon l’une quelconque des revendications précédentes, où la composition déclenche des anticorps qui neutralisent la CDTa ou la CDTb ou les deux.
  6. 6. Composition immunogène selon l’une quelconque des revendications précédentes, où la composition déclenche des anticorps qui neutralisent la toxine binaire.
  7. 7. Composition immunogène selon l’une quelconque des revendications précédentes, où la composition immunogène comprend en outre une protéine de toxine A isolée de Clostridium difficile et/ou une protéine de toxine B isolée de C. difficile.
  8. 8. Composition immunogène selon la revendication 7, où la composition immunogène comprend une protéine de toxine A isolée de Clostridium difficile et une protéine de toxine B isolée de C. difficile où la protéine de toxine A isolée de Clostridium difficile et la protéine de toxine B isolée de C. difficile forment une protéine de fusion et dans laquelle la protéine de fusion est (i) SEQ ID NO : 32 ; ou (ii) un variant présentant au moins 80 %, 85 %, 90 %, 95 %, 98 %, 99 %, 100 % d’identité de séquence avec SEQ ID NO : 32; ou (iii) un fragment d’au moins 800, 850, 900 ou 950 acides aminés consécutifs de SEQ ID NO : 32.
  9. 9. Composition immunogène selon l’une quelconque des revendications précédentes, où la composition immunogène comprend en outre un adjuvant.
  10. 10. Composition immunogène selon l’une quelconque des revendications précédentes, comprenant en outre des antigènes supplémentaires.
  11. 11. Composition immunogène selon l’une quelconque des revendications précédentes, comprenant en outre un saccharide de C. difficile.
  12. 12. Vaccin comprenant la composition immunogène selon l’une quelconque des revendications précédentes et un excipient pharmaceutiquement acceptable.
  13. 13. Composition immunogène selon l’une quelconque des revendications 1 à 11 ou vaccin selon la revendication 12 pour une utilisation dans le traitement ou la prévention d’une maladie de C. difficile.
  14. 14. Composition immunogène selon l’une quelconque des revendications 1 à 11 ou vaccin selon la revendication 12 pour une utilisation dans le traitement ou la prévention d’une maladie provoquée par une souche de C. difficile choisie dans le groupe constitué de 078, 019, 023, 027, 033, 034, 036, 045, 058, 059, 063, 066, 075, 078, 080, 111, 112, 203, 250 et 571.
  15. 15. Composition immunogène selon l’une quelconque des revendications 1 à 11 ou vaccin selon la revendication 12 pour une utilisation dans le traitement ou la prévention d’une maladie provoquée par la souche 078 de C. difficile.
  16. 16. Utilisation de la composition immunogène selon l’une quelconque des revendications 1 à 11 ou du vaccin selon la revendication 12 dans la préparation d’un médicament destiné à la prévention ou au traitement d’une maladie de C. difficile.
  17. 17. Utilisation selon la revendication 16, où la maladie est une maladie provoquée par une souche de C. difficile choisie dans le groupe constitué de 078, 019, 023, 027, 033, 034, 036, 045, 058, 059, 063, 066, 075, 078, 080, 111, 112, 203, 250 et 571.
  18. 18. Utilisation selon la revendication 16, où la maladie est une maladie provoquée par la souche 078 de C. difficile.
  19. 19. Protéine CDTb isolée de Clostridium difficile telle que définie dans l’une quelconque des revendications 1 à 4.
BE2015/5390A 2014-06-25 2015-06-25 Composition immunogene BE1022949B1 (fr)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1411306.2A GB201411306D0 (en) 2014-06-25 2014-06-25 Immunogenic composition
GB1411306.2 2014-06-25
GB201411371A GB201411371D0 (en) 2014-06-26 2014-06-26 Immunogenic composition

Publications (2)

Publication Number Publication Date
BE1022949B1 BE1022949B1 (fr) 2016-10-21
BE1022949A1 true BE1022949A1 (fr) 2016-10-21

Family

ID=53498986

Family Applications (1)

Application Number Title Priority Date Filing Date
BE2015/5390A BE1022949B1 (fr) 2014-06-25 2015-06-25 Composition immunogene

Country Status (18)

Country Link
US (1) US20170218031A1 (fr)
EP (2) EP3160500B1 (fr)
JP (2) JP6688233B2 (fr)
CN (1) CN106536544B (fr)
BE (1) BE1022949B1 (fr)
BR (1) BR112016030096B1 (fr)
CA (1) CA2952118A1 (fr)
CY (1) CY1122145T1 (fr)
DK (1) DK3160500T3 (fr)
ES (1) ES2749701T3 (fr)
HR (1) HRP20191864T1 (fr)
HU (1) HUE045936T2 (fr)
LT (1) LT3160500T (fr)
MX (1) MX2016017094A (fr)
PL (1) PL3160500T3 (fr)
PT (1) PT3160500T (fr)
SI (1) SI3160500T1 (fr)
WO (1) WO2015197737A1 (fr)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3595709A4 (fr) * 2017-03-15 2020-12-23 Novavax, Inc. Méthodes et compositions pour induire des réponses immunitaires contre clostridium difficile
CN112703006A (zh) 2018-06-19 2021-04-23 葛兰素史密丝克莱恩生物有限公司 免疫原性组合物
GB202205833D0 (en) 2022-04-21 2022-06-08 Glaxosmithkline Biologicals Sa Bacteriophage

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4235877A (en) 1979-06-27 1980-11-25 Merck & Co., Inc. Liposome particle containing viral or bacterial antigenic subunit
US4866034A (en) 1982-05-26 1989-09-12 Ribi Immunochem Research Inc. Refined detoxified endotoxin
US4436727A (en) 1982-05-26 1984-03-13 Ribi Immunochem Research, Inc. Refined detoxified endotoxin product
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
US4877611A (en) 1986-04-15 1989-10-31 Ribi Immunochem Research Inc. Vaccine containing tumor antigens and adjuvants
EP0362278A4 (fr) 1987-06-05 1990-05-14 Us Health Facteurs de motilite de l'autocrine dans le diagnostic et le traitement du cancer.
US4912094B1 (en) 1988-06-29 1994-02-15 Ribi Immunochem Research Inc. Modified lipopolysaccharides and process of preparation
ATE115862T1 (de) 1989-02-04 1995-01-15 Akzo Nobel Nv Tocole als impfstoffadjuvans.
PL170980B1 (pl) 1992-06-25 1997-02-28 Smithkline Beecham Biolog Szczepionka PL PL PL PL PL PL PL
ES2162139T5 (es) 1993-03-23 2008-05-16 Smithkline Beecham Biologicals S.A. Composiciones de vacuna que contienen monofosforil-lipido a 3-o-desacilado.
NZ295998A (en) 1994-10-24 1999-10-28 Ophidian Pharm Inc Neutralizing antitoxins against clostridium difficile and clostidium botulinum toxins
UA56132C2 (uk) 1995-04-25 2003-05-15 Смітклайн Бічем Байолоджікалс С.А. Композиція вакцини (варіанти), спосіб стабілізації qs21 відносно гідролізу (варіанти), спосіб приготування композиції вакцини
EP0832282A1 (fr) 1995-06-02 1998-04-01 Incyte Pharmaceuticals, Inc. Procede ameliore pour obtenir des sequences d'adn complementaire longues
JP2002542169A (ja) * 1999-04-09 2002-12-10 テクラブ, インコーポレイテッド Clostridiumdifficileに対する、組換え毒素A/毒素Bワクチン
US20020065396A1 (en) 2000-03-28 2002-05-30 Fei Yang Compositions and methods of diagnosing, monitoring, staging, imaging and treating colon cancer
WO2005004791A2 (fr) * 2002-11-08 2005-01-20 President And Fellows Of Harvard College Composes et procedes de traitement et de prevention d'infections bacteriennes
AU2012349753A1 (en) * 2011-12-08 2014-06-19 Novartis Ag Clostridium difficile toxin-based vaccine
AR089797A1 (es) 2012-01-27 2014-09-17 Merck Sharp & Dohme Vacunas contra clostridum difficile que comprenden toxinas recombinantes
SI2928489T1 (sl) * 2012-12-05 2019-05-31 Glaxosmithkline Biologicals S.A. Imunogeni sestavek
GB201223342D0 (en) * 2012-12-23 2013-02-06 Glaxosmithkline Biolog Sa Immunogenic composition

Also Published As

Publication number Publication date
BE1022949B1 (fr) 2016-10-21
JP6688233B2 (ja) 2020-04-28
CA2952118A1 (fr) 2015-12-30
PL3160500T3 (pl) 2020-02-28
EP3160500A1 (fr) 2017-05-03
ES2749701T3 (es) 2020-03-23
BR112016030096A2 (pt) 2017-08-22
EP3636278A2 (fr) 2020-04-15
EP3160500B1 (fr) 2019-08-21
MX2016017094A (es) 2017-05-03
WO2015197737A1 (fr) 2015-12-30
US20170218031A1 (en) 2017-08-03
LT3160500T (lt) 2019-10-25
HRP20191864T1 (hr) 2020-01-10
JP2020100625A (ja) 2020-07-02
PT3160500T (pt) 2019-11-11
CN106536544A (zh) 2017-03-22
CN106536544B (zh) 2020-04-07
JP2017520573A (ja) 2017-07-27
BR112016030096A8 (pt) 2021-07-06
EP3636278A3 (fr) 2020-07-15
DK3160500T3 (da) 2019-11-11
HUE045936T2 (hu) 2020-01-28
CY1122145T1 (el) 2020-11-25
SI3160500T1 (sl) 2019-11-29
BR112016030096B1 (pt) 2023-10-03

Similar Documents

Publication Publication Date Title
BE1022345A9 (fr) Constructions de la proteine uspa2 et leurs utilisations
EP2934579B1 (fr) Composition immunogène comprenant des éléments des protéines cdtb et/ou cdta de c. difficile
CN101273055B (zh) 用于预防或治疗结核分枝杆菌感染的新方法
KR102393038B1 (ko) OspA의 돌연변이체 단편 및 이에 관련된 방법 및 용도
KR20070121814A (ko) 클라미디아 감염에 대비한 백신
JP2015528455A (ja) Staphylococcusaureusに対する免疫化のための安定化されたタンパク質
AU2017293400A1 (en) Listeria-based immunogenic compositions comprising Wilms tumor protein antigens and methods of use thereof
JP2019521095A (ja) 二次性結核および非結核性マイコバクテリウム感染症を治療するための組成物および方法
JP2020100625A (ja) クロストリジウム・ディフィシル免疫原性組成物
BE1022174B1 (fr) Vaccin
JP2015528457A (ja) Staphylococcusaureusに対する免疫化のための安定化されたタンパク質
EP0787796B9 (fr) Epitopes protecteurs de l&#39;adényl cyclase-hémolysine (AC-Hly). leur application au traitement ou à la prévention des infections par Bordetella
JP2015528456A (ja) Staphylococcusaureusに対する免疫化のための安定化されたタンパク質
BE1022553A1 (fr) Mutants de spy0269
JP2015532594A (ja) Staphylococcusaureusに対する免疫化のための安定化されたタンパク質
BE1022553B1 (fr) Mutants de spy0269
FR2828106A1 (fr) Utilisation d&#39;une omp d&#39;enterobacterie de faible masse moleculaire comme porteur et/ou adjuvant