EP3976780A1 - Outil genetique optimisé pour modifier les bacteries - Google Patents

Outil genetique optimisé pour modifier les bacteries

Info

Publication number
EP3976780A1
EP3976780A1 EP20740061.5A EP20740061A EP3976780A1 EP 3976780 A1 EP3976780 A1 EP 3976780A1 EP 20740061 A EP20740061 A EP 20740061A EP 3976780 A1 EP3976780 A1 EP 3976780A1
Authority
EP
European Patent Office
Prior art keywords
bacterium
sequence
nucleic acid
seq
genetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
EP20740061.5A
Other languages
German (de)
English (en)
Inventor
Nicolas Lopes Ferreira
Rémi HOCQ
François WASELS
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IFP Energies Nouvelles IFPEN
Original Assignee
IFP Energies Nouvelles IFPEN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IFP Energies Nouvelles IFPEN filed Critical IFP Energies Nouvelles IFPEN
Publication of EP3976780A1 publication Critical patent/EP3976780A1/fr
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/145Clostridium
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Definitions

  • the present invention relates to the transformation and genetic modification of bacteria, in particular belonging to the phylum Firmicutes, typically of solventogenic bacteria, for example of the genus Clostridium, preferably of bacteria possessing in the wild state both a bacterial chromosome and minus one DNA molecule (or natural plasmid) distinct from chromosomal DNA.
  • a genetic modification involving in particular a nucleic acid sequence used to facilitate the transformation of the bacterium, said sequence comprising i) all or part of the sequence SEQ ID NO: 126 and ii) a sequence allowing the modification of the genetic material of a bacterium and / or the expression within said bacterium of a DNA sequence partially or totally absent from the genetic material present within the wild version of said bacterium.
  • the description also covers the genetically modified bacteria obtained and their uses, in particular to produce a solvent, preferably on an industrial scale.
  • Clostridium contains Gram-positive bacteria, strictly anaerobic and sporulating, belonging to the phylum Firmicutes. Clostridia are an important group to the scientific community for several reasons. The first is that a number of serious diseases (e.g. tetanus, botulism) are due to infections of pathogenic members of this family (John & Wood, 1986; Gonzales et al., 2014). The second is the possibility of using so-called acidogenic or solventogenic strains in biotechnology (Moon et al., 2016).
  • Clostridia non-pathogenic, naturally have the capacity to convert a large variety of sugars to produce chemical species of interest, and more particularly acetone, butanol, and ethanol (John & Wood, 1986) in during a fermentation process called ABE.
  • IBE fermentation is possible in some particular species, in which acetone is reduced in variable proportion to isopropanol (Chen et al., 1986, George et al., 1983) thanks to the presence in the genome of these strains of genes encoding secondary alcohol dehydrogenases (s-ADH; Ismael et al., 1993, Hiu et al., 1987).
  • Solventogenic Clostridia species exhibit significant phenotypic similarities, which made their classification difficult before the emergence of modern sequencing techniques (Rogers et al., 2006). With the possibility of sequencing the complete genomes of these bacteria, it is now possible to classify this bacterial genus into 4 major species: C. acetobutylicum, C. saccharoperbutylacetonicum, C. saccharobutylicum and C. beijerinckii.
  • a recent publication proposes, after comparative analysis of the complete genomes of 30 strains, to classify these solventogenic Clostridia into 4 main clades ( Figure 1). These groups in particular separate the species C. acetobutylicum and C. beijerinckii with the respective references C. acetobutylicum ATCC 824 (also designated DSM 792 or LMG 5710) and C. beijerinckii NCIMB 8052. These latter are model strains for the study of ABE fermentation.
  • Clostridium strains naturally capable of carrying out IBE fermentation are few in number and mostly belong to the Clostridium beijerinckii species (see Zhang et al., 2018, Table 1). These strains are typically selected from C. butylicum LMD 27.6, C. aurantibutylicum NCIB 10659, C. beijerinckii LMD 27.6, C. beijerinckii VPI2968, C. beijerinckii NRRL B-593, C. beijerinckii ATCC 6014, C. beijerinckii McClung 3081 , C. isopropylicum IAM 19239, C. beijerinckii DSM 6423, C. sp. A1424, C. beijerinckii optinoii, and C. beijerinckii BGS1.
  • nuclease typically a Cas-type nuclease in the case of the CRISPR / Cas genetic tool, such as the Cas9 protein from Streptococcus pyogenes
  • gRNA guide RNA
  • the tools based on CRISPR technology have the major drawback of significantly limiting the size of the nucleic acid. of interest (and therefore the number of coding sequences or genes) likely to be inserted into the bacterial genome (approximately 1.8 kb at best according to Xu et al., 2015).
  • the inventors have developed and described a more efficient genetic tool for modifying bacteria, suitable for bacteria of the Clostridium genus, based on the use of two distinct nucleic acids, typically of two plasmids (WO2017064439, Wasels et al., 2017 and Figure 3) which solves this problem in particular.
  • the first nucleic acid of this tool allows the expression of cas9 and a second nucleic acid, specific for the modification to be carried out, contains one or more gRNA expression cassettes as well as a matrix of repair allowing the replacement of a portion of the bacterial DNA targeted by Cas9 by a sequence of interest.
  • At least one nucleic acid comprises a sequence encoding an anti-CRISPR protein ("acr"), placed under the control of an inducible promoter.
  • acr anti-CRISPR protein
  • the inventors have also very recently succeeded in genetically modifying bacteria comprising in the wild state a gene conferring on the bacteria resistance to one or more antibiotics in order to make them sensitive to the said antibiotic (s), this which facilitated the use of their genetic tool based on the use of at least two nucleic acids. They thus succeeded in genetically modifying the strain C. beijerinckii DSM 6423 naturally producing isopropanol. They succeeded in particular in eliminating from this strain a natural plasmid which is not essential for the strain, identified in the present description as “pNF2” (cf. FRI 8/73492).
  • the inventors then discovered, and reveal for the first time in the context of the present invention, that the elimination of this plasmid pNF2 makes it possible to obtain a C. beijerinckii DSM 6423 bacterium for which the efficiency of introducing material genetic (ie transformation) is increased by a factor of between approximately 10 1 and 5 x 10 3 .
  • the inventors also succeeded in still very significantly improve the genetic tool based on the use of at least two nucleic acids, using part of the plasmid pNF2 in order to design particular nucleic acids carrying a sequence allowing modification of the genetic material of a bacterium and / or to express within a bacterium a DNA sequence absent from the genetic material present within the wild version of said bacterium.
  • These nucleic acids and new tools dramatically improve the efficiency of transformation of bacteria, in particular the efficiency of transformation of bacteria previously freed of the natural plasmid (s) they contain in the wild state.
  • the present invention thus very advantageously facilitates the efficiency of transformation and therefore the exploitation of bacteria, in particular on an industrial scale.
  • the inventors describe, in the context of the present invention and for the first time, a nucleic acid (also identified in the present text as "OPT" nucleic acid) facilitating the transformation of bacteria (by improving maintenance within said bacteria. of all the genetic material introduced).
  • the OPT nucleic acid comprises i) all or part of the sequence SEQ ID NO: 126 and ii) a sequence allowing the modification of the genetic material of a bacterium and / or the expression within said bacterium of a sequence of DNA partially or totally absent from the genetic material present in the wild version of said bacterium.
  • the sequence SEQ ID NO: 126 is also identified herein as nucleic acid "OREP".
  • the inventors have succeeded in improving the frequencies of transformation of a nucleic acid within the bacterium C. beijerinckii DSM 6423 in particular by deleting the OREP sequence within said bacteria and by advantageously using all or part of this OREP sequence to construct nucleic acids and / or genetic tools allowing the modification of the genetic material of a bacterium and / or the expression within said bacterium of a DNA sequence partially or totally absent from the genetic material present within the wild version of said bacteria.
  • the OREP sequence comprises a nucleotide sequence (SEQ ID NO: 127) encoding a protein involved in the replication of an OPT nucleic acid of interest.
  • This protein involved in replication is also identified in this text as "REP" protein (SEQ ID NO: 128 - "MNNNNTESEELKEQSQLLLDKCTKKKKKNPKFSSYIEPLVSKKLSERIKECGDFLQMLSDLNLE NSKLHRASFCGNRFCPMCSWRIACKDSLEISILMEHLRKEESKEFIFLTLTTPNVKGADLDNSIKA YNKAFKKLMERKEVKSIVKGYIRKLEVTYNLDKSSKSYNTYHPHFHVVLAVNRSYFKKQNLYIN HHRWLSLWQESTGDYSITQVDVRKAKINDYKEVYELAKYSAKDSDYLINREVFTVFYKSLKGK QVLVFSGLFKDAHKMYKNGELDLYKKLDTIEYAYMVSYNWLKKKY
  • the REP protein has a domain conserved in firmicutes, called “COG 5655” (Plasmid rolling circle replication initiator protein REP), of sequence SEQ ID NO: 129. Also described is a genetic tool allowing the optimized transformation then the modification by homologous recombination of the genetic material of a bacterium and / or the expression within said bacterium of a DNA sequence partially or totally absent from the material of a bacterium.
  • bacterium belonging to the phylum Firmicutes for example a bacterium of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus (Hidalgo-Cantabrana, C. et al.; Yadav, R. et al.).
  • the modification tool by homologous recombination is typically characterized i) in that it comprises at least:
  • first nucleic acid encoding at least one DNA endonuclease, for example the enzyme Cas9, in which the sequence encoding the DNA endonuclease is placed under the control of a promoter, and
  • At least one of said nucleic acids further encodes one or more guide RNAs (gRNA) or in that the genetic tool further comprises one or more guide RNAs, each guide RNA comprising a binding RNA structure to the DNA endonuclease and a sequence complementary to the targeted portion of the bacterial DNA, and preferably iii) in that at least one of said nucleic acids further comprises a sequence encoding an anti-CRISPR protein placed under the control of an inducible promoter, or in that the genetic tool further comprises a third nucleic acid encoding an anti-CRISPR protein placed under the control of an inducible promoter.
  • gRNA guide RNAs
  • such a genetic tool comprising at least:
  • first nucleic acid encoding at least one DNA endonuclease, in which the sequence encoding the DNA endonuclease is placed under the control of a promoter
  • nucleic acid comprising, or consisting of, an “OREP nucleic acid” sequence, ie comprising, or consisting of, i) all or part of the sequence SEQ ID NO: 126 and ii) a sequence allowing the modification of the genetic material of a bacterium and / or the expression within said bacterium of a DNA sequence partially or totally absent from the genetic material present within the wild version of said bacterium.
  • the “second nucleic acid containing a repair template” as described above comprises this “other nucleic acid”.
  • the inventors also describe a process for transforming, and preferably for genetically modifying, for example by homologous recombination, a bacterium belonging to the phylum Firmicutes, for example a bacterium of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus, typically a solventogenic bacterium. , as well as the bacterium (s) obtained (transformed (s) and typically genetically modified (s)) using such a process.
  • This method advantageously comprises a step of transforming the bacterium by introducing into said bacterium all or part of a genetic tool as described in the present text, in particular of a nucleic acid (“nucleic acid OREP ”) comprising, or consisting of, i) all or part of the sequence SEQ ID NO: 126 and ii) a sequence allowing the modification of the genetic material of a bacterium and / or the expression within said bacterium of a DNA sequence that is partially or totally absent from the genetic material present within the wild version of said bacterium.
  • nucleic acid OREP nucleic acid
  • this method advantageously comprises the following steps: a) introduction into the bacterium of a genetic tool as described in the present text, preferably in the presence of an agent inducing the expression of anti-CRISPR protein, and
  • step b) culture of the transformed bacterium obtained at the end of step a) on a medium not containing the agent inducing the expression of the anti-CRISPR protein, and typically allowing the expression of the ribonucleoprotein endonuclease complex DNA / gRNA, for example Cas9 / gRNA.
  • the inventors also describe a kit for transforming, and preferably genetically modifying, a bacterium belonging to the phylum Firmicutes, for example a bacterium of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus, or for producing at least one solvent, for example a mixture of solvents, using such a bacterium.
  • This kit preferably comprises a nucleic acid as described in the present text and an inducer suitable for the inducible promoter of the expression of the selected anti-CRISPR protein used in the genetic tool as described in this text.
  • the kit comprises all or part of the elements of a genetic tool as described in this text.
  • a nucleic acid or a genetic tool for the first time in the present text, for transforming and possibly genetically modifying a bacterium belonging to the phylum Firmicutes, for example a bacterium of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus, preferably a bacterium possessing in the wild state both a bacterial chromosome and at least one DNA molecule distinct from the chromosomal DNA (typically a natural plasmid).
  • a bacterium belonging to the phylum Firmicutes for example a bacterium of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus, preferably a bacterium possessing in the wild state both a bacterial chromosome and at least one DNA molecule distinct from the chromosomal DNA (typically a natural plasmid).
  • a nucleic acid of a genetic tool, of a method for transforming and preferably genetically modifying such a bacterium, of the bacterium obtained by such a method and / or a kit, to allow the production, preferably on an industrial scale, of a solvent or of a mixture of solvents, preferably acetone, butanol, ethanol, isopropanol or d a mixture of these, typically of an isopropanofbutanol, butanol / ethanol or isopropanol / ethanol mixture.
  • bacteria of the Clostridium genus naturally producing isopropanol typically possessing in their genome an adh gene encoding a primary / secondary alcohol dehydrogenase which allows the reduction of acetone to isopropanol, are distinguished both genetically and functionally from bacteria naturally capable of ABE fermentation.
  • the inventors have advantageously succeeded, in the context of the present invention, in transforming and genetically modifying a bacterium of the Clostridium genus naturally producing isopropanol, the bacterium C. beijerinckii DSM 6423, as well as the reference strain C. acetobutylicum DSM 792.
  • the C. beijerinckii DSM 6423 strain is naturally sensitive to erythromycin but resistant to thiamphenicol.
  • Patent application No. FRI 8/73492 describes a particular strain, the C. beijerinckii DSM 6423 AcatB strain (also identified in the present text as C. beijerinckii IFP962 AcatB), made sensitive to thiamphenicol.
  • the inventors have succeeded in removing from the C. beijerinckii DSM 6423 strain its natural plasmid pNF2 and obtained a C. beijerinckii DSM6423 AcatB ApNF2 strain (also identified in the present text as C. beijerinckii IFP963 AcatB ApNF2).
  • This strain is characterized for the first time in the context of the present application. It was registered on February 20, 2019 under the deposit number LMG P- 31277 with the BCCM-LMG collection. This strain lacks the catB gene of sequence SEQ ID NO: 18 and the plasmid pNF2 (wild type). The description also relates to any bacterium derived, cloned, mutant or genetically modified version thereof, typically also lacking the catB gene of sequence SEQ ID NO: 18 and the plasmid pNF2 (wild-type).
  • non-chromosomal (bacterial) DNA or "natural (bacterial) plasmid”
  • genetically modified using a nucleic acid and / or genetic tool described in the context of the present invention so as not to include at least one of its molecules of non-chromosomal DNA, typically several of its non-chromosomal DNA molecules (eg two, three or four non-chromosomal DNA molecules), preferably all of its non-chromosomal DNA molecules.
  • a solventogenic bacterium belonging to the phylum Firmicutes for example a bacterium of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus, more particularly a bacterium of the genus Clostridium, naturally capable (ie capable of wild state) to produce isopropanol, in particular naturally capable of carrying out IBE fermentation, which has been genetically modified and has, due to this genetic modification, in particular lost at least one natural plasmid (ie a naturally occurring plasmid present in the wild version of said bacterium), preferably all of its natural plasmids, as well as the tools, in particular the genetic tools, which made it possible to obtain it.
  • a solventogenic bacterium belonging to the phylum Firmicutes for example a bacterium of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus, more particularly a bacterium of the genus Clostridium,
  • the inventors have thus succeeded in making sensitive to an antibiotic belonging to the class of amphenicols, a bacterium naturally carrying (carrier in the wild state) of a gene encoding an enzyme responsible for resistance to these antibiotics. .
  • Other preferred bacteria contain, in the wild, both a bacterial chromosome and at least one DNA molecule distinct from chromosomal DNA.
  • Also preferred bacteria contain, in the wild, both a bacterial chromosome and at least one DNA molecule distinct from chromosomal DNA, as well as a gene conferring resistance to an antibiotic.
  • this gene encodes an amphenicol-O-acetyltransferase, for example a chloramphenicol-O-acetyltransferase or a thiamphenicol-O-acetyltransferase.
  • a first object described by the inventors relates to a nucleic acid (identified in the present text as “OPT” nucleic acid), advantageously usable to facilitate the transformation of bacteria by improving the maintenance within said bacteria of all the genetic material.
  • This OPT nucleic acid comprises i) all or part of the sequence SEQ ID NO: 126 (“OREP” sequence) or of a functional variant thereof and ii) a sequence (also identified in the present text as “ sequence of interest ') allowing modification of the genetic material of a bacterium and / or expression within said bacterium of a DNA sequence partially or totally absent from the genetic material present within the wild version of said bacterium.
  • the OREP sequence (SEQ ID NO: 126) comprises a nucleotide sequence of sequence SEQ ID NO: 127.
  • the sequence SEQ ID NO: 127 preferably comprises a sequence encoding a protein involved in the replication of the OPT nucleic acid.
  • a protein considered to be involved in replication is also identified in the present text as a “REP” protein (SEQ ID NO: 128).
  • the REP protein has a domain conserved in Firmicutes, called “COG 5655”, of sequence SEQ ID NO: 129.
  • the OPT nucleic acid comprises part of the OREP sequence (SEQ ID NO: 126), typically one or more fragments of the OREP sequence, preferably at least the sequence encoding the REP protein (SEQ ID NO: 128) or a variant or functional fragment thereof (ie the fragment involved in replication), typically the sequence SEQ ID NO: 127 or a variant or fragment thereof encoding the fragment involved, within the sequence.
  • REP protein in the replication of an OPT nucleic acid.
  • the functional fragment of the OREP sequence encoding the fragment, present within the REP protein, involved in the replication of an OPT nucleic acid comprises the domain of sequence SEQ ID NO: 129.
  • nucleic acid fragments encoding a functional fragment of the REP protein are capable of being easily prepared by those skilled in the art.
  • a typical example of a variant has sequence homology with the sequence SEQ ID NO: 127 of between 70% and 100%, preferably between 85 and 99%, even more preferably between 95 and 99%, for example 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 or 100%.
  • the functional fragment or variant of the OREP sequence encodes a protein involved in the replication of OPT nucleic acid.
  • the functional fragment or variant of the OREP sequence comprises, in addition to the sequence encoding a protein (for example the REP protein) involved in the replication of the OPT nucleic acid (for example a genetic construct of the plasmid type) or of a variant or functional fragment thereof, a site of 1 to 150 bases, preferably of 1 to 15 bases, for example a sequence rich in bases A and T (Rajewska et al .), preferably a site present within the plasmid pNF2 of sequence SEQ ID NO: 1 18, allowing the binding of a protein allowing the replication of the nucleic acid OPT.
  • a protein for example the REP protein
  • the OPT nucleic acid for example a genetic construct of the plasmid type
  • a variant or functional fragment thereof for example a site of 1 to 150 bases, preferably of 1 to 15 bases, for example a sequence rich in bases A and T (Rajewska et al .)
  • the sequence of interest allowing the modification of the genetic material of the bacterium is typically a modification matrix allowing, for example by a homologous recombination mechanism, for example according to one of the methods described in the present text, the replacement of a portion of the bacteria's genetic material by a sequence of interest.
  • the sequence of interest allowing the modification of the genetic material of the bacterium can also be a sequence recognizing (binding at least in part), and preferably targeting, ie recognizing and allowing the cut, in the genome of a bacterium of interest. , at least one strand i) of a target sequence, ii) of a sequence controlling the transcription of a target sequence, or iii) of a sequence flanking a target sequence.
  • sequence of interest allowing the expression within said bacterium of a DNA sequence partially or totally absent from the genetic material present within the wild version of said bacterium typically allows the bacterium to express one or more proteins that it is incapable of expressing, or of expressing in sufficient quantity, in the wild.
  • “OPT nucleic acid” further comprises iii) a sequence encoding a DNA endonuclease, for example Cas9, and / or iv) one or more guide RNAs (gRNA), each gRNA comprising an RNA structure binding to the DNA endonuclease and a sequence complementary to the targeted portion of the genetic material of the bacteria.
  • gRNA guide RNAs
  • OPT nucleic acid does not exhibit methylation at the level of the units recognized by the methyltransferases of the Dam and Dcm type.
  • the “OPT nucleic acid” is selected from an expression cassette and a vector, and is preferably a plasmid, for example a plasmid having a sequence selected from SEQ ID NO: 1 19, SEQ ID NO: 123, SEQ ID NO: 124 and SEQ ID NO: 125.
  • Another object described by the inventors relates to a genetic tool that can be used to transform and / or genetically modify a bacterium of interest, typically a bacterium as described in the present text belonging to the phylum Firmicutes, for example a bacterium of the genus Clostridium. , of the genus Bacillus or of the genus Lactobacillus, preferably a bacterium of the genus Clostridium naturally capable (ie capable in the wild state) of producing isopropanol, in particular naturally capable of carrying out IBE fermentation, preferably a resistant bacterium naturally to one or more antibiotics, such as C. beijerinckii bacteria.
  • a preferred bacteria has both a bacterial chromosome and at least one DNA molecule distinct from chromosomal DNA in the wild.
  • bacteria belonging to the phylum Firmicutes is meant, in the context of the present description, bacteria belonging to the class of Clostridia, Mollicutes, Bacilli or Togobacteria, preferably to the class of Clostridia or Bacilli.
  • Particular bacteria belonging to the phylum Firmicutes include, for example, bacteria of the genus Clostridium, bacteria of the genus Bacillus or bacteria of the genus Lactobacillus.
  • bacteria of the genus Clostridium is understood to mean in particular the Clostridium species said to be of industrial interest, typically the solvent-causing or acetogenic bacteria of the genus Clostridium.
  • the expression "bacterium of the genus Clostridium” encompasses wild bacteria as well as the strains derived from these, genetically modified with the aim of improving their performance (for example overexpressing the ctfA, ctfB and a de genes) without having been exposed. to the CRISPR system.
  • Clostridium species of industrial interest the species capable of producing, by fermentation, solvents and acids such as butyric acid or acetic acid, from sugars or from oses, typically from sugars comprising 5 carbon atoms such as xylose, arabinose or fructose, from sugars comprising 6 carbon atoms such as glucose or mannose, from polysaccharides such as cellulose or hemicelluloses and / or any other source of carbon which can be assimilated and used by bacteria of the Clostridium genus (CO, CO2, and methanol for example).
  • solvents and acids such as butyric acid or acetic acid
  • solvent-forming bacteria of interest are bacteria of the genus Clostridium producing acetone, butanol, ethanol and / or isopropanol, such as the strains identified in the literature as “ABE strain” [strains producing fermentations allowing the production of acetone, butanol and ethanol] and “strain IBE” [strains carrying out fermentations allowing the production of isopropanol (by reduction of acetone), butanol and ethanol].
  • Solventogenic bacteria of the Clostridium genus can be selected, for example, from C. acetobutylicum, C. cellulolyticum, C. phytofermentans, C. beijerinckii, C. saccharobutylicum, C.
  • saccharoperbutylacetonicum C. sporogenes, C. butyricum, C. aurantibutyricum and C. tyrobutyricum, preferably from C. acetobutylicum, C. beijerinckii, C. butyricum, C. tyrobutyricum and C. cellulolyticum, and even more preferably from C. acetobutylicum and C. beijerinckii.
  • a bacterium capable of producing isopropanol in the wild state may for example be a bacterium selected from a C. beijerinckii bacterium, a C. diolis bacterium, C. puniceum bacteria, C. butyricum bacteria, C. saccharoperbutylacetonicum bacteria, C. botulinum bacteria, C. drakei bacteria, C. scatologenes bacteria, C. perfringens bacteria, and C. tunisiense bacteria, from preferably a bacterium selected from a C. beijerinckii bacterium, a C. diolis bacterium, a C.
  • puniceum bacterium and a C. saccharoperbutylacetonicum bacterium.
  • the acetogenic bacteria of interest are bacteria that produce acids and / or solvents from CO2 and 3 ⁇ 4.
  • Acetogenic bacteria of the genus Clostridium can be selected, for example, from C. aceticum, C. thermoaceticum, C. ljungdahlii, C. autoethanogenum, C. difficile, C. scatologenes and C. carboxydivorans.
  • the bacterium of the Clostridium genus concerned is an “ABE strain”, preferably the DSM 792 strain (also designated strain ATCC 824 or also LMG 5710) of C. acetobutylicum, or the NCIMB 8052 strain of C. beijerinckii.
  • the bacterium of the Clostridium genus concerned is an “IBE strain”, preferably a subclade of C. beijerinckii selected from DSM 6423, LMG 7814, LMG 7815, NRRL B-593, NCCB 27006, or a bacterium C. aurantibutyricum DSZM 793 (Georges et al., 1983), and a subclade of such a bacterium C. beijerinckii or C. aurantibutyricum exhibiting at least 90%, 95%, 96%, 97%, 98 % or 99% identity with strain DSM 6423.
  • the inventors carried out fermentation tests confirming that the C. beijerinckii bacteria of the DSM 6423, LMG 7815 and NCCB 27006 subclade are capable of producing isopropanol in the wild state (see Table 1).
  • the C. beijerinckii bacterium is the bacterium of DSM 6423 subclade.
  • the C. beijerinckii bacterium is a C. beijerinckii strain IFP963 AcalB ApNF2 (registered on February 20, 2019 under the deposit number LMG P-31277 from the BCCM-LMG collection, and also identified herein as C. beijerinckii DSM 6423 AcatB ApNF2), or a genetically modified version thereof.
  • the bacterium C. beijerinckii IFP963 AcatB ApNF2, or said genetically modified version thereof lacks the catB gene of sequence SEQ ID NO: 18 and of the plasmid pNF2.
  • bacterium of the genus Bacillus is meant in particular B. amyloliquefaciens, B. thurigiensis, B. coagulans, B. cereus, B. anthracis or also B. subtilis.
  • the strain IFP963 AcatB ApNF2 can thus be transformed with an efficiency 10 to 5 ⁇ 10 3 times greater than its wild-type counterpart or to the strain DSM 6423 AcatB (also identified in the present text as IFP962 AcatB).
  • the bacterium intended to be transformed, and preferably genetically modified is preferably a bacterium which has been exposed to a first step of transformation and to a first step of genetic modification using a nucleic acid or genetic tool according to l 'invention having made it possible to delete at least one extrachromosomal DNA molecule (typically at least one plasmid) naturally present within said bacterium in the wild state.
  • a particular genetic tool described by the inventors is characterized i) in that it comprises at least:
  • first nucleic acid encoding at least one DNA endonuclease, for example the enzyme Cas9, in which the sequence encoding the DNA endonuclease is placed under the control of a promoter, and
  • At least one of said nucleic acids further encodes one or more guide RNAs (gRNA) or in that the genetic tool further comprises one or more guide RNAs, each guide RNA comprising a binding RNA structure DNA endonuclease and a sequence complementary to the targeted portion of bacterial DNA.
  • gRNA guide RNAs
  • RNA is in the form of a chimeric RNA which consists of the combination of a bacterial CRISPR RNA (crRNA) and a tracrRNA (// vms-activating RNA CRISPR) (linek et al., Science 2012 ).
  • the gRNA combines the targeting specificity of the crRNA corresponding to the "spacer sequences" which serve as guides for the Cas proteins, and the conformational properties of the rRNA into a single transcript.
  • the target genomic sequence is typically advantageously permanently modified by virtue of a repair matrix provided.
  • the genetic tool according to the invention is preferably characterized iii) in that at least one of said (“first” and “second”) nucleic acids further comprises a sequence encoding an anti-CRISPR protein placed under the control of an inducible promoter, or in that the genetic tool further comprises a third nucleic acid encoding an anti-CRISPR protein placed under the control of an inducible promoter.
  • a genetic tool comprising at least:
  • nucleic acid (or an “umpteenth nucleic acid”) comprising, or consisting of, a nucleic acid sequence “OPT”, ie a sequence comprising i) all or part of the sequence SEQ ID NO: 126 (“OREP ”) And ii) a sequence allowing the modification of the genetic material of a bacterium and / or the expression within said bacterium of a DNA sequence partially or completely absent from the genetic material present within the wild version of said bacterium, at least one of said nucleic acids of this particular genetic tool preferably further comprising a sequence encoding an anti-CRISPR protein placed under the control of an inducible promoter, or said particular genetic tool preferably further comprising a third nucleic acid encoding an anti-CRISPR protein placed under the control of an inducible promoter.
  • the “second” or “nth nucleic acid containing a repair template” as described above comprises, or consists of, this “other nucleic acid”.
  • the “first nucleic acid” further encodes one or more guide RNAs (gRNA).
  • gRNA guide RNAs
  • nucleic acid is understood to mean any natural, synthetic, semi-synthetic or recombinant DNA or RNA molecule, optionally chemically modified (ie comprising non-natural bases, modified nucleotides comprising by example a modified binding, modified bases and / or modified sugars), or optimized so that the codons of the transcripts synthesized from the coding sequences are the codons most frequently found in a bacterium of the genus Clostridium for its use in it.
  • the optimized codons are typically codons rich in adenine (“A”) and thymine (“T”) bases.
  • C cysteine
  • D aspartic acid
  • E glutamic acid
  • F phenylalanine
  • G glycine
  • H histidine
  • I isoleucine
  • K lysine
  • L leucine
  • M methionine
  • N asparagine
  • P proline
  • Q glutamine
  • R arginine
  • S serine
  • T threonine
  • V valine
  • W tryptophan
  • Y tyrosine.
  • a genetic tool described in the context of the present invention comprises a first nucleic acid encoding at least one DNA endonuclease (also identified in the present text as “nuclease”), typically a Cas type nuclease, for example Cas9 or MAD7.
  • DNA endonuclease also identified in the present text as “nuclease”
  • Cas type nuclease for example Cas9 or MAD7.
  • Cas9 is meant the Cas9 protein (also called CRISPR-associated protein 9, Csnl or Csxl2) or a functional protein, peptide or polypeptide fragment thereof, ie capable of interacting with the guide RNA (s) and of to exert the enzymatic (nuclease) activity which allows it to carry out the double strand cleavage of the DNA of the target genome.
  • Cas9 can thus denote a modified protein, for example truncated in order to delete the domains of the protein which are not essential for the predefined functions of the protein, in particular the domains not necessary for the interaction with the gRNA (s).
  • the MAD7 nuclease (the amino acid sequence of which corresponds to the sequence SEQ ID NO: 72), also identified as “Cas 12” or “Cpfl”, can otherwise be advantageously used in the context of the present invention by the combining with one or more gRNAs known to those skilled in the art capable of binding to such a nuclease (cf. Garcia-Doval et al., 2017 and Stella S. et al., 2017).
  • the sequence encoding the MAD7 nuclease is a sequence optimized to be easily expressed in strains of Clostridium, preferably the sequence SEQ ID NO: 71.
  • sequence encoding the MAD7 nuclease is a sequence optimized to be easily expressed in strains of Bacillus, preferably the sequence SEQ ID NO: 132.
  • the Cas9 encoding sequence (the entire protein or a fragment thereof) as usable in one of the exemplary possible embodiments of the invention can be obtained from any known Cas9 protein (Makarova et al. , 201 1).
  • Cas9 proteins which can be used in the present invention include, without being limited thereto, the Cas9 proteins of S. pyogenes (cf.
  • the Cas9 protein, or a functional protein, peptide or polypeptide fragment thereof, encoded by one of the nucleic acids of the genetic tool according to the invention comprises, or consists of, the sequence of amino acids SEQ ID NO: 75, or any other amino acid sequence having at least 50%, preferably at least 60%, identity therewith, and containing at least the two aspartic acids ("D ") Occupying positions 10 (" D10 ”) and 840 (" D840 ") of the amino acid sequence SEQ ID NO: 75.
  • Cas9 comprises, or consists of, the Cas9 protein (NCBI accession number: WP_010922251.1, SEQ ID NO: 75), encoded by the cas9 gene of the strain of S. pyogenes M1 GAS ( NCBI entry number: NC 002737.2 SPy_1046, SEQ ID NO: 76) or an optimized version thereof ("optimized version") that results in a transcript containing the codons used preferably by bacteria of the Clostridium genus, typically codons rich in adenine (“A”) and thymine (“T”) bases, allowing facilitated expression of the Cas9 protein within this bacterial genus.
  • These optimized codons respect the codon usage bias, well known to those skilled in the art, specific to each bacterial strain.
  • the Cas9 domain consists of an entire Cas9 protein, preferably the Cas9 protein of S. pyogenes or of an optimized version thereof.
  • each of the nucleic acids of a genetic tool described in the present text consists of a distinct entity and is typically in the form of 'an expression cassette (or “construct”) such as for example a nucleic acid comprising at least one transcriptional promoter linked in an operational manner (as understood by those skilled in the art) to one or more (coding) sequences of interest, for example to an operon comprising several coding sequences of interest, the expression products of which contribute to the achievement of a function of interest within the bacterium, or a nucleic acid further comprising an activator sequence and / or a transcription terminator; or in the form of a vector, circular or linear, single or double stranded, for example a plasmid, a phage, a cosmid, an artificial or synthetic chromosome, comprising one or more expression cassettes as defined above.
  • the vector is a plasmid
  • the nucleic acids of interest can be constructed by standard techniques well known to those skilled in the art and can comprise one or more promoters, origins of bacterial replication (ORI sequences) , termination sequences, selection genes, for example antibiotic resistance genes, and sequences ("flanked regions") permitting the targeted insertion of the cassette or the vector.
  • cassettes and expression vectors can be integrated within the bacterial genome by techniques well known to those skilled in the art.
  • ORI sequences of interest can be chosen from pIP404, rAMbI, repH (origin of replication in C. acetobutylicum), ColE1 or rep (origin of replication in E. coli), or any other origin of replication allowing the maintenance of the vector, typically from the plasmid, within a bacterial cell, for example a Clostridium or Bacillus cell.
  • a preferred ORI sequence is that present within the OREP sequence (SEQ ID NO: 126) of the plasmid pNF2 (SEQ ID NO: 1 18).
  • the termination sequences of interest can be chosen from those of the adc, th1 genes, of the bcs operon, or of any other terminator, well known to those skilled in the art, allowing the stopping of transcription within. of a bacterial cell, for example of a Clostridium or Bacillus cell.
  • Selection genes (resistance genes) of interest can be chosen from ermB, catP, bla, tetA, tetM, and / or any other gene for resistance to ampicillin, erythromycin, chloramphenicol, thiamphenicol, spectinomycin, tetracycline or any other antibiotic which can be used to select bacteria, for example of the genus Clostridium or Bacillus, well known to those skilled in the art.
  • the sequence encoding the DNA endonuclease, for example Cas9 optionally present within one of the nucleic acids of a genetic tool according to the invention, can be placed under the control of a promoter.
  • This promoter can be a constitutive promoter or an inducible promoter.
  • the promoter controlling the expression of the nuclease is an inducible promoter.
  • constitutive promoters which can be used in the context of the present invention can be selected from the promoter of the th1 gene, of the ptb gene, of the adc gene, of the BCS operon, or a derivative thereof, preferably a functional derivative. but shorter (truncated) such as the “miniPthl” derivative of the promoter of the thl gene of C. acetobutylicum (Dong et al., 2012), or any other promoter, well known to those skilled in the art, allowing the expression of d a protein within a bacterium of interest, for example a bacterium of the genus Clostridium.
  • inducible promoters can be selected for example from a promoter whose expression is controlled by the transcriptional repressor TetR, for example the promoter of the telA gene (tetracycline resistance gene originally present on the Tn10 transposon of E. coli); a promoter whose expression is controlled by L-arabinose, for example the promoter of the ptk gene (Zhang et al., 2015), preferably in combination with the araR cassette for regulating the expression of C.
  • a promoter whose expression is controlled by the transcriptional repressor TetR for example the promoter of the telA gene (tetracycline resistance gene originally present on the Tn10 transposon of E. coli); a promoter whose expression is controlled by L-arabinose, for example the promoter of the ptk gene (Zhang et al., 2015), preferably in combination with the araR cassette for regulating the expression of C.
  • acetobutylicum so to build an ARAi system (Zhang et al., 2015); a promoter whose expression is controlled by laminaribiose (glucose dimer b-1,3), for example the promoter of the celC gene, preferably immediately followed by the repressor gene glyR3 and the gene of interest (Mearls et al.
  • the promoter of the celC gene (Newcomb et al., 201 1); a promoter whose expression is controlled by lactose, for example the promoter of the bgaL gene (Banerjee et al., 2014); a promoter whose expression is controlled by xylose, for example the promoter of the xylB gene (Nariya et al., 2011); and a promoter whose expression is controlled by UV exposure, for example the ben gene promoter (Dupuy et al., 2005).
  • lactose for example the promoter of the bgaL gene
  • a promoter whose expression is controlled by xylose for example the promoter of the xylB gene (Nariya et al., 2011)
  • a promoter whose expression is controlled by UV exposure for example the ben gene promoter (Dupuy et al., 2005).
  • a promoter derived from one of the promoters described above, preferably a shorter (truncated) functional derivative can also be used in the context of the invention.
  • inducible promoters which can be used in the context of the present invention are also described, for example, in the articles by Ransom et al. (2015), Currie et al. (2013) and Hartman et al. (201 1).
  • a preferred inducible promoter is a promoter derived from such A, inducible to anhydrotetracycline (aTc; less toxic than tetracycline and capable of lifting the inhibition of the transcriptional repressor TetR at lower concentration), chosen from Pcm-2tet01 and Pcm- 2tet02 / l (Dong et al., 2012).
  • Another preferred inducible promoter is a lactose inducible promoter, for example the promoter of the bgaL gene (Banerjee et al., 2014).
  • a nucleic acid of particular interest typically an expression cassette or vector, comprises one or more expression cassettes, each cassette encoding a gRNA.
  • the term “guide RNA” or “gRNA” denotes, within the meaning of the invention, an RNA molecule capable of interacting with a DNA endonuclease in order to guide it towards a target region of the bacterial chromosome. The specificity of cut is determined by the gRNA. As explained previously, each gRNA comprises two regions:
  • SDS region a first region (commonly called "SDS" region), at the 5 'end of the gRNA, which is complementary to the target chromosomal region and which mimics the crRNA of the endogenous CRISPR system, and
  • a second region (commonly called the “handle” region), at the 3 'end of the gRNA, which mimics the base pairing interactions between the tracrRNA (“trans-activating crRNA”) and the crRNA of the endogenous CRISPR system and has a double-stranded rod and loop structure terminating at 3 'in an essentially single-stranded sequence.
  • This second region is essential for the binding of gRNA to the DNA endonuclease.
  • the first region of the gRNA ("SDS" region) varies depending on the target chromosome sequence.
  • the "SDS" region of the gRNA which is complementary to the target chromosomal region comprises at least 1 nucleotide, preferably at least 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 or 40 nucleotides, typically between 1 and 40 nucleotides. Preferably, this region is 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 or 30 nucleotides in length.
  • the second region of the gRNA (“handle” region) has a stem and loop structure (or hairpin structure).
  • the “handle” regions of the different gRNAs do not depend on the chromosomal target chosen.
  • the “handle” region comprises, or consists of, a sequence of at least 1 nucleotide, preferably at least 1, 50, 100, 200, 500 and 1000 nucleotides, typically between 1 and 1000 nucleotides. . Preferably, this region is 40 to 120 nucleotides in length.
  • the total length of a gRNA is generally 50 to 1000 nucleotides, preferably 80 to 200 nucleotides, and more particularly preferably 90 to 120 nucleotides.
  • a gRNA as used in the present invention has a length of between 95 and 110 nucleotides, for example a length of approximately 100 or of approximately 110 nucleotides.
  • gRNAs can easily define the sequence and structure of gRNAs according to the chromosomal region to be targeted using well known techniques (see for example the article by DiCarlo et al., 2013).
  • the targeted DNA region / portion / sequence within the bacterial genome may correspond to a non-coding portion of DNA or to a coding portion of DNA.
  • the targeted portion of the bacterial DNA is essential for bacterial survival. It corresponds, for example, to any region of the bacterial chromosome or to any region located on non-chromosomal DNA, for example on a mobile genetic element, essential for the survival of the microorganism under growth conditions.
  • a plasmid containing a marker of resistance to a antibiotic when the growth conditions provided make it necessary to cultivate the bacteria in the presence of said antibiotic.
  • the targeted portion of the bacterial DNA can correspond to any region of said non-bacterial DNA. chromosomal.
  • Specific examples of DNA portion targeted within a bacterium of the genus Clostridium are the sequences used in Example 1 of the experimental part. These are, for example, sequences encoding the bdhA (SEQ ID NO: 77) and bdhB (SEQ ID NO: 78) genes.
  • the targeted DNA region / portion / sequence is followed by a "PAM" ("protospacer adjacent motif") sequence which is involved in binding to the DNA endonuclease.
  • PAM protospacer adjacent motif
  • the “SDS” region of a given gRNA is identical (100%) or at least 80% identical, preferably at least 85%, 90%, 95%, 96%, 97%, 98% or 99% at least. to the region / portion / DNA sequence targeted within the bacterial genome, for example the bacterial chromosome, and is capable of hybridizing to all or part of the sequence complementary to said region / portion / sequence, typically to a sequence comprising at least 1 nucleotide, preferably at least 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 or 40 nucleotides, typically between 1 and 40 nucleotides, preferably with a sequence comprising 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 or 30 nucleotides.
  • the nucleic acid of interest may comprise one or more guide RNAs (gRNAs) targeting a sequence ("target sequence”, “targeted sequence” or “recognized sequence”).
  • gRNAs guide RNAs
  • target sequence "targeted sequence” or “recognized sequence”
  • gRNAs can target chromosomal regions, or regions belonging to the non-chromosomal bacterial DNA (for example to mobile genetic elements) possibly present within the microorganism, which are identical or different.
  • GRNAs can be introduced into the bacterial cell in the form of gRNA molecules (mature or precursor), in the form of precursors or in the form of one or more nucleic acids encoding said gRNAs.
  • the gRNAs are preferably introduced into the bacterial cell in the form of one or more nucleic acids encoding said gRNAs.
  • these gRNAs can contain modified nucleotides or chemical modifications allowing them, for example, to increase their resistance to nucleases and thus increase their lifespan in the cell. They may in particular comprise at least one modified or unnatural nucleotide such as, for example, a nucleotide comprising a modified base, such as inosine, methyl-5-deoxycytidine, dimethylamino-5-deoxyuridine, deoxyuridine, diamino -2,6-purine, bromo-5-deoxyuridine or any other modified base allowing hybridization.
  • a modified base such as inosine, methyl-5-deoxycytidine, dimethylamino-5-deoxyuridine, deoxyuridine, diamino -2,6-purine, bromo-5-deoxyuridine or any other modified base allowing hybridization.
  • the gRNAs used according to the invention can also be modified at the level of the intemucleotide bond such as, for example, phosphorothioates, H-phosphonates or alkyl-phosphonates, or at the level of the backbone such as by example alpha-oligonucleotides, 2'-0-alkyl riboses or PNAs (Peptide Nucleic Acids) (Egholm et al., 1992).
  • GRNAs can be natural, synthetic or produced by recombinant techniques. These gRNAs can be prepared by any methods known to those skilled in the art such as, for example, chemical synthesis, in vivo transcription or amplification techniques.
  • the sequence (s) encoding the gRNA (s) are placed under the control of an expression promoter.
  • This promoter can be constitutive or inducible.
  • each gRNA can be controlled by a different promoter.
  • the promoter used is the same for all the gRNAs.
  • the same promoter can in a particular embodiment be used to allow the expression of several, for example only a few, or in other words of all or part, of the gRNAs intended to be expressed.
  • the promoter (s) controlling the expression of the gRNA (s) is / are inducible promoters.
  • constitutive promoters which can be used in the context of the present invention can be selected from the promoter of the th1 gene, of the ptb gene or of the BCS operon, or a derivative thereof, preferably miniPthl, or any other promoter, well known to those skilled in the art, allowing the synthesis of an RNA (coding or not coding) within the bacterium of interest.
  • inducible promoters which can be used in the context of the present invention can be selected from the promoter of the gene such A, of the xylA gene, of the lad gene, or of the bgaL gene, or a derivative thereof, preferably 2tet01 or tet02 / l.
  • a preferred inducible promoter is 2tet01.
  • the promoters controlling the expression of DNA endonuclease and gRNA (s) may be the same or different and constitutive or inducible.
  • the promoters respectively controlling the expression of the DNA endonuclease or of the gRNA (s) are different promoters but inducible by the same inducing agent.
  • Inducible promoters as described above make it possible to advantageously control the action of the DNA / gRNA ribonucleoprotein endonuclease complex, for example Cas9 / gRNA, and to facilitate the selection of transformants which have undergone the desired genetic modifications.
  • the genetic tool according to the invention can also advantageously comprise a sequence encoding at least one anti-CRISPR protein, ie a protein capable of inhibiting or preventing / neutralizing the action of Cas, and / or a protein capable to inhibit or prevent / neutralize the action of a CRISPR / Cas system, for example of a CRISPR / Cas type II system when the nuclease is a Cas9 type nuclease.
  • This sequence is typically placed under the control of an inducible promoter different from the promoters controlling the expression of the DNA endonuclease and / or of the gRNA (s), and is inducible by another inducing agent.
  • the sequence encoding the anti-CRISPR protein is also typically located on one of the at least two nucleic acids present within the genetic tool.
  • the sequence encoding the anti-CRISPR protein is located on a nucleic acid distinct from the first two (typically a “third nucleic acid”).
  • both the sequence encoding the anti-CRISPR protein and the sequence encoding the transcriptional repressor of said anti-CRISPR protein are integrated into the bacterial chromosome.
  • the sequence encoding an anti-CRISPR protein is placed, within the genetic tool, on the nucleic acid encoding the DNA endonuclease (also identified in the present text as "first nucleic acid ").
  • the sequence encoding an anti-CRISPR protein is placed, within the genetic tool, on a nucleic acid different from that encoding the DNA endonuclease, for example on the nucleic acid identified in the present text as a “second nucleic acid” or else on an “umpteenth” (typically a “third”) nucleic acid possibly included in the genetic tool.
  • the anti-CRISPR protein is typically an "anti-Cas9" protein or an "anti-MAD7” protein, i.e. a protein capable of inhibiting or preventing / neutralizing the action of Cas9 or CAS7.
  • the anti-CRISPR protein is advantageously an “anti-Cas9” protein, for example selected from AcrlIA1, AcrIIA2, AcrIIA3, AcrIIA4, AcrIIA5, AcrIICl, AcrIIC2 and AcrIIC3 (Pawluk et al, 2018).
  • the “anti-Cas9” protein is AcrIIA2 or AcrIIA4.
  • the “anti-Cas9” protein is AcrIIA4.
  • Such a protein is typically able to very significantly limit, ideally prevent, the action of Cas9, for example by binding to the enzyme Cas9 (Dong et al, 2017; Rauch et al, 2017).
  • anti-MAD7 protein
  • AcrVA1 AcrVA1
  • the anti-CRISPR protein is capable of inhibiting, preferably neutralizing, the action of the DNA endonuclease, preferably during the phase of introduction of the nucleic acid sequences of the DNA. genetic tool in the bacterial strain of interest.
  • the promoter controlling the expression of the sequence encoding the anti-CRISPR protein is preferably an inducible promoter.
  • the inducible promoter is associated with a constitutively expressed gene, typically responsible for the expression of a protein allowing transcriptional repression from said inducible promoter.
  • This promoter can for example be selected from the promoter of the gene such A, of the xylA gene, of the lacl gene, or of the bgaL gene, or a derivative thereof.
  • an inducible promoter that can be used in the context of the invention is the Pbgal promoter (inducible to lactose) present, within the genetic tool and on the same nucleic acid, alongside the bgaR gene expressed in a constitutive manner and of which the expression product allows transcriptional repression from Pbgal.
  • the inducing agent lactose
  • the transcriptional repression of the Pbgal promoter is lifted, allowing transcription of the gene placed downstream of the latter.
  • the gene placed downstream corresponds, in the context of the present invention, to the gene encoding the anti-CRISPR protein, for example acrIIA4.
  • the promoter controlling the expression of the anti-CRISPR protein makes it possible to advantageously control the action of the DNA endonuclease, for example of the Cas9 enzyme, and thus to facilitate the transformation of bacteria, for example of bacteria from genus Clostridium, Bacillus or Lactobacillus, and obtaining transformants which have undergone the desired genetic modifications.
  • the invention relates to a genetic tool comprising a plasmid vector whose sequence is that of SEQ ID NO: 23 as the "first" nucleic acid.
  • the invention relates to a genetic tool comprising a plasmid vector whose sequence is selected from one of the sequences SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 119, SEQ ID NO: 123, SEQ ID NO: 124 and SEQ ID NO: 125 as the "second" or "nth" nucleic acid.
  • the invention relates to a genetic tool comprising a plasmid vector whose sequence is selected from one of the sequences SEQ ID NO: 119, SEQ ID NO: 123, SEQ ID NO: 124 and SEQ ID NO: 125 as "OPT nucleic acid".
  • the genetic tool comprises several (for example at least two or three) sequences from among SEQ ID NOs: 23, 79, 80, 1 19, 123, 124 and 125, said sequences being different from each other. others.
  • the inventors describe examples of nucleic acid of interest, typically of DNA sequences of interest, allowing the expression within a bacterium of a DNA sequence partially or totally absent from the genetic material present within of the wild version of said bacterium.
  • the expression of the DNA sequence of interest allows the bacterium, for example the bacterium of the genus Clostridium, to ferment (typically simultaneously) several different sugars, for example at least two different sugars , typically at least two different sugars from sugars comprising 5 carbon atoms (such as glucose or mannose) and / or from sugars comprising 6 carbon atoms (such as xylose, arabinose or fructose), of preferably at least three different sugars, selected for example from glucose, xylose and mannose; glucose, arabinose and mannose; and glucose xylose and arabinose.
  • the DNA sequence of interest encodes at least one product of interest, preferably a product which promotes the production of solvent by the bacterium, for example by the bacterium of the genus Clostridium, Bacillus or Lactobacillus. , typically at least one protein of interest, for example an enzyme; a membrane protein such as a transporter; a protein for processing other proteins (chaperone protein); a transcription factor; or a combination of these.
  • the DNA sequence of interest promotes solvent production and is typically selected from a sequence encoding i) an enzyme, for example an involved enzyme.
  • a sequence encoding an alcohol dehydrogenase for example a sequence selected from adh, adhE, adhE1, adhE2, bdhA, bdhB and bdhC
  • a sequence encoding a transferase for example a sequence selected from ct / A, ctfB, atoA and atoB
  • a sequence encoding a decarboxylase eg a de
  • a sequence encoding a hydrogenase eg a sequence selected from etfA, etfB and hydA
  • a membrane protein for example a sequence encoding a phosphotransferase (for example a sequence selected from glcG, bglC, cbe4532, cbe4533, cbe4982, cbe4983, cbe0751), iii
  • the inventors also describe examples of nucleic acid of interest recognizing (binding at least in part), and preferably targeting, ie recognizing and allowing the cleavage, in the genome of a bacterium of interest, of at least a strand i) of a target sequence, ii) of a sequence controlling the transcription of a target sequence, or iii) of a sequence flanking a target sequence.
  • the recognized sequence is also identified herein as a "target sequence” or “targeted sequence”.
  • a genetic tool comprising, or consisting of, such a nucleic acid of interest is also described.
  • the nucleic acid of interest is typically present within the "second" or “umpteenth” nucleic acid of a genetic tool as described in this text.
  • the nucleic acid of interest is typically used in the context of the present description to delete the recognized sequence from the genome of the bacterium or to modify its expression, for example to modulate / regulate its expression, in particular to inhibit it, preferably. to modify it so as to render said bacterium incapable of expressing a protein, in particular a functional protein, from said sequence.
  • the target sequence is a sequence encoding an enzyme allowing the bacterium of interest to grow in a culture medium containing an antibiotic to which it confers resistance on it, a sequence controlling the transcription of such a sequence or a sequence flanking such a sequence
  • the antibiotic is typically an antibiotic belonging to the class of amphenicols.
  • amphenicols of interest in the context of the present disclosure are chloramphenicol, thiamphenicol, azidamfenicol and florfenicol (Schwarz S. et al., 2004), in particular chloramphenicol and thiamphenicol.
  • the nucleic acid of interest comprises at least one region complementary to the target sequence which is 100% identical or at least 80% identical, preferably 85%, 90%, 95%, 96%. , 97%, 98% or 99% at least to the region / portion / DNA sequence targeted within the bacterial genome and is capable of hybridizing to all or part of the sequence complementary to said region / portion / sequence, typically to a sequence comprising at least 1 nucleotide, preferably at less 1, 2, 3, 4, 5, 10, 14, 15, 20, 25, 30, 35 or 40 nucleotides, typically between 1, 10 or 20 and 1000 nucleotides, for example between 1, 10 or 20 and 900, 800, 700, 600, 500, 400, 300 or 200 nucleotides, between 1, 10 or 20 and 100 nucleotides, between 1, 10 or 20 and 50 nucleotides, or between 1, 10 or 20 and 40 nucleotides, for example between 10 and 40 nucleotides, between 10 and 30 nucleotides, between 10 and 20 nucleotides,
  • the nucleic acid of interest comprises at least two regions each complementary to a target sequence, identical at 100% or identical at least 80%, preferably at 85%, 90%, 95%, 96%, 97%, 98% or 99% at least to said targeted region / portion / DNA sequence within the bacterial genome. These regions are capable of hybridizing to all or part of the sequence complementary to said region / portion / sequence, typically to a sequence as described above comprising at least 1 nucleotide, preferably at least 100 nucleotides, typically between 100 and 1000 nucleotides.
  • Regions complementary to the target sequence present within the nucleic acid of interest can recognize, preferably target, the 5 'and 3' flanking regions of the target sequence in a genetic modification tool as described in present text, for example the ClosTron® genetic tool, the Targetron® genetic tool or an allelic exchange tool such as ACE®.
  • the target sequence is a sequence encoding an amphenicol-O-acetyltransferase, for example a chloramphenicol-O-acetyltransferase or a thiamphenicol-O-acetyltransferase, controlling the transcription of such a sequence or flanking such a sequence, at within the genome of a bacterium of interest, for example of the genus Clostridium, capable of growing in a culture medium containing one or more antibiotics belonging to the class of amphenicols, for example chloramphenicol and / or thiamphenicol.
  • an amphenicol-O-acetyltransferase for example a chloramphenicol-O-acetyltransferase or a thiamphenicol-O-acetyltransferase
  • the recognized sequence is for example the sequence SEQ ID NO: 18 corresponding to the catB gene (CIBE 3859) encoding a chloramphenicol-O-acetyltransferase from C. beijerinckii DSM 6423 or an amino acid sequence which is at least 70%, 75% identical. , 80%, 85%, 90% or 95% to said chloramphenicol-O-acetyltransferase, or a sequence comprising all or at least 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97 %, 98% or 99% of the sequence SEQ ID NO: 18.
  • the recognized sequence can be a sequence comprising at least 1 nucleotide, preferably at least 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 or 40 nucleotides, typically between 1 and 40 nucleotides, preferably a sequence comprising 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 , 28, 29 or 30 nucleotides of the sequence SEQ ID NO: 18.
  • amino acid sequences at least 70% identical to chloramphenicol-O-acetyltransferase encoded by the sequence SEQ ID NO: 18 correspond to the sequences identified in the NCBI database under the following references: WP 077843937.1, SEQ ID NO: 44 (WP_063843219.1), SEQ ID NO: 45 (WP_0781 16092.1), SEQ ID NO: 46 (WP_077840383.1), SEQ ID NO: 47 (WP_077307770.1), SEQ ID NO: 48 (WPJ03699368.1 ), SEQ ID NO: 49 (WP_087701812.1), SEQ ID NO: 50 (WP 0172101 12.1), SEQ ID NO: 51 (WP 077831818.1), SEQ ID NO: 52 (WP 012059398.1), SEQ ID NO: 53 ( WP 077363893.1), SEQ ID NO: 54 (WP 015393553.1), SEQ ID NO: 55 (WP_023973814.1), SEQ ID NO:
  • amino acid sequences at least 75% identical to chloramphenicol-O-acetyltransferase encoded by the sequence SEQ ID NO: 18 correspond to the sequences WP 077843937.1, WP_063843219.1, WP_0781 16092.1, WP_077840383.1, WP_077307770.1 , WP 103699368.1,
  • amino acid sequences which are at least 90% identical to chloramphenicol-O-acetyltransferase encoded by the sequence SEQ ID NO: 18, are the sequences WP 077843937.1,
  • WP_063843219.1 WP_0781 16092.1, WP_077840383.1, WP_077307770.1, WP 103699368.1,
  • amino acid sequences at least 95% identical to chloramphenicol-O-acetyltransferase encoded by the sequence SEQ ID NO: 18 correspond to the sequences WP 077843937.1, WP_063843219.1, WP_0781 16092.1, WP_077840383.1, WP_077307770.1 , WP 103699368.1,
  • Preferred amino acid sequences are the sequences WP 077843937.1, SEQ ID NO: 44 (WP_063843219.1) and SEQ ID NO: 45 (WP_0781 16092.1).
  • a particular sequence identical to the sequence SEQ ID NO: 18 is the sequence identified in the NCBI database under the reference WP 077843937.1.
  • the target sequence is the sequence SEQ ID NO: 68 corresponding to the catQ gene encoding a chloramphenicol-O-acetyltransferase from C. perfringens whose amino acid sequence corresponds to SEQ ID NO: 66 (WP 063843220.1), or a sequence identical to at least 70%, 75%, 80%, 85%, 90% or 95% to said chloramphenicol-O-acetyltransferase, or a sequence comprising all or at least 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% of the sequence SEQ ID NO: 68.
  • the recognized sequence can be a sequence comprising at least 1 nucleotide, preferably at least 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 or 40 nucleotides, typically between 1 and 40 nucleotides, preferably a sequence comprising 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 or 30 nucleotides of the sequence SEQ ID NO: 68.
  • the recognized sequence is selected from a nucleic acid sequence catB (SEQ ID NO: 18), catQ (SEQ ID NO 68), catD (SEQ ID NO: 69, Schwarz S. et al. , 2004) or catP (SEQ ID NO: 70, Schwarz S. et al., 2004) known to those skilled in the art, present naturally within a bacterium or introduced artificially into such a bacterium.
  • catB nucleic acid sequence catB
  • catQ SEQ ID NO: 68
  • catD SEQ ID NO: 69, Schwarz S. et al. , 2004
  • catP SEQ ID NO: 70, Schwarz S. et al., 2004
  • the target sequence can also be a sequence controlling the transcription of a coding sequence as described above (encoding an enzyme allowing the bacteria of interest to grow in a culture medium containing a antibiotic to which it confers resistance), typically a promoter sequence, for example the promoter sequence (SEQ ID NO: 73) of the catB gene or that (SEQ ID NO: 74) of the calQ gene.
  • a promoter sequence for example the promoter sequence (SEQ ID NO: 73) of the catB gene or that (SEQ ID NO: 74) of the calQ gene.
  • the nucleic acid of interest then recognizes, and is therefore typically capable of binding to a sequence controlling the transcription of a coding sequence as described above.
  • the target sequence may be a sequence flanking a coding sequence as described above, for example a sequence flanking the catB gene of sequence SEQ ID NO: 18 or a sequence at least 70% identical to the latter.
  • a flanking sequence typically comprises 1, 10 or 20 and 1000 nucleotides, for example between 1, 10 or 20 and 900, 800, 700, 600, 500, 400, 300 or 200 nucleotides, between 1, 10 or 20 and 100 nucleotides.
  • between 1, 10 or 20 and 50 nucleotides, or between 1, 10 or 20 and 40 nucleotides for example between 10 and 40 nucleotides, between 10 and 30 nucleotides, between 10 and 20 nucleotides, between 20 and 30 nucleotides, between 15 and 40 nucleotides, between 15 and 30 nucleotides or between 15 and 20 nucleotides.
  • the target sequence corresponds to the pair of sequences flanking such a coding sequence, each flanking sequence typically comprising at least 20 nucleotides, typically between 100 and 1000 nucleotides, preferably between 200 and 800 nucleotides.
  • nucleic acid of interest used to transform and / or genetically modify a bacterium of interest
  • a DNA fragment i) recognizing a coding sequence, ii) controlling the transcription of a coding sequence, or iii) flanking a coding sequence, an enzyme of interest, preferably an amphenicol-O-acetyltransferase, for example an chloramphenicol-O-acetyltransferase or a thiamphenicol-O-acetyltransferase, within the genome of a bacterium, for example of a bacterium of the genus Clostridium as described above
  • nucleic acid of interest is capable of deleting the sequence (“target sequence”) recognized from the genome of the bacterium or of modifying its expression, for example of modulating it, in particular of inhibiting it, preferably modifying it so as to render said bacterium incapable of expressing a protein, for example an amphenicol-O-acetyltransferase, in particular a functional protein, from said sequence.
  • target sequence the sequence recognized from the genome of the bacterium or of modifying its expression, for example of modulating it, in particular of inhibiting it, preferably modifying it so as to render said bacterium incapable of expressing a protein, for example an amphenicol-O-acetyltransferase, in particular a functional protein, from said sequence.
  • the selection gene used is not a gene for resistance to chloramphenicol and / or to thiamphenicol. , and is preferably none of the catB, catQ, catD or catP genes.
  • the nucleic acid of interest comprises one or more guide RNAs (gRNA) targeting a coding sequence, controlling the transcription of a coding sequence, or flanking a coding sequence, an enzyme of interest, in in particular an amphenicol-O-acetyltransferase, and / or a modification matrix (also identified in the present text as an "edition matrix"), for example a matrix making it possible to eliminate or modify all or part of the sequence target, preferably with the aim of inhibiting or suppressing the expression of the target sequence, typically a template comprising sequences homologous (corresponding) to the sequences located upstream and downstream of the target sequence as described above, typically sequences (homologous to said sequences located upstream and downstream of the target sequence) each comprising between 10 or 20 base pairs and 1000, 1500 or 2000 base pairs, for example between 100, 200, 300, 400 o u 500 base pairs and 1000, 1200, 1300, 1400 or 1500 base pairs, preferably between 100 and 1500 or between 100 and 1000 base pairs
  • gRNA
  • the nucleic acid of interest used to transform and / or genetically modify a bacterium of interest is a nucleic acid which does not exhibit methylation at the levels of the motifs recognized by the methyltransferases of the Dam and Dcm type. (prepared from an Escherichia coli bacterium exhibiting the dam- dcm- genotype).
  • the nucleic acid of interest used as a genetic tool is a nucleic acid which does not exhibit methylation at the levels of the motifs recognized by the methyltransferases of the Dam and Dcm type, typically a nucleic acid including adenosine ("A" ) of the GATC motif and / or the second cytosine “C” of the CCWGG motif (W which may correspond to an adenosine (“A”) or to a thymine (“T”)) are demethylated.
  • A adenosine
  • C second cytosine
  • a nucleic acid not exhibiting methylation at the levels of the motifs recognized by the Dam and Dcm type methyltransferases can typically be prepared from an Escherichia coli bacterium exhibiting the ni dcm genotype (for example Escherichia coli INV 110, Invitrogen) .
  • This same nucleic acid can comprise other methylations carried out for example by methyltransferases of EcoKI type, the latter targeting the adenines (“A”) of the AAC (N6) GTGC and GCAC (N6) GTT (N can correspond to n ' any base).
  • the targeted sequence corresponds to a gene encoding an amphenicol-O-acetyltransferase, for example a chloramphenicol-O-acetyltransferase such as the catB gene, to a sequence controlling the transcription of this gene, or to a flanking sequence this gene.
  • an amphenicol-O-acetyltransferase for example a chloramphenicol-O-acetyltransferase such as the catB gene
  • a nucleic acid of particular interest described by the inventors is for example a vector, preferably a plasmid, for example the plasmid pCas9ind-Aca / 2? of sequence SEQ ID NO: 21 or the plasmid pCas9ind-gRNA_ca / 2? of sequence SEQ ID NO: 38 described in the experimental part of the present description (cf. example 2), in particular a version of said sequence not exhibiting methylation at the level of the units recognized by the methyltransferases of the Dam and Dcm type.
  • the present description also relates to the use of a nucleic acid of interest to transform and / or genetically modify a bacterium of interest as described in the present text.
  • Another aspect described by the inventors relates to a method for transforming, and preferably furthermore genetically modifying, a bacterium belonging to the phylum Firmicutes, for example a bacterium of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus, typically a bacterium.
  • solventogen in particular a solventogenic bacterium of the Clostridium genus, using a genetic tool according to the invention, typically using a nucleic acid of interest according to the invention as described above.
  • This method advantageously comprises a step of transforming the bacterium by introducing into said bacterium all or part of a genetic tool as described in the present text, in particular of a nucleic acid of interest described in the present text, of preferably an "OPT nucleic acid" comprising, or consisting of, i) all or part of the sequence SEQ ID NO: 126 (OREP) and ii) a sequence allowing modification of the genetic material of a bacterium and / or l expression within said bacterium of a DNA sequence partially or totally absent from the genetic material present within the wild version of said bacterium.
  • the method may further comprise a step of obtaining, recovering, selecting or isolating the transformed bacteria, i.e. the bacteria exhibiting the desired recombination / modification / optimization (s).
  • the method for transforming, and preferably genetically modifying, a bacterium as described in the present text involves a genetic modification tool, for example a genetic modification tool selected from a CRISPR tool, a tool based on the use of type II introns (for example the Targetron® tool or the ClosTron® tool) and a allelic exchange (for example the ACE® tool), and comprises a step of transforming the bacterium by introducing into said bacterium a nucleic acid of interest according to the invention as described above.
  • a genetic modification tool for example a genetic modification tool selected from a CRISPR tool, a tool based on the use of type II introns (for example the Targetron® tool or the ClosTron® tool) and a allelic exchange (for example the ACE® tool)
  • a genetic modification tool for example a genetic modification tool selected from a CRISPR tool, a tool based on the use of type II introns (for example the Targetron® tool or the ClosT
  • the present invention is typically advantageously implemented when the genetic modification tool selected to transform, and preferably genetically modify, a bacterium belonging to the phylum Firmicutes, for example a bacterium of the genus Clostridium, is intended to be used on a bacterium, such as C.
  • said genetic tool comprises a step of transforming said bacterium with the aid of a nucleic acid allowing the expression of a marker of resistance to an antibiotic to which this bacterium is resistant to wild state and / or a step of selecting bacteria transformed and / or genetically modified using said antibiotic (to which the bacteria is resistant in the wild state), preferably by selecting tion among said bacteria of bacteria having lost said extra-chromosomal DNA sequence.
  • a modification advantageously achievable by virtue of the present invention for example using a genetic modification tool selected from a CRISPR tool, a tool based on the use of type II introns and an allelic exchange tool, consists in removing an undesirable sequence, for example a sequence encoding an enzyme conferring resistance to one or more antibiotics on the bacterium, or in rendering this undesirable sequence non-functional.
  • Another modification advantageously achievable by virtue of the present invention consists in genetically modifying a bacterium in order to improve its performance, for example its performance in the production of a solvent or a mixture of solvents of interest, said bacterium having previously already has been modified thanks to the invention to make it sensitive to an antibiotic to which it was resistant in the wild state, and / or to rid it of an extra chromosomal DNA sequence present within the wild form of said bacterium.
  • the method according to the invention is based on the use of (implements) the CRISPR (Clustered Regularly Interspaced Short Palindromie Repeats) technology / genetic tool, in particular the CRISPR / genetic tool. Case (CRISPR-associated protein).
  • CRISPR Clustered Regularly Interspaced Short Palindromie Repeats
  • Case CRISPR-associated protein
  • the present invention can be implemented using a conventional CRISPR / Cas genetic tool using a single plasmid comprising a nuclease, a gRNA and a repair template as described by Wang et al. (2015).
  • gRNAs can readily define the sequence and structure of gRNAs according to the chromosomal region or mobile genetic element to be targeted using well known techniques (see, for example, the article by DiCarlo et al., 2013).
  • the inventors have developed and described a genetic tool for modifying bacteria, suitable for bacteria of the genus Clostridium, also usable in the context of the present invention, based on the use of two plasmids (cf. WO2017 / 064439, Wasels et al. al., 2017, and Figure 15 associated with the present description).
  • the “first” plasmid of this tool allows the expression of the Cas nuclease and a “second” plasmid, specific for the modification to be carried out, contains one or more gRNA expression cassettes (targeting typically different regions of bacterial DNA) as well as a repair matrix allowing, by a homologous recombination mechanism, the replacement of a portion of the bacterial DNA targeted by Cas by a sequence of interest.
  • the cas gene and / or the gRNA expression cassette (s) are placed under the control of constitutive or inducible, preferably inducible, expression promoters known to those skilled in the art (for example described in application WO2017 / 064439 and incorporated by reference into the present description), and preferably different but inducible by the same inducing agent.
  • the gRNAs likely to be used correspond to the gRNAs as described previously in this text.
  • a particular process involving CRISPR technology capable of being implemented in the context of the present invention to transform, and typically to genetically modify by homologous recombination, a bacterium as described in this text, comprises the following steps:
  • step b) culture of the transformed bacteria obtained at the end of step a) on a medium which does not contain (or under conditions which do not involve) the agent inducing the expression of the anti-CRISPR protein, typically allowing the expression of the DNA / gRNA endonuclease ribonucleoprotein complex, typically Cas / gRNA (in order to stop the production of said anti-CRISPR protein and to allow the action of the endonuclease).
  • a medium which does not contain (or under conditions which do not involve) the agent inducing the expression of the anti-CRISPR protein typically allowing the expression of the DNA / gRNA endonuclease ribonucleoprotein complex, typically Cas / gRNA (in order to stop the production of said anti-CRISPR protein and to allow the action of the endonuclease).
  • the agent inducing the expression of the anti-CRISPR protein is present in an amount sufficient to induce said expression.
  • the inducing agent lactose, makes it possible to overcome the inhibition of expression (transcriptional repression) of the anti-CRISPR protein linked to the expression of the BgaR protein.
  • the agent inducing the expression of the anti-CRISPR protein is preferably used at a concentration of between about 1 mM and about IM, preferably between about 10 mM and about 100 mM, for example about 40 mM.
  • the anti-CRISPR protein is capable of inhibiting, preferably neutralizing, the action of the nuclease, preferably during the phase of introduction of the nucleic acid sequences of the genetic tool into the gene. bacterial strain of interest.
  • the method further comprises, during or after step b), a step of inducing the expression of the inducible promoter (s) controlling the expression of the nuclease. and / or guide RNA (s) when such a promoter (s) are present within the genetic tool, in order to allow the genetic modification of interest to the bacterium once said genetic tool has been introduced into said bacterium.
  • Induction is carried out using a substance making it possible to lift the inhibition of expression linked to the selected inducible promoter.
  • the induction step when it is present, can thus be implemented by any culture method on a medium allowing the expression of the ribonucleoprotein endonuclease / gRNA complex known to those skilled in the art after introduction into the target bacteria. of the genetic tool according to the invention. It is for example carried out by bringing the bacteria into contact with a suitable substance, present in sufficient quantity or by exposure to UV light. This substance makes it possible to remove the inhibition of expression linked to the selected inducible promoter.
  • the aTc is preferably used at a concentration between about 1 ng / ml and about 5000 ng / ml, preferably between about 10 ng / ml and 1000 ng / ml, 10 ng / ml and 800 ng / ml, 10 ng / ml and 500 ng / ml, 100 ng / ml or 200 ng / ml and about 800 ng / ml or 1000 ng / ml, or between about 100 ng / ml or 200 ng / ml and about 500 ng / ml, 600 ng / ml or 700 ng / ml, for example about 50 ng / ml, 100 ng / ml, 150 ng / / ml,
  • the method comprises an additional step c) of removing the nucleic acid containing the repair matrix (the bacterial cell then being considered as “cured” of said nucleic acid) and / or of elimination guide RNA (s) or sequences encoding the guide RNA (s) introduced with the genetic tool during step a).
  • the method comprises one or more additional steps, subsequent to step b) or to step c), of introducing an umpteenth, for example third, fourth, fifth, etc., nucleic acid containing a repair template distinct from that (s) already introduced and one or more RNA expression cassettes allowing the integration of the sequence of interest contained in said distinct repair matrix in a targeted area of the genome of the bacterium, in the presence of an agent inducing the expression of the anti-CRISPR protein, each additional step being followed by a step of culturing the bacterium thus transformed on a medium not containing the agent inducing the expression of the anti-CRISPR protein, typically allowing the expression of the Cas / gRNA ribonucleoprotein complex.
  • the bacterium is transformed using a nucleic acid or a genetic tool such as those described above, using (for example encoding) an enzyme responsible for the cleavage.
  • an enzyme responsible for the cleavage at least one strand of the target sequence of interest, in which the enzyme is, in a particular mode, a nuclease, preferably a Cas type nuclease, preferably selected from a Cas9 enzyme and a MAD7 enzyme.
  • the target sequence of interest is a sequence, for example the catB gene, encoding an enzyme conferring on bacteria resistance to one or more antibiotics, preferably to one or more antibiotics belonging to the class of amphenicols, typically an amphenicol-O-acetyltransferase such as a chloramphenicol-O-acetyltransferase, a sequence controlling the transcription of the coding sequence or a sequence flanking said coding sequence.
  • the anti-CRISPR protein is typically an “anti-Cas” protein as described above.
  • the anti-CRISPR protein is advantageously an “anti-Cas9” protein or an “anti-MAD7” protein.
  • the editing / repair template may itself comprise one or more nucleic acid sequences or portions of nucleic acid sequence corresponding to natural sequences and / or synthetic, coding and / or non-coding.
  • the matrix can also comprise one or more "foreign" sequences, i.e. naturally absent from the genome of bacteria belonging to the phylum Firmicutes, in particular to the genus Clostridium, to the genus Bacillus or of the genus Lactobacillus, or from the genome of particular species of said genus.
  • the matrix can also include a combination of sequences.
  • the genetic tool used in the context of the present invention allows the repair matrix to guide the incorporation into the bacterial genome of a nucleic acid of interest, typically of a sequence or portion of a DNA sequence comprising at least 1 base pair (bp), preferably at least 1, 2, 3, 4, 5, 10, 15, 20, 50, 100, 1000, 10,000, 100,000 or 1,000,000 bp, typically between 1 bp and 20 kb, for example 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1, 12 or 13 kb, or between 1 bp and 10 kb, preferably between 10 bp and 10 kb or between 1 kb and 10 kb, for example between lpb and 5 kb, between 2 kb and 5 kb, or alternatively between 2.5 or 3 kb and 5 kb.
  • bp base pair
  • the expression of the DNA sequence of interest allows the bacterium belonging to the phylum Firmicutes, in particular of the genus Clostridium, of the genus Bacillus or of the genus Lactobacillus, to ferment (typically simultaneously) several different sugars, for example at least two different sugars, typically at least two different sugars from sugars comprising 5 carbon atoms (such as glucose or mannose) and / or from sugars comprising 6 carbon atoms (such as xylose , arabinose or fructose), preferably at least three different sugars, selected for example from glucose, xylose and mannose; glucose, arabinose and mannose; and glucose xylose and arabinose.
  • the DNA sequence of interest encodes at least one product of interest, preferably a product promoting the production of solvent by the modified bacterium, typically at least one protein of interest, for example. an enzyme; a membrane protein such as a transporter; a protein for processing other proteins (chaperone protein); a transcription factor; or a combination of these.
  • the introduction into the bacteria of the elements (nucleic acids or gRNA) of the genetic tool is carried out by any method, direct or indirect, known to those skilled in the art, for example by transformation, conjugation, microinjection, transfection, electroporation, etc., preferably by electroporation (Mermelstein et al, 1993).
  • the method according to the invention is based on the use of type II introns, and for example implements the ClosTron® technology / genetic tool or the Targetron® genetic tool.
  • Targetron® technology is based on the use of a reprogrammable group II intron (based on Tintron Ll.ltrB from Lactococcus lactis) capable of integrating the bacterial genome rapidly at a desired locus (Chen et al., 2005, Wang et al. ., 2013), typically for the purpose of inactivating a targeted gene.
  • the mechanisms of recognition of the edited zone as well as of insertion into the genome by retro-splicing are based on a homology between Tintron and said zone on the one hand, and on the activity of a protein (ltrA) on the other hand. go.
  • ClosTron® technology is based on a similar approach, supplemented by the addition of a selection marker in the Tintron sequence (Heap et al., 2007).
  • This marker makes it possible to select for the integration of the intron into the genome, and therefore makes it easier to obtain the desired mutants.
  • This genetic system also exploits type I introns. Indeed, the selection marker (called RAM for retrotransposition-activated marker) is interrupted by such a genetic element, which prevents its expression from the plasmid (a more precise description of the system: Zhong et al.). Splicing of this genetic element occurs before integration into the genome, resulting in a chromosome with an active form of the resistance gene.
  • An optimized version of the system includes FLP / FRT sites upstream and downstream of this gene, allowing the use of the FRT recombinase to eliminate the resistance gene (Heap et al., 2010).
  • the method according to the invention is based on the use of an allelic exchange tool, and for example implements the technology / genetic tool ACE®.
  • ACE® technology is based on the use of an auxotrophic mutant (for Turacil in C. acetobutylicum ATCC 824 by deletion of the pyrE gene, which also causes resistance to 5-fluoroorotic acid (A-5-FO); Heap et al. ., 2012).
  • the system uses the allelic exchange mechanism, well known to those skilled in the art. Following transformation with a pseudo-suicide vector (with very low copies), the integration of the latter into the bacterial chromosome by a first allelic exchange event can be verified by virtue of the resistance gene initially present on the plasmid.
  • the integration step can be performed in two different ways, either within the pyrE locus or within another locus:
  • the pyrE gene is also placed on the plasmid, without however being expressed (no functional promoter).
  • the second recombination restores a functional pyre gene and can then be selected by auxotrophy (minimum medium, not containing uracil). Since the non-functional pyrE gene also exhibits a selectable character (sensitivity to A-5-FO), other integrations can then be envisaged on the same model, by successively alternating the state of pyrE between functional and non-functional.
  • a genomic zone allowing expression of the counter-selection marker after recombination is targeted (typically, in operon after another gene, preferably a highly expressed gene). This second recombination is then selected by auxotrophy (minimum medium not containing uracil).
  • the targeted sequence is typically one of the sequences described in the present text.
  • the nucleic acids and genetic tools according to the invention allow the introduction into the bacterium of sequences of interest of small sizes as well as of large sizes, in one step, ie using a single nucleic acid (typically “OPT nucleic acid” or the “second” or “umpteenth” nucleic acid of a tool as described in the present text) or in several steps, ie using several nucleic acids (typically the “second” or the “nth” nucleic acids as described in the present text), preferably in one step.
  • a single nucleic acid typically “OPT nucleic acid” or the “second” or “umpteenth” nucleic acid of a tool as described in the present text
  • several steps typically the “second” or the “nth” nucleic acids as described in the present text
  • the nucleic acids and genetic tools according to the invention make it possible to delete a targeted portion of the bacterial DNA or to replace it with a shorter sequence (for example by a sequence having lost in the process. minus one base pair) and / or non-functional.
  • the nucleic acids and genetic tools according to the invention advantageously make it possible to introduce into the bacterium, for example into the bacterial genome, a nucleic acid of interest comprising at least one pair of base, and up to 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1, 12, 13, 14, or 15 kb.
  • Another subject of the invention relates to a transformed and / or genetically modified bacterium, typically a bacterium belonging to the phylum Firmicutes, and belonging for example to the genus Clostridium, to the genus Bacillus or to the genus Lactobacillus, typically a solvent-causing bacterium, preferably a bacterium belonging to a species or corresponding to one of the subclades described by the inventors in the present text or obtained using a process as described by the inventors in the present text, as well as any derived bacterium, clone, mutant, or genetically modified version thereof, and their uses.
  • a transformed and / or genetically modified bacterium typically a bacterium belonging to the phylum Firmicutes, and belonging for example to the genus Clostridium, to the genus Bacillus or to the genus Lactobacillus, typically a solvent-causing bacterium, preferably a bacterium belonging to a species or corresponding to one of the
  • An example of a bacterium thus transformed and / or genetically modified by virtue of the invention is a bacterium which no longer expresses an enzyme conferring on it resistance to one or more antibiotics, in particular a bacterium which no longer expresses an amphenicol-O-acetyltransferase, for example a bacterium expressing in the wild state the catB gene, and lacking said catB gene or incapable of expressing said catB gene once transformed and / or genetically modified by virtue of the invention.
  • the bacteria thus transformed and / or genetically modified by virtue of the invention is made sensitive to an amphenicol, for example to an amphenicol as described in the present text, in particular to chloramphenicol or to thiamphenicol.
  • a particular example of a preferred genetically modified bacterium according to the invention is the bacterium identified in the present description as C. beijerinckii IFP962 AcatB as registered under the deposit number LMG P-31 151 with the Belgian Co-ordinated Collections of Micro-organisms (“BCCM”, KL Ledeganckstraat 35, B-9000 Gent - Belgium) on December 6, 2018.
  • BCCM Belgian Co-ordinated Collections of Micro-organisms
  • C. beijerinckii is a C. beijerinckii IFP963 AcatB ApNF2 strain as registered under the deposit number LMG P-31277 with from the BCCM- LMG collection on February 20, 2019.
  • the description also relates to any bacterium derived, cloned, mutant or genetically modified version of one of said bacteria, for example any bacterium derived, clone, mutant or genetically modified version remaining sensitive to an amphenicol such as thiamphenicol and / or chloramphenicol, typically a bacterium lacking the catB gene of sequence SEQ ID NO: 18 and the plasmid pNF2.
  • the bacterium transformed and / or genetically modified according to the invention for example the bacterium C. beijerinckii IFP962 AcatB or the bacterium C. beijerinckii IFP963 AcatB ApNF2, is still capable of being transformed, and preferably genetically modified. It can be done using a nucleic acid, for example a plasmid as described in the present description, for example in the experimental part.
  • nucleic acid capable of being advantageously used is the plasmid pCas9 aCr of sequence SEQ ID NO: 23 (described in the experimental part of the present description) or else a plasmid selected from pCas9 md (SEQ ID NO: 22) , pCas9 Cond (SEQ ID NO: 133) and pMAD7 (SEQ ID NO: 134).
  • a particular aspect of the invention indeed relates to the use of a genetically modified bacterium described in the present text, preferably the bacterium C. beijerinckii IFP962 AcatB (also identified in the present text as C. beijerinckii DSM 6423 AcatB ) deposited under the number LMG P-31 151, even more preferably the bacterium C.
  • the invention also relates to a kit comprising (i) a nucleic acid as described in the present text, for example “an OPT nucleic acid” or a DNA fragment recognizing a target sequence in a bacterium belonging to the phylum des Firmicutes as described in the present text, and (ii) at least one tool, preferably several tools, selected from among the elements of a genetic modification tool as described in the present text making it possible to transform, and typically genetically modifying such a bacterium, in order to produce an improved variant of said bacterium; nucleic acid as gRNA; nucleic acid as a repair template; an "OPT nucleic acid”; at least one pair of primers, for example a pair of primers as described in the context of the present invention; and an inducer allowing the expression of a protein encoded by said tool, for example of a Cas9 or MAD7 type nuclease.
  • a nucleic acid as described in the present text for example “an OPT nucleic acid”
  • the genetic modification tool for transforming, and typically genetically modifying a bacterium belonging to the phylum Firmicutes as described in the present text, perhaps for example selected from an “OPT nucleic acid”, a CRISPR tool, a tool based on the use of type II introns and an allelic exchange tool, as explained above.
  • the kit comprises all or part of the elements of a genetic tool as described in this text.
  • a particular kit for transforming, and preferably genetically modifying, a bacterium belonging to the phylum Firmicutes as described in the present text, or for producing at least one solvent, for example a mixture of solvents, using such a bacterium comprises a nucleic acid comprising, or consisting of, i) all or part of the sequence SEQ ID NO: 126 and ii) a sequence allowing the modification of the genetic material of a bacterium and / or the expression within said bacterium of a DNA sequence partially or totally absent from the genetic material present within the wild version of said bacterium; as well as at least one inducer suitable for the inducible promoter of the expression of the selected anti-CRISPR protein used in a genetic tool described in this text.
  • the kit can also comprise one or more inducers suitable for the selected inducible promoter (s) optionally used within the genetic tool to control the expression of the nuclease used and / or one or more guide RNAs.
  • kits according to the invention allows the expression of a nuclease comprising a label (or "tag").
  • the kits according to the invention can also comprise one or more consumables such as a culture medium, at least one competent bacterium belonging to the phylum Firmicutes as described in the present text, for example a bacterium of the genus Clostridium, Bacillus or Lactobacillus, (ie packaged for processing), at least one gRNA, one nuclease, one or more selection molecules, or even an explanatory leaflet.
  • the description also relates to the use of a kit according to the invention, or of one or more of the elements of this kit, for the implementation of a method described in the present conversion text, and ideally of genetic modification, of a bacterium belonging to the phylum Firmicutes as described in the present text, for example a bacterium of the genus Clostridium, Bacillus or Lactobacillus (for example the bacterium C. beijerinckii IFP962 AcatB deposited under the number LMG P-31 151), preferably a bacterium having in the wild state both a bacterial chromosome and at least one DNA molecule distinct from the chromosomal DNA ( typically a natural plasmid), most preferably of the bacterium C.
  • a bacterium belonging to the phylum Firmicutes as described in the present text
  • a bacterium of the genus Clostridium, Bacillus or Lactobacillus for example the bacterium C. beijerinckii
  • Solvents capable of being produced are typically acetone, butanol, ethanol, isopropanol or a mixture of these, typically an ethanol / isopropanol, butanol / isopropanol, or ethanol / butanol mixture, preferably a isopropanoPbutanol mixture.
  • bacteria transformed according to the invention typically allows the production per year on an industrial scale of at least 100 tonnes of acetone, of at least 100 tonnes of ethanol, of at least 1000 tonnes of isopropanol. , at least 1,800 tonnes of butanol, or at least 40,000 tonnes of a mixture thereof.
  • Figure 1 represents the CRISPR / Cas9 system used for genome editing as a genetic tool for creating, using Cas9 nuclease, one or more double stranded cuts in genomic DNA directed by the gRNA.
  • GRNA guide RNA
  • PAM Protospacer Adjacent Motif. Figure modified from Jinek et al, 2012.
  • FIG 2 shows the repair by homologous recombination of a double-stranded cleavage induced by Cas9.
  • PAM Protospacer Adjacent Motif.
  • FIG 3 shows the use of CRISPR / Cas9 in Clostridium.
  • ermB gene for resistance to erythromycin
  • catP SEQ ID NO: 70
  • thiamphenicoPchloramphenicol resistance gene tetR, gene whose expression product represses transcription from Pcm-tet02 / l
  • Pcm-2tet01 and Pcm-tet02 / l anhydrotetracycycline inducible promoters, "aTc” (Dong et al., 2012); miniPthl, constitutive promoter (Dong et al., 2012).
  • Figure 4 shows the map of the plasmid pCas9 aCr (SEQ ID NO: 23).
  • ermB erythromycin resistance gene
  • rep origin of replication in E. coli
  • repH origin of replication in C. acetobutylicum
  • Tthl thiolase terminator
  • miniPthl constitutive promoter
  • Pcm-tetO2 / l promoter repressed by the product of tetR and inducible by anhydrotetracycline, "aTc” (Dong et al., 2012)
  • Pbgal promoter repressed by the product of lacR and inducible by lactose (Hartman et al., 201 1); acrIIA4, gene encoding the anti-CRISPR protein AcrII14; bgaR, gene whose expression product represses transcription from Pbgal.
  • FIG 5 shows the relative transformation rate of C. acetobutylicum DSM 792 containing pCas9 md (SEQ ID NO: 22) or pCas9 aCT (SEQ ID N: 23).
  • the frequencies are expressed as the number of transformants obtained per pg of DNA used during the transformation, related to the transformation frequencies of pEC750C (SEQ ID NO: 106), and represent the means of at least two independent experiments.
  • FIG 6 shows the induction of the CRISPR / Cas9 system in transformants of strain DSM 792 containing pCas9 aCT and a gRNA expression plasmid targeting bdhB, with (SEQ ID NO: 79 and SEQ ID NO: 80) or without (SEQ ID NO: 105) repair matrix.
  • Em erythromycin; Tm, thiamphenicol; aTc, anhydrotetracycline; ND, undiluted.
  • Figure 7 represents the modification of the bdh locus of C. acetobutylicum DSM792 via the CRISPR / Cas9 system.
  • Figure 7A shows the genetic organization of the bdh locus. Homologies between repair matrix and genomic DNA are highlighted using light gray parallelograms. The hybridization sites of primers VI and V2 are also shown.
  • Figure 7 shows the modification of the bdh locus of C. acetobutylicum DSM792 via the CRISPR / Cas9 system.
  • Figure 7B shows the amplification of the bdh locus using primers VI and V2.
  • M 2-log size marker (NEB);
  • P plasmid pGRNA -AbdhAAbdhB;
  • WT wild strain.
  • Figure 8 represents the classification of 30 Solventogenic Clostridium strains, according to Poehlein et al., 2017. Note that the C. beijerinckii NR RL B-593 subclade is also identified in the literature as that C. beijerinckii DSM 6423.
  • Figure 9 represents the Map of the plasmid pCas9ind -AcatB
  • Figure 10 represents the Map of the plasmid pCas9acr
  • FIG 11 shows the Map of the plasmid pEC750S-iyy; HR
  • Figure 12 shows the map of plasmid p EX -A 2 -g R N A - upp.
  • FIG 13 shows the map of the plasmid pEC750S-Dmpp.
  • Figure 14 represents the Map of the plasmid pEC150C-Aupp
  • Figure 15 represents the Map of pGRNA-pNF2
  • FIG 16 shows the PCR Amplification of the catB gene in the clones resulting from the bacterial transformation of the C. beijerinckii DSM 6423 strain.
  • FIG. 17 represents the growth of the C. beijerinckii DSM 6423 WT and AcatB strains on 2YTG medium and 2YTG thiamphenicol selective medium.
  • FIG. 18 shows the Induction of the CRISPR / Cas9acr system in transformants of the C. beijerinckii DSM 6423 strain containing pCas9 acr and a gRNA expression plasmid targeting upp, with or without a repair template.
  • Em erythromycin
  • Tm thiamphenicol
  • aTc anhydrotetracycline
  • ND undiluted.
  • Figure 19 shows the Modification of the upp locus of C. beijerinckii DSM 6423 via the CRISPR / Cas9 system.
  • 19A represents the genetic organization of the upp locus: genes, target site of the gRNA and repair matrices, associated with the regions of corresponding homologies on the genomic DNA.
  • the sites of hybridization of the primers for verification by PCR RHO 10 and RHO 11 are also indicated.
  • Figure 19 shows the Modification of the upp locus of C. beijerinckii DSM 6423 via the CRISPR / Cas9 system.
  • Figure 19B shows the amplification of the upp locus using primers RH010 and RH01 1. Amplification of 1680 bp is expected in the case of a wild-type gene, compared to 1090 bp for a modified upp gene.
  • M size marker 100 bp - 3 kb (Lonza); WT, wild strain.
  • Figure 20 represents the PCR amplification verifying the presence of the plasmid pCas9 md . in C. beijerinckii strain 6423 AcatB.
  • Figure 21 represents the PCR amplification (—900 bp) verifying the presence or not of the natural plasmid pNF2 before induction (positive control 1 and 2) then after induction on medium containing aTc of the CRISPR-Cas9 system. .
  • Figure 22 shows the Genetic Tool for Bacteria Modification, adapted to bacteria of the genus Clostridium, based on the use of two plasmids (cf. WO2017 / 064439, Wasels et al., 2017).
  • Figure 23 shows the map of the plasmid pCas9ind-gRNA_ca / 2 ?.
  • FIG. 24 represents the transformation efficiency (in colonies observed per ⁇ g of DNA transformed) for 20 ⁇ g of plasmid pCas9 md in the C. beijerinckii strain DSM6423. Error bars represent the standard error of the mean for a biological triplicate.
  • Figure 25 shows the map of plasmid pNF3.
  • Figure 26 shows the map of the plasmid pEC751 S.
  • Figure 27 shows the map of plasmid pNF3S.
  • Figure 28 shows the map of plasmid pNF3E.
  • Figure 29 shows the map of plasmid pNF3C.
  • FIG. 30 represents the transformation efficiency (in colonies observed per ⁇ g of transformed DNA) of the plasmid pCas9 md in three strains of C. beijerinckii DSM 6423.
  • the error bars correspond to the standard deviation of the mean for a biological duplicate.
  • FIG. 31 represents the efficiency of transformation (in colonies observed per ⁇ g of transformed DNA) of the plasmid pEC750C in two strains derived from C. beijerinckii DSM 6423.
  • the error bars correspond to the standard deviation of the mean for a biological duplicate.
  • Figure 32 shows the efficiency of transformation (in colonies observed per ⁇ g of transformed DNA) of the plasmids pEC750C, pNF3C, pFWO1 and pNF3E in the strain C. beijerinckii IFP963 AcatB ApNF2.
  • the error bars are the standard deviation from the mean for a biological triplicate.
  • FIG. 33 represents the efficiency of transformation (in colonies observed per ⁇ g of transformed DNA) of the plasmids pFWO1, pNF3E and pNF3S in the C. beijerinckii NCIMB 8052 strain.
  • C. acetobutylicum DSM 792 was cultured in 2YTG medium (Tryptone 16 gl -1 , yeast extract 10 gl -1 , glucose 5 gl -1 , NaCl 4 gl -1 ).
  • E. coli NEB 10B was cultured in LB medium (Tryptone 10 gl -1 , yeast extract 5 gl -1 , NaCl 5 gl -1 ). Solid media were made by adding 15 ⁇ l -1 agarose to liquid media.
  • Erythromycin at concentrations of 40 or 500 mg.l -1 respectively in 2YTG or LB medium
  • chloramphenicol 25 or 12.5 mg.l -1 respectively in solid or liquid LB
  • thiamphenicol 15 mg.l -1 in 2YTG medium
  • Plasmid pCas9 aCT (SEQ ID NO: 23), presented in Figure 4, was constructed by cloning the fragment (SEQ ID NO: 81) containing bgaR and acrIIA4 under the control of the Pbgal promoter synthesized by Eurofins Genomics at the Sacl site.
  • pCas9 md vector (Wasels et al, 2017).
  • the pGRNA md plasmid (SEQ ID NO: 82) was constructed by cloning an expression cassette (SEQ ID NO: 83) of a gRNA under the control of the Pcm-2tet01 promoter (Dong et al, 2012) synthesized by Eurofins Genomics at the SacI site of the vector pEC750C (SEQ ID NO: 106) (Wasels et al, 2017).
  • the plasmids pGRNA-xylB (SEQ ID NO: 102), pGRNA-xylR (SEQ ID NO: 103), pGRNA-glcG (SEQ ID NO: 104) and pGRNA-bdhB (SEQ ID NO: 105) were constructed by cloning the respective pairs of primers 5'-TCATGATTTCTCCATATTAGCTAG-3 'and 5'-AAACCTAGCTAATATGGAGAAATC- 3', 5 '-TCAT GTTAC ACTT GGAAC AGGCGT - 3' and 5 '- AAACACGCCT GTTCCAAGTGTAAC-3', 5 ' and 5'-AAACTGGGGATCCTACTGCCGGAA-3 ', 5'-TCATGCTTATTACGACATAACACA-3' and 5'-AAACTGTGTTATGTCGTAATAAGC-3 'within the plasmid pGRNA md (SEQ ID NO: 82) digested with B
  • Plasmid pGRNA-DM / td (SEQ ID NO: 79) was constructed by cloning the DNA fragment obtained by overlapping PCR assembly of the PCR products obtained with the primers 5'- ATGCATGGATCCAAACGAACCCAAAAAGAAAGTTTC-3 'and 5'-
  • Plasmid pGKN A- AbdhAAbdhB (SEQ ID NO: 80) was constructed by cloning the DNA fragment obtained by overlapping PCR assembly of the PCR products obtained with the primers 5'- ATGCATGGATCCAAACGAACCCAAAAAGAAAGTTTC-3 'and 5'-
  • C. acetobutylicum DSM 792 was transformed according to the protocol described by Mermelstein et al, 1993.
  • the selection of transformants of C. acetobutylicum DSM 792 already containing an expression plasmid of Cas9 (pCas9 md or pCas9 aCr ) transformed with a plasmid containing an gRNA expression cassette was produced on solid 2YTG medium containing erythromycin (40 mg.l -1 ), thiamphenicol (15 mg.l 1 ) and lactose (40 nM).
  • Induction of the expression of cas9 was carried out via the growth of transformants obtained on a solid 2YTG medium containing erythromycin (40 mg.l -1 ), thiamphenicol (15 mg.l -1 ) and agent inducing the expression of cas9 and gRNA, aTc (1 mg.l -1 ).
  • the targeting plasmid containing the expression cassette for the gRNA targeting bdhB (pGRNA-bdhB - SEQ ID NO: 105) as well as two derived plasmids containing repair templates allowing the deletion of the bdhB gene alone (pGRNA-AM / zR - SEQ ID NO: 79) or bdhA and bdhB genes (pGRNA -AbdhAAbdhB - SEQ ID NO: 80) were transformed into the DSM 792 strain containing pCas9 md (SEQ ID NO: 22) or pCas9 acr (SEQ ID NO: 23).
  • Table 2 [Table 2]
  • Transformation frequencies of strain DSM 792 containing pCas9 md or pCas9 aCT with plasmids targeting bdhB are expressed as the number of transformants obtained per ⁇ g of DNA used during the transformation, and represent the means of at least two independent experiments.
  • the first plasmid, pCas9 md contains cas9 under the control of a promoter inducible to TaTc, and
  • the second plasmid derived from pEC750C, contains the expression cassette of a gRNA (placed under the control of a second promoter inducible to aTc) as well as an editing matrix making it possible to repair the double-stranded break induced by the system.
  • gRNAs still seemed to be too toxic, despite controlling their expression as well as that of Cas9 using promoters inducible to aTc, consequently limiting the efficiency of transformation of bacteria by the genetic tool and therefore the modification of the chromosome.
  • the cas9 expression plasmid was modified, via the insertion of an anti-CRISPR gene, acrIIA4, under the control of a lactose-inducible promoter.
  • the efficiencies of transformation of different gRNA expression plasmids could thus be improved very significantly, making it possible to obtain transformants for all the plasmids tested.
  • the modification of the cas9 expression plasmid allows better control of the Cas9-gRNA ribonucleoprotein complex, advantageously facilitating the production of transformants in which the action of Cas9 can be triggered in order to obtain mutants of interest.
  • C. beijerinckn DSM 6423 was cultured in 2YTG medium (Tryptone 16 g L -1 , yeast extract 10 g L -1 , glucose 5 g L -1 , NaCl 4 g L -1 ).
  • E. coli NEB 10-beta and INV1 10 were cultured in LB medium (Tryptone 10 g L -1 , yeast extract 5 g L -1 , NaCl 5 g L -1 ).
  • Solid media were made by adding 15 g L -1 of agarose to liquid media.
  • Erythromycin at concentrations of 20 or 500 mg L -1 respectively in 2YTG or LB medium
  • chloramphenicol 25 or 12.5 mg L -1 respectively in solid or liquid LB
  • thiamphenicol 15 mg L -1 in 2YTG medium
  • spectinomycin at concentrations of 100 or 650 mg L -1 respectively in LB or 2YTG medium
  • AcatB fwd TGTTATGGATTATAAGCGGCTCGAGGACGTCAAACCATGTTAATCATTGC
  • RH077 ATTGCCAGCCTAACACTTGG
  • RH001 ATCTCCATGGACGCGTGACGTCGACATAAGGTACCAGGAATTAGAGCAGC
  • RH003 ATAATGGTCTAGAGCTGGAGATAGATTATTTGGTACTAAG
  • RH004 TATGACCATGATTACGAATTCGAGCTCGAAGCGCTTATTATTGCATTAGC pEX-fwd: C AG ATT GTACT GAGAGT GC ACC
  • RH 134 GT CGACGT GGAATT GT GAGC
  • pNF2_fwd GGGCGCACTTATACACCACC
  • pNF2_rev TGCTACGCACCCCCTAAAGG
  • RH021 ACTTGGGTCGACCACGATAAAACAAGGTTTTAAGG
  • RH022 TACCAGGGATCCGTATTAATGTAACTATGATATCAATTCTTG
  • aad9-fwd2 ATGCATGGTCCCAATGAATAGGTTTACACTTACTTTAGTTTTATGG aad9-rev: ATGCGAGTTAACAACTTCTAAAATCTGATTACCAATTAG
  • RH031 ATGCATGGATCCCAATGAATAGGTTTACACTTACTTTAGTTTTATGG
  • RH032 AT GCG AGAGCT C AACTT CTAAAAT CT GATTACC AATTAG
  • RH138 AT GCAT GGAT CCGT CT GACAGTTACC AGGTCC
  • RH 139 AT GCG AGAGCTCC AATT GTT CAAAAAAATAAT GGCGGAG
  • RH 1 AT ATGCATGGATCCCGGCAGTTTTTCTTTTTCGG
  • This AcatB fragment comprises i) an expression cassette for a guide RNA targeting the catB gene (chloramphenicol resistance gene encoding a chloramphenicol-O-acetyltransferase - SEQ ID NO: 18) of C. beijerinckii DSM6423 under the control of a promoter inducible to anhydrotetracycline (expression cassette: SEQ ID NO: 19), and ii) an editing template (SEQ ID NO: 20) comprising 400 bp homologs located upstream and downstream of the catB gene.
  • AcatB fragment amplified by PCR (AcatB fwd and AcatB rev primers) and cloned into pCas9ind (described in patent application WO2017 / 064439 - SEQ ID NO: 22) after digestion of the various DNAs with the restriction enzyme Xhol .
  • SEQ ID NO: 25 a repair template used for the deletion of the upp gene and consisting of two homologous DNA fragments upstream and downstream of the upp gene (respective sizes: 500 (SEQ ID NO: 26) and 377 (SEQ ID NO: 27) base pairs). Assembly was obtained using the Gibson Cloning System (New England Biolabs, Gibson assembly Master Mix 2X). To do this, the upstream and downstream parts were amplified by PCR from the genomic DNA of strain DSM 6423 (cf. Maté de Gerando et al., 2018 and accession number PRJEB 1 1626
  • This plasmid comprises the DNA fragment gRNA-upp corresponding to an expression cassette (SEQ ID NO: 29) of a guide RNA targeting the upp gene (protospacer targeting upp (SEQ ID NO: 31)) under the control of 'a constitutive promoter (non-coding RNA of sequence SEQ ID NO: 30), inserted into a replication plasmid called pEX-A2.
  • plasmid pEC750S-w /? PHR (SEQ ID NO: 24) and additionally contains the DNA fragment comprising an expression cassette for a guide RNA targeting the upp gene under the control of a promoter constitutive.
  • This fragment was inserted into a pEX-A2, called pEX-A2-gRNA-upp.
  • the insert was then amplified by PCR with the primers pEX-fwd and pEX-rev, then digested with the restriction enzymes XhoI and Ncol. Finally, this fragment was ligated into pEC750S-w /? PHR previously digested with the same restriction enzymes to obtain pEC750S-Dmpp.
  • Plasmid No. 7 pEC750C-Aupp (cf. Figure 14 and SEQ ID NO: 33)
  • the cassette comprising the guide RNA as well as the repair template were then amplified with the primers pEC750C-fwd and M13-rev.
  • the amplicon was digested by enzyme restriction with the enzymes XhoI and SacI, then cloned by enzyme ligation into pEC750C to obtain pEC750C-Dmpp.
  • Plasmid No. 8 pGRNA-pNF2 (cf. Figure 15 and SEQ ID NO: 34)
  • This plasmid is based on pEC750C and contains an expression cassette for a guide RNA targeting the plasmid pNF2 (SEQ ID NO: 118).
  • Plasmid No. 9 pCas9ind-gRNA_ca / R (cf. Figure 23 and SEQ ID NO: 38).
  • pNF2 contains part of pNF2, comprising in particular the origin of replication and a gene encoding a plasmid replication protein (CIBE_p20001), amplified with the primers RH021 and RH022. This PCR product was then cloned at the SalI and BamHI restriction sites in the plasmid pUC19 (SEQ ID NO: 1 17).
  • pEC750C contains all the elements of pEC750C (SEQ ID NO: 106), except the chloramphenicol resistance gene catP (SEQ ID NO: 70).
  • the latter has been replaced by the aad9 gene from Enterococcus faecalis (SEQ ID NO: 130), which confers resistance to spectinomycin.
  • This element was amplified with the primers aad9- fwd2 and aad9-rev from the plasmid pMTL007S-E1 (SEQ ID NO: 120) and cloned into the Avall and Hpal sites of pEC750C, in place of the catP gene (SEQ ID NO : 70).
  • Plasmid No. 12 pNF3S (cf. Figure 27 and SEQ ID NO: 123)
  • pNF3C (cf. Figure 29 and SEQ ID NO: 125) It contains all the elements of pNF3, with an insertion of the cal P gene of Clostridium perfringens (SEQ ID NO: 70). This element was amplified from pEC750C with the primers RH140 and RH141 and cloned between the BamHI and SacI sites of pNF3E.
  • the plasmids were introduced and replicated in a half dcm strain of E. coli (INV110, Invitrogen). This makes it possible to eliminate the methylations of the Dam and Dcm type on the plasmid pCas9ind-DcatB before introducing it by transformation into the strain DSM 6423 according to the protocol described by Mermelstein et al. (1993), with the following modifications: the strain is transformed with a larger quantity of plasmid (20 ⁇ g), at an OD 600 of 0.8, and using the following electroporation parameters: 100 W, 25 pF, 1400 V. Spreading on a Petri dish containing erythromycin (20 mg / ml) thus made it possible to obtain transformants of C. beijerinckii DSM 6423 containing the plasmid pCas9ind -AcatB.
  • a clone of the C. beijerinckii DSM 6423 AcatB strain was previously transformed with the vector pCas9 acr not exhibiting methylation at the levels of the motifs recognized by the methyltransferases of the dam and dcm type (prepared from an Escherichia coli bacterium exhibiting the dam demj genotype. verification of the presence of the pCas9 aCT plasmid maintained in the C. beijerinckii DSM 6423 strain was verified by colony PCR with the primers RH025 and RH 134.
  • a clone of the C. beijerinckii DSM 6423 AcatB strain was previously transformed with the vector pCas9 md not exhibiting methylation at the levels of the motifs recognized by the methyltransferases of the Dam and Dcm type (prepared from an Escherichia coli bacterium exhibiting the ni dcm genotype).
  • the presence of the plasmid pCas9 md within the C. beijerinckii DSM6423 strain was verified by PCR with the primers pCas9 ind _fwd (SEQ ID NO: 42) and pCas9 ind _ rev (SEQ ID NO: 43) (cf. Figure 20). ).
  • pGRNA-pNF2 prepared from an Escherichia coli bacterium with the ni dcm genotype.
  • the inventors succeeded in introducing and maintaining various plasmids within the Clostridium beijerinckii DSM 6423 strain. They managed to delete the catB gene using a CRISPR-Cas9 type tool based on the use of a single plasmid. The sensitivity to thiamphenicol of the recombinant strains obtained was confirmed by tests in agar medium.
  • the plasmids prepared in the ⁇ 'E. coli NEB 10-beta strain are also used to transform the C. beijerinckii NCIMB 8052 strain.
  • the plasmids are introduced beforehand and replicated in a strain of E coli half dcm- (INV110, Invitrogen). This makes it possible to remove the Dam and Dcm type methylations on the plasmids of interest before introducing them by transformation into strain DSM 6423.
  • the transformation is otherwise carried out similarly for each strain, that is to say according to the protocol described by Mermelstein et al. 1992, with the following modifications: the strain is transformed with a larger amount of plasmid (5-20 pg), at an OD 600 of 0.6-0.8, and the electroporation parameters are 100 W, 25 pF , 1400 V. After 3 h of regeneration in 2YTG, the bacteria are spread on a Petri dish (2YTG agar) containing the desired antibiotic (erythromycin: 20-40 mg / mL; thiamphenicol: 15 mg / mL; spectinomycin: 650 mg / mL).
  • the desired antibiotic erythromycin: 20-40 mg / mL
  • thiamphenicol 15 mg / mL
  • spectinomycin 650 mg / mL
  • Transformations were carried out in biological duplicates in the following strains of C. beijerinckii: wild-type DSM 6423, DSM 6423 AcatB and DSM 6423 AcalB ApNF2 (FIG. 30).
  • the vector pCas9 md which is notably difficult to use to modify a bacterium because it does not allow good transformation efficiencies, was used. It also comprises a gene conferring on the strain resistance to erythromycin, an antibiotic for which the three strains are sensitive.
  • Plasmids pFWO1 and pEC750C were also transformed. These two plasmids contain genes for resistance to different antibiotics (respectively G erythromycin and thiamphenicol) and are commonly used to transform C. beijerinckii and C. acetobutylicum.
  • the vectors based on pNF3 exhibit excellent transformation efficiency, and can be used in particular in C. beijerinckii DSM 6423 AcatB ApNF2.
  • pNF3E which contains an erythromycin resistance gene
  • pFW01 which includes the same resistance gene.
  • This same plasmid could not be introduced into the wild-type C. beijerinckii DSM 6423 strain (0 colonies obtained with 5 ⁇ g of plasmids transformed into biological duplicates), which demonstrates the impact of the presence of the natural plasmid pNF2.
  • the inventors carried out a comparative analysis of the transformation efficiencies of the plasmids pFWO1, pNF3E and pNF3S in the strain ABE C. beijerinckii NCIMB 8052 (FIG. 33) .
  • the strain NCIMB 8052 being naturally resistant to thiamphenicol, pNF3S, conferring resistance to spectinomycin, was used instead of pNF3C.
  • strain NCIMB 8052 is transformable with plasmids based on pNF3, which proves that these vectors are applicable to the species C. beijerinckii in the broad sense.
  • Patent application FRI 8/73492 describes the AcatB strain as well as the use of a CRISPR / Cas9 system with two plasmids requiring the use of a gene for resistance to erythromycin and of a gene for resistance to thiamphenicol. .
  • the vector pNF3C was transformed into the AcatB strain already containing the plasmid pCas9 acr .
  • Transformation carried out in duplicate, showed a transformation efficiency of 0.625 ⁇ 0.125 colonies / pg DNA (mean ⁇ standard error), which proves that a vector based on pNF3C can be used in combination with the pCas9 acr in the AcatB strain.
  • part of the plasmid pNF2 comprising its origin of replication (SEQ ID NO: 118) could be successfully reused to create a new series of shuttle vectors (SEQ ID NO: 1 19, 123, 124 and 125) , customizable, allowing in particular their replication in an E. coli as well as their reintroduction into C. beijerinckii DSM 6423.
  • shuttle vectors SEQ ID NO: 1 19, 123, 124 and 125
  • These new vectors exhibit advantageous transformation efficiencies for carrying out genetic editing, for example in C. beijerinckii DSM 6423 and its derivatives, in particular using the tool CRISPR / Cas9 comprising two different nucleic acids.
  • PNA Peptide nucleic acids
  • ClosTron mutagenesis in Clostridium refined and streamlined. Journal of microbiological methods, 80 (1), 49-55.
  • ClosTron a universal gene knock-out System for the genus Clostridium. Journal of microbiological methods, 70 (3), 452-464.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

La présente invention concerne la transformation et la modification génétique de bactéries appartenant au phylum des Firmicutes. Elle concerne ainsi des méthodes, outils et kits permettant une telle modification génétique, impliquant en particulier une séquence d'acide nucléique utilisée pour faciliter la transformation de la bactérie, ladite séquence comprenant i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d'une bactérie et/ou l'expression au sein de ladite bactérie d'une séquence d'ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. La description vise aussi les bactéries génétiquement modifiées obtenues et leurs utilisations, en particulier pour produire un solvant, de préférence à l'échelle industrielle.

Description

DESCRIPTION
Titre : OUTIL GENETIQUE OPTIMISÉ POUR MODIFIER LES BACTERIES
La présente invention concerne la transformation et la modification génétique de bactéries, en particulier appartenant au phylum des Firmicutes, typiquement de bactéries solvantogènes, par exemple du genre Clostridium, de préférence de bactéries possédant à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN (ou plasmide naturel) distincte de l’ADN chromosomique. Elle concerne ainsi des méthodes, outils et kits permettant une telle modification génétique, impliquant en particulier une séquence d’acide nucléique utilisée pour faciliter la transformation de la bactérie, ladite séquence comprenant i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. La description vise aussi les bactéries génétiquement modifiées obtenues et leurs utilisations, en particulier pour produire un solvant, de préférence à l’échelle industrielle.
ARRIERE-PLAN TECHNOLOGIQUE
Le genre Clostridium contient des bactéries à Gram positif, anaérobies strictes et sporulantes, appartenant au phylum des Firmicutes. Les Clostridia sont un groupe d’importance pour la communauté scientifique pour plusieurs raisons. La première est qu’un certain nombre de maladies graves (e.g. tétanos, botulisme) sont dues à des infections de membres pathogènes de cette famille (John & Wood, 1986 ; Gonzales et al., 2014). La deuxième est la possibilité d’utiliser des souches dites acidogènes ou solvantogènes en biotechnologie (Moon et al., 2016). Ces Clostridia, non pathogènes, ont naturellement la capacité de convertir une variété importante de sucres pour produire des espèces chimiques d’intérêt, et plus particulièrement de l’acétone, du butanol, et de l’éthanol (John & Wood, 1986) au cours d’un processus fermentaire nommé ABE. De manière similaire, la fermentation IBE est possible chez certaines espèces particulières, lors de laquelle l’acétone est réduit en proportion variable en isopropanol (Chen et al., 1986, George et al., 1983) grâce à la présence dans le génome de ces souches de gènes codant des alcool déshydrogénases secondaires (s-ADH ; Ismael et al., 1993, Hiu et al., 1987).
Les espèces de Clostridia solvantogènes présentent des similarités phénotypiques importantes, ce qui rendait difficile leur classification avant l’émergence des techniques de séquençage modernes (Rogers et al., 2006). Avec la possibilité de séquencer les génomes complets de ces bactéries, il est aujourd’hui possible de classer ce genre bactérien en 4 espèces majeures : C. acetobutylicum, C. saccharoperbutylacetonicum, C. saccharobutylicum et C. beijerinckii. Une publication récente propose, après analyse comparative des génomes complets de 30 souches, de classer ces Clostridia solvantogènes en 4 clades principaux (Figure 1). Ces groupes séparent notamment les espèces que sont C. acetobutylicum et C. beijerinckii avec comme références respectives C. acetobutylicum ATCC 824 (également désignée DSM 792 ou encore LMG 5710) et C. beijerinckii NCIMB 8052. Ces dernières sont des souches modèles pour l’étude de la fermentation ABE.
Les souches de Clostridium naturellement capables d’effectuer une fermentation IBE sont peu nombreuses et appartiennent majoritairement à l’espèce Clostridium beijerinckii (cf. Zhang et al., 2018, Tableau 1). Ces souches sont typiquement sélectionnées parmi les souches C. butylicum LMD 27.6, C. aurantibutylicum NCIB 10659, C. beijerinckii LMD 27.6, C. beijerinckii VPI2968, C. beijerinckii NRRL B-593, C. beijerinckii ATCC 6014, C. beijerinckii McClung 3081, C. isopropylicum IAM 19239, C. beijerinckii DSM 6423, C. sp. A1424, C. beijerinckii optinoii, et C. beijerinckii BGS1.
Bien qu’utilisées en industrie depuis plus d’un siècle, les connaissances sur les bactéries, notamment appartenant au genre Clostridium, ont longtemps été limitées par les difficultés rencontrées pour les modifier génétiquement. Différents outils génétiques ont été conçus au cours des dernières années pour optimiser les souches de ce genre, la dernière génération étant basée sur Tutilisation de la technologie CRISPR (Clustered Regularly Interspaced Short Palindromie Repeats)/Cas (CRISPR-associated protein). Cette méthode est basée sur l’emploi d’une enzyme appelée nucléase (typiquement une nucléase de type Cas dans le cas de l’outil génétique CRISPR/Cas, telle que la protéine Cas9 de Streptococcus pyogenes), qui va, guidée par une molécule d’ARN, réaliser une coupure double brin au sein d’une molécule d’ADN (séquence cible d’intérêt). La séquence de TARN guide (ARNg) déterminera le site de coupure de la nucléase, lui conférant ainsi une très forte spécificité (Figure 1).
Une coupure double brin au sein d’une molécule d’ADN indispensable étant létale pour un organisme, la survie de ce dernier dépendra de sa capacité à la réparer (cf. par exemple Cui & Bikard, 2016). Chez les bactéries du genre Clostridium, la réparation d’une coupure double brin dépend d’un mécanisme de recombinaison homologue nécessitant une copie intacte de la séquence clivée. En fournissant à la bactérie un fragment d’ADN permettant d’effectuer cette réparation tout en modifiant la séquence originelle, il est possible de forcer le micro-organisme à intégrer les changements désirés au sein de son génome. La modification réalisée ne doit plus permettre le ciblage de l’ADN génomique par le complexe ribonucléoprotéique Cas9-ARNg, via la modification de la séquence cible ou du site PAM (Figure 2).
Différentes approches ont été décrites pour tenter de rendre fonctionnel cet outil génétique au sein de bactéries du genre Clostridium. Ces microorganismes sont en effet connus pour être difficiles à modifier génétiquement en raison de leurs faibles fréquences de transformation et de recombinaison homologue. Quelques approches sont basées sur l’emploi de Cas9, exprimée de manière constitutive chez C. beijerinckii et C. ljungdahlii (Wang et al, 2015 ; Huang et al, 2016) ou sous contrôle d’un promoteur inductible chez C. beijerinckii, C. saccharoperbutylacetonicum et C. authoethanogenum (Wang et al, 2016 ; Nagaraju et al, 2016 ; Wang et al, 2017). D’autres auteurs ont décrit l’utilisation d’une version modifiée de la nucléase, Cas9n, qui réalise des coupures simple brin, au lieu de coupures double brin, au sein du génome (Xu et al, 2015 ; Li et al, 2016). Ce choix est dû aux observations selon lesquelles la toxicité de Cas9 est trop importante pour son utilisation chez des bactéries du genre Clostridium dans les conditions expérimentales testées. La plupart des outils décrits précédemment reposent sur l'utilisation d'un plasmide unique. Enfin, il est également possible d’utiliser des systèmes CRISPR/Cas endogènes lorsqu’ils ont été identifiés au sein du génome du micro-organisme, comme par exemple chez C. pasteurianum (Pyne et al, 2016).
A moins qu'ils n'utilisent (comme dans le dernier cas décrit ci-dessus) la machinerie endogène de la souche à modifier, les outils basés sur la technologie CRISPR présentent l'inconvénient majeur de limiter significativement la taille de l'acide nucléique d'intérêt (et donc le nombre de séquences codantes ou gènes) susceptible d'être inséré dans le génome bactérien (1,8 kb environ au mieux d'après Xu et al., 2015).
Les inventeurs ont mis au point et décrit un outil génétique plus performant de modification de bactéries, adapté aux bactéries du genre Clostridium, basé sur l’utilisation de deux acides nucléiques distincts, typiquement de deux plasmides (WO2017064439, Wasels et al., 2017 et Figure 3) qui résout notamment ce problème. Dans un mode de réalisation particulier, le premier acide nucléique de cet outil permet l’expression de cas9 et un deuxième acide nucléique, spécifique de la modification à effectuer, contient une ou plusieurs cassettes d’expression d’ARNg ainsi qu’une matrice de réparation permettant le remplacement d’une portion de l’ADN bactérien ciblée par Cas9 par une séquence d’intérêt. La toxicité du système est limitée en plaçant cas9 et/ou la (les) cassette(s) d’expression d’ARNg sous contrôle de promoteurs inductibles. Les inventeurs ont récemment amélioré cet outil en permettant d’augmenter très significativement l’efficacité de transformation et donc l’obtention, en nombre et quantité utile (en particulier dans un contexte de sélection de souches robustes pour une production à l’échelle industrielle), de bactéries génétiquement modifiées d’intérêt (cf. FR 18/548356). Dans cet outil amélioré au moins un acide nucléique comprend une séquence codant une protéine anti-CRISPR (« acr »), placée sous le contrôle d’un promoteur inductible. Cete protéine anti-CRISPR permet de réprimer l’activité du complexe endonucléase d’ADN/ARN guide. L’expression de la protéine est régulée pour permetre son expression uniquement pendant l’étape de transformation de la bactérie.
Les inventeurs sont également très récemment parvenus à modifier génétiquement des bactéries comprenant à l’état sauvage un gène conférant à la bactérie la résistance à un ou plusieurs antibiotiques afin de les rendre sensibles au(x)dit(s) antibiotique(s), ce qui a permis de faciliter l’utilisation de leur outil génétique basé sur l’utilisation d’au moins deux acides nucléiques. Ils sont ainsi parvenus à modifier génétiquement la souche C. beijerinckii DSM 6423 naturellement productrice d’isopropanol. Ils sont en particulier parvenus à éliminer de cette souche un plasmide naturel non essentiel pour la souche, identifié dans la présente description en tant que « pNF2 » (cf. FRI 8/73492).
Les inventeurs ont ensuite découvert, et révèlent pour la première fois dans le cadre de la présente invention, que l’élimination de ce plasmide pNF2, permet d’obtenir une bactérie C. beijerinckii DSM 6423 pour laquelle l’efficacité d’introduction de matériel génétique (i.e. de transformation) est augmentée d’un facteur compris entre environ 101 et 5 x 103. Comme expliqué ci-dessous, les inventeurs ont également réussi à améliorer encore de manière très significative l’outil génétique basé sur l’utilisation d’au moins deux acides nucléiques, en utilisant une partie du plasmide pNF2 afin de concevoir des acides nucléiques particuliers porteurs d’une séquence permettant de modifier le matériel génétique d’une bactérie et/ou d’exprimer au sein d’une bactérie une séquence d’ADN absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. Ces acides nucléiques et nouveaux outils améliorent de manière spectaculaire l’efficacité de transformation des bactéries, en particulier l’efficacité de transformation de bactéries préalablement débarrassées du ou des plasmides naturels qu’elles contiennent à l’état sauvage.
La présente invention facilite ainsi de manière très avantageuse l’efficacité de transformation et donc l’exploitation des bactéries, en particulier à l’échelle industrielle.
RESUME DE L’INVENTION
Les inventeurs décrivent, dans le contexte de la présente invention et pour la première fois, un acide nucléique (également identifié dans le présent texte en tant que acide nucléique « OPT ») facilitant la transformation des bactéries (en améliorant le maintien au sein desdites bactéries de l’ensemble du matériel génétique introduit). L’acide nucléique OPT comprend i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. La séquence SEQ ID NO : 126 est également identifiée dans le présent texte en tant qu’acide nucléique « OREP ».
Les inventeurs sont parvenus à améliorer les fréquences de transformation d’un acide nucléique au sein de la bactérie C. beijerinckii DSM 6423 notamment en supprimant la séquence OREP au sein de ladite bactérie et en utilisant avantageusement tout ou partie de cette séquence OREP pour construire des acides nucléiques et/ou outils génétiques permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
La séquence OREP comprend une séquence nucléotidique (SEQ ID NO : 127) codant pour une protéine impliquée dans la réplication d’un acide nucléique OPT d’intérêt. Cette protéine impliquée dans la réplication est également identifiée dans le présent texte en tant que protéine « REP » (SEQ ID NO : 128 - « MNNNNTESEELKEQSQLLLDKCTKKKKKNPKFSSYIEPLVSKKLSERIKECGDFLQMLSDLNLE NSKLHRASFCGNRFCPMCSWRIACKDSLEISILMEHLRKEESKEFIFLTLTTPNVKGADLDNSIKA YNKAFKKLMERKEVKSIVKGYIRKLEVTYNLDKSSKSYNTYHPHFHVVLAVNRSYFKKQNLYIN HHRWLSLWQESTGDYSITQVDVRKAKINDYKEVYELAKYSAKDSDYLINREVFTVFYKSLKGK QVLVFSGLFKDAHKMYKNGELDLYKKLDTIEYAYMVSYNWLKKKYDTSNIRELTEEEKQKFNK NLIEDVDIE »). La protéine REP possède un domaine conservé chez les firmicutes, nommé « COG 5655 » (Plasmid rolling circle réplication initiator protein REP), de séquence SEQ ID NO : 129. Est également décrit un outil génétique permettant la transformation optimisée puis la modification par recombinaison homologue du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel d’une bactérie appartenant au phylum des Firmicutes, par exemple d’une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus (Hidalgo-Cantabrana, C. et al. ; Yadav, R. et al.).
Dans un mode de réalisation particulier, l’outil de modification par recombinaison homologue se caractérise typiquement i) en ce qu’il comprend au moins :
- un « premier » acide nucléique codant au moins une endonucléase d’ADN, par exemple l’enzyme Cas9, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- au moins un « deuxième » acide nucléique contenant une matrice de réparation permettant, par un mécanisme de recombinaison homologue, le remplacement d’une portion de l’ADN bactérien ciblée par l’endonucléase par une séquence d’intérêt,
en ce que ii) au moins l’un desdits acides nucléiques code en outre un ou plusieurs ARN guides (ARNg) ou en ce que l’outil génétique comprend en outre un ou plusieurs ARN guides, chaque ARN guide comprenant une structure ARN de fixation à l’endonucléase d’ADN et une séquence complémentaire de la portion ciblée de l’ADN bactérien, et de préférence iii) en ce que au moins l’un desdits acides nucléiques comprend en outre une séquence codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible, ou en ce que l’outil génétique comprend en outre un troisième acide nucléique codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible.
Est en particulier décrit un tel outil génétique comprenant au moins :
- un « premier » acide nucléique codant au moins une endonucléase d’ADN, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- un « autre » acide nucléique comprenant, ou consistant en, une séquence « d’acide nucléique OREP », i.e. comprenant, ou consistant en, i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
Dans un mode de réalisation particulier le « deuxième acide nucléique contenant une matrice de réparation » tel que décrit ci-dessus comprend cet « autre acide nucléique ».
Les inventeurs décrivent également un procédé pour transformer, et de préférence pour modifier génétiquement, par exemple par recombinaison homologue, une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, typiquement une bactérie solvantogène, de même que la/les bactérie(s) obtenue(s) (transformée(s) et typiquement modifiée(s) génétiquement) à l’aide d’un tel procédé. Ce procédé comprend avantageusement une étape de transformation de la bactérie par introduction dans ladite bactérie de tout ou partie d’un outil génétique tel que décrit dans le présent texte, en particulier d’un acide nucléique (« acide nucléique OREP ») comprenant, ou consistant en, i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
Dans un mode de réalisation particulier, ce procédé comprend avantageusement les étapes suivantes : a) d’introduction dans la bactérie d’un outil génétique tel que décrit dans le présent texte, de préférence en présence d’un agent inducteur de l’expression de la protéine anti-CRISPR, et
b) de culture de la bactérie transformée obtenue à l’issue de l’étape a) sur un milieu ne contenant pas l’agent inducteur de l’expression de la protéine anti-CRISPR, et permettant typiquement l’expression du complexe ribonucléoprotéique endonucléase d’ADN/ARNg, par exemple Cas9/ARNg.
Les inventeurs décrivent également un kit pour transformer, et de préférence modifier génétiquement, une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus , ou pour produire au moins un solvant, par exemple un mélange de solvants, à l’aide d’une telle bactérie. Ce kit comprend de préférence un acide nucléique tel que décrit dans le présent texte et un inducteur adapté au promoteur inductible de l’expression de la protéine anti-CRISPR sélectionné utilisé au sein de l’outil génétique tel que décrit dans le présent texte. Dans un mode de réalisation particulier, le kit comprend tout ou partie des éléments d’un outil génétique tel que décrit dans le présent texte.
Est également décrite l’utilisation d’un acide nucléique ou d’un outil génétique, divulgués pour la première fois dans le présent texte, pour transformer et éventuellement modifier génétiquement une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, de préférence une bactérie possédant à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique (typiquement un plasmide naturel).
Est aussi décrite pour la première fois dans le présent texte l’utilisation d’un acide nucléique, d’un outil génétique, d’un procédé pour transformer et de préférence modifier génétiquement une telle bactérie, de la bactérie obtenue par un tel procédé et/ou d’un kit, pour permettre la production, de préférence à l’échelle industrielle, d’un solvant ou d’un mélange de solvants, de préférence d’acétone, de butanol, d’éthanol, d’isopropanol ou d’un mélange de ceux-ci, typiquement d’un mélange isopropanoFbutanol, butanol/ éthanol ou isopropanol/éthanol. DESCRIPTION DETAILLEE DE L’INVENTION
Bien qu’utilisées en industrie depuis plus d’un siècle, les connaissances sur les bactéries solvantogènes, en particulier appartenant au genre Clostridium, sont limitées par les difficultés rencontrées pour les modifier génétiquement. Par exemple, les bactéries du genre Clostridium naturellement productrice d’isopropanol, typiquement possédant dans leur génome un gène adh codant une alcool-déshydrogénase primaire/secondaire qui permet la réduction de l’acétone en isopropanol, se distinguent à la fois génétiquement et fonctionnellement des bactéries capables à l’état naturel d’une fermentation ABE.
Les inventeurs sont avantageusement parvenus, dans le contexte de la présente invention, à transformer et à modifier génétiquement, une bactérie du genre Clostridium naturellement productrice d’isopropanol, la bactérie C. beijerinckii DSM 6423, ainsi que la souche de référence C. acetobutylicum DSM 792.
Une partie des travaux décrits dans la partie expérimentale ont été réalisés au sein d’une souche capable de fermentation IBE, i.e. la souche C. beijerinckii DSM 6423 dont le génome et une analyse transcriptomique ont été décrits récemment par les inventeurs (Maté de Gerando et al., 2018).
Lors de l’assemblage du génome de cette souche, les inventeurs ont en particulier découvert, en plus du chromosome, la présence d’éléments génétiques mobiles (numéro d’accession PRJEB11626 - https://www.ebi.ac.uk/ena/data/view/PRJEB11626) : deux plasmides naturels (pNFl et pNF2) et un bactériophage linéaire (F6423).
La souche C. beijerinckii DSM 6423 est naturellement sensible à l’érythromycine mais résistante au thiamphénicol. La demande de brevet n° FRI 8/73492 décrit une souche particulière, la souche C. beijerinckii DSM 6423 AcatB (également identifiée dans le présent texte en tant que C. beijerinckii IFP962 AcatB), rendue sensible au thiamphénicol. Dans un mode de réalisation particulier de l’invention, les inventeurs sont parvenus à supprimer de la souche C. beijerinckii DSM 6423 son plasmide naturel pNF2 et ont obtenu une souche C. beijerinckii DSM6423 AcatB ApNF2 (également identifiée dans le présent texte en tant que C. beijerinckii IFP963 AcatB ApNF2). Cette souche est caractérisée pour la première fois dans le cadre de la présente demande. Elle a été enregistrée le 20 février 2019 sous le numéro de dépôt LMG P- 31277 auprès de la collection BCCM-LMG. Cette souche est dépourvue du gène catB de séquence SEQ ID NO : 18 et du plasmide pNF2 (sauvage). La description concerne également toute bactérie dérivée, clone, mutant ou version génétiquement modifiée de celle-ci, typiquement également dépourvue du gène catB de séquence SEQ ID NO : 18 et du plasmide pNF2 (sauvage). Elle concerne aussi plus généralement toute bactérie possédant à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique (identifiée dans le présent texte en tant que « ADN (bactérien) non chromosomique » ou « plasmide (bactérien) naturel »), modifiée génétiquement à l’aide d’un acide nucléique et/ou outil génétique décrit(s) dans le cadre de la présente invention de manière à ne plus comprendre au moins l’une de ses molécules d’ADN non chromosomique, typiquement plusieurs de ses molécules d’ADN non chromosomique (par exemple deux, trois ou quatre molécules d’ADN non chromosomique), de préférence l’ensemble de ses molécules d’ADN non chromosomique.
Les inventeurs décrivent ainsi, dans la présente demande, une bactérie solvantogène appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus , plus particulièrement une bactérie du genre Clostridium, naturellement capable (i.e. capable à l’état sauvage) de produire de l’isopropanol, en particulier naturellement capable d’effectuer une fermentation IBE, qui a été modifiée génétiquement et a, du fait de cette modification génétique, en particulier perdu au moins un plasmide naturel (i.e. un plasmide naturellement présent au sein de la version sauvage de ladite bactérie), de préférence l’ensemble de ses plasmides naturels, ainsi que les outils, en particulier les outils génétiques, ayant permis son obtention.
Ces outils présentent l’avantage de faciliter considérablement la transformation et la modification génétique des bactéries. Les expériences réalisées par les inventeurs ont démontré l’utilisation possible des outils et plus généralement de la technologie décrite dans le présent texte pour modifier génétiquement une bactérie, en particulier des bactéries appartenant au phylum des Firmicutes, par exemple des bactéries du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, notamment des bactéries du genre Clostridium capables, à l’état sauvage, de produire de l’isopropanol, en particulier d’effectuer une fermentation IBE, en particulier celles porteuses d’un gène codant une enzyme responsable de la résistance à un antibiotique, en particulier un gène codant une amphénicol-O-acetyltransférase, par exemple une chloramphénicol-O- acetyltransférase ou une thiamphénicol-O-acetyltransférase.
Dans un mode de réalisation particulier, les inventeurs sont ainsi parvenus à rendre sensible à antibiotique appartenant à la classe des amphénicols, une bactérie naturellement porteuse (porteuse à l’état sauvage) d’un gène codant une enzyme responsable de la résistance à ces antibiotiques.
D’autres bactéries préférées contiennent, à l’état sauvage, à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique.
Des bactéries également préférées contiennent, à l’état sauvage, à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique, ainsi qu’un gène conférant une résistance à un antibiotique. Dans un mode de réalisation particulier, ce gène code une amphénicol-O- acetyltransférase, par exemple une chloramphénicol-O-acetyltransférase ou une thiamphénicol-O- acetyltransférase.
Un premier objet décrit par les inventeurs concerne un acide nucléique (identifié dans le présent texte en tant que acide nucléique « OPT »), avantageusement utilisable pour faciliter la transformation des bactéries en améliorant le maintien au sein desdites bactéries de l’ensemble du matériel génétique introduit. Cet acide nucléique OPT comprend i) tout ou partie de la séquence SEQ ID NO : 126 (séquence « OREP ») ou d’un variant fonctionnel de celle-ci et ii) une séquence (également identifiée dans le présent texte en tant que « séquence d’intérêt ») permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
La séquence OREP (SEQ ID NO : 126) comprend une séquence nucléotidique de séquence SEQ ID NO : 127. La séquence SEQ ID NO : 127 comprend de préférence une séquence codant pour une protéine impliquée dans la réplication de l’acide nucléique OPT. Une protéine considérée comme impliquée dans la réplication est également identifiée dans le présent texte en tant que protéine « REP » (SEQ ID NO : 128). La protéine REP possède un domaine conservé chez les Firmicutes, nommé « COG 5655 », de séquence SEQ ID NO : 129.
Dans un mode de réalisation particulier, l’acide nucléique OPT comprend une partie de la séquence OREP (SEQ ID NO : 126), typiquement un ou plusieurs fragments de la séquence OREP, de préférence au moins la séquence codant la protéine REP (SEQ ID NO : 128) ou un variant ou fragment fonctionnel de celle-ci (i.e. le fragment impliqué dans la réplication), typiquement la séquence SEQ ID NO : 127 ou un variant ou fragment de celle-ci codant le fragment impliqué, au sein de la protéine REP, dans la réplication d’un acide nucléique OPT. Le fragment fonctionnel de la séquence OREP codant le fragment, présent au sein de la protéine REP, impliqué dans la réplication d’un acide nucléique OPT, comprend le domaine de séquence SEQ ID NO : 129. Des exemples de tels fragments d’acide nucléique codant un fragment fonctionnel de la protéine REP, et variants de ceux-ci, sont susceptibles d’être facilement préparés par l’homme du métier. Un exemple typique de variant présente une homologie de séquence avec la séquence SEQ ID NO : 127 comprise entre 70% et 100%, de préférence entre 85 et 99%, de manière encore plus préférée entre 95 et 99%, par exemple de 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100%.
Dans un mode de réalisation préféré, le fragment ou variant fonctionnel de la séquence OREP code pour une protéine impliquée dans la réplication de l’acide nucléique OPT.
Dans un mode de réalisation préféré de l’invention, le fragment ou variant fonctionnel de la séquence OREP comprend, en plus de la séquence codant une protéine (par exemple la protéine REP) impliquée dans la réplication de l’acide nucléique OPT (par exemple une construction génétique de type plasmide) ou d’un variant ou fragment fonctionnel de celle-ci, un site de 1 à 150 bases, de préférence de 1 à 15 bases, par exemple une séquence riches en bases A et T (Rajewska et al.), de préférence un site présent au sein du plasmide pNF2 de séquence SEQ ID NO : 1 18, permettant la fixation d’une protéine permettant la réplication de l’acide nucléique OPT.
La séquence d’intérêt permettant la modification du matériel génétique de la bactérie est typiquement une matrice de modification permettant, par exemple par un mécanisme de recombinaison homologue, par exemple selon l’un des procédés décrits dans le présent texte, le remplacement d’une portion du matériel génétique de la bactérie par une séquence d’intérêt. La séquence d’intérêt permettant la modification du matériel génétique de la bactérie peut aussi être une séquence reconnaissant (liant au moins en partie), et de préférence ciblant, i.e. reconnaissant et permettant la coupure, dans le génome d’une bactérie d’intérêt, d’au moins un brin i) d’une séquence cible, ii) d’une séquence contrôlant la transcription d’une séquence cible, ou iii) d’une séquence flanquant une séquence cible.
La séquence d’intérêt permettant l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie permet typiquement à la bactérie d’exprimer une ou plusieurs protéines qu’elle est incapable d’exprimer, ou d’exprimer en quantité suffisante, à l’état sauvage.
Selon un aspect particulier, « l’acide nucléique OPT » comprend en outre iii) une séquence codant une endonucléase d’ADN, par exemple Cas9, et/ou iv) un ou plusieurs ARN guides (ARNg), chaque ARNg comprenant une structure ARN de fixation à l’endonucléase d’ADN et une séquence complémentaire de la portion ciblée du matériel génétique de la bactérie.
Selon un autre aspect particulier, « l’acide nucléique OPT » ne présente pas de méthylation au niveau des motifs reconnus par les méthyltransférases de type Dam et Dcm.
De manière préférée, « l’acide nucléique OPT » est sélectionné parmi une cassette d’expression et un vecteur, et est de préférence un plasmide, par exemple un plasmide ayant une séquence sélectionnée parmi SEQ ID NO : 1 19, SEQ ID NO : 123, SEQ ID NO : 124 et SEQ ID NO : 125.
Un autre objet décrit par les inventeurs concerne un outil génétique utilisable pour transformer et/ou modifier génétiquement une bactérie d’intérêt, typiquement une bactérie telle que décrite dans le présent texte appartenant au phylum des Firmicutes, par exemple d’une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus , de préférence une bactérie du genre Clostridium naturellement capable (i.e. capable à l’état sauvage) de produire de l’isopropanol, en particulier naturellement capable d’effectuer une fermentation IBE, de préférence une bactérie résistante naturellement à un ou plusieurs antibiotiques, telle qu’une bactérie C. beijerinckii. Une bactérie préférée possède à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique.
Par bactérie appartenant au phylum des Firmicutes on entend, dans le contexte de la présente description, les bactéries appartenant à la classe des Clostridia, Mollicutes, Bacilli ou des Togobacteria, de préférence à la classe des Clostridia ou des Bacilli.
Des bactéries particulières appartenant au phylum des Firmicutes comprennent par exemple les bactéries du genre Clostridium, les bactéries du genre Bacillus ou les bactéries du genre Lactobacillus.
Par « bactérie du genre Clostridium », on entend en particulier les espèces de Clostridium dites d’intérêt industriel, typiquement les bactéries solvantogènes ou acétogènes du genre Clostridium. L’expression « bactérie du genre Clostridium » englobe les bactéries sauvages ainsi que les souches dérivées de celles- ci, modifiées génétiquement dans le but d’améliorer leur performance (par exemple surexprimant les gènes ctfA, ctfB et a de) sans avoir été exposées au système CRISPR.
Par « espèce de Clostridium d’intérêt industriel » on entend les espèces capables de produire, par fermentation, des solvants et des acides tels que l’acide butyrique ou l’acide acétique, à partir de sucres ou d’oses, typiquement à partir de sucres comprenant 5 atomes de carbone tels que le xylose, l’arabinose ou le fructose, de sucres comprenant 6 atomes de carbones tels que le glucose ou le mannose, de polyosides tels que la cellulose ou les hémicelluloses et/ou de toute autre source de carbone assimilable et utilisable par les bactéries du genre Clostridium (CO, CO2, et méthanol par exemple). Des exemples de bactéries solvantogènes d’intérêt sont les bactéries du genre Clostridium productrices d’acétone, de butanol, d’éthanol et/ou d’isopropanol, telles que les souches identifiées dans la littérature en tant que « souche ABE » [souches réalisant des fermentations permettant la production d’acétone, de butanol et d’éthanol] et « souche IBE » [souches réalisant des fermentations permettant la production d’isopropanol (par réduction de l’acétone), de butanol et d’éthanol]. Des bactéries solvantogènes du genre Clostridium peuvent être sélectionnées par exemple parmi C. acetobutylicum, C. cellulolyticum, C. phytofermentans, C. beijerinckii, C. saccharobutylicum, C. saccharoperbutylacetonicum, C. sporogenes, C. butyricum, C. aurantibutyricum et C. tyrobutyricum, de manière préférée parmi C. acetobutylicum, C. beijerinckii, C. butyricum, C. tyrobutyricum et C. cellulolyticum, et de manière encore plus préférée parmi C. acetobutylicum et C. beijerinckii.
Une bactérie capable de produire de l’isopropanol à l’état sauvage, en particulier capable d’effectuer une fermentation IBE à l’état sauvage, peut être par exemple une bactérie sélectionnée parmi une bactérie C. beijerinckii, une bactérie C. diolis, une bactérie C. puniceum, une bactérie C. butyricum, une bactérie C. saccharoperbutylacetonicum, une bactérie C. botulinum, une bactérie C. drakei, une bactérie C. scatologenes, une bactérie C. perfringens, et une bactérie C. tunisiense, de préférence une bactérie sélectionnée parmi une bactérie C. beijerinckii, une bactérie C. diolis, une bactérie C. puniceum et une bactérie C. saccharoperbutylacetonicum. Une bactérie naturellement capable de produire de l’isopropanol, en particulier capable d’effectuer une fermentation IBE à l’état sauvage, particulièrement préférée est une bactérie C. beijerinckii.
Les bactéries acétogènes d’intérêt sont des bactéries productrices d’acides et/ou de solvants à partir de CO2 et ¾. Des bactéries acétogènes du genre Clostridium peuvent être sélectionnées par exemple parmi C. aceticum, C. thermoaceticum, C. ljungdahlii, C. autoethanogenum, C. difficile, C. scatologenes et C. carboxydivorans.
Dans un mode de réalisation particulier, la bactérie du genre Clostridium concernée est une « souche ABE », de préférence la souche DSM 792 (également désignée souche ATCC 824 ou encore LMG 5710) de C. acetobutylicum, ou la souche NCIMB 8052 de C. beijerinckii.
Dans un autre mode de réalisation particulier, la bactérie du genre Clostridium concernée est une « souche IBE », de préférence un sous-clade de C. beijerinckii sélectionné parmi DSM 6423, LMG 7814, LMG 7815, NRRL B-593, NCCB 27006, ou une bactérie C. aurantibutyricum DSZM 793 (Georges et al., 1983), et un sous-clade d’une telle bactérie C. beijerinckii ou C. aurantibutyricum présentant au moins 90%, 95%, 96%, 97%, 98% ou 99% d’identité avec la souche DSM 6423. Une bactérie C. beijerinckii, ou un sous-clade de bactérie C. beijerinckii, particulièrement préféré(e) est dépourvu(e) du plasmide pNF2. Les génomes respectifs des sous-clades LMG 7814, LMG 7815, NRRL B-593 et NCCB 27006 d’une part, et DSZM 793 d’autre part, présentent des pourcentages d’identité de séquence d’au moins 97% avec le génome du sous-clade DSM 6423.
Les inventeurs ont réalisé des tests fermentaires confirmant que les bactéries C. beijerinckii de sous-clade DSM 6423, LMG 7815 et NCCB 27006 sont capables de produire de l’isopropanol à l’état sauvage (cf. tableau 1).
[Tableau 1]
Bilan des essais de fermentation de glucose à l’aide des souches naturellement productrices d’isopropanol C. beijerinckii DSM 6423, LMG 7815 et NCCB 27006.Dans un mode de réalisation particulièrement préféré de l’invention, la bactérie C. beijerinckii est la bactérie de sous-clade DSM 6423.
Dans encore un autre mode de réalisation préféré de l’invention, la bactérie C. beijerinckii est une souche C. beijerinckii IFP963 AcalB ApNF2 (enregistrée le 20 février 2019 sous le numéro de dépôt LMG P-31277 auprès de la collection BCCM-LMG, et également identifiée dans le présent texte en tant que C. beijerinckii DSM 6423 AcatB ApNF2), ou une version génétiquement modifiée de celle-ci. La bactérie C. beijerinckii IFP963 AcatB ApNF2, ou ladite version génétiquement modifiée de celle-ci, est dépourvue du gène catB de séquence SEQ ID NO : 18 et du plasmide pNF2. Par « bactérie du genre Bacillus », on entend en particulier B. amyloliquefaciens, B. thurigiensis, B. coagulans, B. cereus, B. anthracis ou encore B. subtilis.
Au cours d’expérimentations récentes, les inventeurs ont observé que l’éviction du plasmide naturel pNF2 présente un avantage significatif pour l’introduction et le maintien d’éléments génétiques additionnels, naturels ou synthétiques (par exemple de cassette(s) d’expression ou de vecteur(s) plasmidique(s) d’expression). La souche IFP963 AcatB ApNF2 peut ainsi être transformée avec une efficacité 10 à 5 x 103 fois supérieure à son homologue sauvage ou à la souche DSM 6423 AcatB (également identifiée dans le présent texte en tant que IFP962 AcatB).
La bactérie destinée à être transformée, et de préférence modifiée génétiquement, est de préférence une bactérie qui a été exposée à une première étape de transformation et à une première étape de modification génétique à l’aide d’un acide nucléique ou outil génétique selon l’invention ayant permis de supprimer au moins une molécule d’ADN extrachromosomique (typiquement au moins un plasmide) naturellement présente au sein de ladite bactérie à l’état sauvage.
Un outil génétique particulier décrit par les inventeurs se caractérise i) en ce qu’il comprend au moins :
- un « premier » acide nucléique codant au moins une endonucléase d’ADN, par exemple l’enzyme Cas9, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- au moins un « deuxième » acide nucléique contenant une matrice de réparation permettant, par un mécanisme de recombinaison homologue, le remplacement d’une portion de l’ADN bactérien ciblée par l’endonucléase par une séquence d’intérêt,
en ce que ii) au moins l’un desdits acides nucléiques code en outre un ou plusieurs ARN guides (ARNg) ou en ce que l’outil génétique comprend en outre un ou plusieurs ARN guides, chaque ARN guide comprenant une structure ARN de fixation à l’endonucléase d’ADN et une séquence complémentaire de la portion ciblée de l’ADN bactérien.
Un exemple d'outil génétique décrit par les inventeurs contient, tout comme le système CRISPR/Cas, deux éléments essentiels distincts, i.e. i) une endonucléase, dans le cas présent la nucléase associée au système CRISPR (Cas ou « CRISPR associated protein »), Cas, et ii) un ARN guide. L’ARN guide se présente sous la forme d'un ARN chimérique qui consiste en la combinaison d’un ARN bactérien CRISPR (ARNcr) et d’un ARNtracr (//vms-activating ARN CRISPR) (linek et al., Science 2012). L'ARNg combine la spécificité de ciblage de l' ARNcr correspondant aux "séquences espaçantes" qui servent de guides aux protéines Cas, et les propriétés conformationnelles de l' ARNtracr en un transcrit unique. Lorsque l'ARNg et la protéine Cas sont exprimés simultanément dans la cellule, la séquence génomique cible est typiquement avantageusement modifiée de manière permanente grâce à une matrice de réparation fournie. L’outil génétique selon l’invention se caractérise de préférence iii) en ce que au moins l’un desdits (« premier » et « deuxième ») acides nucléiques comprend en outre une séquence codant une protéine anti- CRISPR placée sous le contrôle d’un promoteur inductible, ou en ce que l’outil génétique comprend en outre un troisième acide nucléique codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible.
Est en particulier décrit un outil génétique comprenant au moins :
- un premier acide nucléique codant au moins une endonucléase d’ADN, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- un autre acide nucléique (ou un « énième acide nucléique ») comprenant, ou consistant en, une séquence d’acide nucléique « OPT », i.e. une séquence comprenant i) tout ou partie de la séquence SEQ ID NO : 126 (« OREP ») et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie, au moins l’un desdits acides nucléiques de cet outil génétique particulier comprenant de préférence en outre une séquence codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible, ou ledit outil génétique particulier comprenant de préférence en outre un troisième acide nucléique codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible.
Dans un mode de réalisation particulier le « deuxième » ou « énième acide nucléique contenant une matrice de réparation » tel que décrit ci-dessus comprend, ou consiste en, cet « autre acide nucléique ».
Dans un autre mode de réalisation particulier le « premier acide nucléique » code en outre un ou plusieurs ARN guides (ARNg).
Par « acide nucléique », on entend au sens de l’invention, toute molécule d’ADN ou d’ARN naturelle, synthétique, semi-synthétique ou recombinante, éventuellement modifiée chimiquement (i.e. comprenant des bases non naturelles, des nucléotides modifiés comprenant par exemple une liaison modifiée, des bases modifiées et/ou des sucres modifiés), ou optimisée de manière à ce que les codons des transcrits synthétisés à partir des séquences codantes soient les codons les plus fréquemment trouvés chez une bactérie du genre Clostridium en vue de son utilisation chez celle-ci. Dans le cas du genre Clostridium, les codons optimisés sont typiquement des codons riches en bases adénines (« A ») et thymines (« T »).
Dans les séquences peptidiques décrites dans ce document, les acides aminés sont représentés par leur code à une lettre selon la nomenclature suivante : C : cystéine; D : acide aspartique; E : acide glutamique; F : phénylalanine; G : glycine; H : histidine; I : isoleucine; K : lysine; L : leucine ; M : méthionine ; N : asparagine ; P : proline ; Q : glutamine ; R : arginine ; S : sérine ; T : thréonine ; V : valine ; W : tryptophane et Y : tyrosine. Un outil génétique décrit dans le contexte de la présente invention comprend un premier acide nucléique codant au moins une endonucléase d’ADN (également identifiée dans le présent texte en tant que « nucléase »), typiquement une nucléase de type Cas, par exemple Cas9 ou MAD7.
Par « Cas9 » on entend la protéine Cas9 (aussi appelée CRISPR-associated protein 9, Csnl ou Csxl2) ou un fragment protéique, peptidique ou polypeptidique fonctionnel de celle-ci, i.e. capable d’interagir avec le/les ARN guides et d’exercer l’activité enzymatique (nucléasique) qui lui permet de réaliser la coupure double brin de l’ADN du génome cible. « Cas9 » peut ainsi désigner une protéine modifiée, par exemple tronquée afin de supprimer les domaines de la protéine non essentiels aux fonctions prédéfinies de la protéine, en particulier les domaines non nécessaires à l’interaction avec le/les ARNg.
La nucléase MAD7 (dont la séquence d’acides aminés correspond à la séquence SEQ ID NO : 72), également identifiée en tant que « Cas 12 » ou « Cpfl », peut autrement être avantageusement utilisée dans le cadre de la présente invention en la combinant avec un ou des ARNg connu(s) de l’homme de métier capable(s) de se lier à une telle nucléase (cf. Garcia-Doval et al., 2017 et Stella S. et al., 2017).
Selon un aspect particulier, la séquence codant la nucléase MAD7 est une séquence optimisée pour être facilement exprimée dans des souches de Clostridium, de préférence la séquence SEQ ID NO : 71.
Selon un autre aspect particulier, la séquence codant la nucléase MAD7 est une séquence optimisée pour être facilement exprimée dans des souches de Bacillus, de préférence la séquence SEQ ID NO : 132.
La séquence codant Cas9 (la protéine entière ou un fragment de celle-ci) telle qu’utilisable dans l’un des exemples de modes de réalisation possibles de l’invention peut être obtenue à partir de toute protéine Cas9 connue (Makarova et al., 201 1). Des exemples de protéines Cas9 utilisables dans la présente invention incluent, sans y être limités, les protéines Cas9 de S. pyogenes (cf. SEQ ID NO : 1 de la demande WO2017/064439 et numéro d’entrée NCBI : WP_010922251.1), Streptococcus thermophilus, Streptococcus mutans, Campylobacter jejuni, Pasteurella multocida, Francisella novicida, Neisseria meningitidis, Neisseria lactamica et Légionella pneumophila (cf. Fonfara et al, 2013 ; Makarova et al, 2015).
Dans un mode de réalisation particulier, la protéine Cas9, ou un fragment protéique, peptidique ou polypeptidique fonctionnel de celle-ci, codée par l’un des acides nucléiques de l’outil génétique selon l’invention comprend, ou consiste en, la séquence d’acides aminés SEQ ID NO : 75, ou toute autre séquence d’acides aminés ayant au moins 50%, de préférence au moins 60%, d’identité avec celle-ci, et contenant au minimum les deux acides aspartiques (« D ») occupant les positions 10 (« D10 ») et 840 (« D840 ») de la séquence d’acides aminés SEQ ID NO : 75.
Dans un mode de réalisation préféré, Cas9 comprend, ou consiste en, la protéine Cas9 (Numéro d’entrée NCBI : WP_010922251.1, SEQ ID NO : 75), codée par le gène cas9 de la souche de S. pyogenes Ml GAS (Numéro d’entrée NCBI : NC 002737.2 SPy_1046, SEQ ID NO : 76) ou une version de celui-ci ayant subi une optimisation (« version optimisée ») à l’origine d’un transcrit contenant les codons utilisés préférentiellement par les bactéries du genre Clostridium, typiquement les codons riches en bases adénines (« A ») et thymines (« T »), permettant une expression facilitée de la protéine Cas9 au sein de ce genre bactérien. Ces codons optimisés respectent le biais d’usage de codons, bien connu de l’homme de l’art, spécifique à chaque souche bactérienne.
Selon un mode de réalisation particulier, le domaine Cas9 est constitué d’une protéine Cas9 entière, de préférence la protéine Cas9 de S. pyogenes ou d’une version optimisée de celle-ci.
Chacun des acides nucléiques d’un outil génétique décrit dans le présent texte, typiquement le « premier » acide nucléique et le « deuxième » ou « énième » acide nucléique dudit outil génétique, consiste en une entité distincte et se présente typiquement sous la forme d’une cassette d’expression (ou « construction ») telle que par exemple un acide nucléique comprenant au moins un promoteur transcriptionnel lié de manière opérationnelle (au sens où l’entend l’homme du métier) à une ou plusieurs séquences (codantes) d’intérêt, par exemple à un opéron comprenant plusieurs séquence codantes d’intérêt dont les produits d’expression concourent à la réalisation d'une fonction d’intérêt au sein de la bactérie, ou un acide nucléique comprenant en outre une séquence activatrice et/ou un terminateur de transcription ; ou sous la forme d’un vecteur, circulaire ou linéaire, simple ou double brin, par exemple un plasmide, un phage, un cosmide, un chromosome artificiel ou synthétique, comprenant une ou plusieurs cassettes d’expression telles que définies ci-dessus. De manière préférée, le vecteur est un plasmide.
Les acides nucléiques d’intérêt, typiquement les cassettes ou vecteurs d’expression, peuvent être construits par des techniques classiques bien connues de l’homme du métier et peuvent comporter un(e) ou plusieurs promoteurs, origines de réplication bactérienne (séquences ORI), séquences de terminaison, gènes de sélection, par exemple gènes de résistance à un antibiotique, et séquences (« régions flanquées ») permettant l’insertion ciblée de la cassette ou du vecteur. Par ailleurs, ces cassettes et vecteurs d’expression peuvent être intégrés au sein du génome bactérien par des techniques bien connues de l’homme du métier. Des séquences ORI d’intérêt peuvent être choisies parmi pIP404, rAMbI, repH (origine de réplication chez C. acetobutylicum), ColEl ou rep (origine de réplication chez E. coli), ou toute autre origine de réplication permettant le maintien du vecteur, typiquement du plasmide, au sein d’une cellule bactérienne, par exemple d’une cellule de Clostridium ou de Bacillus.
Dans le contexte de la présente invention, une séquence ORI préférée est celle présente au sein de la séquence OREP (SEQ ID NO : 126) du plasmide pNF2 (SEQ ID NO : 1 18).
Des séquences de terminaison d’intérêt peuvent être choisies parmi celles des gènes adc, thl, de l’ opéron bcs, ou de tout autre terminateur, bien connu de l’homme de l’art, permettant l’arrêt de la transcription au sein d’une cellule bactérienne, par exemple d’une cellule de Clostridium ou de Bacillus.
Des gènes de sélection (gènes de résistance) d’intérêt peuvent être choisis parmi ermB, catP, bla, tetA, tetM, et/ou tout autre gène de résistance à l’ampicilline, à l’érythromycine, au chloramphenicol, au thiamphénicol, à la spectinomycine, à la tétracycline ou à tout autre antibiotique pouvant être utilisé pour sélectionner des bactéries, par exemple du genre Clostridium ou Bacillus, bien connu de l’homme de l’art. La séquence codant l’endonucléase d’ADN, par exemple Cas9, éventuellement présente au sein de l’un des acides nucléiques d’un outil génétique selon l’invention, peut être placée sous le contrôle d’un promoteur. Ce promoteur peut être un promoteur constitutif ou un promoteur inductible. Dans un mode de réalisation préféré, le promoteur contrôlant l’expression de la nucléase est un promoteur inductible.
Des exemples de promoteurs constitutifs utilisables dans le cadre de la présente invention peuvent être sélectionnés parmi le promoteur du gène thl, du gène ptb, du gène adc, de l’opéron BCS, ou un dérivé de ceux-ci, de préférence un dérivé fonctionnel mais plus court (tronqué) tel que le dérivé « miniPthl » du promoteur du gène thl de C. acetobutylicum (Dong et al., 2012), ou tout autre promoteur, bien connu de l’homme de métier, permettant l’expression d’une protéine au sein d’une bactérie d’intérêt, par exemple d’une bactérie du genre Clostridium.
Des exemples de promoteurs inductibles utilisables dans le cadre de la présente invention peuvent être sélectionnés par exemple parmi un promoteur dont l’expression est contrôlée par le répresseur transcriptionnel TetR, par exemple le promoteur du gène telA (gène de résistance à la tétracycline originellement présent sur le transposon TnlO d’E. coli ) ; un promoteur dont l’expression est contrôlée par la L-arabinose, par exemple le promoteur du gène ptk (Zhang et al., 2015), de préférence en combinaison avec la cassette araR de régulation de l’expression de C. acetobutylicum de façon à construire un système ARAi (Zhang et al., 2015) ; un promoteur dont l’expression est contrôlée par la laminaribiose (dimère de glucose b- 1,3), par exemple le promoteur du gène celC, de préférence immédiatement suivi du gène répresseur glyR3 et du gène d’intérêt (Mearls et al. 2015) ou le promoteur du gène celC (Newcomb et al., 201 1) ; un promoteur dont l’expression est contrôlée par le lactose, par exemple le promoteur du gène bgaL (Banerjee et al., 2014) ; un promoteur dont l’expression est contrôlée par le xylose, par exemple le promoteur du gène xylB (Nariya et al., 2011) ; et un promoteur dont l’expression est contrôlée par l’exposition aux UV, par exemple le promoteur du gène ben (Dupuy et al., 2005).
Un promoteur dérivé de l’un des promoteurs décrits ci-dessus, de préférence un dérivé fonctionnel plus court (tronqué) peut également être utilisé dans le contexte de l’invention.
D’autres promoteurs inductibles utilisables dans le contexte de la présente invention sont également décrits par exemple dans les articles de Ransom et al. (2015), Currie et al. (2013) et Hartman et al. (201 1).
Un promoteur inductible préféré est un promoteur dérivé de tel A , inductible à l’anhydrotétracycline (aTc ; moins toxique que la tétracycline et capable de lever l’inhibition du répresseur transcriptionnel TetR à plus faible concentration), choisi parmi Pcm-2tet01 et Pcm-2tet02/l (Dong et al., 2012).
Un autre promoteur inductible préféré est un promoteur inductible par le lactose, par exemple le promoteur du gène bgaL (Banerjee et al., 2014).
Un acide nucléique d’intérêt particulier, typiquement une cassette ou un vecteur d’expression, comprend une ou plusieurs cassettes d’expression, chaque cassette codant un ARNg. Le terme « ARN guide » ou « ARNg » désigne au sens de l’invention une molécule d’ARN capable d’interagir avec une endonucléase d’ADN afin de la guider vers une région cible du chromosome bactérien. La spécificité de coupure est déterminée par l’ARNg. Comme expliqué précédemment, chaque ARNg comprend deux régions :
- une première région (communément appelée région « SDS »), à l’extrémité 5’ de l’ARNg, qui est complémentaire de la région chromosomique cible et qui imite l’ARNcr du système CRISPR endogène, et
- une seconde région (communément appelé région « handle »), à l’extrémité 3’ de l’ARNg, qui mime les interactions d’appariement de bases entre l’ARNtracr (« trans-activating crRNA ») et l’ARNcr du système CRISPR endogène et présente une structure double brin en tige et boucle s’achevant en 3’ par une séquence essentiellement simple brin. Cette seconde région est essentielle à la fixation de l’ARNg à l’endonucléase d’ADN.
La première région de l’ARNg (région « SDS ») varie selon la séquence chromosomique ciblée.
La région « SDS » de l’ARNg qui est complémentaire de la région chromosomique cible, comprend au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1 et 40 nucléotides. De préférence, cette région a une longueur de 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides.
La seconde région de l’ARNg (région « handle ») a une structure en tige et boucle (ou structure en épingle à cheveux). Les régions « handle » des différents ARNg ne dépendent pas de la cible chromosomique choisie.
Selon un mode de réalisation particulier, la région « handle » comprend, ou consiste en, une séquence d’au moins 1 nucléotide, de préférence au moins 1, 50, 100, 200, 500 et 1000 nucléotides, typiquement entre 1 et 1000 nucléotides. De préférence, cette région a une longueur de 40 à 120 nucléotides.
La longueur totale d’un ARNg est en général de 50 à 1000 nucléotides, de préférence de 80 à 200 nucléotides, et de manière plus particulièrement préférée de 90 à 120 nucléotides. Selon un mode de réalisation particulier, un ARNg tel qu’utilisé dans la présente invention a une longueur comprise entre 95 et 1 10 nucléotides, par exemple une longueur d’environ 100 ou d’environ 1 10 nucléotides.
L’homme du métier peut aisément définir la séquence et la structure des ARNg selon la région chromosomique à cibler en utilisant des techniques bien connues (voir par exemple l’article de DiCarlo et al., 2013).
La région/portion/séquence d’ADN ciblée au sein du génome bactérien, par exemple du chromosome bactérien, peut correspondre à une portion d’ADN non codante ou à une portion d’ADN codante.
Dans un mode de réalisation particulier consistant à modifier une séquence donnée, la portion ciblée de l’ADN bactérien est essentielle à la survie bactérienne. Elle correspond par exemple à n’importe quelle région du chromosome bactérien ou à n’importe quelle région située sur de l’ADN non chromosomique, par exemple sur un élément génétique mobile, indispensable à la survie du micro-organisme dans des conditions de croissance particulières, par exemple un plasmide contenant un marqueur de résistance à un antibiotique lorsque les conditions de croissance prévues imposent de cultiver la bactérie en présence dudit antibiotique.
Dans un autre mode de réalisation particulier visant à supprimer un élément génétique non indispensable dans les conditions de croissance particulières associées à la culture du micro-organisme, la portion ciblée de l’ADN bactérien peut correspondre à n’importe quelle région dudit ADN bactérien non chromosomique. Des exemples particuliers de portion d’ADN ciblée au sein d’une bactérie du genre Clostridium sont les séquences utilisées dans l’exemple 1 de la partie expérimentale. Il s’agit par exemple des séquences codant les gènes bdhA (SEQ ID NO : 77) et bdhB (SEQ ID NO : 78). La région/portion/séquence d’ADN ciblée est suivie d’une séquence « PAM » (« protospacer adjacent motif ») qui intervient dans la liaison à l’endonucléase d’ADN.
La région « SDS » d’un ARNg donné est identique (à 100%) ou identique à 80% au moins, de préférence à 85%, 90%, 95%, 96%, 97%, 98% ou 99% au moins à la région/portion/séquence d’ADN ciblée au sein du génome bactérien, par exemple du chromosome bactérien, et est capable de s’hybrider à tout ou partie de la séquence complémentaire de ladite région/portion/séquence, typiquement à une séquence comprenant au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1 et 40 nucléotides, de préférence à une séquence comprenant 14, 15, 16, 17, 18 ,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides.
Dans le contexte de l’invention, l’acide nucléique d’intérêt peut comprendre un ou plusieurs ARN guides (ARNg) ciblant une séquence (« séquence cible », « séquence ciblée » ou « séquence reconnue »). Ces différents ARNg peuvent cibler des régions chromosomiques, ou des régions appartenant à l’ADN bactérien non chromosomique (par exemple aux éléments génétiques mobiles) éventuellement présents au sein du microorganisme, identiques ou différentes.
Les ARNg peuvent être introduits dans la cellule bactérienne sous la forme de molécules d’ARNg (matures ou précurseurs), sous la forme de précurseurs ou sous la forme d’un ou plusieurs acides nucléiques codant lesdits ARNg. Les ARNg sont de préférence introduits dans la cellule bactérienne sous la forme d’un ou plusieurs acides nucléiques codant lesdits ARNg.
Lorsque le ou les ARNg sont introduits dans la cellule directement sous la forme de molécules d’ARN, ces ARNg (matures ou précurseurs) peuvent contenir des nucléotides modifiés ou des modifications chimiques leur permettant, par exemple, d’augmenter leur résistance aux nucléases et d’augmenter ainsi leur durée de vie dans la cellule. Ils peuvent notamment comprendre au moins un nucléotide modifié ou non naturel tel que, par exemple, un nucléotide comportant une base modifiée, telle que l'inosine, la méthyl-5- désoxycytidine, la diméthylamino-5-désoxyuridine, la désoxyuridine, la diamino-2,6-purine, la bromo-5- désoxyuridine ou toute autre base modifiée permettant l'hybridation. Les ARNg utilisés selon l’invention peuvent également être modifiés au niveau de la liaison intemucléotidique comme par exemple les phosphorothioates, les H-phosphonates ou les alkyl-phosphonates, ou au niveau du squelette comme par exemple les alpha-oligonucléotides, les 2'-0-alkyl riboses ou les PNA (Peptide Nucleic Acids) (Egholm et al., 1992).
Les ARNg peuvent être des ARN naturels, synthétiques ou produits par des techniques de recombinaison. Ces ARNg peuvent être préparés par toutes méthodes connues de l’homme du métier telles que, par exemple, la synthèse chimique, la transcription in vivo ou des techniques d’amplification.
Lorsque les ARNg sont introduits dans la cellule bactérienne sous la forme d’un ou plusieurs acides nucléiques, la ou les séquences codant le ou les ARNg sont placées sous le contrôle d’un promoteur d’expression. Ce promoteur peut être constitutif ou inductible.
Lorsque plusieurs ARNg sont utilisés, l’expression de chaque ARNg peut être contrôlée par un promoteur différent. De préférence, le promoteur utilisé est le même pour tous les ARNg. Un même promoteur peut dans un mode de réalisation particulier être utilisé pour permettre l’expression de plusieurs, par exemple de quelques-uns seulement, ou en d’autres termes de tout ou partie, des ARNg destinés à être exprimés.
Dans un mode de réalisation préféré, le/les promoteurs contrôlant l’expression du/des ARNg est/sont des promoteurs inductibles.
Des exemples de promoteurs constitutifs utilisables dans le cadre de la présente invention peuvent être sélectionnés parmi le promoteur du gène thl, du gène ptb ou de l’opéron BCS, ou un dérivé de ceux-ci, de préférence miniPthl, ou tout autre promoteur, bien connu de l’homme de métier, permettant la synthèse d’un ARN (codant ou non codant) au sein de la bactérie d’intérêt.
Des exemples de promoteurs inductibles utilisables dans le cadre de la présente invention peuvent être sélectionnés parmi le promoteur du gène tel A , du gène xylA, du gène lad, ou du gène bgaL, ou un dérivé de ceux-ci, de préférence 2tet01 ou tet02/l . Un promoteur inductible préféré est 2tet01.
Les promoteurs contrôlant l’expression de l’endonucléase d’ADN et du/des ARNg peuvent être identiques ou différents et constitutifs ou inductibles. Dans un mode de réalisation particulier et préféré, les promoteurs contrôlant respectivement l’expression de l’endonucléase d’ADN ou du/des ARNg sont des promoteurs différents mais inductibles par le même agent inducteur.
Les promoteurs inductibles tels que décrits ci-dessus permettent de maîtriser avantageusement l’action du complexe ribonucléoprotéique endonucléase d’ADN/ARNg, par exemple Cas9/ARNg, et de faciliter la sélection de transformants ayant subi les modifications génétiques souhaitées.
L’outil génétique selon l’invention peut en outre comprendre avantageusement une séquence codant au moins une protéine anti-CRISPR, i.e. une protéine capable d’inhiber ou d’empêcher/de neutraliser l’action de Cas, et/ou une protéine capable d’inhiber ou d’empêcher/de neutraliser l’action d’un système CRISPR/Cas, par exemple d’un système CRISPR/Cas de type II lorsque la nucléase est une nucléase de type Cas9. Cette séquence est typiquement placée sous le contrôle d’un promoteur inductible différent des promoteurs contrôlant l’expression de l’endonucléase d’ADN et/ou du ou des ARNg, et est inductible par un autre agent inducteur. Dans un mode de réalisation préféré, la séquence codant la protéine anti-CRISPR est par ailleurs typiquement localisée sur l’un des au moins deux acides nucléiques présents au sein de l’outil génétique. Dans un mode de réalisation particulier, la séquence codant la protéine anti-CRISPR est localisée sur un acide nucléique distinct des deux premiers (typiquement un « troisième acide nucléique »). Dans encore un autre mode de réalisation particulier, à la fois la séquence codant la protéine anti-CRISPR et la séquence codant le répresseur transcriptionnel de ladite protéine anti-CRISPR sont intégrées dans le chromosome bactérien.
Dans un mode de réalisation préféré, la séquence codant une protéine anti-CRISPR est placée, au sein de l’outil génétique, sur l’acide nucléique codant l’endonucléase d’ADN (également identifié dans le présent texte en tant que « premier acide nucléique »). Dans un autre mode de réalisation, la séquence codant une protéine anti-CRISPR est placée, au sein de l’outil génétique, sur un acide nucléique différent de celui codant l’endonucléase d’ADN, par exemple sur l’acide nucléique identifié dans le présent texte en tant que « deuxième acide nucléique » ou encore sur un « énième » (typiquement un « troisième ») acide nucléique éventuellement compris dans l’outil génétique.
La protéine anti-CRISPR est typiquement une protéine « anti-Cas9 » ou une protéine « anti-MAD7 », i.e. une protéine capable d’inhiber ou d’empêcher/de neutraliser l’action de Cas9 ou de CAS7.
La protéine anti-CRISPR est avantageusement une protéine « anti-Cas9 », par exemple sélectionnée parmi AcrlIAl, AcrIIA2, AcrIIA3, AcrIIA4, AcrIIA5, AcrlICl, AcrIIC2 et AcrIIC3 (Pawluk et al, 2018). De manière préférée la protéine « anti-Cas9 » est AcrIIA2 ou AcrIIA4. De manière encore plus préférée la protéine « anti-Cas9 » est AcrIIA4. Une telle protéine est typiquement capable de limiter très significativement, idéalement d’empêcher, l’action de Cas9, par exemple en se fixant sur l’enzyme Cas9 (Dong et al, 2017 ; Rauch et al, 2017).
Une autre protéine anti-CRISPR avantageusement utilisable est une protéine « anti-MAD7 », par exemple la protéine AcrVAl (Marino et al, 2018).
Dans un mode de réalisation préféré, la protéine anti-CRISPR est capable d’inhiber, de préférence neutraliser, l’action de l’endonucléase d’ADN, de préférence durant la phase d’introduction des séquences d’acide nucléique de l’outil génétique dans la souche bactérienne d’intérêt.
Le promoteur contrôlant l’expression de la séquence codant la protéine anti-CRISPR est de préférence un promoteur inductible. Le promoteur inductible est associé à un gène exprimé de manière constitutive, typiquement responsable de l’expression d’une protéine permettant la répression transcriptionnelle à partir dudit promoteur inductible. Ce promoteur peut être par exemple sélectionné parmi le promoteur du gène tel A , du gène xylA, du gène lacl, ou du gène bgaL, ou un dérivé de ceux-ci.
Un exemple de promoteur inductible utilisable dans le contexte de l’invention est le promoteur Pbgal (inductible au lactose) présent, au sein de l’outil génétique et sur le même acide nucléique, au côté du gène bgaR exprimé de manière constitutive et dont le produit d’ expression permet la répression transcriptionnelle à partir de Pbgal. En présence de l’agent inducteur, le lactose, la répression transcriptionnelle du promoteur Pbgal est levée, permettant la transcription du gène placé en aval de celui-ci. De manière préférée, le gène placé en aval correspond, dans le cadre de la présente invention, au gène codant la protéine anti-CRISPR, par exemple acrIIA4.
Le promoteur contrôlant l’expression de la protéine anti-CRISPR permet de maîtriser avantageusement l’action de l’endonucléase d’ADN, par exemple de l’enzyme Cas9, et d’ainsi faciliter la transformation des bactéries, par exemple des bactéries du genre Clostridium, Bacillus ou Lactobacillus , et l’obtention de transformants ayant subi les modifications génétiques souhaitées.
Dans un mode de réalisation particulier, l’invention concerne un outil génétique comprenant un vecteur plasmidique dont la séquence est celle de SEQ ID NO : 23 en tant que « premier » acide nucléique.
Dans encore un autre mode de réalisation particulier, l’invention concerne un outil génétique comprenant un vecteur plasmidique dont la séquence est sélectionnée parmi l’une des séquences SEQ ID NO : 79, SEQ ID NO : 80, SEQ ID NO : 119, SEQ ID NO : 123, SEQ ID NO : 124 et SEQ ID NO : 125 en tant que « deuxième » ou « énième » acide nucléique.
Dans encore un autre mode de réalisation particulier, l’invention concerne un outil génétique comprenant un vecteur plasmidique dont la séquence est sélectionnée parmi l’une des séquences SEQ ID NO : 119, SEQ ID NO : 123, SEQ ID NO : 124 et SEQ ID NO : 125 en tant que « acide nucléique OPT ». Dans un autre mode de réalisation particulier, l’outil génétique comprend plusieurs (par exemple au moins deux ou trois) séquences parmi SEQ ID NO : 23, 79, 80, 1 19, 123, 124 et 125, lesdites séquences étant différentes les unes des autres.
Les inventeurs décrivent des exemples d’acide nucléique d’intérêt, typiquement de séquences d’ADN d’intérêt, permettant l’expression au sein d’une bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
Dans un mode de réalisation particulier, l’expression de la séquence d’ADN d’intérêt permet à la bactérie, par exemple à la bactérie du genre Clostridium, de fermenter (typiquement simultanément) plusieurs sucres différents, par exemple au moins deux sucres différents, typiquement au moins deux sucres différents parmi les sucres comprenant 5 atomes de carbone (tels que le glucose ou le mannose) et/ou parmi les sucres comprenant 6 atomes de carbone (tels que le xylose, l’arabinose ou le fructose), de préférence au moins trois sucres différents, sélectionnés par exemple parmi glucose, xylose et mannose ; glucose, arabinose et mannose ; et glucose xylose et arabinose.
Dans un autre mode de réalisation particulier, la séquence d’ADN d’intérêt code au moins un produit d’intérêt, de préférence un produit favorisant la production de solvant par la bactérie, par exemple par la bactérie du genre Clostridium, Bacillus ou Lactobacillus, typiquement au moins une protéine d’intérêt, par exemple une enzyme ; une protéine membranaire tel qu’un transporteur ; une protéine de maturation d’autres protéines (protéine chaperonne) ; un facteur de transcription ; ou une combinaison de ceux-ci. Dans un mode de réalisation préféré, la séquence d’ADN d’intérêt favorise la production de solvant et est typiquement sélectionnée parmi une séquence codant i) une enzyme, par exemple une enzyme impliquée dans la conversion des aldéhydes en alcool, par exemple sélectionnée parmi une séquence codant une alcool déshydrogénase (par exemple une séquence sélectionnée parmi adh, adhE, adhEl, adhE2, bdhA, bdhB et bdhC), une séquence codant une transférase (par exemple une séquence sélectionnée parmi ct/A, ctfB, atoA et atoB), une séquence codant une décarboxylase (par exemple a de), une séquence codant une hydrogénase (par exemple une séquence sélectionnée parmi etfA, etfB et hydA ), et une combinaison de celles-ci, ii) une protéine membranaire, par exemple une séquence codant une phosphotransférase (par exemple une séquence sélectionnée parmi glcG, bglC, cbe4532, cbe4533, cbe4982, cbe4983, cbe0751), iii) un facteur de transcription (par exemple une séquence sélectionnée parmi sigL, sigE, sigF, sigG, sigH, sigK) et iv) une combinaison de ceux-ci.
Les inventeurs décrivent par ailleurs des exemples d’acide nucléique d’intérêt reconnaissant (liant au moins en partie), et de préférence ciblant, i.e. reconnaissant et permettant la coupure, dans le génome d’une bactérie d’intérêt, d’au moins un brin i) d’une séquence cible, ii) d’une séquence contrôlant la transcription d’une séquence cible, ou iii) d’une séquence flanquant une séquence cible.
La séquence reconnue est également identifiée dans le présent texte en tant que « séquence cible » ou « séquence ciblée ».
Un outil génétique comprenant, ou consistant en, un tel acide nucléique d’intérêt est également décrit. Dans ce cas, l’acide nucléique d’intérêt est typiquement présent au sein du « deuxième » ou « énième » acide nucléique d’un outil génétique tel que décrit dans le présent texte.
L’acide nucléique d’intérêt est utilisé typiquement dans le contexte de la présente description pour supprimer la séquence reconnue du génome de la bactérie ou pour modifier son expression, par exemple pour moduler/réguler son expression, en particulier l’inhiber, de préférence pour la modifier de manière à rendre ladite bactérie incapable d’exprimer une protéine, en particulier une protéine fonctionnelle, à partir de ladite séquence.
Lorsque la séquence cible est une séquence codant une enzyme permettant à la bactérie d’intérêt de croître dans un milieu de culture contenant un antibiotique vis-à-vis duquel elle lui confère une résistance, une séquence contrôlant la transcription d’une telle séquence ou une séquence flanquant une telle séquence, l’antibiotique est typiquement un antibiotique appartenant à la classe des amphénicols. Des exemples d’amphénicols d’intérêt dans le contexte de la présente description sont le chloramphénicol, le thiamphénicol, l’azidamfénicol et le florfénicol (Schwarz S. et al., 2004), en particulier le chloramphénicol et le thiamphénicol.
Dans un mode de réalisation particulier, l’acide nucléique d’intérêt comprend au moins une région complémentaire de la séquence cible identique à 100% ou identique à 80% au moins, de préférence à 85%, 90%, 95%, 96%, 97%, 98% ou 99% au moins à la région/portion/séquence d’ADN ciblée au sein du génome bactérien et est capable de s’hybrider à tout ou partie de la séquence complémentaire de ladite région/portion/séquence, typiquement à une séquence comprenant au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 14, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1, 10 ou 20 et 1000 nucléotides, par exemple entre 1, 10 ou 20 et 900, 800, 700, 600, 500, 400, 300 ou 200 nucléotides, entre 1, 10 ou 20 et 100 nucléotides, entre 1, 10 ou 20 et 50 nucléotides, ou entre 1, 10 ou 20 et 40 nucléotides, par exemple entre 10 et 40 nucléotides, entre 10 et 30 nucléotides, entre 10 et 20 nucléotides, entre 20 et 30 nucléotides, entre 15 et 40 nucléotides, entre 15 et 30 nucléotides ou entre 15 et 20 nucléotides, de préférence à une séquence comprenant 14, 15, 16, 17, 18 , 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides. La région complémentaire de la séquence cible présente au sein de l’acide nucléique d’intérêt peut correspondre à la région « SDS » d’un ARN guide (ARNg) utilisé dans un outil CRISPR tel que décrit dans le présent texte.
Dans un autre mode de réalisation particulier décrit, l’acide nucléique d’intérêt comprend au moins deux régions complémentaires chacune d’une séquence cible, identiques à 100% ou identiques à 80% au moins, de préférence à 85%, 90%, 95%, 96%, 97%, 98% ou 99% au moins à ladite région/portion/séquence d’ADN ciblée au sein du génome bactérien. Ces régions sont capables de s’hybrider à tout ou partie de la séquence complémentaire de ladite région/portion/séquence, typiquement à une séquence telle que décrite ci-dessus comprenant au moins 1 nucléotide, de préférence au moins 100 nucléotides, typiquement entre 100 et 1000 nucléotides. Les régions complémentaires de la séquence cible présentes au sein de l’acide nucléique d’intérêt peuvent reconnaître, de préférence cibler, les régions flanquantes en 5’ et en 3’ de la séquence ciblée dans un outil de modification génétique tel que décrit dans le présent texte, par exemple l’outil génétique ClosTron®, l’outil génétique Targetron® ou un outil d’échange allélique type ACE®.
Selon un aspect particulier, la séquence cible est une séquence codant une amphénicol-O-acetyltransférase, par exemple une chloramphénicol-O-acetyltransférase ou une thiamphénicol-O-acetyltransférase, contrôlant la transcription d’une telle séquence ou flanquant une telle séquence, au sein du génome d’une bactérie d’intérêt, par exemple du genre Clostridium, capable de croître dans un milieu de culture contenant un ou plusieurs antibiotiques appartenant à la classe des amphénicols, par exemple du chloramphénicol et/ou du thiamphénicol.
La séquence reconnue est par exemple la séquence SEQ ID NO : 18 correspondant au gène catB (CIBE 3859) codant une chloramphénicol-O-acetyltransférase de C. beijerinckii DSM 6423 ou une séquence d’acides aminés identique à au moins 70%, 75%, 80%, 85%, 90% ou 95% à ladite chloramphénicol-O-acetyltransférase, ou une séquence comprenant tout ou au moins 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de la séquence SEQ ID NO : 18. Autrement formulé, la séquence reconnue peut être une séquence comprenant au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1 et 40 nucléotides, de préférence une séquence comprenant 14, 15, 16, 17, 18 ,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides de la séquence SEQ ID NO : 18. Des exemples de séquences d’acides aminés identiques à au moins 70% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18 correspondent aux séquences identifiées dans la base de données NCBI sous les références suivantes : WP 077843937.1, SEQ ID NO : 44 (WP_063843219.1), SEQ ID NO : 45 (WP_0781 16092.1), SEQ ID NO : 46 (WP_077840383.1), SEQ ID NO : 47 (WP_077307770.1), SEQ ID NO : 48 (WPJ03699368.1), SEQ ID NO : 49 (WP_087701812.1), SEQ ID NO : 50 (WP 0172101 12.1), SEQ ID NO : 51 (WP 077831818.1), SEQ ID NO : 52 (WP 012059398.1), SEQ ID NO : 53 (WP 077363893.1), SEQ ID NO : 54 (WP 015393553.1), SEQ ID NO : 55 (WP_023973814.1), SEQ ID NO : 56 (WP_026887895.1), SEQ ID NO 57 (AWK51568.1), SEQ ID NO : 58 (WP 003359882.1), SEQ ID NO : 59 (WP 091687918.1), SEQ ID NO : 60 (WP_055668544.1), SEQ ID NO : 61 (KGK90159.1), SEQ ID NO : 62 (WP_032079033.1), SEQ ID NO : 63 (WP_029163167.1), SEQ ID NO : 64 (WP_017414356.1), SEQ ID NO : 65 (WP_073285202.1), SEQ ID NO : 66 (WP_063843220.1), et SEQ ID NO : 67 (WP_021281995.1).
Des exemples de séquences d’acides aminés identiques à au moins 75% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18 correspondent aux séquences WP 077843937.1, WP_063843219.1, WP_0781 16092.1, WP_077840383.1, WP_077307770.1, WP 103699368.1,
WP_087701812.1, WP_017210112.1, WP_077831818.1, WP_012059398.1, WP_077363893.1,
WP_015393553.1, WP_023973814.1, WP_026887895.1 AWK51568.1, WP_003359882.1,
WP 091687918.1, WP 055668544.1 et KGK90159.1.
Des exemples de séquences d’acides aminés identiques à au moins 90% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18, sont les séquences WP 077843937.1,
WP_063843219.1, WP_0781 16092.1, WP_077840383.1, WP_077307770.1, WP 103699368.1,
WP_087701812.1, WP_017210112.1, WP_077831818.1, WP_012059398.1, WP_077363893.1,
WP_015393553.1, WP_023973814.1, WP_026887895.1 et AWK51568.1.
Des exemples de séquences d’acides aminés identiques à au moins 95% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18 correspondent aux séquences WP 077843937.1, WP_063843219.1, WP_0781 16092.1, WP_077840383.1, WP_077307770.1, WP 103699368.1,
WP_087701812.1, WP_017210112.1, WP_077831818.1, WP_012059398.1, WP_077363893.1,
WP_015393553.1, WP_023973814.1, et WP_026887895.1.
Des séquences d’acides aminés préférées, identiques à au moins 99% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18, sont les séquences WP 077843937.1, SEQ ID NO : 44 (WP_063843219.1) et SEQ ID NO : 45 (WP_0781 16092.1).
Une séquence particulière identique à la séquence SEQ ID NO : 18 est la séquence identifiée dans la base de données NCBI sous la référence WP 077843937.1.
Selon un exemple particulier, la séquence cible est la séquence SEQ ID NO : 68 correspondant au gène catQ codant une chloramphénicol-O-acetyltransférase de C. perfringens dont la séquence d’acides aminés correspond à SEQ ID NO : 66 (WP 063843220.1), ou une séquence identique à au moins 70%, 75%, 80%, 85%, 90% ou 95% à ladite chloramphénicol-O-acetyltransférase, ou une séquence comprenant tout ou au moins 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de la séquence SEQ ID NO : 68.
Autrement formulé, la séquence reconnue peut être une séquence comprenant au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1 et 40 nucléotides, de préférence une séquence comprenant 14, 15, 16, 17, 18 ,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides de la séquence SEQ ID NO : 68.
Dans encore un autre exemple particulier, la séquence reconnue est sélectionnée parmi une séquence d’acide nucléique catB (SEQ ID NO : 18), catQ (SEQ ID NO 68), catD (SEQ ID NO : 69, Schwarz S. et al., 2004) ou catP (SEQ ID NO : 70, Schwarz S. et al., 2004) connue de l’homme du métier, présente naturellement au sein d’une bactérie ou introduite artificiellement dans une telle bactérie.
Comme indiqué précédemment, selon un autre exemple particulier, la séquence cible peut aussi être une séquence contrôlant la transcription d’une séquence codante telle que décrite précédemment (codant une enzyme permettant à la bactérie d’intérêt de croître dans un milieu de culture contenant un antibiotique vis- à-vis duquel elle lui confère une résistance), typiquement une séquence promotrice, par exemple la séquence promotrice (SEQ ID NO : 73) du gène catB ou celle (SEQ ID NO : 74) du gène calQ.
L’acide nucléique d’intérêt reconnaît alors, et est donc typiquement capable de se lier à une séquence contrôlant la transcription d’une séquence codante telle que décrite précédemment.
Selon un autre exemple particulier, la séquence cible peut être une séquence flanquant une séquence codante telle que décrite précédemment, par exemple une séquence flanquant le gène catB de séquence SEQ ID NO : 18 ou une séquence identique à au moins 70% à celle-ci. Une telle séquence flanquante comprend typiquement 1, 10 ou 20 et 1000 nucléotides, par exemple entre 1, 10 ou 20 et 900, 800, 700, 600, 500, 400, 300 ou 200 nucléotides, entre 1, 10 ou 20 et 100 nucléotides, entre 1, 10 ou 20 et 50 nucléotides, ou entre 1, 10 ou 20 et 40 nucléotides, par exemple entre 10 et 40 nucléotides, entre 10 et 30 nucléotides, entre 10 et 20 nucléotides, entre 20 et 30 nucléotides, entre 15 et 40 nucléotides, entre 15 et 30 nucléotides ou entre 15 et 20 nucléotides.
Selon un aspect particulier, la séquence cible correspond à la paire de séquences flanquant une telle séquence codante, chaque séquence flanquante comprenant typiquement au moins 20 nucléotides, typiquement entre 100 et 1000 nucléotides, de préférence entre 200 et 800 nucléotides.
Dans le contexte de la présente description, un exemple particulier d’acide nucléique d’intérêt, utilisé pour transformer et/ou modifier génétiquement une bactérie d’intérêt, est un fragment d’ADN i) reconnaissant une séquence codant, ii) contrôlant la transcription d’une séquence codant, ou iii) flanquant une séquence codant, une enzyme d’intérêt, de préférence une amphénicol-O-acetyltransférase, par exemple une chloramphénicol-O-acetyltransférase ou une thiamphénicol-O-acetyltransférase, au sein du génome d’une bactérie, par exemple d’une bactérie du genre Clostridium telle que décrite précédemment
Comme indiqué précédemment, un exemple d’acide nucléique d’intérêt selon l’invention est capable de supprimer la séquence (« séquence cible ») reconnue du génome de la bactérie ou de modifier son expression, par exemple de la moduler, en particulier de l’inhiber, de préférence de la modifier de manière à rendre ladite bactérie incapable d’exprimer une protéine, par exemple une amphénicol-O- acetyltransférase, en particulier une protéine fonctionnelle, à partir de ladite séquence.
Dans un mode de réalisation particulier où la séquence reconnue codant une enzyme est une séquence conférant à la bactérie une résistance au chloramphénicol et/ou au thiamphénicol, le gène de sélection utilisé n’est pas un gène de résistance au chloramphénicol et/ou au thiamphénicol, et n’est de préférence aucun des gènes catB, catQ, catD ou catP.
Dans un mode de réalisation particulier, l’acide nucléique d’intérêt comprend un ou plusieurs ARN guides (ARNg) ciblant une séquence codant, contrôlant la transcription d’une séquence codant, ou flanquant une séquence codant, une enzyme d’intérêt, en particulier une amphénicol-O-acetyltransférase, et/ou une matrice de modification (également identifiée dans le présent texte en tant que « matrice d’édition »), par exemple une matrice permettant d’éliminer ou de modifier tout ou partie de la séquence cible, de préférence dans le but d’inhiber ou supprimer l’expression de la séquence cible, typiquement une matrice comprenant des séquences homologues (correspondant) aux séquences situées en amont et en aval de la séquence cible telles que décrites précédemment, typiquement des séquences (homologues auxdites séquences situées en amont et en aval de la séquence cible) comprenant chacune entre 10 ou 20 paires de base et 1000, 1500 ou 2000 paires de base, par exemple entre 100, 200, 300, 400 ou 500 paires de base et 1000, 1200, 1300, 1400 ou 1500 paires de base, de préférence entre 100 et 1500 ou entre 100 et 1000 paires de bases, et de manière encore plus préférée entre 500 et 1000 paires de base ou entre 200 et 800 paires de base.
Dans un mode de réalisation particulier, l’acide nucléique d’intérêt utilisé pour transformer et/ou modifier génétiquement une bactérie d’intérêt, est un acide nucléique ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type Dam et Dcm (préparé à partir d’une bactérie Escherichia coli présentant le génotype dam- dcm-).
Lorsque la bactérie d’intérêt à transformer et/ou modifier génétiquement est une bactérie C. beijerinckii, en particulier appartenant à l’un des sous-clades DSM 6423, LMG 7814, LMG 7815, NRRL B-593 et NCCB 27006, l’acide nucléique d’intérêt utilisé comme outil génétique, par exemple le plasmide, est un acide nucléique ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type Dam et Dcm, typiquement un acide nucléique dont l’adénosine (« A ») du motif GATC et/ou la deuxième cytosine « C » du motif CCWGG (W pouvant correspondre à une adénosine (« A ») ou à une thymine (« T »)) sont déméthylés. Un acide nucléique ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type Dam et Dcm peut typiquement être préparé à partir d’une bactérie Escherichia coli présentant le génotype du ni dcm (par exemple Escherichia coli INV 1 10, Invitrogen). Ce même acide nucléique peut comporter d’autres méthylations réalisées par exemple par des méthyltransférases de type EcoKI, cette dernière visant les adénines (« A ») des motifs AAC(N6)GTGC et GCAC(N6)GTT (N pouvant correspondre à n’importe quel base).
Dans un mode de réalisation particulier, la séquence ciblée correspond à un gène codant une amphénicol- O-acetyltransférase par exemple une chloramphénicol-O-acetyltransférase tel que le gène catB, à une séquence contrôlant la transcription de ce gène, ou à une séquence flanquant ce gène.
Un acide nucléique d’intérêt particulier décrit par les inventeurs est par exemple un vecteur, de préférence un plasmide, par exemple le plasmide pCas9ind-Aca/2? de séquence SEQ ID NO : 21 ou le plasmide pCas9ind-gRNA_ca/2? de séquence SEQ ID NO : 38 décrit dans la partie expérimentale de la présente description (cf. exemple 2), en particulier une version de ladite séquence ne présentant pas de méthylation au niveau des motifs reconnus par les méthyltransférases de type Dam et Dcm.
La présente description concerne aussi l’utilisation d’un acide nucléique d’intérêt pour transformer et/ou modifier génétiquement une bactérie d’intérêt telle que décrite dans le présent texte.
Un autre aspect décrit par les inventeurs a trait à un procédé pour transformer, et de préférence en outre modifier génétiquement, une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, typiquement une bactérie solvantogène, en particulier une bactérie solvantogène du genre Clostridium, à l’aide d’un outil génétique selon l’invention, typiquement à l’aide d’un acide nucléique d’intérêt selon l’invention tel que décrit plus haut. Ce procédé comprend avantageusement une étape de transformation de la bactérie par introduction dans ladite bactérie de tout ou partie d’un outil génétique tel que décrit dans le présent texte, en particulier d’un acide nucléique d’intérêt décrit dans le présent texte, de préférence d’un « acide nucléique OPT » comprenant, ou consistant en, i) tout ou partie de la séquence SEQ ID NO : 126 (OREP) et ii) une séquence permetant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. Le procédé peut comprendre en outre une étape d’obtention, de récupération, de sélection ou d’isolement de la bactérie transformée, i.e. de la bactérie présentant la ou les recombinaisons/modifications/optimisations recherchées.
Dans un mode de réalisation particulier, le procédé pour transformer, et de préférence modifier génétiquement, une bactérie telle que décrite dans le présent texte, fait intervenir un outil de modification génétique par exemple un outil de modification génétique sélectionné parmi un outil CRISPR, un outil basé sur l’utilisation d’introns de type II (par exemple l’outil Targetron® ou l’outil ClosTron®) et un outil d’échange allélique (par exemple l’outil ACE®), et comprend une étape de transformation de la bactérie par introduction dans ladite bactérie d’un acide nucléique d’intérêt selon l’invention tel que décrit plus haut. La présente invention est typiquement avantageusement mise en œuvre dès lors que l’outil de modification génétique sélectionné pour transformer, et de préférence modifier génétiquement, une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, est destiné à être utilisé sur une bactérie, telle que C. beijerinckii, porteuse à l’état sauvage d’un gène codant une enzyme responsable de la résistance à un ou plusieurs antibiotiques et/ou porteuse à l’état sauvage d’au moins une séquence d’ADN extra-chromosomique, et que la mise en œuvre dudit outil génétique comprend une étape de transformation de ladite bactérie à l’aide d’un acide nucléique permettant l’expression d’un marqueur de résistance à un antibiotique auquel cette bactérie est résistante à l’état sauvage et/ou une étape de sélection des bactéries transformées et/ou modifiées génétiquement à l’aide dudit antibiotique (auquel la bactérie est résistante à l’état sauvage), de préférence de sélection parmi lesdites bactéries des bactéries ayant perdu ladite séquence d’ADN extra-chromosomique.
Une modification avantageusement réalisable grâce à la présente invention, par exemple à l’aide d’un outil de modification génétique sélectionné parmi un outil CRISPR, un outil basé sur l’utilisation d’introns de type II et un outil d’échange allélique, consiste à supprimer une séquence indésirable, par exemple une séquence codant une enzyme conférant à la bactérie la résistance à un ou plusieurs antibiotiques, ou à rendre cette séquence indésirable non fonctionnelle. Une autre modification avantageusement réalisable grâce à la présente invention consiste à modifier génétiquement une bactérie afin d’améliorer ses performances, par exemple ses performances dans la production d’un solvant ou d’un mélange de solvants d’intérêt, ladite bactérie ayant préalablement déjà été modifiée grâce à l’invention pour la rendre sensible à un antibiotique auquel elle était résistante à l’état sauvage, et/ou pour la débarrasser d’une séquence d’ADN extra chromosomique présente au sein de la forme sauvage de ladite bactérie.
Dans un mode de réalisation préféré, le procédé selon l’invention est basé sur l’utilisation de (met en œuvre) la technologie / l’outil génétique CRISPR (Clustered Regularly Interspaced Short Palindromie Repeats), en particulier l’outil génétique CRISPR/Cas (CRISPR-associated protein).
La présente invention peut être mise en œuvre à l’aide d’un outil génétique CRISPR/Cas classique utilisant un unique plasmide comprenant une nucléase, un ARNg et une matrice de réparation tel que décrit par Wang et al. (2015).
L’homme du métier peut aisément définir la séquence et la structure des ARNg selon la région chromosomique ou l’élément génétique mobile à cibler en utilisant des techniques bien connues (voir par exemple l’article de DiCarlo et al., 2013).
Les inventeurs ont mis au point et décrit un outil génétique de modification de bactéries, adapté aux bactéries du genre Clostridium, également utilisable dans le contexte de la présente invention, basé sur l’utilisation de deux plasmides (cf. WO2017/064439, Wasels et al., 2017, et Figure 15 associée à la présente description). Dans un mode de réalisation particulier, le « premier » plasmide de cet outil permet l’expression de la nucléase Cas et un « deuxième » plasmide, spécifique de la modification à effectuer, contient une ou plusieurs cassettes d’expression d’ARNg (ciblant typiquement des régions différentes de l’ADN bactérien) ainsi qu’une matrice de réparation permettant, par un mécanisme de recombinaison homologue, le remplacement d’une portion de l’ADN bactérien ciblée par Cas par une séquence d’intérêt. Le gène cas et/ou la (les) cassette(s) d’expression d’ARNg sont placés sous le contrôle de promoteurs d’expression constitutifs ou inductibles, de préférence inductibles, connus de l’homme du métier (par exemple décrits dans la demande WO2017/064439 et incorporés par référence à la présente description), et de préférence différents mais inductibles par le même agent inducteur.
Les ARNg susceptibles d’être utilisés correspondent aux ARNg tels que décrits précédemment dans le présent texte.
Un procédé particulier faisant intervenir la technologie CRISPR, susceptible d’être mis en œuvre dans le cadre de la présente invention pour transformer, et typiquement pour modifier génétiquement par recombinaison homologue, une bactérie telle que décrite dans le présent texte, comprend les étapes suivantes :
a) d’introduction dans la bactérie d’un acide nucléique ou outil génétique décrit par les inventeurs en présence d’un agent inducteur de l’expression d’une protéine anti-CRISPR, et
b) de culture de la bactérie transformée obtenue à l’issue de l’étape a) sur un milieu ne contenant pas (ou dans des conditions n’impliquant pas) l’agent inducteur de l’expression de la protéine anti-CRISPR, permettant typiquement l’expression du complexe ribonucléoprotéique endonucléase d’ADN/ARNg, typiquement Cas/ARNg (afin de stopper la production de ladite protéine anti-CRISPR et de permettre l’action de l’endonucléase).
L’agent inducteur de l’expression de la protéine anti-CRISPR est présent en quantité suffisante pour induire ladite expression. Dans le cas du promoteur Pbgal, l’agent inducteur, le lactose, permet de lever l’inhibition d’expression (répression transcriptionnelle) de la protéine anti-CRISPR liée à l’expression de la protéine BgaR.
L’agent inducteur de l’expression de la protéine anti-CRISPR est de préférence utilisé à une concentration comprise entre environ 1 mM et environ IM, de préférence entre environ 10 mM et environ 100 mM, par exemple environ 40 mM.
Dans un mode de réalisation préféré, la protéine anti-CRISPR est capable d’inhiber, de préférence neutraliser, l’action de la nucléase, de préférence durant la phase d’introduction des séquences d’acide nucléique de l’outil génétique dans la souche bactérienne d’intérêt.
Dans un mode de réalisation particulier, le procédé comprend en outre, pendant ou après l’étape b), une étape d’induction de l’expression du ou des promoteurs inductibles contrôlant l’expression de la nucléase et/ou du ou des ARN guides lorsqu’un tel ou de tels promoteurs sont présents au sein de l’outil génétique, afin de permettre la modification génétique d’intérêt de la bactérie une fois ledit outil génétique introduit dans ladite bactérie. L’induction est réalisée à l’aide d’une substance permettant de lever l’inhibition d’expression liée au promoteur inductible sélectionné.
L’étape d’induction, lorsqu’elle est présente, peut ainsi être mise en œuvre par toute méthode de culture sur un milieu permettant l’expression du complexe ribonucléoprotéique endonucléase/ARNg connue de l’homme du métier après introduction dans la bactérie cible de l’outil génétique selon l’invention. Elle est par exemple réalisée par mise en contact de la bactérie avec une substance adéquate, présente en quantité suffisante ou par exposition à la lumière UV. Cette substance permet de lever l’inhibition d’expression liée au promoteur inductible sélectionné. Lorsque le promoteur sélectionné est un promoteur inductible à l’anhydrotétracycline (aTc), choisi parmi Pcm-2tet01 et Pcm-tet02/l, l’aTc est de préférence utilisée à une concentration comprise entre environ 1 ng/ml et environ 5000 ng/ml, de préférence entre environ 10 ng/ml et 1000 ng/ml, 10 ng/ml et 800 ng/ml, 10 ng/ml et 500 ng/ml, 100 ng/ml ou 200 ng/ml et environ 800 ng/ml ou 1000 ng/ml, ou entre environ 100 ng/ml ou 200 ng/ml et environ 500 ng/ml, 600 ng/ml ou 700 ng/ml, par exemple environ 50 ng/ml, 100 ng/ml, 150 ng/ml, 200 ng/ml, 250 ng/ml, 300 ng/ml, 350 ng/ml, 400 ng/ml, 450 ng/ml, 500 ng/ml, 550 ng/ml, 600 ng/ml, 650 ng/ml, 700 ng/ml, 750 ng/ml ou 800 ng/ml.
Dans un autre mode de réalisation particulier, le procédé comprend une étape c) additionnelle d’élimination de l’acide nucléique contenant la matrice de réparation (la cellule bactérienne étant alors considérée comme « curée » dudit acide nucléique) et/ou d’élimination du/des ARNs guides ou séquences codant le/les ARNs guides introduits avec l’outil génétique lors de l’étape a).
Dans encore un autre mode de réalisation particulier, le procédé comprend une ou plusieurs étapes additionnelles, postérieure(s) à l’étape b) ou à l’étape c), d’introduction d’un énième, par exemple troisième, quatrième, cinquième, etc., acide nucléique contenant une matrice de réparation distincte de celle(s) déjà introduite(s) et d’une ou plusieurs cassettes d’expression d’ARN guides permettant l’intégration de la séquence d’intérêt contenue dans ladite matrice de réparation distincte dans une zone ciblée du génome de la bactérie, en présence d’un agent inducteur de l’expression de la protéine anti-CRISPR, chaque étape additionnelle étant suivie d’une étape de culture de la bactérie ainsi transformée sur un milieu ne contenant pas l’agent inducteur de l’expression de la protéine anti-CRISPR, permettant typiquement l’expression du complexe ribonucléoprotéique Cas/ARNg.
Dans un mode de réalisation particulier du procédé selon l’invention, la bactérie est transformée à l’aide d’un acide nucléique ou d’un outil génétique tels ceux décrits plus haut, utilisant (par exemple codant) une enzyme responsable de la coupure d’au moins un brin de la séquence cible d’intérêt, dans lequel l’enzyme est dans un mode particulier une nucléase, de préférence une nucléase de type Cas, préférentiellement sélectionnée parmi une enzyme Cas9 et une enzyme MAD7. Dans un exemple de mode de réalisation, la séquence cible d’intérêt est une séquence, par exemple le gène catB, codant une enzyme conférant à la bactérie la résistance à un ou plusieurs antibiotiques, de préférence à un ou plusieurs antibiotiques appartenant à la classe des amphénicols, typiquement une amphénicol-O-acetyltransférase telle qu’une chloramphénicol-O-acetyltransférase, une séquence contrôlant la transcription de la séquence codante ou une séquence flanquant ladite séquence codante.
Lorsqu’elle est utilisée la protéine anti-CRISPR est typiquement une protéine « anti-Cas » telle que décrite précédemment. La protéine anti-CRISPR est avantageusement une protéine « anti-Cas9 » ou une protéine « anti-MAD7 ».
Tout comme la portion d’ADN ciblée (« séquence reconnue »), la matrice d’édition/de réparation peut elle- même comprendre une ou plusieurs séquences d’acide nucléique ou portions de séquence d’acide nucléique correspondant à des séquences naturelles et/ou synthétiques, codantes et/ou non codantes. La matrice peut également comprendre une ou plusieurs séquences « étrangères », i.e. naturellement absentes du génome des bactéries appartenant au phylum des Firmicutes, en particulier au genre Clostridium, au genre Bacillus ou du genre Lactobacillus, ou du génome d’espèces particulières dudit genre. La matrice peut aussi comprendre une combinaison de séquences.
L’outil génétique utilisé dans le cadre de la présente invention permet à la matrice de réparation de guider l’incorporation au sein du génome bactérien d’un acide nucléique d’intérêt, typiquement d’une séquence ou portion de séquence d’ADN comprenant au moins 1 paire de base (pb), de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 50, 100, 1 000, 10 000, 100 000 ou 1 000 000 pb, typiquement entre 1 pb et 20 kb, par exemple 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1, 12 ou 13 kb, ou entre 1 pb et 10 kb, de préférence entre 10 pb et 10 kb ou entre 1 kb et 10 kb, par exemple entre lpb et 5 kb, entre 2 kb et 5 kb, ou encore entre 2,5 ou 3 kb et 5 kb.
Dans un mode de réalisation particulier, l’expression de la séquence d’ADN d’intérêt permet à la bactérie appartenant au phylum des Firmicutes, en particulier du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, de fermenter (typiquement simultanément) plusieurs sucres différents, par exemple au moins deux sucres différents, typiquement au moins deux sucres différents parmi les sucres comprenant 5 atomes de carbone (tels que le glucose ou le mannose) et/ou parmi les sucres comprenant 6 atomes de carbone (tels que le xylose, l’arabinose ou le fructose), de préférence au moins trois sucres différents, sélectionnés par exemple parmi glucose, xylose et mannose ; glucose, arabinose et mannose ; et glucose xylose et arabinose. Dans un autre mode de réalisation particulier, la séquence d’ADN d’intérêt code au moins un produit d’intérêt, de préférence un produit favorisant la production de solvant par la bactérie modifiée, typiquement au moins une protéine d’intérêt, par exemple une enzyme ; une protéine membranaire tel qu’un transporteur ; une protéine de maturation d’autres protéines (protéine chaperonne) ; un facteur de transcription ; ou une combinaison de ceux-ci. L’introduction dans la bactérie des éléments (acides nucléiques ou ARNg) de l’outil génétique est réalisée par toute méthode, directe ou indirecte, connue de l’homme du métier, par exemple par transformation, conjugaison, microinjection, transfection, électroporation, etc., de préférence par électroporation (Mermelstein et al, 1993).
Dans un autre mode de réalisation, le procédé selon l’invention est basé sur l’utilisation d’introns de type II, et met par exemple en œuvre la technologie / l’outil génétique ClosTron® ou l’outil génétique Targetron®.
La technologie Targetron® repose sur Tutilisation d’un intron de groupe II (basé sur Tintron Ll.ltrB de Lactococcus lactis ) reprogrammable, capable d’intégrer le génome bactérien rapidement à un locus désiré (Chen et al., 2005, Wang et al., 2013), typiquement dans le but d’inactiver un gène ciblé. Les mécanismes de reconnaissance de la zone éditée ainsi que d’insertion dans le génome par rétro-épissage sont basés sur une homologie entre Tintron et ladite zone d’une part, et sur l’activité d’une protéine (ltrA) d’autre part.
La technologie ClosTron® repose sur une approche similaire, complétée par l’ajout d’un marqueur de sélection dans la séquence de Tintron (Heap et al., 2007). Ce marqueur permet de sélectionner l’intégration de Tintron dans le génome, et facilite donc l’obtention des mutants désirés. Ce système génétique exploite également les introns de type I. En effet, le marqueur de sélection (appelé RAM pour retrotransposition- activated marker ) est interrompu par un tel élément génétique, qui empêche son expression depuis le plasmide (une description plus précise du système : Zhong et al.). L’épissage de cet élément génétique se produit avant intégration dans le génome, ce qui permet l’obtention d’un chromosome présentant une forme active du gène de résistance. Une version optimisée du système comprend des sites FLP/FRT en amont et en aval de ce gène, ce qui permet d’utiliser la recombinase FRT pour éliminer le gène de résistance (Heap et al., 2010).
Dans un autre mode de réalisation, le procédé selon l’invention est basé sur Tutilisation d’un outil d’échange allélique, et met par exemple en œuvre la technologie / l’outil génétique ACE®.
La technologie ACE® repose sur Tutilisation d’un mutant auxotrophe (pour Turacile chez C. acetobutylicum ATCC 824 par délétion du gène pyrE, qui provoque également une résistance à l’acide 5- fluoroorotique (A-5-FO) ; Heap et al., 2012). Le système utilise le mécanisme d’échange allélique, bien connu de l’homme de métier. Suite à une transformation avec un vecteur pseudo-suicide (à très faibles copies), l’intégration de ce dernier dans le chromosome bactérien par un premier évènement d’échange allélique peut être vérifiée grâce au gène de résistance présent initialement sur le plasmide. L’étape d’intégration peut être réalisée de deux manières différentes, soit au sein du locus pyrE soit au sein d’un autre locus : Dans le cas de l’intégration au locus pyrE, le gène pyrE est également placé sur le plasmide, sans toutefois être exprimé (pas de promoteur fonctionnel). La deuxième recombinaison restaure un gène pyrE fonctionnel et peut alors être sélectionnée par auxotrophie (milieu minimum, ne contenant pas d’uracile). Le gène pyrE non-fonctionnel présentant également un caractère sélectionnable (sensibilité au A-5-FO), d’autres intégrations sont ensuite envisageables sur le même modèle, en alternant successivement l’état de pyrE entre fonctionnel et non- fonctionnel.
Dans le cas de l’intégration à un autre locus, une zone génomique permettant une expression du marqueur de contre-sélection après recombinaison est ciblée (typiquement, en opéron après un autre gène, de préférence un gène fortement exprimé). Cette deuxième recombinaison est alors sélectionnée par auxotrophie (milieu minimum ne contenant pas d’uracile).
Dans les modes de réalisation décrits basés sur l’utilisation d’introns de type II, et mettant par exemple en œuvre la technologie / l’outil génétique ClosTron® ou l’outil génétique Targetron®, ou basés sur l’utilisation d’un outil d’échange allélique, et mettant par exemple en œuvre la technologie / l’outil génétique ACE®, la séquence ciblée est typiquement l’une des séquences décrites dans le présent texte.
De manière particulièrement avantageuse, les acides nucléiques et outils génétiques selon l’invention permettent l’introduction dans la bactérie de séquences d’intérêt de petites tailles aussi bien que de grandes tailles, en une étape, i.e. à l’aide d’un seul acide nucléique (typiquement « l’acide nucléique OPT » ou le « deuxième » ou « énième » acide nucléique d’un outil tel que décrit dans le présent texte) ou en plusieurs étapes, i.e. à l’aide de plusieurs acides nucléiques (typiquement le « deuxième » ou les « énième » acides nucléiques tels que décrits dans le présent texte), de préférence en une étape.
Dans un mode de réalisation particulier de l’invention, les acides nucléiques et outils génétiques selon l’invention permettent de supprimer une portion ciblée de l’ADN bactérien ou de la remplacer par une séquence plus courte (par exemple par une séquence ayant perdu au moins une paire de bases) et/ou non fonctionnelle. Dans un mode de réalisation particulier préféré de l’invention, les acides nucléiques et outils génétiques selon l’invention permettent avantageusement d’introduire dans la bactérie, par exemple dans le génome bactérien, un acide nucléique d’intérêt comprenant au moins une paire de base, et jusqu’à 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1, 12, 13, 14, ou 15 kb.
Un autre objet de l’invention concerne une bactérie transformée et/ou génétiquement modifiée, typiquement une bactérie appartenant au phylum des Firmicutes, et appartenant par exemple au genre Clostridium, au genre Bacillus ou au genre Lactobacillus , typiquement une bactérie solvantogène, de préférence une bactérie appartenant à une espèce ou correspondant à l’un des sous-clades décrits par les inventeurs dans le présent texte ou obtenue à l’aide d’un procédé tel que décrit par les inventeurs dans le présent texte, ainsi que toute bactérie dérivée, clone, mutant ou version génétiquement modifiée de celle-ci, et leurs utilisations. Un exemple de bactérie ainsi transformée et/ou génétiquement modifiée grâce à l’invention est une bactérie n’exprimant plus une enzyme lui conférant la résistance à un ou plusieurs antibiotiques, en particulier une bactérie n’exprimant plus une amphénicol-O-acetyltransférase, par exemple une bactérie exprimant à l’état sauvage le gène catB, et dépourvue dudit gène catB ou incapable d’exprimer ledit gène catB une fois transformée et/ou génétiquement modifiée grâce à l’invention. La bactérie ainsi transformée et/ou génétiquement modifiée grâce à l’invention est rendue sensible à un amphénicol, par exemple à un amphénicol tel que décrit dans le présent texte, en particulier au chloramphénicol ou au thiamphénicol.
Un exemple particulier de bactérie génétiquement modifiée préférée selon l’invention est la bactérie identifiée dans la présente description en tant que C. beijerinckii IFP962 AcatB telle qu’enregistrée sous le numéro de dépôt LMG P-31 151 auprès de la Belgian Co-ordinated Collections of Micro-organisms (« BCCM », K.L. Ledeganckstraat 35, B-9000 Gent - Belgique) le 6 décembre 2018.
Un autre exemple particulier de bactérie génétiquement modifiée préférée selon l’invention est la bactérie identifiée dans la présente description en tant que C. beijerinckii est une souche C. beijerinckii IFP963 AcatB ApNF2 telle qu’enregistrée sous le numéro de dépôt LMG P-31277 auprès de la collection BCCM- LMG le 20 février 2019.
La description concerne également toute bactérie dérivée, clone, mutant ou version génétiquement modifiée de l’une desdites bactéries, par exemple toute bactérie dérivée, clone, mutant ou version génétiquement modifiée restant sensible à un amphénicol tel que le thiamphénicol et/ou le chloramphénicol, typiquement une bactérie dépourvue du gène catB de séquence SEQ ID NO : 18 et du plasmide pNF2.
Selon un mode de réalisation particulier, la bactérie transformée et/ou génétiquement modifiée selon l’invention, par exemple la bactérie C. beijerinckii IFP962 AcatB ou la bactérie C. beijerinckii IFP963 AcatB ApNF2, est encore susceptible d’être transformée, et de préférence modifiée génétiquement. Elle peut l’être à l’aide d’un acide nucléique, par exemple d’un plasmide tel que décrit dans la présente description, par exemple dans la partie expérimentale. Un exemple d’acide nucléique susceptible d’être avantageusement utilisé est le plasmide pCas9aCr de séquence SEQ ID NO : 23 (décrit dans la partie expérimentale de la présente description) ou encore un plasmide sélectionné parmi pCas9md (SEQ ID NO : 22), pCas9Cond (SEQ ID NO : 133) et pMAD7 (SEQ ID NO : 134).
Un aspect particulier de l’invention concerne en effet l’utilisation d’une bactérie modifiée génétiquement décrite dans le présent texte, de préférence la bactérie C. beijerinckii IFP962 AcatB (également identifiée dans le présent texte en tant que C. beijerinckii DSM 6423 AcatB ) déposée sous le numéro LMG P-31 151, de manière encore plus préférée la bactérie C. beijerinckii IFP963 AcatB ApNF2 déposée sous le numéro LMG P-31277, ou d’une version génétiquement modifiée de l’une de celles-ci, par exemple à l’aide de l’un des acides nucléiques, outils génétiques ou procédés décrits dans le présent texte, pour produire, grâce à l’expression du ou des acides nucléiques d’intérêt introduits volontairement dans son génome, un ou plusieurs solvants, de préférence au moins l’isopropanol, de préférence à l’échelle industrielle. L’invention concerne aussi un kit (trousse) comprenant (i) un acide nucléique tel que décrit dans le présent texte, par exemple « un acide nucléique OPT » ou un fragment d’ADN reconnaissant une séquence cible dans une bactérie appartenant au phylum des Firmicutes telle que décrite dans le présent texte, et (ii) au moins un outil, de préférence plusieurs outils, sélectionné(s) parmi les éléments d’un outil de modification génétique tel que décrit dans le présent texte permettant de transformer, et typiquement modifier génétiquement une telle bactérie, en vue de produire un variant amélioré de ladite bactérie; un acide nucléique en tant qu’ARNg ; un acide nucléique en tant que matrice de réparation ; un « acide nucléique OPT » ; au moins une paire d’amorces, par exemple une paire d’amorces telle que décrite dans le contexte de la présente invention ; et un inducteur permettant l’expression d’une protéine codée par ledit outil, par exemple d’une nucléase de type Cas9 ou MAD7.
L’outil de modification génétique pour transformer, et typiquement modifier génétiquement une bactérie appartenant au phylum des Firmicutes telle que décrite dans le présent texte, peut-être par exemple sélectionné parmi un « acide nucléique OPT », un outil CRISPR, un outil basé sur l’utilisation d’introns de type II et un outil d’échange allélique, comme expliqué plus haut.
Dans un mode de réalisation particulier, le kit comprend tout ou partie des éléments d’un outil génétique tel que décrit dans le présent texte.
Un kit particulier pour transformer, et de préférence modifier génétiquement, une bactérie appartenant au phylum des Firmicutes telle que décrite dans le présent texte, ou pour produire au moins un solvant, par exemple un mélange de solvants, à l’aide d’une telle bactérie, comprend un acide nucléique comprenant, ou consistant en, i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie ; ainsi que au moins un inducteur adapté au promoteur inductible de l’expression de la protéine anti-CRISPR sélectionné utilisé au sein d’un outil génétique décrit dans le présent texte.
Le kit peut en outre comprendre un ou plusieurs inducteurs adaptés au(x) promoteur(s) inductible(s) sélectionné(s) éventuellement utilisé(s) au sein de l’outil génétique pour contrôler l’expression de la nucléase utilisée et/ou d’un ou de plusieurs ARN guides.
Un kit particulier selon l’invention permet l’expression d’une nucléase comprenant une étiquette (ou «tag»). Les kits selon l’invention peuvent en outre comprendre un ou plusieurs consommables tels qu’un milieu de culture, au moins une bactérie compétente appartenant au phylum des Firmicutes telle que décrite dans le présent texte, par exemple une bactérie du genre Clostridium, Bacillus ou Lactobacillus , (i.e. conditionnée en vue de la transformation), au moins un ARNg, une nucléase, une ou plusieurs molécules de sélection, ou encore une notice explicative.
La description concerne également l’utilisation d’un kit selon l’invention, ou de l’un ou de plusieurs des éléments de ce kit, pour la mise en œuvre d’un procédé décrit dans le présent texte de transformation, et idéalement de modification génétique, d’une bactérie appartenant au phylum des Firmicutes telle que décrite dans le présent texte, par exemple une bactérie du genre Clostridium, Bacillus ou Lactobacillus (par exemple la bactérie C. beijerinckii IFP962 AcatB déposée sous le numéro LMG P-31 151), de préférence une bactérie possédant à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique (typiquement un plasmide naturel), de manière préférée entre toute de la bactérie C. beijerinckii IFP963 AcatB ApNF2 déposée sous le numéro LMG P-31277, et/ou pour la production de solvant(s) ou de biocarburant(s), ou de mélanges de ceux-ci, de préférence à l’échelle industrielle, à l’aide d’une telle bactérie.
Des solvants susceptibles d’être produits sont typiquement l’acétone, le butanol, l’éthanol, l’isopropanol ou un mélange de ceux-ci, typiquement un mélange éthanol/isopropanol, butanol/isopropanol, ou éthanol/butanol, de préférence un mélange isopropanoPbutanol.
L’utilisation de bactéries transformées selon l’invention permet typiquement la production par an à l’échelle industrielle d’au moins 100 tonnes d’acétone, d’au moins 100 tonnes d’éthanol, d’au moins 1000 tonnes d’isopropanol, d’au moins 1800 tonnes de butanol, ou d’au moins 40 000 tonnes d’un mélange de ceux-ci.
Les exemples et figures ci-après ont pour but d’illustrer plus pleinement l’invention sans pour autant en limiter la portée.
FIGURES
[Fig 1] La Figure 1 représente le système CRISPR/Cas9 utilisé pour l’édition du génome en tant qu’ outil génétique permettant de créer, à l’aide de la nucléase Cas9, une ou des coupures double brin dans l’ADN génomique dirigée(s) par l’ARNg.
ARNg, ARN guide ; PAM, Protospacer Adjacent Motif. Figure modifiée depuis Jinek et al, 2012.
[Fig 2] La Figure 2 représente la réparation par recombinaison homologue d’une coupure double brin induite par Cas9. PAM, Protospacer Adjacent Motif.
[Fig 3] La Figure 3 représente l’utilisation de CRISPR/Cas9 chez Clostridium.
ermB, gène de résistance à lérythromycine ; catP (SEQ ID NO : 70), gène de résistance au thiamphénicoPchloramphenicol ; tetR, gène dont le produit d’expression réprime la transcription à partir de Pcm-tet02/l ; Pcm-2tet01 et Pcm-tet02/l, promoteurs inductibles à l’anhydrotétracycycline, « aTc » (Dong et al., 2012) ; miniPthl, promoteur constitutif (Dong et al., 2012).
[Fig 4] La Figure 4 représente la carte du plasmide pCas9aCr (SEQ ID NO : 23).
ermB, gène de résistance à l’érythromycine ; rep, origine de réplication chez E. coli ; repH, origine de réplication chez C. acetobutylicum ; Tthl, terminateur thiolase ; miniPthl, promoteur constitutif (Dong et al., 2012) ; Pcm-tet02/l, promoteur réprimé par le produit de tetR et inductible par l’anhydrotétracycline, « aTc » (Dong et al., 2012) ; Pbgal, promoteur réprimé par le produit de lacR et inductible par le lactose (Hartman et al., 201 1) ; acrIIA4, gène codant la protéine anti-CRISPR AcrII14 ; bgaR, gène dont le produit d’expression réprime la transcription à partir de Pbgal. [Fig 5] La Figure 5 représente le taux de transformation relatifs de C. acetobutylicum DSM 792 contenant pCas9md (SEQ ID NO : 22) ou pCas9aCT (SEQ ID N : 23). Les fréquences sont exprimées en nombre de transformants obtenus par pg d’ADN utilisé lors de la transformation, rapportées aux fréquences de transformation de pEC750C (SEQ ID NO : 106), et représentent les moyennes d’au moins deux expériences indépendantes.
[Fig 6] La Figure 6 représente l’induction du système CRISPR/Cas9 chez des transformants de la souche DSM 792 contenant pCas9aCT et un plasmide d’expression de l’ARNg ciblant bdhB, avec (SEQ ID NO : 79 et SEQ ID NO : 80) ou sans (SEQ ID NO : 105) matrice de réparation. Em, érythromycine ; Tm, thiamphénicol ; aTc, anhydrotétracycline ; ND, non dilué.
[Fig 7A] La Figure 7 représente la modification du locus bdh de C. acetobutylicum DSM792 via le système CRISPR/Cas9. La figure 7A représente l’organisation génétique du locus bdh. Les homologies entre matrice de réparation et ADN génomique sont mises en évidence à l’aide de parallélogrammes gris clair. Les sites d’hybridation des amorces VI et V2 sont également représentés.
[Fig 7B] La Figure 7 représente la modification du locus bdh de C. acetobutylicum DSM792 via le système CRISPR/Cas9. La figure 7B représente l’amplification du locus bdh à l’aide des amorces VI et V2. M, marqueur de taille 2-log (NEB) ; P, plasmide pGRNA -AbdhAAbdhB ; WT, souche sauvage.
[Fig 8] La Figure 8 représente le classement de 30 souches de Clostridium solvantogènes, d’après Poehlein et al., 2017. A noter que le sous-clade C. beijerinckii N R RL B-593 est également identifié dans la littérature en tant que C. beijerinckii DSM 6423.
[Fig 9] La Figure 9 représente la Carte du plasmide pCas9ind -AcatB
[Fig 10] La Figure 10 représente la Carte du plasmide pCas9acr
[Fig 1 1] La Figure 11 représente la Carte du plasmide pEC750S-iyy;HR
[Fig 12] La Figure 12 représente la Carte du plasmide p EX -A 2 -g R N A - upp.
[Fig 13] La Figure 13 représente la Carte du plasmide pEC750S-Dmpp .
[Fig 14] La Figure 14 représente la Carte du plasmide pEC150C-Aupp
[Fig 15] La Figure 15 représente la Carte du pGRNA-pNF2
[Fig 16] La Figure 16 représente l’Amplification PCR du gène catB dans les clones issus de la transformation bactérienne de la souche C. beijerinckii DSM 6423.
Amplification d’environ 1,5 kb si la souche possède encore le gène catB, ou d’environ 900 pb si ce gène est délété.
[Fig 17] La Figure 17 représente la Croissance des souches C. beijerinckii DSM 6423 WT et AcatB sur milieu 2YTG et milieu sélectif 2YTG thiamphénicol.
[Fig 18] La Figure 18 représente l’Induction du système CRISPR/Cas9acr chez des transformants de la souche C. beijerinckii DSM 6423 contenant pCas9acr et un plasmide d’expression de l’ARNg ciblant upp, avec ou sans matrice de réparation. Légende : Em, érythromycine ; Tm, thiamphénicol ; aTc, anhydrotétracycline ; ND, non dilué. [Fig 19A] La Figure 19 représente la Modification du locus upp de C. beijerinckii DSM 6423 via le système CRISPR/Cas9. La Figure 19A représente l’organisation génétique du locus upp : gènes, site cible de l’ARNg et matrices de réparation, associées aux régions d’homologies correspondantes sur l’ADN génomique. Les sites d’hybridation des amorces pour la vérification par PCR (RHO 10 et RHO 1 1) sont également indiqués.
[Fig 19B] La Figure 19 représente la Modification du locus upp de C. beijerinckii DSM 6423 via le système CRISPR/Cas9. La Figure 19B représente l’amplification du locus upp à l’aide des amorces RH010 et RH01 1. Une amplification de 1680 pb est attendue dans le cas d’un gène sauvage, contre 1090 pb pour un gène upp modifié. M, marqueur de taille 100 bp - 3 kb (Lonza) ; WT, souche sauvage.
[Fig 20] La Figure 20 représente l’Amplification PCR vérifiant la présence du plasmide pCas9md. dans la souche C. beijerinckii 6423 AcatB.
[Fig 21] La Figure 21 représente l’Amplification PCR (—900 pb) vérifiant la présence ou non du plasmide naturel pNF2 avant induction (contrôle positif 1 et 2) puis après induction sur milieu contenant de l’aTc du système CRISPR-Cas9.
[Fig 22] La Figure 22 représente l’Outil génétique de modification de bactéries, adapté aux bactéries du genre Clostridium, basé sur l’utilisation de deux plasmides (cf. WO2017/064439, Wasels et al., 2017).
[Fig 23] La Figure 23 représente la Carte du plasmide pCas9ind-gRNA_ca/2?.
[Fig. 24] La figure 24 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) pour 20 pg de plasmide pCas9md dans la souche de C. beijerinckii DSM6423. Les barres d’erreur représentent l’erreur standard de la moyenne pour un triplicat biologique.
[Fig. 25] La figure 25 représente la carte du plasmide pNF3.
[Fig. 26] La figure 26 représente la carte du plasmide pEC751 S.
[Fig. 27] La figure 27 représente la carte du plasmide pNF3S.
[Fig. 28] La figure 28 représente la carte du plasmide pNF3E.
[Fig. 29] La figure 29 représente la carte du plasmide pNF3C.
[Fig. 30] La figure 30 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) du plasmide pCas9md dans trois souches de C. beijerinckii DSM 6423. Les barres d’erreur correspondent à l’écart standard de la moyenne pour un duplicat biologique.
[Fig. 31] La figure 31 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) du plasmide pEC750C dans deux souches dérivées de C. beijerinckii DSM 6423. Les barres d’erreur correspondent à l’écart standard de la moyenne pour un duplicat biologique.
[Fig. 32] La figure 32 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) des plasmides pEC750C, pNF3C, pFWOl et pNF3E dans la souche C. beijerinckii IFP963 AcatB ApNF2. Les barres d’erreur correspondent à l’écart standard de la moyenne pour un triplicat biologique.
[Fig. 33] La figure 33 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) des plasmides pFWOl, pNF3E et pNF3S dans la souche C. beijerinckii NCIMB 8052. EXEMPLES
EXEMPLE n°l
Matériels et méthodes
Conditions de culture
C. acetobutylicum DSM 792 a été cultivée en milieu 2YTG (Tryptone 16 g.l-1, extrait de levure 10 g.l-1, glucose 5 g.l-1, NaCl 4 g.l-1). E. coli NEB 10B a été cultivée en milieu LB (Tryptone 10 g.l-1, extrait de levure 5 g.l-1, NaCl 5 g.l-1). Les milieux solides ont été réalisés en ajoutant 15 g.l-1 d’agarose aux milieux liquides. De l'érythromycine (à des concentrations de 40 ou 500 mg.l-1 respectivement en milieu 2YTG ou LB), du chloramphénicol (25 ou 12,5 mg.l-1 respectivement en LB solide ou liquide) et du thiamphénicol (15 mg.l-1 en milieu 2YTG) ont été utilisés lorsque nécessaire.
Manipulation des acides nucléiques
Toutes les enzymes et kits utilisés l’ont été en suivant les recommandations des fournisseurs.
Construction des plasmides
Le plasmide pCas9aCT (SEQ ID NO : 23), présenté en Figure 4, a été construit en clonant le fragment (SEQ ID NO : 81) contenant bgaR et acrIIA4 sous le contrôle du promoteur Pbgal synthétisé par Eurofins Genomics au niveau du site Sacl du vecteur pCas9md (Wasels et al, 2017).
Le plasmide pGRNAmd (SEQ ID NO : 82) a été construit en clonant une cassette d’expression (SEQ ID NO : 83) d’un ARNg sous contrôle du promoteur Pcm-2tet01 (Dong et al, 2012) synthétisée par Eurofins Genomics au niveau du site Sacl du vecteur pEC750C (SEQ ID NO : 106) (Wasels et al, 2017).
Les plasmides pGRNA-xylB (SEQ ID NO : 102), pGRNA-xylR (SEQ ID NO : 103), pGRNA-glcG (SEQ ID NO : 104) et pGRNA-bdhB (SEQ ID NO : 105) ont été construits en clonant les couples d’amorces respectifs 5’-TCATGATTTCTCCATATTAGCTAG-3’ et 5’-AAACCTAGCTAATATGGAGAAATC- 3’, 5’ -TCAT GTTAC ACTT GGAAC AGGCGT - 3’ et 5’ - AAACACGCCT GTTCCAAGTGTAAC-3’ , 5’- TCATTTCCGGCAGTAGGATCCCCA-3’ et 5’-AAACTGGGGATCCTACTGCCGGAA-3’, 5’- TCATGCTTATTACGACATAACACA-3’ et 5’-AAACTGTGTTATGTCGTAATAAGC-3’ au sein du plasmide pGRNAmd (SEQ ID NO : 82) digéré par Bsal.
Le plasmide pGRNA-DM/td (SEQ ID NO : 79) a été construit en clonant le fragment d’ADN obtenu par assemblage par PCR chevauchante des produits PCR obtenus avec les amorces 5’- ATGCATGGATCCAAACGAACCCAAAAAGAAAGTTTC-3’ et 5’-
GGTTGATTTCAAATCTGTGTAAACCTACCG-3’ d’une part, 5’-
ACACAGATTTGAAATCAACCACTTTAACCC-3’ et 5’- ATGCATGTCGACTCTTAAGAACATGTATAAAGTATGG-3’ d’autre part, dans le vecteur pGRNA- bdhB digéré par Barri H I et Sacl.
Le plasmide pGKN A- AbdhAAbdhB (SEQ ID NO : 80) a été construit en clonant le fragment d’ADN obtenu par assemblage par PCR chevauchante des produits PCR obtenus avec les amorces 5’- ATGCATGGATCCAAACGAACCCAAAAAGAAAGTTTC-3’ et 5’-
GCTAAGTTTTAAATCTGTGTAAACCTACCG-3’ d’une part, 5’-
ACACAGATTTAAAACTTAGCATACTTCTTACC-3’ et 5’-
ATGCATGTCGACCTTCTAATCTCCTCTACTATTTTAG -3’ d’autre part, dans le vecteur pGRNA- bdhB digéré par BamHI et Sacl.
Transformation
C. acetobutylicum DSM 792 a été transformée selon le protocole décrit par Mermelstein et al, 1993. La sélection de transformants de C. acetobutylicum DSM 792 contenant déjà un plasmide d’expression de Cas9 (pCas9md ou pCas9aCr) transformés avec un plasmide contenant une cassette d’expression d’un ARNg a été réalisée sur milieu 2YTG solide contenant de l’érythromycine (40 mg.l-1), du thiamphénicol (15 mg.l 1 ) et du lactose (40 nM).
Induction de l’expression de cas9
L’induction de l’expression de cas9 a été réalisée via la croissance des transformants obtenus sur un milieu 2YTG solide contenant de l’érythromycine (40 mg.l-1), du thiamphénicol (15 mg.l-1) et l’agent inducteur de l’expression de cas9 et de l’ARNg, l’aTc (1 mg.l-1).
Amplification du locus bdh
Le contrôle de l’édition du génome de C. acetobutylicum DSM 792 au niveau du locus des gènes bdh A et bdhB a été réalisé par PCR à l’aide de l’enzyme Q5® High-Fidelity DNA Polymerase (NEB) à l’aide des amorces VI (5’-ACACATTGAAGGGAGCTTTT-3’) et V2 (5’- GGCAAC AAC AT CAGGCCTTT-3’ ) .
Résultats
Efficacité de transformation
Afin d’évaluer l’impact de l’insertion du gène acrIIA4 sur la fréquence de transformation du plasmide d’expression de cas9, différents plasmides d’expression d’ARNg ont été transformés dans la souche DSM 792 contenant pCas9md (SEQ ID NO : 22) ou pCas9aCT (SEQ ID NO : 23), et les transformants ont été sélectionnés sur un milieu supplémenté en lactose. Les fréquences de transformations obtenues sont présentées en Figure 5. Génération de mutants AbdhB et AbdhAAbdhB
Le plasmide de ciblage contenant la cassette d’expression de l’ARNg ciblant bdhB (pGRNA-bdhB - SEQ ID NO : 105) ainsi que deux plasmides dérivés contenant des matrices de réparation permettant la délétion du gène bdhB seul (pGRNA-AM/zR - SEQ ID NO : 79) ou des gènes bdhA et bdhB (pGRNA -AbdhAAbdhB - SEQ ID NO : 80) ont été transformés dans la souche DSM 792 contenant pCas9md (SEQ ID NO : 22) ou pCas9acr (SEQ ID NO : 23). Les fréquences de transformation obtenues sont présentées dans le Tableau 2 : [Tableau 2]
Fréquences de transformation de la souche DSM 792 contenant pCas9md ou pCas9aCT avec des plasmides ciblant bdhB. Les fréquences sont exprimées en nombre de transformants obtenus par pg d’ADN utilisé lors de la transformation, et représentent les moyennes d’au moins deux expériences indépendantes.
Les transformants obtenus ont subi une phase d’induction de l’expression du système CRISPR/Cas9 via un passage sur milieu supplémenté en anhydrotétracycline, aTc (Figure 6).
Les modifications désirées ont été confirmées par PCR sur l’ADN génomique de deux colonies résistantes à l’aTc (Figure 7).
Conclusions
L’outil génétique basé sur CRISPR/Cas9 décrit dans Wasels et al. (2017) utilise deux plasmides :
- le premier plasmide, pCas9md, contient cas9 sous contrôle d’un promoteur inductible à TaTc, et
- le deuxième plasmide, dérivé de pEC750C, contient la cassette d’expression d’un ARNg (placé sous le contrôle d’un second promoteur inductible à l’aTc) ainsi qu’une matrice d’édition permettant de réparer la cassure double brin induite par le système.
Cependant, les inventeurs ont observé que certains ARNg semblaient encore être trop toxiques, malgré le contrôle de leur expression ainsi que de celle de Cas9 à l’aide de promoteurs inductibles à l’aTc, limitant en conséquence l’efficacité de transformation des bactéries par l’outil génétique et donc la modification du chromosome.
Afin d’améliorer cet outil génétique, le plasmide d’expression de cas9 a été modifié, via l’insertion d’un gène anti-CRISPR, acrIIA4, sous contrôle d’un promoteur inductible au lactose. Les efficacités de transformation de différents plasmides d’expression d’ARNg ont ainsi pu être améliorées de manière très significative, permettant l’obtention de transformants pour tous les plasmides testés.
Il a également été possible de réaliser l’édition du locus bdhB au sein du génome de C. acetobutylicum DSM 792, à l’aide de plasmides qui n’avaient pas pu être introduits dans la souche DSM 792 contenant pCas9md. Les fréquences de modification observées sont les mêmes que celles observées précédemment (Wasels et al, 2017), avec 100% des colonies testées modifiées.
En conclusion, la modification du plasmide d’expression de cas9 permet un meilleur contrôle du complexe ribonucléoprotéique Cas9-ARNg, facilitant avantageusement l’obtention de transformants dans lesquels l’action de Cas9 peut être déclenchée afin d’obtenir des mutants d’intérêt.
EXEMPLE n°2
Matériels et méthodes
Conditions de culture
C. beijerinckn DSM 6423 a été cultivée en milieu 2YTG (Tryptone 16 g L-1, extrait de levure 10 g L-1, glucose 5 g L-1, NaCl 4 g L-1). E. coli NEB 10-beta et INV1 10 ont été cultivées en milieu LB (Tryptone 10 g L-1, extrait de levure 5 g L-1, NaCl 5 g L-1). Les milieux solides ont été réalisés en ajoutant 15 g L-1 d’agarose aux milieux liquides. De l'érythromycine (à des concentrations de 20 ou 500 mg L-1 respectivement en milieu 2YTG ou LB), du chloramphénicol (25 ou 12,5 mg L-1 respectivement en LB solide ou liquide), du thiamphénicol (15 mg L-1 en milieu 2YTG) ou de la spectinomycine (à des concentrations de 100 ou 650 mg L-1 respectivement en milieu LB ou 2YTG) ont été utilisés si nécessaire.
Acides nucléiques et vecteurs plasmidiques
Toutes les enzymes et kits utilisés l’ont été en suivant les recommandations des fournisseurs.
Les tests de PCR sur colonie ont respecté le protocole suivant :
Une colonie isolée de C. beijerinckii DSM 6423 est resuspendue dans 100 pL de Tris 10 mM pH 7,5 EDTA 5 mM. Cette solution est chauffée à 98 °C pendant 10 min sans agitation. 0,5 pL de ce lysat bactérien peuvent alors être utilisés comme matrice de PCR dans des réactions de 10 pL avec la Phire (Thermo Scientific), la Phusion (Thermo Scientific), la Q5 (NEB) ou la KAPA2G Robust (Sigma-Aldrich) polymerase.
La liste des amorces ayant servies à l’ensemble des constructions (nom/séquence d’ADN) est détaillée ci- dessous :
AcatB fwd : TGTTATGGATTATAAGCGGCTCGAGGACGTCAAACCATGTTAATCATTGC AcatB rev : AATCTATCACTGATAGGGACTCGAGCAATTTCACCAAAGAATTCGCTAGC ca -gN -e :
AAT CT AT C ACT GATAGGGACT CGAGGGGCAAAAGT GTAAAGAC AAGCTT C RH076 : CATATAATAAAAGGAAACCTCTTGATCG
RH077 : ATTGCCAGCCTAACACTTGG
RH001 : ATCTCCATGGACGCGTGACGTCGACATAAGGTACCAGGAATTAGAGCAGC
RH002 : TCTATCTCCAGCTCTAGACCATTATTATTCCTCCAAGTTTGCT
RH003 : ATAATGGTCTAGAGCTGGAGATAGATTATTTGGTACTAAG
RH004 : TATGACCATGATTACGAATTCGAGCTCGAAGCGCTTATTATTGCATTAGC pEX-fwd : C AG ATT GTACT GAGAGT GC ACC
pEX-rev : GT GAGCGGATAACAATTT CAC AC
pEC750C-fwd : CAATATTCCACAATATTATATTATAAGCTAGC
M13-rev : CAGGAAAC AGCT AT GAC
RHO 10 : CGGATATTGCATTACCAGTAGC
RHO 11 : TT AT C AAT CT CTTAC ACAT GGAGC
RH025 : TAGTATGCCGCCATTATTACGACA
RH 134 : GT CGACGT GGAATT GT GAGC
pNF2_fwd : GGGCGCACTTATACACCACC
pNF2_rev : TGCTACGCACCCCCTAAAGG
RH021 : ACTTGGGTCGACCACGATAAAACAAGGTTTTAAGG
RH022 : TACCAGGGATCCGTATTAATGTAACTATGATATCAATTCTTG
aad9-fwd2 : ATGCATGGTCCCAATGAATAGGTTTACACTTACTTTAGTTTTATGG aad9-rev : ATGCGAGTTAACAACTTCTAAAATCTGATTACCAATTAG
RH031 : ATGCATGGATCCCAATGAATAGGTTTACACTTACTTTAGTTTTATGG
RH032 : AT GCG AGAGCT C AACTT CTAAAAT CT GATTACC AATTAG
RH138 : AT GCAT GGAT CCGT CT GACAGTTACC AGGTCC
RH 139 : AT GCG AGAGCTCC AATT GTT CAAAAAAATAAT GGCGGAG
RH 1 AT ATGCATGGATCCCGGCAGTTTTTCTTTTTCGG
RH141 ATGCGAGAGCTCGGTTAAATACTAGTTTTTAGTTACAGAC
Les vecteurs plasmidiques suivants ont été préparés :
- Plasmide N° 1 : pEX-A258-Aca/£ (SEQ ID NO : 17)
Il contient le fragment d’ADN synthétisé AcatB cloné dans le plasmide pEX-A258. Ce fragment AcatB comprend i) une cassette d’expression d’un ARN guide ciblant le gène catB (gène de résistance au chloramphénicol codant une chloramphénicol-O-acetyltransférase - SEQ ID NO : 18) de C. beijerinckii DSM6423 sous le contrôle d’un promoteur inductible à l’anhydrotetracycline (cassette d’expression : SEQ ID NO : 19), et ii) une matrice d’édition (SEQ ID NO : 20) comprenant 400 pb homologues situées en amont et en aval du gène catB.
- Plasmide N°2 : pCas9ind-AcatB (cf. Figure 9 et SEQ ID NO : 21)
Il contient le fragment AcatB amplifié par PCR (amorces AcatB fwd et AcatB rev) et cloné dans le pCas9ind (décrit dans la demande de brevet WO2017/064439 - SEQ ID NO : 22) après digestion des différents ADN par l’enzyme de restriction Xhol.
- Plasmide N°3 : pCas9acr (cf. Figure 10 et SEQ ID NO : 23)
- Plasmide N°4 : pEC750S-w£/ÆlR (cf. Figure 1 1 et SEQ ID NO : 24)
Il contient une matrice de réparation (SEQ ID NO : 25) utilisée pour la délétion du gène upp et constituée par deux fragments d’ADN homologues en amont et en aval du gène upp (tailles respectives : 500 (SEQ ID NO : 26) et 377 (SEQ ID NO : 27) paires de bases). L’assemblage a été obtenu à l’aide du système de clonage Gibson (New England Biolabs, Gibson assembly Master Mix 2X). Pour ce faire, les parties amont et aval ont été amplifiée par PCR à partir de l’ADN génomique de la souche DSM 6423 (cf. Maté de Gerando et al., 2018 et numéro d’accession PRJEB 1 1626
(https://www.ebi.ac.uk/ena/data/view/PRJEB1 1626)) à l’aide des amorces respectives RH001 / RH002 et RH003 / RH004. Ces deux fragments ont ensuite été assemblés dans le pEC750S linéarisé au préalable par restriction enzymatique (enzymes de restriction Sali et Sacl).
- Plasmide N°5 : pEX-A2-gRNA-w/?p (cf. Figure 12 et SEQ ID NO : 28)
Ce plasmide comprend le fragment d’ADN gRNA-upp correspondant à une cassette d’expression (SEQ ID NO : 29) d’un ARN guide ciblant le gène upp (protospacer ciblant upp (SEQ ID NO :31)) sous le contrôle d’un promoteur constitutif (ARN non codant de séquence SEQ ID NO : 30), inséré dans un plasmide de réplication nommé pEX-A2.
- Plasmide N°6 : pEC750S-Aw/?p (cf. Figure 13 et SEQ ID NO : 32)
Il possède comme base le plasmide pEC750S-w/?pHR (SEQ ID NO : 24) et contient en plus le fragment d’ADN comportant une cassette d’expression d’un ARN guide ciblant le gène upp sous le contrôle d’un promoteur constitutif.
Ce fragment a été inséré dans un pEX-A2, appelé pEX-A2-gRNA-upp. L’insert a ensuite été amplifié par PCR avec les amorces pEX-fwd et pEX-rev, puis digéré avec les enzymes de restriction Xhol et Ncol. Enfin, ce fragment a été cloné par ligation dans le pEC750S-w/?pHR préalablement digéré par les mêmes enzymes de restriction pour obtenir le pEC750S-Dmpp .
- Plasmide N°7 : pEC750C-Aupp (cf. Figure 14 et SEQ ID NO : 33) La cassette comportant l’ARN guide ainsi que la matrice de réparation ont ensuite été amplifiés avec les amorces pEC750C-fwd et M13-rev. L’amplicon a été digéré par restriction enzymatique avec les enzymes Xhol et Sacl, puis cloné par ligation enzymatique dans le pEC750C pour obtenir le pEC750C-Dmpp.
- Plasmide N°8 : pGRNA-pNF2 (cf. Figure 15 et SEQ ID NO : 34)
Ce plasmide a comme base pEC750C et contient une cassette d’expression d’un ARN guide ciblant le plasmide pNF2 (SEQ ID NO : 1 18).
- Plasmide N°9 : pCas9ind-gRNA_ca/R (cf. Figure 23 et SEQ ID NO : 38).
Il contient la séquence codant pour l’ARN guide ciblant le locus catB amplifiée par PCR (amorces AcatB fwd et AcatB gRNA rev) et clonée dans le pCas9ind (décrit dans la demande de brevet WO2017/064439) après digestion des différents ADN par l’enzyme de restriction Xhol et ligation.
- Plasmide N°10 : pNF3 (cf. Figure 25 et SEQ ID NO : 1 19)
Il contient une partie du pNF2, comprenant notamment l’origine de réplication et un gène codant pour une protéine de réplication de plasmide (CIBE_p20001), amplifiée avec les amorces RH021 et RH022. Ce produit de PCR a ensuite été cloné au niveau des sites de restriction Sali et BamHI dans le plasmide pUC19 (SEQ ID NO : 1 17).
- Plasmide N°1 1 : pEC751S (cf. Figure 26 et SEQ ID NO : 121)
Il contient tous les éléments du pEC750C (SEQ ID NO : 106), sauf le gène de résistance au chloramphénicol catP (SEQ ID NO : 70). Ce dernier a été remplacé par le gène aad9 d’ Enterococcus faecalis (SEQ ID NO : 130), qui confère une résistance à la spectinomycine. Cet élément a été amplifié avec les amorces aad9- fwd2 et aad9-rev à partir du plasmide pMTL007S-El (SEQ ID NO : 120) et cloné dans les sites Avall et Hpal du pEC750C, à la place du gène catP (SEQ ID NO : 70).
- Plasmide N°12 : pNF3S (cf. Figure 27 et SEQ ID NO : 123)
Il contient tous les éléments du pNF3, avec une insertion du gène aad9 (amplifié avec les amorces RH031 et RH032 à partir du pEC751 S) entre les sites BamHI et Sacl.
- Plasmide N°13 : pNF3E (cf. Figure 28 et SEQ ID NO : 124)
Il contient tous les éléments du pNF3, avec une insertion du gène ermB de Clostridium difficile (SEQ ID NO : 131) sous le contrôle du promoteur miniPthl. Cet élément a été amplifié à partir du pFWOl avec les amorces RH138 et RH 139 et cloné entre les sites BamHI et Sacl du pNF3E.
- Plasmide N°14 : pNF3C (cf. Figure 29 et SEQ ID NO : 125) Il contient tous les éléments du pNF3, avec une insertion du gène cal P de Clostridium perfringens (SEQ ID NO : 70). Cet élément a été amplifié à partir du pEC750C avec les amorces RH140 et RH141 et cloné entre les sites BamHI et Sacl du pNF3E.
Résultats n°l
Transformation de la souche C. beijerinckii DSM 6423
Les plasmides ont été introduits et répliqués dans une souche de E. coli demi dcm (INV110, Invitrogen). Ceci permet d’éliminer les méthylations de type Dam et Dcm sur le plasmide pCas9ind-DcatB avant de l’introduire par transformation dans la souche DSM 6423 selon le protocole décrit par Mermelstein et al. (1993), avec les modifications suivantes : la souche est transformée avec une quantité plus importante de plasmide (20 pg), à une DOÔOO de 0,8, et à l’aide des paramètres d’électroporation suivants : 100 W, 25 pF, 1400 V. L’étalement sur boite de Pétri contenant de l'érythromycine (20 mg/mL) a ainsi permis d’obtenir des transformants de C. beijerinckii DSM 6423 contenant le plasmide pCas9ind -AcatB.
Induction de l’expression de cas 9 et obtention de la souche C. beijerinckii DSM 6423 AcatB (C. beijerinckii IFP962 AcatB )
Plusieurs colonies résistantes à l’érythromycine ont ensuite été reprises dans 100 pL de milieu de culture (2YTG) puis diluées en série jusqu’à un facteur de dilution de 104 dans du milieu de culture. Pour chaque colonie, huit pL de chaque dilution ont été déposés sur une boîte de Pétri contenant de l’érythromycine et de l’anhydrotétracycline (200 ng/mL) permettant d’induire l’expression du gène codant la nucléase Cas9. Après extraction d’ADN génomique, la délétion du gène catB au sein des clones ayant poussés sur cette boite a été vérifiée par PCR, à l’aide des amorces RH076 et RH077 (cf. Figure 16).
Vérification de la sensibilité de la souche C. beijerinckii DSM 6423 AcatB au thiamphénicol
Pour s’assurer que la délétion du gène catB confère bien une sensibilité nouvelle au thiamphénicol, des analyses comparatives sur milieu gélosé ont été réalisées. Des précultures de C. beijerinckii DSM 6423 et C. beijerinckii DSM 6423 AcatB ont été réalisées sur milieu 2YTG puis 100 pL de ces précultures ont été étalés sur des milieux gélosés 2YTG supplémentée ou non en thiamphénicol à une concentration de 15 mg/L. La figure 17 permet d’observer que seule la souche initiale C. beijerinckii DSM 6423 est capable de pousser sur un milieu supplémenté en thiamphénicol.
Délétion du gène upp par l’outil CRISPR-Cas9 dans la souche C. beijerinckii DSM 6423 AcatB
Un clone de la souche C. beijerinckii DSM 6423 AcatB a été au préalable transformé avec le vecteur pCas9acr ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type dam et dcm (préparé à partir d’une bactérie Escherichia coli présentant le génotype dam demj. La vérification de la présence du plasmide pCas9aCT maintenu dans la souche C. beijerinckii DSM 6423 a été vérifiée par PCR sur colonie avec les amorces RH025 et RH 134.
Un clone résistant à l'érythromycine a ensuite été transformé avec pEC750C-Dmpp préalablement déméthylé. Les colonies ainsi obtenues ont été sélectionnées sur du milieu contenant de l'érythromycine (20 mg/mL), du thiamphénicol (15 mg/mL) et du lactose (40 mM).
Plusieurs de ces clones ont ensuite été resuspendus dans 100 pL de milieu de culture (2YTG) puis dilués en série dans du milieu de culture (jusqu’à un facteur de dilution de 104). Cinq pL de chaque dilution ont été déposés sur une boîte de Pétri contenant de l’érythromycine, du thiamphénicol et de l’anhydrotétracycline (200 ng/mL) (cf. Figure 18).
Pour chaque clone, deux colonies résistantes à l’aTc ont été testées par colonie PCR avec des amorces destinées à amplifier le locus upp (cf. Figure 19).
Délétion du plasmide naturel pNF2 par l’outil CRISPR-Cas9 dans la souche C. beijerinckii DSM 6423 AcatB
Un clone de la souche C. beijerinckii DSM 6423 AcatB a été au préalable transformé avec le vecteur pCas9md ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type Dam et Dcm (préparé à partir d’une bactérie Escherichia coli présentant le génotype du ni dcm). La présence du plasmide pCas9md au sein de la souche C. beijerinckii DSM6423 a été vérifiée par PCR avec les amorces pCas9ind_fwd (SEQ ID NO : 42) et pCas9ind_ rev (SEQ ID NO : 43) (cf. Figure 20).
Un clone résistant à l’érythromycine a ensuite été utilisé pour transformer le pGRNA-pNF2, préparé à partir d’une bactérie Escherichia coli présentant le génotype du ni dcm .
Plusieurs colonies obtenues sur du milieu contenant de lérythromycine (20 mg/mL) et du thiamphénicol ( 15 mg/mL) ont été resuspendues dans du milieu de culture et diluées en série jusqu’à un facteur de dilution de 104. Huit pL de chaque dilution ont été déposés sur une boîte de Pétri contenant de l’érythromycine, du thiamphénicol et de l’anhydrotétracycline (200 ng/mL) afin d’induire l’expression du système CRISPR/Cas9.
L’absence du plasmide naturel pNF2 a été vérifiée par PCR avec les amorces pNF2_fwd (SEQ ID NO: 39) et pNF2_rev (SEQ ID NO : 40) (cf. Figure 21).
Conclusions
Au cours de ce travail, les inventeurs sont parvenus à introduire et maintenir différents plasmides au sein de la souche Clostridium beijerinckii DSM 6423. Ils sont parvenus à supprimer le gène catB à l’aide d’un outil de type CRISPR-Cas9 basé sur l’utilisation d’un seul plasmide. La sensibilité au thiamphénicol des souches recombinantes obtenues a été confirmée par des tests en milieu gélosé.
Cette délétion leur a permis d’utiliser plus efficacement l’outil CRISPR-Cas9 nécessitant deux plasmides décrit dans la demande de brevet FRI 854835. Deux exemples permettant de démontrer l’intérêt de cette application ont été réalisés : la délétion du gène upp et l’élimination d’un plasmide naturel non essentiel pour la souche Clostridium beijerinckii DSM 6423.
Résultats n°2
Transformation des souches de C. beijerinckii
Les plasmides préparés dans la souche ά’ E. coli NEB 10-beta sont également utilisés pour transformer la souche C. beijerinckii NCIMB 8052. En revanche, pour C. beijerinckii DSM 6423, les plasmides sont préalablement introduits et répliqués dans une souche de E. coli demi dcm- (INV1 10, Invitrogen). Ceci permet d’éliminer les méthylations de type Dam et Dcm sur les plasmides d’intérêt avant de les introduire par transformation dans la souche DSM 6423.
La transformation est autrement réalisée similairement pour chaque souche, c’est-à-dire selon le protocole décrit par Mermelstein et al. 1992, avec les modifications suivantes : la souche est transformée avec une quantité plus importante de plasmide (5-20 pg), à une DO600 de 0,6-0, 8, et les paramètres d’électroporation sont 100 W, 25 pF, 1400 V. Après 3h de régénération dans du 2YTG, les bactéries sont étalées sur boîte de Pétri (2YTG agar) contenant l’antibiotique souhaité (érythromycine : 20-40 mg/mL ; thiamphénicol : 15 mg/mL ; spectinomycine : 650 mg/mL).
Comparaison des efficacités de transformation des souches de C. beijerinckii DSM 6423
Des transformations ont été réalisées en duplicat biologique dans les souches de C. beijerinckii suivantes : DSM 6423 sauvage, DSM 6423 AcatB et DSM 6423 AcalB ApNF2 (Figure 30). Pour cela, le vecteur pCas9md, notablement difficile à utiliser pour modifier une bactérie car ne permettant pas de bonnes efficacités de transformation, a été utilisé. Il comporte de plus un gène conférant à la souche une résistance à l’érythromycine, antibiotique pour lequel les trois souches sont sensibles.
Les résultats indiquent une augmentation de l’efficacité de transformation d’un facteur d’environ 15-20 imputable à la perte du plasmide naturel pNF2.
L’efficacité de transformation a également été testée pour le plasmide pEC750C, qui confère une résistance au thiamphénicol, uniquement dans les souches DSM 6423 AcatB (IFP962 AcatB) et DSM 6423 AcatB ApNF2 (IFP963 AcatB ApNF2), puisque la souche sauvage est résistante à cet antibiotique (Figure 31). Pour ce plasmide, le gain en efficacité de transformation est encore plus flagrant (amélioration d’un facteur d’environ 2000).
Comparaison des efficacités de transformation des plasmides pNF3 avec d’autres plasmides
Afin de déterminer l’efficacité de transformation de plasmides contenant l’origine de réplication du plasmide naturel pNF2, les plasmides pNF3E et pNF3C ont été introduits dans la souche C. beijerinckii DSM 6423 AcatB ApNF2. L’utilisation de vecteurs contenant des gènes de résistance à l'érythromycine ou au chloamphénicol permet de comparer l’efficacité de transformation du vecteur en fonction de la nature du gène de résistance. Les plasmides pFWOl et pEC750C ont également été transformés. Ces deux plasmides contiennent des gènes de résistance à des antibiotiques différents (respectivement G érythromycine et le thiamphénicol) et sont couramment utilisés pour transformer C. beijerinckii et C. acetobutylicum.
Comme montré dans la Figure 32, les vecteurs basés sur le pNF3 présentent une excellente efficacité de transformation, et sont notamment utilisables chez C. beijerinckii DSM 6423 AcatB ApNF2. En particulier, le pNF3E (qui contient un gène de résistance à l’érythromycine) montre une efficacité de transformation nettement supérieure à celle de pFWOl, qui comprend le même gène de résistance. Ce même plasmide n’a pas pu être introduit dans la souche C. beijerinckii DSM 6423 sauvage (0 colonies obtenues avec 5 pg de plasmides transformés en duplicat biologique), ce qui démontre l’impact de la présence du plasmide naturel pNF2.
Vérification de la transformabilité des plasmides pNF3 dans d’autres souches/espèces
Pour illustrer la possibilité d’utiliser ce nouveau plasmide dans d’autres souches solvantogènes de Clostridium, les inventeurs ont réalisé une analyse comparative des efficacités de transformation des plasmides pFWOl, pNF3E et pNF3S dans la souche ABE C. beijerinckii NCIMB 8052 (Figure 33). La souche NCIMB 8052 étant naturellement résistante au thiamphénicol, le pNF3S, conférant une résistance à la spectinomycine, a été utilisé à la place du pNF3C.
Les résultats démontrent que la souche NCIMB 8052 est transformable avec les plasmides basés sur le pNF3, ce qui prouve que ces vecteurs sont applicables à l’espèce C. beijerinckii au sens large.
L’applicabilité de la suite de vecteurs de synthèse basés sur le pNF3 a également été testée dans la souche référence DSM 792 de C. acetobutylicum. Un essai de transformation a ainsi montré la possibilité de transformer cette souche par le plasmide pNF3C (Efficacité de transformation de 3 colonies observées par pg d’ADN transformé contre 120 colonies/pg pour le plasmide pEC750C).
Vérification de la compatibilité des plasmides pNF3 avec l’outil génétique décrit dans la demande FR18/73492
La demande de brevet FRI 8/73492 décrit la souche AcatB ainsi que l’utilisation d’un système CRISPR/Cas9 à deux plasmides nécessitant l’utilisation d’un gène de résistance à l’érythromycine et d’un gène de résistance au thiamphénicol. Pour démontrer l’intérêt de la nouvelle suite de plasmides pNF3, le vecteur pNF3C a été transformé dans la souche AcatB contenant déjà le plasmide pCas9acr. La transformation, réalisée en duplicat, a montré une efficacité de transformation de 0,625 ± 0, 125 colonies/pg d’ADN (moyenne ± erreur standard), ce qui prouve qu’un vecteur basé sur le pNF3C peut être utilisé en combinaison avec le pCas9acr dans la souche AcatB.
Parallèlement à ces résultats, une partie du plasmide pNF2 comprenant son origine de réplication (SEQ ID NO : 118) a pu être réutilisée avec succès pour créer une nouvelle suite de vecteurs navettes (SEQ ID NO : 1 19, 123, 124 et 125), modifiables à façon, permettant notamment leur réplication dans une souche à'E. coli ainsi que leur réintroduction chez C. beijerinckii DSM 6423. Ces nouveaux vecteurs présentent des efficacités de transformation avantageuses pour réaliser de l’édition génétique par exemple chez C. beijerinckii DSM 6423 et ses dérivées, en particulier à l’aide de l’outil CRISPR/Cas9 comprenant deux acides nucléiques différents.
Ces nouveaux vecteurs ont également pu être testés avec succès dans une autre souche de C. beijerinckii (NCIMB 8052), et d’espèce de Clostridium (en particulier C. acetobutylicum), démontrant leur applicabilité dans d’autres organismes du phylum des Firmicutes. Un test est également réalisé sur Bacillus.
Conclusions
Ces résultats démontrent que la suppression du plasmide naturel pNF2 augmente significativement les fréquences de transformation de la bactérie qui le contenait (d’un facteur d’environ 15 pour le pFWOl et d’un facteur d’environ 2000 pour le pEC750C). Ce résultat est particulièrement intéressant dans le cas des bactéries du genre Clostridium, connues pour être difficiles à transformer, et en particulier pour la souche C. beijerinckii DSM 6423 qui souffre naturellement d’une efficacité de transformation faible (inférieure à 5 colonies/pg de plasmide).
REFERENCES
- Banerjee, A., Leang, C, Ueki, T., Nevin, K. P., & Lovley, D. R. (2014). Lactose-inducible System for metabolic engineering of Clostridium ljungdahlii. Applied and environmental microbiology, 80(8), 2410- 2416.
- Chen J.-S., Hiu S.F. (1986) Acetone-butanol-isopropanol production by Clostridium beijerinckii (synonym, Clostridium butylicum). Biotechnol. Lett. 8:371-376.
- Cui, L., & Bikard, D. (2016). Conséquences of Cas9 cleavage in the chromosome of Escherichia coli. Nucleic acids research, 44(9), 4243-4251.
- Currie, D. H., Herring, C. D., Guss, A. M., Oison, D. G., Hogsett, D. A., & Lynd, L. R. (2013). Functional heterologous expression of an engineered full length CipA firom Clostridium thermocellum in Thermoanaerobacterium saccharolyticum. Biotechnology for biofüels, 6(1), 32.
- DiCarlo, J. E., Norville, J. E., Mali, P., Rios, X., Aach, J., & Church, G. M. (2013). Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas Systems. Nucleic acids research, 41(7), 4336-4343.
- Dong, H., Tao, W., Zhang, Y., & Li, Y. (2012). Development of an anhydrotetracycline-inducible gene expression System for solvent-producing Clostridium acetobutylicum : A useful tool for strain engineering. Metabolic engineering, 14(1), 59-67.
- Dong, D., Guo, M., Wang, S., Zhu, Y., Wang, S., Xiong, Z., ... & Huang, Z. (2017). Structural basis of CRISPR-SpyCas9 inhibition by an anti-CRISPR protein. Nature, 546(7658), 436.
- Dupuy, B., Mani, N., Katayama, S., & Sonenshein, A. L. (2005). Transcription activation of a UV- inducible Clostridium perfringens bacteriocin gene by a novel s factor. Molecular microbiology, 55(4), 1 196-1206.
- Egholm, M., Buchardt, O., Nielsen, P. E., & Berg, R. H. (1992). Peptide nucleic acids (PNA). Oligonucleotide analogs with an achiral peptide backbone. Journal of the American Chemical Society, 1 14(5), 1895-1897.
- Fonfara, L, Le Rhun, A., Chylinski, K., Makarova, K. S., Lecrivain, A. L., Bzdrenga, J., ... & Charpentier, E. (2013). Phylogeny of Cas9 détermines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas Systems. Nucleic acids research, 42(4), 2577-2590.
- Garcia-Doval C, Jinek M. Molecular architectures and mechanisms of Class 2 CRISPR-associated nucleases. Curr Opin Struct Biol. 2017 Dec;47: 157-166. doi: 10.1016/j. sbi.2017.10.015 Ajouter au projet Citavi par DOI. Epub 2017 Nov 3. Review.
- George H.A., Johnson J.L., Moore W. E. C., Holdeman, L. V., Chen J. S. (1983) Acetone, Isopropanol, and Butanol Production by Clostridium beijerinckii (syn. Clostridium butylicum) and Clostridium aurantibutyricum. Appl. Env. Microbiol. 45: 1160-1 163.
- Gonzales y Tucker RD, Frazee B. View firom the front Unes: an emergency medicine perspective on clostridial infections in injection drug users. Anaerobe. 2014 Dec; 30: 108- 15. - Hartman, A. H., Liu, H., & Melville, S. B. (201 1). Construction and characterization of a lactose-inducible promoter System for controlled gene expression in Clostridium perfringens. Applied and environmental microbiology, 77(2), 471-478.
- Heap, J. T., Ehsaan, M., Cooksley, C. M., Ng, Y. K., Cartman, S. T., Winzer, K., & Minton, N. P. (2012). Intégration of DNA into bacterial chromosomes firom plasmids without a counter-selection marker. Nucleic acids research, 40( 8), e59-e59.
- Heap, J. T., Kuehne, S. A., Ehsaan, M., Cartman, S. T., Cooksley, C. M., Scott, J. C., & Minton, N. P. (2010). The ClosTron: mutagenesis in Clostridium refined and streamlined. Journal of microbiological methods, 80(1), 49-55.
- Heap, J. T., Pennington, O. J., Cartman, S. T., Carter, G. P., & Minton, N. P. (2007). The ClosTron: a universal gene knock-out System for the genus Clostridium. Journal of microbiological methods, 70(3), 452-464.
- Heap, J. T., Pennington, O. J., Cartman, S. T., & Minton, N. P. (2009). A modular System for Clostridium shuttle plasmids. Journal of microbiological methods, 78( 1), 79-85.
- Hidalgo-Cantabrana, C., O’Flaherty, S., & Barrangou, R. (2017). CRISPR-based engineering of next- generation lactic acid bacteria. Current opinion in microbiology, 37, 79-87.
- Hiu S.F., Zhu C.-X., Yan R.-T., Chen J.-S. (1987) Butanol-ethanol dehydrogenase and butanol-ethanol- isopropanol dehydrogenase: different alcohol dehydrogenases in two strains of Clostridium beijerinckii (Clostridium butylicum). Appl. Env. Microbiol. 53:697-703.
- Huang, H., Chai, C., Li, N., Rowe, P., Minton, N. P., Yang, S., & Gu, Y. (2016). CRISPR/Cas9-based efficient genome editing in Clostridium ljungdahlii, an autotrophic gas-fermenting bacterium. ACS synthetic biology, 5(12), 1355- 1361.
- Huggins, A.S., Bannam, T.L. and Rood, J.I. (1992) Comparative sequence analysis of the catB gene firom Clostridium butyricum. Antimicrob. Agents Chemother. 36, 2548-2551.
- Ismaiel A.A., Zhu C.X., Colby G.D., Chen, J. S. (1993). Purification and characterization of a primary- secondary alcohol dehydrogenase from two strains of Clostridium beijerinckii. J. Bacteriol. 175:5097- 5105.
- Jinek, M., Chylinski, K., Fonfara, I., Hauer, M., Doudna, J. A., & Charpentier, E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science, 337(6096), 816-821.
- Jones D.T., Woods D.R. (1986) Acetone-butanol fermentation revisited. Microbiological Reviews 50:484-524.
- Kolek J., Sedlar K., Provaznik I., Patakova P. (2016). Dam and Dcm méthylations prevent gene transfer into Clostridium pasteurianum NRRL B-598: development of methods for electrotransformation, conjugation, and sonoporation. Biotechnol Biofuels. 9: 14.
- Li, Q., Chen, J., Minton, N. P., Zhang, Y., Wen, Z., Liu, J., ... & Gu, Y. (2016). CRISPR-based genome editing and expression control Systems in Clostridium acetobutylicum and Clostridium beijerinckii. Biotechnology journal, 11(7), 961-972. - Makarova, K. S., Haft, D. H., Barrangou, R., Brouns, S. J., Charpentier, E., Horvath, P., ... & Van Der Oost, J. (201 1). Evolution and classification of the CRISPR-Cas Systems. Nature Reviews Microbiology, 9(6), 467.
- Makarova, K. S., Wolf, Y. I., Alkhnbashi, O. S., Costa, F., Shah, S. A., Saunders, S. J., ... & Horvath, P. (2015). An updated evolutionary classification of CRISPR-Cas Systems. Nature Reviews Microbiology, 13(11), 722.
- Manno, N. D., Zhang, J. Y., Borges, A. L., Sousa, A. A., Leon, L. M., Rauch, B. J., ... & Bondy-Denomy, J. (2018). Discovery of widespread type I and type V CRISPR-Cas inhibitors. Science, 362(641 1), 240- 242.
- Maté de Gérando, H., Wasels, F., Bisson, A., Clément, B., Bidard, F., Jourdier E., Lopez-Contreras A., Lopes Ferreira N. (2018). Genome and transcriptome of the natural isopropanol producer Clostridium beijerinckii DSM 6423. BMC genomics. 19:242.
- Mearls, E. B., Oison, D. G., Herring, C. D., & Lynd, L. R. (2015). Development of a regulatable plasmid- based gene expression System for Clostridium thermocellum. Applied microbiology and biotechnology, 99(18), 7589-7599.
- Mermelstein, L. D., & Papoutsakis, E. T. (1993). In vivo méthylation in Escherichia coli by the Bacillus subtilis phage phi 3T I methyltransferase to protect plasmids from restriction upon transformation of Clostridium acetobutylicum ATCC 824. Applied and environmental microbiology, 59(4), 1077- 1081.
- Mermelstein L.D., Welker N.E., Bennett G.N., Papoutsakis E.T. (1992). Expression of cloned homologous fermentative genes in Clostridium acetobutylicum ATCC 824 10: 190-195.
- Mermelstein L.D., Welker N.E., Bennett G.N., Papoutsakis E.T. (1993). Expression of cloned homologous fermentative genes in Clostridium acetobutylicum ATCC 824 10: 190-195.
- Moon HG, Jang YS, Cho C, Lee J, Binkley R, Lee SY. One hundred years of clostridial butanol fermentation. FEMS Microbiol Lett. 2016 Feb;363(3).
- Nagaraju, S., Davies, N. K., Walker, D. J. F., Kopke, M., & Simpson, S. D. (2016). Genome editing of Clostridium autoethanogenum using CRISPR/Cas9. Biotechnology for biofüels, 9(1), 219.
- Nariya, H., Miyata, S., Kuwahara, T., & Okabe, A. (201 1). Development and characterization of a xylose- inducible gene expression System for Clostridium perfringens. Applied and environmental microbiology, 77(23), 8439-8441.
- Newcomb, M., Millen, J., Chen, C. Y., & Wu, J. D. (201 1). Co-transcription of the celC gene cluster in Clostridium thermocellum. Applied microbiology and biotechnology, 90(2), 625-634.
- Pawluk, A., Davidson, A. R., & Maxwell, K. L. (2018). Anti-CRISPR: Discovery, mechanism and function . Nature Reviews Microbiology , 16(1), 12
- Poehlein A., Solano J.D.M., Flitsch S. K., Krabben P., Winzer K., Reid S.J., Jones D.T., Green E., Minton N.P., Daniel R., Dürre P. (2017). Microbial solvent formation revisited by comparative genome analysis. Biotechnol Biofuels. 10:58. - Pyne, M. E., Bruder, M. R., Moo-Young, M., Chung, D. A., & Chou, C. P. (2016). Hamessing heterologous and endogenous CRISPR-Cas machineries for efficient markerless genome editing in Clostridium. Scientific reports, 6.
- Rauch, B. J., Silvis, M. R., Hultquist, J. F., Waters, C. S., McGregor, M. J., Krogan, N. J., & Bondy- Denomy, J. (2017). Inhibition of CRISPR-Cas9 with bactériophage proteins. Cell, 168(1-2), 150- 158.
- Rajewska M., Wegrzyn K, Konieczny I., FEMS Microbiol Rev. 2012 Mar; 36(2). AT-rich région and repeated sequences - the essential éléments of réplication origins ofbacterial replicons :408-34.
- Ransom, E. M., Ellermeier, C. D., & Weiss, D. S. (2015). Use of mCherry red fluorescent protein for studies of protein localization and gene expression in Clostridium difficile. Applied and environmental microbiology, 81(5), 1652-1660.
- Rogers P., Chen J.-S., Zidwick M. (2006) in The prokaryotes. 3rd édition, Vol. 1, edited by Dworkin M (Springer, New York, USA, 2006). 3rd édition, Vol. 1, pp. 672-755.
- Schwarz S, Kehrenberg C, Doublet B, Cloeckaert A. Molecular basis of bacterial résistance to chloramphénicol and florfenicol. FEMS Microbiol Rev. 2004 Nov;28(5):519-42.
- Stella S, Alcôn P, Montoya G. Class 2 CRISPR-Cas RNA-guided endonucleases: Swiss Army knives of genome editing. Nat Struct Mol Biol. 2017 Nov;24(l l):882-892. doi: 10.1038/nsmb.3486.
- Wang, S., Dong, S., Wang, P., Tao, Y., & Wang, Y. (2017). Genome Editing in Clostridium saccharoperbutylacetonicum N 1-4 with the CRISPR-Cas9 System. Applied and Environmental Microbiology, 83(10), e00233-17.
- Wang Y, Li X, Milne CB, et al. Development of a gene knockout System using mobile group II introns (Targetron) and genetic disruption of acid production pathways in Clostridium beijerinckii. Appl Environ Microbiol. 2013; 79(19): 5853-63.
- Wang, Y. et al. Markerless chromosomal gene délétion in Clostridium beijerinckii using CRISPR/Cas9 System. J. Biotechnol.2015. 200: 1-5.
- Wang, Y., Zhang, Z. T., Seo, S. O., Lynn, P., Lu, T., fin, Y. S., & Blaschek, H. P. (2016). Bacterial genome editing with CRISPR-Cas9: délétion, Intégration, single nucléotide modification, and désirable “clean” mutant sélection in Clostridium beijerinckii as an example. A CS synthetic biology, 5(7), 721-732.
- Wasels, F., Jean-Marie, J., Collas, F., Lôpez-Contreras, A. M., & Ferreira, N. L. (2017). A two-plasmid inducible CRISPR/Cas9 genome editing tool for Clostridium acetobutylicum. Journal of microbiological methods. 140:5-1 1.
- Xu, T., Li, Y., Shi, Z., Hemme, C. L., Li, Y., Zhu, Y., ... & Zhou, J. (2015). Efficient genome editing in Clostridium cellulolyticum via CRISPR-Cas9 nickase. Applied and environmental microbiology, 81(13), 4423-4431.
- Y adav, R., Kumar, V., Baweja, M., & Shukla, P. (2018). Gene editing and genetic engineering approaches for advanced probiotics : A Review. Critical reviews in food science and nutrition, 58(10), 1735-1746. - Yue Chen, Bruce A. McClane, Derek J. Fisher, Julian I. Rood, Phalguni Gupta; Construction of an Alpha Toxin Gene Knockout Mutant of Clostridium perfringens Type A by Use of a Mobile Group II Intron; Appl. Environ. Microbiol. Nov 2005, 71 (11) 7542-7547; DOI: 10.1128/AEM.71.11.7542-7547.2005.
- Zhang, J., Liu, Y. J., Cui, G. Z., & Cui, Q. (2015). A novel arabinose-inducible genetic operation System developed for Clostridium cellulolyticum. Biotechnology for biofüels, 8(1), 36.
- Zhang C., Tinggang L. Jianzhong H. (2018) Characterization and genome analysis of a butanol- isopropanol-producing Clostridium beijerinckii strain BGS1. Biotechnol Biofuels (2018) 11:280.
- Zhong, J., Karberg, M., & Lambowitz, A. M. (2003). Targeted and random bacterial gene disruption using a group II intron (targetron) vector containing a retrotransposition-activated selectable marker. Nucleic acids research, 31(6), 1656-1664.

Claims

REVENDICATIONS
1. Bactérie C. beijerinckii enregistrée le 20 février 2019 sous le numéro de dépôt LMG P-31277 auprès de la collection BCCM-LMG ou version génétiquement modifiée de celle-ci.
2. Acide nucléique comprenant i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
3. Acide nucléique selon la revendication 2, caractérisé en ce que la séquence permettant la modification du matériel génétique de la bactérie est une matrice de modification permettant, par un mécanisme de recombinaison homologue, le remplacement d’une portion du matériel génétique de la bactérie par une séquence d’intérêt.
4. Acide nucléique selon la revendication 2 ou 3, caractérisé en ce que l’acide nucléique comprend en outre iii) une séquence codant une endonucléase d’ADN et/ou iv) un ou plusieurs ARN guides (ARNg), chaque ARNg comprenant une structure ARN de fixation à l’endonucléase d’ADN et une séquence complémentaire de la portion ciblée du matériel génétique de la bactérie.
5. Acide nucléique selon l’une quelconque des revendications 2 à 4, caractérisé en ce que ledit acide nucléique est sélectionné parmi une cassette d’expression et un vecteur, et est de préférence un plasmide, par exemple un plasmide ayant une séquence sélectionnée parmi SEQ ID NO : 1 19, SEQ ID NO : 123, SEQ ID NO : 124 et SEQ ID NO : 125.
6. Outil génétique pour transformer et modifier génétiquement une bactérie, caractérisé en ce que ledit outil génétique comprend au moins :
- un premier acide nucléique codant au moins une endonucléase d’ADN, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- un deuxième acide nucléique tel que décrit dans l’une des quelconque revendications 2 à 5, et en ce que au moins l’un desdits acide nucléique de l’outil génétique comprend en outre de préférence une séquence codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible, ou en ce que l’outil génétique comprend en outre un troisième acide nucléique codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible.
7. Outil génétique selon la revendication 6, caractérisé en ce que le premier acide nucléique code en outre un ou plusieurs ARN guides (ARNg) ou en ce que l’outil génétique comprend en outre un ou plusieurs ARNg.
8. Utilisation d’un acide nucléique tel que décrit dans l’une quelconque des revendications 2 à 6 ou d’un outil génétique tel que décrit dans l’une des revendications 6 ou 7, pour transformer et éventuellement modifier génétiquement une bactérie.
9. Procédé pour transformer, et de préférence modifier génétiquement, une bactérie à l’aide d’un outil de modification génétique, caractérisé en ce qu’il comprend une étape de transformation de la bactérie par introduction dans ladite bactérie d’un acide nucléique selon l’une quelconque des revendications 2 à 5.
10. Acide nucléique selon l’une quelconque des revendications 2 à 5, outil génétique selon la revendication 6 ou 7, utilisation selon la revendication 8, ou procédé selon la revendication 9, caractérisé(e) en ce que la bactérie appartient au phylum des Firmicutes, et appartient de préférence au genre Clostridium, au genre Bacillus ou au genre Lactobacillus.
1 1. Acide nucléique, outil génétique, utilisation ou procédé selon la revendication 10, caractérisé en ce que la bactérie est une bactérie du genre Clostridium, de préférence une bactérie solvantogène sélectionnée parmi C. acetobutylicum, C. cellulolyticum, C. phytofermentans, C. beijerinckii, C. saccharobutylicum, C. saccharoperbutylacetonicum, C. sporogenes, C. butyricum, C. aurantibutyricum, C. tyrobutyricum ou une bactérie acétogène sélectionnée parmi C. aceticum, C. thermoaceticum, C. ljungdahlii, C. autoethanogenum, C. difficile, C. scatologenes et C. carboxydivorans.
12. Acide nucléique, outil génétique, utilisation ou procédé selon la revendication 10 ou 1 1 , caractérisé en ce que la bactérie est une bactérie C. beijerinckii dépourvue du plasmide pNF2, de préférence un sous- clade sélectionné parmi DSM 6423, LMG 7814, LMG 7815, NRRL B-593, NCCB 27006 et un sous-clade présentant au moins 95%, de préférence 97%, d’identité avec la souche DSM 6423.
13. Kit pour transformer et de préférence modifier génétiquement une bactérie ou pour produire au moins un solvant à l’aide d’une bactérie, ledit kit comprenant un acide nucléique tel que décrit dans l’une quelconque des revendications 2 à 5 et au moins un inducteur adapté au promoteur inductible de l’expression de la protéine anti-CRISPR sélectionné utilisé au sein de l’outil génétique tel que décrit dans l’une des revendications 6 ou 7.
14. Utilisation d’un acide nucléique tel que décrit dans l’une quelconque des revendications 2 à 5, de l’outil génétique selon l’une des revendications 6 ou 7, du procédé selon la revendication 9 ou d’un kit selon la revendication 13, pour permettre la production d’un solvant ou d’un mélange de solvants à l’échelle industrielle, de préférence d’acétone, de butanol, d’éthanol, d’isopropanol ou d’un mélange de ceux-ci, typiquement d’un mélange isopropanol/butanol.
15. Bactérie C. beijerinckii susceptible d’être obtenu par le procédé selon l’une des revendications 9 à 12 caractérisée en ce que ladite bactérie est dépourvue du gène catB de séquence SEQ ID NO :18 et du plasmide pNF2.
EP20740061.5A 2019-05-24 2020-05-22 Outil genetique optimisé pour modifier les bacteries Pending EP3976780A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1905485A FR3096373B1 (fr) 2019-05-24 2019-05-24 Outil genetique optimisé pour modifier les bacteries
PCT/FR2020/050853 WO2020240122A1 (fr) 2019-05-24 2020-05-22 Outil genetique optimisé pour modifier les bacteries

Publications (1)

Publication Number Publication Date
EP3976780A1 true EP3976780A1 (fr) 2022-04-06

Family

ID=69157897

Family Applications (1)

Application Number Title Priority Date Filing Date
EP20740061.5A Pending EP3976780A1 (fr) 2019-05-24 2020-05-22 Outil genetique optimisé pour modifier les bacteries

Country Status (9)

Country Link
US (1) US20220243170A1 (fr)
EP (1) EP3976780A1 (fr)
JP (1) JP2022534223A (fr)
KR (1) KR20220012324A (fr)
CN (1) CN114286857A (fr)
BR (1) BR112021023648A2 (fr)
CA (1) CA3141382A1 (fr)
FR (1) FR3096373B1 (fr)
WO (1) WO2020240122A1 (fr)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3147287A1 (fr) * 2023-03-31 2024-10-04 IFP Energies Nouvelles Bacteries clostridium modifiees produisant du propan-2-ol, preparation et utilisations de celles-ci
FR3147288A1 (fr) 2023-03-31 2024-10-04 IFP Energies Nouvelles Bacteries clostridium modifiees, outil d’edition genetique du plasmide psol de bacteries clostridium, et utilisations

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2018004642A (es) * 2015-10-13 2019-04-15 Lanzatech New Zealand Ltd Bacteria diseñada por ingeniería genética que comprende una trayectoria de fermentación que genera energía.
FR3042506B1 (fr) 2015-10-16 2018-11-30 IFP Energies Nouvelles Outil genetique de transformation de bacteries clostridium
FR3081881B1 (fr) * 2018-06-04 2024-05-24 Ifp Energies Now Outil genetique optimise pour modifier les bacteries du genre clostridium
FR3090691B1 (fr) * 2018-12-20 2023-06-09 Ifp Energies Now Bacteries clostridium genetiquement modifiees, preparation et utilisations de celles-ci

Also Published As

Publication number Publication date
CN114286857A (zh) 2022-04-05
FR3096373A1 (fr) 2020-11-27
BR112021023648A2 (pt) 2022-01-04
JP2022534223A (ja) 2022-07-28
US20220243170A1 (en) 2022-08-04
WO2020240122A1 (fr) 2020-12-03
CA3141382A1 (fr) 2020-12-03
KR20220012324A (ko) 2022-02-03
FR3096373B1 (fr) 2024-09-13

Similar Documents

Publication Publication Date Title
EP3362559B1 (fr) Outil genetique de transformation de bacteries clostridium
EP3578662A1 (fr) Outil genetique optimisé pour modifier les bacteries du genre clostridium
CN109072245B (zh) 用于c1固定菌的crispr/cas系统
Zhang et al. Exploiting endogenous CRISPR-Cas system for multiplex genome editing in Clostridium tyrobutyricum and engineer the strain for high-level butanol production
WO2020240122A1 (fr) Outil genetique optimisé pour modifier les bacteries
WO2020128379A1 (fr) Bacteries clostridium genetiquement modifiees, preparation et utilisations de celles-ci
KR20150142305A (ko) 합성 조절 sRNA를 이용한 클로스트리듐 속 미생물 유전자의 발현 조절 방법
US20210403889A1 (en) Crispr-cas system for clostridium genome engineering and recombinant strains produced thereof
WO2024200980A1 (fr) Bacteries clostridium modifiees, outil d'edition genetique du plasmide psol de bacteries clostridium, et utilisations
WO2021260322A1 (fr) Souches de bacteries clostridium resistantes au 5-fluorouracile, outils genetiques et utilisations de ceux-ci
WO2024200979A1 (fr) Bacteries clostridium modifiees produisant du propan-2-ol, preparation et utilisations de celles-ci
Zhang butanol production, Metabolic Engineering
Grosse-Honebrink Forward and reverse genetics in industrially important Clostridia
FR3025803A1 (fr) Cassette d'expression et leurs utilisations

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20211210

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)