DESCRIPTION
Titre : OUTIL GENETIQUE OPTIMISÉ POUR MODIFIER LES BACTERIES
La présente invention concerne la transformation et la modification génétique de bactéries, en particulier appartenant au phylum des Firmicutes, typiquement de bactéries solvantogènes, par exemple du genre Clostridium, de préférence de bactéries possédant à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN (ou plasmide naturel) distincte de l’ADN chromosomique. Elle concerne ainsi des méthodes, outils et kits permettant une telle modification génétique, impliquant en particulier une séquence d’acide nucléique utilisée pour faciliter la transformation de la bactérie, ladite séquence comprenant i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. La description vise aussi les bactéries génétiquement modifiées obtenues et leurs utilisations, en particulier pour produire un solvant, de préférence à l’échelle industrielle.
ARRIERE-PLAN TECHNOLOGIQUE
Le genre Clostridium contient des bactéries à Gram positif, anaérobies strictes et sporulantes, appartenant au phylum des Firmicutes. Les Clostridia sont un groupe d’importance pour la communauté scientifique pour plusieurs raisons. La première est qu’un certain nombre de maladies graves (e.g. tétanos, botulisme) sont dues à des infections de membres pathogènes de cette famille (John & Wood, 1986 ; Gonzales et al., 2014). La deuxième est la possibilité d’utiliser des souches dites acidogènes ou solvantogènes en biotechnologie (Moon et al., 2016). Ces Clostridia, non pathogènes, ont naturellement la capacité de convertir une variété importante de sucres pour produire des espèces chimiques d’intérêt, et plus particulièrement de l’acétone, du butanol, et de l’éthanol (John & Wood, 1986) au cours d’un processus fermentaire nommé ABE. De manière similaire, la fermentation IBE est possible chez certaines espèces particulières, lors de laquelle l’acétone est réduit en proportion variable en isopropanol (Chen et al., 1986, George et al., 1983) grâce à la présence dans le génome de ces souches de gènes codant des alcool déshydrogénases secondaires (s-ADH ; Ismael et al., 1993, Hiu et al., 1987).
Les espèces de Clostridia solvantogènes présentent des similarités phénotypiques importantes, ce qui rendait difficile leur classification avant l’émergence des techniques de séquençage modernes (Rogers et al., 2006). Avec la possibilité de séquencer les génomes complets de ces bactéries, il est aujourd’hui possible de classer ce genre bactérien en 4 espèces majeures : C. acetobutylicum, C. saccharoperbutylacetonicum, C. saccharobutylicum et C. beijerinckii. Une publication récente propose, après analyse comparative des génomes complets de 30 souches, de classer ces Clostridia solvantogènes en 4 clades principaux (Figure 1).
Ces groupes séparent notamment les espèces que sont C. acetobutylicum et C. beijerinckii avec comme références respectives C. acetobutylicum ATCC 824 (également désignée DSM 792 ou encore LMG 5710) et C. beijerinckii NCIMB 8052. Ces dernières sont des souches modèles pour l’étude de la fermentation ABE.
Les souches de Clostridium naturellement capables d’effectuer une fermentation IBE sont peu nombreuses et appartiennent majoritairement à l’espèce Clostridium beijerinckii (cf. Zhang et al., 2018, Tableau 1). Ces souches sont typiquement sélectionnées parmi les souches C. butylicum LMD 27.6, C. aurantibutylicum NCIB 10659, C. beijerinckii LMD 27.6, C. beijerinckii VPI2968, C. beijerinckii NRRL B-593, C. beijerinckii ATCC 6014, C. beijerinckii McClung 3081, C. isopropylicum IAM 19239, C. beijerinckii DSM 6423, C. sp. A1424, C. beijerinckii optinoii, et C. beijerinckii BGS1.
Bien qu’utilisées en industrie depuis plus d’un siècle, les connaissances sur les bactéries, notamment appartenant au genre Clostridium, ont longtemps été limitées par les difficultés rencontrées pour les modifier génétiquement. Différents outils génétiques ont été conçus au cours des dernières années pour optimiser les souches de ce genre, la dernière génération étant basée sur Tutilisation de la technologie CRISPR (Clustered Regularly Interspaced Short Palindromie Repeats)/Cas (CRISPR-associated protein). Cette méthode est basée sur l’emploi d’une enzyme appelée nucléase (typiquement une nucléase de type Cas dans le cas de l’outil génétique CRISPR/Cas, telle que la protéine Cas9 de Streptococcus pyogenes), qui va, guidée par une molécule d’ARN, réaliser une coupure double brin au sein d’une molécule d’ADN (séquence cible d’intérêt). La séquence de TARN guide (ARNg) déterminera le site de coupure de la nucléase, lui conférant ainsi une très forte spécificité (Figure 1).
Une coupure double brin au sein d’une molécule d’ADN indispensable étant létale pour un organisme, la survie de ce dernier dépendra de sa capacité à la réparer (cf. par exemple Cui & Bikard, 2016). Chez les bactéries du genre Clostridium, la réparation d’une coupure double brin dépend d’un mécanisme de recombinaison homologue nécessitant une copie intacte de la séquence clivée. En fournissant à la bactérie un fragment d’ADN permettant d’effectuer cette réparation tout en modifiant la séquence originelle, il est possible de forcer le micro-organisme à intégrer les changements désirés au sein de son génome. La modification réalisée ne doit plus permettre le ciblage de l’ADN génomique par le complexe ribonucléoprotéique Cas9-ARNg, via la modification de la séquence cible ou du site PAM (Figure 2).
Différentes approches ont été décrites pour tenter de rendre fonctionnel cet outil génétique au sein de bactéries du genre Clostridium. Ces microorganismes sont en effet connus pour être difficiles à modifier génétiquement en raison de leurs faibles fréquences de transformation et de recombinaison homologue. Quelques approches sont basées sur l’emploi de Cas9, exprimée de manière constitutive chez C. beijerinckii et C. ljungdahlii (Wang et al, 2015 ; Huang et al, 2016) ou sous contrôle d’un promoteur inductible chez C. beijerinckii, C. saccharoperbutylacetonicum et C. authoethanogenum (Wang et al, 2016 ; Nagaraju et al, 2016 ; Wang et al, 2017). D’autres auteurs ont décrit l’utilisation d’une version modifiée de la nucléase, Cas9n, qui réalise des coupures simple brin, au lieu de coupures double brin, au sein du génome (Xu et al,
2015 ; Li et al, 2016). Ce choix est dû aux observations selon lesquelles la toxicité de Cas9 est trop importante pour son utilisation chez des bactéries du genre Clostridium dans les conditions expérimentales testées. La plupart des outils décrits précédemment reposent sur l'utilisation d'un plasmide unique. Enfin, il est également possible d’utiliser des systèmes CRISPR/Cas endogènes lorsqu’ils ont été identifiés au sein du génome du micro-organisme, comme par exemple chez C. pasteurianum (Pyne et al, 2016).
A moins qu'ils n'utilisent (comme dans le dernier cas décrit ci-dessus) la machinerie endogène de la souche à modifier, les outils basés sur la technologie CRISPR présentent l'inconvénient majeur de limiter significativement la taille de l'acide nucléique d'intérêt (et donc le nombre de séquences codantes ou gènes) susceptible d'être inséré dans le génome bactérien (1,8 kb environ au mieux d'après Xu et al., 2015).
Les inventeurs ont mis au point et décrit un outil génétique plus performant de modification de bactéries, adapté aux bactéries du genre Clostridium, basé sur l’utilisation de deux acides nucléiques distincts, typiquement de deux plasmides (WO2017064439, Wasels et al., 2017 et Figure 3) qui résout notamment ce problème. Dans un mode de réalisation particulier, le premier acide nucléique de cet outil permet l’expression de cas9 et un deuxième acide nucléique, spécifique de la modification à effectuer, contient une ou plusieurs cassettes d’expression d’ARNg ainsi qu’une matrice de réparation permettant le remplacement d’une portion de l’ADN bactérien ciblée par Cas9 par une séquence d’intérêt. La toxicité du système est limitée en plaçant cas9 et/ou la (les) cassette(s) d’expression d’ARNg sous contrôle de promoteurs inductibles. Les inventeurs ont récemment amélioré cet outil en permettant d’augmenter très significativement l’efficacité de transformation et donc l’obtention, en nombre et quantité utile (en particulier dans un contexte de sélection de souches robustes pour une production à l’échelle industrielle), de bactéries génétiquement modifiées d’intérêt (cf. FR 18/548356). Dans cet outil amélioré au moins un acide nucléique comprend une séquence codant une protéine anti-CRISPR (« acr »), placée sous le contrôle d’un promoteur inductible. Cete protéine anti-CRISPR permet de réprimer l’activité du complexe endonucléase d’ADN/ARN guide. L’expression de la protéine est régulée pour permetre son expression uniquement pendant l’étape de transformation de la bactérie.
Les inventeurs sont également très récemment parvenus à modifier génétiquement des bactéries comprenant à l’état sauvage un gène conférant à la bactérie la résistance à un ou plusieurs antibiotiques afin de les rendre sensibles au(x)dit(s) antibiotique(s), ce qui a permis de faciliter l’utilisation de leur outil génétique basé sur l’utilisation d’au moins deux acides nucléiques. Ils sont ainsi parvenus à modifier génétiquement la souche C. beijerinckii DSM 6423 naturellement productrice d’isopropanol. Ils sont en particulier parvenus à éliminer de cette souche un plasmide naturel non essentiel pour la souche, identifié dans la présente description en tant que « pNF2 » (cf. FRI 8/73492).
Les inventeurs ont ensuite découvert, et révèlent pour la première fois dans le cadre de la présente invention, que l’élimination de ce plasmide pNF2, permet d’obtenir une bactérie C. beijerinckii DSM 6423 pour laquelle l’efficacité d’introduction de matériel génétique (i.e. de transformation) est augmentée d’un facteur compris entre environ 101 et 5 x 103. Comme expliqué ci-dessous, les inventeurs ont également réussi à
améliorer encore de manière très significative l’outil génétique basé sur l’utilisation d’au moins deux acides nucléiques, en utilisant une partie du plasmide pNF2 afin de concevoir des acides nucléiques particuliers porteurs d’une séquence permettant de modifier le matériel génétique d’une bactérie et/ou d’exprimer au sein d’une bactérie une séquence d’ADN absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. Ces acides nucléiques et nouveaux outils améliorent de manière spectaculaire l’efficacité de transformation des bactéries, en particulier l’efficacité de transformation de bactéries préalablement débarrassées du ou des plasmides naturels qu’elles contiennent à l’état sauvage.
La présente invention facilite ainsi de manière très avantageuse l’efficacité de transformation et donc l’exploitation des bactéries, en particulier à l’échelle industrielle.
RESUME DE L’INVENTION
Les inventeurs décrivent, dans le contexte de la présente invention et pour la première fois, un acide nucléique (également identifié dans le présent texte en tant que acide nucléique « OPT ») facilitant la transformation des bactéries (en améliorant le maintien au sein desdites bactéries de l’ensemble du matériel génétique introduit). L’acide nucléique OPT comprend i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. La séquence SEQ ID NO : 126 est également identifiée dans le présent texte en tant qu’acide nucléique « OREP ».
Les inventeurs sont parvenus à améliorer les fréquences de transformation d’un acide nucléique au sein de la bactérie C. beijerinckii DSM 6423 notamment en supprimant la séquence OREP au sein de ladite bactérie et en utilisant avantageusement tout ou partie de cette séquence OREP pour construire des acides nucléiques et/ou outils génétiques permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
La séquence OREP comprend une séquence nucléotidique (SEQ ID NO : 127) codant pour une protéine impliquée dans la réplication d’un acide nucléique OPT d’intérêt. Cette protéine impliquée dans la réplication est également identifiée dans le présent texte en tant que protéine « REP » (SEQ ID NO : 128 - « MNNNNTESEELKEQSQLLLDKCTKKKKKNPKFSSYIEPLVSKKLSERIKECGDFLQMLSDLNLE NSKLHRASFCGNRFCPMCSWRIACKDSLEISILMEHLRKEESKEFIFLTLTTPNVKGADLDNSIKA YNKAFKKLMERKEVKSIVKGYIRKLEVTYNLDKSSKSYNTYHPHFHVVLAVNRSYFKKQNLYIN HHRWLSLWQESTGDYSITQVDVRKAKINDYKEVYELAKYSAKDSDYLINREVFTVFYKSLKGK QVLVFSGLFKDAHKMYKNGELDLYKKLDTIEYAYMVSYNWLKKKYDTSNIRELTEEEKQKFNK NLIEDVDIE »). La protéine REP possède un domaine conservé chez les firmicutes, nommé « COG 5655 » (Plasmid rolling circle réplication initiator protein REP), de séquence SEQ ID NO : 129.
Est également décrit un outil génétique permettant la transformation optimisée puis la modification par recombinaison homologue du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel d’une bactérie appartenant au phylum des Firmicutes, par exemple d’une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus (Hidalgo-Cantabrana, C. et al. ; Yadav, R. et al.).
Dans un mode de réalisation particulier, l’outil de modification par recombinaison homologue se caractérise typiquement i) en ce qu’il comprend au moins :
- un « premier » acide nucléique codant au moins une endonucléase d’ADN, par exemple l’enzyme Cas9, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- au moins un « deuxième » acide nucléique contenant une matrice de réparation permettant, par un mécanisme de recombinaison homologue, le remplacement d’une portion de l’ADN bactérien ciblée par l’endonucléase par une séquence d’intérêt,
en ce que ii) au moins l’un desdits acides nucléiques code en outre un ou plusieurs ARN guides (ARNg) ou en ce que l’outil génétique comprend en outre un ou plusieurs ARN guides, chaque ARN guide comprenant une structure ARN de fixation à l’endonucléase d’ADN et une séquence complémentaire de la portion ciblée de l’ADN bactérien, et de préférence iii) en ce que au moins l’un desdits acides nucléiques comprend en outre une séquence codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible, ou en ce que l’outil génétique comprend en outre un troisième acide nucléique codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible.
Est en particulier décrit un tel outil génétique comprenant au moins :
- un « premier » acide nucléique codant au moins une endonucléase d’ADN, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- un « autre » acide nucléique comprenant, ou consistant en, une séquence « d’acide nucléique OREP », i.e. comprenant, ou consistant en, i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
Dans un mode de réalisation particulier le « deuxième acide nucléique contenant une matrice de réparation » tel que décrit ci-dessus comprend cet « autre acide nucléique ».
Les inventeurs décrivent également un procédé pour transformer, et de préférence pour modifier génétiquement, par exemple par recombinaison homologue, une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, typiquement une bactérie solvantogène, de même que la/les bactérie(s) obtenue(s) (transformée(s) et typiquement modifiée(s) génétiquement) à l’aide d’un tel procédé. Ce procédé comprend avantageusement une étape de transformation de la bactérie par introduction dans ladite bactérie de tout ou partie d’un outil génétique tel que décrit dans le présent texte, en particulier d’un acide nucléique (« acide nucléique
OREP ») comprenant, ou consistant en, i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
Dans un mode de réalisation particulier, ce procédé comprend avantageusement les étapes suivantes : a) d’introduction dans la bactérie d’un outil génétique tel que décrit dans le présent texte, de préférence en présence d’un agent inducteur de l’expression de la protéine anti-CRISPR, et
b) de culture de la bactérie transformée obtenue à l’issue de l’étape a) sur un milieu ne contenant pas l’agent inducteur de l’expression de la protéine anti-CRISPR, et permettant typiquement l’expression du complexe ribonucléoprotéique endonucléase d’ADN/ARNg, par exemple Cas9/ARNg.
Les inventeurs décrivent également un kit pour transformer, et de préférence modifier génétiquement, une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus , ou pour produire au moins un solvant, par exemple un mélange de solvants, à l’aide d’une telle bactérie. Ce kit comprend de préférence un acide nucléique tel que décrit dans le présent texte et un inducteur adapté au promoteur inductible de l’expression de la protéine anti-CRISPR sélectionné utilisé au sein de l’outil génétique tel que décrit dans le présent texte. Dans un mode de réalisation particulier, le kit comprend tout ou partie des éléments d’un outil génétique tel que décrit dans le présent texte.
Est également décrite l’utilisation d’un acide nucléique ou d’un outil génétique, divulgués pour la première fois dans le présent texte, pour transformer et éventuellement modifier génétiquement une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, de préférence une bactérie possédant à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique (typiquement un plasmide naturel).
Est aussi décrite pour la première fois dans le présent texte l’utilisation d’un acide nucléique, d’un outil génétique, d’un procédé pour transformer et de préférence modifier génétiquement une telle bactérie, de la bactérie obtenue par un tel procédé et/ou d’un kit, pour permettre la production, de préférence à l’échelle industrielle, d’un solvant ou d’un mélange de solvants, de préférence d’acétone, de butanol, d’éthanol, d’isopropanol ou d’un mélange de ceux-ci, typiquement d’un mélange isopropanoFbutanol, butanol/ éthanol ou isopropanol/éthanol.
DESCRIPTION DETAILLEE DE L’INVENTION
Bien qu’utilisées en industrie depuis plus d’un siècle, les connaissances sur les bactéries solvantogènes, en particulier appartenant au genre Clostridium, sont limitées par les difficultés rencontrées pour les modifier génétiquement. Par exemple, les bactéries du genre Clostridium naturellement productrice d’isopropanol, typiquement possédant dans leur génome un gène adh codant une alcool-déshydrogénase primaire/secondaire qui permet la réduction de l’acétone en isopropanol, se distinguent à la fois génétiquement et fonctionnellement des bactéries capables à l’état naturel d’une fermentation ABE.
Les inventeurs sont avantageusement parvenus, dans le contexte de la présente invention, à transformer et à modifier génétiquement, une bactérie du genre Clostridium naturellement productrice d’isopropanol, la bactérie C. beijerinckii DSM 6423, ainsi que la souche de référence C. acetobutylicum DSM 792.
Une partie des travaux décrits dans la partie expérimentale ont été réalisés au sein d’une souche capable de fermentation IBE, i.e. la souche C. beijerinckii DSM 6423 dont le génome et une analyse transcriptomique ont été décrits récemment par les inventeurs (Maté de Gerando et al., 2018).
Lors de l’assemblage du génome de cette souche, les inventeurs ont en particulier découvert, en plus du chromosome, la présence d’éléments génétiques mobiles (numéro d’accession PRJEB11626 - https://www.ebi.ac.uk/ena/data/view/PRJEB11626) : deux plasmides naturels (pNFl et pNF2) et un bactériophage linéaire (F6423).
La souche C. beijerinckii DSM 6423 est naturellement sensible à l’érythromycine mais résistante au thiamphénicol. La demande de brevet n° FRI 8/73492 décrit une souche particulière, la souche C. beijerinckii DSM 6423 AcatB (également identifiée dans le présent texte en tant que C. beijerinckii IFP962 AcatB), rendue sensible au thiamphénicol. Dans un mode de réalisation particulier de l’invention, les inventeurs sont parvenus à supprimer de la souche C. beijerinckii DSM 6423 son plasmide naturel pNF2 et ont obtenu une souche C. beijerinckii DSM6423 AcatB ApNF2 (également identifiée dans le présent texte en tant que C. beijerinckii IFP963 AcatB ApNF2). Cette souche est caractérisée pour la première fois dans le cadre de la présente demande. Elle a été enregistrée le 20 février 2019 sous le numéro de dépôt LMG P- 31277 auprès de la collection BCCM-LMG. Cette souche est dépourvue du gène catB de séquence SEQ ID NO : 18 et du plasmide pNF2 (sauvage). La description concerne également toute bactérie dérivée, clone, mutant ou version génétiquement modifiée de celle-ci, typiquement également dépourvue du gène catB de séquence SEQ ID NO : 18 et du plasmide pNF2 (sauvage). Elle concerne aussi plus généralement toute bactérie possédant à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique (identifiée dans le présent texte en tant que « ADN (bactérien) non chromosomique » ou « plasmide (bactérien) naturel »), modifiée génétiquement à l’aide d’un acide nucléique et/ou outil génétique décrit(s) dans le cadre de la présente invention de manière à ne plus comprendre au moins l’une de ses molécules d’ADN non chromosomique, typiquement plusieurs de ses
molécules d’ADN non chromosomique (par exemple deux, trois ou quatre molécules d’ADN non chromosomique), de préférence l’ensemble de ses molécules d’ADN non chromosomique.
Les inventeurs décrivent ainsi, dans la présente demande, une bactérie solvantogène appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus , plus particulièrement une bactérie du genre Clostridium, naturellement capable (i.e. capable à l’état sauvage) de produire de l’isopropanol, en particulier naturellement capable d’effectuer une fermentation IBE, qui a été modifiée génétiquement et a, du fait de cette modification génétique, en particulier perdu au moins un plasmide naturel (i.e. un plasmide naturellement présent au sein de la version sauvage de ladite bactérie), de préférence l’ensemble de ses plasmides naturels, ainsi que les outils, en particulier les outils génétiques, ayant permis son obtention.
Ces outils présentent l’avantage de faciliter considérablement la transformation et la modification génétique des bactéries. Les expériences réalisées par les inventeurs ont démontré l’utilisation possible des outils et plus généralement de la technologie décrite dans le présent texte pour modifier génétiquement une bactérie, en particulier des bactéries appartenant au phylum des Firmicutes, par exemple des bactéries du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, notamment des bactéries du genre Clostridium capables, à l’état sauvage, de produire de l’isopropanol, en particulier d’effectuer une fermentation IBE, en particulier celles porteuses d’un gène codant une enzyme responsable de la résistance à un antibiotique, en particulier un gène codant une amphénicol-O-acetyltransférase, par exemple une chloramphénicol-O- acetyltransférase ou une thiamphénicol-O-acetyltransférase.
Dans un mode de réalisation particulier, les inventeurs sont ainsi parvenus à rendre sensible à antibiotique appartenant à la classe des amphénicols, une bactérie naturellement porteuse (porteuse à l’état sauvage) d’un gène codant une enzyme responsable de la résistance à ces antibiotiques.
D’autres bactéries préférées contiennent, à l’état sauvage, à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique.
Des bactéries également préférées contiennent, à l’état sauvage, à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique, ainsi qu’un gène conférant une résistance à un antibiotique. Dans un mode de réalisation particulier, ce gène code une amphénicol-O- acetyltransférase, par exemple une chloramphénicol-O-acetyltransférase ou une thiamphénicol-O- acetyltransférase.
Un premier objet décrit par les inventeurs concerne un acide nucléique (identifié dans le présent texte en tant que acide nucléique « OPT »), avantageusement utilisable pour faciliter la transformation des bactéries en améliorant le maintien au sein desdites bactéries de l’ensemble du matériel génétique introduit. Cet acide nucléique OPT comprend i) tout ou partie de la séquence SEQ ID NO : 126 (séquence « OREP ») ou d’un variant fonctionnel de celle-ci et ii) une séquence (également identifiée dans le présent texte en tant que « séquence d’intérêt ») permettant la modification du matériel génétique d’une bactérie et/ou l’expression
au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
La séquence OREP (SEQ ID NO : 126) comprend une séquence nucléotidique de séquence SEQ ID NO : 127. La séquence SEQ ID NO : 127 comprend de préférence une séquence codant pour une protéine impliquée dans la réplication de l’acide nucléique OPT. Une protéine considérée comme impliquée dans la réplication est également identifiée dans le présent texte en tant que protéine « REP » (SEQ ID NO : 128). La protéine REP possède un domaine conservé chez les Firmicutes, nommé « COG 5655 », de séquence SEQ ID NO : 129.
Dans un mode de réalisation particulier, l’acide nucléique OPT comprend une partie de la séquence OREP (SEQ ID NO : 126), typiquement un ou plusieurs fragments de la séquence OREP, de préférence au moins la séquence codant la protéine REP (SEQ ID NO : 128) ou un variant ou fragment fonctionnel de celle-ci (i.e. le fragment impliqué dans la réplication), typiquement la séquence SEQ ID NO : 127 ou un variant ou fragment de celle-ci codant le fragment impliqué, au sein de la protéine REP, dans la réplication d’un acide nucléique OPT. Le fragment fonctionnel de la séquence OREP codant le fragment, présent au sein de la protéine REP, impliqué dans la réplication d’un acide nucléique OPT, comprend le domaine de séquence SEQ ID NO : 129. Des exemples de tels fragments d’acide nucléique codant un fragment fonctionnel de la protéine REP, et variants de ceux-ci, sont susceptibles d’être facilement préparés par l’homme du métier. Un exemple typique de variant présente une homologie de séquence avec la séquence SEQ ID NO : 127 comprise entre 70% et 100%, de préférence entre 85 et 99%, de manière encore plus préférée entre 95 et 99%, par exemple de 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100%.
Dans un mode de réalisation préféré, le fragment ou variant fonctionnel de la séquence OREP code pour une protéine impliquée dans la réplication de l’acide nucléique OPT.
Dans un mode de réalisation préféré de l’invention, le fragment ou variant fonctionnel de la séquence OREP comprend, en plus de la séquence codant une protéine (par exemple la protéine REP) impliquée dans la réplication de l’acide nucléique OPT (par exemple une construction génétique de type plasmide) ou d’un variant ou fragment fonctionnel de celle-ci, un site de 1 à 150 bases, de préférence de 1 à 15 bases, par exemple une séquence riches en bases A et T (Rajewska et al.), de préférence un site présent au sein du plasmide pNF2 de séquence SEQ ID NO : 1 18, permettant la fixation d’une protéine permettant la réplication de l’acide nucléique OPT.
La séquence d’intérêt permettant la modification du matériel génétique de la bactérie est typiquement une matrice de modification permettant, par exemple par un mécanisme de recombinaison homologue, par exemple selon l’un des procédés décrits dans le présent texte, le remplacement d’une portion du matériel génétique de la bactérie par une séquence d’intérêt. La séquence d’intérêt permettant la modification du matériel génétique de la bactérie peut aussi être une séquence reconnaissant (liant au moins en partie), et de préférence ciblant, i.e. reconnaissant et permettant la coupure, dans le génome d’une bactérie d’intérêt,
d’au moins un brin i) d’une séquence cible, ii) d’une séquence contrôlant la transcription d’une séquence cible, ou iii) d’une séquence flanquant une séquence cible.
La séquence d’intérêt permettant l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie permet typiquement à la bactérie d’exprimer une ou plusieurs protéines qu’elle est incapable d’exprimer, ou d’exprimer en quantité suffisante, à l’état sauvage.
Selon un aspect particulier, « l’acide nucléique OPT » comprend en outre iii) une séquence codant une endonucléase d’ADN, par exemple Cas9, et/ou iv) un ou plusieurs ARN guides (ARNg), chaque ARNg comprenant une structure ARN de fixation à l’endonucléase d’ADN et une séquence complémentaire de la portion ciblée du matériel génétique de la bactérie.
Selon un autre aspect particulier, « l’acide nucléique OPT » ne présente pas de méthylation au niveau des motifs reconnus par les méthyltransférases de type Dam et Dcm.
De manière préférée, « l’acide nucléique OPT » est sélectionné parmi une cassette d’expression et un vecteur, et est de préférence un plasmide, par exemple un plasmide ayant une séquence sélectionnée parmi SEQ ID NO : 1 19, SEQ ID NO : 123, SEQ ID NO : 124 et SEQ ID NO : 125.
Un autre objet décrit par les inventeurs concerne un outil génétique utilisable pour transformer et/ou modifier génétiquement une bactérie d’intérêt, typiquement une bactérie telle que décrite dans le présent texte appartenant au phylum des Firmicutes, par exemple d’une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus , de préférence une bactérie du genre Clostridium naturellement capable (i.e. capable à l’état sauvage) de produire de l’isopropanol, en particulier naturellement capable d’effectuer une fermentation IBE, de préférence une bactérie résistante naturellement à un ou plusieurs antibiotiques, telle qu’une bactérie C. beijerinckii. Une bactérie préférée possède à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique.
Par bactérie appartenant au phylum des Firmicutes on entend, dans le contexte de la présente description, les bactéries appartenant à la classe des Clostridia, Mollicutes, Bacilli ou des Togobacteria, de préférence à la classe des Clostridia ou des Bacilli.
Des bactéries particulières appartenant au phylum des Firmicutes comprennent par exemple les bactéries du genre Clostridium, les bactéries du genre Bacillus ou les bactéries du genre Lactobacillus.
Par « bactérie du genre Clostridium », on entend en particulier les espèces de Clostridium dites d’intérêt industriel, typiquement les bactéries solvantogènes ou acétogènes du genre Clostridium. L’expression « bactérie du genre Clostridium » englobe les bactéries sauvages ainsi que les souches dérivées de celles- ci, modifiées génétiquement dans le but d’améliorer leur performance (par exemple surexprimant les gènes ctfA, ctfB et a de) sans avoir été exposées au système CRISPR.
Par « espèce de Clostridium d’intérêt industriel » on entend les espèces capables de produire, par fermentation, des solvants et des acides tels que l’acide butyrique ou l’acide acétique, à partir de sucres ou
d’oses, typiquement à partir de sucres comprenant 5 atomes de carbone tels que le xylose, l’arabinose ou le fructose, de sucres comprenant 6 atomes de carbones tels que le glucose ou le mannose, de polyosides tels que la cellulose ou les hémicelluloses et/ou de toute autre source de carbone assimilable et utilisable par les bactéries du genre Clostridium (CO, CO2, et méthanol par exemple). Des exemples de bactéries solvantogènes d’intérêt sont les bactéries du genre Clostridium productrices d’acétone, de butanol, d’éthanol et/ou d’isopropanol, telles que les souches identifiées dans la littérature en tant que « souche ABE » [souches réalisant des fermentations permettant la production d’acétone, de butanol et d’éthanol] et « souche IBE » [souches réalisant des fermentations permettant la production d’isopropanol (par réduction de l’acétone), de butanol et d’éthanol]. Des bactéries solvantogènes du genre Clostridium peuvent être sélectionnées par exemple parmi C. acetobutylicum, C. cellulolyticum, C. phytofermentans, C. beijerinckii, C. saccharobutylicum, C. saccharoperbutylacetonicum, C. sporogenes, C. butyricum, C. aurantibutyricum et C. tyrobutyricum, de manière préférée parmi C. acetobutylicum, C. beijerinckii, C. butyricum, C. tyrobutyricum et C. cellulolyticum, et de manière encore plus préférée parmi C. acetobutylicum et C. beijerinckii.
Une bactérie capable de produire de l’isopropanol à l’état sauvage, en particulier capable d’effectuer une fermentation IBE à l’état sauvage, peut être par exemple une bactérie sélectionnée parmi une bactérie C. beijerinckii, une bactérie C. diolis, une bactérie C. puniceum, une bactérie C. butyricum, une bactérie C. saccharoperbutylacetonicum, une bactérie C. botulinum, une bactérie C. drakei, une bactérie C. scatologenes, une bactérie C. perfringens, et une bactérie C. tunisiense, de préférence une bactérie sélectionnée parmi une bactérie C. beijerinckii, une bactérie C. diolis, une bactérie C. puniceum et une bactérie C. saccharoperbutylacetonicum. Une bactérie naturellement capable de produire de l’isopropanol, en particulier capable d’effectuer une fermentation IBE à l’état sauvage, particulièrement préférée est une bactérie C. beijerinckii.
Les bactéries acétogènes d’intérêt sont des bactéries productrices d’acides et/ou de solvants à partir de CO2 et ¾. Des bactéries acétogènes du genre Clostridium peuvent être sélectionnées par exemple parmi C. aceticum, C. thermoaceticum, C. ljungdahlii, C. autoethanogenum, C. difficile, C. scatologenes et C. carboxydivorans.
Dans un mode de réalisation particulier, la bactérie du genre Clostridium concernée est une « souche ABE », de préférence la souche DSM 792 (également désignée souche ATCC 824 ou encore LMG 5710) de C. acetobutylicum, ou la souche NCIMB 8052 de C. beijerinckii.
Dans un autre mode de réalisation particulier, la bactérie du genre Clostridium concernée est une « souche IBE », de préférence un sous-clade de C. beijerinckii sélectionné parmi DSM 6423, LMG 7814, LMG 7815, NRRL B-593, NCCB 27006, ou une bactérie C. aurantibutyricum DSZM 793 (Georges et al., 1983), et un sous-clade d’une telle bactérie C. beijerinckii ou C. aurantibutyricum présentant au moins 90%, 95%, 96%, 97%, 98% ou 99% d’identité avec la souche DSM 6423. Une bactérie C. beijerinckii, ou un sous-clade de bactérie C. beijerinckii, particulièrement préféré(e) est dépourvu(e) du plasmide pNF2.
Les génomes respectifs des sous-clades LMG 7814, LMG 7815, NRRL B-593 et NCCB 27006 d’une part, et DSZM 793 d’autre part, présentent des pourcentages d’identité de séquence d’au moins 97% avec le génome du sous-clade DSM 6423.
Les inventeurs ont réalisé des tests fermentaires confirmant que les bactéries C. beijerinckii de sous-clade DSM 6423, LMG 7815 et NCCB 27006 sont capables de produire de l’isopropanol à l’état sauvage (cf. tableau 1).
[Tableau 1]
Bilan des essais de fermentation de glucose à l’aide des souches naturellement productrices d’isopropanol C. beijerinckii DSM 6423, LMG 7815 et NCCB 27006.Dans un mode de réalisation particulièrement préféré de l’invention, la bactérie C. beijerinckii est la bactérie de sous-clade DSM 6423.
Dans encore un autre mode de réalisation préféré de l’invention, la bactérie C. beijerinckii est une souche C. beijerinckii IFP963 AcalB ApNF2 (enregistrée le 20 février 2019 sous le numéro de dépôt LMG P-31277 auprès de la collection BCCM-LMG, et également identifiée dans le présent texte en tant que C. beijerinckii DSM 6423 AcatB ApNF2), ou une version génétiquement modifiée de celle-ci. La bactérie C. beijerinckii IFP963 AcatB ApNF2, ou ladite version génétiquement modifiée de celle-ci, est dépourvue du gène catB de séquence SEQ ID NO : 18 et du plasmide pNF2.
Par « bactérie du genre Bacillus », on entend en particulier B. amyloliquefaciens, B. thurigiensis, B. coagulans, B. cereus, B. anthracis ou encore B. subtilis.
Au cours d’expérimentations récentes, les inventeurs ont observé que l’éviction du plasmide naturel pNF2 présente un avantage significatif pour l’introduction et le maintien d’éléments génétiques additionnels, naturels ou synthétiques (par exemple de cassette(s) d’expression ou de vecteur(s) plasmidique(s) d’expression). La souche IFP963 AcatB ApNF2 peut ainsi être transformée avec une efficacité 10 à 5 x 103 fois supérieure à son homologue sauvage ou à la souche DSM 6423 AcatB (également identifiée dans le présent texte en tant que IFP962 AcatB).
La bactérie destinée à être transformée, et de préférence modifiée génétiquement, est de préférence une bactérie qui a été exposée à une première étape de transformation et à une première étape de modification génétique à l’aide d’un acide nucléique ou outil génétique selon l’invention ayant permis de supprimer au moins une molécule d’ADN extrachromosomique (typiquement au moins un plasmide) naturellement présente au sein de ladite bactérie à l’état sauvage.
Un outil génétique particulier décrit par les inventeurs se caractérise i) en ce qu’il comprend au moins :
- un « premier » acide nucléique codant au moins une endonucléase d’ADN, par exemple l’enzyme Cas9, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- au moins un « deuxième » acide nucléique contenant une matrice de réparation permettant, par un mécanisme de recombinaison homologue, le remplacement d’une portion de l’ADN bactérien ciblée par l’endonucléase par une séquence d’intérêt,
en ce que ii) au moins l’un desdits acides nucléiques code en outre un ou plusieurs ARN guides (ARNg) ou en ce que l’outil génétique comprend en outre un ou plusieurs ARN guides, chaque ARN guide comprenant une structure ARN de fixation à l’endonucléase d’ADN et une séquence complémentaire de la portion ciblée de l’ADN bactérien.
Un exemple d'outil génétique décrit par les inventeurs contient, tout comme le système CRISPR/Cas, deux éléments essentiels distincts, i.e. i) une endonucléase, dans le cas présent la nucléase associée au système CRISPR (Cas ou « CRISPR associated protein »), Cas, et ii) un ARN guide. L’ARN guide se présente sous la forme d'un ARN chimérique qui consiste en la combinaison d’un ARN bactérien CRISPR (ARNcr) et d’un ARNtracr (//vms-activating ARN CRISPR) (linek et al., Science 2012). L'ARNg combine la spécificité de ciblage de l' ARNcr correspondant aux "séquences espaçantes" qui servent de guides aux protéines Cas, et les propriétés conformationnelles de l' ARNtracr en un transcrit unique. Lorsque l'ARNg et la protéine Cas sont exprimés simultanément dans la cellule, la séquence génomique cible est typiquement avantageusement modifiée de manière permanente grâce à une matrice de réparation fournie.
L’outil génétique selon l’invention se caractérise de préférence iii) en ce que au moins l’un desdits (« premier » et « deuxième ») acides nucléiques comprend en outre une séquence codant une protéine anti- CRISPR placée sous le contrôle d’un promoteur inductible, ou en ce que l’outil génétique comprend en outre un troisième acide nucléique codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible.
Est en particulier décrit un outil génétique comprenant au moins :
- un premier acide nucléique codant au moins une endonucléase d’ADN, dans lequel la séquence codant l’endonucléase d’ADN est placée sous le contrôle d’un promoteur, et
- un autre acide nucléique (ou un « énième acide nucléique ») comprenant, ou consistant en, une séquence d’acide nucléique « OPT », i.e. une séquence comprenant i) tout ou partie de la séquence SEQ ID NO : 126 (« OREP ») et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie, au moins l’un desdits acides nucléiques de cet outil génétique particulier comprenant de préférence en outre une séquence codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible, ou ledit outil génétique particulier comprenant de préférence en outre un troisième acide nucléique codant une protéine anti-CRISPR placée sous le contrôle d’un promoteur inductible.
Dans un mode de réalisation particulier le « deuxième » ou « énième acide nucléique contenant une matrice de réparation » tel que décrit ci-dessus comprend, ou consiste en, cet « autre acide nucléique ».
Dans un autre mode de réalisation particulier le « premier acide nucléique » code en outre un ou plusieurs ARN guides (ARNg).
Par « acide nucléique », on entend au sens de l’invention, toute molécule d’ADN ou d’ARN naturelle, synthétique, semi-synthétique ou recombinante, éventuellement modifiée chimiquement (i.e. comprenant des bases non naturelles, des nucléotides modifiés comprenant par exemple une liaison modifiée, des bases modifiées et/ou des sucres modifiés), ou optimisée de manière à ce que les codons des transcrits synthétisés à partir des séquences codantes soient les codons les plus fréquemment trouvés chez une bactérie du genre Clostridium en vue de son utilisation chez celle-ci. Dans le cas du genre Clostridium, les codons optimisés sont typiquement des codons riches en bases adénines (« A ») et thymines (« T »).
Dans les séquences peptidiques décrites dans ce document, les acides aminés sont représentés par leur code à une lettre selon la nomenclature suivante : C : cystéine; D : acide aspartique; E : acide glutamique; F : phénylalanine; G : glycine; H : histidine; I : isoleucine; K : lysine; L : leucine ; M : méthionine ; N : asparagine ; P : proline ; Q : glutamine ; R : arginine ; S : sérine ; T : thréonine ; V : valine ; W : tryptophane et Y : tyrosine.
Un outil génétique décrit dans le contexte de la présente invention comprend un premier acide nucléique codant au moins une endonucléase d’ADN (également identifiée dans le présent texte en tant que « nucléase »), typiquement une nucléase de type Cas, par exemple Cas9 ou MAD7.
Par « Cas9 » on entend la protéine Cas9 (aussi appelée CRISPR-associated protein 9, Csnl ou Csxl2) ou un fragment protéique, peptidique ou polypeptidique fonctionnel de celle-ci, i.e. capable d’interagir avec le/les ARN guides et d’exercer l’activité enzymatique (nucléasique) qui lui permet de réaliser la coupure double brin de l’ADN du génome cible. « Cas9 » peut ainsi désigner une protéine modifiée, par exemple tronquée afin de supprimer les domaines de la protéine non essentiels aux fonctions prédéfinies de la protéine, en particulier les domaines non nécessaires à l’interaction avec le/les ARNg.
La nucléase MAD7 (dont la séquence d’acides aminés correspond à la séquence SEQ ID NO : 72), également identifiée en tant que « Cas 12 » ou « Cpfl », peut autrement être avantageusement utilisée dans le cadre de la présente invention en la combinant avec un ou des ARNg connu(s) de l’homme de métier capable(s) de se lier à une telle nucléase (cf. Garcia-Doval et al., 2017 et Stella S. et al., 2017).
Selon un aspect particulier, la séquence codant la nucléase MAD7 est une séquence optimisée pour être facilement exprimée dans des souches de Clostridium, de préférence la séquence SEQ ID NO : 71.
Selon un autre aspect particulier, la séquence codant la nucléase MAD7 est une séquence optimisée pour être facilement exprimée dans des souches de Bacillus, de préférence la séquence SEQ ID NO : 132.
La séquence codant Cas9 (la protéine entière ou un fragment de celle-ci) telle qu’utilisable dans l’un des exemples de modes de réalisation possibles de l’invention peut être obtenue à partir de toute protéine Cas9 connue (Makarova et al., 201 1). Des exemples de protéines Cas9 utilisables dans la présente invention incluent, sans y être limités, les protéines Cas9 de S. pyogenes (cf. SEQ ID NO : 1 de la demande WO2017/064439 et numéro d’entrée NCBI : WP_010922251.1), Streptococcus thermophilus, Streptococcus mutans, Campylobacter jejuni, Pasteurella multocida, Francisella novicida, Neisseria meningitidis, Neisseria lactamica et Légionella pneumophila (cf. Fonfara et al, 2013 ; Makarova et al, 2015).
Dans un mode de réalisation particulier, la protéine Cas9, ou un fragment protéique, peptidique ou polypeptidique fonctionnel de celle-ci, codée par l’un des acides nucléiques de l’outil génétique selon l’invention comprend, ou consiste en, la séquence d’acides aminés SEQ ID NO : 75, ou toute autre séquence d’acides aminés ayant au moins 50%, de préférence au moins 60%, d’identité avec celle-ci, et contenant au minimum les deux acides aspartiques (« D ») occupant les positions 10 (« D10 ») et 840 (« D840 ») de la séquence d’acides aminés SEQ ID NO : 75.
Dans un mode de réalisation préféré, Cas9 comprend, ou consiste en, la protéine Cas9 (Numéro d’entrée NCBI : WP_010922251.1, SEQ ID NO : 75), codée par le gène cas9 de la souche de S. pyogenes Ml GAS (Numéro d’entrée NCBI : NC 002737.2 SPy_1046, SEQ ID NO : 76) ou une version de celui-ci ayant subi une optimisation (« version optimisée ») à l’origine d’un transcrit contenant les codons utilisés
préférentiellement par les bactéries du genre Clostridium, typiquement les codons riches en bases adénines (« A ») et thymines (« T »), permettant une expression facilitée de la protéine Cas9 au sein de ce genre bactérien. Ces codons optimisés respectent le biais d’usage de codons, bien connu de l’homme de l’art, spécifique à chaque souche bactérienne.
Selon un mode de réalisation particulier, le domaine Cas9 est constitué d’une protéine Cas9 entière, de préférence la protéine Cas9 de S. pyogenes ou d’une version optimisée de celle-ci.
Chacun des acides nucléiques d’un outil génétique décrit dans le présent texte, typiquement le « premier » acide nucléique et le « deuxième » ou « énième » acide nucléique dudit outil génétique, consiste en une entité distincte et se présente typiquement sous la forme d’une cassette d’expression (ou « construction ») telle que par exemple un acide nucléique comprenant au moins un promoteur transcriptionnel lié de manière opérationnelle (au sens où l’entend l’homme du métier) à une ou plusieurs séquences (codantes) d’intérêt, par exemple à un opéron comprenant plusieurs séquence codantes d’intérêt dont les produits d’expression concourent à la réalisation d'une fonction d’intérêt au sein de la bactérie, ou un acide nucléique comprenant en outre une séquence activatrice et/ou un terminateur de transcription ; ou sous la forme d’un vecteur, circulaire ou linéaire, simple ou double brin, par exemple un plasmide, un phage, un cosmide, un chromosome artificiel ou synthétique, comprenant une ou plusieurs cassettes d’expression telles que définies ci-dessus. De manière préférée, le vecteur est un plasmide.
Les acides nucléiques d’intérêt, typiquement les cassettes ou vecteurs d’expression, peuvent être construits par des techniques classiques bien connues de l’homme du métier et peuvent comporter un(e) ou plusieurs promoteurs, origines de réplication bactérienne (séquences ORI), séquences de terminaison, gènes de sélection, par exemple gènes de résistance à un antibiotique, et séquences (« régions flanquées ») permettant l’insertion ciblée de la cassette ou du vecteur. Par ailleurs, ces cassettes et vecteurs d’expression peuvent être intégrés au sein du génome bactérien par des techniques bien connues de l’homme du métier. Des séquences ORI d’intérêt peuvent être choisies parmi pIP404, rAMbI, repH (origine de réplication chez C. acetobutylicum), ColEl ou rep (origine de réplication chez E. coli), ou toute autre origine de réplication permettant le maintien du vecteur, typiquement du plasmide, au sein d’une cellule bactérienne, par exemple d’une cellule de Clostridium ou de Bacillus.
Dans le contexte de la présente invention, une séquence ORI préférée est celle présente au sein de la séquence OREP (SEQ ID NO : 126) du plasmide pNF2 (SEQ ID NO : 1 18).
Des séquences de terminaison d’intérêt peuvent être choisies parmi celles des gènes adc, thl, de l’ opéron bcs, ou de tout autre terminateur, bien connu de l’homme de l’art, permettant l’arrêt de la transcription au sein d’une cellule bactérienne, par exemple d’une cellule de Clostridium ou de Bacillus.
Des gènes de sélection (gènes de résistance) d’intérêt peuvent être choisis parmi ermB, catP, bla, tetA, tetM, et/ou tout autre gène de résistance à l’ampicilline, à l’érythromycine, au chloramphenicol, au
thiamphénicol, à la spectinomycine, à la tétracycline ou à tout autre antibiotique pouvant être utilisé pour sélectionner des bactéries, par exemple du genre Clostridium ou Bacillus, bien connu de l’homme de l’art. La séquence codant l’endonucléase d’ADN, par exemple Cas9, éventuellement présente au sein de l’un des acides nucléiques d’un outil génétique selon l’invention, peut être placée sous le contrôle d’un promoteur. Ce promoteur peut être un promoteur constitutif ou un promoteur inductible. Dans un mode de réalisation préféré, le promoteur contrôlant l’expression de la nucléase est un promoteur inductible.
Des exemples de promoteurs constitutifs utilisables dans le cadre de la présente invention peuvent être sélectionnés parmi le promoteur du gène thl, du gène ptb, du gène adc, de l’opéron BCS, ou un dérivé de ceux-ci, de préférence un dérivé fonctionnel mais plus court (tronqué) tel que le dérivé « miniPthl » du promoteur du gène thl de C. acetobutylicum (Dong et al., 2012), ou tout autre promoteur, bien connu de l’homme de métier, permettant l’expression d’une protéine au sein d’une bactérie d’intérêt, par exemple d’une bactérie du genre Clostridium.
Des exemples de promoteurs inductibles utilisables dans le cadre de la présente invention peuvent être sélectionnés par exemple parmi un promoteur dont l’expression est contrôlée par le répresseur transcriptionnel TetR, par exemple le promoteur du gène telA (gène de résistance à la tétracycline originellement présent sur le transposon TnlO d’E. coli ) ; un promoteur dont l’expression est contrôlée par la L-arabinose, par exemple le promoteur du gène ptk (Zhang et al., 2015), de préférence en combinaison avec la cassette araR de régulation de l’expression de C. acetobutylicum de façon à construire un système ARAi (Zhang et al., 2015) ; un promoteur dont l’expression est contrôlée par la laminaribiose (dimère de glucose b- 1,3), par exemple le promoteur du gène celC, de préférence immédiatement suivi du gène répresseur glyR3 et du gène d’intérêt (Mearls et al. 2015) ou le promoteur du gène celC (Newcomb et al., 201 1) ; un promoteur dont l’expression est contrôlée par le lactose, par exemple le promoteur du gène bgaL (Banerjee et al., 2014) ; un promoteur dont l’expression est contrôlée par le xylose, par exemple le promoteur du gène xylB (Nariya et al., 2011) ; et un promoteur dont l’expression est contrôlée par l’exposition aux UV, par exemple le promoteur du gène ben (Dupuy et al., 2005).
Un promoteur dérivé de l’un des promoteurs décrits ci-dessus, de préférence un dérivé fonctionnel plus court (tronqué) peut également être utilisé dans le contexte de l’invention.
D’autres promoteurs inductibles utilisables dans le contexte de la présente invention sont également décrits par exemple dans les articles de Ransom et al. (2015), Currie et al. (2013) et Hartman et al. (201 1).
Un promoteur inductible préféré est un promoteur dérivé de tel A , inductible à l’anhydrotétracycline (aTc ; moins toxique que la tétracycline et capable de lever l’inhibition du répresseur transcriptionnel TetR à plus faible concentration), choisi parmi Pcm-2tet01 et Pcm-2tet02/l (Dong et al., 2012).
Un autre promoteur inductible préféré est un promoteur inductible par le lactose, par exemple le promoteur du gène bgaL (Banerjee et al., 2014).
Un acide nucléique d’intérêt particulier, typiquement une cassette ou un vecteur d’expression, comprend une ou plusieurs cassettes d’expression, chaque cassette codant un ARNg.
Le terme « ARN guide » ou « ARNg » désigne au sens de l’invention une molécule d’ARN capable d’interagir avec une endonucléase d’ADN afin de la guider vers une région cible du chromosome bactérien. La spécificité de coupure est déterminée par l’ARNg. Comme expliqué précédemment, chaque ARNg comprend deux régions :
- une première région (communément appelée région « SDS »), à l’extrémité 5’ de l’ARNg, qui est complémentaire de la région chromosomique cible et qui imite l’ARNcr du système CRISPR endogène, et
- une seconde région (communément appelé région « handle »), à l’extrémité 3’ de l’ARNg, qui mime les interactions d’appariement de bases entre l’ARNtracr (« trans-activating crRNA ») et l’ARNcr du système CRISPR endogène et présente une structure double brin en tige et boucle s’achevant en 3’ par une séquence essentiellement simple brin. Cette seconde région est essentielle à la fixation de l’ARNg à l’endonucléase d’ADN.
La première région de l’ARNg (région « SDS ») varie selon la séquence chromosomique ciblée.
La région « SDS » de l’ARNg qui est complémentaire de la région chromosomique cible, comprend au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1 et 40 nucléotides. De préférence, cette région a une longueur de 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides.
La seconde région de l’ARNg (région « handle ») a une structure en tige et boucle (ou structure en épingle à cheveux). Les régions « handle » des différents ARNg ne dépendent pas de la cible chromosomique choisie.
Selon un mode de réalisation particulier, la région « handle » comprend, ou consiste en, une séquence d’au moins 1 nucléotide, de préférence au moins 1, 50, 100, 200, 500 et 1000 nucléotides, typiquement entre 1 et 1000 nucléotides. De préférence, cette région a une longueur de 40 à 120 nucléotides.
La longueur totale d’un ARNg est en général de 50 à 1000 nucléotides, de préférence de 80 à 200 nucléotides, et de manière plus particulièrement préférée de 90 à 120 nucléotides. Selon un mode de réalisation particulier, un ARNg tel qu’utilisé dans la présente invention a une longueur comprise entre 95 et 1 10 nucléotides, par exemple une longueur d’environ 100 ou d’environ 1 10 nucléotides.
L’homme du métier peut aisément définir la séquence et la structure des ARNg selon la région chromosomique à cibler en utilisant des techniques bien connues (voir par exemple l’article de DiCarlo et al., 2013).
La région/portion/séquence d’ADN ciblée au sein du génome bactérien, par exemple du chromosome bactérien, peut correspondre à une portion d’ADN non codante ou à une portion d’ADN codante.
Dans un mode de réalisation particulier consistant à modifier une séquence donnée, la portion ciblée de l’ADN bactérien est essentielle à la survie bactérienne. Elle correspond par exemple à n’importe quelle région du chromosome bactérien ou à n’importe quelle région située sur de l’ADN non chromosomique, par exemple sur un élément génétique mobile, indispensable à la survie du micro-organisme dans des conditions de croissance particulières, par exemple un plasmide contenant un marqueur de résistance à un
antibiotique lorsque les conditions de croissance prévues imposent de cultiver la bactérie en présence dudit antibiotique.
Dans un autre mode de réalisation particulier visant à supprimer un élément génétique non indispensable dans les conditions de croissance particulières associées à la culture du micro-organisme, la portion ciblée de l’ADN bactérien peut correspondre à n’importe quelle région dudit ADN bactérien non chromosomique. Des exemples particuliers de portion d’ADN ciblée au sein d’une bactérie du genre Clostridium sont les séquences utilisées dans l’exemple 1 de la partie expérimentale. Il s’agit par exemple des séquences codant les gènes bdhA (SEQ ID NO : 77) et bdhB (SEQ ID NO : 78). La région/portion/séquence d’ADN ciblée est suivie d’une séquence « PAM » (« protospacer adjacent motif ») qui intervient dans la liaison à l’endonucléase d’ADN.
La région « SDS » d’un ARNg donné est identique (à 100%) ou identique à 80% au moins, de préférence à 85%, 90%, 95%, 96%, 97%, 98% ou 99% au moins à la région/portion/séquence d’ADN ciblée au sein du génome bactérien, par exemple du chromosome bactérien, et est capable de s’hybrider à tout ou partie de la séquence complémentaire de ladite région/portion/séquence, typiquement à une séquence comprenant au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1 et 40 nucléotides, de préférence à une séquence comprenant 14, 15, 16, 17, 18 ,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides.
Dans le contexte de l’invention, l’acide nucléique d’intérêt peut comprendre un ou plusieurs ARN guides (ARNg) ciblant une séquence (« séquence cible », « séquence ciblée » ou « séquence reconnue »). Ces différents ARNg peuvent cibler des régions chromosomiques, ou des régions appartenant à l’ADN bactérien non chromosomique (par exemple aux éléments génétiques mobiles) éventuellement présents au sein du microorganisme, identiques ou différentes.
Les ARNg peuvent être introduits dans la cellule bactérienne sous la forme de molécules d’ARNg (matures ou précurseurs), sous la forme de précurseurs ou sous la forme d’un ou plusieurs acides nucléiques codant lesdits ARNg. Les ARNg sont de préférence introduits dans la cellule bactérienne sous la forme d’un ou plusieurs acides nucléiques codant lesdits ARNg.
Lorsque le ou les ARNg sont introduits dans la cellule directement sous la forme de molécules d’ARN, ces ARNg (matures ou précurseurs) peuvent contenir des nucléotides modifiés ou des modifications chimiques leur permettant, par exemple, d’augmenter leur résistance aux nucléases et d’augmenter ainsi leur durée de vie dans la cellule. Ils peuvent notamment comprendre au moins un nucléotide modifié ou non naturel tel que, par exemple, un nucléotide comportant une base modifiée, telle que l'inosine, la méthyl-5- désoxycytidine, la diméthylamino-5-désoxyuridine, la désoxyuridine, la diamino-2,6-purine, la bromo-5- désoxyuridine ou toute autre base modifiée permettant l'hybridation. Les ARNg utilisés selon l’invention peuvent également être modifiés au niveau de la liaison intemucléotidique comme par exemple les phosphorothioates, les H-phosphonates ou les alkyl-phosphonates, ou au niveau du squelette comme par
exemple les alpha-oligonucléotides, les 2'-0-alkyl riboses ou les PNA (Peptide Nucleic Acids) (Egholm et al., 1992).
Les ARNg peuvent être des ARN naturels, synthétiques ou produits par des techniques de recombinaison. Ces ARNg peuvent être préparés par toutes méthodes connues de l’homme du métier telles que, par exemple, la synthèse chimique, la transcription in vivo ou des techniques d’amplification.
Lorsque les ARNg sont introduits dans la cellule bactérienne sous la forme d’un ou plusieurs acides nucléiques, la ou les séquences codant le ou les ARNg sont placées sous le contrôle d’un promoteur d’expression. Ce promoteur peut être constitutif ou inductible.
Lorsque plusieurs ARNg sont utilisés, l’expression de chaque ARNg peut être contrôlée par un promoteur différent. De préférence, le promoteur utilisé est le même pour tous les ARNg. Un même promoteur peut dans un mode de réalisation particulier être utilisé pour permettre l’expression de plusieurs, par exemple de quelques-uns seulement, ou en d’autres termes de tout ou partie, des ARNg destinés à être exprimés.
Dans un mode de réalisation préféré, le/les promoteurs contrôlant l’expression du/des ARNg est/sont des promoteurs inductibles.
Des exemples de promoteurs constitutifs utilisables dans le cadre de la présente invention peuvent être sélectionnés parmi le promoteur du gène thl, du gène ptb ou de l’opéron BCS, ou un dérivé de ceux-ci, de préférence miniPthl, ou tout autre promoteur, bien connu de l’homme de métier, permettant la synthèse d’un ARN (codant ou non codant) au sein de la bactérie d’intérêt.
Des exemples de promoteurs inductibles utilisables dans le cadre de la présente invention peuvent être sélectionnés parmi le promoteur du gène tel A , du gène xylA, du gène lad, ou du gène bgaL, ou un dérivé de ceux-ci, de préférence 2tet01 ou tet02/l . Un promoteur inductible préféré est 2tet01.
Les promoteurs contrôlant l’expression de l’endonucléase d’ADN et du/des ARNg peuvent être identiques ou différents et constitutifs ou inductibles. Dans un mode de réalisation particulier et préféré, les promoteurs contrôlant respectivement l’expression de l’endonucléase d’ADN ou du/des ARNg sont des promoteurs différents mais inductibles par le même agent inducteur.
Les promoteurs inductibles tels que décrits ci-dessus permettent de maîtriser avantageusement l’action du complexe ribonucléoprotéique endonucléase d’ADN/ARNg, par exemple Cas9/ARNg, et de faciliter la sélection de transformants ayant subi les modifications génétiques souhaitées.
L’outil génétique selon l’invention peut en outre comprendre avantageusement une séquence codant au moins une protéine anti-CRISPR, i.e. une protéine capable d’inhiber ou d’empêcher/de neutraliser l’action de Cas, et/ou une protéine capable d’inhiber ou d’empêcher/de neutraliser l’action d’un système CRISPR/Cas, par exemple d’un système CRISPR/Cas de type II lorsque la nucléase est une nucléase de type Cas9. Cette séquence est typiquement placée sous le contrôle d’un promoteur inductible différent des promoteurs contrôlant l’expression de l’endonucléase d’ADN et/ou du ou des ARNg, et est inductible par un autre agent inducteur. Dans un mode de réalisation préféré, la séquence codant la protéine anti-CRISPR est par ailleurs typiquement localisée sur l’un des au moins deux acides nucléiques présents au sein de
l’outil génétique. Dans un mode de réalisation particulier, la séquence codant la protéine anti-CRISPR est localisée sur un acide nucléique distinct des deux premiers (typiquement un « troisième acide nucléique »). Dans encore un autre mode de réalisation particulier, à la fois la séquence codant la protéine anti-CRISPR et la séquence codant le répresseur transcriptionnel de ladite protéine anti-CRISPR sont intégrées dans le chromosome bactérien.
Dans un mode de réalisation préféré, la séquence codant une protéine anti-CRISPR est placée, au sein de l’outil génétique, sur l’acide nucléique codant l’endonucléase d’ADN (également identifié dans le présent texte en tant que « premier acide nucléique »). Dans un autre mode de réalisation, la séquence codant une protéine anti-CRISPR est placée, au sein de l’outil génétique, sur un acide nucléique différent de celui codant l’endonucléase d’ADN, par exemple sur l’acide nucléique identifié dans le présent texte en tant que « deuxième acide nucléique » ou encore sur un « énième » (typiquement un « troisième ») acide nucléique éventuellement compris dans l’outil génétique.
La protéine anti-CRISPR est typiquement une protéine « anti-Cas9 » ou une protéine « anti-MAD7 », i.e. une protéine capable d’inhiber ou d’empêcher/de neutraliser l’action de Cas9 ou de CAS7.
La protéine anti-CRISPR est avantageusement une protéine « anti-Cas9 », par exemple sélectionnée parmi AcrlIAl, AcrIIA2, AcrIIA3, AcrIIA4, AcrIIA5, AcrlICl, AcrIIC2 et AcrIIC3 (Pawluk et al, 2018). De manière préférée la protéine « anti-Cas9 » est AcrIIA2 ou AcrIIA4. De manière encore plus préférée la protéine « anti-Cas9 » est AcrIIA4. Une telle protéine est typiquement capable de limiter très significativement, idéalement d’empêcher, l’action de Cas9, par exemple en se fixant sur l’enzyme Cas9 (Dong et al, 2017 ; Rauch et al, 2017).
Une autre protéine anti-CRISPR avantageusement utilisable est une protéine « anti-MAD7 », par exemple la protéine AcrVAl (Marino et al, 2018).
Dans un mode de réalisation préféré, la protéine anti-CRISPR est capable d’inhiber, de préférence neutraliser, l’action de l’endonucléase d’ADN, de préférence durant la phase d’introduction des séquences d’acide nucléique de l’outil génétique dans la souche bactérienne d’intérêt.
Le promoteur contrôlant l’expression de la séquence codant la protéine anti-CRISPR est de préférence un promoteur inductible. Le promoteur inductible est associé à un gène exprimé de manière constitutive, typiquement responsable de l’expression d’une protéine permettant la répression transcriptionnelle à partir dudit promoteur inductible. Ce promoteur peut être par exemple sélectionné parmi le promoteur du gène tel A , du gène xylA, du gène lacl, ou du gène bgaL, ou un dérivé de ceux-ci.
Un exemple de promoteur inductible utilisable dans le contexte de l’invention est le promoteur Pbgal (inductible au lactose) présent, au sein de l’outil génétique et sur le même acide nucléique, au côté du gène bgaR exprimé de manière constitutive et dont le produit d’ expression permet la répression transcriptionnelle à partir de Pbgal. En présence de l’agent inducteur, le lactose, la répression transcriptionnelle du promoteur Pbgal est levée, permettant la transcription du gène placé en aval de celui-ci. De manière préférée, le gène
placé en aval correspond, dans le cadre de la présente invention, au gène codant la protéine anti-CRISPR, par exemple acrIIA4.
Le promoteur contrôlant l’expression de la protéine anti-CRISPR permet de maîtriser avantageusement l’action de l’endonucléase d’ADN, par exemple de l’enzyme Cas9, et d’ainsi faciliter la transformation des bactéries, par exemple des bactéries du genre Clostridium, Bacillus ou Lactobacillus , et l’obtention de transformants ayant subi les modifications génétiques souhaitées.
Dans un mode de réalisation particulier, l’invention concerne un outil génétique comprenant un vecteur plasmidique dont la séquence est celle de SEQ ID NO : 23 en tant que « premier » acide nucléique.
Dans encore un autre mode de réalisation particulier, l’invention concerne un outil génétique comprenant un vecteur plasmidique dont la séquence est sélectionnée parmi l’une des séquences SEQ ID NO : 79, SEQ ID NO : 80, SEQ ID NO : 119, SEQ ID NO : 123, SEQ ID NO : 124 et SEQ ID NO : 125 en tant que « deuxième » ou « énième » acide nucléique.
Dans encore un autre mode de réalisation particulier, l’invention concerne un outil génétique comprenant un vecteur plasmidique dont la séquence est sélectionnée parmi l’une des séquences SEQ ID NO : 119, SEQ ID NO : 123, SEQ ID NO : 124 et SEQ ID NO : 125 en tant que « acide nucléique OPT ». Dans un autre mode de réalisation particulier, l’outil génétique comprend plusieurs (par exemple au moins deux ou trois) séquences parmi SEQ ID NO : 23, 79, 80, 1 19, 123, 124 et 125, lesdites séquences étant différentes les unes des autres.
Les inventeurs décrivent des exemples d’acide nucléique d’intérêt, typiquement de séquences d’ADN d’intérêt, permettant l’expression au sein d’une bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie.
Dans un mode de réalisation particulier, l’expression de la séquence d’ADN d’intérêt permet à la bactérie, par exemple à la bactérie du genre Clostridium, de fermenter (typiquement simultanément) plusieurs sucres différents, par exemple au moins deux sucres différents, typiquement au moins deux sucres différents parmi les sucres comprenant 5 atomes de carbone (tels que le glucose ou le mannose) et/ou parmi les sucres comprenant 6 atomes de carbone (tels que le xylose, l’arabinose ou le fructose), de préférence au moins trois sucres différents, sélectionnés par exemple parmi glucose, xylose et mannose ; glucose, arabinose et mannose ; et glucose xylose et arabinose.
Dans un autre mode de réalisation particulier, la séquence d’ADN d’intérêt code au moins un produit d’intérêt, de préférence un produit favorisant la production de solvant par la bactérie, par exemple par la bactérie du genre Clostridium, Bacillus ou Lactobacillus, typiquement au moins une protéine d’intérêt, par exemple une enzyme ; une protéine membranaire tel qu’un transporteur ; une protéine de maturation d’autres protéines (protéine chaperonne) ; un facteur de transcription ; ou une combinaison de ceux-ci. Dans un mode de réalisation préféré, la séquence d’ADN d’intérêt favorise la production de solvant et est typiquement sélectionnée parmi une séquence codant i) une enzyme, par exemple une enzyme impliquée
dans la conversion des aldéhydes en alcool, par exemple sélectionnée parmi une séquence codant une alcool déshydrogénase (par exemple une séquence sélectionnée parmi adh, adhE, adhEl, adhE2, bdhA, bdhB et bdhC), une séquence codant une transférase (par exemple une séquence sélectionnée parmi ct/A, ctfB, atoA et atoB), une séquence codant une décarboxylase (par exemple a de), une séquence codant une hydrogénase (par exemple une séquence sélectionnée parmi etfA, etfB et hydA ), et une combinaison de celles-ci, ii) une protéine membranaire, par exemple une séquence codant une phosphotransférase (par exemple une séquence sélectionnée parmi glcG, bglC, cbe4532, cbe4533, cbe4982, cbe4983, cbe0751), iii) un facteur de transcription (par exemple une séquence sélectionnée parmi sigL, sigE, sigF, sigG, sigH, sigK) et iv) une combinaison de ceux-ci.
Les inventeurs décrivent par ailleurs des exemples d’acide nucléique d’intérêt reconnaissant (liant au moins en partie), et de préférence ciblant, i.e. reconnaissant et permettant la coupure, dans le génome d’une bactérie d’intérêt, d’au moins un brin i) d’une séquence cible, ii) d’une séquence contrôlant la transcription d’une séquence cible, ou iii) d’une séquence flanquant une séquence cible.
La séquence reconnue est également identifiée dans le présent texte en tant que « séquence cible » ou « séquence ciblée ».
Un outil génétique comprenant, ou consistant en, un tel acide nucléique d’intérêt est également décrit. Dans ce cas, l’acide nucléique d’intérêt est typiquement présent au sein du « deuxième » ou « énième » acide nucléique d’un outil génétique tel que décrit dans le présent texte.
L’acide nucléique d’intérêt est utilisé typiquement dans le contexte de la présente description pour supprimer la séquence reconnue du génome de la bactérie ou pour modifier son expression, par exemple pour moduler/réguler son expression, en particulier l’inhiber, de préférence pour la modifier de manière à rendre ladite bactérie incapable d’exprimer une protéine, en particulier une protéine fonctionnelle, à partir de ladite séquence.
Lorsque la séquence cible est une séquence codant une enzyme permettant à la bactérie d’intérêt de croître dans un milieu de culture contenant un antibiotique vis-à-vis duquel elle lui confère une résistance, une séquence contrôlant la transcription d’une telle séquence ou une séquence flanquant une telle séquence, l’antibiotique est typiquement un antibiotique appartenant à la classe des amphénicols. Des exemples d’amphénicols d’intérêt dans le contexte de la présente description sont le chloramphénicol, le thiamphénicol, l’azidamfénicol et le florfénicol (Schwarz S. et al., 2004), en particulier le chloramphénicol et le thiamphénicol.
Dans un mode de réalisation particulier, l’acide nucléique d’intérêt comprend au moins une région complémentaire de la séquence cible identique à 100% ou identique à 80% au moins, de préférence à 85%, 90%, 95%, 96%, 97%, 98% ou 99% au moins à la région/portion/séquence d’ADN ciblée au sein du génome bactérien et est capable de s’hybrider à tout ou partie de la séquence complémentaire de ladite région/portion/séquence, typiquement à une séquence comprenant au moins 1 nucléotide, de préférence au
moins 1, 2, 3, 4, 5, 10, 14, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1, 10 ou 20 et 1000 nucléotides, par exemple entre 1, 10 ou 20 et 900, 800, 700, 600, 500, 400, 300 ou 200 nucléotides, entre 1, 10 ou 20 et 100 nucléotides, entre 1, 10 ou 20 et 50 nucléotides, ou entre 1, 10 ou 20 et 40 nucléotides, par exemple entre 10 et 40 nucléotides, entre 10 et 30 nucléotides, entre 10 et 20 nucléotides, entre 20 et 30 nucléotides, entre 15 et 40 nucléotides, entre 15 et 30 nucléotides ou entre 15 et 20 nucléotides, de préférence à une séquence comprenant 14, 15, 16, 17, 18 , 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides. La région complémentaire de la séquence cible présente au sein de l’acide nucléique d’intérêt peut correspondre à la région « SDS » d’un ARN guide (ARNg) utilisé dans un outil CRISPR tel que décrit dans le présent texte.
Dans un autre mode de réalisation particulier décrit, l’acide nucléique d’intérêt comprend au moins deux régions complémentaires chacune d’une séquence cible, identiques à 100% ou identiques à 80% au moins, de préférence à 85%, 90%, 95%, 96%, 97%, 98% ou 99% au moins à ladite région/portion/séquence d’ADN ciblée au sein du génome bactérien. Ces régions sont capables de s’hybrider à tout ou partie de la séquence complémentaire de ladite région/portion/séquence, typiquement à une séquence telle que décrite ci-dessus comprenant au moins 1 nucléotide, de préférence au moins 100 nucléotides, typiquement entre 100 et 1000 nucléotides. Les régions complémentaires de la séquence cible présentes au sein de l’acide nucléique d’intérêt peuvent reconnaître, de préférence cibler, les régions flanquantes en 5’ et en 3’ de la séquence ciblée dans un outil de modification génétique tel que décrit dans le présent texte, par exemple l’outil génétique ClosTron®, l’outil génétique Targetron® ou un outil d’échange allélique type ACE®.
Selon un aspect particulier, la séquence cible est une séquence codant une amphénicol-O-acetyltransférase, par exemple une chloramphénicol-O-acetyltransférase ou une thiamphénicol-O-acetyltransférase, contrôlant la transcription d’une telle séquence ou flanquant une telle séquence, au sein du génome d’une bactérie d’intérêt, par exemple du genre Clostridium, capable de croître dans un milieu de culture contenant un ou plusieurs antibiotiques appartenant à la classe des amphénicols, par exemple du chloramphénicol et/ou du thiamphénicol.
La séquence reconnue est par exemple la séquence SEQ ID NO : 18 correspondant au gène catB (CIBE 3859) codant une chloramphénicol-O-acetyltransférase de C. beijerinckii DSM 6423 ou une séquence d’acides aminés identique à au moins 70%, 75%, 80%, 85%, 90% ou 95% à ladite chloramphénicol-O-acetyltransférase, ou une séquence comprenant tout ou au moins 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de la séquence SEQ ID NO : 18. Autrement formulé, la séquence reconnue peut être une séquence comprenant au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1 et 40 nucléotides, de préférence une séquence comprenant 14, 15, 16, 17, 18 ,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides de la séquence SEQ ID NO : 18.
Des exemples de séquences d’acides aminés identiques à au moins 70% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18 correspondent aux séquences identifiées dans la base de données NCBI sous les références suivantes : WP 077843937.1, SEQ ID NO : 44 (WP_063843219.1), SEQ ID NO : 45 (WP_0781 16092.1), SEQ ID NO : 46 (WP_077840383.1), SEQ ID NO : 47 (WP_077307770.1), SEQ ID NO : 48 (WPJ03699368.1), SEQ ID NO : 49 (WP_087701812.1), SEQ ID NO : 50 (WP 0172101 12.1), SEQ ID NO : 51 (WP 077831818.1), SEQ ID NO : 52 (WP 012059398.1), SEQ ID NO : 53 (WP 077363893.1), SEQ ID NO : 54 (WP 015393553.1), SEQ ID NO : 55 (WP_023973814.1), SEQ ID NO : 56 (WP_026887895.1), SEQ ID NO 57 (AWK51568.1), SEQ ID NO : 58 (WP 003359882.1), SEQ ID NO : 59 (WP 091687918.1), SEQ ID NO : 60 (WP_055668544.1), SEQ ID NO : 61 (KGK90159.1), SEQ ID NO : 62 (WP_032079033.1), SEQ ID NO : 63 (WP_029163167.1), SEQ ID NO : 64 (WP_017414356.1), SEQ ID NO : 65 (WP_073285202.1), SEQ ID NO : 66 (WP_063843220.1), et SEQ ID NO : 67 (WP_021281995.1).
Des exemples de séquences d’acides aminés identiques à au moins 75% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18 correspondent aux séquences WP 077843937.1, WP_063843219.1, WP_0781 16092.1, WP_077840383.1, WP_077307770.1, WP 103699368.1,
WP_087701812.1, WP_017210112.1, WP_077831818.1, WP_012059398.1, WP_077363893.1,
WP_015393553.1, WP_023973814.1, WP_026887895.1 AWK51568.1, WP_003359882.1,
WP 091687918.1, WP 055668544.1 et KGK90159.1.
Des exemples de séquences d’acides aminés identiques à au moins 90% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18, sont les séquences WP 077843937.1,
WP_063843219.1, WP_0781 16092.1, WP_077840383.1, WP_077307770.1, WP 103699368.1,
WP_087701812.1, WP_017210112.1, WP_077831818.1, WP_012059398.1, WP_077363893.1,
WP_015393553.1, WP_023973814.1, WP_026887895.1 et AWK51568.1.
Des exemples de séquences d’acides aminés identiques à au moins 95% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18 correspondent aux séquences WP 077843937.1, WP_063843219.1, WP_0781 16092.1, WP_077840383.1, WP_077307770.1, WP 103699368.1,
WP_087701812.1, WP_017210112.1, WP_077831818.1, WP_012059398.1, WP_077363893.1,
WP_015393553.1, WP_023973814.1, et WP_026887895.1.
Des séquences d’acides aminés préférées, identiques à au moins 99% à la chloramphénicol-O- acetyltransférase codée par la séquence SEQ ID NO : 18, sont les séquences WP 077843937.1, SEQ ID NO : 44 (WP_063843219.1) et SEQ ID NO : 45 (WP_0781 16092.1).
Une séquence particulière identique à la séquence SEQ ID NO : 18 est la séquence identifiée dans la base de données NCBI sous la référence WP 077843937.1.
Selon un exemple particulier, la séquence cible est la séquence SEQ ID NO : 68 correspondant au gène catQ codant une chloramphénicol-O-acetyltransférase de C. perfringens dont la séquence d’acides aminés correspond à SEQ ID NO : 66 (WP 063843220.1), ou une séquence identique à au moins 70%, 75%, 80%,
85%, 90% ou 95% à ladite chloramphénicol-O-acetyltransférase, ou une séquence comprenant tout ou au moins 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de la séquence SEQ ID NO : 68.
Autrement formulé, la séquence reconnue peut être une séquence comprenant au moins 1 nucléotide, de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 ou 40 nucléotides, typiquement entre 1 et 40 nucléotides, de préférence une séquence comprenant 14, 15, 16, 17, 18 ,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucléotides de la séquence SEQ ID NO : 68.
Dans encore un autre exemple particulier, la séquence reconnue est sélectionnée parmi une séquence d’acide nucléique catB (SEQ ID NO : 18), catQ (SEQ ID NO 68), catD (SEQ ID NO : 69, Schwarz S. et al., 2004) ou catP (SEQ ID NO : 70, Schwarz S. et al., 2004) connue de l’homme du métier, présente naturellement au sein d’une bactérie ou introduite artificiellement dans une telle bactérie.
Comme indiqué précédemment, selon un autre exemple particulier, la séquence cible peut aussi être une séquence contrôlant la transcription d’une séquence codante telle que décrite précédemment (codant une enzyme permettant à la bactérie d’intérêt de croître dans un milieu de culture contenant un antibiotique vis- à-vis duquel elle lui confère une résistance), typiquement une séquence promotrice, par exemple la séquence promotrice (SEQ ID NO : 73) du gène catB ou celle (SEQ ID NO : 74) du gène calQ.
L’acide nucléique d’intérêt reconnaît alors, et est donc typiquement capable de se lier à une séquence contrôlant la transcription d’une séquence codante telle que décrite précédemment.
Selon un autre exemple particulier, la séquence cible peut être une séquence flanquant une séquence codante telle que décrite précédemment, par exemple une séquence flanquant le gène catB de séquence SEQ ID NO : 18 ou une séquence identique à au moins 70% à celle-ci. Une telle séquence flanquante comprend typiquement 1, 10 ou 20 et 1000 nucléotides, par exemple entre 1, 10 ou 20 et 900, 800, 700, 600, 500, 400, 300 ou 200 nucléotides, entre 1, 10 ou 20 et 100 nucléotides, entre 1, 10 ou 20 et 50 nucléotides, ou entre 1, 10 ou 20 et 40 nucléotides, par exemple entre 10 et 40 nucléotides, entre 10 et 30 nucléotides, entre 10 et 20 nucléotides, entre 20 et 30 nucléotides, entre 15 et 40 nucléotides, entre 15 et 30 nucléotides ou entre 15 et 20 nucléotides.
Selon un aspect particulier, la séquence cible correspond à la paire de séquences flanquant une telle séquence codante, chaque séquence flanquante comprenant typiquement au moins 20 nucléotides, typiquement entre 100 et 1000 nucléotides, de préférence entre 200 et 800 nucléotides.
Dans le contexte de la présente description, un exemple particulier d’acide nucléique d’intérêt, utilisé pour transformer et/ou modifier génétiquement une bactérie d’intérêt, est un fragment d’ADN i) reconnaissant une séquence codant, ii) contrôlant la transcription d’une séquence codant, ou iii) flanquant une séquence codant, une enzyme d’intérêt, de préférence une amphénicol-O-acetyltransférase, par exemple une
chloramphénicol-O-acetyltransférase ou une thiamphénicol-O-acetyltransférase, au sein du génome d’une bactérie, par exemple d’une bactérie du genre Clostridium telle que décrite précédemment
Comme indiqué précédemment, un exemple d’acide nucléique d’intérêt selon l’invention est capable de supprimer la séquence (« séquence cible ») reconnue du génome de la bactérie ou de modifier son expression, par exemple de la moduler, en particulier de l’inhiber, de préférence de la modifier de manière à rendre ladite bactérie incapable d’exprimer une protéine, par exemple une amphénicol-O- acetyltransférase, en particulier une protéine fonctionnelle, à partir de ladite séquence.
Dans un mode de réalisation particulier où la séquence reconnue codant une enzyme est une séquence conférant à la bactérie une résistance au chloramphénicol et/ou au thiamphénicol, le gène de sélection utilisé n’est pas un gène de résistance au chloramphénicol et/ou au thiamphénicol, et n’est de préférence aucun des gènes catB, catQ, catD ou catP.
Dans un mode de réalisation particulier, l’acide nucléique d’intérêt comprend un ou plusieurs ARN guides (ARNg) ciblant une séquence codant, contrôlant la transcription d’une séquence codant, ou flanquant une séquence codant, une enzyme d’intérêt, en particulier une amphénicol-O-acetyltransférase, et/ou une matrice de modification (également identifiée dans le présent texte en tant que « matrice d’édition »), par exemple une matrice permettant d’éliminer ou de modifier tout ou partie de la séquence cible, de préférence dans le but d’inhiber ou supprimer l’expression de la séquence cible, typiquement une matrice comprenant des séquences homologues (correspondant) aux séquences situées en amont et en aval de la séquence cible telles que décrites précédemment, typiquement des séquences (homologues auxdites séquences situées en amont et en aval de la séquence cible) comprenant chacune entre 10 ou 20 paires de base et 1000, 1500 ou 2000 paires de base, par exemple entre 100, 200, 300, 400 ou 500 paires de base et 1000, 1200, 1300, 1400 ou 1500 paires de base, de préférence entre 100 et 1500 ou entre 100 et 1000 paires de bases, et de manière encore plus préférée entre 500 et 1000 paires de base ou entre 200 et 800 paires de base.
Dans un mode de réalisation particulier, l’acide nucléique d’intérêt utilisé pour transformer et/ou modifier génétiquement une bactérie d’intérêt, est un acide nucléique ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type Dam et Dcm (préparé à partir d’une bactérie Escherichia coli présentant le génotype dam- dcm-).
Lorsque la bactérie d’intérêt à transformer et/ou modifier génétiquement est une bactérie C. beijerinckii, en particulier appartenant à l’un des sous-clades DSM 6423, LMG 7814, LMG 7815, NRRL B-593 et NCCB 27006, l’acide nucléique d’intérêt utilisé comme outil génétique, par exemple le plasmide, est un acide nucléique ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type Dam et Dcm, typiquement un acide nucléique dont l’adénosine (« A ») du motif GATC et/ou la deuxième cytosine « C » du motif CCWGG (W pouvant correspondre à une adénosine (« A ») ou à une thymine (« T »)) sont déméthylés.
Un acide nucléique ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type Dam et Dcm peut typiquement être préparé à partir d’une bactérie Escherichia coli présentant le génotype du ni dcm (par exemple Escherichia coli INV 1 10, Invitrogen). Ce même acide nucléique peut comporter d’autres méthylations réalisées par exemple par des méthyltransférases de type EcoKI, cette dernière visant les adénines (« A ») des motifs AAC(N6)GTGC et GCAC(N6)GTT (N pouvant correspondre à n’importe quel base).
Dans un mode de réalisation particulier, la séquence ciblée correspond à un gène codant une amphénicol- O-acetyltransférase par exemple une chloramphénicol-O-acetyltransférase tel que le gène catB, à une séquence contrôlant la transcription de ce gène, ou à une séquence flanquant ce gène.
Un acide nucléique d’intérêt particulier décrit par les inventeurs est par exemple un vecteur, de préférence un plasmide, par exemple le plasmide pCas9ind-Aca/2? de séquence SEQ ID NO : 21 ou le plasmide pCas9ind-gRNA_ca/2? de séquence SEQ ID NO : 38 décrit dans la partie expérimentale de la présente description (cf. exemple 2), en particulier une version de ladite séquence ne présentant pas de méthylation au niveau des motifs reconnus par les méthyltransférases de type Dam et Dcm.
La présente description concerne aussi l’utilisation d’un acide nucléique d’intérêt pour transformer et/ou modifier génétiquement une bactérie d’intérêt telle que décrite dans le présent texte.
Un autre aspect décrit par les inventeurs a trait à un procédé pour transformer, et de préférence en outre modifier génétiquement, une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, typiquement une bactérie solvantogène, en particulier une bactérie solvantogène du genre Clostridium, à l’aide d’un outil génétique selon l’invention, typiquement à l’aide d’un acide nucléique d’intérêt selon l’invention tel que décrit plus haut. Ce procédé comprend avantageusement une étape de transformation de la bactérie par introduction dans ladite bactérie de tout ou partie d’un outil génétique tel que décrit dans le présent texte, en particulier d’un acide nucléique d’intérêt décrit dans le présent texte, de préférence d’un « acide nucléique OPT » comprenant, ou consistant en, i) tout ou partie de la séquence SEQ ID NO : 126 (OREP) et ii) une séquence permetant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie. Le procédé peut comprendre en outre une étape d’obtention, de récupération, de sélection ou d’isolement de la bactérie transformée, i.e. de la bactérie présentant la ou les recombinaisons/modifications/optimisations recherchées.
Dans un mode de réalisation particulier, le procédé pour transformer, et de préférence modifier génétiquement, une bactérie telle que décrite dans le présent texte, fait intervenir un outil de modification génétique par exemple un outil de modification génétique sélectionné parmi un outil CRISPR, un outil basé sur l’utilisation d’introns de type II (par exemple l’outil Targetron® ou l’outil ClosTron®) et un outil
d’échange allélique (par exemple l’outil ACE®), et comprend une étape de transformation de la bactérie par introduction dans ladite bactérie d’un acide nucléique d’intérêt selon l’invention tel que décrit plus haut. La présente invention est typiquement avantageusement mise en œuvre dès lors que l’outil de modification génétique sélectionné pour transformer, et de préférence modifier génétiquement, une bactérie appartenant au phylum des Firmicutes, par exemple une bactérie du genre Clostridium, est destiné à être utilisé sur une bactérie, telle que C. beijerinckii, porteuse à l’état sauvage d’un gène codant une enzyme responsable de la résistance à un ou plusieurs antibiotiques et/ou porteuse à l’état sauvage d’au moins une séquence d’ADN extra-chromosomique, et que la mise en œuvre dudit outil génétique comprend une étape de transformation de ladite bactérie à l’aide d’un acide nucléique permettant l’expression d’un marqueur de résistance à un antibiotique auquel cette bactérie est résistante à l’état sauvage et/ou une étape de sélection des bactéries transformées et/ou modifiées génétiquement à l’aide dudit antibiotique (auquel la bactérie est résistante à l’état sauvage), de préférence de sélection parmi lesdites bactéries des bactéries ayant perdu ladite séquence d’ADN extra-chromosomique.
Une modification avantageusement réalisable grâce à la présente invention, par exemple à l’aide d’un outil de modification génétique sélectionné parmi un outil CRISPR, un outil basé sur l’utilisation d’introns de type II et un outil d’échange allélique, consiste à supprimer une séquence indésirable, par exemple une séquence codant une enzyme conférant à la bactérie la résistance à un ou plusieurs antibiotiques, ou à rendre cette séquence indésirable non fonctionnelle. Une autre modification avantageusement réalisable grâce à la présente invention consiste à modifier génétiquement une bactérie afin d’améliorer ses performances, par exemple ses performances dans la production d’un solvant ou d’un mélange de solvants d’intérêt, ladite bactérie ayant préalablement déjà été modifiée grâce à l’invention pour la rendre sensible à un antibiotique auquel elle était résistante à l’état sauvage, et/ou pour la débarrasser d’une séquence d’ADN extra chromosomique présente au sein de la forme sauvage de ladite bactérie.
Dans un mode de réalisation préféré, le procédé selon l’invention est basé sur l’utilisation de (met en œuvre) la technologie / l’outil génétique CRISPR (Clustered Regularly Interspaced Short Palindromie Repeats), en particulier l’outil génétique CRISPR/Cas (CRISPR-associated protein).
La présente invention peut être mise en œuvre à l’aide d’un outil génétique CRISPR/Cas classique utilisant un unique plasmide comprenant une nucléase, un ARNg et une matrice de réparation tel que décrit par Wang et al. (2015).
L’homme du métier peut aisément définir la séquence et la structure des ARNg selon la région chromosomique ou l’élément génétique mobile à cibler en utilisant des techniques bien connues (voir par exemple l’article de DiCarlo et al., 2013).
Les inventeurs ont mis au point et décrit un outil génétique de modification de bactéries, adapté aux bactéries du genre Clostridium, également utilisable dans le contexte de la présente invention, basé sur l’utilisation de deux plasmides (cf. WO2017/064439, Wasels et al., 2017, et Figure 15 associée à la présente description).
Dans un mode de réalisation particulier, le « premier » plasmide de cet outil permet l’expression de la nucléase Cas et un « deuxième » plasmide, spécifique de la modification à effectuer, contient une ou plusieurs cassettes d’expression d’ARNg (ciblant typiquement des régions différentes de l’ADN bactérien) ainsi qu’une matrice de réparation permettant, par un mécanisme de recombinaison homologue, le remplacement d’une portion de l’ADN bactérien ciblée par Cas par une séquence d’intérêt. Le gène cas et/ou la (les) cassette(s) d’expression d’ARNg sont placés sous le contrôle de promoteurs d’expression constitutifs ou inductibles, de préférence inductibles, connus de l’homme du métier (par exemple décrits dans la demande WO2017/064439 et incorporés par référence à la présente description), et de préférence différents mais inductibles par le même agent inducteur.
Les ARNg susceptibles d’être utilisés correspondent aux ARNg tels que décrits précédemment dans le présent texte.
Un procédé particulier faisant intervenir la technologie CRISPR, susceptible d’être mis en œuvre dans le cadre de la présente invention pour transformer, et typiquement pour modifier génétiquement par recombinaison homologue, une bactérie telle que décrite dans le présent texte, comprend les étapes suivantes :
a) d’introduction dans la bactérie d’un acide nucléique ou outil génétique décrit par les inventeurs en présence d’un agent inducteur de l’expression d’une protéine anti-CRISPR, et
b) de culture de la bactérie transformée obtenue à l’issue de l’étape a) sur un milieu ne contenant pas (ou dans des conditions n’impliquant pas) l’agent inducteur de l’expression de la protéine anti-CRISPR, permettant typiquement l’expression du complexe ribonucléoprotéique endonucléase d’ADN/ARNg, typiquement Cas/ARNg (afin de stopper la production de ladite protéine anti-CRISPR et de permettre l’action de l’endonucléase).
L’agent inducteur de l’expression de la protéine anti-CRISPR est présent en quantité suffisante pour induire ladite expression. Dans le cas du promoteur Pbgal, l’agent inducteur, le lactose, permet de lever l’inhibition d’expression (répression transcriptionnelle) de la protéine anti-CRISPR liée à l’expression de la protéine BgaR.
L’agent inducteur de l’expression de la protéine anti-CRISPR est de préférence utilisé à une concentration comprise entre environ 1 mM et environ IM, de préférence entre environ 10 mM et environ 100 mM, par exemple environ 40 mM.
Dans un mode de réalisation préféré, la protéine anti-CRISPR est capable d’inhiber, de préférence neutraliser, l’action de la nucléase, de préférence durant la phase d’introduction des séquences d’acide nucléique de l’outil génétique dans la souche bactérienne d’intérêt.
Dans un mode de réalisation particulier, le procédé comprend en outre, pendant ou après l’étape b), une étape d’induction de l’expression du ou des promoteurs inductibles contrôlant l’expression de la nucléase
et/ou du ou des ARN guides lorsqu’un tel ou de tels promoteurs sont présents au sein de l’outil génétique, afin de permettre la modification génétique d’intérêt de la bactérie une fois ledit outil génétique introduit dans ladite bactérie. L’induction est réalisée à l’aide d’une substance permettant de lever l’inhibition d’expression liée au promoteur inductible sélectionné.
L’étape d’induction, lorsqu’elle est présente, peut ainsi être mise en œuvre par toute méthode de culture sur un milieu permettant l’expression du complexe ribonucléoprotéique endonucléase/ARNg connue de l’homme du métier après introduction dans la bactérie cible de l’outil génétique selon l’invention. Elle est par exemple réalisée par mise en contact de la bactérie avec une substance adéquate, présente en quantité suffisante ou par exposition à la lumière UV. Cette substance permet de lever l’inhibition d’expression liée au promoteur inductible sélectionné. Lorsque le promoteur sélectionné est un promoteur inductible à l’anhydrotétracycline (aTc), choisi parmi Pcm-2tet01 et Pcm-tet02/l, l’aTc est de préférence utilisée à une concentration comprise entre environ 1 ng/ml et environ 5000 ng/ml, de préférence entre environ 10 ng/ml et 1000 ng/ml, 10 ng/ml et 800 ng/ml, 10 ng/ml et 500 ng/ml, 100 ng/ml ou 200 ng/ml et environ 800 ng/ml ou 1000 ng/ml, ou entre environ 100 ng/ml ou 200 ng/ml et environ 500 ng/ml, 600 ng/ml ou 700 ng/ml, par exemple environ 50 ng/ml, 100 ng/ml, 150 ng/ml, 200 ng/ml, 250 ng/ml, 300 ng/ml, 350 ng/ml, 400 ng/ml, 450 ng/ml, 500 ng/ml, 550 ng/ml, 600 ng/ml, 650 ng/ml, 700 ng/ml, 750 ng/ml ou 800 ng/ml.
Dans un autre mode de réalisation particulier, le procédé comprend une étape c) additionnelle d’élimination de l’acide nucléique contenant la matrice de réparation (la cellule bactérienne étant alors considérée comme « curée » dudit acide nucléique) et/ou d’élimination du/des ARNs guides ou séquences codant le/les ARNs guides introduits avec l’outil génétique lors de l’étape a).
Dans encore un autre mode de réalisation particulier, le procédé comprend une ou plusieurs étapes additionnelles, postérieure(s) à l’étape b) ou à l’étape c), d’introduction d’un énième, par exemple troisième, quatrième, cinquième, etc., acide nucléique contenant une matrice de réparation distincte de celle(s) déjà introduite(s) et d’une ou plusieurs cassettes d’expression d’ARN guides permettant l’intégration de la séquence d’intérêt contenue dans ladite matrice de réparation distincte dans une zone ciblée du génome de la bactérie, en présence d’un agent inducteur de l’expression de la protéine anti-CRISPR, chaque étape additionnelle étant suivie d’une étape de culture de la bactérie ainsi transformée sur un milieu ne contenant pas l’agent inducteur de l’expression de la protéine anti-CRISPR, permettant typiquement l’expression du complexe ribonucléoprotéique Cas/ARNg.
Dans un mode de réalisation particulier du procédé selon l’invention, la bactérie est transformée à l’aide d’un acide nucléique ou d’un outil génétique tels ceux décrits plus haut, utilisant (par exemple codant) une enzyme responsable de la coupure d’au moins un brin de la séquence cible d’intérêt, dans lequel l’enzyme est dans un mode particulier une nucléase, de préférence une nucléase de type Cas, préférentiellement sélectionnée parmi une enzyme Cas9 et une enzyme MAD7. Dans un exemple de mode de réalisation, la séquence cible d’intérêt est une séquence, par exemple le gène catB, codant une enzyme conférant à la
bactérie la résistance à un ou plusieurs antibiotiques, de préférence à un ou plusieurs antibiotiques appartenant à la classe des amphénicols, typiquement une amphénicol-O-acetyltransférase telle qu’une chloramphénicol-O-acetyltransférase, une séquence contrôlant la transcription de la séquence codante ou une séquence flanquant ladite séquence codante.
Lorsqu’elle est utilisée la protéine anti-CRISPR est typiquement une protéine « anti-Cas » telle que décrite précédemment. La protéine anti-CRISPR est avantageusement une protéine « anti-Cas9 » ou une protéine « anti-MAD7 ».
Tout comme la portion d’ADN ciblée (« séquence reconnue »), la matrice d’édition/de réparation peut elle- même comprendre une ou plusieurs séquences d’acide nucléique ou portions de séquence d’acide nucléique correspondant à des séquences naturelles et/ou synthétiques, codantes et/ou non codantes. La matrice peut également comprendre une ou plusieurs séquences « étrangères », i.e. naturellement absentes du génome des bactéries appartenant au phylum des Firmicutes, en particulier au genre Clostridium, au genre Bacillus ou du genre Lactobacillus, ou du génome d’espèces particulières dudit genre. La matrice peut aussi comprendre une combinaison de séquences.
L’outil génétique utilisé dans le cadre de la présente invention permet à la matrice de réparation de guider l’incorporation au sein du génome bactérien d’un acide nucléique d’intérêt, typiquement d’une séquence ou portion de séquence d’ADN comprenant au moins 1 paire de base (pb), de préférence au moins 1, 2, 3, 4, 5, 10, 15, 20, 50, 100, 1 000, 10 000, 100 000 ou 1 000 000 pb, typiquement entre 1 pb et 20 kb, par exemple 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1, 12 ou 13 kb, ou entre 1 pb et 10 kb, de préférence entre 10 pb et 10 kb ou entre 1 kb et 10 kb, par exemple entre lpb et 5 kb, entre 2 kb et 5 kb, ou encore entre 2,5 ou 3 kb et 5 kb.
Dans un mode de réalisation particulier, l’expression de la séquence d’ADN d’intérêt permet à la bactérie appartenant au phylum des Firmicutes, en particulier du genre Clostridium, du genre Bacillus ou du genre Lactobacillus, de fermenter (typiquement simultanément) plusieurs sucres différents, par exemple au moins deux sucres différents, typiquement au moins deux sucres différents parmi les sucres comprenant 5 atomes de carbone (tels que le glucose ou le mannose) et/ou parmi les sucres comprenant 6 atomes de carbone (tels que le xylose, l’arabinose ou le fructose), de préférence au moins trois sucres différents, sélectionnés par exemple parmi glucose, xylose et mannose ; glucose, arabinose et mannose ; et glucose xylose et arabinose. Dans un autre mode de réalisation particulier, la séquence d’ADN d’intérêt code au moins un produit d’intérêt, de préférence un produit favorisant la production de solvant par la bactérie modifiée, typiquement au moins une protéine d’intérêt, par exemple une enzyme ; une protéine membranaire tel qu’un transporteur ; une protéine de maturation d’autres protéines (protéine chaperonne) ; un facteur de transcription ; ou une combinaison de ceux-ci.
L’introduction dans la bactérie des éléments (acides nucléiques ou ARNg) de l’outil génétique est réalisée par toute méthode, directe ou indirecte, connue de l’homme du métier, par exemple par transformation, conjugaison, microinjection, transfection, électroporation, etc., de préférence par électroporation (Mermelstein et al, 1993).
Dans un autre mode de réalisation, le procédé selon l’invention est basé sur l’utilisation d’introns de type II, et met par exemple en œuvre la technologie / l’outil génétique ClosTron® ou l’outil génétique Targetron®.
La technologie Targetron® repose sur Tutilisation d’un intron de groupe II (basé sur Tintron Ll.ltrB de Lactococcus lactis ) reprogrammable, capable d’intégrer le génome bactérien rapidement à un locus désiré (Chen et al., 2005, Wang et al., 2013), typiquement dans le but d’inactiver un gène ciblé. Les mécanismes de reconnaissance de la zone éditée ainsi que d’insertion dans le génome par rétro-épissage sont basés sur une homologie entre Tintron et ladite zone d’une part, et sur l’activité d’une protéine (ltrA) d’autre part.
La technologie ClosTron® repose sur une approche similaire, complétée par l’ajout d’un marqueur de sélection dans la séquence de Tintron (Heap et al., 2007). Ce marqueur permet de sélectionner l’intégration de Tintron dans le génome, et facilite donc l’obtention des mutants désirés. Ce système génétique exploite également les introns de type I. En effet, le marqueur de sélection (appelé RAM pour retrotransposition- activated marker ) est interrompu par un tel élément génétique, qui empêche son expression depuis le plasmide (une description plus précise du système : Zhong et al.). L’épissage de cet élément génétique se produit avant intégration dans le génome, ce qui permet l’obtention d’un chromosome présentant une forme active du gène de résistance. Une version optimisée du système comprend des sites FLP/FRT en amont et en aval de ce gène, ce qui permet d’utiliser la recombinase FRT pour éliminer le gène de résistance (Heap et al., 2010).
Dans un autre mode de réalisation, le procédé selon l’invention est basé sur Tutilisation d’un outil d’échange allélique, et met par exemple en œuvre la technologie / l’outil génétique ACE®.
La technologie ACE® repose sur Tutilisation d’un mutant auxotrophe (pour Turacile chez C. acetobutylicum ATCC 824 par délétion du gène pyrE, qui provoque également une résistance à l’acide 5- fluoroorotique (A-5-FO) ; Heap et al., 2012). Le système utilise le mécanisme d’échange allélique, bien connu de l’homme de métier. Suite à une transformation avec un vecteur pseudo-suicide (à très faibles copies), l’intégration de ce dernier dans le chromosome bactérien par un premier évènement d’échange allélique peut être vérifiée grâce au gène de résistance présent initialement sur le plasmide. L’étape d’intégration peut être réalisée de deux manières différentes, soit au sein du locus pyrE soit au sein d’un autre locus :
Dans le cas de l’intégration au locus pyrE, le gène pyrE est également placé sur le plasmide, sans toutefois être exprimé (pas de promoteur fonctionnel). La deuxième recombinaison restaure un gène pyrE fonctionnel et peut alors être sélectionnée par auxotrophie (milieu minimum, ne contenant pas d’uracile). Le gène pyrE non-fonctionnel présentant également un caractère sélectionnable (sensibilité au A-5-FO), d’autres intégrations sont ensuite envisageables sur le même modèle, en alternant successivement l’état de pyrE entre fonctionnel et non- fonctionnel.
Dans le cas de l’intégration à un autre locus, une zone génomique permettant une expression du marqueur de contre-sélection après recombinaison est ciblée (typiquement, en opéron après un autre gène, de préférence un gène fortement exprimé). Cette deuxième recombinaison est alors sélectionnée par auxotrophie (milieu minimum ne contenant pas d’uracile).
Dans les modes de réalisation décrits basés sur l’utilisation d’introns de type II, et mettant par exemple en œuvre la technologie / l’outil génétique ClosTron® ou l’outil génétique Targetron®, ou basés sur l’utilisation d’un outil d’échange allélique, et mettant par exemple en œuvre la technologie / l’outil génétique ACE®, la séquence ciblée est typiquement l’une des séquences décrites dans le présent texte.
De manière particulièrement avantageuse, les acides nucléiques et outils génétiques selon l’invention permettent l’introduction dans la bactérie de séquences d’intérêt de petites tailles aussi bien que de grandes tailles, en une étape, i.e. à l’aide d’un seul acide nucléique (typiquement « l’acide nucléique OPT » ou le « deuxième » ou « énième » acide nucléique d’un outil tel que décrit dans le présent texte) ou en plusieurs étapes, i.e. à l’aide de plusieurs acides nucléiques (typiquement le « deuxième » ou les « énième » acides nucléiques tels que décrits dans le présent texte), de préférence en une étape.
Dans un mode de réalisation particulier de l’invention, les acides nucléiques et outils génétiques selon l’invention permettent de supprimer une portion ciblée de l’ADN bactérien ou de la remplacer par une séquence plus courte (par exemple par une séquence ayant perdu au moins une paire de bases) et/ou non fonctionnelle. Dans un mode de réalisation particulier préféré de l’invention, les acides nucléiques et outils génétiques selon l’invention permettent avantageusement d’introduire dans la bactérie, par exemple dans le génome bactérien, un acide nucléique d’intérêt comprenant au moins une paire de base, et jusqu’à 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1, 12, 13, 14, ou 15 kb.
Un autre objet de l’invention concerne une bactérie transformée et/ou génétiquement modifiée, typiquement une bactérie appartenant au phylum des Firmicutes, et appartenant par exemple au genre Clostridium, au genre Bacillus ou au genre Lactobacillus , typiquement une bactérie solvantogène, de préférence une bactérie appartenant à une espèce ou correspondant à l’un des sous-clades décrits par les inventeurs dans le présent texte ou obtenue à l’aide d’un procédé tel que décrit par les inventeurs dans le présent texte, ainsi que toute bactérie dérivée, clone, mutant ou version génétiquement modifiée de celle-ci, et leurs utilisations.
Un exemple de bactérie ainsi transformée et/ou génétiquement modifiée grâce à l’invention est une bactérie n’exprimant plus une enzyme lui conférant la résistance à un ou plusieurs antibiotiques, en particulier une bactérie n’exprimant plus une amphénicol-O-acetyltransférase, par exemple une bactérie exprimant à l’état sauvage le gène catB, et dépourvue dudit gène catB ou incapable d’exprimer ledit gène catB une fois transformée et/ou génétiquement modifiée grâce à l’invention. La bactérie ainsi transformée et/ou génétiquement modifiée grâce à l’invention est rendue sensible à un amphénicol, par exemple à un amphénicol tel que décrit dans le présent texte, en particulier au chloramphénicol ou au thiamphénicol.
Un exemple particulier de bactérie génétiquement modifiée préférée selon l’invention est la bactérie identifiée dans la présente description en tant que C. beijerinckii IFP962 AcatB telle qu’enregistrée sous le numéro de dépôt LMG P-31 151 auprès de la Belgian Co-ordinated Collections of Micro-organisms (« BCCM », K.L. Ledeganckstraat 35, B-9000 Gent - Belgique) le 6 décembre 2018.
Un autre exemple particulier de bactérie génétiquement modifiée préférée selon l’invention est la bactérie identifiée dans la présente description en tant que C. beijerinckii est une souche C. beijerinckii IFP963 AcatB ApNF2 telle qu’enregistrée sous le numéro de dépôt LMG P-31277 auprès de la collection BCCM- LMG le 20 février 2019.
La description concerne également toute bactérie dérivée, clone, mutant ou version génétiquement modifiée de l’une desdites bactéries, par exemple toute bactérie dérivée, clone, mutant ou version génétiquement modifiée restant sensible à un amphénicol tel que le thiamphénicol et/ou le chloramphénicol, typiquement une bactérie dépourvue du gène catB de séquence SEQ ID NO : 18 et du plasmide pNF2.
Selon un mode de réalisation particulier, la bactérie transformée et/ou génétiquement modifiée selon l’invention, par exemple la bactérie C. beijerinckii IFP962 AcatB ou la bactérie C. beijerinckii IFP963 AcatB ApNF2, est encore susceptible d’être transformée, et de préférence modifiée génétiquement. Elle peut l’être à l’aide d’un acide nucléique, par exemple d’un plasmide tel que décrit dans la présente description, par exemple dans la partie expérimentale. Un exemple d’acide nucléique susceptible d’être avantageusement utilisé est le plasmide pCas9aCr de séquence SEQ ID NO : 23 (décrit dans la partie expérimentale de la présente description) ou encore un plasmide sélectionné parmi pCas9md (SEQ ID NO : 22), pCas9Cond (SEQ ID NO : 133) et pMAD7 (SEQ ID NO : 134).
Un aspect particulier de l’invention concerne en effet l’utilisation d’une bactérie modifiée génétiquement décrite dans le présent texte, de préférence la bactérie C. beijerinckii IFP962 AcatB (également identifiée dans le présent texte en tant que C. beijerinckii DSM 6423 AcatB ) déposée sous le numéro LMG P-31 151, de manière encore plus préférée la bactérie C. beijerinckii IFP963 AcatB ApNF2 déposée sous le numéro LMG P-31277, ou d’une version génétiquement modifiée de l’une de celles-ci, par exemple à l’aide de l’un des acides nucléiques, outils génétiques ou procédés décrits dans le présent texte, pour produire, grâce à l’expression du ou des acides nucléiques d’intérêt introduits volontairement dans son génome, un ou plusieurs solvants, de préférence au moins l’isopropanol, de préférence à l’échelle industrielle.
L’invention concerne aussi un kit (trousse) comprenant (i) un acide nucléique tel que décrit dans le présent texte, par exemple « un acide nucléique OPT » ou un fragment d’ADN reconnaissant une séquence cible dans une bactérie appartenant au phylum des Firmicutes telle que décrite dans le présent texte, et (ii) au moins un outil, de préférence plusieurs outils, sélectionné(s) parmi les éléments d’un outil de modification génétique tel que décrit dans le présent texte permettant de transformer, et typiquement modifier génétiquement une telle bactérie, en vue de produire un variant amélioré de ladite bactérie; un acide nucléique en tant qu’ARNg ; un acide nucléique en tant que matrice de réparation ; un « acide nucléique OPT » ; au moins une paire d’amorces, par exemple une paire d’amorces telle que décrite dans le contexte de la présente invention ; et un inducteur permettant l’expression d’une protéine codée par ledit outil, par exemple d’une nucléase de type Cas9 ou MAD7.
L’outil de modification génétique pour transformer, et typiquement modifier génétiquement une bactérie appartenant au phylum des Firmicutes telle que décrite dans le présent texte, peut-être par exemple sélectionné parmi un « acide nucléique OPT », un outil CRISPR, un outil basé sur l’utilisation d’introns de type II et un outil d’échange allélique, comme expliqué plus haut.
Dans un mode de réalisation particulier, le kit comprend tout ou partie des éléments d’un outil génétique tel que décrit dans le présent texte.
Un kit particulier pour transformer, et de préférence modifier génétiquement, une bactérie appartenant au phylum des Firmicutes telle que décrite dans le présent texte, ou pour produire au moins un solvant, par exemple un mélange de solvants, à l’aide d’une telle bactérie, comprend un acide nucléique comprenant, ou consistant en, i) tout ou partie de la séquence SEQ ID NO : 126 et ii) une séquence permettant la modification du matériel génétique d’une bactérie et/ou l’expression au sein de ladite bactérie d’une séquence d’ADN partiellement ou totalement absente du matériel génétique présent au sein de la version sauvage de ladite bactérie ; ainsi que au moins un inducteur adapté au promoteur inductible de l’expression de la protéine anti-CRISPR sélectionné utilisé au sein d’un outil génétique décrit dans le présent texte.
Le kit peut en outre comprendre un ou plusieurs inducteurs adaptés au(x) promoteur(s) inductible(s) sélectionné(s) éventuellement utilisé(s) au sein de l’outil génétique pour contrôler l’expression de la nucléase utilisée et/ou d’un ou de plusieurs ARN guides.
Un kit particulier selon l’invention permet l’expression d’une nucléase comprenant une étiquette (ou «tag»). Les kits selon l’invention peuvent en outre comprendre un ou plusieurs consommables tels qu’un milieu de culture, au moins une bactérie compétente appartenant au phylum des Firmicutes telle que décrite dans le présent texte, par exemple une bactérie du genre Clostridium, Bacillus ou Lactobacillus , (i.e. conditionnée en vue de la transformation), au moins un ARNg, une nucléase, une ou plusieurs molécules de sélection, ou encore une notice explicative.
La description concerne également l’utilisation d’un kit selon l’invention, ou de l’un ou de plusieurs des éléments de ce kit, pour la mise en œuvre d’un procédé décrit dans le présent texte de transformation, et idéalement de modification génétique, d’une bactérie appartenant au phylum des Firmicutes telle que décrite dans le présent texte, par exemple une bactérie du genre Clostridium, Bacillus ou Lactobacillus (par
exemple la bactérie C. beijerinckii IFP962 AcatB déposée sous le numéro LMG P-31 151), de préférence une bactérie possédant à l’état sauvage à la fois un chromosome bactérien et au moins une molécule d’ADN distincte de l’ADN chromosomique (typiquement un plasmide naturel), de manière préférée entre toute de la bactérie C. beijerinckii IFP963 AcatB ApNF2 déposée sous le numéro LMG P-31277, et/ou pour la production de solvant(s) ou de biocarburant(s), ou de mélanges de ceux-ci, de préférence à l’échelle industrielle, à l’aide d’une telle bactérie.
Des solvants susceptibles d’être produits sont typiquement l’acétone, le butanol, l’éthanol, l’isopropanol ou un mélange de ceux-ci, typiquement un mélange éthanol/isopropanol, butanol/isopropanol, ou éthanol/butanol, de préférence un mélange isopropanoPbutanol.
L’utilisation de bactéries transformées selon l’invention permet typiquement la production par an à l’échelle industrielle d’au moins 100 tonnes d’acétone, d’au moins 100 tonnes d’éthanol, d’au moins 1000 tonnes d’isopropanol, d’au moins 1800 tonnes de butanol, ou d’au moins 40 000 tonnes d’un mélange de ceux-ci.
Les exemples et figures ci-après ont pour but d’illustrer plus pleinement l’invention sans pour autant en limiter la portée.
FIGURES
[Fig 1] La Figure 1 représente le système CRISPR/Cas9 utilisé pour l’édition du génome en tant qu’ outil génétique permettant de créer, à l’aide de la nucléase Cas9, une ou des coupures double brin dans l’ADN génomique dirigée(s) par l’ARNg.
ARNg, ARN guide ; PAM, Protospacer Adjacent Motif. Figure modifiée depuis Jinek et al, 2012.
[Fig 2] La Figure 2 représente la réparation par recombinaison homologue d’une coupure double brin induite par Cas9. PAM, Protospacer Adjacent Motif.
[Fig 3] La Figure 3 représente l’utilisation de CRISPR/Cas9 chez Clostridium.
ermB, gène de résistance à l’érythromycine ; catP (SEQ ID NO : 70), gène de résistance au thiamphénicoPchloramphenicol ; tetR, gène dont le produit d’expression réprime la transcription à partir de Pcm-tet02/l ; Pcm-2tet01 et Pcm-tet02/l, promoteurs inductibles à l’anhydrotétracycycline, « aTc » (Dong et al., 2012) ; miniPthl, promoteur constitutif (Dong et al., 2012).
[Fig 4] La Figure 4 représente la carte du plasmide pCas9aCr (SEQ ID NO : 23).
ermB, gène de résistance à l’érythromycine ; rep, origine de réplication chez E. coli ; repH, origine de réplication chez C. acetobutylicum ; Tthl, terminateur thiolase ; miniPthl, promoteur constitutif (Dong et al., 2012) ; Pcm-tet02/l, promoteur réprimé par le produit de tetR et inductible par l’anhydrotétracycline, « aTc » (Dong et al., 2012) ; Pbgal, promoteur réprimé par le produit de lacR et inductible par le lactose (Hartman et al., 201 1) ; acrIIA4, gène codant la protéine anti-CRISPR AcrII14 ; bgaR, gène dont le produit d’expression réprime la transcription à partir de Pbgal.
[Fig 5] La Figure 5 représente le taux de transformation relatifs de C. acetobutylicum DSM 792 contenant pCas9md (SEQ ID NO : 22) ou pCas9aCT (SEQ ID N : 23). Les fréquences sont exprimées en nombre de transformants obtenus par pg d’ADN utilisé lors de la transformation, rapportées aux fréquences de transformation de pEC750C (SEQ ID NO : 106), et représentent les moyennes d’au moins deux expériences indépendantes.
[Fig 6] La Figure 6 représente l’induction du système CRISPR/Cas9 chez des transformants de la souche DSM 792 contenant pCas9aCT et un plasmide d’expression de l’ARNg ciblant bdhB, avec (SEQ ID NO : 79 et SEQ ID NO : 80) ou sans (SEQ ID NO : 105) matrice de réparation. Em, érythromycine ; Tm, thiamphénicol ; aTc, anhydrotétracycline ; ND, non dilué.
[Fig 7A] La Figure 7 représente la modification du locus bdh de C. acetobutylicum DSM792 via le système CRISPR/Cas9. La figure 7A représente l’organisation génétique du locus bdh. Les homologies entre matrice de réparation et ADN génomique sont mises en évidence à l’aide de parallélogrammes gris clair. Les sites d’hybridation des amorces VI et V2 sont également représentés.
[Fig 7B] La Figure 7 représente la modification du locus bdh de C. acetobutylicum DSM792 via le système CRISPR/Cas9. La figure 7B représente l’amplification du locus bdh à l’aide des amorces VI et V2. M, marqueur de taille 2-log (NEB) ; P, plasmide pGRNA -AbdhAAbdhB ; WT, souche sauvage.
[Fig 8] La Figure 8 représente le classement de 30 souches de Clostridium solvantogènes, d’après Poehlein et al., 2017. A noter que le sous-clade C. beijerinckii N R RL B-593 est également identifié dans la littérature en tant que C. beijerinckii DSM 6423.
[Fig 9] La Figure 9 représente la Carte du plasmide pCas9ind -AcatB
[Fig 10] La Figure 10 représente la Carte du plasmide pCas9acr
[Fig 1 1] La Figure 11 représente la Carte du plasmide pEC750S-iyy;HR
[Fig 12] La Figure 12 représente la Carte du plasmide p EX -A 2 -g R N A - upp.
[Fig 13] La Figure 13 représente la Carte du plasmide pEC750S-Dmpp .
[Fig 14] La Figure 14 représente la Carte du plasmide pEC150C-Aupp
[Fig 15] La Figure 15 représente la Carte du pGRNA-pNF2
[Fig 16] La Figure 16 représente l’Amplification PCR du gène catB dans les clones issus de la transformation bactérienne de la souche C. beijerinckii DSM 6423.
Amplification d’environ 1,5 kb si la souche possède encore le gène catB, ou d’environ 900 pb si ce gène est délété.
[Fig 17] La Figure 17 représente la Croissance des souches C. beijerinckii DSM 6423 WT et AcatB sur milieu 2YTG et milieu sélectif 2YTG thiamphénicol.
[Fig 18] La Figure 18 représente l’Induction du système CRISPR/Cas9acr chez des transformants de la souche C. beijerinckii DSM 6423 contenant pCas9acr et un plasmide d’expression de l’ARNg ciblant upp, avec ou sans matrice de réparation. Légende : Em, érythromycine ; Tm, thiamphénicol ; aTc, anhydrotétracycline ; ND, non dilué.
[Fig 19A] La Figure 19 représente la Modification du locus upp de C. beijerinckii DSM 6423 via le système CRISPR/Cas9. La Figure 19A représente l’organisation génétique du locus upp : gènes, site cible de l’ARNg et matrices de réparation, associées aux régions d’homologies correspondantes sur l’ADN génomique. Les sites d’hybridation des amorces pour la vérification par PCR (RHO 10 et RHO 1 1) sont également indiqués.
[Fig 19B] La Figure 19 représente la Modification du locus upp de C. beijerinckii DSM 6423 via le système CRISPR/Cas9. La Figure 19B représente l’amplification du locus upp à l’aide des amorces RH010 et RH01 1. Une amplification de 1680 pb est attendue dans le cas d’un gène sauvage, contre 1090 pb pour un gène upp modifié. M, marqueur de taille 100 bp - 3 kb (Lonza) ; WT, souche sauvage.
[Fig 20] La Figure 20 représente l’Amplification PCR vérifiant la présence du plasmide pCas9md. dans la souche C. beijerinckii 6423 AcatB.
[Fig 21] La Figure 21 représente l’Amplification PCR (—900 pb) vérifiant la présence ou non du plasmide naturel pNF2 avant induction (contrôle positif 1 et 2) puis après induction sur milieu contenant de l’aTc du système CRISPR-Cas9.
[Fig 22] La Figure 22 représente l’Outil génétique de modification de bactéries, adapté aux bactéries du genre Clostridium, basé sur l’utilisation de deux plasmides (cf. WO2017/064439, Wasels et al., 2017).
[Fig 23] La Figure 23 représente la Carte du plasmide pCas9ind-gRNA_ca/2?.
[Fig. 24] La figure 24 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) pour 20 pg de plasmide pCas9md dans la souche de C. beijerinckii DSM6423. Les barres d’erreur représentent l’erreur standard de la moyenne pour un triplicat biologique.
[Fig. 25] La figure 25 représente la carte du plasmide pNF3.
[Fig. 26] La figure 26 représente la carte du plasmide pEC751 S.
[Fig. 27] La figure 27 représente la carte du plasmide pNF3S.
[Fig. 28] La figure 28 représente la carte du plasmide pNF3E.
[Fig. 29] La figure 29 représente la carte du plasmide pNF3C.
[Fig. 30] La figure 30 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) du plasmide pCas9md dans trois souches de C. beijerinckii DSM 6423. Les barres d’erreur correspondent à l’écart standard de la moyenne pour un duplicat biologique.
[Fig. 31] La figure 31 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) du plasmide pEC750C dans deux souches dérivées de C. beijerinckii DSM 6423. Les barres d’erreur correspondent à l’écart standard de la moyenne pour un duplicat biologique.
[Fig. 32] La figure 32 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) des plasmides pEC750C, pNF3C, pFWOl et pNF3E dans la souche C. beijerinckii IFP963 AcatB ApNF2. Les barres d’erreur correspondent à l’écart standard de la moyenne pour un triplicat biologique.
[Fig. 33] La figure 33 représente l’efficacité de transformation (en colonies observées par pg d’ADN transformé) des plasmides pFWOl, pNF3E et pNF3S dans la souche C. beijerinckii NCIMB 8052.
EXEMPLES
EXEMPLE n°l
Matériels et méthodes
Conditions de culture
C. acetobutylicum DSM 792 a été cultivée en milieu 2YTG (Tryptone 16 g.l-1, extrait de levure 10 g.l-1, glucose 5 g.l-1, NaCl 4 g.l-1). E. coli NEB 10B a été cultivée en milieu LB (Tryptone 10 g.l-1, extrait de levure 5 g.l-1, NaCl 5 g.l-1). Les milieux solides ont été réalisés en ajoutant 15 g.l-1 d’agarose aux milieux liquides. De l'érythromycine (à des concentrations de 40 ou 500 mg.l-1 respectivement en milieu 2YTG ou LB), du chloramphénicol (25 ou 12,5 mg.l-1 respectivement en LB solide ou liquide) et du thiamphénicol (15 mg.l-1 en milieu 2YTG) ont été utilisés lorsque nécessaire.
Manipulation des acides nucléiques
Toutes les enzymes et kits utilisés l’ont été en suivant les recommandations des fournisseurs.
Construction des plasmides
Le plasmide pCas9aCT (SEQ ID NO : 23), présenté en Figure 4, a été construit en clonant le fragment (SEQ ID NO : 81) contenant bgaR et acrIIA4 sous le contrôle du promoteur Pbgal synthétisé par Eurofins Genomics au niveau du site Sacl du vecteur pCas9md (Wasels et al, 2017).
Le plasmide pGRNAmd (SEQ ID NO : 82) a été construit en clonant une cassette d’expression (SEQ ID NO : 83) d’un ARNg sous contrôle du promoteur Pcm-2tet01 (Dong et al, 2012) synthétisée par Eurofins Genomics au niveau du site Sacl du vecteur pEC750C (SEQ ID NO : 106) (Wasels et al, 2017).
Les plasmides pGRNA-xylB (SEQ ID NO : 102), pGRNA-xylR (SEQ ID NO : 103), pGRNA-glcG (SEQ ID NO : 104) et pGRNA-bdhB (SEQ ID NO : 105) ont été construits en clonant les couples d’amorces respectifs 5’-TCATGATTTCTCCATATTAGCTAG-3’ et 5’-AAACCTAGCTAATATGGAGAAATC- 3’, 5’ -TCAT GTTAC ACTT GGAAC AGGCGT - 3’ et 5’ - AAACACGCCT GTTCCAAGTGTAAC-3’ , 5’- TCATTTCCGGCAGTAGGATCCCCA-3’ et 5’-AAACTGGGGATCCTACTGCCGGAA-3’, 5’- TCATGCTTATTACGACATAACACA-3’ et 5’-AAACTGTGTTATGTCGTAATAAGC-3’ au sein du plasmide pGRNAmd (SEQ ID NO : 82) digéré par Bsal.
Le plasmide pGRNA-DM/td (SEQ ID NO : 79) a été construit en clonant le fragment d’ADN obtenu par assemblage par PCR chevauchante des produits PCR obtenus avec les amorces 5’- ATGCATGGATCCAAACGAACCCAAAAAGAAAGTTTC-3’ et 5’-
GGTTGATTTCAAATCTGTGTAAACCTACCG-3’ d’une part, 5’-
ACACAGATTTGAAATCAACCACTTTAACCC-3’ et 5’-
ATGCATGTCGACTCTTAAGAACATGTATAAAGTATGG-3’ d’autre part, dans le vecteur pGRNA- bdhB digéré par Barri H I et Sacl.
Le plasmide pGKN A- AbdhAAbdhB (SEQ ID NO : 80) a été construit en clonant le fragment d’ADN obtenu par assemblage par PCR chevauchante des produits PCR obtenus avec les amorces 5’- ATGCATGGATCCAAACGAACCCAAAAAGAAAGTTTC-3’ et 5’-
GCTAAGTTTTAAATCTGTGTAAACCTACCG-3’ d’une part, 5’-
ACACAGATTTAAAACTTAGCATACTTCTTACC-3’ et 5’-
ATGCATGTCGACCTTCTAATCTCCTCTACTATTTTAG -3’ d’autre part, dans le vecteur pGRNA- bdhB digéré par BamHI et Sacl.
Transformation
C. acetobutylicum DSM 792 a été transformée selon le protocole décrit par Mermelstein et al, 1993. La sélection de transformants de C. acetobutylicum DSM 792 contenant déjà un plasmide d’expression de Cas9 (pCas9md ou pCas9aCr) transformés avec un plasmide contenant une cassette d’expression d’un ARNg a été réalisée sur milieu 2YTG solide contenant de l’érythromycine (40 mg.l-1), du thiamphénicol (15 mg.l 1 ) et du lactose (40 nM).
Induction de l’expression de cas9
L’induction de l’expression de cas9 a été réalisée via la croissance des transformants obtenus sur un milieu 2YTG solide contenant de l’érythromycine (40 mg.l-1), du thiamphénicol (15 mg.l-1) et l’agent inducteur de l’expression de cas9 et de l’ARNg, l’aTc (1 mg.l-1).
Amplification du locus bdh
Le contrôle de l’édition du génome de C. acetobutylicum DSM 792 au niveau du locus des gènes bdh A et bdhB a été réalisé par PCR à l’aide de l’enzyme Q5® High-Fidelity DNA Polymerase (NEB) à l’aide des amorces VI (5’-ACACATTGAAGGGAGCTTTT-3’) et V2 (5’- GGCAAC AAC AT CAGGCCTTT-3’ ) .
Résultats
Efficacité de transformation
Afin d’évaluer l’impact de l’insertion du gène acrIIA4 sur la fréquence de transformation du plasmide d’expression de cas9, différents plasmides d’expression d’ARNg ont été transformés dans la souche DSM 792 contenant pCas9md (SEQ ID NO : 22) ou pCas9aCT (SEQ ID NO : 23), et les transformants ont été sélectionnés sur un milieu supplémenté en lactose. Les fréquences de transformations obtenues sont présentées en Figure 5.
Génération de mutants AbdhB et AbdhAAbdhB
Le plasmide de ciblage contenant la cassette d’expression de l’ARNg ciblant bdhB (pGRNA-bdhB - SEQ ID NO : 105) ainsi que deux plasmides dérivés contenant des matrices de réparation permettant la délétion du gène bdhB seul (pGRNA-AM/zR - SEQ ID NO : 79) ou des gènes bdhA et bdhB (pGRNA -AbdhAAbdhB - SEQ ID NO : 80) ont été transformés dans la souche DSM 792 contenant pCas9md (SEQ ID NO : 22) ou pCas9acr (SEQ ID NO : 23). Les fréquences de transformation obtenues sont présentées dans le Tableau 2 : [Tableau 2]
Fréquences de transformation de la souche DSM 792 contenant pCas9md ou pCas9aCT avec des plasmides ciblant bdhB. Les fréquences sont exprimées en nombre de transformants obtenus par pg d’ADN utilisé lors de la transformation, et représentent les moyennes d’au moins deux expériences indépendantes.
Les transformants obtenus ont subi une phase d’induction de l’expression du système CRISPR/Cas9 via un passage sur milieu supplémenté en anhydrotétracycline, aTc (Figure 6).
Les modifications désirées ont été confirmées par PCR sur l’ADN génomique de deux colonies résistantes à l’aTc (Figure 7).
Conclusions
L’outil génétique basé sur CRISPR/Cas9 décrit dans Wasels et al. (2017) utilise deux plasmides :
- le premier plasmide, pCas9md, contient cas9 sous contrôle d’un promoteur inductible à TaTc, et
- le deuxième plasmide, dérivé de pEC750C, contient la cassette d’expression d’un ARNg (placé sous le contrôle d’un second promoteur inductible à l’aTc) ainsi qu’une matrice d’édition permettant de réparer la cassure double brin induite par le système.
Cependant, les inventeurs ont observé que certains ARNg semblaient encore être trop toxiques, malgré le contrôle de leur expression ainsi que de celle de Cas9 à l’aide de promoteurs inductibles à l’aTc, limitant en conséquence l’efficacité de transformation des bactéries par l’outil génétique et donc la modification du chromosome.
Afin d’améliorer cet outil génétique, le plasmide d’expression de cas9 a été modifié, via l’insertion d’un gène anti-CRISPR, acrIIA4, sous contrôle d’un promoteur inductible au lactose. Les efficacités de
transformation de différents plasmides d’expression d’ARNg ont ainsi pu être améliorées de manière très significative, permettant l’obtention de transformants pour tous les plasmides testés.
Il a également été possible de réaliser l’édition du locus bdhB au sein du génome de C. acetobutylicum DSM 792, à l’aide de plasmides qui n’avaient pas pu être introduits dans la souche DSM 792 contenant pCas9md. Les fréquences de modification observées sont les mêmes que celles observées précédemment (Wasels et al, 2017), avec 100% des colonies testées modifiées.
En conclusion, la modification du plasmide d’expression de cas9 permet un meilleur contrôle du complexe ribonucléoprotéique Cas9-ARNg, facilitant avantageusement l’obtention de transformants dans lesquels l’action de Cas9 peut être déclenchée afin d’obtenir des mutants d’intérêt.
EXEMPLE n°2
Matériels et méthodes
Conditions de culture
C. beijerinckn DSM 6423 a été cultivée en milieu 2YTG (Tryptone 16 g L-1, extrait de levure 10 g L-1, glucose 5 g L-1, NaCl 4 g L-1). E. coli NEB 10-beta et INV1 10 ont été cultivées en milieu LB (Tryptone 10 g L-1, extrait de levure 5 g L-1, NaCl 5 g L-1). Les milieux solides ont été réalisés en ajoutant 15 g L-1 d’agarose aux milieux liquides. De l'érythromycine (à des concentrations de 20 ou 500 mg L-1 respectivement en milieu 2YTG ou LB), du chloramphénicol (25 ou 12,5 mg L-1 respectivement en LB solide ou liquide), du thiamphénicol (15 mg L-1 en milieu 2YTG) ou de la spectinomycine (à des concentrations de 100 ou 650 mg L-1 respectivement en milieu LB ou 2YTG) ont été utilisés si nécessaire.
Acides nucléiques et vecteurs plasmidiques
Toutes les enzymes et kits utilisés l’ont été en suivant les recommandations des fournisseurs.
Les tests de PCR sur colonie ont respecté le protocole suivant :
Une colonie isolée de C. beijerinckii DSM 6423 est resuspendue dans 100 pL de Tris 10 mM pH 7,5 EDTA 5 mM. Cette solution est chauffée à 98 °C pendant 10 min sans agitation. 0,5 pL de ce lysat bactérien peuvent alors être utilisés comme matrice de PCR dans des réactions de 10 pL avec la Phire (Thermo Scientific), la Phusion (Thermo Scientific), la Q5 (NEB) ou la KAPA2G Robust (Sigma-Aldrich) polymerase.
La liste des amorces ayant servies à l’ensemble des constructions (nom/séquence d’ADN) est détaillée ci- dessous :
AcatB fwd : TGTTATGGATTATAAGCGGCTCGAGGACGTCAAACCATGTTAATCATTGC AcatB rev : AATCTATCACTGATAGGGACTCGAGCAATTTCACCAAAGAATTCGCTAGC
ca -gN -e :
AAT CT AT C ACT GATAGGGACT CGAGGGGCAAAAGT GTAAAGAC AAGCTT C RH076 : CATATAATAAAAGGAAACCTCTTGATCG
RH077 : ATTGCCAGCCTAACACTTGG
RH001 : ATCTCCATGGACGCGTGACGTCGACATAAGGTACCAGGAATTAGAGCAGC
RH002 : TCTATCTCCAGCTCTAGACCATTATTATTCCTCCAAGTTTGCT
RH003 : ATAATGGTCTAGAGCTGGAGATAGATTATTTGGTACTAAG
RH004 : TATGACCATGATTACGAATTCGAGCTCGAAGCGCTTATTATTGCATTAGC pEX-fwd : C AG ATT GTACT GAGAGT GC ACC
pEX-rev : GT GAGCGGATAACAATTT CAC AC
pEC750C-fwd : CAATATTCCACAATATTATATTATAAGCTAGC
M13-rev : CAGGAAAC AGCT AT GAC
RHO 10 : CGGATATTGCATTACCAGTAGC
RHO 11 : TT AT C AAT CT CTTAC ACAT GGAGC
RH025 : TAGTATGCCGCCATTATTACGACA
RH 134 : GT CGACGT GGAATT GT GAGC
pNF2_fwd : GGGCGCACTTATACACCACC
pNF2_rev : TGCTACGCACCCCCTAAAGG
RH021 : ACTTGGGTCGACCACGATAAAACAAGGTTTTAAGG
RH022 : TACCAGGGATCCGTATTAATGTAACTATGATATCAATTCTTG
aad9-fwd2 : ATGCATGGTCCCAATGAATAGGTTTACACTTACTTTAGTTTTATGG aad9-rev : ATGCGAGTTAACAACTTCTAAAATCTGATTACCAATTAG
RH031 : ATGCATGGATCCCAATGAATAGGTTTACACTTACTTTAGTTTTATGG
RH032 : AT GCG AGAGCT C AACTT CTAAAAT CT GATTACC AATTAG
RH138 : AT GCAT GGAT CCGT CT GACAGTTACC AGGTCC
RH 139 : AT GCG AGAGCTCC AATT GTT CAAAAAAATAAT GGCGGAG
RH 1 AT ATGCATGGATCCCGGCAGTTTTTCTTTTTCGG
RH141 ATGCGAGAGCTCGGTTAAATACTAGTTTTTAGTTACAGAC
Les vecteurs plasmidiques suivants ont été préparés :
- Plasmide N° 1 : pEX-A258-Aca/£ (SEQ ID NO : 17)
Il contient le fragment d’ADN synthétisé AcatB cloné dans le plasmide pEX-A258. Ce fragment AcatB comprend i) une cassette d’expression d’un ARN guide ciblant le gène catB (gène de résistance au chloramphénicol codant une chloramphénicol-O-acetyltransférase - SEQ ID NO : 18) de C. beijerinckii DSM6423 sous le contrôle d’un promoteur inductible à l’anhydrotetracycline (cassette d’expression : SEQ
ID NO : 19), et ii) une matrice d’édition (SEQ ID NO : 20) comprenant 400 pb homologues situées en amont et en aval du gène catB.
- Plasmide N°2 : pCas9ind-AcatB (cf. Figure 9 et SEQ ID NO : 21)
Il contient le fragment AcatB amplifié par PCR (amorces AcatB fwd et AcatB rev) et cloné dans le pCas9ind (décrit dans la demande de brevet WO2017/064439 - SEQ ID NO : 22) après digestion des différents ADN par l’enzyme de restriction Xhol.
- Plasmide N°3 : pCas9acr (cf. Figure 10 et SEQ ID NO : 23)
- Plasmide N°4 : pEC750S-w£/ÆlR (cf. Figure 1 1 et SEQ ID NO : 24)
Il contient une matrice de réparation (SEQ ID NO : 25) utilisée pour la délétion du gène upp et constituée par deux fragments d’ADN homologues en amont et en aval du gène upp (tailles respectives : 500 (SEQ ID NO : 26) et 377 (SEQ ID NO : 27) paires de bases). L’assemblage a été obtenu à l’aide du système de clonage Gibson (New England Biolabs, Gibson assembly Master Mix 2X). Pour ce faire, les parties amont et aval ont été amplifiée par PCR à partir de l’ADN génomique de la souche DSM 6423 (cf. Maté de Gerando et al., 2018 et numéro d’accession PRJEB 1 1626
(https://www.ebi.ac.uk/ena/data/view/PRJEB1 1626)) à l’aide des amorces respectives RH001 / RH002 et RH003 / RH004. Ces deux fragments ont ensuite été assemblés dans le pEC750S linéarisé au préalable par restriction enzymatique (enzymes de restriction Sali et Sacl).
- Plasmide N°5 : pEX-A2-gRNA-w/?p (cf. Figure 12 et SEQ ID NO : 28)
Ce plasmide comprend le fragment d’ADN gRNA-upp correspondant à une cassette d’expression (SEQ ID NO : 29) d’un ARN guide ciblant le gène upp (protospacer ciblant upp (SEQ ID NO :31)) sous le contrôle d’un promoteur constitutif (ARN non codant de séquence SEQ ID NO : 30), inséré dans un plasmide de réplication nommé pEX-A2.
- Plasmide N°6 : pEC750S-Aw/?p (cf. Figure 13 et SEQ ID NO : 32)
Il possède comme base le plasmide pEC750S-w/?pHR (SEQ ID NO : 24) et contient en plus le fragment d’ADN comportant une cassette d’expression d’un ARN guide ciblant le gène upp sous le contrôle d’un promoteur constitutif.
Ce fragment a été inséré dans un pEX-A2, appelé pEX-A2-gRNA-upp. L’insert a ensuite été amplifié par PCR avec les amorces pEX-fwd et pEX-rev, puis digéré avec les enzymes de restriction Xhol et Ncol. Enfin, ce fragment a été cloné par ligation dans le pEC750S-w/?pHR préalablement digéré par les mêmes enzymes de restriction pour obtenir le pEC750S-Dmpp .
- Plasmide N°7 : pEC750C-Aupp (cf. Figure 14 et SEQ ID NO : 33)
La cassette comportant l’ARN guide ainsi que la matrice de réparation ont ensuite été amplifiés avec les amorces pEC750C-fwd et M13-rev. L’amplicon a été digéré par restriction enzymatique avec les enzymes Xhol et Sacl, puis cloné par ligation enzymatique dans le pEC750C pour obtenir le pEC750C-Dmpp.
- Plasmide N°8 : pGRNA-pNF2 (cf. Figure 15 et SEQ ID NO : 34)
Ce plasmide a comme base pEC750C et contient une cassette d’expression d’un ARN guide ciblant le plasmide pNF2 (SEQ ID NO : 1 18).
- Plasmide N°9 : pCas9ind-gRNA_ca/R (cf. Figure 23 et SEQ ID NO : 38).
Il contient la séquence codant pour l’ARN guide ciblant le locus catB amplifiée par PCR (amorces AcatB fwd et AcatB gRNA rev) et clonée dans le pCas9ind (décrit dans la demande de brevet WO2017/064439) après digestion des différents ADN par l’enzyme de restriction Xhol et ligation.
- Plasmide N°10 : pNF3 (cf. Figure 25 et SEQ ID NO : 1 19)
Il contient une partie du pNF2, comprenant notamment l’origine de réplication et un gène codant pour une protéine de réplication de plasmide (CIBE_p20001), amplifiée avec les amorces RH021 et RH022. Ce produit de PCR a ensuite été cloné au niveau des sites de restriction Sali et BamHI dans le plasmide pUC19 (SEQ ID NO : 1 17).
- Plasmide N°1 1 : pEC751S (cf. Figure 26 et SEQ ID NO : 121)
Il contient tous les éléments du pEC750C (SEQ ID NO : 106), sauf le gène de résistance au chloramphénicol catP (SEQ ID NO : 70). Ce dernier a été remplacé par le gène aad9 d’ Enterococcus faecalis (SEQ ID NO : 130), qui confère une résistance à la spectinomycine. Cet élément a été amplifié avec les amorces aad9- fwd2 et aad9-rev à partir du plasmide pMTL007S-El (SEQ ID NO : 120) et cloné dans les sites Avall et Hpal du pEC750C, à la place du gène catP (SEQ ID NO : 70).
- Plasmide N°12 : pNF3S (cf. Figure 27 et SEQ ID NO : 123)
Il contient tous les éléments du pNF3, avec une insertion du gène aad9 (amplifié avec les amorces RH031 et RH032 à partir du pEC751 S) entre les sites BamHI et Sacl.
- Plasmide N°13 : pNF3E (cf. Figure 28 et SEQ ID NO : 124)
Il contient tous les éléments du pNF3, avec une insertion du gène ermB de Clostridium difficile (SEQ ID NO : 131) sous le contrôle du promoteur miniPthl. Cet élément a été amplifié à partir du pFWOl avec les amorces RH138 et RH 139 et cloné entre les sites BamHI et Sacl du pNF3E.
- Plasmide N°14 : pNF3C (cf. Figure 29 et SEQ ID NO : 125)
Il contient tous les éléments du pNF3, avec une insertion du gène cal P de Clostridium perfringens (SEQ ID NO : 70). Cet élément a été amplifié à partir du pEC750C avec les amorces RH140 et RH141 et cloné entre les sites BamHI et Sacl du pNF3E.
Résultats n°l
Transformation de la souche C. beijerinckii DSM 6423
Les plasmides ont été introduits et répliqués dans une souche de E. coli demi dcm (INV110, Invitrogen). Ceci permet d’éliminer les méthylations de type Dam et Dcm sur le plasmide pCas9ind-DcatB avant de l’introduire par transformation dans la souche DSM 6423 selon le protocole décrit par Mermelstein et al. (1993), avec les modifications suivantes : la souche est transformée avec une quantité plus importante de plasmide (20 pg), à une DOÔOO de 0,8, et à l’aide des paramètres d’électroporation suivants : 100 W, 25 pF, 1400 V. L’étalement sur boite de Pétri contenant de l'érythromycine (20 mg/mL) a ainsi permis d’obtenir des transformants de C. beijerinckii DSM 6423 contenant le plasmide pCas9ind -AcatB.
Induction de l’expression de cas 9 et obtention de la souche C. beijerinckii DSM 6423 AcatB (C. beijerinckii IFP962 AcatB )
Plusieurs colonies résistantes à l’érythromycine ont ensuite été reprises dans 100 pL de milieu de culture (2YTG) puis diluées en série jusqu’à un facteur de dilution de 104 dans du milieu de culture. Pour chaque colonie, huit pL de chaque dilution ont été déposés sur une boîte de Pétri contenant de l’érythromycine et de l’anhydrotétracycline (200 ng/mL) permettant d’induire l’expression du gène codant la nucléase Cas9. Après extraction d’ADN génomique, la délétion du gène catB au sein des clones ayant poussés sur cette boite a été vérifiée par PCR, à l’aide des amorces RH076 et RH077 (cf. Figure 16).
Vérification de la sensibilité de la souche C. beijerinckii DSM 6423 AcatB au thiamphénicol
Pour s’assurer que la délétion du gène catB confère bien une sensibilité nouvelle au thiamphénicol, des analyses comparatives sur milieu gélosé ont été réalisées. Des précultures de C. beijerinckii DSM 6423 et C. beijerinckii DSM 6423 AcatB ont été réalisées sur milieu 2YTG puis 100 pL de ces précultures ont été étalés sur des milieux gélosés 2YTG supplémentée ou non en thiamphénicol à une concentration de 15 mg/L. La figure 17 permet d’observer que seule la souche initiale C. beijerinckii DSM 6423 est capable de pousser sur un milieu supplémenté en thiamphénicol.
Délétion du gène upp par l’outil CRISPR-Cas9 dans la souche C. beijerinckii DSM 6423 AcatB
Un clone de la souche C. beijerinckii DSM 6423 AcatB a été au préalable transformé avec le vecteur pCas9acr ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type dam et dcm (préparé à partir d’une bactérie Escherichia coli présentant le génotype dam demj. La
vérification de la présence du plasmide pCas9aCT maintenu dans la souche C. beijerinckii DSM 6423 a été vérifiée par PCR sur colonie avec les amorces RH025 et RH 134.
Un clone résistant à l'érythromycine a ensuite été transformé avec pEC750C-Dmpp préalablement déméthylé. Les colonies ainsi obtenues ont été sélectionnées sur du milieu contenant de l'érythromycine (20 mg/mL), du thiamphénicol (15 mg/mL) et du lactose (40 mM).
Plusieurs de ces clones ont ensuite été resuspendus dans 100 pL de milieu de culture (2YTG) puis dilués en série dans du milieu de culture (jusqu’à un facteur de dilution de 104). Cinq pL de chaque dilution ont été déposés sur une boîte de Pétri contenant de l’érythromycine, du thiamphénicol et de l’anhydrotétracycline (200 ng/mL) (cf. Figure 18).
Pour chaque clone, deux colonies résistantes à l’aTc ont été testées par colonie PCR avec des amorces destinées à amplifier le locus upp (cf. Figure 19).
Délétion du plasmide naturel pNF2 par l’outil CRISPR-Cas9 dans la souche C. beijerinckii DSM 6423 AcatB
Un clone de la souche C. beijerinckii DSM 6423 AcatB a été au préalable transformé avec le vecteur pCas9md ne présentant pas de méthylation aux niveaux des motifs reconnus par les méthyltransférases de type Dam et Dcm (préparé à partir d’une bactérie Escherichia coli présentant le génotype du ni dcm). La présence du plasmide pCas9md au sein de la souche C. beijerinckii DSM6423 a été vérifiée par PCR avec les amorces pCas9ind_fwd (SEQ ID NO : 42) et pCas9ind_ rev (SEQ ID NO : 43) (cf. Figure 20).
Un clone résistant à l’érythromycine a ensuite été utilisé pour transformer le pGRNA-pNF2, préparé à partir d’une bactérie Escherichia coli présentant le génotype du ni dcm .
Plusieurs colonies obtenues sur du milieu contenant de l’érythromycine (20 mg/mL) et du thiamphénicol ( 15 mg/mL) ont été resuspendues dans du milieu de culture et diluées en série jusqu’à un facteur de dilution de 104. Huit pL de chaque dilution ont été déposés sur une boîte de Pétri contenant de l’érythromycine, du thiamphénicol et de l’anhydrotétracycline (200 ng/mL) afin d’induire l’expression du système CRISPR/Cas9.
L’absence du plasmide naturel pNF2 a été vérifiée par PCR avec les amorces pNF2_fwd (SEQ ID NO: 39) et pNF2_rev (SEQ ID NO : 40) (cf. Figure 21).
Conclusions
Au cours de ce travail, les inventeurs sont parvenus à introduire et maintenir différents plasmides au sein de la souche Clostridium beijerinckii DSM 6423. Ils sont parvenus à supprimer le gène catB à l’aide d’un outil de type CRISPR-Cas9 basé sur l’utilisation d’un seul plasmide. La sensibilité au thiamphénicol des souches recombinantes obtenues a été confirmée par des tests en milieu gélosé.
Cette délétion leur a permis d’utiliser plus efficacement l’outil CRISPR-Cas9 nécessitant deux plasmides décrit dans la demande de brevet FRI 854835. Deux exemples permettant de démontrer l’intérêt de cette
application ont été réalisés : la délétion du gène upp et l’élimination d’un plasmide naturel non essentiel pour la souche Clostridium beijerinckii DSM 6423.
Résultats n°2
Transformation des souches de C. beijerinckii
Les plasmides préparés dans la souche ά’ E. coli NEB 10-beta sont également utilisés pour transformer la souche C. beijerinckii NCIMB 8052. En revanche, pour C. beijerinckii DSM 6423, les plasmides sont préalablement introduits et répliqués dans une souche de E. coli demi dcm- (INV1 10, Invitrogen). Ceci permet d’éliminer les méthylations de type Dam et Dcm sur les plasmides d’intérêt avant de les introduire par transformation dans la souche DSM 6423.
La transformation est autrement réalisée similairement pour chaque souche, c’est-à-dire selon le protocole décrit par Mermelstein et al. 1992, avec les modifications suivantes : la souche est transformée avec une quantité plus importante de plasmide (5-20 pg), à une DO600 de 0,6-0, 8, et les paramètres d’électroporation sont 100 W, 25 pF, 1400 V. Après 3h de régénération dans du 2YTG, les bactéries sont étalées sur boîte de Pétri (2YTG agar) contenant l’antibiotique souhaité (érythromycine : 20-40 mg/mL ; thiamphénicol : 15 mg/mL ; spectinomycine : 650 mg/mL).
Comparaison des efficacités de transformation des souches de C. beijerinckii DSM 6423
Des transformations ont été réalisées en duplicat biologique dans les souches de C. beijerinckii suivantes : DSM 6423 sauvage, DSM 6423 AcatB et DSM 6423 AcalB ApNF2 (Figure 30). Pour cela, le vecteur pCas9md, notablement difficile à utiliser pour modifier une bactérie car ne permettant pas de bonnes efficacités de transformation, a été utilisé. Il comporte de plus un gène conférant à la souche une résistance à l’érythromycine, antibiotique pour lequel les trois souches sont sensibles.
Les résultats indiquent une augmentation de l’efficacité de transformation d’un facteur d’environ 15-20 imputable à la perte du plasmide naturel pNF2.
L’efficacité de transformation a également été testée pour le plasmide pEC750C, qui confère une résistance au thiamphénicol, uniquement dans les souches DSM 6423 AcatB (IFP962 AcatB) et DSM 6423 AcatB ApNF2 (IFP963 AcatB ApNF2), puisque la souche sauvage est résistante à cet antibiotique (Figure 31). Pour ce plasmide, le gain en efficacité de transformation est encore plus flagrant (amélioration d’un facteur d’environ 2000).
Comparaison des efficacités de transformation des plasmides pNF3 avec d’autres plasmides
Afin de déterminer l’efficacité de transformation de plasmides contenant l’origine de réplication du plasmide naturel pNF2, les plasmides pNF3E et pNF3C ont été introduits dans la souche C. beijerinckii DSM 6423 AcatB ApNF2. L’utilisation de vecteurs contenant des gènes de résistance à l'érythromycine ou au chloamphénicol permet de comparer l’efficacité de transformation du vecteur en fonction de la nature du gène de résistance. Les plasmides pFWOl et pEC750C ont également été transformés. Ces deux
plasmides contiennent des gènes de résistance à des antibiotiques différents (respectivement G érythromycine et le thiamphénicol) et sont couramment utilisés pour transformer C. beijerinckii et C. acetobutylicum.
Comme montré dans la Figure 32, les vecteurs basés sur le pNF3 présentent une excellente efficacité de transformation, et sont notamment utilisables chez C. beijerinckii DSM 6423 AcatB ApNF2. En particulier, le pNF3E (qui contient un gène de résistance à l’érythromycine) montre une efficacité de transformation nettement supérieure à celle de pFWOl, qui comprend le même gène de résistance. Ce même plasmide n’a pas pu être introduit dans la souche C. beijerinckii DSM 6423 sauvage (0 colonies obtenues avec 5 pg de plasmides transformés en duplicat biologique), ce qui démontre l’impact de la présence du plasmide naturel pNF2.
Vérification de la transformabilité des plasmides pNF3 dans d’autres souches/espèces
Pour illustrer la possibilité d’utiliser ce nouveau plasmide dans d’autres souches solvantogènes de Clostridium, les inventeurs ont réalisé une analyse comparative des efficacités de transformation des plasmides pFWOl, pNF3E et pNF3S dans la souche ABE C. beijerinckii NCIMB 8052 (Figure 33). La souche NCIMB 8052 étant naturellement résistante au thiamphénicol, le pNF3S, conférant une résistance à la spectinomycine, a été utilisé à la place du pNF3C.
Les résultats démontrent que la souche NCIMB 8052 est transformable avec les plasmides basés sur le pNF3, ce qui prouve que ces vecteurs sont applicables à l’espèce C. beijerinckii au sens large.
L’applicabilité de la suite de vecteurs de synthèse basés sur le pNF3 a également été testée dans la souche référence DSM 792 de C. acetobutylicum. Un essai de transformation a ainsi montré la possibilité de transformer cette souche par le plasmide pNF3C (Efficacité de transformation de 3 colonies observées par pg d’ADN transformé contre 120 colonies/pg pour le plasmide pEC750C).
Vérification de la compatibilité des plasmides pNF3 avec l’outil génétique décrit dans la demande FR18/73492
La demande de brevet FRI 8/73492 décrit la souche AcatB ainsi que l’utilisation d’un système CRISPR/Cas9 à deux plasmides nécessitant l’utilisation d’un gène de résistance à l’érythromycine et d’un gène de résistance au thiamphénicol. Pour démontrer l’intérêt de la nouvelle suite de plasmides pNF3, le vecteur pNF3C a été transformé dans la souche AcatB contenant déjà le plasmide pCas9acr. La transformation, réalisée en duplicat, a montré une efficacité de transformation de 0,625 ± 0, 125 colonies/pg d’ADN (moyenne ± erreur standard), ce qui prouve qu’un vecteur basé sur le pNF3C peut être utilisé en combinaison avec le pCas9acr dans la souche AcatB.
Parallèlement à ces résultats, une partie du plasmide pNF2 comprenant son origine de réplication (SEQ ID NO : 118) a pu être réutilisée avec succès pour créer une nouvelle suite de vecteurs navettes (SEQ ID NO : 1 19, 123, 124 et 125), modifiables à façon, permettant notamment leur réplication dans une souche à'E.
coli ainsi que leur réintroduction chez C. beijerinckii DSM 6423. Ces nouveaux vecteurs présentent des efficacités de transformation avantageuses pour réaliser de l’édition génétique par exemple chez C. beijerinckii DSM 6423 et ses dérivées, en particulier à l’aide de l’outil CRISPR/Cas9 comprenant deux acides nucléiques différents.
Ces nouveaux vecteurs ont également pu être testés avec succès dans une autre souche de C. beijerinckii (NCIMB 8052), et d’espèce de Clostridium (en particulier C. acetobutylicum), démontrant leur applicabilité dans d’autres organismes du phylum des Firmicutes. Un test est également réalisé sur Bacillus.
Conclusions
Ces résultats démontrent que la suppression du plasmide naturel pNF2 augmente significativement les fréquences de transformation de la bactérie qui le contenait (d’un facteur d’environ 15 pour le pFWOl et d’un facteur d’environ 2000 pour le pEC750C). Ce résultat est particulièrement intéressant dans le cas des bactéries du genre Clostridium, connues pour être difficiles à transformer, et en particulier pour la souche C. beijerinckii DSM 6423 qui souffre naturellement d’une efficacité de transformation faible (inférieure à 5 colonies/pg de plasmide).
REFERENCES
- Banerjee, A., Leang, C, Ueki, T., Nevin, K. P., & Lovley, D. R. (2014). Lactose-inducible System for metabolic engineering of Clostridium ljungdahlii. Applied and environmental microbiology, 80(8), 2410- 2416.
- Chen J.-S., Hiu S.F. (1986) Acetone-butanol-isopropanol production by Clostridium beijerinckii (synonym, Clostridium butylicum). Biotechnol. Lett. 8:371-376.
- Cui, L., & Bikard, D. (2016). Conséquences of Cas9 cleavage in the chromosome of Escherichia coli. Nucleic acids research, 44(9), 4243-4251.
- Currie, D. H., Herring, C. D., Guss, A. M., Oison, D. G., Hogsett, D. A., & Lynd, L. R. (2013). Functional heterologous expression of an engineered full length CipA firom Clostridium thermocellum in Thermoanaerobacterium saccharolyticum. Biotechnology for biofüels, 6(1), 32.
- DiCarlo, J. E., Norville, J. E., Mali, P., Rios, X., Aach, J., & Church, G. M. (2013). Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas Systems. Nucleic acids research, 41(7), 4336-4343.
- Dong, H., Tao, W., Zhang, Y., & Li, Y. (2012). Development of an anhydrotetracycline-inducible gene expression System for solvent-producing Clostridium acetobutylicum : A useful tool for strain engineering. Metabolic engineering, 14(1), 59-67.
- Dong, D., Guo, M., Wang, S., Zhu, Y., Wang, S., Xiong, Z., ... & Huang, Z. (2017). Structural basis of CRISPR-SpyCas9 inhibition by an anti-CRISPR protein. Nature, 546(7658), 436.
- Dupuy, B., Mani, N., Katayama, S., & Sonenshein, A. L. (2005). Transcription activation of a UV- inducible Clostridium perfringens bacteriocin gene by a novel s factor. Molecular microbiology, 55(4), 1 196-1206.
- Egholm, M., Buchardt, O., Nielsen, P. E., & Berg, R. H. (1992). Peptide nucleic acids (PNA). Oligonucleotide analogs with an achiral peptide backbone. Journal of the American Chemical Society, 1 14(5), 1895-1897.
- Fonfara, L, Le Rhun, A., Chylinski, K., Makarova, K. S., Lecrivain, A. L., Bzdrenga, J., ... & Charpentier, E. (2013). Phylogeny of Cas9 détermines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas Systems. Nucleic acids research, 42(4), 2577-2590.
- Garcia-Doval C, Jinek M. Molecular architectures and mechanisms of Class 2 CRISPR-associated nucleases. Curr Opin Struct Biol. 2017 Dec;47: 157-166. doi: 10.1016/j. sbi.2017.10.015 Ajouter au projet Citavi par DOI. Epub 2017 Nov 3. Review.
- George H.A., Johnson J.L., Moore W. E. C., Holdeman, L. V., Chen J. S. (1983) Acetone, Isopropanol, and Butanol Production by Clostridium beijerinckii (syn. Clostridium butylicum) and Clostridium aurantibutyricum. Appl. Env. Microbiol. 45: 1160-1 163.
- Gonzales y Tucker RD, Frazee B. View firom the front Unes: an emergency medicine perspective on clostridial infections in injection drug users. Anaerobe. 2014 Dec; 30: 108- 15.
- Hartman, A. H., Liu, H., & Melville, S. B. (201 1). Construction and characterization of a lactose-inducible promoter System for controlled gene expression in Clostridium perfringens. Applied and environmental microbiology, 77(2), 471-478.
- Heap, J. T., Ehsaan, M., Cooksley, C. M., Ng, Y. K., Cartman, S. T., Winzer, K., & Minton, N. P. (2012). Intégration of DNA into bacterial chromosomes firom plasmids without a counter-selection marker. Nucleic acids research, 40( 8), e59-e59.
- Heap, J. T., Kuehne, S. A., Ehsaan, M., Cartman, S. T., Cooksley, C. M., Scott, J. C., & Minton, N. P. (2010). The ClosTron: mutagenesis in Clostridium refined and streamlined. Journal of microbiological methods, 80(1), 49-55.
- Heap, J. T., Pennington, O. J., Cartman, S. T., Carter, G. P., & Minton, N. P. (2007). The ClosTron: a universal gene knock-out System for the genus Clostridium. Journal of microbiological methods, 70(3), 452-464.
- Heap, J. T., Pennington, O. J., Cartman, S. T., & Minton, N. P. (2009). A modular System for Clostridium shuttle plasmids. Journal of microbiological methods, 78( 1), 79-85.
- Hidalgo-Cantabrana, C., O’Flaherty, S., & Barrangou, R. (2017). CRISPR-based engineering of next- generation lactic acid bacteria. Current opinion in microbiology, 37, 79-87.
- Hiu S.F., Zhu C.-X., Yan R.-T., Chen J.-S. (1987) Butanol-ethanol dehydrogenase and butanol-ethanol- isopropanol dehydrogenase: different alcohol dehydrogenases in two strains of Clostridium beijerinckii (Clostridium butylicum). Appl. Env. Microbiol. 53:697-703.
- Huang, H., Chai, C., Li, N., Rowe, P., Minton, N. P., Yang, S., & Gu, Y. (2016). CRISPR/Cas9-based efficient genome editing in Clostridium ljungdahlii, an autotrophic gas-fermenting bacterium. ACS synthetic biology, 5(12), 1355- 1361.
- Huggins, A.S., Bannam, T.L. and Rood, J.I. (1992) Comparative sequence analysis of the catB gene firom Clostridium butyricum. Antimicrob. Agents Chemother. 36, 2548-2551.
- Ismaiel A.A., Zhu C.X., Colby G.D., Chen, J. S. (1993). Purification and characterization of a primary- secondary alcohol dehydrogenase from two strains of Clostridium beijerinckii. J. Bacteriol. 175:5097- 5105.
- Jinek, M., Chylinski, K., Fonfara, I., Hauer, M., Doudna, J. A., & Charpentier, E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science, 337(6096), 816-821.
- Jones D.T., Woods D.R. (1986) Acetone-butanol fermentation revisited. Microbiological Reviews 50:484-524.
- Kolek J., Sedlar K., Provaznik I., Patakova P. (2016). Dam and Dcm méthylations prevent gene transfer into Clostridium pasteurianum NRRL B-598: development of methods for electrotransformation, conjugation, and sonoporation. Biotechnol Biofuels. 9: 14.
- Li, Q., Chen, J., Minton, N. P., Zhang, Y., Wen, Z., Liu, J., ... & Gu, Y. (2016). CRISPR-based genome editing and expression control Systems in Clostridium acetobutylicum and Clostridium beijerinckii. Biotechnology journal, 11(7), 961-972.
- Makarova, K. S., Haft, D. H., Barrangou, R., Brouns, S. J., Charpentier, E., Horvath, P., ... & Van Der Oost, J. (201 1). Evolution and classification of the CRISPR-Cas Systems. Nature Reviews Microbiology, 9(6), 467.
- Makarova, K. S., Wolf, Y. I., Alkhnbashi, O. S., Costa, F., Shah, S. A., Saunders, S. J., ... & Horvath, P. (2015). An updated evolutionary classification of CRISPR-Cas Systems. Nature Reviews Microbiology, 13(11), 722.
- Manno, N. D., Zhang, J. Y., Borges, A. L., Sousa, A. A., Leon, L. M., Rauch, B. J., ... & Bondy-Denomy, J. (2018). Discovery of widespread type I and type V CRISPR-Cas inhibitors. Science, 362(641 1), 240- 242.
- Maté de Gérando, H., Wasels, F., Bisson, A., Clément, B., Bidard, F., Jourdier E., Lopez-Contreras A., Lopes Ferreira N. (2018). Genome and transcriptome of the natural isopropanol producer Clostridium beijerinckii DSM 6423. BMC genomics. 19:242.
- Mearls, E. B., Oison, D. G., Herring, C. D., & Lynd, L. R. (2015). Development of a regulatable plasmid- based gene expression System for Clostridium thermocellum. Applied microbiology and biotechnology, 99(18), 7589-7599.
- Mermelstein, L. D., & Papoutsakis, E. T. (1993). In vivo méthylation in Escherichia coli by the Bacillus subtilis phage phi 3T I methyltransferase to protect plasmids from restriction upon transformation of Clostridium acetobutylicum ATCC 824. Applied and environmental microbiology, 59(4), 1077- 1081.
- Mermelstein L.D., Welker N.E., Bennett G.N., Papoutsakis E.T. (1992). Expression of cloned homologous fermentative genes in Clostridium acetobutylicum ATCC 824 10: 190-195.
- Mermelstein L.D., Welker N.E., Bennett G.N., Papoutsakis E.T. (1993). Expression of cloned homologous fermentative genes in Clostridium acetobutylicum ATCC 824 10: 190-195.
- Moon HG, Jang YS, Cho C, Lee J, Binkley R, Lee SY. One hundred years of clostridial butanol fermentation. FEMS Microbiol Lett. 2016 Feb;363(3).
- Nagaraju, S., Davies, N. K., Walker, D. J. F., Kopke, M., & Simpson, S. D. (2016). Genome editing of Clostridium autoethanogenum using CRISPR/Cas9. Biotechnology for biofüels, 9(1), 219.
- Nariya, H., Miyata, S., Kuwahara, T., & Okabe, A. (201 1). Development and characterization of a xylose- inducible gene expression System for Clostridium perfringens. Applied and environmental microbiology, 77(23), 8439-8441.
- Newcomb, M., Millen, J., Chen, C. Y., & Wu, J. D. (201 1). Co-transcription of the celC gene cluster in Clostridium thermocellum. Applied microbiology and biotechnology, 90(2), 625-634.
- Pawluk, A., Davidson, A. R., & Maxwell, K. L. (2018). Anti-CRISPR: Discovery, mechanism and function . Nature Reviews Microbiology , 16(1), 12
- Poehlein A., Solano J.D.M., Flitsch S. K., Krabben P., Winzer K., Reid S.J., Jones D.T., Green E., Minton N.P., Daniel R., Dürre P. (2017). Microbial solvent formation revisited by comparative genome analysis. Biotechnol Biofuels. 10:58.
- Pyne, M. E., Bruder, M. R., Moo-Young, M., Chung, D. A., & Chou, C. P. (2016). Hamessing heterologous and endogenous CRISPR-Cas machineries for efficient markerless genome editing in Clostridium. Scientific reports, 6.
- Rauch, B. J., Silvis, M. R., Hultquist, J. F., Waters, C. S., McGregor, M. J., Krogan, N. J., & Bondy- Denomy, J. (2017). Inhibition of CRISPR-Cas9 with bactériophage proteins. Cell, 168(1-2), 150- 158.
- Rajewska M., Wegrzyn K, Konieczny I., FEMS Microbiol Rev. 2012 Mar; 36(2). AT-rich région and repeated sequences - the essential éléments of réplication origins ofbacterial replicons :408-34.
- Ransom, E. M., Ellermeier, C. D., & Weiss, D. S. (2015). Use of mCherry red fluorescent protein for studies of protein localization and gene expression in Clostridium difficile. Applied and environmental microbiology, 81(5), 1652-1660.
- Rogers P., Chen J.-S., Zidwick M. (2006) in The prokaryotes. 3rd édition, Vol. 1, edited by Dworkin M (Springer, New York, USA, 2006). 3rd édition, Vol. 1, pp. 672-755.
- Schwarz S, Kehrenberg C, Doublet B, Cloeckaert A. Molecular basis of bacterial résistance to chloramphénicol and florfenicol. FEMS Microbiol Rev. 2004 Nov;28(5):519-42.
- Stella S, Alcôn P, Montoya G. Class 2 CRISPR-Cas RNA-guided endonucleases: Swiss Army knives of genome editing. Nat Struct Mol Biol. 2017 Nov;24(l l):882-892. doi: 10.1038/nsmb.3486.
- Wang, S., Dong, S., Wang, P., Tao, Y., & Wang, Y. (2017). Genome Editing in Clostridium saccharoperbutylacetonicum N 1-4 with the CRISPR-Cas9 System. Applied and Environmental Microbiology, 83(10), e00233-17.
- Wang Y, Li X, Milne CB, et al. Development of a gene knockout System using mobile group II introns (Targetron) and genetic disruption of acid production pathways in Clostridium beijerinckii. Appl Environ Microbiol. 2013; 79(19): 5853-63.
- Wang, Y. et al. Markerless chromosomal gene délétion in Clostridium beijerinckii using CRISPR/Cas9 System. J. Biotechnol.2015. 200: 1-5.
- Wang, Y., Zhang, Z. T., Seo, S. O., Lynn, P., Lu, T., fin, Y. S., & Blaschek, H. P. (2016). Bacterial genome editing with CRISPR-Cas9: délétion, Intégration, single nucléotide modification, and désirable “clean” mutant sélection in Clostridium beijerinckii as an example. A CS synthetic biology, 5(7), 721-732.
- Wasels, F., Jean-Marie, J., Collas, F., Lôpez-Contreras, A. M., & Ferreira, N. L. (2017). A two-plasmid inducible CRISPR/Cas9 genome editing tool for Clostridium acetobutylicum. Journal of microbiological methods. 140:5-1 1.
- Xu, T., Li, Y., Shi, Z., Hemme, C. L., Li, Y., Zhu, Y., ... & Zhou, J. (2015). Efficient genome editing in Clostridium cellulolyticum via CRISPR-Cas9 nickase. Applied and environmental microbiology, 81(13), 4423-4431.
- Y adav, R., Kumar, V., Baweja, M., & Shukla, P. (2018). Gene editing and genetic engineering approaches for advanced probiotics : A Review. Critical reviews in food science and nutrition, 58(10), 1735-1746.
- Yue Chen, Bruce A. McClane, Derek J. Fisher, Julian I. Rood, Phalguni Gupta; Construction of an Alpha Toxin Gene Knockout Mutant of Clostridium perfringens Type A by Use of a Mobile Group II Intron; Appl. Environ. Microbiol. Nov 2005, 71 (11) 7542-7547; DOI: 10.1128/AEM.71.11.7542-7547.2005.
- Zhang, J., Liu, Y. J., Cui, G. Z., & Cui, Q. (2015). A novel arabinose-inducible genetic operation System developed for Clostridium cellulolyticum. Biotechnology for biofüels, 8(1), 36.
- Zhang C., Tinggang L. Jianzhong H. (2018) Characterization and genome analysis of a butanol- isopropanol-producing Clostridium beijerinckii strain BGS1. Biotechnol Biofuels (2018) 11:280.
- Zhong, J., Karberg, M., & Lambowitz, A. M. (2003). Targeted and random bacterial gene disruption using a group II intron (targetron) vector containing a retrotransposition-activated selectable marker. Nucleic acids research, 31(6), 1656-1664.