WO2020165178A1 - Method for biosynthesising eriodictyol and/or luteolin in a yeast - Google Patents

Method for biosynthesising eriodictyol and/or luteolin in a yeast Download PDF

Info

Publication number
WO2020165178A1
WO2020165178A1 PCT/EP2020/053485 EP2020053485W WO2020165178A1 WO 2020165178 A1 WO2020165178 A1 WO 2020165178A1 EP 2020053485 W EP2020053485 W EP 2020053485W WO 2020165178 A1 WO2020165178 A1 WO 2020165178A1
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
seq
exhibiting
polypeptides
activity
Prior art date
Application number
PCT/EP2020/053485
Other languages
French (fr)
Inventor
Cyrille PAUTHENIER
André Le Jeune
Hélène SCORNEC
Célia ROUSSEL
Laetitia JOUBERT
Original Assignee
Abolis Biotechnologies
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abolis Biotechnologies filed Critical Abolis Biotechnologies
Publication of WO2020165178A1 publication Critical patent/WO2020165178A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/18Baker's yeast; Brewer's yeast
    • C12N1/185Saccharomyces isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/13Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
    • C12Y114/13021Flavonoid 3'-monooxygenase (1.14.13.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae

Definitions

  • the present invention relates to a method for producing erodictyol and / or luteolin.
  • Eriodictyol and / or luteolin are, respectively, a flavanone and a flavone dihydroxylated at the 3 'and 4' position. These compounds are of interest as such but also as biosynthetic intermediates for the production of other molecules of interest.
  • the inventors have developed a biosynthesis of erodictyol and / or luteolin in a yeast.
  • a recombinant yeast comprising a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of adding a hydroxyl in the 3 'position of naringenin and / or apigenin.
  • F3'H flavonoid 3'-monooxygenase
  • the flavonoid 3'-monooxygenase is an enzyme from Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Arabidopsis thaliana, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis or Pilosella officinarum.
  • the flavonoid 3'-monooxygenase can be an enzyme comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 and 87 , optionally chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 and 21, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably selected from the enzymes of SEQ ID NOs: 1, 5, 7, 11, 17, 19 and 87, optionally selected from the enzymes of SEQ ID NOs: 1, 5, 7, 11, 17 and 19, and the polypeptides having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting the activity flavonoid 3'-monooxygenase.
  • the flavonoid 3'-monooxygenase is an enzyme comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
  • the flavonoid 3'-monooxygenase is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, preferably SEQ ID NOs: 7, 17 and 87 , and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
  • F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95%, of sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity.
  • F3′H is an enzyme comprising a sequence selected from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 85% sequence identity, preferably at least 90% sequence identity, with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity.
  • the F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 17 and the polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90 % or at least 95% sequence identity, preferably at least 90% sequence identity, with the sequence SEQ ID NO: 17, and exhibiting the flavonoid 3'-monooxygenase activity.
  • the F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 87 and the polypeptides comprising a sequence having at least 70%, at least 75%, at least 80%, at least 85 %, at least 90% or at least 95% sequence identity, preferably at least 90% sequence identity, with the sequence SEQ ID NO: 87, and exhibiting the flavonoid 3'-monooxygenase activity.
  • the F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 11 and the polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90 % or at least 95% sequence identity, preferably at least 90% sequence identity, with the sequence SEQ ID NO: 11, and exhibiting the flavonoid 3'-monooxygenase activity.
  • the recombinant yeast further comprises a heterologous or endogenous nucleic acid encoding a cytochrome P450 reductase (CPR), preferably from Saccharomyces cerevisiae, from Catharanthus roseus or from Arabidopsis thaliana.
  • CPR cytochrome P450 reductase
  • Cytochrome P450 reductase can be selected from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity.
  • the CPR can be chosen from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting cytochrome P450 reductase activity.
  • the CPR is chosen from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity.
  • the recombinant yeast further comprises a heterologous or endogenous nucleic acid encoding an S-adenosylmethionine synthetase (SAMT).
  • SAMT S-adenosylmethionine synthetase
  • the recombinant yeast further comprises a heterologous nucleic acid sequence encoding a flavone synthase (FNS), in particular a flavone synthase capable of producing luteolin from erodictyol, preferably from Arabidopsis thaliana, Petroseiinum crispum, Zea mays, Lonicera japonica, Lonicera macranthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus varecellymus, Dussisuturea barhusutcensus, Dushusutaria barhusus barhus, Schusutocensus, Schusutisus, Schusutocensus varhus scolymus, Schusuto
  • Flavone synthase can be selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115 , 117, 119, 121, 123, 125, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, of preferably selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35 and 37, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity.
  • the flavone synthase is an enzyme comprising a sequence selected from SEQ ID NO: 37 or a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting flavone synthase activity.
  • the recombinant yeast can further comprise:
  • CHS chalcone synthase
  • CHI chalcone isomerase
  • it further comprises:
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • a TAL comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity
  • TAL comprising a selected sequence from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity
  • a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) from Arabidopsis thaliana, Citrus clementina, Petroselinum crispum or Streptomyces davuligerus, in particular from Arabidopsis thaliana, Petroselinum crispum or Streptomyces davuligerus; a 4CL comprising a sequence chosen from SEQ ID NOs: 43, 45, 47, 89, 91 and 49, in particular chosen from SEQ ID NOs: 43, 45, 47 and 49, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; in particular a 4CL comprising a sequence selected from SEQ ID NOs: 45 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting activity 4-
  • a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces davuligerus in particular a CHS comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone synthase activity; and a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs:
  • the recombinant yeast further comprises: a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity;
  • TAL tyrosine ammonia lyase
  • a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NOs: 89, 91 and 45, preferably SEQ ID NO: 45, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with these sequences and exhibiting 4-coumarate-CoA ligase activity; and
  • heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone synthase activity; and a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) comprising a sequence selected from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting chalcone isomerase activity.
  • CHS chalcone synthase
  • CHI chalcone isomerase
  • it may further comprise a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine to L-Dopa and also p coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID NOs: 73 and 75, of preferably SEQ ID NO: 75, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydroxylase activity; or a heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 71 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% identity of a sequence with one of these sequences and exhibiting p-coumarate 3 hydroxy
  • the yeast is a yeast of the genus Saccharomyces, in particular Saccharomyces cerevisiae.
  • the present invention relates to the use of a yeast as defined in the present application for producing erodictyol and / or luteolin.
  • It also relates to a method for producing erodictyol and / or luteolin comprising the culture of a yeast as defined in the present application and optionally the harvesting of erodictyol and / or luteolin.
  • the inventors therefore explored several biosynthetic pathways and succeeded in developing the biosynthesis of erodictyol and / or luteolin in a yeast from naringenin and apigenin respectively. Indeed, the yeast has been modified to introduce an enzyme capable of adding a hydroxyl group at the 3 'position of these compounds.
  • yeast By “recombinant yeast” is meant a yeast which is not found in nature and which contains a genome modified following an insertion, modification or deletion of one or more genetic elements.
  • nucleic acid which has been modified and does not exist in natural yeast.
  • this term can denote a coding sequence or gene which is operably linked to a promoter which is not the natural promoter. It can also refer to a coding sequence in which introns have been deleted for genes comprising exons and introns.
  • heterologous is understood that the gene has been introduced by genetic engineering into the cell. It can be present there in episomal or chromosomal form. The origin of the gene may be different from the cell into which it is introduced. However, the gene can also come from the same species as the cell into which it is introduced but it is considered heterologous due to its environment which is not natural. For example, the gene or nucleic acid sequence is heterologous because he / she is under the control of a promoter other than his / her natural promoter, he / she is introduced in a different place from this one where he / she is naturally located. The host cell may contain a copy of the endogenous gene prior to the introduction of the heterologous gene or it may not contain an endogenous copy.
  • nucleic acid sequence can be heterologous in the sense that the coding sequence has been optimized for expression in the yeast host.
  • a heterologous nucleic sequence encodes a protein which is heterologous to the host cell, that is to say which is not naturally present in yeast.
  • yeast host refers to a genetic element or protein naturally present in said yeast.
  • gene denotes any nucleic acid encoding a protein.
  • the term gene encompasses DNA, such as cDNA or gDNA, as well as G RNA.
  • the gene can first be prepared by recombinant, enzymatic and / or chemical techniques, and then replicated in a host cell or an in vitro system.
  • the gene typically comprises an open reading frame encoding a desired protein.
  • the gene may contain additional sequences such as a transcription terminator or a signal peptide. Due to the degeneration of the genetic code, several nucleic acids can encode a particular polypeptide.
  • codons in the coding sequence for a given polypeptide can be modified such that optimal expression in a particular yeast is achieved, for example by using codon translation tables appropriate for that yeast.
  • Nucleic acids can also be optimized to a GC content preferable for the particular yeast and / or to reduce the number of repeat sequences.
  • the heterologous nucleic acids have been optimized by codon for expression in the yeast of interest. Optimization of codons can be accomplished by routine methods known in the art (see, eg, Welch, M., et al. (2011), Methods in Enzymology 498: 43-66).
  • the term "operably linked” denotes a configuration in which a control sequence is placed at an appropriate position relative to a sequence. coding, such that the control sequence directs expression of the coding sequence.
  • control sequences denotes the nucleic acid sequences necessary for the expression of a gene.
  • the control sequences can be native or heterologous. Control sequences well known and currently used by those skilled in the art will be preferred. Such control sequences include, but are not limited to, a leader, a polyadenylation sequence, a propeptide sequence, a promoter, a signal peptide sequence and a transcription terminator. Preferably, the control sequences comprise a promoter and a transcription terminator.
  • expression cassette denotes a nucleic acid construct comprising a coding region, i.e. a gene, and a regulatory region, i.e. comprising one or more control sequences. , linked in an operational manner.
  • control sequences are suitable for the yeast host.
  • the term "expression vector” refers to a DNA or RNA molecule which comprises an expression cassette.
  • the expression vector is a linear or circular double stranded DNA molecule.
  • the vector may further include an origin of replication, a selection marker, etc.
  • percentage identity between two nucleic acid or amino acid sequences within the meaning of the present invention, is meant a percentage of nucleotides or of identical amino acid residues between the two sequences to be compared, obtained after the best alignment, this percentage being purely statistical and the differences between the two sequences being distributed at random and over their entire length.
  • the best alignment or optimal alignment is the alignment for which the percentage identity between the two sequences to be compared, as calculated below, is the highest.
  • Sequence comparisons between two nucleic acid or amino acid sequences are traditionally carried out by comparing these sequences after having optimally aligned them, said comparison being carried out by segment or by comparison window to identify and compare the local regions of sequence similarity.
  • Alignment for the purpose of determining percent amino acid sequence identity can be accomplished in various ways which are well known in the art, for example using computer software available on the web on the Internet such as http: //blast.ncbi.nlm. Nih.gov/ or http://www.ebi.ac.uk/Tools/emboss/). Man from The business can determine the appropriate parameters to measure alignment, including any algorithm necessary to achieve maximum alignment over the full length of the sequences being compared.
  • percent amino acid sequence identity values refer to values generated using the EMBOSS Needle pair sequence alignment program which creates an optimal overall alignment of two sequences.
  • all of the identity percentages mentioned in this application can be set at at least 60%, at least 70%, at least 80%, at least 85%, preferably at least 90% identity , more preferably at least 95% identity.
  • all the percentages of sequence identity of the enzymes are at least 80% or at least 85%, preferably at least 90% or at least 95%, are considered as described. sequence identity.
  • the polypeptides may have 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 additions, substitutions or deletions relative to the sequences described in SEQ ID Nos.
  • these additions, substitutions or deletions are introduced at the N-terminus, C-terminus or at both ends.
  • the polypeptides can optionally be in the form of a fusion protein.
  • overexpression and “increased expression” as used herein, are used interchangeably and mean that the expression of a gene or an enzyme is increased relative to unmodified yeast, for example. wild-type yeast or not comprising the genetic modifications described herein. By “wild” is meant an unmodified yeast existing in nature.
  • the increased expression of an enzyme is usually achieved by increasing the expression of the gene encoding said enzyme.
  • the terms "overexpression” and "expression” can be used interchangeably.
  • a person skilled in the art can use any of the known techniques such as increasing the number of copies of the gene in yeast, using a promoter inducing a high level. expression of the gene, i.e. a strong promoter, using elements stabilizing the corresponding messenger RNA or the sequestration sequences of the ribosome binding site (RBS) and the sequences surrounding them.
  • overexpression can be obtained by increasing the number of copies of the gene in yeast.
  • One or more copies of the gene can be introduced into the genome by recombination methods known to those skilled in the art, including gene replacement or multicopy insertion (see for example international patent application WO 2015/092013 ).
  • an expression cassette comprising the gene, preferably placed under the control of a strong promoter, is integrated into the genome.
  • the gene can be carried by an expression vector, preferably a plasmid, comprising an expression cassette with the gene of interest placed preferably under the control of a strong promoter.
  • the expression vector can be present in the yeast in one or more copies, depending on the nature of the origin of replication.
  • Overexpression of the gene can also be achieved by using a promoter inducing a high level of expression of the gene.
  • the promoter of an endogenous gene can be replaced by a stronger promoter, that is to say a promoter inducing a higher level of expression.
  • heterologous nucleic acid The endogenous gene under the control of a promoter which is not the natural promoter is called heterologous nucleic acid.
  • Promoters suitable for use in the present invention are known to those skilled in the art and can be constitutive or inducible, and be endogenous or heterologous.
  • the yeast is a yeast of the order of Saccharomycetales, Sporidiobolales and Schizosaccharomycetales.
  • the yeast can for example be selected from Pichia, Kluyveromyces, Saccharomyces, Schizosaccharomyces, Candida, Lipomyces, Rhodotorula, Rhodosporidium, Yarrowia, or Debaryomyces.
  • the yeast is chosen from Pichia pastoris, Kluyveromyces iactis, Kluyveromyces marxianus, Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kiuyveri, Saccharomyces norbensis, Saccharomyces oviformis, Schizosaccharomyces pombe, Candida albicans, Candida tropicalis, Rhodotorula glutinis, Rhodosporidium toruloides, Yarrowia lipolytica, Debaryomyces hansenii and Lipomyces starkeyi.
  • the yeast is a Saccharomyces yeast, preferably a Saccharomyces cerevisiae yeast.
  • the yeasts may have been modified to increase the production of tyrosine and / or phenylalanine, preferably tyrosine.
  • the pathway for the biosynthesis of tyrosine and / or phenylalanine, preferably tyrosine can be optimized, in particular by redirecting the carbon flow from other metabolic pathways towards that of tyrosine and / or phenylalanine , preferably tyrosine.
  • the yeast produces significant amounts of tyrosine and / or phenylalanine, in particular from a simple carbon source such as glucose.
  • the recombinant yeast according to the present invention has been modified to produce erodictyol and / or luteolin.
  • the yeast has been modified to introduce an enzyme capable of adding a hydroxyl group in the 3 'position of these compounds.
  • the inventors had to identify and select enzymes capable of accepting naringenin and / or apigenin as substrate and of adding a hydroxyl group in the 3 'position of these compounds.
  • the enzyme is selected so as to exhibit a preference for hydroxylation at the 3 'position of naringenin and / or apigenin.
  • the enzyme is specific for the 3 'position of naringenin and / or apigenin, in particular in order to avoid double hydroxylation at the 3' and 5 'positions, and preferably also to avoid hydroxylation at the 5 'position.
  • the recombinant yeast is capable of producing naringenin and / or apigenin, in particular it has been modified for this purpose.
  • the strain is capable of producing naringenin and / or apigenin from glucose.
  • naringenin and / or apigenin can be supplied to the yeast.
  • the yeast produces erodictyol.
  • Luteolin can then be prepared from erodictyol by chemical or biochemical conversion, in particular by oxidation.
  • the yeast produces erodictyol and luteolin, in particular from glucose and without supply of naringenin and / or apigenin.
  • the recombinant yeast comprises an enzyme which effects the addition of a hydroxyl group at the 3 'position of naringenin and / or apigenin.
  • the inventors had to identify and select enzymes capable of accepting naringenin and / or apigenin as substrate and of adding a hydroxyl group in the 3 'position of these compounds.
  • the enzyme is selected so as to exhibit a preference for hydroxylation at the 3 'position of naringenin and / or apigenin.
  • the enzyme is specific for the 3 'position of naringenin and / or apigenin, in particular in order to avoid double hydroxylation at the 3' and 5 'positions, and preferably also to avoid hydroxylation at the 5 'position.
  • the flavonoid 3'-monooxygenase (F3'H) is an enzyme which carries out the addition of a hydroxyl group at the 3 'position of naringenin and / or apigenin. This enzyme belongs to the class of EC 1.14.14.82. It is also called a flavonoid 3'-hydroxylase.
  • 3'-monooxygenase flavonoid activity is meant the transformation of a flavonoid into a 3 'hydroxylated flavonoid by an F3'H enzyme.
  • an enzymatic test can be performed which consists of the in vitro incubation of the flavonoid 3 'monooxygenase enzyme in the presence of NAD (P) H, O2, and d 'a flavonoid, under optimal conditions (pH, ions, etc.), and observation in UPLC-MS and in comparison with the expected standard of the appearance of a 3'-hydroxylated flavonoid.
  • the flavonoid is naringenin or apigenin and the 3'-hydroxylated flavonoid is their 3'-hydroxylated form, i.e. Eriodictyol or Luteolin.
  • the recombinant yeast can therefore comprise a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin.
  • F3'H flavonoid 3'-monooxygenase
  • F3'H is a plant enzyme, in particular plants of the genus Allium, Arabidopsis, Brassica, Callistephus, Columnea, Citrus, Dianthus, Gentiana, Gerbera, Glycine, Fragaria, Ipomoea, Malus, Matthiola, Osteospermum , Oryza, Phanerochaete, Perilla, Petroselinum, Pelargonium, Pilosella, Petunia, Sinningia, Sorghum, Torenia, Vitis or Zea, for example of Allium cepa, Arabidopsis thaliana, Brassica napus, Columnea hybrida, Callistephus chinensis, Citrus sinensis, Citrus clementina caryophyllus, Fragaria vesca, Fragaria x ananassa, Gerbera hybrida, Glycine max, Gentiana triflora, Ipomoea nil, Ipomoea purpur
  • F3'H is an enzyme from plants of the genus Allium, Brassica, Callistephus, Columnea, Citrus, Dianthus, Gentiana, Gerbera, Glycine, Fragaria, Ipomoea, Malus, Matthiola, Osteospermum, Oryza, Phanerochaete , Perilla, Petroselinum, Pelargonium, Pilosella, Petunia, Sinningia, Sorghum, Torenia, Vitis or Zea, for example of Allium cepa, Brassica napus, Columnea hybrida, Callistephus chinensis, Citrus sinensis, Citrus clementina, Dianthus caryophyllus, Fragaria vesca, Fragaria x ananas
  • the F3'FI is an enzyme from Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Arabidopsis thaliana and Pilosella officinarum.
  • F3'FI can be an enzyme from Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis and Pilosella officinarum.
  • the F3'FI is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 and 87, in particularly among SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 and 21, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d 'sequence identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably selected from enzymes comprising a sequence chosen from SEQ ID NOs: 1, 5, 7, 11, 17, 19 and 87, in particular from SEQ ID NOs: 1, 5, 7, 11, 17 and 19, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting flavonoid activity 3 '- monooxygenase, in particular with naringenin and / or apigenin as substrate and with hydroxylation in the 3' position.
  • F3'H is an enzyme comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
  • F3'H is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 60, 70, 75, 80, 85 , 90 or 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
  • the F3′H can be an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87 and polypeptides comprising a sequence having at least 60, 70, 75, 80, 85, 90 or 95%, identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
  • the F3'H may be from Perilla frutescens var. twitched.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB045593.1 and BAB59005.1, respectively, and more particularly in SEQ ID NOs: 2 and 1.
  • the F3'H may be from Phanerochaete chrysosporium.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB597870.1 and BAL05157.1, respectively, and more particularly in SEQ ID NOs: 4 and 3.
  • the F3'H can be from Petunia x hybrida.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AF155332.1 and AAD56282.1, respectively, and more particularly in SEQ ID NOs: 6 and 5.
  • the F3'H may be from Callistephus chinensis.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AF313488.1 and AAG49298.1, respectively, and more particularly in SEQ ID Nos: 8 and 7.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AF313489.1 and AAG49299.1, respectively, and more particularly in SEQ ID NOs: 10 and 9.
  • the F3'H can be from Gerbera hybrida.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers DQ218417.1 and ABA64468.1, respectively, and more particularly in SEQ ID NOs: 12 and 11.
  • the F3'H can be from Osteospermum hybrid cultivar.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers DQ250711.1 and ABB29899.1, respectively, and more particularly in SEQ ID NOs: 14 and 13.
  • the F3'H can be from Citrus clementina.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers
  • the F3'H can be from Citrus sinensis.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers
  • the F3'H may be from Pilosella officinarum.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers DQ319866.2 and ABC47161.1, respectively, and more particularly in SEQ ID NOs: 20 and 19.
  • the F3'H can be from Streptomyces avermitilis.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers SAV_4539 and WP_010985964.1, respectively, and more particularly in SEQ ID NOs: 22 and 21.
  • the F3'H can be Arabidopsis thaliana.
  • a nucleic acid sequence encoding this enzyme and the protein sequence are described in NCBI under the reference numbers NM_120881.2 and NP_196416.1, respectively and more particularly in SEQ IDs
  • F3′H is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
  • F3′H is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and the polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%. , at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
  • F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity.
  • F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 17 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90 % or at least 95% sequence identity with the sequence SEQ ID NO: 17, and exhibiting the flavonoid 3'-monooxygenase activity.
  • F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 87 and polypeptides comprising a sequence having at least 70%, at least 75%, at least 80%, at least 85 %, at least 90% or at least 95% sequence identity with the sequence SEQ ID NO: 87, and exhibiting the flavonoid 3'-monooxygenase activity.
  • F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 11 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90 % or at least 95% sequence identity with the sequence SEQ ID NO: 11, and exhibiting the flavonoid 3'-monooxygenase activity.
  • the flavonoid 3'-monooxygenase requires the presence of NADPFI to effect the addition of the hydroxyl group.
  • the yeast comprises a heterologous or endogenous nucleic acid encoding a cytochrome P450 reductase, a NADPH-cytochrome P450 reductase. This enzyme belongs to the class of EC 1.6.2.4.
  • the yeast comprises a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H), in particular capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin; and a heterologous or endogenous nucleic acid encoding a cytochrome P450 reductase.
  • F3'H flavonoid 3'-monooxygenase
  • Cytochrome P450 reductase originates from a eukaryote, in particular from a yeast, for example of the genus Saccharomycetales, or from a plant, for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Phoseolus, Physcomitrella, Pinus, Populus, Ruta, Saccharum, Solanum, Vigna, Vitis or Zea.
  • the cytochrome P450 reductase originates from a eukaryote, for example from yeast, in particular from Saccharomyces cerevisiae, or from a plant, for example from Catharanthus roseus or from Arabidopsis thaliana.
  • cytochrome P450 reductase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity.
  • cytochrome P450 reductase can be selected from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity.
  • cytochrome P450 reductase is selected from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95%, of preferably at least 80% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity.
  • the cytochrome P450 reductase can be from Catharanthus roseus. It is described in NCBI's Genbank database under number X69791.1 for the nucleic acid sequence and under the number CAA49446.1 for the protein sequence, and more particularly in SEQ ID Nos: 24 and 23, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number Q05001.
  • the cytochrome P450 reductase can be from Saccharomyces cerevisiae. It is described in the Genbank database from NCBI under the number NM_001179172.1 for the nucleic acid sequence and under the number NP_011908.1 for the protein sequence, and more particularly in SEQ ID Nos: 26 and 25, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number P16603.
  • Cytochrome P450 reductase can be chimeric. It is described in the article Aigrain et al (2009, EMBO reports, 10, 742-747). The nucleic acid sequence encoding this enzyme and the protein sequence are described in SEQ ID Nos: 28 and 27, respectively.
  • the cytochrome P450 reductase can be from Arabidopsis thaliana. It is described in the NCBI Genbank database under the number NM_118585.4 for the nucleic acid sequence and under the number NP_194183.1 for the protein sequence, and more particularly in SEQ ID Nos: 30 and 29, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number Q9SB48.
  • cytochrome P450 reductase may be from Arabidopsis thaliana and be described in the NCBI Genbank database under the number NM_179141.2 for the nucleic sequence and under the number NP_849472.2 for the protein sequence, and more particularly in SEQ ID Nos: 32 and 31, respectively.
  • the protein is described in UniProtKB / Swiss Prot under the reference number Q9SUM3.
  • cytochrome P450 comes from Arabidopsis thaliana, it can be called ATR.
  • a new copy of a coding sequence for CPR as defined above is introduced into the yeast.
  • the yeast is Saccharomyces cerevisiae and the CPR is from the same yeast, the promoter of the endogenous gene encoding CPR is replaced by a strong promoter.
  • the expression of CPR is increased compared to wild yeast; CPR is therefore overexpressed in modified yeast.
  • F3′H and the CPR come from the same origin, the same species.
  • FNS Flavone synthase
  • Luteolin can be produced from erodictyol.
  • the enzyme capable of converting erodictyol into luteolin is a flavone synthase (FNS).
  • the yeast can therefore comprise a heterologous nucleic acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing apigenin from naringenin and / or luteolin from erodictyol, preferably luteolin from erodictyol.
  • flavone synthase activity is meant the transformation of a flavanone into a flavone by an FNSI enzyme (independent CPR) or an FNSII (dependent CPR).
  • an enzymatic test can be performed which consists of in vitro incubation in the case of FNSI of a mixture composed of the enzyme flavone synthase (FNSI), a flavanone, 2-oxoglutarate, O, under optimal conditions (pH, temperature, ions ...) and in the case of FNSII of a mixture composed of the enzyme FNSII, a flavanone, NAD (P) H, of 02, under optimal conditions (pH, temperature, ions, etc.).
  • the flavanone is naringenin or erodictyol which will be converted into their flavone form, that is to say into apigenin or luteolin, respectively.
  • the yeast comprises a heterologous nucleic acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing apigenin from naringenin and / or luteolin from l Eriodictyol, preferably luteolin from erodictyol.
  • the flavone synthase is an enzyme derived from plants, for example of the genus Aethusa, Angelica, Antirrhinum, Apium, Arabidopsis, Callistephus, Camellia, Conium, Cuminum, Cynara, Dahlia, Dorcoceras, Erythranthe, Lonicera, Medicago, Oryza, Perilla , Petroseiinum, Plectranthus, Populus, Saussurea, Scutellaria or Zea, in particular of the genus Arabidopsis, Lonicera, Medicago, Oryza, Petroseiinum, Populus or Zea, in particular of Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza macranthoides, Medicago truncatula, Oryza macranthoides, Medicago truncatula, Petrose
  • the flavone synthase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109 , 111, 113, 115, 117, 119, 121, 123, 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a flavone synthase activity.
  • the flavone synthase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting flavone synthase activity.
  • the FNS is selected from enzymes comprising SEQ ID NO: 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting activity flavone synthase.
  • FNS flavone synthase
  • FNSI flavone synthase 1
  • FNSIII flavone synthase 2
  • the FNS is a type I flavone synthase. In another embodiment, the FNS is a type II flavone synthase. In a further embodiment, the yeast comprises a type I flavone synthase and a type II flavone synthase.
  • the yeast comprises a heterologous nucleic acid sequence encoding a type I flavone synthase (FNSI).
  • FNSI type I flavone synthase
  • FNSI can be a plant flavone synthase such as Petroselinum crispum, Oryza sativa, Populus deltoides, Medicago truncatula, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, or Conium maculatum, in particular from Petroselinum crispum, Oryza sativa, Populus deltoides, Medicago truncatula, preferably from Petroselinum crispum.
  • a plant flavone synthase such as Petroselinum crispum, Oryza sativa, Populus deltoides, Medicago truncatula, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, or Conium maculatum, in particular from Petroselinum crispum,
  • the FNSI can be an enzyme comprising a sequence chosen from SEQ ID NOs: 37, 93, 103, 107, 109, 111 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting flavone synthase activity.
  • the FNSI can be an enzyme comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence. and exhibiting flavone synthase activity.
  • the FNSI can be from Petroselinum crispum. It is described in the NCBI Genbank database under number AY817680.1 for the nucleic acid sequence and under number AAX21541.1 for the protein sequence. The protein is described in UniProtKB / Swiss Prot under the reference number Q7XZQ8. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 37 and 38, respectively. FNSI can also be Angelica archangelica. It is described in the NCBI Genbank database under number DQ683352.1 for the nucleic acid sequence and under number ABG78793.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 93 and 94, respectively.
  • FNSI can also be Apium graveolens. It is described in NCBI's Genbank database under number AY817676.1 for the nucleic acid sequence and under number AAX21537.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID NOs: 103 and 104, respectively.
  • the FNSI can also be from Cuminum cyminum. It is described in the NCBI Genbank database under number DQ683349.1 for the nucleic acid sequence and under number ABG78790.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 107 and 108, respectively.
  • the FNSI can also be from Aethusa cynapium. It is described in the NCBI Genbank database under number DQ683350.1 for the nucleic acid sequence and under number DQ683350.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 109 and 110, respectively.
  • the FNSI can also be from Conium moculotum. It is described in the NCBI Genbank database under number DQ683354.1 for the nucleic acid sequence and under number ABG78795.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 111 and 112, respectively.
  • the yeast comprises a heterologous nucleic acid sequence encoding a type II flavone synthase (FNSII).
  • FNSII type II flavone synthase
  • the FNSII can be a plant flavone synthase, for example of Arabidopsis thaliana, Zea mays, of the genus Lonicera such as for example Lonicera japonica and Lonicera mocronthoides, Callistephus chinensis, Medicago truncatula, Camellia sinensis, Cynara cordunculus var scolymus, Saussectranthus medusa, barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata or Erythranthe lewisii, in particular a flavone synthase of Arabidopsis thaliana, Zea mays or of the genus Lonicera such as, for example, Lonicera macranthoides and Lonichoides.
  • the genus Lonicera such as for example Lonicera
  • the flavone synthase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35, 95, 97, 99, 101, 105, 113, 115, 117, 119, 121 , 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 33 and 35 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity.
  • the FNS flavone synthase is an FNSII from Lonicera japonica.
  • the enzyme may be an enzyme described in the Genbank database of NCBI under the number KU127576.1 for the nucleic sequence and under the number AMQ91109.1 for the protein sequence, and more particularly in SEQ IDs Nos: 34 and 33, respectively.
  • the FNS flavone synthase is an FNSII from Lonicera macranthoides.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KU127580.1 and AMQ91113.1, respectively, and more particularly in SEQ ID Nos: 36 and 35, respectively.
  • the FNS flavone synthase is an FNSII from Cynara cordunculus var scolymus.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers JN825735.1 and AFG31000.1, respectively, and more particularly in SEQ ID Nos: 96 and 95, respectively.
  • the FNS flavone synthase is an FNSII from Perilla frutescens var crispa.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB045592.1 and BAB59004.1, respectively, and more particularly in SEQ ID Nos: 98 and 97, respectively.
  • the FNS flavone synthase is FNSII from Dahlia pinnata.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB769842.1 and BAM72335.1, respectively, and more particularly in SEQ ID Nos: 100 and 99, respectively.
  • the FNS flavone synthase is an FNSII from Callistephus chinensis.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AF188612.1 and AAF04115.1, respectively, and more particularly in SEQ ID Nos: 102 and 101, respectively.
  • the FNS flavone synthase is an FNSII from Medicago truncatula.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers DQ354373.1 and ABC86159.1, respectively, and more particularly in SEQ ID Nos: 106 and 105, respectively.
  • the FNS flavone synthase is an FNSII from Camellia sinensis.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers FJ169499.1 and ACH99109.1, respectively, and more particularly in SEQ ID Nos: 114 and 113, respectively.
  • the FNS flavone synthase is an FNSII from Saussurea medusa.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KF170286.1 and AGV40781.1, respectively, and more particularly in SEQ ID Nos: 116 and 115, respectively.
  • the FNS flavone synthase is FNSII from Plectranthus barbatus.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KF606861.1 and AHJ89438.1, respectively, and more particularly in SEQ ID Nos: 118 and 117, respectively.
  • the FNS flavone synthase is FNSII from Scutellaria baicalensis.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KT963454.1 and AMW91729.1, respectively, and more particularly in SEQ ID Nos: 120 and 119, respectively.
  • the FNS flavone synthase is FNSII from Dorcoceras hygrometricum.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KV013332.1 and KZV23934.1, respectively, and more particularly in SEQ ID Nos: 122 and 121, respectively.
  • the FNS flavone synthase is FNSII from Antirrhinum majus.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB028151.1 and BAA84071.1, respectively, and more particularly in SEQ ID Nos: 124 and 123, respectively.
  • the FNS flavone synthase is FNSII from Erythranthe lewisii.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KX710102.1 and AOR81894.1, respectively, and more particularly in SEQ ID Nos: 126 and 125, respectively.
  • the yeast comprises a heterologous nucleic acid sequence encoding a type II flavone synthase (FNSII) and a type I flavone synthase, for example a sequence chosen from SEQ ID NOs: 33, 35, 95, 97, 99, 101, 105, 113, 115, 117, 119, 121, 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity and an enzyme comprising a sequence chosen from SEQ ID NO: 37, 93, 103, 107, 109 and 111 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a sequence chosen from SEQ ID NOs: 33 and 35 and polypeptides comprising a sequence having at least 60, 70,
  • FNS type II, FNSII requires the presence of cytochrome P450 reductase (CPR). If the yeast does not include cytochrome P450 reductase, it will therefore be necessary to introduce a heterologous cytochrome P450 reductase. If the yeast already includes one, it is possible to consider either the overexpression of an endogenous cytochrome P450 reductase (for example by replacing the promoter with a strong promoter or by adding one or more copies of the coding sequence) or also introduce a heterologous cytochrome P450 reductase.
  • CPR cytochrome P450 reductase
  • the type II FNS and the CPR come from the same origin, the same species.
  • the recombinant yeast can further comprise a heterologous or endogenous nucleic acid encoding an S-adenosylmethionine synthetase (SAMT).
  • SAMT S-adenosylmethionine synthetase
  • the SAMT originate from yeast, in particular from Saccharomyces cerevisiae, very particularly when the microorganism is a yeast.
  • S-adenosylmethionine synthetase is an enzyme comprising a sequence chosen from SEQ ID NO: 81 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with this sequence and exhibiting S-adenosylmethionine synthetase activity.
  • the S-adenosylmethionine synthetase can be from Saccharomyces cerevisiae. It is described in the NCBI Genbank database under the number NM_001180810.3 for the nucleic acid sequence and under the number N P_010790.3 for the protein sequence. The protein is described in UniProtKB / Swiss Prot under the reference number P19358.
  • a new copy of a coding sequence for SAMT as defined above is introduced into the microorganism.
  • the microorganism is Saccharomyces cerevisiae
  • the promoter of the endogenous gene encoding SAMT is replaced by a strong promoter.
  • the expression of SAMT is increased compared to the wild microorganism; SAMT is therefore overexpressed in the modified microorganism.
  • the yeast preferably comprises the enzymes allowing the production of erodictyol and / or luteolin from naringenin and / or apigenin.
  • the recombinant yeast comprises: a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in the 3 'position; in particular capable of hydroxylating naringenin and / or apigenin in the 3 'position; preferably Perilla frutescens var.
  • F3'H flavonoid 3'-monooxygenase
  • an F3′H comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 and 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a flavonoid 3'-monooxygenase activity, preferably selected from among enzymes comprising a sequence chosen from SEQ ID NOs: 1, 5, 7, 11, 17 and 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with a of these sequences and exhibiting a flavonoid 3'-monooxygenase activity, in particular an F3'H comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85
  • a heterologous nucleic acid sequence encoding a cytochrome P450 reductase preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; preferably one CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) capable of producing a flavone from
  • the recombinant yeast comprises:
  • a heterologous nucleic acid sequence encoding a flavonoid 3′-monooxygenase (F3′H) capable of hydroxylating in the 3 ′ position naringenin and / or apigenin; preferably Arabidopsis thaliana, Perilla frutescens var.
  • F3′H flavonoid 3′-monooxygenase
  • an F3'H comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17 , 19, 21 and 87 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a flavonoid 3'-monooxygenase activity, preferably selected from enzymes comprising a sequence chosen from SEQ ID NOs: 7, 11, 17 and 87 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavonoid 3'-monooxygenase activity;
  • cytochrome P450 reductase preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; preferably a CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with a of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, in particular enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70,
  • a heterologous nucleic acid sequence encoding a flavone synthase (FNS) capable of producing a flavone from a flavanone, in particular capable of transforming naringenin into apigenin, and / or erodictyol into luteolin, preferably of transforming erodictyol to luteolin; preferably an SNSF of Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroseiinum crispum, Populus delto ⁇ des, Zea mays, Callistephus chinensis, Apium graveolens, Cuminum cyminum, Aethusa changelumis, Camellium arculatia , Cynara cardunculus var scolymus, Saussurea medusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcocer
  • the recombinant yeast comprises:
  • a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting flavonoid 3'-monooxygenase activity;
  • F3'H flavonoid 3'-monooxygenase
  • a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, and more particularly preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequenced with this sequence and exhibiting cytochrome P450 reductase activity; and
  • FNS flavone synthase
  • the recombinant yeast comprises:
  • a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123
  • the recombinant yeast comprises:
  • a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting flavone synthase activity.
  • FNS flavone synthase
  • Each enzyme can be chosen from the enzymes described above.
  • naringenin and apigenin are known in plants, in particular from glucose, tyrosine or phenylalanine.
  • Microorganisms notably E. coli and Saccharomyces cerevisiae, have been modified to produce naringenin and / or and apigenin (Hwang El, et al. 2003. Appl Environ Microbiol. 2003, 69 (5): 2699-2706 ; Jiang Hl, et al. 2005. Appl Environ Microbiol. 2005, 71 (6): 2962-9; Pandey et al, 2016, Biotechnol Adv., 34, 634-662).
  • naringenin and apigenin can be that described in Figure 1.
  • the yeast comprises the enzymes necessary for the synthesis of naringenin and / or apigenin from tyrosine.
  • the yeast comprises the enzymes necessary for the synthesis of naringenin and / or apigenin from phenylalanine.
  • the yeast comprises the enzymes necessary for the synthesis of naringenin and / or apigenin from tyrosine and phenylalanine.
  • TAL is a tyrosine ammonia lyase. This enzyme is able to produce p-coumaric acid from tyrosine. This enzyme belongs to the class of EC 4.3.1.23.
  • phenylalanine ammonia lyase activity is meant the transformation of phenylalanine into frans-cinnamic acid by an enzyme Phenylalanine ammonia lyase.
  • Phenylalanine ammonia lyase activity an enzymatic test can be carried out which consists of the in vitro incubation of a mixture composed of the enzyme phenylalanine ammonia lyase and phenylalanine under optimal conditions (pH, temperature, ions ...) After a certain incubation time, l The appearance of trans-cinnamic acid is observed in UPLC-MS in comparison with the expected standard.
  • a tyrosine ammonia lyase can also exhibit a phenylalanine ammonia lyase (PAL) activity as defined above and / or a dihydroxyphenylalanine ammonia-lyase (DAL) activity.
  • PAL phenylalanine ammonia lyase
  • DAL dihydroxyphenylalanine ammonia-lyase
  • the yeast can therefore comprise a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase.
  • this enzyme is an enzyme produced by a bacterium of the genus Rhodobacter or a bacterium of the genus Flavobacteriaceae.
  • this enzyme is produced by a bacterium Rhodobacter capsuiatus, or Rhodobacter sphaeroides.
  • this enzyme is produced by a Flavobacterium johnsoniae bacterium.
  • this enzyme is an enzyme produced by a yeast, in particular a yeast of the genus Rhodotoruia, for example Rhodotorula glutinis.
  • Other organisms also produce such an enzyme, for example Camellia sinensis, Fragaria x ananassa, Ralstonia metallidurans, or Zea mays.
  • tyrosine ammonia lyase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with one of these sequences and exhibiting tyrosine ammonia lyase activity.
  • the TAL is from Flavobacterium johnsoniae. It is described in the Genbank database from NCBI under the number KR095306.1 for the nucleic acid sequence and under the number AKE50827.1 for the protein sequence, and more particularly in SEQ ID Nos: 40 and 39.
  • the TAL is from Rhodotorula glutinis. It is described in the Genbank database of NCBI under the number KF765779.1 for the nucleic sequence and under the number AGZ04575.1 for the protein sequence, and more particularly in SEQ ID Nos: 42 and 41, respectively.
  • the tyrosine ammonia lyase is selected from the enzyme comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity.
  • 4CL is a 4-coumarate-CoA ligase. This enzyme is able to produce 4-coumaroyl-CoA from p-coumaric acid and Coenzyme A and to produce caffeoyl-CoA from caffeic acid and Coenzyme A. This enzyme belongs to the class of EC 6.2.1.12.
  • 4-coumarate CoA ligase activity is meant the conversion of p-coumaric acid to p-coumaroyl CoA or caffeic acid to caffeoyl CoA by a 4-coumarate CoA ligase enzyme.
  • an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme 4-coumarate CoA ligase, p-coumaric acid or caffeic acid, ATP and CoA under optimal conditions (pH, temperature, ions, etc.).
  • the yeast can therefore comprise a heterologous nucleic acid sequence encoding a 4-coumarate-CoA ligase.
  • this enzyme is an enzyme produced by a plant, for example Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus, Crocus, Larix, Festuca, Glycine, Jugions, Keteleeria, Lithospermum, Lolium, Lotus, Lycopersicon , Malus, Medicago, Mesembryanthemum, Nicotiana, Nothotsuga, Oryza, Phaseolus, Pelargonium, Petroselinum, Physcomitrella, Picea, Prunus, Pseudolarix, Pseudotsuga, Rosa, Rubus, Ryza, Saccharum, Suaeda, Pinus, Populus, Solanum, Thellicumiella, Tsugaiticum, , Vitis or Zea.
  • a plant for example Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus,
  • this enzyme is an enzyme produced by a microorganism, for example Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter or Yarrowia.
  • a microorganism for example Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter or Yarrowia.
  • this enzyme is an enzyme produced by a plant, preferably Arabidopsis thaliana, Citrus clementina or Petroselinum crispum, in in particular Arabidopsis thaliana or Petroselinum crispum, or by a bacterium, preferably of the genus Streptomyces, in particular Streptomyces clavuligerus.
  • the 4-coumarate-CoA ligase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 43, 45, 47, 49, 89 and 91 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity.
  • 4-coumarate-CoA ligase is an enzyme comprising a sequence selected from SEQ ID NOs: 43, 45, 47 and 49, preferably SEQ ID NOs: 45 and 49, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity.
  • the 4CL is Arabidopsis thaliana. It is described in the Genbank database from NCBI under the number AY099747.1 for the nucleic sequence and under the number AAM20598.1 for the protein sequence, and more particularly in SEQ ID Nos: 44 and 43, respectively.
  • the 4CL is from Petroselinum crispum. It is described in the NCBI Genbank database under number X13324.1 or X13325.1 for the nucleic acid sequence and under the number CAA31696.1 or CAA31697.1 for the protein sequence, respectively.
  • the proteins are described in UniProtKB / Swiss Prot under the reference number P14912 and P14913, respectively, and more particularly in SEQ ID Nos: 46 and 45, and 48 and 47, respectively.
  • 4CL is from Petroselinum crispum and is described in the Genbank database of NCBI under the number X13324.1 for the nucleic sequence and under the number CAA31696.1 for the protein sequence, and in UniProtKB / Swiss Prot under the number reference number P14912, and more particularly in SEQ ID Nos: 46 and 45, respectively.
  • the 4CL is from Streptomyces clavuligerus. It is described in the Genbank database of NCBI under the number CP016559.1 for the nucleic sequence and under the number ANW18832.1 for the protein sequence, and more particularly in SEQ ID Nos: 50 and 49, respectively.
  • the 4CL is from Citrus clementina. A nucleotide sequence as well as the protein sequence of this enzyme are described respectively in SEQ ID NOs: 92 and 91.
  • the 4CL is Arabidopsis thaüana and a nucleotide sequence as well as the protein sequence of this enzyme are described respectively in SEQ ID NOs: 90 and 89.
  • 4CL is an enzyme comprising a sequence selected from SEQ ID NOs: 45, 89 and 91, preferably SEQ ID NOs: 89 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity.
  • 4CL is an enzyme comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequenced and exhibiting 4-coumarate-CoA ligase activity
  • CHS is a chalcone synthase.
  • This enzyme is able to produce naringenin-chalcone from 4-coumaroyl-CoA and malonyl-CoA and to produce erodictyol-chalcone from caffeoyl-CoA and malonyl-CoA.
  • This enzyme belongs to the class of EC 2.3.1.74.
  • chalcone synthase activity is meant the transformation of p-coumaroyl-CoA and malonyl-CoA into naringenin chalcone or of caffeoyl-CoA and malonyl-CoA into eriodictyol chalcone by a chalcone synthase enzyme.
  • an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme Chalcone synthase, coumaroyl-CoA or caffeoyl-CoA and malonyl -CoA under optimal conditions (pH, temperature, ions ). After a certain incubation time, the appearance respectively of Naringenin chalcone or erodictyol chalcone is observed in HPLC-MS in comparison with the expected standard.
  • Yeast therefore comprises a heterologous nucleic acid sequence encoding a Chalcone synthase.
  • This enzyme can be an enzyme produced by a plant, in particular of the genus Arabidopsis, Avena, Cosmos, Citrus, Daucus, Fagopyrum, Freesia, Glycine, Glycyrrhiza, Humulus, Hypericum, Hordeum, Juglans, Medicago, Phoseolus, Physcomitrella, Plagiochasma, Petroselinum, Pueraria, Rubus, Secale, Scutellaria, Silene, Sinapis, Spinacia, Stellaria, Triticum, Tulipa, Verbena, Vitis, or Xanthisma, e.g.
  • Arabidopsis thalisma for example Avena sativa, Cosmos sulphureus, Citrus sinensis, Daucus carota, Fagopyrum esculentum, Freesia hybrid cultivar, Glycine max, Glycyrrhiza echinoto, Flumulus lupulus, Hypericum androsaemum, Hordeum vulgare, Juglans sp., Medicago sativa, Placiculus vulgarium paticulella paticulella paticulella paticulella paticulum Petroselinum crispum, Pueraria montana var.
  • this enzyme is an enzyme produced by a plant, for example of the genus Citrus, in particular Citrus sinensis, or of Hordeum vulgare, or by a bacterium, preferably of the genus Streptomyces, in particular Streptomyces clavuligerus.
  • the chalcone synthase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 53 and 55 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity.
  • the chalcone synthase is an enzyme comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone synthase activity.
  • the CHS is from Hordeum vulgare. It is described in the Genbank database of NCBI under the number Y09233.1 for the nucleic sequence and under the number CAA70435.1 for the protein sequence, and more particularly in SEQ ID Nos: 52 and 51, respectively.
  • the protein is described in UniProtKB / Swiss Prot under the reference number Q96562.
  • the CHS is from Citrus sinensis. It is described in NCBI's Genbank database under number AB009351.1 for the nucleic acid sequence and under the number BAA81664.1 for the protein sequence, and more particularly in SEQ ID Nos: 54 and 53, respectively.
  • the CHS is from Citrus sinensis. It is described in the NCBI Genbank database under the number XM_006489733.1 for the nucleic acid sequence and under the number XP_006489796.1 for the protein sequence, and more particularly in SEQ ID Nos: 56 and 55, respectively.
  • the CHS is from Streptomyces clavuligerus. It is described in the Genbank database of NCBI under the number CP016559.1 for the nucleic acid sequence and under the number ANW16917.1 for the protein sequence, and more particularly in SEQ ID Nos: 58 and 57, respectively.
  • yeast can be modified to increase the synthesis of malonyl-CoA in yeast.
  • CHI is a chalcone isomerase. It is able to produce naringenin from Naringenin chalcone and produce eriodictyol from eriodictyol chalcone. This enzyme belongs to the class of EC 5.5.1.6.
  • Chalcone isomerase activity is meant the transformation of naringenin chalcone or erodictyol chalcone into naringenin or eriodictyol by a chalcone isomerase enzyme.
  • an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme Chalcone isomerase, naringenin chalcone or erodictyol chalcone under optimal conditions. (pH, temperature, ions ). After a certain incubation time, the appearance of Naringenin or erodictyol respectively is observed in H PLC-MS compared to the expected standard.
  • Yeast therefore comprises a heterologous nucleic acid sequence encoding a chalcone isomerase.
  • This enzyme may come from a plant, in particular of the genus Arabidopsis, Ginkgo, Oncidium, Perilla, Citrus or Trigonella, for example Arabidopsis thaiiana, Ginkgo biloba, Oncidium Gower Ramsey, Perilla frutescens, Citrus Sinensis or Trigonella foenum-graecum.
  • this enzyme is an enzyme produced by a plant, for example Arabidopsis thaiiana or by a bacterium, preferably of the genus Streptomyces, in particular Streptomyces clavuligerus.
  • the chalcone isomerase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting chalcone isomerase activity.
  • the chalcone isomerase is selected from enzymes comprising a sequence selected from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone isomerase activity.
  • the CH I is from Streptomyces clavuligerus. It is described in the Genbank database of NCBI under the number CP016559.1 for the nucleic acid sequence and under the number ANW16918.1 for the protein sequence, and more particularly in SEQ ID Nos: 60 and 59, respectively.
  • the CHI is Arabidopsis thaliana. It is described in the Genbank database of NCBI under the number N M_115370.4 for the nucleic acid sequence and under the number NP_191072.1 for the protein sequence, and more particularly in SEQ ID Nos: 62 and 61, respectively.
  • FNS Flavone synthase
  • Apigenin can be prepared from naringenin using a flavone synthase (FNS).
  • FNS flavone synthase
  • the yeast can therefore comprise a heterologous nucleic acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing apigenin from naringenin and / or a heterologous acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing luteolin from erodictyol.
  • the SNSF can be chosen from those described above.
  • the yeast can also comprise the enzymes necessary for the synthesis of p-coumaric acid from phenylalanine.
  • the yeast may further comprise a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H).
  • PAL belongs to the class of EC 4.3.1.24. It is able to produce cinnamic acid from phenylalanine.
  • phenylalanine ammonia lyase activity is meant the transformation of phenylalanine into frans-cinnamic acid by an enzyme Phenylalanine ammonia lyase.
  • Phenylalanine ammonia lyase activity an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme phenylalanine ammonia lyase and phenylalanine under optimal conditions (pH, temperature , ions ). After a certain incubation time, the appearance of trans-cinnamic acid is observed in UPLC-MS in comparison with the expected standard.
  • the enzyme is from a plant, for example a plant of the genus Arabidopsis, Agastache, Ananas, Asparagus, Brassica, Bromheadia, Bambusa, Beta, Betula, Citrus, Cucumis, Came Ilia, Capsicum, Cassia, Catharanthus, Cicer , Citrullus, Coffea, Cucurbita, Cynodon, Daucus, Dendrobium, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Gly
  • phenylalanine ammonia lyase may further exhibit tyrosine ammonia lyase (TAL) activity and / or dihydroxyphenylalanine ammonia-lyase (DAL) activity as described below.
  • TAL tyrosine ammonia lyase
  • DAL dihydroxyphenylalanine ammonia-lyase
  • the PAL is from Citrus sinensis.
  • the phenylalanine ammonia lyase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity.
  • PAL is selected from enzymes comprising a sequence selected from SEQ ID NOs: 65 and 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity sequence with one of these sequences and exhibiting phenylalanine ammonia lyase activity.
  • PAL is selected from enzymes comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequences and exhibiting phenylalanine ammonia lyase activity.
  • the PAL of Citrus sinensis is described in the Genbank database of NCBI under the number XM_006481431.2 for the nucleic sequence and under the number XP_006481494.1 for the protein sequence, and more particularly in SEQs. ID Nos: 64 and 63, respectively.
  • the PAL of Citrus sinensis is described in the Genbank database of NCBI under the number XM_006488000.2 for the nucleic acid sequence and under the number XP_006488063.1 for the protein sequence, and more particularly in the SEQ ID Nos: 66 and 65, respectively.
  • the PAL of Arabidopsis thaiiana is described in the Genbank database of NCBI under the number NM_115186.4 for the nucleic sequence and under the number NP_190894.1 for the protein sequence, and more particularly in SEQ ID Nos: 78 and 77, respectively.
  • PTAL phenylalanine / tyrosine ammonia lyase
  • C4H belongs to the class of EC 1.14.13.11. It is able to produce p-coumaric acid from cinnamic acid.
  • trans-cinnamate 4-monooxygenase activity is meant the conversion of trans-cinnamic acid to p-coumaric acid by a trans-cinnamate 4-monooxygenase (CPR dependent) enzyme.
  • CPR dependent trans-cinnamate 4-monooxygenase
  • an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme trans-cinnamate 4-monooxygenase, cinnamic acid , NADPH, H + and O2 under optimal conditions (pH, temperature, ions, etc.).
  • the enzyme is from a plant, for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Physcomitreila, Phoseolus, Pinus, Populus, Ruta, Saccharum, Solanum, Vitis, Vigna or Zea.
  • the cinnamate 4-hydroxylase (C4H) is from Citrus sinensis or Arabidopsis thaliana.
  • the cinnamate 4-hydroxylase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity.
  • C4H is selected from enzymes comprising a sequence selected from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cinnamate 4-hydroxylase activity.
  • the C4H of Citrus sinensis is described in the Genbank database of NCBI under the number NM_001288840.1 for the nucleic sequence and under the number NP_001275769.1 for the protein sequence, and more particularly in SEQ. ID Nos: 68 and 67, respectively.
  • the C4H of Citrus sinensis is described in the Genbank database of NCBI under the number NM_001288895.1 for the nucleic sequence and under the number NP_001275824.1 for the protein sequence, and more particularly in the SEQ ID Nos: 70 and 69, respectively.
  • the C4H of Arabidopsis thaliana is described in the Genbank database of NCBI under the number NM_128601.3 for the nucleic sequence and under the number NP_180607.1 for the protein sequence, and more particularly in SEQ ID Nos: 80 and 79, respectively.
  • the biosynthesis of erodictyol can also comprise the synthesis of L-DOPA (3,4-dihydroxy-L-phenylalanine) from tyrosine followed by caffeic acid from L -DOPA (3,4-dihydroxy-L- phenylalanine).
  • L-DOPA 3,4-dihydroxy-L-phenylalanine
  • caffeic acid L -DOPA (3,4-dihydroxy-L- phenylalanine)
  • the following enzymes are required.
  • To convert tyrosine to L-DOPA (3,4-dihydroxy-L-phenylalanine) two subunits are needed, HpaB and HpaC.
  • HpaB is a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit.
  • this enzyme is an enzyme produced by a bacterium, preferably Escherichia coli.
  • HpaB 4-hydroxyphenylacetate 3-monooxygenase oxygenase
  • SEQ ID NO: 83 is an enzyme comprising a sequence chosen from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting 4-hydroxyphenylacetate 3-monooxygenase activity.
  • the HpaB is from Escherichia coli. It is described in the Genbank database of NCBI under the number CAQ34705.1 for the protein sequence, and more particularly in the sequence SEQ ID No: 83. A nucleic sequence encoding this enzyme is described in the sequence SEQ ID No: 84. The protein is described in UniProtKB / Swiss Prot under the reference number A0A140NG21. HpaC is a 4-hydroxyphenylacetate 3-monooxygenase reductase subunit. The yeast can therefore comprise a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC) subunit.
  • HpaC 4-hydroxyphenylacetate 3-monooxygenase reductase
  • p-coumarate 3 hydroxylase activity is meant the conversion of p-coumaric acid to caffeic acid and / or L-tyrosine to L-Dopa using an enzyme complex composed of HpaB (4-hydroxyphenylacetate 3-hydroxylase oxidase) and HpaC (4-hydroxyphenylacetate 3-hydroxylase reductase).
  • an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzymes HpaB, HpaC, p-coumaric acid or L- Tyrosine, FAD and NADH under optimal conditions (pH, temperature, ions ). After a certain incubation time, the appearance of caffeic acid or L-Dopa is observed by HPLC-MS in comparison with the expected standard.
  • this enzyme is an enzyme produced by a bacterium, preferably Escherichia coli.
  • HpaC 4-hydroxyphenylacetate 3-monooxygenase reductase
  • HpaC is an enzyme comprising a sequence chosen from SEQ ID NO: 89 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting 4-hydroxyphenylacetate 3-monooxygenase activity.
  • the HpaC is from Escherichia coli. It is described in the Genbank database of NCBI under the number CAQ34704.1 for the protein sequence, and more particularly in the sequence SEQ ID No: 89. A nucleic sequence encoding this enzyme is described in the sequence SEQ ID No: 90. The protein is described in UniProtKB / Swiss Prot under the reference number A0A140NG67. Together, HpaB and HpaC are able to produce L-DOPA (3,4-dihydroxy-L-phenylalanine) from tyrosine.
  • the yeast can therefore comprise a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) and a heterologous nucleic acid sequence encoding 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC).
  • HpaB 4-hydroxyphenylacetate 3-monooxygenase oxygenase
  • HpaC 4-hydroxyphenylacetate 3-monooxygenase reductase
  • this route also requires the presence of an enzyme capable of synthesizing caffeic acid from L-DOPA (3,4-dihydroxy-L-phenylalanine), a dihydroxyphenylalanine ammonia-lyase (DAL).
  • L-DOPA 3,4-dihydroxy-L-phenylalanine
  • DAL dihydroxyphenylalanine ammonia-lyase
  • dihydroxyphenylalanine ammonia lyase activity is meant the conversion of L-Dopa to frans-caffeic acid by a dihydroxyphenylalanine ammonia lyase enzyme.
  • an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme dihydroxyphenylalanine ammonia lyase and L-dopa (levodopa) under the conditions optimal (pH, temperature, ions, etc.). After a certain incubation time, the appearance of frans-caffeic acid is observed in UPLC-MS in comparison to the expected standard.
  • DAL dihydroxyphenylalanine ammonia-lyase
  • TAL tyrosine ammonia lyase
  • PAL phenylalanine ammonia lyase
  • the yeast can thus comprise a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit, a heterologous nucleic acid sequence encoding a 4- subunit. hydroxyphenylacetate 3-monooxygenase reductase (HpaC) and a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL).
  • HpaB 4-hydroxyphenylacetate 3-monooxygenase oxygenase
  • HpaC hydroxyphenylacetate 3-monooxygenase reductase
  • DAL dihydroxyphenylalanine ammonia-lyase
  • HpaB and HpaC As an alternative to the use of HpaB and HpaC or in combination with them, it is possible to use an enzyme for converting tyrosine into L-Dopa and an enzyme for converting p-coumaric acid into acid caffeic.
  • 4-methoxybenzoate O-demethylase also called 4-methoxybenzoate monooxygenase (O-demethylant) which has the L-tyrosine hydroxylase activity belonging to the class of EC 1.14.99.15 and a p coumarate -3-hydroxylase possessing p-coumarate 3 hydroxylase activity belonging to the class of EC 1.14.13.
  • L-tyrosine hydroxylase activity is meant the conversion of p-coumaric acid to caffeic acid and / or L-tyrosine to L-Dopa using a p-coumarate 3 hydroxylase (CPR dependent) enzyme.
  • CPR dependent p-coumarate 3 hydroxylase
  • an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme p-coumarate 3 hydroxylase, p-coumaric acid or of L-Tyrosine, the necessary co-factors under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caffeic acid or L-Dopa is observed by HPLC-MS in comparison with the expected standard.
  • p-coumarate 3 hydroxylase activity is meant the conversion of p-coumaric acid to caffeic acid and / or L-tyrosine to L-Dopa using a p-coumarate 3 hydroxylase (CPR dependent) enzyme.
  • CPR dependent p-coumarate 3 hydroxylase
  • an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme p-coumarate 3 hydroxylase, p-coumaric acid or L-Tyrosine, under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caffeic acid or L-Dopa is observed by HPLC-MS in comparison with the expected standard.
  • the recombinant yeast can therefore comprise a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase (CYP) capable of converting tyrosine into L-Dopa and also p coumaric acid into caffeic acid.
  • CYP 4-methoxybenzoate O-demethylase
  • 4-methoxybenzoate O-demethylase is an enzyme from bacteria, in particular from Rhodopseudomonas palustris, Pseudomonas putida, or Escherichia coli, from plants, in particular from Beta vuigaris, from mammals, in particular Oryctolagus cuniculus, or fungus, in particular Rhodotorula glutinis.
  • 4-methoxybenzoate O-demethylase is an enzyme from Rhodopseudomonas palustris, Saccharothrix espanaensis, or Beta vulgaris.
  • 4-methoxybenzoate O-demethylase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 73 and 75 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydrolase activity.
  • the 4-methoxybenzoate O-demethylase can also be from Beta vulgaris.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in SEQ ID Nos: 74 and 73, respectively.
  • the protein is described in UniProtKB / Swiss Prot under the reference number P0DKI2.
  • the 4-methoxybenzoate O-demethylase can be from Saccharothrix espanaensis.
  • the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers NC_005296.1 and WP_011157377.1, respectively, and more particularly in SEQ ID Nos: 76 and 75.
  • the protein is described in UniProtKB / Swiss Prot under the reference number Q6N8N2.
  • the yeast can comprise a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase and a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL).
  • DAL dihydroxyphenylalanine ammonia-lyase
  • the recombinant yeast can therefore comprise a heterologous nucleic acid sequence encoding a coumarate 3-hydroxylase (Coum3H) capable of converting p-coumaric acid into caffeic acid.
  • a heterologous nucleic acid sequence encoding a coumarate 3-hydroxylase (Coum3H) capable of converting p-coumaric acid into caffeic acid.
  • the coumarate 3-hydroxylase is an enzyme from bacteria, especially Saccharothrix.
  • the 4-methoxybenzoate O-demethylase is selected the enzyme comprising the sequence SEQ ID NOs: 71 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting coumarate 3-hydroxylase activity.
  • the yeast may comprise a heterologous nucleic acid sequence encoding a coumarate 3-hydroxylase and a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL).
  • DAL dihydroxyphenylalanine ammonia-lyase
  • yeast in addition to the enzymes necessary for the biosynthesis of erodictyol and / or luteolin from naringenin and / or apigenin as described above, yeast preferably comprises the enzymes allowing the production of naringenin and / or or apigenin from tyrosine and / or phenylalanine, preferably from tyrosine.
  • the yeast comprises a heterologous nucleic acid sequence encoding an F3'H enzyme, and optionally a heterologous nucleic acid sequence encoding an FNS enzyme and a heterologous nucleic acid sequence encoding for a CPR enzyme, and further comprises a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL), a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), a sequence of heterologous nucleic acid encoding a chalcone synthase (CHS) and a heterologous nucleic acid sequence encoding a chalcone isomerase (CH I).
  • the yeast also comprises a heterologous nucleic acid sequence encoding a PAL enzyme and a heterologous nucleic acid sequence encoding a C4H enzyme.
  • the yeast comprises
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • a TAL comprising a sequence chosen from SEQ ID NOs: 41 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity
  • TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity
  • a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 53, 51, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone synthase activity; and
  • a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus in particular a CHI comprising a sequence chosen from SEQ ID NOs: 61 and 59 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone isomerase activity; preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity .
  • CHI chalcone isomerase
  • the yeast comprises one of the combinations of F3′H, FNS and CPR enzymes described above, in particular: - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the '3'-monooxygenase flavonoid activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-
  • a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, and more particularly preferably, a sequence chosen from SEQ ID NO: 25 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting cytochrome P450 reductase activity; and
  • the yeast further comprises
  • a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
  • PAL phenylalanine ammonia lyase
  • C4H a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting cinnamate 4-hydroxylase activity.
  • C4H cinnamate 4-hydroxylase
  • the yeast comprises:
  • TAL tyrosine ammonia lyase
  • a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with these sequences and exhibiting a 4-coumarate-CoA ligase activity, very particularly preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and the polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting 4-coumarate-CoA ligase activity; and
  • heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone synthase activity; and a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) comprising a sequence selected from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting chalcone isomerase activity.
  • CHS chalcone synthase
  • CHI chalcone isomerase
  • the yeast comprises one of the combinations of F3′H, FNS and CPR enzymes described above, in particular:
  • a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the '3'-monooxygenase flavonoid activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides
  • a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, and more particularly preferably, a sequence chosen from SEQ ID NO: 25 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting cytochrome P450 reductase activity; and
  • the yeast further comprises
  • a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
  • PAL phenylalanine ammonia lyase
  • a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting cinnamate 4-hydroxylase activity.
  • the yeast comprises:
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • a heterologous nucleic acid sequence encoding a 4-coumarate-CoA ligase (4CL) capable of producing 4-coumaroyl-CoA from p-coumaric acid and Coenzyme A; preferably Arabidopsis thaliana, PetroseUnum crispum or Streptomyces clavuligerus; a 4CL comprising a sequence selected from SEQ ID NOs: 43, 45, 47 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a 4-coumarate-CoA ligase activity, and preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting 4-coumarate-CoA ligase activity;
  • 4CL comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising
  • a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) capable of producing naringenin-chalcone from 4-coumaroyl-CoA and malonyl-CoA; preferably from Citrus sinensis, from Hordeum vulgare or from Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 53 and 55 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, and preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides
  • a heterologous nucleic acid sequence encoding a chalcone isomerase capable of producing naringenin from naringenin chalcone; preferably Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CH I comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting chalcone isomerase activity, and preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity;
  • CH I chalcone isomerase
  • a heterologous nucleic acid sequence encoding a flavonoid 3′-monooxygenase (F3′H) capable of hydroxylating in the 3 ′ position naringenin and / or apigenin; preferably Perilla frutescens var.
  • F3′H flavonoid 3′-monooxygenase
  • an F3′H comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 and 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a 3'-monooxygenase flavonoid activity, preferably selected from enzymes comprising a sequence chosen from SEQ ID NOs: 1, 5, 7, 11, 17 and 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a 3'-monooxygenase flavonoid activity, in particular an F3'H comprising a sequence selected from SEQ ID NOs: 5, 7 and 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85,
  • cytochrome P450 reductase preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; preferably a CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with a of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, in particular a CPR comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60,
  • a heterologous nucleic acid sequence encoding a flavone synthase (FNS) capable of producing a flavone from a flavanone, in particular capable of converting naringenin to apigenin, and / or erodictyol to luteolin, preferably of converting erodictyol to luteolin; preferably an FNS of Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus delto ⁇ des, or Zea mays, preferably of Lonicera japonica, Lonicera macranthoides, and Petroselinum crispum; preferably an FNS comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences
  • the yeast comprises the heterologous nucleic acid sequences encoding the enzymes 4CL, CFIS, CH I, F3'H, CPR, and FNS, as described in the previous embodiment and comprises in outraged :
  • a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity
  • a PAL comprising a sequence chosen from SEQ ID NOs: 65 and 77 and the polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity
  • a PAL comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia
  • a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity, capable of producing p-coumaric acid from phenylalanine, in particular a C4H comprising a sequence selected from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cinnamate 4-hydroxylase activity.
  • C4H cinnamate 4-hydroxylase
  • the yeast comprises the heterologous nucleic acid sequences encoding the enzymes 4CL, CHS, CHI, F3'H, CPR, and FNS, as described in the previous embodiment and further comprises :
  • DAL dihydroxyphenylalanine ammonia-lyase
  • heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit preferably comprising a sequence selected from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
  • HpaC 4-hydroxyphenylacetate 3-monooxygenase reductase subunit
  • HpaC 4-hydroxyphenylacetate 3-monooxygenase reductase subunit
  • the yeast comprises the heterologous nucleic acid sequences encoding the enzymes 4CL, CHS, CHI, F3'H, CPR, and FNS, as described in the previous embodiment and further comprises :
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase in particular a PAL comprising a sequence selected from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences, in particular a PAL comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequences and exhibiting phenylalanine ammonia lyase activity, and exhibiting phenylalanine ammonia lyase activity, and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60,
  • C4H
  • a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit preferably comprising a sequence selected from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70 , 80, 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
  • a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase subunit reductase (HpaC) preferably comprising a sequence chosen from SEQ ID NO: 85 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the latter and exhibiting a 4-hydroxyphenylacetate 3-monooxygenase reductase activity
  • a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL) capable of producing caffeic acid from L-DOPA (3,4-dihydroxy-L-phenylalanine).
  • DAL dihydroxyphenylalanine ammonia-lyase
  • the yeast comprises:
  • PAL phenylalanine ammonia lyase
  • C4H cinnamate 4-hydroxylase
  • TAL tyrosine ammonia lyase
  • 4CL 4-coumaroyl-CoA ligase
  • chalcone synthase comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity in sequence with this sequence and exhibiting chalcone synthase activity;
  • CHS chalcone synthase
  • chalcone isomerase comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting chalcone isomerase activity;
  • F3'H flavonoid 3'-monooxygenase
  • F3'H a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity;
  • FNS flavone synthase
  • CPR cytochrome P450 reductase
  • the origin of the enzymes or of a set of enzymes may be chosen so that their origin is the same or is close.
  • the enzymes or the set of enzymes can be derived from bacteria, for example bacteria of the same genus or of the same species.
  • the enzymes or the set of enzymes may be derived from plants, for example plants of the same genus or of the same species. Indeed, these common origins allow the enzymes to work together optimally.
  • the yeasts comprise a metabolic pathway for the biosynthesis of tyrosine.
  • the yeasts may have been modified to have an increased production of tyrosine compared to a wild strain.
  • the yeasts may have been modified so that the carbon flow is redirected towards the biosynthesis of tyrosine.
  • the yeasts may have been modified to reduce or eliminate feedback inhibitions of tyrosine biosynthesis.
  • the yeasts comprise a metabolic pathway for the biosynthesis of phenylalanine.
  • the yeasts may have been modified to have an increased production of phenylalanine compared to a wild strain.
  • the yeasts may have been modified so that the carbon flow is redirected towards the biosynthesis of phenylalanine.
  • the yeasts may have been modified to reduce or eliminate feedback inhibitions of phenylalanine biosynthesis.
  • the yeasts comprise a metabolic pathway for the biosynthesis of phenylalanine and tyrosine.
  • the yeasts may have been modified to have an increased production of phenylalanine and tyrosine compared to a wild strain.
  • the yeasts may have been modified so that the carbon flow is redirected towards the biosynthesis of phenylalanine and tyrosine.
  • the yeasts may have been modified to reduce or eliminate feedback inhibitions of phenylalanine and tyrosine biosynthesis.
  • each nucleic acid sequence encoding an enzyme as described above is included in an expression cassette.
  • the coding nucleic sequences have been optimized for expression in the yeast host.
  • the coding nucleic sequence is operably linked to the elements necessary for the expression of the gene, in particular for transcription and translation. These elements are chosen so as to be functional in the recombinant yeast host. These elements can include, for example, transcription promoters, transcription activators, terminator sequences, initiation and termination codons. The methods for selecting these elements as a function of the host cell in which expression is desired are well known to those skilled in the art.
  • the promoter is a strong promoter.
  • the promoter can optionally be inducible.
  • the promoter can be selected from the following promoters: the pTDH3 promoter, the pTEF1 promoter, the pTEF2 promoter, the pCCW12 promoter, the pHHF2 promoter, the pHTB2 promoter and the pRPL18B promoter.
  • inducible promoters which can be used in yeast are the tetO-2, GAL10, GAL10-CYC1, PH05 promoters.
  • All or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described or a combination of some of these can be included in a common expression vector or in different expression vectors.
  • the present invention therefore relates to a vector comprising a nucleic acid sequence encoding an F3′H and at least one nucleic acid sequence chosen from: a nucleic acid sequence encoding a CPR, an acid sequence nucleic acid encoding an FNS, a nucleic acid sequence encoding a TAL, a nucleic acid sequence encoding a 4CL, a nucleic acid sequence encoding a CHS, a nucleic acid sequence encoding a CHI, a nucleic acid sequence encoding a PAL, a nucleic acid sequence encoding a C4H, a nucleic acid sequence encoding an HpaB, and a nucleic acid sequence encoding a DAL, each of these enzymes being as defined above.
  • the vector comprises a nucleic acid sequence encoding an F3'H and at least one nucleic acid sequence chosen from: a nucleic acid sequence encoding a CPR, a nucleic acid sequence encoding a FNS, a nucleic acid sequence encoding a TAL, a nucleic acid sequence encoding a 4CL, a nucleic acid sequence encoding a CFIS, a nucleic acid sequence encoding a CH I, and optionally a Nucleic acid sequence encoding a PAL and a nucleic acid sequence encoding a C4H.
  • the vector comprises
  • F3'H flavonoid 3'-monooxygenase
  • an F3'H comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17 , 19 and 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 3'-monooxygenase flavonoid activity, preferably selected from among enzymes comprising a sequence selected from SEQ ID NOs: 1, 5, 7, 11, 17 and 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and having a flavonoid 3'-monooxygenase activity, in particular an F3'H comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or
  • nucleic acid sequence chosen from:
  • a nucleic acid sequence encoding a cytochrome P450 reductase preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; of preferably a CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23 and 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequenced with one of these sequences and exhibiting cytochrome P450 reductase activity;
  • a nucleic acid sequence encoding a flavone synthase in particular capable of producing a flavone from a flavanone, in particular capable of transforming naringenin into apigenin, and / or erodictyol into luteolin, preferably convert erodictyol to luteolin; preferably an SNF of Arabidopsis thaüana, Petroselinum crispum, Zea mays, Lonicera japonica, Lonicera macranthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium cordaraculus, Camellia varymensis Saussurea medusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus,
  • a nucleic acid sequence encoding a chalcone synthase (CHS), in particular capable of producing naringenin-chalcone from 4-coumaroyl-CoA and malonyl-CoA and erodictyol-chalcone from caffeoyl- CoA and malonyl-CoA; preferably from Citrus sinensis, from Hordeum vulgare or from Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a chalcone synthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 53 and 55 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone syntha
  • a nucleic acid sequence encoding a chalcone isomerase in particular capable of producing naringenin from naringenin chalcone and erodictyol from erodictyol-chalcone; preferably Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity in sequence with one of these sequences and exhibiting chalcone isomerase activity;
  • CHI chalcone isomerase
  • a nucleic acid sequence encoding a phenylalanine ammonia lyase in particular capable of producing cinnamic acid from phenylalanine, preferably a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity;
  • a nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular capable of producing p-coumaric acid from cinnamic acid, preferably a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity;
  • HpaB 4-hydroxyphenylacetate 3-monooxygenase oxygenase
  • HpaC 4-hydroxyphenylacetate 3-monooxygenase reductase
  • DAL dihydroxyphenylalanine ammonia-lyase
  • the vector comprises
  • a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95 % identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides comprising
  • nucleic acid sequence chosen from:
  • a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121,
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • a TAL comprising a sequence chosen from SEQ ID NOs: 41 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity
  • TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity
  • a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 53, 51, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting chalcone synthase activity; and
  • a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus in particular a CHI comprising a sequence chosen from SEQ ID NOs: 61 and 59 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone isomerase activity; preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity .
  • CHI chalcone isomerase
  • the vector comprises each of these sequences.
  • the vector may further comprise
  • a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
  • PAL phenylalanine ammonia lyase
  • the vector comprises:
  • a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the '3'-monooxygenase flavonoid activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides
  • nucleic acid sequence chosen from:
  • TAL tyrosine ammonia lyase
  • a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with these sequences and exhibiting 4-coumarate-CoA ligase activity; and
  • heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone synthase activity; and a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) comprising a sequence selected from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting chalcone isomerase activity; a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochro
  • the heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprises a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting 4-coumarate-CoA ligase activity
  • the vector further comprises
  • a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence selected from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
  • PAL phenylalanine ammonia lyase
  • a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting cinnamate 4-hydroxylase activity.
  • C4H cinnamate 4-hydroxylase
  • the vector comprises
  • nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H), in particular capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin; and a nucleic acid sequence encoding a cytochrome P450 reductase; or
  • a nucleic acid sequence encoding a flavonoid 3'-monooxygenase F3'H
  • F3'H flavonoid 3'-monooxygenase
  • a nucleic acid sequence encoding a cytochrome P450 reductase a nucleic acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing luteolin from erodictyol.
  • a vector comprising the three nucleic acid sequences.
  • the coding nucleic sequences and the sequences of the enzymes are as described above.
  • By comprising a nucleic acid sequence is also understood to include an expression cassette comprising the nucleic acid sequence.
  • the vector can thus comprise several nucleic acid sequences chosen from among them, in particular 1, 2, 3, 4, 5, 6, 1, 8, 9 or 10 nucleic acid sequences chosen from among them.
  • the vector can in particular comprise combinations of particular coding sequences as described above.
  • the vectors include heterologous coding sequences as long as the coding sequences can be optimized for the yeast host, be under the control of a heterologous promoter and / or can combine coding sequences which are not from the same organism of origin and / or which are not present in the same arrangement.
  • the vector can be any DNA sequence into which it is possible to insert foreign nucleic acids, the vectors allowing the introduction of foreign DNA into the yeast host.
  • the vector can be for example a plasmid, a phagemid, a cosmid, an artificial chromosome, in particular a YAC, or a BAC.
  • Expression vectors can include nucleic acid sequences encoding selection markers.
  • the selection markers can be genes for resistance to one or more antibiotics or genes for auxotrophy.
  • the auxotrophy gene can for example be HIS5, URA3, LEU2 or TRP1.
  • the antibiotic resistance gene may for example preferably be a resistance gene to ampicillin, chloramphenicol, spectinomycin, streptomycin, kanamycin, hygromycin, geneticin, fluoroacetamide, fluorocitrate, phleomycin, amphotericin-B and / or nureseothricin.
  • the yeast host can be transiently or stably transformed / transfected and the nucleic acid, cassette or vector can be contained therein as an episome or as integrated into the genome of the yeast host.
  • the expression vector can also comprise one or more sequences allowing the targeted insertion of the vector, of the expression cassette or of the nucleic acid into the genome of the yeast host. All or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described above or a combination of some of these can be inserted into the / a chromosome of the recombinant yeast.
  • the yeast can comprise several copies of nucleic acid sequences encoding an enzyme as described above.
  • it can comprise 2 to 10 copies, for example 2, 3, 4, 5, 6, 7, 8, 9 or 10 copies of a nucleic acid sequence encoding an enzyme as described above.
  • the present invention relates to a method for preparing a yeast according to the present invention comprising the introduction of a vector as defined above into the yeast and the selection of the yeasts comprising said vector. It also relates to a method for preparing a yeast according to the present invention comprising the introduction of a nucleic acid sequence encoding a nucleic acid sequence encoding a flavonoid 3′-monooxygenase (F3′H) capable of adding a hydroxyl in the 3 'position of naringenin and / or apigenin in yeast and the selection of yeasts comprising said nucleic sequences.
  • the method can further comprise the introduction of one or more nucleic acid sequences chosen from:
  • a nucleic acid sequence encoding a cytochrome P450 reductase preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; preferably a CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with a of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity; a nucleic acid sequence encoding a flavone synthase (FNS), in particular capable of producing a flavone from a flavanone,
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • a TAL comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity
  • a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity
  • a nucleic acid sequence encoding a chalcone synthase (CHS), in particular capable of producing naringenin-chalcone from 4-coumaroyl-CoA and malonyl-CoA and / or erodictyol-chalcone from caffeoyl-CoA and malonyl-CoA; preferably from Citrus sinensis, from Hordeum vulgare or from Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting chalconesynthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 53 and 55 and polypeptides comprising a sequence having at least 60, 70 , 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting
  • a nucleic acid sequence encoding a chalcone isomerase in particular capable of producing naringenin from naringenin chalcone and / or erodictyol from erodictyol chalcone; preferably Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity in sequence with one of these sequences and exhibiting chalcone isomerase activity;
  • CHI chalcone isomerase
  • a nucleic acid sequence encoding a phenylalanine ammonia lyase in particular capable of producing cinnamic acid from phenylalanine, preferably a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity;
  • a nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular capable of producing p-coumaric acid from the acid cinnamic, preferably a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequenced and exhibiting cinnamate 4-hydroxylase activity;
  • nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit preferably comprising a sequence chosen from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
  • a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC) subunit preferably comprising a sequence chosen from SEQ ID NO: 85 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate activity 3-monooxygenase reductase; or a nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine into L
  • DAL dihydroxyphenylalanine ammonia-lyase
  • the method comprises the introduction of combinations of particular coding sequences as described above.
  • the method comprises the introduction: - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85 %, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected
  • nucleic acid sequence chosen from:
  • a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121,
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • TAL tyrosine ammonia lyase
  • a TAL comprising a sequence chosen from SEQ ID NOs: 41 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity
  • TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity
  • a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 53, 51, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting a chalcone synthase activity; and
  • a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus in particular a CHI comprising a sequence chosen from SEQ ID NOs: 61 and 59 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone isomerase activity; preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity .
  • CHI chalcone isomerase
  • the method comprises the introduction of all of these sequences.
  • the method further comprises introducing:
  • a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
  • PAL phenylalanine ammonia lyase
  • C4H a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cinnamate 4-hyd roxylase activity.
  • C4H cinnamate 4-hydroxylase
  • the present invention relates to the use of a yeast according to the present invention for the production of erodictyol and / or luteolin.
  • it relates to the use of a yeast according to the present invention for the production of erodictyol.
  • it relates to the use of a yeast according to the present invention for the production of luteolin.
  • it relates to the use of a yeast according to the present invention for the production of erodictyol and luteolin.
  • the present invention also relates to a method for producing erodictyol and / or luteolin comprising the cultivation of a yeast according to the present invention, in particular under conditions allowing or favorable to the production of erodictyol and / or luteolin and optionally the recovery and / or purification of the erodictyol and / or of the luteolin produced.
  • Eriodictyol and / or luteolin can be either the final product or a synthetic or biosynthetic intermediate for the preparation of other products.
  • the conditions for cultivating the yeast according to the invention can be adapted according to conventional techniques, well known to those skilled in the art.
  • the yeast is cultivated in an appropriate culture medium.
  • suitable culture medium generally designates a culture medium providing nutrients which are essential or beneficial for the maintenance and / or growth of said yeast, such as carbon sources; nitrogenous sources such as ammonium sulfate; sources of phosphorus, for example, potassium phosphate monobasic; trace elements, for example copper, iodide, iron, magnesium, zinc or molybdate salts; vitamins and other growth factors such as amino acids or other growth promoters.
  • Defoamer can be added as needed.
  • this suitable culture medium can be chemically defined or complex.
  • the culture medium can thus be of identical or similar composition to a synthetic medium, as defined by Verduyn et al., (Yeast. 1992.
  • the culture medium can comprise a simple carbon source, such as glucose, fructose, xylose, ethanol, glycerol, galactose, sucrose, cellulose, cellobiose, starch, glucose polymers , molasses, or by-products of these sugars.
  • a simple carbon source such as glucose, fructose, xylose, ethanol, glycerol, galactose, sucrose, cellulose, cellobiose, starch, glucose polymers , molasses, or by-products of these sugars.
  • the production of erodictyol and / or luteolin by the yeast according to the invention is obtained without supplying naringenin and / or apigenin in the culture medium, preferably without supplying naringenin or apigenin in the culture medium.
  • any mode of culture allowing the production on an industrial scale of molecules of interest can be envisaged.
  • the culture is carried out in bioreactors, in particular in batch, fed-batch, chemostat and / or continuous culture mode. Controlled vitamin supply during the process may also benefit productivity (Alfenore et al., Appl Microbiol Biotechnol. 2002. 60: 67-72).
  • the culture is generally carried out in bioreactors, with possible steps of solid and / or liquid precultures in Erlenmeyer flasks, with an appropriate culture medium.
  • the conditions for cultivating the yeasts according to the invention are easily adaptable by those skilled in the art, depending on the yeast.
  • the culture temperature is in particular for yeasts between 20 ° C and 40 ° C, preferably between 28 ° C and 35 ° C, and more particularly around 30 ° C for 5. cerevisiae.
  • the yeast according to the present invention can be cultured for 1 to 30 days, and preferably 1 to 10 days.
  • a yeast according to the present invention is preferably capable of producing erodictyol and / or luteolin in a minimum amount of 1 mg / l of culture medium, preferably 10, 20, 25, 30, 35, 40 , 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 mg / l of culture medium, optionally 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 or 1000 mg / l of culture medium.
  • Figure 1 Description of the metabolic pathways for the production of erodictyol and luteolin.
  • Figure 2 Production of erodictyol from naringenin by the strain FL_405 (F3'H4 + CPR2). Control strain: CF235. Observation of the disappearance of the naringenin peak and the appearance of an erodictyol peak in the FL-405 strain.
  • Figure 3 Production of luteolin from apigenin by the strain FL_405 (F3′H4 + CPR2). Control strain: CF235. Observation of the disappearance of the apigenin peak and appearance of a luteolin peak in strain FL-405.
  • Figure 4 Production of Apigenin from naringenin by strain SC744 (FNSII1 + CPR2). Control strain: CF234. Observation of the disappearance of the naringenin peak and appearance of an apigenin peak in the strain.
  • Figure 5 Production of luteolin from erodictyol SC744 (FNSII1 + CPR2). Control strain: CF234. Observation of the disappearance of the erodictyol peak and appearance of a luteolin peak in the strain.
  • Figure 6 Production of erodictyol and luteolin by strain SC1500. Control strain: CF237. Observation of erodictyol and luteolin peaks.
  • Figure 7 Production of erodictyol and luteolin by strains SC1500, SC2424, SC2425, SC2426, SC2427 and SC2428.
  • Control strain CF237.
  • strains used in the examples were obtained from Saccharomyces cerevisiae FY1679-28A (Tettelin et al., 1995 https://doi.org/10.1016/S1067-
  • This yeast has a quadri auxotrophy for uracil, tryptophan, histidine and leucine.
  • the genes optimized for expression in yeast have been synthesized by Eurofins genomics, Ebersberg, Germany or Biomatik, Cambridge, Canada or Twist Biosciences, San Francisco, USA or DC Biosciences, Dundee, UK.
  • the cpr2 gene SEQ ID NO: 26 was amplified from genomic DNA.
  • the genes obtained by synthesis or by PCR comprise at the 5 'and 3' end, a BbsI restriction site (GAAGAC).
  • the vector comprises a yeast auxotrophy marker URA, or LEU or TRP or HIS.
  • the yeast strains were cultured in 1 ml of minimum nitrogen base medium (Dutscher, Brumath, Fr) supplemented with 20 g / l glucose in a 24-well plate (Starlab, Orsay, Fr) at 30 ° C for 72 hours with continuous stirring. at 200 RPM.
  • naringenin or apigenin was added at a concentration of 100 mg.l 1 to determine the activity of F3'H and naringenin or erodictyol was added at a concentration of 100 mg.l 1 to determine the activity of FNSII.
  • Each strain was inoculated at OD 0.2 from a 24 hour pre-culture cultivated under the same conditions.
  • the final concentrations of the internal standards are:
  • UHPLC-TQ Analysis by UHPLC-TQ: The samples were analyzed by a UHPLC Vanquish-H (Thermo) coupled to a triple-quadrupole Quantis (Thermo).
  • the column is a Waters Acquity UPLC @ USST3 column (8 miti 2.1 X 100 mm) associated with a HSST3 1.8 miti 2.1 X 5 mm pre-column.
  • Mobile phase A is a solution of 0.1% formic acid in LC / MS grade water and mobile phase B is a solution of 0.1% formic acid in pure acetonitrile of LC / MS quality.
  • the temperature of the column is 50 ° C and the temperature of the sample changer is 10 ° C.
  • Two chromatographic conditions could be used for the detection of aglycone flavonoids:
  • the parameters of the electrospray source are: spray voltage negative mode at 1000V curtain gas: at 50 Arb auxiliary gas at 15 Arb transfer tube temperature at 300 ° C vaporizer temperature at 300 ° C
  • the ions monitored and the fragmentation conditions for the molecules of interest are:
  • F3′H Constructs for each of the F3′H were carried out in a vector carrying the URA selection marker (Table 6). Constructs each comprising SAM2 and only one of the different CPRs were created in a vector carrying the selection marker LEU (Table 7). Two vectors comprising only the URA or LEU selection marker were also created as a control.
  • the marker genes make it possible to identify and select the cells which have integrated the gene of interest.
  • strain FL 405, Figure 2 and Figure 3 has the constructs FL 26 and FL 401.
  • the control strain (without the genes) having the TT URA and TT LEU constructs is called CF235.
  • FNSII The control strain (without the genes) having the TT URA and TT LEU constructs.
  • strain SC 744, Figure 4 and Figure 5 has the constructs FL 620 and FL 401.
  • the control strain (without the genes) possessing the TT TRP and TT LEU constructs is named CF234. Similar constructions were carried out to test the FNSII of SEQ ID Nos: 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 and 125.
  • strain SC1500 comprises the constructions FL 26, FL 602, FL 808 and FL 822;
  • strain SC2424 comprising the constructions FL 1031 + FL 602 + FL 822 + TT H IS;
  • strain SC2425 comprising the constructions FL 26 + FL 602 + FL 822 + TT H IS;
  • strain SC2426 comprising the constructions FL 31 + FL 602 + FL 822 + TT H IS;
  • the strain SC2427 comprises the constructions FL 1031, FL 602, FL 808 and FL 822; and - strain SC2428 comprising the constructions FL 31 + FL 602 + FL 808 + FL 822.
  • the control strain (without the genes) possessing the constructions TT U RA, TT TRP, TT HIS and TT LEU is named CF237.
  • Tables 11 and 12 below show the production of erodictyol (Table 11) and luteolin (Table 12) obtained by culturing the strains comprising the F3′H listed in Table 6 and the constructions of Table 7, in the presence respectively naringenin and apigenin.
  • LQ. below the limit of quantification.
  • the different strains are well capable of producing erodictyol from naringenin, in different concentrations depending on the F3′H and the CPR used (see FIG. 2).
  • LQ. below the limit of quantification.
  • the different strains are well capable of producing luteolin from apigenin, in different concentrations depending on the F3′H and the CPR used (see FIG. 3).
  • Tables 13 and 14 below show the production of apigenin (Table 13) and luteolin (Table 14) obtained by culturing the strains comprising the FNSII listed in Table 8 and the constructions of Table 9, in the presence respectively of naringenin and erodictyol.
  • strains are well capable of producing apigenin and luteolin from naringenin and erodictyol, in different concentrations depending on the SNSF used ( Figures 4 and 5).
  • Strains SC2424, SC2425, SC2426, SC2427, SC1500 and SC2428 possess all the enzymes of the pathway and are capable of producing luteolin and erodictyol from glucose.
  • strain SC1500 corresponds to Figure 6, where the peaks of erodictyol and luteolin are observed. Similar results are obtained for the strains SC2424, SC2425, SC2426, SC2427, and SC2428. The production of erodictyol and luteolin for each of the strains SC2424, SC2425, SC2426, SC2427, SC1500 and SC2428 is shown in Figure 7.
  • PAL and C4H enzymes to the biosynthetic pathway makes it possible to obtain significantly higher concentrations of erodictyol and luteolin.These can be up to 6 times greater than the concentrations obtained with strains containing the same enzymes with the exception of PAL and C4H (cf. figure 7, for example by comparing the strain SC2425 without PAL / C4H and the strain SC1500 with PAL / C4H or the strain SC2426 without PAL / C4H and the strain SC2428 with PAL / C4H).

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Botany (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

The invention relates to a recombinant yeast modified to be capable of producing eriodictyol and/or luteolin and to the use thereof to produce eriodictyol and/or luteolin.

Description

METHODE DE BIOSYNTHESE DE L'ERIODICTYOL ET/OU DE LA LUTEOLINE DANS UNE LEVURE DOMAINE DE L'INVENTION METHOD OF BIOSYNTHESIS OF ERIODICTYOL AND / OR LUTEOLINE IN A YEAST FIELD OF THE INVENTION
La présente invention est relative à une méthode de production de l'ériodictyol et/ou de la lutéoline. The present invention relates to a method for producing erodictyol and / or luteolin.
ARRIERE-PLAN TECHNOLOGIQUE TECHNOLOGICAL BACKGROUND
L'ériodictyol et/ou la lutéoline sont, respectivement, une flavanone et une flavone di- hydroxylées en position 3' et 4'. Ces composés présentent un intérêt en tant que tels mais également en tant qu'intermédiaires de biosynthèse pour la production d'autres molécules d'intérêt. Eriodictyol and / or luteolin are, respectively, a flavanone and a flavone dihydroxylated at the 3 'and 4' position. These compounds are of interest as such but also as biosynthetic intermediates for the production of other molecules of interest.
Ainsi, il existe un besoin de procédé de biosynthèse de l'ériodictyol et/ou de la lutéoline. Thus, there is a need for a process for the biosynthesis of erodictyol and / or luteolin.
RESUME DE L'INVENTION SUMMARY OF THE INVENTION
Les inventeurs ont mis au point une biosynthèse de l'ériodictyol et/ou de la lutéoline dans une levure. The inventors have developed a biosynthesis of erodictyol and / or luteolin in a yeast.
Elle est relative à une levure recombinante comprenant une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine. It relates to a recombinant yeast comprising a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of adding a hydroxyl in the 3 'position of naringenin and / or apigenin.
Dans un premier aspect, la flavonoïde 3'-monooxygénase (F3'H) est une enzyme de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Arabidopsis thaliana, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum. In a first aspect, the flavonoid 3'-monooxygenase (F3'H) is an enzyme from Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Arabidopsis thaliana, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis or Pilosella officinarum.
En particulier, la flavonoïde 3'-monooxygénase (F3'H) peut être une enzyme comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 et 87, éventuellement choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase, de préférence sélectionnée parmi les enzymes de SEQ ID NOs: 1, 5, 7, 11, 17, 19 et 87, éventuellement sélectionnée parmi les enzymes de SEQ ID NOs: 1, 5, 7, 11, 17 et 19, et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. Dans un mode de réalisation, la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7 , 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. In particular, the flavonoid 3'-monooxygenase (F3'H) can be an enzyme comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 and 87 , optionally chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 and 21, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably selected from the enzymes of SEQ ID NOs: 1, 5, 7, 11, 17, 19 and 87, optionally selected from the enzymes of SEQ ID NOs: 1, 5, 7, 11, 17 and 19, and the polypeptides having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting the activity flavonoid 3'-monooxygenase. In one embodiment, the flavonoid 3'-monooxygenase (F3'H) is an enzyme comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
Dans un mode de réalisation préféré, la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 87, de préférence SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. In a preferred embodiment, the flavonoid 3'-monooxygenase (F3'H) is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, preferably SEQ ID NOs: 7, 17 and 87 , and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
Dans un mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 %, d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'- monooxygénase. De préférence, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 85 % d'identité de séquence, de préférence au moins 90% d'identité de séquence, avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase. In a particular embodiment, F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95%, of sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity. Preferably, F3′H is an enzyme comprising a sequence selected from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 85% sequence identity, preferably at least 90% sequence identity, with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity.
Dans un mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 17 et les polypeptides com prenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence, de préférence au moins 90% d'identité de séquence, avec la séquence SEQ ID NO: 17, et présentant l'activité flavonoïde 3'-monooxygénase. In a particular embodiment, the F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 17 and the polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90 % or at least 95% sequence identity, preferably at least 90% sequence identity, with the sequence SEQ ID NO: 17, and exhibiting the flavonoid 3'-monooxygenase activity.
Dans un mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 87 et les polypeptides com prenant une séquence ayant au moins 70 %, au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence, de préférence au moins 90% d'identité de séquence, avec la séquence SEQ ID NO: 87, et présentant l'activité flavonoïde 3'-monooxygénase. In a particular embodiment, the F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 87 and the polypeptides comprising a sequence having at least 70%, at least 75%, at least 80%, at least 85 %, at least 90% or at least 95% sequence identity, preferably at least 90% sequence identity, with the sequence SEQ ID NO: 87, and exhibiting the flavonoid 3'-monooxygenase activity.
Dans un mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 11 et les polypeptides com prenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence, de préférence au moins 90% d'identité de séquence, avec la séquence SEQ ID NO: 11, et présentant l'activité flavonoïde 3'-monooxygénase. De préférence, la levure recombinante comprend en outre un acide nucléique hétérologue ou endogène codant pour une cytochrome P450 réductase (CPR), de préférence de Saccharomyces cerevisiae, de Catharanthus roseus ou d’Arabidopsis thaliana. La cytochrome P450 réductase (CPR) peut être sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase. En particulier, la CPR peut être choisie parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase. De préférence, la CPR est choisie parmi les enzymes comprenant une séquence choisie parmi la SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase. In a particular embodiment, the F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 11 and the polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90 % or at least 95% sequence identity, preferably at least 90% sequence identity, with the sequence SEQ ID NO: 11, and exhibiting the flavonoid 3'-monooxygenase activity. Preferably, the recombinant yeast further comprises a heterologous or endogenous nucleic acid encoding a cytochrome P450 reductase (CPR), preferably from Saccharomyces cerevisiae, from Catharanthus roseus or from Arabidopsis thaliana. Cytochrome P450 reductase (CPR) can be selected from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity. In particular, the CPR can be chosen from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting cytochrome P450 reductase activity. Preferably, the CPR is chosen from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity.
Facultativement, la levure recombinante comprend en outre un acide nucléique hétérologue ou endogène codant pour une S-adénosylméthionine synthétase (SAMT). Optionally, the recombinant yeast further comprises a heterologous or endogenous nucleic acid encoding an S-adenosylmethionine synthetase (SAMT).
De préférence, la levure recombinante comprend en outre une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS), en particulier une flavone synthase capable de produire la lutéoline à partir de l'ériodictyol, de préférence d’Arabidopsis thaliana, Petroseiinum crispum, Zea mays, Lonicera japonica, Lonicera macranthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii. La flavone synthase (FNS) peut être sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase. Dans un mode de réalisation préféré, la flavone synthase (FNS) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 37 ou un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. Preferably, the recombinant yeast further comprises a heterologous nucleic acid sequence encoding a flavone synthase (FNS), in particular a flavone synthase capable of producing luteolin from erodictyol, preferably from Arabidopsis thaliana, Petroseiinum crispum, Zea mays, Lonicera japonica, Lonicera macranthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus varecellymus, Dussisuturea barhusutcensus, Dushusutaria barhusus barhus, Schusutocensus, Schusutisus, Schusutocensus varhus scolymus, Schusutocensus hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata or Erythranthe lewisii. Flavone synthase (FNS) can be selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115 , 117, 119, 121, 123, 125, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, of preferably selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35 and 37, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity. In a preferred embodiment, the flavone synthase (FNS) is an enzyme comprising a sequence selected from SEQ ID NO: 37 or a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting flavone synthase activity.
De préférence, la levure recombinante peut comprendre en outre : Preferably, the recombinant yeast can further comprise:
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) ; et/ou une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77, de préférence SEQ ID NO : 65 et 77, et de manière plus particulièrement préférée SE ID NO : 65, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69 et 79, de préférence SEQ ID NO : 79, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL); and / or a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65, 77, preferably SEQ ID NOs: 65 and 77, and more particularly preferably SE ID NO: 65, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity, and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69 and 79, preferably SEQ ID NO: 79, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) ; a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL);
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) ; et a heterologous nucleic acid sequence encoding a chalcone synthase (CHS); and
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI). a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI).
Dans un mode de réalisation particulier, elle comprend en outre : In a particular embodiment, it further comprises:
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) from Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a selected sequence from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces davuligerus, en particulier d’Arabidopsis thaliana, Petroselinum crispum ou Streptomyces davuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47, 89, 91 et 49, en particulier choisie parmi SEQ ID NOs: 43, 45, 47 et 49, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; en particulier une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 45 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase, de préférence une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 89, 91 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; et de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase ; a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) from Arabidopsis thaliana, Citrus clementina, Petroselinum crispum or Streptomyces davuligerus, in particular from Arabidopsis thaliana, Petroselinum crispum or Streptomyces davuligerus; a 4CL comprising a sequence chosen from SEQ ID NOs: 43, 45, 47, 89, 91 and 49, in particular chosen from SEQ ID NOs: 43, 45, 47 and 49, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; in particular a 4CL comprising a sequence selected from SEQ ID NOs: 45 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting activity 4- coumarate-CoA ligase, preferably a 4CL comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity sequenced with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; and very particularly preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting 4-coumarate-CoA ligase activity;
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces davuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité chalcone synthase; et une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase, de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces davuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone synthase activity; and a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone isomerase activity, preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting chalcone isomerase activity.
Dans un mode de réalisation particulier, la levure recombinante comprend en outre : une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; In a particular embodiment, the recombinant yeast further comprises: a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi les SEQ ID NO: 89, 91 et 45, de préférence SEQ ID NO : 45, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ces séquences et présentant une activité 4-coumarate-CoA ligase ; et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NOs: 89, 91 and 45, preferably SEQ ID NO: 45, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with these sequences and exhibiting 4-coumarate-CoA ligase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . Dans un mode de réalisation particulier, elle peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75, de préférence SEQ ID NO : 75, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydroxylase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p-coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p- coumarate 3 hydroxylase. a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone synthase activity; and a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) comprising a sequence selected from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting chalcone isomerase activity. In a particular embodiment, it may further comprise a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine to L-Dopa and also p coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID NOs: 73 and 75, of preferably SEQ ID NO: 75, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydroxylase activity; or a heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 71 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% identity of a sequence with one of these sequences and exhibiting p-coumarate 3 hydroxylase activity.
Dans un mode de réalisation préféré, la levure est une levure du genre Saccharomyces, en particulier Saccharomyces cerevisiae. In a preferred embodiment, the yeast is a yeast of the genus Saccharomyces, in particular Saccharomyces cerevisiae.
La présente invention est relative à l'utilisation d'une levure tel que définie dans la présente demande pour produire de l'ériodictyol et/ou de la lutéoline. The present invention relates to the use of a yeast as defined in the present application for producing erodictyol and / or luteolin.
Elle est également relative à une méthode de production de l'ériodictyol et/ou de la lutéoline comprenant la culture d'une levure tel que définie dans la présente demande et éventuellement la récolte de l'ériodictyol et/ou de la lutéoline. It also relates to a method for producing erodictyol and / or luteolin comprising the culture of a yeast as defined in the present application and optionally the harvesting of erodictyol and / or luteolin.
DESCRI PTION DETAI LLEE DE L'I NVENTION DETAILED DESCRI PTION OF THE I NVENTION
Les inventeurs ont donc exploré plusieurs voies de biosynthèse et ont réussi à mettre au point la biosynthèse de l'ériodictyol et/ou de la lutéoline dans une levure à partir de la naringénine et de l'apigénine respectivement. En effet, la levure a été modifiée pour introduire une enzyme capable d'ajouter un groupe hydroxyle en position 3' de ces composés. The inventors therefore explored several biosynthetic pathways and succeeded in developing the biosynthesis of erodictyol and / or luteolin in a yeast from naringenin and apigenin respectively. Indeed, the yeast has been modified to introduce an enzyme capable of adding a hydroxyl group at the 3 'position of these compounds.
Définition Definition
Par « levure recombinante » est entendu une levure qui ne se trouve pas dans la nature et qui contient un génome modifié suite à une insertion, modification ou délétion d'un ou plusieurs éléments génétiques. By “recombinant yeast” is meant a yeast which is not found in nature and which contains a genome modified following an insertion, modification or deletion of one or more genetic elements.
Par « acide nucléique recombinant » est entendu un acide nucléique qui a été modifié et n'existe pas dans une levure naturelle. Par exemple, ce terme peut désigner une séquence codante ou gène qui est lié de manière opérationnelle à un promoteur qui n'est pas le promoteur naturel. Cela peut également désigner une séquence codante dans laquelle les introns ont été supprimés pour des gènes comprenant des exons et des introns. By "recombinant nucleic acid" is meant nucleic acid which has been modified and does not exist in natural yeast. For example, this term can denote a coding sequence or gene which is operably linked to a promoter which is not the natural promoter. It can also refer to a coding sequence in which introns have been deleted for genes comprising exons and introns.
Par « hétérologue » est entendu que le gène a été introduit par génie génétique dans la cellule. Il peut y être présent sous forme épisomale ou chromosomique. L'origine du gène peut être différente de la cellule dans laquelle il est introduit. Cependant, le gène peut également provenir de la même espèce que la cellule dans laquelle il est introduit mais il est considéré comme hétérologue en raison de son environnement qui n'est pas naturel. Par exemple, le gène ou la séquence nucléique est hétérologue car il/elle est sous le contrôle d'un promoteur autre que son promoteur naturel, il/elle est introduit(e) dans un endroit différent de celui-ci où il/elle est situé(e) naturellement. La cellule hôte peut contenir une copie du gène endogène préalablement à l'introduction du gène hétérologue ou elle peut ne pas contenir de copie endogène. Par ailleurs, la séquence d'acide nucléique peut être hétérologue dans le sens où la séquence codante a été optimisée pour l'expression dans la levure hôte. De manière préférée, dans le présent document, une séquence nucléique hétérologue code pour une protéine qui est hétérologue à la cellule hôte, c'est-à-dire qui n'est pas naturellement présente dans la levure. By "heterologous" is understood that the gene has been introduced by genetic engineering into the cell. It can be present there in episomal or chromosomal form. The origin of the gene may be different from the cell into which it is introduced. However, the gene can also come from the same species as the cell into which it is introduced but it is considered heterologous due to its environment which is not natural. For example, the gene or nucleic acid sequence is heterologous because he / she is under the control of a promoter other than his / her natural promoter, he / she is introduced in a different place from this one where he / she is naturally located. The host cell may contain a copy of the endogenous gene prior to the introduction of the heterologous gene or it may not contain an endogenous copy. Furthermore, the nucleic acid sequence can be heterologous in the sense that the coding sequence has been optimized for expression in the yeast host. Preferably, in the present document, a heterologous nucleic sequence encodes a protein which is heterologous to the host cell, that is to say which is not naturally present in yeast.
Tel qu’utilisé ici, le terme «natif» ou «endogène», par rapport à la levure hôte, se réfère à un élément génétique ou à une protéine naturellement présente dans ladite levure. As used herein, the term "native" or "endogenous", relative to the yeast host, refers to a genetic element or protein naturally present in said yeast.
Le terme « gène » désigne tout acide nucléique codant pour une protéine. Le terme gène englobe l’ADN, comme l’ADNc ou l’ADNg, ainsi que G ARN . Le gène peut d’abord être préparé par des techniques recombinantes, enzymatiques et/ou chimiques, et ensuite répliqué dans une cellule hôte ou un système in vitro. Le gène comprend typiquement un cadre de lecture ouvert codant pour une protéine souhaitée. Le gène peut contenir des séquences supplémentaires telles qu’un terminateur de transcription ou un peptide signal. En raison de la dégénérescence du code génétique, plusieurs acides nucléiques peuvent coder un polypeptide particulier. Ainsi, les codons dans la séquence codante pour un polypeptide donné peuvent être modifiés de telle sorte que l’expression optimale dans une levure particulière soit obtenue, par exemple en utilisant des tables de traduction de codon appropriées pour cette levure. Les acides nucléiques peuvent également être optimisés selon une teneur en GC préférable pour la levure particulière et/ou pour réduire le nombre de séquences répétées. Dans certains modes de réalisation, les acides nucléiques hétérologues ont été optimisés par codon pour une expression dans la levure concernée. L’optimisation des codons peut être effectuée par des procédés de routine connus dans la technique (voir, par exemple, Welch, M., et al. (2011), Methods in Enzymology 498: 43-66). Le terme « lié de manière opérationnelle » désigne une configuration dans laquelle une séquence de contrôle est placée à une position appropriée par rapport à une séquence codante, de telle sorte que la séquence de contrôle dirige l'expression de la séquence codante. The term “gene” denotes any nucleic acid encoding a protein. The term gene encompasses DNA, such as cDNA or gDNA, as well as G RNA. The gene can first be prepared by recombinant, enzymatic and / or chemical techniques, and then replicated in a host cell or an in vitro system. The gene typically comprises an open reading frame encoding a desired protein. The gene may contain additional sequences such as a transcription terminator or a signal peptide. Due to the degeneration of the genetic code, several nucleic acids can encode a particular polypeptide. Thus, codons in the coding sequence for a given polypeptide can be modified such that optimal expression in a particular yeast is achieved, for example by using codon translation tables appropriate for that yeast. Nucleic acids can also be optimized to a GC content preferable for the particular yeast and / or to reduce the number of repeat sequences. In some embodiments, the heterologous nucleic acids have been optimized by codon for expression in the yeast of interest. Optimization of codons can be accomplished by routine methods known in the art (see, eg, Welch, M., et al. (2011), Methods in Enzymology 498: 43-66). The term "operably linked" denotes a configuration in which a control sequence is placed at an appropriate position relative to a sequence. coding, such that the control sequence directs expression of the coding sequence.
Le terme « séquences de contrôle » désigne les séquences d'acide nucléique nécessaires à l'expression d'un gène. Les séquences de contrôle peuvent être natives ou hétérologues. Des séquences de contrôle bien connues et actuellement utilisées par l'homme du métier seront préférées. De telles séquences de contrôle comprennent, mais sans s'y limiter, un leader, une séquence de polyadénylation, une séquence de propeptide, un promoteur, une séquence de peptide de signal et un terminateur de transcription. De préférence, les séquences de contrôle comprennent un promoteur et un terminateur de transcription. The term “control sequences” denotes the nucleic acid sequences necessary for the expression of a gene. The control sequences can be native or heterologous. Control sequences well known and currently used by those skilled in the art will be preferred. Such control sequences include, but are not limited to, a leader, a polyadenylation sequence, a propeptide sequence, a promoter, a signal peptide sequence and a transcription terminator. Preferably, the control sequences comprise a promoter and a transcription terminator.
Le terme « cassette d'expression » désigne une construction d'acide nucléique comprenant une région codante, c'est-à-dire un gène, et une région de régulation, c'est-à-dire comprenant une ou plusieurs séquences de contrôle, liées de manière opérationnelle. De préférence, les séquences de contrôle conviennent à la levure hôte. The term “expression cassette” denotes a nucleic acid construct comprising a coding region, i.e. a gene, and a regulatory region, i.e. comprising one or more control sequences. , linked in an operational manner. Preferably, the control sequences are suitable for the yeast host.
Tel qu'utilisé ici, le terme « vecteur d'expression » désigne une molécule d'ADN ou d'ARN qui comprend une cassette d'expression. De préférence, le vecteur d'expression est une molécule d'ADN double brin linéaire ou circulaire. Le vecteur peut comprendre en outre une origine de réplication, un marqueur de sélection, etc. As used herein, the term "expression vector" refers to a DNA or RNA molecule which comprises an expression cassette. Preferably, the expression vector is a linear or circular double stranded DNA molecule. The vector may further include an origin of replication, a selection marker, etc.
Par « pourcentage d'identité » entre deux séquences d’acide nucléique ou d’acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d’acides aminés identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Le meilleur alignement ou alignement optimal est l’alignement pour lequel le pourcentage d'identité entre les deux séquences à comparer, comme calculé ci- après, est le plus élevé. Les comparaisons de séquences entre deux séquences d’acide nucléique ou d’acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L’alignement aux fins de la détermination du pourcentage d’identité de séquence d’acides aminés peut être réalisé de diverses façons qui sont bien connues dans le domaine, par exemple en utilisant des logiciels informatiques disponibles sur le Web sur Internet tels que http: //blast.ncbi.nlm. Nih.gov/ ou http://www.ebi.ac.uk/Tools/emboss/). L’homme du métier peut déterminer les paramètres appropriés pour mesurer l'alignement, y compris tout algorithme nécessaire pour obtenir un alignement maximal sur toute la longueur des séquences comparées. Aux fins de la présente invention, les valeurs de pourcentage d'identité de séquence d'acides aminés se réfère à des valeurs générées à l'aide du programme d'alignement de séquence de paires EMBOSS Needle qui crée un alignement global optimal de deux séquences à l'aide de l'algorithme Needleman-Wunsch, dans lequel tous les paramètres de recherche sont définis par défaut Matrice de notation = BLOSUM62, Gap ouvert = 10, Gap extension = 0,5, pénalité d'intervalle d'extrémité = faux, intervalle d'extrémité ouvert = 10 et écart d'extrémité étendue = 0,5. Dans certains modes de réalisation, tous les pourcentages d'identité mentionnés dans cette demande peuvent être fixés à au moins 60%, au moins 70%, au moins 80%, au moins 85%, de préférence à au moins 90% d'identité, plus préférablement à au moins 95% d'identité. En particulier, sont considérés comme décrits les modes de réalisations dans lesquels tous les pourcentages d'identité de séquence des enzymes sont d'au moins 80% ou au moins 85%, de préférence d'au moins 90% ou au moins 95% d’identité de séquence. By “percentage identity” between two nucleic acid or amino acid sequences within the meaning of the present invention, is meant a percentage of nucleotides or of identical amino acid residues between the two sequences to be compared, obtained after the best alignment, this percentage being purely statistical and the differences between the two sequences being distributed at random and over their entire length. The best alignment or optimal alignment is the alignment for which the percentage identity between the two sequences to be compared, as calculated below, is the highest. Sequence comparisons between two nucleic acid or amino acid sequences are traditionally carried out by comparing these sequences after having optimally aligned them, said comparison being carried out by segment or by comparison window to identify and compare the local regions of sequence similarity. Alignment for the purpose of determining percent amino acid sequence identity can be accomplished in various ways which are well known in the art, for example using computer software available on the web on the Internet such as http: //blast.ncbi.nlm. Nih.gov/ or http://www.ebi.ac.uk/Tools/emboss/). Man from The business can determine the appropriate parameters to measure alignment, including any algorithm necessary to achieve maximum alignment over the full length of the sequences being compared. For purposes of the present invention, percent amino acid sequence identity values refer to values generated using the EMBOSS Needle pair sequence alignment program which creates an optimal overall alignment of two sequences. using the Needleman-Wunsch algorithm, in which all search parameters are set by default Scoring matrix = BLOSUM62, Open gap = 10, Gap extension = 0.5, End gap penalty = False , open end gap = 10 and extended end gap = 0.5. In some embodiments, all of the identity percentages mentioned in this application can be set at at least 60%, at least 70%, at least 80%, at least 85%, preferably at least 90% identity , more preferably at least 95% identity. In particular, embodiments in which all the percentages of sequence identity of the enzymes are at least 80% or at least 85%, preferably at least 90% or at least 95%, are considered as described. sequence identity.
Dans un mode de réalisation, les polypeptides peuvent présenter 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 additions, substitutions ou délétions par rapport aux séquences décrites dans les SEQ ID Nos. En particulier, ces additions, substitutions ou délétions sont introduites à l'extrémité N-terminale, C-terminale ou aux deux extrémités. In one embodiment, the polypeptides may have 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 additions, substitutions or deletions relative to the sequences described in SEQ ID Nos. In particular, these additions, substitutions or deletions are introduced at the N-terminus, C-terminus or at both ends.
Les polypeptides peuvent éventuellement se présenter sous forme de protéine de fusion. Les termes « surexpression » et « augmentation d’expression » tels qu’utilisés ici, sont utilisés de manière interchangeable et signifient que l’expression d’un gène ou d’une enzyme est augmentée par rapport à une levure non modifiée, par exemple une levure de type sauvage ou ne comprenant pas les modifications génétiques décrites ici. Par « sauvage » est entendu une levure non-modifiée existant dans la nature. L’expression accrue d’une enzyme est habituellement obtenue en augmentant l’expression du gène codant pour ladite enzyme. Dans des modes de réalisation dans lesquels le gène ou l’enzyme n’est pas naturellement présent dans la levure de l’invention, c'est-à-dire un gène ou une enzyme hétérologue, les termes « surexpression » et « expression » peuvent être utilisés de manière interchangeable. Pour augmenter l'expression d'un gène, l'homme du métier peut utiliser toutes les techniques connues telles que l'augmentation du nombre de copies du gène dans la levure, en utilisant un promoteur induisant un niveau élevé d'expression du gène, c'est-à-dire un promoteur fort, en utilisant des éléments stabilisants l'ARN messager correspondant ou les séquences de séquestration du site de liaison de ribosome (RBS) et les séquences qui les entourent. En particulier, la surexpression peut être obtenue en augmentant le nombre de copies du gène dans la levure. Une ou plusieurs copies du gène peuvent être introduites dans le génome par des procédés de recombinaison, connus de l'homme du métier, y compris le remplacement des gènes ou l’insertion multicopie (voir par exemple la demande de brevet international WO 2015/092013). De préférence, une cassette d’expression comprenant le gène, de préférence placé sous le contrôle d’un promoteur fort, est intégrée au génome. En variante, le gène peut être porté par un vecteur d’expression, de préférence un plasmide, comprenant une cassette d’expression avec le gène d’intérêt placé de préférence sous le contrôle d’un promoteur fort. Le vecteur d’expression peut être présent dans la levure en une ou plusieurs copies, selon la nature de l’origine de la réplication. La surexpression du gène peut également être obtenue en utilisant un promoteur induisant un niveau élevé d’expression du gène. Par exemple, le promoteur d’un gène endogène peut être remplacé par un promoteur plus fort, c'est-à-dire un promoteur induisant un niveau d'expression plus élevé. Le gène endogène sous le contrôle d'un promoteur qui n'est pas le promoteur naturel est qualifié d'acide nucléique hétérologue. Les promoteurs appropriés pour être utilisés dans la présente invention sont connus de l’homme du métier et peuvent être constitutifs ou inductibles, et être endogènes ou hétérologues. The polypeptides can optionally be in the form of a fusion protein. The terms "overexpression" and "increased expression" as used herein, are used interchangeably and mean that the expression of a gene or an enzyme is increased relative to unmodified yeast, for example. wild-type yeast or not comprising the genetic modifications described herein. By “wild” is meant an unmodified yeast existing in nature. The increased expression of an enzyme is usually achieved by increasing the expression of the gene encoding said enzyme. In embodiments in which the gene or enzyme is not naturally present in the yeast of the invention, i.e. a heterologous gene or enzyme, the terms "overexpression" and "expression" can be used interchangeably. To increase the expression of a gene, a person skilled in the art can use any of the known techniques such as increasing the number of copies of the gene in yeast, using a promoter inducing a high level. expression of the gene, i.e. a strong promoter, using elements stabilizing the corresponding messenger RNA or the sequestration sequences of the ribosome binding site (RBS) and the sequences surrounding them. In particular, overexpression can be obtained by increasing the number of copies of the gene in yeast. One or more copies of the gene can be introduced into the genome by recombination methods known to those skilled in the art, including gene replacement or multicopy insertion (see for example international patent application WO 2015/092013 ). Preferably, an expression cassette comprising the gene, preferably placed under the control of a strong promoter, is integrated into the genome. As a variant, the gene can be carried by an expression vector, preferably a plasmid, comprising an expression cassette with the gene of interest placed preferably under the control of a strong promoter. The expression vector can be present in the yeast in one or more copies, depending on the nature of the origin of replication. Overexpression of the gene can also be achieved by using a promoter inducing a high level of expression of the gene. For example, the promoter of an endogenous gene can be replaced by a stronger promoter, that is to say a promoter inducing a higher level of expression. The endogenous gene under the control of a promoter which is not the natural promoter is called heterologous nucleic acid. Promoters suitable for use in the present invention are known to those skilled in the art and can be constitutive or inducible, and be endogenous or heterologous.
Par « comprenant » est également entendu « consistant » ou « consistant essentiellement ». Par « consistant essentiellement » est entendu que la séquence peut présenter 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 additions, substitutions ou délétions par rapport aux séquences décrites dans les SEQ ID Nos. By “comprising” is also understood “consisting” or “essentially consisting”. By "consisting essentially" is understood that the sequence may have 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 additions, substitutions or deletions with respect to the sequences described in SEQ ID Nos.
Levures Yeasts
De préférence, la levure est une levure de l'ordre des Saccharomycetales, Sporidiobolales et Schizosaccharomycetales. La levure peut par exemple être sélectionnée parmi Pichia, Kluyveromyces, Saccharomyces, Schizosaccharomyces, Candida, Lipomyces, Rhodotorula, Rhodosporidium, Yarrowia, ou Debaryomyces. Dans un mode de réalisation, la levure est choisie parmi Pichia pastoris, Kluyveromyces iactis, Kluyveromyces marxianus, Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kiuyveri, Saccharomyces norbensis, Saccharomyces oviformis, Schizosaccharomyces pombe, Candida albicans, Candida tropicalis, Rhodotorula glutinis, Rhodosporidium toruloides, Yarrowia lipolytica, Debaryomyces hansenii et Lipomyces starkeyi. Preferably, the yeast is a yeast of the order of Saccharomycetales, Sporidiobolales and Schizosaccharomycetales. The yeast can for example be selected from Pichia, Kluyveromyces, Saccharomyces, Schizosaccharomyces, Candida, Lipomyces, Rhodotorula, Rhodosporidium, Yarrowia, or Debaryomyces. In one embodiment, the yeast is chosen from Pichia pastoris, Kluyveromyces iactis, Kluyveromyces marxianus, Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kiuyveri, Saccharomyces norbensis, Saccharomyces oviformis, Schizosaccharomyces pombe, Candida albicans, Candida tropicalis, Rhodotorula glutinis, Rhodosporidium toruloides, Yarrowia lipolytica, Debaryomyces hansenii and Lipomyces starkeyi.
Dans un mode de réalisation préféré, la levure est une levure Saccharomyces, de préférence une levure Saccharomyces cerevisiae. In a preferred embodiment, the yeast is a Saccharomyces yeast, preferably a Saccharomyces cerevisiae yeast.
Les levures peuvent avoir été modifiées pour augmenter la production de tyrosine et/ou de phénylalanine, de préférence de la tyrosine. The yeasts may have been modified to increase the production of tyrosine and / or phenylalanine, preferably tyrosine.
De manière alternative ou cumulative, la voie de la biosynthèse de la tyrosine et/ou phénylalanine, de préférence de la tyrosine, peut être optimisée, notamment en redirigeant le flux de carbone d'autres voies métaboliques vers celle de la tyrosine et/ou phénylalanine, de préférence de la tyrosine. Ces modifications et ces gènes sont bien connus de l'homme du métier (voir US 8,809,028 ; Pandey et al, 2016, Biotechnol Adv., 34, 634-662). Alternatively or cumulatively, the pathway for the biosynthesis of tyrosine and / or phenylalanine, preferably tyrosine, can be optimized, in particular by redirecting the carbon flow from other metabolic pathways towards that of tyrosine and / or phenylalanine , preferably tyrosine. These modifications and these genes are well known to those skilled in the art (see US Pat. No. 8,809,028; Pandey et al, 2016, Biotechnol Adv., 34, 634-662).
Ainsi, dans un mode de réalisation, la levure produit des quantités importantes de tyrosine et/ou de phénylalanine, en particulier à partir d'u ne source carbonée simple comme le glucose. Thus, in one embodiment, the yeast produces significant amounts of tyrosine and / or phenylalanine, in particular from a simple carbon source such as glucose.
Modifications permettant la production de l'ériodictyol et/ou la lutéoline Modifications allowing the production of erodictyol and / or luteolin
La levure recombinante selon la présente invention a été modifiée pour produire de l'ériodictyol et/ou de la lutéoline. Notamment, pou r permettre à la levure de synthétiser l'ériodictyol et/ou la lutéoline à partir de la naringénine et de l'apigénine respectivement, la levure a été modifiée pour introduire une enzyme capable d'ajouter un groupe hydroxyle en position 3' de ces composés. The recombinant yeast according to the present invention has been modified to produce erodictyol and / or luteolin. In particular, to enable the yeast to synthesize erodictyol and / or luteolin from naringenin and apigenin respectively, the yeast has been modified to introduce an enzyme capable of adding a hydroxyl group in the 3 'position of these compounds.
Pour cela, les inventeurs ont dû identifier et sélectionner des enzymes capables d'accepter la naringénine et/ou l'apigénine comme substrat et d'ajouter un groupe hydroxyle en position 3' de ces composés. De préférence, l'enzyme est sélectionnée de sorte à présenter une préférence pour une hydroxylation en position 3' de la naringénine et/ou de l'apigénine. Dans un mode de réalisation préféré, l'enzyme est spécifique de la position 3' de la naringénine et/ou de l'apigénine, en particulier afin d'éviter une double hydroxylation en positions 3' et 5', et de préférence éviter également une hydroxylation en position 5'. Dans un premier mode de réalisation, la levure recombinante est capable de produire la naringénine et/ou l'apigénine, en particulier elle a été modifiée dans ce but. Notamment, la souche est capable de produire de naringénine et/ou de l'apigénine à partir du glucose. Dans un mode de réalisation alternatif, la naringénine et/ou l'apigénine peuvent être apportées à la levure. For this, the inventors had to identify and select enzymes capable of accepting naringenin and / or apigenin as substrate and of adding a hydroxyl group in the 3 'position of these compounds. Preferably, the enzyme is selected so as to exhibit a preference for hydroxylation at the 3 'position of naringenin and / or apigenin. In a preferred embodiment, the enzyme is specific for the 3 'position of naringenin and / or apigenin, in particular in order to avoid double hydroxylation at the 3' and 5 'positions, and preferably also to avoid hydroxylation at the 5 'position. In a first embodiment, the recombinant yeast is capable of producing naringenin and / or apigenin, in particular it has been modified for this purpose. In particular, the strain is capable of producing naringenin and / or apigenin from glucose. In an alternative embodiment, naringenin and / or apigenin can be supplied to the yeast.
Dans un mode de réalisation particulier, la levure produit l'ériodictyol. La lutéoline peut alors être préparée à partir de l'ériodictyol par conversion chimique ou biochimique, notamment par oxydation. In a particular embodiment, the yeast produces erodictyol. Luteolin can then be prepared from erodictyol by chemical or biochemical conversion, in particular by oxidation.
Dans un mode de réalisation préféré, la levure produit l'ériodictyol et la lutéoline, notamment à partir du glucose et sans apport de naringénine et/ou d'apigénine. In a preferred embodiment, the yeast produces erodictyol and luteolin, in particular from glucose and without supply of naringenin and / or apigenin.
F3'H : flavonoïde 3'-monooxygénase F3'H: flavonoid 3'-monooxygenase
Ainsi, la levure recombinante comprend une enzyme qui réalise l'addition d'un groupe hydroxyle en position 3' de la naringénine et/ou de l'apigénine. Thus, the recombinant yeast comprises an enzyme which effects the addition of a hydroxyl group at the 3 'position of naringenin and / or apigenin.
Pour cela, les inventeurs ont dû identifier et sélectionner des enzymes capables d'accepter la naringénine et/ou l'apigénine comme substrat et d'ajouter un groupe hydroxyle en position 3' de ces composés. De préférence, l'enzyme est sélectionnée de sorte à présenter une préférence pour une hydroxylation en position 3' de la naringénine et/ou de l'apigénine. Dans un mode de réalisation préféré, l'enzyme est spécifique de la position 3' de la naringénine et/ou de l'apigénine, en particulier afin d'éviter une double hydroxylation en positions 3' et 5', et de préférence éviter également une hydroxylation en position 5'. For this, the inventors had to identify and select enzymes capable of accepting naringenin and / or apigenin as substrate and of adding a hydroxyl group in the 3 'position of these compounds. Preferably, the enzyme is selected so as to exhibit a preference for hydroxylation at the 3 'position of naringenin and / or apigenin. In a preferred embodiment, the enzyme is specific for the 3 'position of naringenin and / or apigenin, in particular in order to avoid double hydroxylation at the 3' and 5 'positions, and preferably also to avoid hydroxylation at the 5 'position.
La flavonoïde 3'-monooxygénase (F3'H) est une enzyme qui réalise l'addition d'un groupe hydroxyle en position 3' de la naringénine et/ou de l'apigénine. Cette enzyme appartient à la classe des EC 1.14.14.82. Elle est également appelée flavonoïde 3'-hydroxylase. The flavonoid 3'-monooxygenase (F3'H) is an enzyme which carries out the addition of a hydroxyl group at the 3 'position of naringenin and / or apigenin. This enzyme belongs to the class of EC 1.14.14.82. It is also called a flavonoid 3'-hydroxylase.
Par « activité flavonoïde 3'-monooxygénase » est entendue la transformation d'un flavonoïde en flavonoïde 3' hydroxylé par une enzyme F3'H. Pour déterminer s'il y a une activité flavonoïde 3'-monooxygénase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro de l'enzyme flavonoïde 3' monooxygénase en présence de NAD(P)H, O2, et d'un flavonoïde, dans des conditions optimales (pH, ions...), et l'observation en UPLC- MS et en comparaison au standard attendu de l'apparition d'un flavonoïde 3'-hydroxylé. De préférence, le flavonoïde est la naringénine ou l'apigénine et le flavonoïde 3'-hydroxylé est leur forme 3’-hydroxylé, c'est-à-dire Eriodictyol ou Lutéoline. By "3'-monooxygenase flavonoid activity" is meant the transformation of a flavonoid into a 3 'hydroxylated flavonoid by an F3'H enzyme. To determine if there is flavonoid 3'-monooxygenase activity, an enzymatic test can be performed which consists of the in vitro incubation of the flavonoid 3 'monooxygenase enzyme in the presence of NAD (P) H, O2, and d 'a flavonoid, under optimal conditions (pH, ions, etc.), and observation in UPLC-MS and in comparison with the expected standard of the appearance of a 3'-hydroxylated flavonoid. Preferably, the flavonoid is naringenin or apigenin and the 3'-hydroxylated flavonoid is their 3'-hydroxylated form, i.e. Eriodictyol or Luteolin.
La levure recombinante peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine. Dans un mode de réalisation, la F3'H est une enzyme de plante, notamment de plantes du genre Allium, Arabidopsis, Brassica, Callistephus, Columnea, Citrus, Dianthus, Gentiana, Gerbera, Glycine, Fragaria, Ipomoea, Malus, Matthiola, Osteospermum, Oryza, Phanerochaete, Perilla, Petroselinum, Pélargonium, Pilosella, Pétunia, Sinningia, Sorghum, Torenia, Vitis ou Zea, par exemple de Allium cepa, Arabidopsis thaliana, Brassica napus, Columnea hybrida, Callistephus chinensis, Citrus sinensis, Citrus clementina, Dianthus caryophyllus, Fragaria vesca, Fragaria x ananassa, Gerbera hybrida, Glycine max, Gentiana triflora, Ipomoea nil, Ipomoea purpurea, Ipomoea tricolor, Matthiola incana, Malus domestica, Osteospermum hybrid cultivar, Oryza sativa, Phanerochaete chrysosporium, Pilosella officinarum, Petroselinum crispum, Pélargonium x hortorum, Perilla frutescens var. crispa, Pétunia x hybrida, Sinningia cardinalis, Sorghum bicolor, Torenia sp, Torenia hybrid cultivar, Vitis vinifera ou Zea mays. Dans un mode de réalisation plus spécifique, la F3'H est une enzyme de plantes du genre Allium, Brassica, Callistephus, Columnea, Citrus, Dianthus, Gentiana, Gerbera, Glycine, Fragaria, Ipomoea, Malus, Matthiola, Osteospermum, Oryza, Phanerochaete, Perilla, Petroselinum, Pélargonium, Pilosella, Pétunia, Sinningia, Sorghum, Torenia, Vitis ou Zea, par exemple de Allium cepa, Brassica napus, Columnea hybrida, Callistephus chinensis, Citrus sinensis, Citrus clementina, Dianthus caryophyllus, Fragaria vesca, Fragaria x ananassa, Gerbera hybrida, Glycine max, Gentiana triflora, Ipomoea nil, Ipomoea purpurea, Ipomoea tricolor, Matthiola incana, Malus domestica, Osteospermum hybrid cultivar, Oryza sativa, Phanerochaete chrysosporium, Pilosella officinarum, Petroselinum crispum, Pélargonium x hortorum, Perilla frutescens var. crispa, Pétunia x hybrida, Sinningia cardinalis, Sorghum bicolor, Torenia sp, Torenia hybrid cultivar, Vitis vinifera ou Zea mays. The recombinant yeast can therefore comprise a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin. In one embodiment, F3'H is a plant enzyme, in particular plants of the genus Allium, Arabidopsis, Brassica, Callistephus, Columnea, Citrus, Dianthus, Gentiana, Gerbera, Glycine, Fragaria, Ipomoea, Malus, Matthiola, Osteospermum , Oryza, Phanerochaete, Perilla, Petroselinum, Pelargonium, Pilosella, Petunia, Sinningia, Sorghum, Torenia, Vitis or Zea, for example of Allium cepa, Arabidopsis thaliana, Brassica napus, Columnea hybrida, Callistephus chinensis, Citrus sinensis, Citrus clementina caryophyllus, Fragaria vesca, Fragaria x ananassa, Gerbera hybrida, Glycine max, Gentiana triflora, Ipomoea nil, Ipomoea purpurea, Ipomoea tricolor, Matthiola incana, Malus domestica, Osteospermum hybrid cultivar, Oryza sativa, Phanerochaete, Petoselinisparum officonium, Petoselinisporium, x hortorum, Perilla frutescens var. crispa, Petunia x hybrida, Sinningia cardinalis, Sorghum bicolor, Torenia sp, Torenia hybrid cultivar, Vitis vinifera or Zea mays. In a more specific embodiment, F3'H is an enzyme from plants of the genus Allium, Brassica, Callistephus, Columnea, Citrus, Dianthus, Gentiana, Gerbera, Glycine, Fragaria, Ipomoea, Malus, Matthiola, Osteospermum, Oryza, Phanerochaete , Perilla, Petroselinum, Pelargonium, Pilosella, Petunia, Sinningia, Sorghum, Torenia, Vitis or Zea, for example of Allium cepa, Brassica napus, Columnea hybrida, Callistephus chinensis, Citrus sinensis, Citrus clementina, Dianthus caryophyllus, Fragaria vesca, Fragaria x ananassa, Gerbera hybrida, Glycine max, Gentiana triflora, Ipomoea nil, Ipomoea purpurea, Ipomoea tricolor, Matthiola incana, Malus domestica, Osteospermum hybrid cultivar, Oryza sativa, Phanerochaete chrysosporium, Pilosella officinarum, Petroselelinum crispum, Petroselinum crispum. crispa, Petunia x hybrida, Sinningia cardinalis, Sorghum bicolor, Torenia sp, Torenia hybrid cultivar, Vitis vinifera or Zea mays.
De préférence, la F3'FI est une enzyme de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Arabidopsis thaliana et Pilosella officinarum. En particulier, la F3'FI peut être une enzyme de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis et Pilosella officinarum. Preferably, the F3'FI is an enzyme from Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Arabidopsis thaliana and Pilosella officinarum. In particular, F3'FI can be an enzyme from Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis and Pilosella officinarum.
Dans un mode de réalisation particulier, la F3'FI est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 et 87, en particulier parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17, 19 et 87, en particulier parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase, notamment avec la naringénine et/ou de l'apigénine comme substrat et avec une hydroxylation en position 3'. Dans un mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase. Dans un mode de réalisation préféré, la F3'H est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 60, 70, 75, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. De manière tout particulièrement préférée, la F3'H peut être une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 75, 80, 85, 90 ou 95 %, d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. In a particular embodiment, the F3'FI is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 and 87, in particularly among SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 and 21, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d 'sequence identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably selected from enzymes comprising a sequence chosen from SEQ ID NOs: 1, 5, 7, 11, 17, 19 and 87, in particular from SEQ ID NOs: 1, 5, 7, 11, 17 and 19, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting flavonoid activity 3 '- monooxygenase, in particular with naringenin and / or apigenin as substrate and with hydroxylation in the 3' position. In a particular embodiment, F3'H is an enzyme comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity. In a preferred embodiment, F3'H is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 60, 70, 75, 80, 85 , 90 or 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity. Very particularly preferably, the F3′H can be an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87 and polypeptides comprising a sequence having at least 60, 70, 75, 80, 85, 90 or 95%, identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
Ainsi, la F3'H peut être de Perilla frutescens var. crispa. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB045593.1 et BAB59005.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 2 et 1. Thus, the F3'H may be from Perilla frutescens var. twitched. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB045593.1 and BAB59005.1, respectively, and more particularly in SEQ ID NOs: 2 and 1.
La F3'H peut être de Phanerochaete chrysosporium. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB597870.1 et BAL05157.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 4 et 3. The F3'H may be from Phanerochaete chrysosporium. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB597870.1 and BAL05157.1, respectively, and more particularly in SEQ ID NOs: 4 and 3.
La F3'H peut être de Pétunia x hybrida. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AF155332.1 et AAD56282.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 6 et 5. The F3'H can be from Petunia x hybrida. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AF155332.1 and AAD56282.1, respectively, and more particularly in SEQ ID NOs: 6 and 5.
La F3'H peut être de Callistephus chinensis. Dans un mode de réalisation, les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AF313488.1 et AAG49298.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 8 et 7. Dans un autre mode de réalisation, les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AF313489.1 et AAG49299.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 10 et 9. The F3'H may be from Callistephus chinensis. In one embodiment, the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AF313488.1 and AAG49298.1, respectively, and more particularly in SEQ ID Nos: 8 and 7. In another embodiment, the nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AF313489.1 and AAG49299.1, respectively, and more particularly in SEQ ID NOs: 10 and 9.
La F3'H peut être de Gerbera hybrida. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence DQ218417.1 et ABA64468.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 12 et 11. The F3'H can be from Gerbera hybrida. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers DQ218417.1 and ABA64468.1, respectively, and more particularly in SEQ ID NOs: 12 and 11.
La F3'H peut être de Osteospermum hybrid cultivar. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence DQ250711.1 et ABB29899.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 14 et 13. The F3'H can be from Osteospermum hybrid cultivar. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers DQ250711.1 and ABB29899.1, respectively, and more particularly in SEQ ID NOs: 14 and 13.
La F3'H peut être de Citrus clementina. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence The F3'H can be from Citrus clementina. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers
XM_006440673.1 et XP_006440736.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 16 et 15. XM_006440673.1 and XP_006440736.1, respectively, and more particularly in SEQ ID NOs: 16 and 15.
La F3'H peut être de Citrus sinensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence The F3'H can be from Citrus sinensis. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers
XM_006477592.2 et XP_006477655.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 18 et 17. XM_006477592.2 and XP_006477655.1, respectively, and more particularly in SEQ ID NOs: 18 and 17.
La F3'H peut être de Pilosella officinarum. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence DQ319866.2 et ABC47161.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 20 et 19. The F3'H may be from Pilosella officinarum. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers DQ319866.2 and ABC47161.1, respectively, and more particularly in SEQ ID NOs: 20 and 19.
La F3'H peut être de Streptomyces avermitilis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence SAV_4539 et WP_010985964.1, respectivement, et plus particulièrement dans les SEQ ID NOs : 22 et 21. The F3'H can be from Streptomyces avermitilis. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers SAV_4539 and WP_010985964.1, respectively, and more particularly in SEQ ID NOs: 22 and 21.
La F3'H peut être d’Arabidopsis thaliana. Une séquence nucléique codant cette enzyme et la séquence protéique sont décrites dans NCBI sous les numéros de référence NM_120881.2 et NP_196416.1, respectivement et plus particulièrement dans les SEQ ID The F3'H can be Arabidopsis thaliana. A nucleic acid sequence encoding this enzyme and the protein sequence are described in NCBI under the reference numbers NM_120881.2 and NP_196416.1, respectively and more particularly in SEQ IDs
NOs : 88 et 87. De préférence, la F3'H est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7 , 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. De manière tout particulièrement préférée, la F3'H est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. NOs: 88 and 87. Preferably, F3′H is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity. Very particularly preferably, F3′H is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and the polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%. , at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
Selon un mode de réalisation préféré, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'- monooxygénase. According to a preferred embodiment, F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity.
Selon un autre mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 17 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 17, et présentant l'activité flavonoïde 3'- monooxygénase. According to another particular embodiment, F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 17 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90 % or at least 95% sequence identity with the sequence SEQ ID NO: 17, and exhibiting the flavonoid 3'-monooxygenase activity.
Selon un autre mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 87 et les polypeptides comprenant une séquence ayant au moins 70 %, au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 87, et présentant l'activité flavonoïde 3'-monooxygénase. According to another particular embodiment, F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 87 and polypeptides comprising a sequence having at least 70%, at least 75%, at least 80%, at least 85 %, at least 90% or at least 95% sequence identity with the sequence SEQ ID NO: 87, and exhibiting the flavonoid 3'-monooxygenase activity.
Selon un autre mode de réalisation particulier, la F3'H est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 11 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 11, et présentant l'activité flavonoïde 3'- monooxygénase. According to another particular embodiment, F3′H is an enzyme comprising a sequence chosen from SEQ ID NO: 11 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90 % or at least 95% sequence identity with the sequence SEQ ID NO: 11, and exhibiting the flavonoid 3'-monooxygenase activity.
CPR : cytochrome P450 réductase CPR: cytochrome P450 reductase
La flavonoïde 3'-monooxygénase (F3'H) nécessite la présence de NADPFI pour réaliser l'addition du groupe hydroxyle. Ainsi, dans un mode de réalisation préféré, la levure comprend un acide nucléique hétérologue ou endogène codant pour une cytochrome P450 réductase, une NADPH- cytochrome P450 réductase. Cette enzyme appartient à la classe des EC 1.6.2.4. The flavonoid 3'-monooxygenase (F3'H) requires the presence of NADPFI to effect the addition of the hydroxyl group. Thus, in a preferred embodiment, the yeast comprises a heterologous or endogenous nucleic acid encoding a cytochrome P450 reductase, a NADPH-cytochrome P450 reductase. This enzyme belongs to the class of EC 1.6.2.4.
Ainsi, dans un mode de réalisation particulier, la levure comprend une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H), en particulier capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; et un acide nucléique hétérologue ou endogène codant pour une cytochrome P450 réductase. Thus, in a particular embodiment, the yeast comprises a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H), in particular capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin; and a heterologous or endogenous nucleic acid encoding a cytochrome P450 reductase.
La cytochrome P450 réductase provient d'un eucaryote, notamment d'une levure, par exemple du genre Saccharomycetales, ou d'une plante, par exemple une plante du genre Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Phoseolus, Physcomitrella, Pinus, Populus, Ruta, Saccharum, Solanum, Vigna, Vitis ou Zea. Cytochrome P450 reductase originates from a eukaryote, in particular from a yeast, for example of the genus Saccharomycetales, or from a plant, for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Phoseolus, Physcomitrella, Pinus, Populus, Ruta, Saccharum, Solanum, Vigna, Vitis or Zea.
Dans un mode de réalisation préféré, la cytochrome P450 réductase provient d'un eucaryote, par exemple de levure, en particulier de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d 'Arabidopsis thaliana. In a preferred embodiment, the cytochrome P450 reductase originates from a eukaryote, for example from yeast, in particular from Saccharomyces cerevisiae, or from a plant, for example from Catharanthus roseus or from Arabidopsis thaliana.
Dans un mode de réalisation particulier, la cytochrome P450 réductase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase. En particulier, la cytochrome P450 réductase peut être sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase. In a particular embodiment, cytochrome P450 reductase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity. In particular, cytochrome P450 reductase can be selected from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity.
Selon un mode de réalisation préféré, la cytochrome P450 réductase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi la SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 %, de préférence au moins 80%, d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase. According to a preferred embodiment, cytochrome P450 reductase is selected from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95%, of preferably at least 80% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity.
Par exemple, la cytochrome P450 réductase peut être de Catharanthus roseus. Elle est décrite dans la base de données Genbank de NCBI sous le numéro X69791.1 pour la séquence nucléique et sous le numéro CAA49446.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 24 et 23, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q05001. For example, the cytochrome P450 reductase can be from Catharanthus roseus. It is described in NCBI's Genbank database under number X69791.1 for the nucleic acid sequence and under the number CAA49446.1 for the protein sequence, and more particularly in SEQ ID Nos: 24 and 23, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number Q05001.
La cytochrome P450 réductase peut être de Saccharomyces cerevisiae. Elle est décrite dans la base de données Genbank de NCBI sous le numéro NM_001179172.1 pour la séquence nucléique et sous le numéro NP_011908.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 26 et 25, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence P16603. The cytochrome P450 reductase can be from Saccharomyces cerevisiae. It is described in the Genbank database from NCBI under the number NM_001179172.1 for the nucleic acid sequence and under the number NP_011908.1 for the protein sequence, and more particularly in SEQ ID Nos: 26 and 25, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number P16603.
La cytochrome P450 réductase peut être chimérique. Elle est décrite dans l'article Aigrain et al (2009, EMBO reports, 10, 742-747). La séquence nucléique codant cette enzyme et la séquence protéique sont décrites dans les SEQ ID Nos : 28 et 27, respectivement. Cytochrome P450 reductase can be chimeric. It is described in the article Aigrain et al (2009, EMBO reports, 10, 742-747). The nucleic acid sequence encoding this enzyme and the protein sequence are described in SEQ ID Nos: 28 and 27, respectively.
Par ailleurs, la cytochrome P450 réductase peut être d’Arabidopsis thaliana. Elle est décrite dans la base de données Genbank de NCBI sous le numéro NM_118585.4 pour la séquence nucléique et sous le numéro NP_194183.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 30 et 29, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q9SB48. On the other hand, the cytochrome P450 reductase can be from Arabidopsis thaliana. It is described in the NCBI Genbank database under the number NM_118585.4 for the nucleic acid sequence and under the number NP_194183.1 for the protein sequence, and more particularly in SEQ ID Nos: 30 and 29, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number Q9SB48.
En outre, la cytochrome P450 réductase peut être d’Arabidopsis thaliana et être décrite dans la base de données Genbank de NCBI sous le numéro NM_179141.2 pour la séquence nucléique et sous le numéro NP_849472.2 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 32 et 31, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q9SUM3. Lorsque la cytochrome P450 provient d'Arabidopsis thaliana, on peut la nommer l'ATR. In addition, the cytochrome P450 reductase may be from Arabidopsis thaliana and be described in the NCBI Genbank database under the number NM_179141.2 for the nucleic sequence and under the number NP_849472.2 for the protein sequence, and more particularly in SEQ ID Nos: 32 and 31, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number Q9SUM3. When cytochrome P450 comes from Arabidopsis thaliana, it can be called ATR.
Dans un mode de réalisation, une nouvelle copie d'une séquence codante pour CPR comme définie ci-dessus est introduite dans la levure. Dans un autre mode de réalisation, lorsque la levure est Saccharomyces cerevisiae et que la CPR provient de la même levure, le promoteur du gène endogène codant pour CPR est remplacé par un promoteur fort. Ainsi, l'expression de la CPR est augmentée par rapport à la levure sauvage ; la CPR est donc surexprimée dans la levure modifiée. In one embodiment, a new copy of a coding sequence for CPR as defined above is introduced into the yeast. In another embodiment, when the yeast is Saccharomyces cerevisiae and the CPR is from the same yeast, the promoter of the endogenous gene encoding CPR is replaced by a strong promoter. Thus, the expression of CPR is increased compared to wild yeast; CPR is therefore overexpressed in modified yeast.
Dans un mode de réalisation particulier, la F3'H et la CPR proviennent de la même origine, la même espèce. FNS : Flavone synthase In a particular embodiment, the F3′H and the CPR come from the same origin, the same species. FNS: Flavone synthase
La lutéoline peut être produite à partir de l'ériodictyol. L'enzyme capable de transformer l'ériodictyol en lutéoline est une flavone synthase (FNS). Luteolin can be produced from erodictyol. The enzyme capable of converting erodictyol into luteolin is a flavone synthase (FNS).
Ainsi, la levure peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une flavone synthase, en particulier une flavone synthase capable de produire l'apigénine à partir de la naringénine et/ou la lutéoline à partir de l'ériodictyol, de préférence la lutéoline à partir de l'ériodictyol. Thus, the yeast can therefore comprise a heterologous nucleic acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing apigenin from naringenin and / or luteolin from erodictyol, preferably luteolin from erodictyol.
Par « activité flavone synthase » est entendue la transformation d'une flavanone en flavone par une enzyme FNSI (CPR indépendante) ou une FNSII (CPR dépendante). By "flavone synthase activity" is meant the transformation of a flavanone into a flavone by an FNSI enzyme (independent CPR) or an FNSII (dependent CPR).
Pour déterminer s'il y a une activité flavone synthase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro dans le cas de la FNSI d'un mélange composé de l'enzyme flavone synthase (FNSI), d'une flavanone, de 2-oxoglutarate, d’O , dans les conditions optimales (pH, température, ions...) et dans le cas de la FNSII d'un mélange composé de l'enzyme FNSII, d'une flavanone, de NAD(P)H, d'02, dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de la flavone correspondante à la flavanone est observée en UPLC-MS en comparaison au standard attendu. De préférence, la flavanone est la naringénine ou l'ériodictyol qui seront transformés en leur forme flavone, c'est-à-dire en apigénine ou en lutéoline, respectivement. To determine if there is flavone synthase activity, an enzymatic test can be performed which consists of in vitro incubation in the case of FNSI of a mixture composed of the enzyme flavone synthase (FNSI), a flavanone, 2-oxoglutarate, O, under optimal conditions (pH, temperature, ions ...) and in the case of FNSII of a mixture composed of the enzyme FNSII, a flavanone, NAD (P) H, of 02, under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of the flavone corresponding to the flavanone is observed in UPLC-MS in comparison with the expected standard. Preferably, the flavanone is naringenin or erodictyol which will be converted into their flavone form, that is to say into apigenin or luteolin, respectively.
Ainsi, dans un mode de réalisation particulier, la levure comprend une séquence d'acide nucléique hétérologue codant pour une flavone synthase, en particulier une flavone synthase capable de produire l'apigénine à partir de la naringénine et/ou la lutéoline à partir de l'ériodictyol, de préférence la lutéoline à partir de l'ériodictyol. Thus, in a particular embodiment, the yeast comprises a heterologous nucleic acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing apigenin from naringenin and / or luteolin from l Eriodictyol, preferably luteolin from erodictyol.
De préférence, la flavone synthase est une enzyme provenant de plante, par exemple du genre Aethusa, Angelica, Antirrhinum, Apium, Arabidopsis, Callistephus, Camellia, Conium, Cuminum, Cynara, Dahlia, Dorcoceras, Erythranthe, Lonicera, Medicago, Oryza, Perilla, Petroseiinum, Plectranthus, Populus, Saussurea, Scutellaria ou Zea, en particulier du genre Arabidopsis, Lonicera, Medicago, Oryza, Petroseiinum, Populus ou Zea,, notamment d 'Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroseiinum crispum, Populus deltoïdes, Zea mays, Callistephus chinensis, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d 'Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, ou Zea mays, de préférence Petroselinum crispum, ou du genre Lonicera comme par exemple Lonicera japonica et Lonicera macranthoides. Preferably, the flavone synthase is an enzyme derived from plants, for example of the genus Aethusa, Angelica, Antirrhinum, Apium, Arabidopsis, Callistephus, Camellia, Conium, Cuminum, Cynara, Dahlia, Dorcoceras, Erythranthe, Lonicera, Medicago, Oryza, Perilla , Petroseiinum, Plectranthus, Populus, Saussurea, Scutellaria or Zea, in particular of the genus Arabidopsis, Lonicera, Medicago, Oryza, Petroseiinum, Populus or Zea, in particular of Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza macranthoides, Medicago truncatula, Oryza macranthoides, Medicago truncatula, Petroseiinum crispum, Populus deltoides, Zea mays, Callistephus chinensis, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus var scolymus, Saussurea medusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata or Erythranthe lewisii, in particular Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Popryelinus truncatum, O. mays, preferably Petroselinum crispum, or of the genus Lonicera such as, for example, Lonicera japonica and Lonicera macranthoides.
Dans un mode de réalisation particulier, la flavone synthase (FNS) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase. En particulier, la flavone synthase (FNS) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase. De préférence, la FNS est sélectionnée parmi les enzymes comprenant la SEQ ID NO: 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. In a particular embodiment, the flavone synthase (FNS) is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109 , 111, 113, 115, 117, 119, 121, 123, 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a flavone synthase activity. In particular, the flavone synthase (FNS) is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting flavone synthase activity. Preferably, the FNS is selected from enzymes comprising SEQ ID NO: 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting activity flavone synthase.
Il existe deux sortes de flavone synthase (FNS) : la flavone synthase 1 (FNSI) et la flavone synthase 2 (FNSII). A partir d'une flavanone et de 2-oxoglutarate, la FNSI est capable de produire la flavone correspondante. L'enzyme FNSI appartient à la classe des EC 1.14.11.22. La FNSII appartient au groupe de P450 et nécessite la présence d'une cytochrome P450 réductase. L'enzyme FNSII appartient à la classe des EC 1.14.13. There are two kinds of flavone synthase (FNS): flavone synthase 1 (FNSI) and flavone synthase 2 (FNSII). From a flavanone and 2-oxoglutarate, FNSI is able to produce the corresponding flavone. The FNSI enzyme belongs to the class of EC 1.14.11.22. FNSII belongs to the P450 group and requires the presence of a cytochrome P450 reductase. The FNSII enzyme belongs to the class of EC 1.14.13.
Dans un mode de réalisation, la FNS est une flavone synthase de type I. Dans un autre mode de réalisation, la FNS est une flavone synthase de type II. Dans un mode de réalisation supplémentaire, la levure comprend une flavone synthase de type I et une flavone synthase de type II. In one embodiment, the FNS is a type I flavone synthase. In another embodiment, the FNS is a type II flavone synthase. In a further embodiment, the yeast comprises a type I flavone synthase and a type II flavone synthase.
Dans un mode de réalisation préféré, la levure comprend une séquence d'acide nucléique hétérologue codant pour une flavone synthase de type I (FNSI). L'avantage de la FNSI est qu'elle fonctionne sans cytochrome P450 réductase. In a preferred embodiment, the yeast comprises a heterologous nucleic acid sequence encoding a type I flavone synthase (FNSI). The advantage of FNSI is that it works without cytochrome P450 reductase.
La FNSI peut être une flavone synthase de plante comme Petroselinum crispum, Oryza sativa, Populus deltoïdes, Medicago truncatula, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, ou Conium maculatum, en particulier de Petroselinum crispum, Oryza sativa, Populus deltoïdes, Medicago truncatula, de préférence de Petroselinum crispum. FNSI can be a plant flavone synthase such as Petroselinum crispum, Oryza sativa, Populus deltoides, Medicago truncatula, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, or Conium maculatum, in particular from Petroselinum crispum, Oryza sativa, Populus deltoides, Medicago truncatula, preferably from Petroselinum crispum.
La FNSI peut être une enzyme comprenant une séquence choisie parmi les SEQ ID NOs: 37, 93, 103, 107, 109, 111 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'un de ces séquences et présentant une activité flavone synthase. Dans un aspect particulier, la FNSI peut être une enzyme comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. The FNSI can be an enzyme comprising a sequence chosen from SEQ ID NOs: 37, 93, 103, 107, 109, 111 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting flavone synthase activity. In a particular aspect, the FNSI can be an enzyme comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence. and exhibiting flavone synthase activity.
Par exemple, la FNSI peut être de Petroselinum crispum. Elle est décrite dans la base de données Genbank de NCBI sous le numéro AY817680.1 pour la séquence nucléique et sous le numéro AAX21541.1 pour la séquence protéique. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q7XZQ8. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 37 et 38, respectivement. La FNSI peut également être d’Angelica archangelica. Elle est décrite dans la base de données Genbank de NCBI sous le numéro DQ683352.1 pour la séquence nucléique et sous le numéro ABG78793.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 93 et 94, respectivement. For example, the FNSI can be from Petroselinum crispum. It is described in the NCBI Genbank database under number AY817680.1 for the nucleic acid sequence and under number AAX21541.1 for the protein sequence. The protein is described in UniProtKB / Swiss Prot under the reference number Q7XZQ8. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 37 and 38, respectively. FNSI can also be Angelica archangelica. It is described in the NCBI Genbank database under number DQ683352.1 for the nucleic acid sequence and under number ABG78793.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 93 and 94, respectively.
La FNSI peut également être d’Apium graveolens. Elle est décrite dans la base de données Genbank de NCBI sous le numéro AY817676.1 pour la séquence nucléique et sous le numéro AAX21537.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID NOs : 103 et 104, respectivement. FNSI can also be Apium graveolens. It is described in NCBI's Genbank database under number AY817676.1 for the nucleic acid sequence and under number AAX21537.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID NOs: 103 and 104, respectively.
La FNSI peut également être de Cuminum cyminum. Elle est décrite dans la base de données Genbank de NCBI sous le numéro DQ683349.1 pour la séquence nucléique et sous le numéro ABG78790.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 107 et 108, respectivement. The FNSI can also be from Cuminum cyminum. It is described in the NCBI Genbank database under number DQ683349.1 for the nucleic acid sequence and under number ABG78790.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 107 and 108, respectively.
La FNSI peut également être d’Aethusa cynapium. Elle est décrite dans la base de données Genbank de NCBI sous le numéro DQ683350.1 pour la séquence nucléique et sous le numéro DQ683350.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 109 et 110, respectivement. La FNSI peut également être de Conium moculotum. Elle est décrite dans la base de données Genbank de NCBI sous le numéro DQ683354.1 pour la séquence nucléique et sous le numéro ABG78795.1 pour la séquence protéique. Les séquences en acides aminés et en acides nucléiques sont décrites dans les SEQ ID Nos : 111 et 112, respectivement. The FNSI can also be from Aethusa cynapium. It is described in the NCBI Genbank database under number DQ683350.1 for the nucleic acid sequence and under number DQ683350.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 109 and 110, respectively. The FNSI can also be from Conium moculotum. It is described in the NCBI Genbank database under number DQ683354.1 for the nucleic acid sequence and under number ABG78795.1 for the protein sequence. The amino acid and nucleic acid sequences are described in SEQ ID Nos: 111 and 112, respectively.
Dans un autre mode de réalisation, la levure comprend une séquence d'acide nucléique hétérologue codant pour une flavone synthase de type II (FNSII). In another embodiment, the yeast comprises a heterologous nucleic acid sequence encoding a type II flavone synthase (FNSII).
La FNSII peut être une flavone synthase de plante, par exemple d’Arabidopsis thaliana, Zea mays, du genre Lonicera comme par exemple Lonicera japonica et Lonicera mocronthoides, Callistephus chinensis, Medicago truncatula, Camellia sinensis, Cynara cordunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier une flavone synthase d’Arabidopsis thaliana, Zea mays ou du genre Lonicera comme par exemple Lonicera japonica et Lonicera macranthoides. Dans un mode de réalisation particulier, la flavone synthase (FNSII) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 95, 97, 99, 101, 105, 113, 115, 117, 119, 121, 123 et 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33 et 35 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase. The FNSII can be a plant flavone synthase, for example of Arabidopsis thaliana, Zea mays, of the genus Lonicera such as for example Lonicera japonica and Lonicera mocronthoides, Callistephus chinensis, Medicago truncatula, Camellia sinensis, Cynara cordunculus var scolymus, Saussectranthus medusa, barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata or Erythranthe lewisii, in particular a flavone synthase of Arabidopsis thaliana, Zea mays or of the genus Lonicera such as, for example, Lonicera macranthoides and Lonichoides. In a particular embodiment, the flavone synthase (FNSII) is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 33, 35, 95, 97, 99, 101, 105, 113, 115, 117, 119, 121 , 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 33 and 35 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity.
Dans un mode de réalisation, la flavone synthase FNS est une FNSII provenant de Lonicera japonica. Dans ce mode de réalisation, l'enzyme peut une enzyme décrite dans la base de données Genbank de NCBI sous le numéro KU127576.1 pour la séquence nucléique et sous le numéro AMQ91109.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 34 et 33, respectivement. In one embodiment, the FNS flavone synthase is an FNSII from Lonicera japonica. In this embodiment, the enzyme may be an enzyme described in the Genbank database of NCBI under the number KU127576.1 for the nucleic sequence and under the number AMQ91109.1 for the protein sequence, and more particularly in SEQ IDs Nos: 34 and 33, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Lonicera macranthoides. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KU127580.1 et AMQ91113.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 36 et 35, respectivement. Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Cynara cordunculus var scolymus. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence JN825735.1 et AFG31000.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 96 et 95, respectivement. In another embodiment, the FNS flavone synthase is an FNSII from Lonicera macranthoides. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KU127580.1 and AMQ91113.1, respectively, and more particularly in SEQ ID Nos: 36 and 35, respectively. In another embodiment, the FNS flavone synthase is an FNSII from Cynara cordunculus var scolymus. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers JN825735.1 and AFG31000.1, respectively, and more particularly in SEQ ID Nos: 96 and 95, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Perilla frutescens var crispa. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB045592.1 et BAB59004.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 98 et 97, respectivement. In another embodiment, the FNS flavone synthase is an FNSII from Perilla frutescens var crispa. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB045592.1 and BAB59004.1, respectively, and more particularly in SEQ ID Nos: 98 and 97, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Dahlia pinnata. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB769842.1 et BAM72335.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 100 et 99, respectivement. Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Callistephus chinensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AF188612.1 et AAF04115.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 102 et 101, respectivement. In another embodiment, the FNS flavone synthase is FNSII from Dahlia pinnata. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB769842.1 and BAM72335.1, respectively, and more particularly in SEQ ID Nos: 100 and 99, respectively. In another embodiment, the FNS flavone synthase is an FNSII from Callistephus chinensis. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AF188612.1 and AAF04115.1, respectively, and more particularly in SEQ ID Nos: 102 and 101, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Medicago truncatula. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence DQ354373.1 et ABC86159.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 106 et 105, respectivement. In another embodiment, the FNS flavone synthase is an FNSII from Medicago truncatula. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers DQ354373.1 and ABC86159.1, respectively, and more particularly in SEQ ID Nos: 106 and 105, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Camellia sinensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence FJ169499.1 et ACH99109.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 114 et 113, respectivement. Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Saussurea médusa. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KF170286.1 et AGV40781.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 116 et 115, respectivement. In another embodiment, the FNS flavone synthase is an FNSII from Camellia sinensis. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers FJ169499.1 and ACH99109.1, respectively, and more particularly in SEQ ID Nos: 114 and 113, respectively. In another embodiment, the FNS flavone synthase is an FNSII from Saussurea medusa. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KF170286.1 and AGV40781.1, respectively, and more particularly in SEQ ID Nos: 116 and 115, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Plectranthus barbatus. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KF606861.1 et AHJ89438.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 118 et 117, respectivement. In another embodiment, the FNS flavone synthase is FNSII from Plectranthus barbatus. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KF606861.1 and AHJ89438.1, respectively, and more particularly in SEQ ID Nos: 118 and 117, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Scutellaria baicalensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KT963454.1 et AMW91729.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 120 et 119, respectivement. In another embodiment, the FNS flavone synthase is FNSII from Scutellaria baicalensis. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KT963454.1 and AMW91729.1, respectively, and more particularly in SEQ ID Nos: 120 and 119, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Dorcoceras hygrometricum. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KV013332.1 et KZV23934.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 122 et 121, respectivement. In another embodiment, the FNS flavone synthase is FNSII from Dorcoceras hygrometricum. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KV013332.1 and KZV23934.1, respectively, and more particularly in SEQ ID Nos: 122 and 121, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Antirrhinum majus. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence AB028151.1 et BAA84071.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 124 et 123, respectivement. In another embodiment, the FNS flavone synthase is FNSII from Antirrhinum majus. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers AB028151.1 and BAA84071.1, respectively, and more particularly in SEQ ID Nos: 124 and 123, respectively.
Dans un autre mode de réalisation, la flavone synthase FNS est une FNSII provenant de Erythranthe lewisii. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence KX710102.1 et AOR81894.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 126 et 125, respectivement. In another embodiment, the FNS flavone synthase is FNSII from Erythranthe lewisii. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers KX710102.1 and AOR81894.1, respectively, and more particularly in SEQ ID Nos: 126 and 125, respectively.
Dans un mode de réalisation particulier, la levure comprend une séquence d'acide nucléique hétérologue codant pour une flavone synthase de type II (FNSII) et une flavone synthase de type I, par exemple une séquence choisie parmi SEQ ID NOs: 33, 35, 95, 97, 99, 101, 105, 113, 115, 117, 119, 121, 123 et 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase et une enzyme comprenant une séquence choisie parmi SEQ ID NO: 37, 93, 103, 107, 109 et 111 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité flavone synthase, de préférence, une séquence choisie parmi SEQ ID NOs: 33 et 35 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase et une enzyme comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. In a particular embodiment, the yeast comprises a heterologous nucleic acid sequence encoding a type II flavone synthase (FNSII) and a type I flavone synthase, for example a sequence chosen from SEQ ID NOs: 33, 35, 95, 97, 99, 101, 105, 113, 115, 117, 119, 121, 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity and an enzyme comprising a sequence chosen from SEQ ID NO: 37, 93, 103, 107, 109 and 111 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a sequence chosen from SEQ ID NOs: 33 and 35 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity and an enzyme comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity.
Les FNS de type II, FNSII, nécessite la présence d'une cytochrome P450 réductase (CPR). Si la levure ne comprend pas de cytochrome P450 réductase, il sera donc nécessaire d'introduire une cytochrome P450 réductase hétérologue. Si la levure en comprend déjà une, il est possible d'envisager soit la surexpression d'une cytochrome P450 réductase endogène (par exemple en remplaçant le promoteur par un promoteur fort ou en ajoutant une ou plusieurs copies de la séquence codante) ou d'en introduire également une cytochrome P450 réductase hétérologue. FNS type II, FNSII, requires the presence of cytochrome P450 reductase (CPR). If the yeast does not include cytochrome P450 reductase, it will therefore be necessary to introduce a heterologous cytochrome P450 reductase. If the yeast already includes one, it is possible to consider either the overexpression of an endogenous cytochrome P450 reductase (for example by replacing the promoter with a strong promoter or by adding one or more copies of the coding sequence) or also introduce a heterologous cytochrome P450 reductase.
Dans un mode de réalisation particulier, la FNS de type II et la CPR proviennent de la même origine, la même espèce. In a particular embodiment, the type II FNS and the CPR come from the same origin, the same species.
Facultativement, la levure recombinante peut comprendre en outre un acide nucléique hétérologue ou endogène codant pour une S-adénosylméthionine synthétase (SAMT). Cette enzyme appartient à la classe des EC 2.5.1.6. Optionally, the recombinant yeast can further comprise a heterologous or endogenous nucleic acid encoding an S-adenosylmethionine synthetase (SAMT). This enzyme belongs to the class of EC 2.5.1.6.
Dans un mode de réalisation, la SAMT proviennent de levure, en particulier de Saccharomyces cerevisiae, tout particulièrement lorsque le microorganisme est une levure. Dans un mode de réalisation particulier, la S-adénosylméthionine synthétase est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 81 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec cette séquence et présentant l'activité S-adénosylméthionine synthétase. In one embodiment, the SAMT originate from yeast, in particular from Saccharomyces cerevisiae, very particularly when the microorganism is a yeast. In a particular embodiment, S-adenosylmethionine synthetase is an enzyme comprising a sequence chosen from SEQ ID NO: 81 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with this sequence and exhibiting S-adenosylmethionine synthetase activity.
Par exemple, la S-adénosylméthionine synthétase peut être de Saccharomyces cerevisiae. Elle est décrite dans la base de données Genbank de NCBI sous le numéro NM_001180810.3 pour la séquence nucléique et sous le numéro N P_010790.3 pour la séquence protéique. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence P19358. For example, the S-adenosylmethionine synthetase can be from Saccharomyces cerevisiae. It is described in the NCBI Genbank database under the number NM_001180810.3 for the nucleic acid sequence and under the number N P_010790.3 for the protein sequence. The protein is described in UniProtKB / Swiss Prot under the reference number P19358.
Dans un mode de réalisation, une nouvelle copie d'une séquence codante pour SAMT comme définie ci-dessus est introduite dans le microorganisme. Dans un autre mode de réalisation, lorsque le microorganisme est Saccharomyces cerevisiae, le promoteur du gène endogène codant pour SAMT est remplacé par un promoteur fort. Ainsi, l'expression de la SAMT est augmentée par rapport au microorganisme sauvage ; la SAMT est donc surexprimée dans le microorganisme modifié. In one embodiment, a new copy of a coding sequence for SAMT as defined above is introduced into the microorganism. In another embodiment, when the microorganism is Saccharomyces cerevisiae, the promoter of the endogenous gene encoding SAMT is replaced by a strong promoter. Thus, the expression of SAMT is increased compared to the wild microorganism; SAMT is therefore overexpressed in the modified microorganism.
Combinaison d'enzymes Combination of enzymes
Ainsi, la levure comprend de préférence les enzymes permettant la production de l'ériodictyol et/ou la lutéoline à partir de la naringénine et/ou de l'apigénine. Thus, the yeast preferably comprises the enzymes allowing the production of erodictyol and / or luteolin from naringenin and / or apigenin.
Dans un premier mode de réalisation particulier, la levure recombinante comprend : une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; en particulier capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, ou Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, en particulier une F3'H comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase ; In a first particular embodiment, the recombinant yeast comprises: a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in the 3 'position; in particular capable of hydroxylating naringenin and / or apigenin in the 3 'position; preferably Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, or Pilosella officinarum, preferably an F3′H comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 and 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a flavonoid 3'-monooxygenase activity, preferably selected from among enzymes comprising a sequence chosen from SEQ ID NOs: 1, 5, 7, 11, 17 and 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with a of these sequences and exhibiting a flavonoid 3'-monooxygenase activity, in particular an F3'H comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with this sequence and exhibiting 3'-monooxygenase flavonoid activity;
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline ; de préférence une FNS d’Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR); preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; preferably one CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) capable of producing a flavone from a flavanone, in particular capable of transforming naringenin into apigenin, and / or erodictyol into luteolin, preferably of convert erodictyol to luteolin; preferably an FNS of Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, or Zea mays, preferably of Lonicera japonica, Lonicera macranthoides, and Petroselinum crispum; preferably an FNS comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity.
Dans un autre mode de réalisation particulier, la levure recombinante comprend : In another particular embodiment, the recombinant yeast comprises:
une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence d’Arabidopsis thaliana, Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum, en particulier d’Arabidopsis thaliana, Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis ou Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 et 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 7 , 11, 17 et 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase; a heterologous nucleic acid sequence encoding a flavonoid 3′-monooxygenase (F3′H) capable of hydroxylating in the 3 ′ position naringenin and / or apigenin; preferably Arabidopsis thaliana, Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis or Pilosella officinarum, in particular Arabidopsis thaliana, Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis or Pilosella officinarum, preferably an F3'H comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17 , 19, 21 and 87 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a flavonoid 3'-monooxygenase activity, preferably selected from enzymes comprising a sequence chosen from SEQ ID NOs: 7, 11, 17 and 87 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavonoid 3'-monooxygenase activity;
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, en particulier les enzymes comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR); preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; preferably a CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with a of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, in particular enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity; and
une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline ; de préférence une FNS d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroseiinum crispum, Populus deltoïdes, Zea mays, Callistephus chinensis, Apium graveolens, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cardunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum , Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroseiinum crispum, Populus deltoïdes ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, ou Petroselinum crispum; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 et 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a flavone synthase (FNS) capable of producing a flavone from a flavanone, in particular capable of transforming naringenin into apigenin, and / or erodictyol into luteolin, preferably of transforming erodictyol to luteolin; preferably an SNSF of Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroseiinum crispum, Populus deltoïdes, Zea mays, Callistephus chinensis, Apium graveolens, Cuminum cyminum, Aethusa changelumis, Camellium arculatia , Cynara cardunculus var scolymus, Saussurea medusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata or Erythranthe lewisii, in particular Arabidopsis thalunciva, Lonicera sativa, Lonicera japunicaides, Lonicera sativa, Lonicera japuncula, Lonicera , Petroseiinum crispum, Populus deltoides or Zea mays, preferably from Lonicera japonica, Lonicera macranthoides, or Petroselinum crispum; preferably an FNS comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably from enzymes comprising a sequence selected from SEQ ID NOs: 33, 35 and 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity .
Dans un autre mode de réalisation particulier, la levure recombinante comprend : In another particular embodiment, the recombinant yeast comprises:
une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase ; a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting flavonoid 3'-monooxygenase activity;
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière plus particulièrement préférée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, and more particularly preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequenced with this sequence and exhibiting cytochrome P450 reductase activity; and
une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline, comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a flavone synthase (FNS) capable of producing a flavone from a flavanone, in particular capable of transforming naringenin into apigenin, and / or erodictyol into luteolin, preferably of transforming erodictyol to luteolin, comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone activity synthase.
Dans un autre mode de réalisation particulier, la levure recombinante comprend : In another particular embodiment, the recombinant yeast comprises:
une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ; et a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11 , 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the 3'-monooxygenase flavonoid activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with this sequence and exhibiting the flavonoid 3'-monooxygenase activity; and
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi la SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, en particulier une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting activity flavone synthase, in particular a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting a flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting flavone synthase activity.
Dans un autre mode de réalisation particulier, la levure recombinante comprend : In another particular embodiment, the recombinant yeast comprises:
une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ; et une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi la SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11 , 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the 3'-monooxygenase flavonoid activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with this sequence and exhibiting the flavonoid 3'-monooxygenase activity; and a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting cytochrome P450 reductase activity; and
une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting flavone synthase activity.
Chaque enzyme peut être choisie parmi les enzymes décrites ci-dessus. Each enzyme can be chosen from the enzymes described above.
Jusqu'à Naringénine et Apigénine Up to Naringenin and Apigenin
Différentes voies de biosynthèses de naringénine et de l'apigénine sont connues dans les plantes, en particulier à partir du glucose, de la tyrosine ou de la phénylalanine. Des microorganismes, notamment E. coli et Saccharomyces cerevisiae, ont été modifiés pour produire de la naringénine et/ou et de l'apigénine (Hwang El, et al. 2003. Appl Environ Microbiol. 2003, 69(5):2699-2706; Jiang Hl, et al. 2005. Appl Environ Microbiol. 2005, 71(6):2962-9 ; Pandey et al, 2016, Biotechnol Adv., 34, 634-662). Different pathways for the biosynthesis of naringenin and apigenin are known in plants, in particular from glucose, tyrosine or phenylalanine. Microorganisms, notably E. coli and Saccharomyces cerevisiae, have been modified to produce naringenin and / or and apigenin (Hwang El, et al. 2003. Appl Environ Microbiol. 2003, 69 (5): 2699-2706 ; Jiang Hl, et al. 2005. Appl Environ Microbiol. 2005, 71 (6): 2962-9; Pandey et al, 2016, Biotechnol Adv., 34, 634-662).
Par exemple, la voie de biosynthèse de la naringénine et de l'apigénine peut être celle décrite dans la Figure 1. For example, the pathway for the biosynthesis of naringenin and apigenin can be that described in Figure 1.
Dans un premier mode de réalisation, la levure comprend les enzymes nécessaires pour la synthèse de la naringénine et/ou de l'apigénine à partir de la tyrosine. In a first embodiment, the yeast comprises the enzymes necessary for the synthesis of naringenin and / or apigenin from tyrosine.
Dans un deuxième mode de réalisation, la levure comprend les enzymes nécessaires pour la synthèse de la naringénine et/ou de l'apigénine à partir de la phénylalanine. In a second embodiment, the yeast comprises the enzymes necessary for the synthesis of naringenin and / or apigenin from phenylalanine.
Dans un troisième mode de réalisation, la levure comprend les enzymes nécessaires pour la synthèse de la naringénine et/ou de l'apigénine à partir de la tyrosine et de la phénylalanine. In a third embodiment, the yeast comprises the enzymes necessary for the synthesis of naringenin and / or apigenin from tyrosine and phenylalanine.
TAL : Tyrosine ammonia lyase TAL: Tyrosine ammonia lyase
La TAL est une tyrosine ammonia lyase. Cette enzyme est capable de produire de l'acide p- coumarique à partir de la tyrosine. Cette enzyme appartient à la classe des EC 4.3.1.23. TAL is a tyrosine ammonia lyase. This enzyme is able to produce p-coumaric acid from tyrosine. This enzyme belongs to the class of EC 4.3.1.23.
Par « activité phénylalanine ammonia lyase » est entendue la transformation de la Phénylalanine en acide frans-cinnamique par une enzyme Phénylalanine ammonia lyase. Pour déterminer s'il y a une activité phénylalanine ammonia lyase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme phénylalanine ammonia lyase et de phénylalanine dans les conditions optimales (pH, température, ions...)· Après un certain temps d'incubation, l'apparition d'acide trans- cinnamique est observée en UPLC-MS en comparaison au standard attendu. By "phenylalanine ammonia lyase activity" is meant the transformation of phenylalanine into frans-cinnamic acid by an enzyme Phenylalanine ammonia lyase. To determine if there is phenylalanine ammonia lyase activity, an enzymatic test can be carried out which consists of the in vitro incubation of a mixture composed of the enzyme phenylalanine ammonia lyase and phenylalanine under optimal conditions (pH, temperature, ions ...) After a certain incubation time, l The appearance of trans-cinnamic acid is observed in UPLC-MS in comparison with the expected standard.
Une tyrosine ammonia lyase (TAL) peut présenter en outre une activité phénylalanine ammonia lyase (PAL) telle que définie ci-dessus et/ou une activité dihydroxyphénylalanine ammonia-lyase (DAL). A tyrosine ammonia lyase (TAL) can also exhibit a phenylalanine ammonia lyase (PAL) activity as defined above and / or a dihydroxyphenylalanine ammonia-lyase (DAL) activity.
La levure peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase. The yeast can therefore comprise a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase.
De préférence, cette enzyme est une enzyme produite par une bactérie du genre Rhodobacter ou une bactérie du genre Flavobacteriaceae. Dans un mode de réalisation particulier, cette enzyme est produite par une bactérie Rhodobacter capsuiatus, ou Rhodobacter sphaeroides. Dans un autre mode de réalisation particulier, cette enzyme est produite par une bactérie Flavobacterium johnsoniae. Dans un autre mode de réalisation, cette enzyme est une enzyme produite par une levure, en particulier une levure du genre Rhodotoruia, par exemple Rhodotorula glutinis. D'autres organismes produisent également une telle enzyme, par exemple Camellia sinensis, Fragaria x ananassa, Ralstonia metallidurans, ou Zea mays. Preferably, this enzyme is an enzyme produced by a bacterium of the genus Rhodobacter or a bacterium of the genus Flavobacteriaceae. In a particular embodiment, this enzyme is produced by a bacterium Rhodobacter capsuiatus, or Rhodobacter sphaeroides. In another particular embodiment, this enzyme is produced by a Flavobacterium johnsoniae bacterium. In another embodiment, this enzyme is an enzyme produced by a yeast, in particular a yeast of the genus Rhodotoruia, for example Rhodotorula glutinis. Other organisms also produce such an enzyme, for example Camellia sinensis, Fragaria x ananassa, Ralstonia metallidurans, or Zea mays.
Dans un mode de réalisation particulier, la tyrosine ammonia lyase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase. In a particular embodiment, tyrosine ammonia lyase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with one of these sequences and exhibiting tyrosine ammonia lyase activity.
Dans un mode de réalisation particulier, la TAL est de Flavobacterium johnsoniae. Elle est décrite dans la base de données Genbank de NCBI sous le numéro KR095306.1 pour la séquence nucléique et sous le numéro AKE50827.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos :40 et 39. In a particular embodiment, the TAL is from Flavobacterium johnsoniae. It is described in the Genbank database from NCBI under the number KR095306.1 for the nucleic acid sequence and under the number AKE50827.1 for the protein sequence, and more particularly in SEQ ID Nos: 40 and 39.
Dans un mode de réalisation particulièrement préféré, la TAL est de Rhodotorula glutinis. Elle est décrite dans la base de données Genbank de NCBI sous le numéro KF765779.1 pour la séquence nucléique et sous le numéro AGZ04575.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 42 et 41, respectivement. Dans un mode de réalisation particulièrement préféré, la tyrosine ammonia lyase est sélectionnée parmi l'enzyme comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase. In a particularly preferred embodiment, the TAL is from Rhodotorula glutinis. It is described in the Genbank database of NCBI under the number KF765779.1 for the nucleic sequence and under the number AGZ04575.1 for the protein sequence, and more particularly in SEQ ID Nos: 42 and 41, respectively. In a particularly preferred embodiment, the tyrosine ammonia lyase is selected from the enzyme comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity.
4CL : 4-Coumarate-CoA ligase 4CL: 4-Coumarate-CoA ligase
La 4CL est une 4-coumarate-CoA ligase. Cette enzyme est capable de produire du 4- coumaroyl-CoA à partir de l'acide p-coumarique et de Coenzyme A et de produire du caffeoyl-CoA à partir de l'acide caféique et de Coenzyme A. Cette enzyme appartient à la classe des EC 6.2.1.12. 4CL is a 4-coumarate-CoA ligase. This enzyme is able to produce 4-coumaroyl-CoA from p-coumaric acid and Coenzyme A and to produce caffeoyl-CoA from caffeic acid and Coenzyme A. This enzyme belongs to the class of EC 6.2.1.12.
Par « activité 4-coumarate CoA ligase » est entendue la transformation de l'acide p- coumarique en p-coumaroyl CoA ou de l'acide caféique en caffeoyl CoA par une enzyme 4- coumarate CoA ligase. Pour déterminer s'il y a une activité4-coumarate CoA ligase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme 4-coumarate CoA ligase, d'acide p-coumarique ou d'acide caféique, d'ATP et de CoA dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition du p-coumaroyl CoA ou du caffeoyl CoA est observée au s pectro photo mètre UV avec une longueur d'onde respectivement de 333 nm et de 346 nm en comparaison au standard attendu. By "4-coumarate CoA ligase activity" is meant the conversion of p-coumaric acid to p-coumaroyl CoA or caffeic acid to caffeoyl CoA by a 4-coumarate CoA ligase enzyme. To determine if there is 4-coumarate CoA ligase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme 4-coumarate CoA ligase, p-coumaric acid or caffeic acid, ATP and CoA under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of p-coumaroyl CoA or caffeoyl CoA is observed with a UV spectrophotometer with a wavelength of 333 nm and 346 nm respectively in comparison with the expected standard.
La levure peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une 4-coumarate-CoA ligase. The yeast can therefore comprise a heterologous nucleic acid sequence encoding a 4-coumarate-CoA ligase.
De préférence, cette enzyme est une enzyme produite par une plante, par exemple Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus, Crocus, Larix, Festuca, Glycine, Jugions, Keteleeria, Lithospermum, Lolium, Lotus, Lycopersicon, Malus, Medicago, Mesembryanthemum, Nicotiana, Nothotsuga, Oryza, Phaseolus, Pélargonium, Petroselinum, Physcomitrella, Picea, Prunus, Pseudolarix, Pseudotsuga, Rosa, Rubus, Ryza, Saccharum, Suaeda, Pinus, Populus, Solanum, Thellungiella, Triticum, Tsuga, Vitis ou Zea. De manière alternative, cette enzyme est une enzyme produite par un microorganisme, par exemple Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter ou Yarrowia. Preferably, this enzyme is an enzyme produced by a plant, for example Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus, Crocus, Larix, Festuca, Glycine, Jugions, Keteleeria, Lithospermum, Lolium, Lotus, Lycopersicon , Malus, Medicago, Mesembryanthemum, Nicotiana, Nothotsuga, Oryza, Phaseolus, Pelargonium, Petroselinum, Physcomitrella, Picea, Prunus, Pseudolarix, Pseudotsuga, Rosa, Rubus, Ryza, Saccharum, Suaeda, Pinus, Populus, Solanum, Thellicumiella, Tsugaiticum, , Vitis or Zea. Alternatively, this enzyme is an enzyme produced by a microorganism, for example Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter or Yarrowia.
Dans une mode de réalisation préféré, cette enzyme est une enzyme produite par une plante, de préférence Arabidopsis thaliana, Citrus clementina ou Petroselinum crispum, en particulier Arabidopsis thaliana ou Petroselinum crispum, ou par une bactérie, de préférence du genre Streptomyces, en particulier Streptomyces clavuligerus. In a preferred embodiment, this enzyme is an enzyme produced by a plant, preferably Arabidopsis thaliana, Citrus clementina or Petroselinum crispum, in in particular Arabidopsis thaliana or Petroselinum crispum, or by a bacterium, preferably of the genus Streptomyces, in particular Streptomyces clavuligerus.
Dans un mode de réalisation particulier, la 4-coumarate-CoA ligase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47, 49, 89 et 91 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate- CoA ligase. In a particular embodiment, the 4-coumarate-CoA ligase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 43, 45, 47, 49, 89 and 91 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity.
Dans un mode de réalisation particulier, la 4-coumarate-CoA ligase est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 43, 45, 47 et 49, de préférence SEQ ID NOs: 45 et 49, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase. In a particular embodiment, 4-coumarate-CoA ligase is an enzyme comprising a sequence selected from SEQ ID NOs: 43, 45, 47 and 49, preferably SEQ ID NOs: 45 and 49, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity.
Dans un premier mode de réalisation particulier, la 4CL est d’Arabidopsis thaliana. Elle est décrite dans la base de données Genbank de NCBI sous le numéro AY099747.1 pour la séquence nucléique et sous le numéro AAM20598.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos :44 et 43, respectivement. In a first particular embodiment, the 4CL is Arabidopsis thaliana. It is described in the Genbank database from NCBI under the number AY099747.1 for the nucleic sequence and under the number AAM20598.1 for the protein sequence, and more particularly in SEQ ID Nos: 44 and 43, respectively.
Dans un deuxième mode de réalisation particulier, la 4CL est de Petroselinum crispum. Elle est décrite dans la base de données Genbank de NCBI sous le numéro X13324.1 ou X13325.1 pour la séquence nucléique et sous le numéro CAA31696.1 ou CAA31697.1 pour la séquence protéique, respectivement. Les protéines sont décrites dans UniProtKB/Swiss Prot sous le numéro de référence P14912 et P14913, respectivement, et plus particulièrement dans les SEQ ID Nos :46 et 45, et 48 et 47, respectivement. De préférence, la 4CL est de Petroselinum crispum et est décrite dans la base de données Genbank de NCBI sous le numéro X13324.1 pour la séquence nucléique et sous le numéro CAA31696.1 pour la séquence protéique, et dans UniProtKB/Swiss Prot sous le numéro de référence P14912, et plus particulièrement dans les SEQ ID Nos :46 et 45, respectivement. In a second particular embodiment, the 4CL is from Petroselinum crispum. It is described in the NCBI Genbank database under number X13324.1 or X13325.1 for the nucleic acid sequence and under the number CAA31696.1 or CAA31697.1 for the protein sequence, respectively. The proteins are described in UniProtKB / Swiss Prot under the reference number P14912 and P14913, respectively, and more particularly in SEQ ID Nos: 46 and 45, and 48 and 47, respectively. Preferably, 4CL is from Petroselinum crispum and is described in the Genbank database of NCBI under the number X13324.1 for the nucleic sequence and under the number CAA31696.1 for the protein sequence, and in UniProtKB / Swiss Prot under the number reference number P14912, and more particularly in SEQ ID Nos: 46 and 45, respectively.
Dans un troisième mode de réalisation particulier, la 4CL est de Streptomyces clavuligerus. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CP016559.1 pour la séquence nucléique et sous le numéro ANW18832.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos :50 et 49, respectivement. Dans un quatrième mode de réalisation particulier, la 4CL est de Citrus clementina. Une séquence nucléotidique ainsi que la séquence protéique de cette enzyme sont décrites respectivement dans les SEQ ID NO : 92 et 91. In a third particular embodiment, the 4CL is from Streptomyces clavuligerus. It is described in the Genbank database of NCBI under the number CP016559.1 for the nucleic sequence and under the number ANW18832.1 for the protein sequence, and more particularly in SEQ ID Nos: 50 and 49, respectively. In a fourth particular embodiment, the 4CL is from Citrus clementina. A nucleotide sequence as well as the protein sequence of this enzyme are described respectively in SEQ ID NOs: 92 and 91.
Dans un cinquième mode de réalisation particulier, la 4CL est d’Arabidopsis thaüana et une séquence nucléotidique ainsi que la séquence protéique de cette enzyme sont décrites respectivement dans les SEQ ID NO : 90 et 89. In a fifth particular embodiment, the 4CL is Arabidopsis thaüana and a nucleotide sequence as well as the protein sequence of this enzyme are described respectively in SEQ ID NOs: 90 and 89.
Dans un mode de réalisation préféré, la 4CL est une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 45, 89 et 91, de préférence SEQ ID NOs: 89 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate- CoA ligase. De manière tout particulièrement préférée, la 4CL est une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase In a preferred embodiment, 4CL is an enzyme comprising a sequence selected from SEQ ID NOs: 45, 89 and 91, preferably SEQ ID NOs: 89 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity. Very particularly preferably, 4CL is an enzyme comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequenced and exhibiting 4-coumarate-CoA ligase activity
CHS : Chalcone synthase CHS: Chalcone synthase
La CHS est une chalcone synthase. Cette enzyme est capable de produire de la naringénine- chalcone à partir du 4-coumaroyl-CoA et de malonyl-CoA et de produire de l'ériodictyol- chalcone à partir de caffeoyl-CoA et de malonyl-CoA. Cette enzyme appartient à la classe des EC 2.3.1.74. CHS is a chalcone synthase. This enzyme is able to produce naringenin-chalcone from 4-coumaroyl-CoA and malonyl-CoA and to produce erodictyol-chalcone from caffeoyl-CoA and malonyl-CoA. This enzyme belongs to the class of EC 2.3.1.74.
Par « activité chalcone synthase » est entendue la transformation de p-coumaroyl-CoA et de malonyl-CoA en naringénine chalcone ou de caffeoyl-CoA et de malonyl-CoA en ériodictyol chalcone par une enzyme chalcone synthase. Pour déterminer s'il y a une activité chalcone synthase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme Chalcone synthase, de coumaroyl- CoA ou de caffeoyl-CoA et de malonyl-CoA dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition respectivement de la Naringénine chalcone ou de l'ériodictyol chalcone est observée en HPLC-MS en comparaison au standard attendu. By "chalcone synthase activity" is meant the transformation of p-coumaroyl-CoA and malonyl-CoA into naringenin chalcone or of caffeoyl-CoA and malonyl-CoA into eriodictyol chalcone by a chalcone synthase enzyme. To determine if there is chalcone synthase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme Chalcone synthase, coumaroyl-CoA or caffeoyl-CoA and malonyl -CoA under optimal conditions (pH, temperature, ions ...). After a certain incubation time, the appearance respectively of Naringenin chalcone or erodictyol chalcone is observed in HPLC-MS in comparison with the expected standard.
La levure comprend donc une séquence d'acide nucléique hétérologue codant pour une Chalcone synthase. Yeast therefore comprises a heterologous nucleic acid sequence encoding a Chalcone synthase.
Cette enzyme peut être une enzyme produite par une plante, notamment du genre Arabidopsis, Avena, Cosmos, Citrus, Daucus, Fagopyrum, Freesia, Glycine, Glycyrrhiza, Humulus, Hypericum, Hordeum, Juglans, Medicago, Phoseolus, Physcomitrella, Plagiochasma, Petroselinum, Pueraria, Rubus, Secale, Scutellaria, Silene, Sinapis, Spinacia, Stellaria, Triticum, Tulipa, Verbena, Vitis, ou Xanthisma, par exemple Arabidopsis thaliana, Avena sativa, Cosmos sulphureus, Citrus sinensis, Daucus carota, Fagopyrum esculentum, Freesia hybrid cultivar, Glycine max, Glycyrrhiza echinoto, Flumulus lupulus, Hypericum androsaemum, Hordeum vulgare, Juglans sp., Medicago sativa, Phaseolus vulgaris, Physcomitrella patens, Plagiochasma appendiculatum, Petroselinum crispum, Pueraria montana var. iohata, Rubus idaeus, Secale cereaie, Scutellaria baicalensis, Silene sp., Sinapis alba, Spinacia oleracea, Stellaria longipes, Triticum aestivum, Tulipa hybrid cultivar, Verbena sp., Vitis vinifera, ou Xanthisma gracile. This enzyme can be an enzyme produced by a plant, in particular of the genus Arabidopsis, Avena, Cosmos, Citrus, Daucus, Fagopyrum, Freesia, Glycine, Glycyrrhiza, Humulus, Hypericum, Hordeum, Juglans, Medicago, Phoseolus, Physcomitrella, Plagiochasma, Petroselinum, Pueraria, Rubus, Secale, Scutellaria, Silene, Sinapis, Spinacia, Stellaria, Triticum, Tulipa, Verbena, Vitis, or Xanthisma, e.g. Arabidopsis thalisma, for example Avena sativa, Cosmos sulphureus, Citrus sinensis, Daucus carota, Fagopyrum esculentum, Freesia hybrid cultivar, Glycine max, Glycyrrhiza echinoto, Flumulus lupulus, Hypericum androsaemum, Hordeum vulgare, Juglans sp., Medicago sativa, Placiculus vulgarium paticulella paticulella paticulella paticulum Petroselinum crispum, Pueraria montana var. iohata, Rubus idaeus, Secale cereaie, Scutellaria baicalensis, Silene sp., Sinapis alba, Spinacia oleracea, Stellaria longipes, Triticum aestivum, Tulipa hybrid cultivar, Verbena sp., Vitis vinifera, or Xanthisma gracile.
De préférence, cette enzyme est une enzyme produite par une plante, par exemple du genre Citrus, en particuliers Citrus sinensis, ou de Hordeum vulgare ou par une bactérie, de préférence du genre Streptomyces, en particulier Streptomyces clavuligerus. Preferably, this enzyme is an enzyme produced by a plant, for example of the genus Citrus, in particular Citrus sinensis, or of Hordeum vulgare, or by a bacterium, preferably of the genus Streptomyces, in particular Streptomyces clavuligerus.
Dans un mode de réalisation particulier, la chalcone synthase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 53 et 55 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase. In a particular embodiment, the chalcone synthase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 53 and 55 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity.
Dans un mode de réalisation particulièrement préféré, la chalcone synthase est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase. In a particularly preferred embodiment, the chalcone synthase is an enzyme comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone synthase activity.
Dans un premier mode de réalisation particulier, la CHS est de Hordeum vulgare. Elle est décrite dans la base de données Genbank de NCBI sous le numéro Y09233.1 pour la séquence nucléique et sous le numéro CAA70435.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 52 et 51, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q96562. In a first particular embodiment, the CHS is from Hordeum vulgare. It is described in the Genbank database of NCBI under the number Y09233.1 for the nucleic sequence and under the number CAA70435.1 for the protein sequence, and more particularly in SEQ ID Nos: 52 and 51, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number Q96562.
Dans un deuxième mode de réalisation particulier, la CHS est de Citrus sinensis. Elle est décrite dans la base de données Genbank de NCBI sous le numéro AB009351.1 pour la séquence nucléique et sous le numéro BAA81664.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 54 et 53, respectivement. In a second particular embodiment, the CHS is from Citrus sinensis. It is described in NCBI's Genbank database under number AB009351.1 for the nucleic acid sequence and under the number BAA81664.1 for the protein sequence, and more particularly in SEQ ID Nos: 54 and 53, respectively.
Dans un troisième mode de réalisation particulier, la CHS est de Citrus sinensis. Elle est décrite dans la base de données Genbank de NCBI sous le numéro XM_006489733.1 pour la séquence nucléique et sous le numéro XP_006489796.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 56 et 55, respectivement. In a third particular embodiment, the CHS is from Citrus sinensis. It is described in the NCBI Genbank database under the number XM_006489733.1 for the nucleic acid sequence and under the number XP_006489796.1 for the protein sequence, and more particularly in SEQ ID Nos: 56 and 55, respectively.
Dans un quatrième mode de réalisation particulier, la CHS est d e Streptomyces clavuligerus. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CP016559.1 pour la séquence nucléique et sous le numéro ANW16917.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 58 et 57, respectivement. In a fourth particular embodiment, the CHS is from Streptomyces clavuligerus. It is described in the Genbank database of NCBI under the number CP016559.1 for the nucleic acid sequence and under the number ANW16917.1 for the protein sequence, and more particularly in SEQ ID Nos: 58 and 57, respectively.
La réaction catalysée par la chalcone synthase nécessitant la présence de malonyl-CoA, la levure peut être modifiée pour augmenter la synthèse de malonyl-CoA dans la levure. Since the chalcone synthase catalyzed reaction requires the presence of malonyl-CoA, yeast can be modified to increase the synthesis of malonyl-CoA in yeast.
CHI : Chalcone isomérase CHI: Chalcone isomerase
La CHI est une chalcone isomérase. Elle est capable de produire la naringénine à partir de la Naringénine chalcone et de produire de l'eriodictyol à partir d'ériodictyol chalcone. Cette enzyme appartient à la classe des EC 5.5.1.6. CHI is a chalcone isomerase. It is able to produce naringenin from Naringenin chalcone and produce eriodictyol from eriodictyol chalcone. This enzyme belongs to the class of EC 5.5.1.6.
Par « activité Chalcone isomérase » est entendue la transformation de naringénine chalcone ou d'ériodictyol chalcone en naringénine ou ériodictyol par une enzyme chalcone isomérase. Pour déterminer s'il y a une activité Chalcone isomérase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme Chalcone isomérase, de naringénine chalcone ou d'ériodictyol chalcone dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition respectivement de la Naringénine ou de l'ériodictyol est observée en H PLC-MS en comparaison au standard attendu. By "Chalcone isomerase activity" is meant the transformation of naringenin chalcone or erodictyol chalcone into naringenin or eriodictyol by a chalcone isomerase enzyme. To determine if there is chalcone isomerase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme Chalcone isomerase, naringenin chalcone or erodictyol chalcone under optimal conditions. (pH, temperature, ions ...). After a certain incubation time, the appearance of Naringenin or erodictyol respectively is observed in H PLC-MS compared to the expected standard.
La levure comprend donc une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase. Yeast therefore comprises a heterologous nucleic acid sequence encoding a chalcone isomerase.
Cette enzyme peut provenir d'une plante, notamment du genre Arabidopsis, Ginkgo, Oncidium, Perilla, Citrus ou Trigonella, par exemple Arabidopsis thaiiana, Ginkgo biloba, Oncidium Gower Ramsey, Perilla frutescens, Citrus Sinensis ou Trigonella foenum-graecum. De préférence, cette enzyme est une enzyme produite par une plante, par exemple Arabidopsis thaiiana ou par une bactérie, de préférence du genre Streptomyces, en particulier Streptomyces clavuligerus. Dans un mode de réalisation particulier, la chalcone isomérase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase. This enzyme may come from a plant, in particular of the genus Arabidopsis, Ginkgo, Oncidium, Perilla, Citrus or Trigonella, for example Arabidopsis thaiiana, Ginkgo biloba, Oncidium Gower Ramsey, Perilla frutescens, Citrus Sinensis or Trigonella foenum-graecum. Preferably, this enzyme is an enzyme produced by a plant, for example Arabidopsis thaiiana or by a bacterium, preferably of the genus Streptomyces, in particular Streptomyces clavuligerus. In a particular embodiment, the chalcone isomerase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting chalcone isomerase activity.
Dans un mode de réalisation préféré, la chalcone isomérase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase. In a preferred embodiment, the chalcone isomerase is selected from enzymes comprising a sequence selected from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone isomerase activity.
Dans un premier mode de réalisation particulier, la CH I est de Streptomyces clavuligerus. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CP016559.1 pour la séquence nucléique et sous le numéro ANW16918.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 60 et 59, respectivement. In a first particular embodiment, the CH I is from Streptomyces clavuligerus. It is described in the Genbank database of NCBI under the number CP016559.1 for the nucleic acid sequence and under the number ANW16918.1 for the protein sequence, and more particularly in SEQ ID Nos: 60 and 59, respectively.
Dans un deuxième mode de réalisation particulier, la CHI est d’Arabidopsis thaliana. Elle est décrite dans la base de données Genbank de NCBI sous le numéro N M_115370.4 pour la séquence nucléique et sous le numéro NP_191072.1pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 62 et 61, respectivement. In a second particular embodiment, the CHI is Arabidopsis thaliana. It is described in the Genbank database of NCBI under the number N M_115370.4 for the nucleic acid sequence and under the number NP_191072.1 for the protein sequence, and more particularly in SEQ ID Nos: 62 and 61, respectively.
FNS: Flavone synthase FNS: Flavone synthase
L'apigénine peut être préparée à partir de la naringénine à l'aide d'une flavone synthase (FNS). Apigenin can be prepared from naringenin using a flavone synthase (FNS).
La levure peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une flavone synthase, en particulier une flavone synthase capable de produire de l'apigénine à partir de la naringénine et/ou une séquence d'acide hétérologue codant pour une flavone synthase, en particulier une flavone synthase capable de produire de la lutéoline à partir d'ériodictyol. The yeast can therefore comprise a heterologous nucleic acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing apigenin from naringenin and / or a heterologous acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing luteolin from erodictyol.
La FNS peut être choisie parmi celles décrites précédemment. The SNSF can be chosen from those described above.
A partir de la phénylalanine From phenylalanine
Alternativement ou en complément, la levure peut également comprendre les enzymes nécessaires pour la synthèse de l'acide p-coumarique à partir de la phénylalanine. Alternatively or in addition, the yeast can also comprise the enzymes necessary for the synthesis of p-coumaric acid from phenylalanine.
Dans ce contexte, la levure peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H). La PAL appartient à la classe des EC 4.3.1.24. Elle est capable de produire de l'acide cinnamique à partir de la phénylalanine. In this context, the yeast may further comprise a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H). PAL belongs to the class of EC 4.3.1.24. It is able to produce cinnamic acid from phenylalanine.
Par « activité phénylalanine ammonia lyase » est entendue la transformation de la Phénylalanine en acide frans-cinnamique par une enzyme Phénylalanine ammonia lyase. Pour déterminer s'il y a une activité phénylalanine ammonia lyase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme phénylalanine ammonia lyase et de phénylalanine dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide trans- cinnamique est observée en UPLC-MS en comparaison au standard attendu. By "phenylalanine ammonia lyase activity" is meant the transformation of phenylalanine into frans-cinnamic acid by an enzyme Phenylalanine ammonia lyase. To determine whether there is phenylalanine ammonia lyase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme phenylalanine ammonia lyase and phenylalanine under optimal conditions (pH, temperature , ions ...). After a certain incubation time, the appearance of trans-cinnamic acid is observed in UPLC-MS in comparison with the expected standard.
Plusieurs enzymes ont déjà été décrites dans l'art antérieur. De préférence, l'enzyme provient d'une plante, par exemple une plante du genre Arabidopsis, Agastache, Ananas, Asparagus, Brassica, Bromheadia, Bambusa, Beta, Betula, Citrus, Cucumis, Came Ilia, Capsicum, Cassia, Catharanthus, Cicer, Citrullus, Coffea, Cucurbita, Cynodon, Daucus, Dendrobium, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Lotus, Lycopersicon, Medicago, Malus, Manihot, Medicago, Mesembryanthemum, Nicotiana, Olea, Oryza, Phaseolus, Pinus, Populus, Pisum, Persea, Petroselinum, Phalaenopsis, Phyllostachys, Physcomitrella, Picea, Pyrus, Prunus, Quercus, Raphanus, Rehmannia, Rubus, Solanum, Sorghum, Sphenostylis, Stellaria, Stylosanthes, Triticum, Trifolium, Vaccinium, Vigna, Vitis, Zea, ou Zinnia. Par exemple, on peut citer celles d 'Arabidopsis thaliana ou de Petroselinum crispum. Several enzymes have already been described in the prior art. Preferably, the enzyme is from a plant, for example a plant of the genus Arabidopsis, Agastache, Ananas, Asparagus, Brassica, Bromheadia, Bambusa, Beta, Betula, Citrus, Cucumis, Came Ilia, Capsicum, Cassia, Catharanthus, Cicer , Citrullus, Coffea, Cucurbita, Cynodon, Daucus, Dendrobium, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Lycophemago, Lotus, Manago, Malembry, Medicembago , Nicotiana, Olea, Oryza, Phaseolus, Pinus, Populus, Pisum, Persea, Petroselinum, Phalaenopsis, Phyllostachys, Physcomitrella, Picea, Pyrus, Prunus, Quercus, Raphanus, Rehmannia, Rubus, Solanum, Sorghum, Sphenostylosum, Stellaria, Stellaria , Trifolium, Vaccinium, Vigna, Vitis, Zea, or Zinnia. For example, mention may be made of those of Arabidopsis thaliana or of Petroselinum crispum.
En outre, la phénylalanine ammonia lyase (PAL) peut présenter en outre une activité tyrosine ammonia lyase (TAL) et/ou une activité dihydroxyphénylalanine ammonia-lyase (DAL) telle que décrite ci-dessous. In addition, phenylalanine ammonia lyase (PAL) may further exhibit tyrosine ammonia lyase (TAL) activity and / or dihydroxyphenylalanine ammonia-lyase (DAL) activity as described below.
Dans un mode de réalisation particulier, la PAL est de Citrus sinensis. Dans un mode de réalisation particulier, la phénylalanine ammonia lyase (PAL) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase. In a particular embodiment, the PAL is from Citrus sinensis. In a particular embodiment, the phenylalanine ammonia lyase (PAL) is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity.
Dans un mode de réalisation préféré, la PAL est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 65 et 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase. De manière tout particulièrement préférée, la PAL est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité phénylalanine ammonia lyase. In a preferred embodiment, PAL is selected from enzymes comprising a sequence selected from SEQ ID NOs: 65 and 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity sequence with one of these sequences and exhibiting phenylalanine ammonia lyase activity. Very particularly preferably, PAL is selected from enzymes comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequences and exhibiting phenylalanine ammonia lyase activity.
Dans un mode de réalisation particulier, la PAL de Citrus sinensis est décrite dans la base de données Genbank de NCBI sous le numéro XM_006481431.2 pour la séquence nucléique et sous le numéro XP_006481494.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 64 et 63, respectivement. In a particular embodiment, the PAL of Citrus sinensis is described in the Genbank database of NCBI under the number XM_006481431.2 for the nucleic sequence and under the number XP_006481494.1 for the protein sequence, and more particularly in SEQs. ID Nos: 64 and 63, respectively.
Dans un autre mode de réalisation particulier, la PAL de Citrus sinensis est décrite dans la base de données Genbank de NCBI sous le numéro XM_006488000.2 pour la séquence nucléique et sous le numéro XP_006488063.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 66 et 65, respectivement. In another particular embodiment, the PAL of Citrus sinensis is described in the Genbank database of NCBI under the number XM_006488000.2 for the nucleic acid sequence and under the number XP_006488063.1 for the protein sequence, and more particularly in the SEQ ID Nos: 66 and 65, respectively.
Dans un autre mode de réalisation particulier, la PAL d’Arabidopsis thaiiana est décrite dans la base de données Genbank de NCBI sous le numéro NM_115186.4 pour la séquence nucléique et sous le numéro NP_190894.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 78 et 77, respectivement. In another particular embodiment, the PAL of Arabidopsis thaiiana is described in the Genbank database of NCBI under the number NM_115186.4 for the nucleic sequence and under the number NP_190894.1 for the protein sequence, and more particularly in SEQ ID Nos: 78 and 77, respectively.
Éventuellement, si la biosynthèse à partir de la tyrosine et de la phénylalanine est envisagée, la PAL et la TAL peuvent être remplacées ou complétées par une phénylalanine/tyrosine ammonia lyase (PTAL). La PTAL appartient à la classe des EC 4.3.1.25. Optionally, if biosynthesis from tyrosine and phenylalanine is contemplated, PAL and TAL can be replaced or supplemented with a phenylalanine / tyrosine ammonia lyase (PTAL). PTAL belongs to the class of EC 4.3.1.25.
La C4H appartient à la classe des EC 1.14.13.11. Elle est capable de produire de l'acide p- coumarique à partir de l'acide cinnamique. C4H belongs to the class of EC 1.14.13.11. It is able to produce p-coumaric acid from cinnamic acid.
Par « activité trans-cinnamate 4-monooxygénase » est entendue la transformation de l'acide trans-cinnamique en acide p-coumarique par une enzyme trans-cinnamate 4- monooxygénase (CPR dépendante). Pour déterminer s'il y a une activité trans-cinnamate 4-monooxygénase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme trans-cinnamate 4-monooxygénase, d'acide cinnamique, de NADPH, d'H+ et d'Û2 dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de 4-hydroxycinnamate (acide p- coumarique) est observée en UPLC-MS en comparaison au standard attendu. Plusieurs enzymes ont déjà été décrites dans l'art antérieur. De préférence, l'enzyme provient d'une plante, par exemple une plante du genre Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Physcomitreila, Phoseolus, Pinus, Populus, Ruta, Saccharum, Solanum, Vitis, Vigna ou Zea. By "trans-cinnamate 4-monooxygenase activity" is meant the conversion of trans-cinnamic acid to p-coumaric acid by a trans-cinnamate 4-monooxygenase (CPR dependent) enzyme. To determine if there is trans-cinnamate 4-monooxygenase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme trans-cinnamate 4-monooxygenase, cinnamic acid , NADPH, H + and O2 under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of 4-hydroxycinnamate (p-coumaric acid) is observed in UPLC-MS in comparison with the expected standard. Several enzymes have already been described in the prior art. Preferably, the enzyme is from a plant, for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Physcomitreila, Phoseolus, Pinus, Populus, Ruta, Saccharum, Solanum, Vitis, Vigna or Zea.
Dans un mode de réalisation préféré, la cinnamate 4-hydroxylase (C4H) est de Citrus sinensis ou d’Arabidopsis thaliana. In a preferred embodiment, the cinnamate 4-hydroxylase (C4H) is from Citrus sinensis or Arabidopsis thaliana.
Dans un mode de réalisation particulier, la cinnamate 4-hydroxylase (C4H) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4- hydroxylase. In a particular embodiment, the cinnamate 4-hydroxylase (C4H) is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity.
Dans un mode de réalisation préféré, la C4H est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase. In a preferred embodiment, C4H is selected from enzymes comprising a sequence selected from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cinnamate 4-hydroxylase activity.
Dans un mode de réalisation particulier, la C4H de Citrus sinensis est décrite dans la base de données Genbank de NCBI sous le numéro NM_001288840.1 pour la séquence nucléique et sous le numéro NP_001275769.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 68 et 67, respectivement. In a particular embodiment, the C4H of Citrus sinensis is described in the Genbank database of NCBI under the number NM_001288840.1 for the nucleic sequence and under the number NP_001275769.1 for the protein sequence, and more particularly in SEQ. ID Nos: 68 and 67, respectively.
Dans un autre mode de réalisation particulier, la C4H de Citrus sinensis est décrite dans la base de données Genbank de NCBI sous le numéro NM_001288895.1 pour la séquence nucléique et sous le numéro NP_001275824.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 70 et 69, respectivement. In another particular embodiment, the C4H of Citrus sinensis is described in the Genbank database of NCBI under the number NM_001288895.1 for the nucleic sequence and under the number NP_001275824.1 for the protein sequence, and more particularly in the SEQ ID Nos: 70 and 69, respectively.
Dans un autre mode de réalisation particulier, la C4H d’Arabidopsis thaliana est décrite dans la base de données Genbank de NCBI sous le numéro NM_128601.3 pour la séquence nucléique et sous le numéro NP_180607.1 pour la séquence protéique, et plus particulièrement dans les SEQ ID Nos : 80 et 79, respectivement. In another particular embodiment, the C4H of Arabidopsis thaliana is described in the Genbank database of NCBI under the number NM_128601.3 for the nucleic sequence and under the number NP_180607.1 for the protein sequence, and more particularly in SEQ ID Nos: 80 and 79, respectively.
En passant par l'acide caféique Via caffeic acid
Dans un mode de réalisation supplémentaire, la biosynthèse de l'ériodictyol peut également comprendre la synthèse de la L-DOPA (3,4-dihydroxy-L-phenylalanine) à partir de la tyrosine puis de l'acide caféique à partir de la L-DOPA (3,4-dihydroxy-L- phenylalanine). Pour cela, les enzymes suivantes sont nécessaires. Pour convertir la tyrosine en L-DOPA (3,4-dihydroxy-L-phenylalanine), deux sous-unités sont nécessaires, HpaB et HpaC. In a further embodiment, the biosynthesis of erodictyol can also comprise the synthesis of L-DOPA (3,4-dihydroxy-L-phenylalanine) from tyrosine followed by caffeic acid from L -DOPA (3,4-dihydroxy-L- phenylalanine). For this, the following enzymes are required. To convert tyrosine to L-DOPA (3,4-dihydroxy-L-phenylalanine), two subunits are needed, HpaB and HpaC.
La HpaB est une sous-unité 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB). De préférence, cette enzyme est une enzyme produite par une bactérie, de préférence Escherichia coli. HpaB is a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit. Preferably, this enzyme is an enzyme produced by a bacterium, preferably Escherichia coli.
Dans un mode de réalisation particulier, la 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase. In a particular embodiment, 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) is an enzyme comprising a sequence chosen from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting 4-hydroxyphenylacetate 3-monooxygenase activity.
Dans un mode de réalisation particulier, la HpaB est de Escherichia coli. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CAQ34705.1 pour la séquence protéique, et plus particulièrement dans la séquence SEQ ID No : 83. Une séquence nucléique codant pour cette enzyme est décrite dans la séquence SEQ ID No : 84. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence A0A140NG21. La HpaC est une sous-unité 4-hydroxyphénylacetate 3-monooxygénase réductase. La levure peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC). In a particular embodiment, the HpaB is from Escherichia coli. It is described in the Genbank database of NCBI under the number CAQ34705.1 for the protein sequence, and more particularly in the sequence SEQ ID No: 83. A nucleic sequence encoding this enzyme is described in the sequence SEQ ID No: 84. The protein is described in UniProtKB / Swiss Prot under the reference number A0A140NG21. HpaC is a 4-hydroxyphenylacetate 3-monooxygenase reductase subunit. The yeast can therefore comprise a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC) subunit.
Par « activité p-coumarate 3 hydroxylase » est entendue la transformation de l'acide p- coumarique en acide caféique et/ou de la L-tyrosine en L-Dopa en utilisant un complexe enzymatique composé de HpaB (4-hydroxyphenylacetate 3-hydroxylase oxydase) et de HpaC (4-hydroxyphenylacetate 3-hydroxylase réductase). Pour déterminer s'il y a une activité p-coumarate 3 hydroxylase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé des enzymes HpaB, HpaC, d'acide p- coumarique ou de L-Tyrosine, de FAD et de NADH dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide caféique ou de la L-Dopa est observée en HPLC-MS en comparaison au standard attendu,. By "p-coumarate 3 hydroxylase activity" is meant the conversion of p-coumaric acid to caffeic acid and / or L-tyrosine to L-Dopa using an enzyme complex composed of HpaB (4-hydroxyphenylacetate 3-hydroxylase oxidase) and HpaC (4-hydroxyphenylacetate 3-hydroxylase reductase). To determine if there is p-coumarate 3 hydroxylase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzymes HpaB, HpaC, p-coumaric acid or L- Tyrosine, FAD and NADH under optimal conditions (pH, temperature, ions ...). After a certain incubation time, the appearance of caffeic acid or L-Dopa is observed by HPLC-MS in comparison with the expected standard.
De préférence, cette enzyme est une enzyme produite par une bactérie, de préférence Escherichia coli. Preferably, this enzyme is an enzyme produced by a bacterium, preferably Escherichia coli.
Dans un mode de réalisation particulier, la 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase. In a particular embodiment, 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC) is an enzyme comprising a sequence chosen from SEQ ID NO: 89 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting 4-hydroxyphenylacetate 3-monooxygenase activity.
Dans un mode de réalisation particulier, la HpaC est de Escherichia coli. Elle est décrite dans la base de données Genbank de NCBI sous le numéro CAQ34704.1 pour la séquence protéique, et plus particulièrement dans la séquence SEQ ID No : 89. Une séquence nucléique codant pour cette enzyme est décrite dans la séquence SEQ ID No : 90. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence A0A140NG67. Ensemble, la HpaB et la HpaC sont capables de produire de la L-DOPA (3,4-dihydroxy-L- phenylalanine) à partir de la tyrosine. In a particular embodiment, the HpaC is from Escherichia coli. It is described in the Genbank database of NCBI under the number CAQ34704.1 for the protein sequence, and more particularly in the sequence SEQ ID No: 89. A nucleic sequence encoding this enzyme is described in the sequence SEQ ID No: 90. The protein is described in UniProtKB / Swiss Prot under the reference number A0A140NG67. Together, HpaB and HpaC are able to produce L-DOPA (3,4-dihydroxy-L-phenylalanine) from tyrosine.
Ainsi, la levure peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) et une séquence d'acide nucléique hétérologue codant pour 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC). Thus, the yeast can therefore comprise a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) and a heterologous nucleic acid sequence encoding 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC).
Par ailleurs, cette voie nécessite également la présence d'une enzyme capable de synthétiser l'acide caféique à partir de la L-DOPA (3,4-dihydroxy-L-phenylalanine), une dihydroxyphénylalanine ammonia-lyase (DAL). Cette enzyme appartient à la classe des EC 4.3.1.11. Moreover, this route also requires the presence of an enzyme capable of synthesizing caffeic acid from L-DOPA (3,4-dihydroxy-L-phenylalanine), a dihydroxyphenylalanine ammonia-lyase (DAL). This enzyme belongs to the class of EC 4.3.1.11.
Par « activité dihydroxyphénylalanine ammonia lyase » est entendue la transformation de la L-Dopa en acide frans-caféique par une enzyme dihydroxyphénylalanine ammonia lyase. Pour déterminer s'il y a une activité dihydroxyphénylalanine ammonia lyase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme dihydroxyphénylalanine ammonia lyase et de L-dopa (levodopa) dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide frans-caféique est observée en UPLC-MS en comparaison au standard attendu,. By "dihydroxyphenylalanine ammonia lyase activity" is meant the conversion of L-Dopa to frans-caffeic acid by a dihydroxyphenylalanine ammonia lyase enzyme. To determine if there is dihydroxyphenylalanine ammonia lyase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme dihydroxyphenylalanine ammonia lyase and L-dopa (levodopa) under the conditions optimal (pH, temperature, ions, etc.). After a certain incubation time, the appearance of frans-caffeic acid is observed in UPLC-MS in comparison to the expected standard.
En outre, la dihydroxyphénylalanine ammonia-lyase (DAL) peut présenter en outre une activité tyrosine ammonia lyase (TAL) et/ou une activité phénylalanine ammonia lyase (PAL). Further, dihydroxyphenylalanine ammonia-lyase (DAL) may additionally exhibit tyrosine ammonia lyase (TAL) activity and / or phenylalanine ammonia lyase (PAL) activity.
La levure peut ainsi comprendre une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), une séquence d'acide nucléique hétérologue codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC) et une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL).The yeast can thus comprise a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit, a heterologous nucleic acid sequence encoding a 4- subunit. hydroxyphenylacetate 3-monooxygenase reductase (HpaC) and a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL).
De manière alternative à l'utilisation des HpaB et HpaC ou en combinaison avec celles-ci, il est possible d'utiliser une enzyme permettant de convertir la tyrosine en L-Dopa et une enzyme permettant de convertir l'acide p-coumarique en acide caféique. As an alternative to the use of HpaB and HpaC or in combination with them, it is possible to use an enzyme for converting tyrosine into L-Dopa and an enzyme for converting p-coumaric acid into acid caffeic.
Il s'agit respectivement d'une 4-méthoxybenzoate O-déméthylase, également appelée 4- méthoxybenzoate monooxygénase (O-déméthylant) qui possède l'activité L-tyrosine hydroxylase appartenant à la classe des EC 1.14.99.15 et d'une p coumarate-3-hydroxylase possédant l'activité p-coumarate 3 hydroxylase appartenant à la classe des EC 1.14.13. It is respectively a 4-methoxybenzoate O-demethylase, also called 4-methoxybenzoate monooxygenase (O-demethylant) which has the L-tyrosine hydroxylase activity belonging to the class of EC 1.14.99.15 and a p coumarate -3-hydroxylase possessing p-coumarate 3 hydroxylase activity belonging to the class of EC 1.14.13.
Ces différentes enzymes font toutes deux partie de la famille des cytochrome P450 (CYP). Par « activité L-tyrosine hydroxylase » est entendue la transformation de l'acide p- coumarique en acide caféique et/ou de la L-tyrosine en L-Dopa en utilisant une enzyme p- coumarate 3 hydroxylase (CPR dépendante). Pour déterminer s'il y a une activité L-tyrosine hydroxylase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme p-coumarate 3 hydroxylase, d'acide p-coumarique ou de L-Tyrosine, les co-facteurs nécessaires dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide caféique ou de la L- Dopa est observée en HPLC-MS en comparaison au standard attendu. These different enzymes are both part of the cytochrome P450 (CYP) family. By "L-tyrosine hydroxylase activity" is meant the conversion of p-coumaric acid to caffeic acid and / or L-tyrosine to L-Dopa using a p-coumarate 3 hydroxylase (CPR dependent) enzyme. To determine if there is L-tyrosine hydroxylase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme p-coumarate 3 hydroxylase, p-coumaric acid or of L-Tyrosine, the necessary co-factors under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caffeic acid or L-Dopa is observed by HPLC-MS in comparison with the expected standard.
Par « activité p-coumarate 3 hydroxylase » est entendue la transformation de l'acide p- coumarique en acide caféique et/ou de la L-tyrosine en L-Dopa en utilisant une enzyme p- coumarate 3 hydroxylase (CPR dépendante). Pour déterminer s'il y a une activité p- coumarate 3 hydroxylase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme p-coumarate 3 hydroxylase, d'acide p-coumarique ou de L-Tyrosine, dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide caféique ou de la L- Dopa est observée en HPLC-MS en comparaison au standard attendu. By "p-coumarate 3 hydroxylase activity" is meant the conversion of p-coumaric acid to caffeic acid and / or L-tyrosine to L-Dopa using a p-coumarate 3 hydroxylase (CPR dependent) enzyme. To determine if there is p-coumarate 3 hydroxylase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme p-coumarate 3 hydroxylase, p-coumaric acid or L-Tyrosine, under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caffeic acid or L-Dopa is observed by HPLC-MS in comparison with the expected standard.
La levure recombinante peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase (CYP) capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique. The recombinant yeast can therefore comprise a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase (CYP) capable of converting tyrosine into L-Dopa and also p coumaric acid into caffeic acid.
Dans un mode de réalisation, la 4-méthoxybenzoate O-déméthylase est une enzyme de bactérie, notamment de Rhodopseudomonas palustris, Pseudomonas putida, ou Escherichia coli, de plante, notamment de Beta vuigaris, de mammifère, notamment d’Oryctolagus cuniculus, ou de champignon, notamment de Rhodotorula glutinis. Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase est une enzyme de Rhodopseudomonas palustris, de Saccharothrix espanaensis, ou de Beta vulgaris. In one embodiment, 4-methoxybenzoate O-demethylase is an enzyme from bacteria, in particular from Rhodopseudomonas palustris, Pseudomonas putida, or Escherichia coli, from plants, in particular from Beta vuigaris, from mammals, in particular Oryctolagus cuniculus, or fungus, in particular Rhodotorula glutinis. In a particular embodiment, 4-methoxybenzoate O-demethylase is an enzyme from Rhodopseudomonas palustris, Saccharothrix espanaensis, or Beta vulgaris.
Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité L-tyrosine hydrolase. In a particular embodiment, 4-methoxybenzoate O-demethylase is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 73 and 75 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydrolase activity.
La 4-méthoxybenzoate O-déméthylase peut également être de Beta vulgaris. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans dans les SEQ ID Nos : 74 et 73, respectivement. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence P0DKI2. The 4-methoxybenzoate O-demethylase can also be from Beta vulgaris. The nucleic acid sequences encoding this enzyme and protein sequences are described in SEQ ID Nos: 74 and 73, respectively. The protein is described in UniProtKB / Swiss Prot under the reference number P0DKI2.
En outre, la 4-méthoxybenzoate O-déméthylase peut être de Saccharothrix espanaensis. Les séquences nucléiques codant cette enzyme et séquences protéiques sont décrites dans NCBI sous les numéros de référence NC_005296.1 et WP_011157377.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 76 et 75. La protéine est décrite dans UniProtKB/Swiss Prot sous le numéro de référence Q6N8N2. Additionally, the 4-methoxybenzoate O-demethylase can be from Saccharothrix espanaensis. The nucleic acid sequences encoding this enzyme and protein sequences are described in NCBI under the reference numbers NC_005296.1 and WP_011157377.1, respectively, and more particularly in SEQ ID Nos: 76 and 75. The protein is described in UniProtKB / Swiss Prot under the reference number Q6N8N2.
Dans un mode de réalisation, la levure peut comprendre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase et une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL). In one embodiment, the yeast can comprise a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase and a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL).
La levure recombinante peut donc comprendre une séquence d'acide nucléique hétérologue codant pour une coumarate 3-hydroxylase (Coum3H) capable de convertir l'acide p-coumarique en acide caféique. The recombinant yeast can therefore comprise a heterologous nucleic acid sequence encoding a coumarate 3-hydroxylase (Coum3H) capable of converting p-coumaric acid into caffeic acid.
Dans un mode de réalisation, la coumarate 3-hydroxylase est une enzyme de bactérie, notamment de Saccharothrix. In one embodiment, the coumarate 3-hydroxylase is an enzyme from bacteria, especially Saccharothrix.
Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase est sélectionnée l'enzyme comprenant la séquence SEQ ID NOs: 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité coumarate 3-hydroxylase. In a particular embodiment, the 4-methoxybenzoate O-demethylase is selected the enzyme comprising the sequence SEQ ID NOs: 71 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting coumarate 3-hydroxylase activity.
La séquence nucléique codant cette enzyme et séquence protéique est décrite dans NCBI sous les numéros de référence DQ357071.1 et ABC88666.1, respectivement, et plus particulièrement dans les SEQ ID Nos : 72 et 71. Dans un mode de réalisation, la levure peut comprendre une séquence d'acide nucléique hétérologue codant pour une coumarate 3-hydroxylase et une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL). The nucleic acid sequence encoding this enzyme and protein sequence is described in NCBI under the reference numbers DQ357071.1 and ABC88666.1, respectively, and more particularly in SEQ ID Nos: 72 and 71. In one embodiment, the yeast may comprise a heterologous nucleic acid sequence encoding a coumarate 3-hydroxylase and a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL).
Combinaisons d'enzymes supplémentaires Combinations of additional enzymes
Ainsi, outre les enzymes nécessaires à la biosynthèse de l'ériodictyol et/ou la lutéoline à partir de la naringénine et/ou de l'apigénine telles que décrites précédemment, la levure comprend de préférence les enzymes permettant la production de la naringénine et/ou de l'apigénine à partir de la tyrosine et/ou de la phénylalanine, de préférence à partir de la tyrosine. Thus, in addition to the enzymes necessary for the biosynthesis of erodictyol and / or luteolin from naringenin and / or apigenin as described above, yeast preferably comprises the enzymes allowing the production of naringenin and / or or apigenin from tyrosine and / or phenylalanine, preferably from tyrosine.
Ainsi, selon des modes de réalisation particuliers, la levure comprend une séquence d'acide nucléique hétérologue codant pour une enzyme F3'H, et optionnellement une séquence d'acide nucléique hétérologue codant pour une enzyme FNS et une séquence d'acide nucléique hétérologue codant pour une enzyme CPR, et comprend en outre une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) et une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I). Dans les modes de réalisation préférés, la levure comprend également une séquence d'acide nucléique hétérologue codant pour une enzyme PAL et une séquence d'acide nucléique hétérologue codant pour une enzyme C4H. Thus, according to particular embodiments, the yeast comprises a heterologous nucleic acid sequence encoding an F3'H enzyme, and optionally a heterologous nucleic acid sequence encoding an FNS enzyme and a heterologous nucleic acid sequence encoding for a CPR enzyme, and further comprises a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL), a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), a sequence of heterologous nucleic acid encoding a chalcone synthase (CHS) and a heterologous nucleic acid sequence encoding a chalcone isomerase (CH I). In preferred embodiments, the yeast also comprises a heterologous nucleic acid sequence encoding a PAL enzyme and a heterologous nucleic acid sequence encoding a C4H enzyme.
Dans une mode de réalisation, la levure comprend In one embodiment, the yeast comprises
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) from Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 41 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity ;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; en particulier une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 89, 91, 45, 43, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 89, 91 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase, et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) from Arabidopsis thaliana, Citrus clementina, Petroselinum crispum or Streptomyces clavuligerus; in particular a 4CL comprising a sequence chosen from SEQ ID NOs: 89, 91, 45, 43, 47 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; preferably a 4CL comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; very particularly preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting a 4- coumarate-CoA ligase activity, and
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 53, 51, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone synthase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 61 and 59 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone isomerase activity; preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity .
De préférence, dans ce mode de réalisation, la levure comprend l'une des combinaisons d'enzymes F3'H, FNS et CPR décrites plus haut, en particulier : - une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7 , 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ; et Preferably, in this embodiment, the yeast comprises one of the combinations of F3′H, FNS and CPR enzymes described above, in particular: - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the '3'-monooxygenase flavonoid activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least ins 95% identity with this sequence and exhibiting the flavonoid 3'-monooxygenase activity; and
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, and more particularly preferably, a sequence chosen from SEQ ID NO: 25 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting cytochrome P450 reductase activity; and
une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, en particulier une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111 , 113, 115, 117, 119, 121, 123, 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting activity flavone synthase, in particular a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting a flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting flavone synthase activity.
De préférence, dans ce mode de réalisation, la levure comprend en outre Preferably, in this embodiment, the yeast further comprises
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase . - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting cinnamate 4-hydroxylase activity.
Dans un autre mode de réalisation, la levure comprend : In another embodiment, the yeast comprises:
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi les SEQ ID NO: 89, 91 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ces séquences et présentant une activité 4- coumarate-CoA ligase, de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase ; et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with these sequences and exhibiting a 4-coumarate-CoA ligase activity, very particularly preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and the polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting 4-coumarate-CoA ligase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisi parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone synthase activity; and a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) comprising a sequence selected from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting chalcone isomerase activity.
De préférence, dans ce mode de réalisation, la levure comprend l'une des combinaisons d'enzymes F3'H, FNS et CPR décrites plus haut, en particulier : Preferably, in this embodiment, the yeast comprises one of the combinations of F3′H, FNS and CPR enzymes described above, in particular:
- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7 , et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'- monooxygénase ; et - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the '3'-monooxygenase flavonoid activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with this sequence and exhibiting the 3'-monooxygenase flavonoid activity; and
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, and more particularly preferably, a sequence chosen from SEQ ID NO: 25 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting cytochrome P450 reductase activity; and
une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, en particulier une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111 , 113, 115, 117, 119, 121, 123, 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone activity synthase, in particular a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity.
De préférence, dans ce mode de réalisation, la levure comprend en outre Preferably, in this embodiment, the yeast further comprises
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine am monia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4- hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4- hydroxylase.Dans un autre mode de réalisation particulier, la levure comprend : - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting cinnamate 4-hydroxylase activity.In another particular embodiment, the yeast comprises:
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) capable de produire de l'acide p-coumarique à partir de la tyrosine; de préférence de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) capable of producing p-coumaric acid from tyrosine; preferably Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity ;
une séquence d'acide nucléique hétérologue codant pour une 4-coumarate-CoA ligase (4CL) capable de produire de le 4-coumaroyl-CoA à partir de l'acide p- coumarique et de Coenzyme A ; de préférence d’Arabidopsis thaliana, PetroseUnum crispum ou Streptomyces clavuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase, et de préférence une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase ; a heterologous nucleic acid sequence encoding a 4-coumarate-CoA ligase (4CL) capable of producing 4-coumaroyl-CoA from p-coumaric acid and Coenzyme A; preferably Arabidopsis thaliana, PetroseUnum crispum or Streptomyces clavuligerus; a 4CL comprising a sequence selected from SEQ ID NOs: 43, 45, 47 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a 4-coumarate-CoA ligase activity, and preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting 4-coumarate-CoA ligase activity;
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) capable de produire de la naringénine-chalcone à partir du 4-coumaroyl-CoA et de malonyl-CoA ; de préférence de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 53 et 55 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, et de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité chalcone synthase ; a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) capable of producing naringenin-chalcone from 4-coumaroyl-CoA and malonyl-CoA; preferably from Citrus sinensis, from Hordeum vulgare or from Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 53 and 55 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, and preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting chalcone synthase activity;
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) capable de produire la naringénine à partir de la naringénine chalcone ; de préférence d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CH I comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase, et de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ; a heterologous nucleic acid sequence encoding a chalcone isomerase (CH I) capable of producing naringenin from naringenin chalcone; preferably Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CH I comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting chalcone isomerase activity, and preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity;
une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, et Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7 , 9, 11, 13, 15, 17, 19 et 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'-monooxygénase, en particulier une F3'H comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7 et 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase ; a heterologous nucleic acid sequence encoding a flavonoid 3′-monooxygenase (F3′H) capable of hydroxylating in the 3 ′ position naringenin and / or apigenin; preferably Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, and Pilosella officinarum, preferably an F3′H comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 and 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a 3'-monooxygenase flavonoid activity, preferably selected from enzymes comprising a sequence chosen from SEQ ID NOs: 1, 5, 7, 11, 17 and 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a 3'-monooxygenase flavonoid activity, in particular an F3'H comprising a sequence selected from SEQ ID NOs: 5, 7 and 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d 'sequence identity with this sequence and exhibiting flavonoid 3'-monooxygenase activity, preferably an F3'H c comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 7 and exhibiting flavonoid activity 3'-monooxygenase;
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, en particulier une CPR comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité cytochrome P450 réductase ; et a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR); preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; preferably a CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with a of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, in particular a CPR comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequences and exhibiting cytochrome P450 reductase activity; and
une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline; de préférence une FNS d’Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a flavone synthase (FNS) capable of producing a flavone from a flavanone, in particular capable of converting naringenin to apigenin, and / or erodictyol to luteolin, preferably of converting erodictyol to luteolin; preferably an FNS of Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, or Zea mays, preferably of Lonicera japonica, Lonicera macranthoides, and Petroselinum crispum; preferably an FNS comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity.
Dans un autre mode de réalisation particulier, la levure comprend les séquences d'acides nucléiques hétérologues codant pour les enzymes 4CL, CFIS, CH I, F3'H, CPR, et FNS, telles que décrites dans le mode de réalisation précédent et comprend en outre : In another particular embodiment, the yeast comprises the heterologous nucleic acid sequences encoding the enzymes 4CL, CFIS, CH I, F3'H, CPR, and FNS, as described in the previous embodiment and comprises in outraged :
une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 65 et 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préféré une PAL comprenant une séquence choisie parmi SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, in particular a PAL comprising a sequence chosen from SEQ ID NOs: 65 and 77 and the polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a PAL comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase, capables de produire de l'acide p-coumarique à partir de la phénylalanine, en particulier une C4H comprenant une séquence choisie parmi SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase. a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity, capable of producing p-coumaric acid from phenylalanine, in particular a C4H comprising a sequence selected from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cinnamate 4-hydroxylase activity.
Dans un autre mode de réalisation particulier, la levure comprend les séquences d'acides nucléiques hétérologues codant pour les enzymes 4CL, CHS, CHI, F3'H, CPR, et FNS, telles que décrites dans le mode de réalisation précédent et comprend en outre : In another particular embodiment, the yeast comprises the heterologous nucleic acid sequences encoding the enzymes 4CL, CHS, CHI, F3'H, CPR, and FNS, as described in the previous embodiment and further comprises :
une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL) capable de produire de l'acide caféique à partir de la L-DOPA (3,4-dihydroxy-L-phenylalanine); a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL) capable of producing caffeic acid from L-DOPA (3,4-dihydroxy-L-phenylalanine);
une séquence d'acide nucléique hétérologue codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), de préférence comprenant une séquence choisie parmi SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC), de préférence comprenant une séquence choisie parmi SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase; ou une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydroxylase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p- coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p-coumarate 3 hydroxylase. a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit, preferably comprising a sequence selected from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase subunit ( HpaC), preferably comprising a sequence chosen from SEQ ID NO: 85 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity therewith and exhibiting an activity 4 - hydroxyphenylacetate 3-monooxygenase reductase; or a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine into L-Dopa and also p coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID NOs: 73 and 75 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydroxylase activity; or a heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 71 and polypeptides comprising a sequence having at least less 60, 70, 80, 85, 90 or 95% identity of a sequence with one of these sequences and exhibiting p-coumarate 3 hydroxylase activity.
Dans un autre mode de réalisation particulier, la levure comprend les séquences d'acides nucléiques hétérologues codant pour les enzymes 4CL, CHS, CHI, F3'H, CPR, et FNS, telles que décrites dans le mode de réalisation précédent et comprend en outre : In another particular embodiment, the yeast comprises the heterologous nucleic acid sequences encoding the enzymes 4CL, CHS, CHI, F3'H, CPR, and FNS, as described in the previous embodiment and further comprises :
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) capable de produire de l'acide p-coumarique à partir de la tyrosine; de préférence de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) capable of producing p-coumaric acid from tyrosine; preferably Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity ;
facultativement, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences, en particulier une PAL comprenant une séquence choisie parmi SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité phénylalanine ammonia lyase, et présentant une activité phénylalanine ammonia lyase, et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4- hydroxylase, capables de produire de l'acide p-coumarique à partir de la phénylalanine, en particulier une C4H comprenant une séquence choisie parmi SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase; optionally, a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence selected from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences, in particular a PAL comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequences and exhibiting phenylalanine ammonia lyase activity, and exhibiting phenylalanine ammonia lyase activity, and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting activity cinnamate 4- hydroxylase, capable of producing p-coumaric acid from phenylalanine, in particular a C4H comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cinnamate 4-hydroxylase activity;
facultativement, une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), de préférence comprenant une séquence choisie parmi SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et une séquence d'acide nucléique hétérologue codant pour une sous-unité 4-hydroxyphénylacetate 3- monooxygénase réductase (HpaC), de préférence comprenant une séquence choisie parmi SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase; ou une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydrolase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p-coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p-coumarate 3 hydroxylase ; optionally, a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit, preferably comprising a sequence selected from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70 , 80, 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase subunit reductase (HpaC), preferably comprising a sequence chosen from SEQ ID NO: 85 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the latter and exhibiting a 4-hydroxyphenylacetate 3-monooxygenase reductase activity; or a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine into L-Dopa and also p coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID NOs: 73 and 75 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydrolase activity; or a heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 71 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% identity of a sequence with one of these sequences and exhibiting p-coumarate 3 hydroxylase activity;
facultativement, une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL) capable de produire de l'acide caféique à partir de la L-DOPA (3,4-dihydroxy-L-phenylalanine). optionally, a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL) capable of producing caffeic acid from L-DOPA (3,4-dihydroxy-L-phenylalanine).
Dans un autre mode de réalisation particulier, la levure comprend : In another particular embodiment, the yeast comprises:
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity;
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4- hydroxylase ; - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting cinnamate 4-hydroxylase activity;
- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; - a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity;
- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 ou 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité 4- coumarate-CoA ligase ; - a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NO: 45 or 89 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity;
- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; - a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity in sequence with this sequence and exhibiting chalcone synthase activity;
- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ; - a heterologous nucleic acid sequence encoding a chalcone isomerase (CH I) comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting chalcone isomerase activity;
- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence a ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase ; - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity;
- une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; et - a heterologous nucleic acid sequence encoding a flavone synthase (FNS) comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting flavone synthase activity; and
- une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase. - a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity.
L'origine des enzymes ou d'un ensemble d'enzymes pourra être choisie de sorte à ce que leur origine soit la même ou soit proche. Par exemple, les enzymes ou l'ensemble d'enzymes peuvent être issues de bactéries, par exemple de bactéries du même genre ou de la même espèce. Dans un autre exemple, les enzymes ou l'ensemble d'enzymes peuvent être issues de plantes, par exemple de plantes du même genre ou de la même espèce. En effet, ces origines communes permettent que les enzymes fonctionnent entre elles de manière optimale. The origin of the enzymes or of a set of enzymes may be chosen so that their origin is the same or is close. For example, the enzymes or the set of enzymes can be derived from bacteria, for example bacteria of the same genus or of the same species. In another example, the enzymes or the set of enzymes may be derived from plants, for example plants of the same genus or of the same species. Indeed, these common origins allow the enzymes to work together optimally.
Dans un mode de réalisation, les levures comprennent une voie métabolique de biosynthèse de la tyrosine. Notamment, les levures peuvent avoir été modifiées pour avoir une production augmentée de tyrosine par rapport à une souche sauvage. Notamment, les levures peuvent avoir été modifiées pour que le flux de carbone soit redirigé vers la biosynthèse de tyrosine. En outre, les levures peuvent avoir été modifiées pour réduire ou supprimer les rétro-inhibitions de la biosynthèse de tyrosine. In one embodiment, the yeasts comprise a metabolic pathway for the biosynthesis of tyrosine. In particular, the yeasts may have been modified to have an increased production of tyrosine compared to a wild strain. In particular, the yeasts may have been modified so that the carbon flow is redirected towards the biosynthesis of tyrosine. In addition, the yeasts may have been modified to reduce or eliminate feedback inhibitions of tyrosine biosynthesis.
Dans un autre mode de réalisation, les levures comprennent une voie métabolique de biosynthèse de la phénylalanine. Notamment, les levures peuvent avoir été modifiées pour avoir une production augmentée de phénylalanine par rapport à une souche sauvage. Notamment, les levures peuvent avoir été modifiées pour que le flux de carbone soit redirigé vers la biosynthèse de phénylalanine. En outre, les levures peuvent avoir été modifiées pour réduire ou supprimer les rétro-inhibitions de la biosynthèse de phénylalanine. In another embodiment, the yeasts comprise a metabolic pathway for the biosynthesis of phenylalanine. In particular, the yeasts may have been modified to have an increased production of phenylalanine compared to a wild strain. In particular, the yeasts may have been modified so that the carbon flow is redirected towards the biosynthesis of phenylalanine. In addition, the yeasts may have been modified to reduce or eliminate feedback inhibitions of phenylalanine biosynthesis.
Dans un autre mode de réalisation, les levures comprennent une voie métabolique de biosynthèse de la phénylalanine et de la tyrosine. Notamment, les levures peuvent avoir été modifiées pour avoir une production augmentée de phénylalanine et de tyrosine par rapport à une souche sauvage. Notamment, les levures peuvent avoir été modifiées pour que le flux de carbone soit redirigé vers la biosynthèse de phénylalanine et de tyrosine. En outre, les levures peuvent avoir été modifiées pour réduire ou supprimer les rétro- inhibitions de la biosynthèse de phénylalanine et de tyrosine. In another embodiment, the yeasts comprise a metabolic pathway for the biosynthesis of phenylalanine and tyrosine. In particular, the yeasts may have been modified to have an increased production of phenylalanine and tyrosine compared to a wild strain. In particular, the yeasts may have been modified so that the carbon flow is redirected towards the biosynthesis of phenylalanine and tyrosine. In In addition, the yeasts may have been modified to reduce or eliminate feedback inhibitions of phenylalanine and tyrosine biosynthesis.
Acide nucléique recombinant et Cassette d'expression Recombinant nucleic acid and expression cassette
Chaque séquence nucléique codant pour une enzyme telle que décrite précédemment est comprise dans une cassette d'expression. De préférence, les séquences nucléiques codantes ont été optimisées pour l'expression dans la levure hôte. La séquence nucléique codante est liée de manière opérationnelle aux éléments nécessaires à l’expression du gène, notamment à la transcription et traduction. Ces éléments sont choisis de sorte à être fonctionnels dans la levure recombinante hôte. Ces éléments peuvent comporter par exemple des promoteurs de transcription, des activateurs de transcription, des séquences terminatrices, des codons d'initiation et de terminaison. Les méthodes pour sélectionner ces éléments en fonction de la cellule hôte dans laquelle l'expression est souhaitée, sont bien connues de l'homme du métier. Each nucleic acid sequence encoding an enzyme as described above is included in an expression cassette. Preferably, the coding nucleic sequences have been optimized for expression in the yeast host. The coding nucleic sequence is operably linked to the elements necessary for the expression of the gene, in particular for transcription and translation. These elements are chosen so as to be functional in the recombinant yeast host. These elements can include, for example, transcription promoters, transcription activators, terminator sequences, initiation and termination codons. The methods for selecting these elements as a function of the host cell in which expression is desired are well known to those skilled in the art.
De préférence, le promoteur est un promoteur fort. Le promoteur peut éventuellement être inductible. Preferably, the promoter is a strong promoter. The promoter can optionally be inducible.
Le promoteur peut être sélectionné parmi les promoteurs suivants : le promoteur pTDH3, le promoteur pTEFl, le promoteur pTEF2, le promoteur pCCW12, le promoteur pHHF2, le promoteur pHTB2 et le promoteur pRPL18B. Des exemples de promoteurs inductibles utilisables chez la levure sont les promoteurs tetO-2, GAL10, GAL10-CYC1, PH05. The promoter can be selected from the following promoters: the pTDH3 promoter, the pTEF1 promoter, the pTEF2 promoter, the pCCW12 promoter, the pHHF2 promoter, the pHTB2 promoter and the pRPL18B promoter. Examples of inducible promoters which can be used in yeast are the tetO-2, GAL10, GAL10-CYC1, PH05 promoters.
Toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ou une combinaison de certaines de celles-ci peuvent être comprises dans un vecteur d'expression commun ou dans différents vecteurs d'expression. All or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described or a combination of some of these can be included in a common expression vector or in different expression vectors.
La présente invention est donc relative à un vecteur comprenant une séquence d'acide nucléique codant pour une F3'H et au moins une séquence d'acide nucléique choisie parmi :une séquence d'acide nucléique codant pour une CPR, une séquence d'acide nucléique codant pour une FNS, une séquence d'acide nucléique codant pour une TAL, une séquence d'acide nucléique codant pour une 4CL, une séquence d'acide nucléique codant pour une CHS, une séquence d'acide nucléique codant pour une CHI, une séquence d'acide nucléique codant pour une PAL, une séquence d'acide nucléique codant pour une C4H, une séquence d'acide nucléique codant pour une HpaB, et une séquence d'acide nucléique codant pour une DAL, chacune de ces enzymes étant telles que définies ci-dessus. De préférence, le vecteur comprend une séquence d'acide nucléique codant pour une F3'H et au moins une séquence d'acide nucléique choisie parmi :une séquence d'acide nucléique codant pour une CPR, une séquence d'acide nucléique codant pour une FNS, une séquence d'acide nucléique codant pour une TAL, une séquence d'acide nucléique codant pour une 4CL, une séquence d'acide nucléique codant pour une CFIS, une séquence d'acide nucléique codant pour une CH I, et optionnellement une séquence d'acide nucléique codant pour une PAL et une séquence d'acide nucléique codant pour une C4H. The present invention therefore relates to a vector comprising a nucleic acid sequence encoding an F3′H and at least one nucleic acid sequence chosen from: a nucleic acid sequence encoding a CPR, an acid sequence nucleic acid encoding an FNS, a nucleic acid sequence encoding a TAL, a nucleic acid sequence encoding a 4CL, a nucleic acid sequence encoding a CHS, a nucleic acid sequence encoding a CHI, a nucleic acid sequence encoding a PAL, a nucleic acid sequence encoding a C4H, a nucleic acid sequence encoding an HpaB, and a nucleic acid sequence encoding a DAL, each of these enzymes being as defined above. Preferably, the vector comprises a nucleic acid sequence encoding an F3'H and at least one nucleic acid sequence chosen from: a nucleic acid sequence encoding a CPR, a nucleic acid sequence encoding a FNS, a nucleic acid sequence encoding a TAL, a nucleic acid sequence encoding a 4CL, a nucleic acid sequence encoding a CFIS, a nucleic acid sequence encoding a CH I, and optionally a Nucleic acid sequence encoding a PAL and a nucleic acid sequence encoding a C4H.
Selon un mode de réalisation, le vecteur comprend According to one embodiment, the vector comprises
une séquence d'acide nucléique codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; en particulier capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine ; de préférence de Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum, en particulier Perilla frutescens var. crispa, Pétunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis ou Pilosella officinarum, de préférence une F3'H comprenant une séquence choisie parmi SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'- monooxygénase, de préférence sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 1, 5, 7, 11, 17 et 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavonoïde 3'- monooxygénase, en particulier une F3'H comprenant une séquence sélectionnée parmi les SEQ ID NOs: 5, 7, 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavonoïde 3'-monooxygénase ; a nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin; in particular capable of hydroxylating naringenin and / or apigenin in the 3 'position; preferably Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis or Pilosella officinarum, in particular Perilla frutescens var. crispa, Petunia x hybrida, Callistephus chinensis, Gerbera hybrida, Citrus sinensis or Pilosella officinarum, preferably an F3'H comprising a sequence chosen from SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 17 , 19 and 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 3'-monooxygenase flavonoid activity, preferably selected from among enzymes comprising a sequence selected from SEQ ID NOs: 1, 5, 7, 11, 17 and 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and having a flavonoid 3'-monooxygenase activity, in particular an F3'H comprising a sequence selected from SEQ ID NOs: 5, 7, 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting 3'-monooxygenase flavonoid activity ;
et au moins une séquence d'acide nucléique choisie parmi : and at least one nucleic acid sequence chosen from:
o une séquence d'acide nucléique codant pour une cytochrome P450 réductase ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23 et 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ; o a nucleic acid sequence encoding a cytochrome P450 reductase; preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; of preferably a CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23 and 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequenced with one of these sequences and exhibiting cytochrome P450 reductase activity;
une séquence d'acide nucléique codant pour une flavone synthase (FNS), en particulier capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline ; de préférence une FNS d’Arabidopsis thaüana, Petroselinum crispum, Zea mays, Lonicera japonica, Lonicera macranthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cordunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum , Antirrhinum majus, Perillafrutescens var crispa, Dahlia pinnata ou Erythranthe lewisii, en particulier d’Arabidopsis thaliana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum ; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 et 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 33, 35 et 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase ; de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), en particulier capable de produire de l'acide p-coumarique à partir de la tyrosine; de préférence de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a nucleic acid sequence encoding a flavone synthase (FNS), in particular capable of producing a flavone from a flavanone, in particular capable of transforming naringenin into apigenin, and / or erodictyol into luteolin, preferably convert erodictyol to luteolin; preferably an SNF of Arabidopsis thaüana, Petroselinum crispum, Zea mays, Lonicera japonica, Lonicera macranthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium cordaraculus, Camellia varymensis Saussurea medusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perillafrutescens var crispa, Dahlia pinnata or Erythranthe lewisii, in particular of Arabidopsis thaliana, Lonicera japonica, Lonicera Oulelinumustruncula, Medicrosodesulelinumustruncula, Medicagodesulelinum deluncula, Medicagodesulelinus deluncula, Lonicera japonicum, or Zea mays, preferably from Lonicera japonica, Lonicera macranthoides, and Petroselinum crispum; preferably an FNS comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably from enzymes comprising a sequence selected from SEQ ID NOs: 33, 35 and 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity; preferably a flavone synthase (FNS) comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity; a nucleic acid sequence encoding a tyrosine ammonia lyase (TAL), in particular capable of producing p-coumaric acid from tyrosine; preferably Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity ;
une séquence d'acide nucléique codant pour une 4-coumarate-CoA ligase (4CL), en particulier capable de produire le 4-coumaroyl-CoA à partir de l'acide p-coumarique et de Coenzyme A et le caffeoyl-CoA à partir d'acide caféique et de Coenzyme A; de préférence d’Arabidopsis thaliana, PetroseUnum crispum ou Streptomyces clavuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 45, 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; a nucleic acid sequence encoding a 4-coumarate-CoA ligase (4CL), in particular capable of producing 4-coumaroyl-CoA from p-coumaric acid and Coenzyme A and caffeoyl-CoA from caffeic acid and Coenzyme A; preferably Arabidopsis thaliana, PetroseUnum crispum or Streptomyces clavuligerus; a 4CL comprising a sequence chosen from SEQ ID NOs: 43, 45, 47 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; preferably an enzyme comprising a sequence selected from SEQ ID NOs: 45, 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity;
une séquence d'acide nucléique codant pour une chalcone synthase (CHS), en particulier capable de produire de la naringénine-chalcone à partir du 4- coumaroyl-CoA et de malonyl-CoA et de l'ériodictyol-chalcone à partir de caffeoyl-CoA et de malonyl-CoA; de préférence de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 53 et 55 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase ; de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité chalcone synthase; a nucleic acid sequence encoding a chalcone synthase (CHS), in particular capable of producing naringenin-chalcone from 4-coumaroyl-CoA and malonyl-CoA and erodictyol-chalcone from caffeoyl- CoA and malonyl-CoA; preferably from Citrus sinensis, from Hordeum vulgare or from Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a chalcone synthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 53 and 55 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity; preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequences and exhibiting chalcone synthase activity;
une séquence d'acide nucléique codant pour une chalcone isomérase (CHI), en particulier capable de produire la naringénine à partir de la naringénine chalcone et de l'ériodictyol à partir de l'ériodictyol-chalcone ; de préférence d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; a nucleic acid sequence encoding a chalcone isomerase (CHI), in particular capable of producing naringenin from naringenin chalcone and erodictyol from erodictyol-chalcone; preferably Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity in sequence with one of these sequences and exhibiting chalcone isomerase activity;
une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), en particulier capable de produire de l'acide cinnamique à partir de la phénylalanine, de préférence une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase ; a nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular capable of producing cinnamic acid from phenylalanine, preferably a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity;
une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H), en particulier capable de produire de l'acide p-coumarique à partir de l'acide cinnamique, de préférence une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4- hydroxylase ; a nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular capable of producing p-coumaric acid from cinnamic acid, preferably a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity;
o une séquence d'acide nucléique codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), de préférence comprenant une séquence choisie parmi SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et une séquence d'acide nucléique codant pour une sous-unité 4-hydroxyphénylacetate 3- monooxygénase réductase (HpaC), de préférence comprenant une séquence choisie parmi SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase réductase; ou une séquence d'acide nucléique codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydrolase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p-coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p-coumarate 3 hydroxylase, et o a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit, preferably comprising a sequence chosen from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC) subunit ), preferably comprising a sequence chosen from SEQ ID NO: 85 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity therewith and exhibiting 4- activity hydroxyphenylacetate 3-monooxygenase reductase; or a nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine into L-Dopa and also p coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID NOs: 73 and 75 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydrolase activity; or a heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 71 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% identity of a sequence with one of these sequences and exhibiting p-coumarate 3 hydroxylase activity, and
o une séquence d'acide nucléique codant pour une dihydroxyphénylalanine ammonia-lyase (DAL). o a nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL).
Dans un mode de réalisation préféré, le vecteur comprend In a preferred embodiment, the vector comprises
- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'-monooxygénase ; et - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95 % identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides comprising a sequence having at least at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with this sequence and exhibiting the flavonoid 3'-monooxygenase activity; and
et au moins une séquence d'acide nucléique choisie parmi : and at least one nucleic acid sequence chosen from:
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi la SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 et 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, et en particulier une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; et a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting activity flavone synthase, and in particular a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity; and
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) from Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 41 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity ;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; en particulier une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 89, 91, 45, 43, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 89, 91 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase, et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) from Arabidopsis thaliana, Citrus clementina, Petroselinum crispum or Streptomyces clavuligerus; in particular a 4CL comprising a sequence chosen from SEQ ID NOs: 89, 91, 45, 43, 47 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; preferably a 4CL comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; very particularly preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting a 4- coumarate-CoA ligase activity, and
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides com prenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 53, 51, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting chalcone synthase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 61 and 59 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone isomerase activity; preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity .
De préférence, le vecteur comprend chacune de ces séquences. Preferably, the vector comprises each of these sequences.
Optionnellement, dans ce mode de réalisation, le vecteur peut comprendre en outre Optionally, in this embodiment, the vector may further comprise
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase . Dans un autre mode de réalisation préféré, le vecteur comprend : - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting cinnamate 4-hydroxylase activity. In another preferred embodiment, the vector comprises:
- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7 , 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'-monooxygénase ; - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the '3'-monooxygenase flavonoid activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least ins 95% identity with this sequence and exhibiting the flavonoid 3'-monooxygenase activity;
et au moins une séquence d'acide nucléique choisie parmi : and at least one nucleic acid sequence chosen from:
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity sequenced with this sequence and exhibiting tyrosine ammonia lyase activity;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi les SEQ ID NO: 89, 91 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec ces séquences et présentant une activité 4- coumarate-CoA ligase ; et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with these sequences and exhibiting 4-coumarate-CoA ligase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ; une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi la SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 et 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, et en particulier une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone synthase activity; and a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) comprising a sequence selected from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting chalcone isomerase activity; a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting activity flavone synthase, and in particular a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity.
De préférence, dans ce mode de réalisation, la séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprend une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase Preferably, in this embodiment, the heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprises a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting 4-coumarate-CoA ligase activity
De préférence, dans ce mode de réalisation, le vecteur comprend en outre Preferably, in this embodiment, the vector further comprises
une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence selected from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hydroxylase. a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting cinnamate 4-hydroxylase activity.
Dans un mode de réalisation particulier, le vecteur comprend In a particular embodiment, the vector comprises
une séquence d'acide nucléique codant pour une flavonoïde 3'-monooxygénase (F3'H), en particulier capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; et une séquence d'acide nucléique codant pour une cytochrome P450 réductase ; ou a nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H), in particular capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin; and a nucleic acid sequence encoding a cytochrome P450 reductase; or
une séquence d'acide nucléique codant pour une flavonoïde 3'-monooxygénase (F3'H), en particulier capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine ; une séquence d'acide nucléique codant pour une cytochrome P450 réductase ; et une séquence d'acide nucléique codant pour une flavone synthase, en particulier une flavone synthase capable de produire la lutéoline à partir de l'ériodictyol. a nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H), in particular capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin; a nucleic acid sequence encoding a cytochrome P450 reductase; and a nucleic acid sequence encoding a flavone synthase, in particular a flavone synthase capable of producing luteolin from erodictyol.
Dans un mode de réalisation particulier, elle est relative à un vecteur comprenant les trois séquences nucléiques. Les séquences nucléiques codantes et les séquences des enzymes sont telles que décrites ci-dessus. Par comprendre une séquence d'acide nucléique est également entendu comprendre une cassette d'expression comprenant la séquence d'acide nucléique. Le vecteur peut ainsi comprendre plusieurs séquences d'acide nucléique choisies parmi celles-ci, notamment 1, 2, 3, 4, 5, 6, 1 , 8, 9 ou 10 séquences d'acide nucléique choisies parmi celles-ci. In a particular embodiment, it relates to a vector comprising the three nucleic acid sequences. The coding nucleic sequences and the sequences of the enzymes are as described above. By comprising a nucleic acid sequence is also understood to include an expression cassette comprising the nucleic acid sequence. The vector can thus comprise several nucleic acid sequences chosen from among them, in particular 1, 2, 3, 4, 5, 6, 1, 8, 9 or 10 nucleic acid sequences chosen from among them.
Le vecteur peut notamment comprendre des combinaisons de séquences codantes particulières telles que décrites ci-dessus. The vector can in particular comprise combinations of particular coding sequences as described above.
Les vecteurs comprennent des séquences codantes hétérologues dans la mesure où les séquences codantes peuvent être optimisées pour la levure hôte, être sous le contrôle de promoteur hétérologue et/ou peuvent combiner des séquences codantes qui ne proviennent pas du même organisme d'origine et/ou qui ne sont pas présentes dans le même arrangement. The vectors include heterologous coding sequences as long as the coding sequences can be optimized for the yeast host, be under the control of a heterologous promoter and / or can combine coding sequences which are not from the same organism of origin and / or which are not present in the same arrangement.
Le vecteur peut être toute séquence d’ADN dans laquelle il est possible d’insérer des acides nucléiques étrangers, les vecteurs permettant d’introduire de l’ADN étranger dans la levure hôte. Le vecteur peut être par exemple un plasmide, un phagemide, un cosmide, un chromosome artificiel, notamment un YAC, ou un BAC. The vector can be any DNA sequence into which it is possible to insert foreign nucleic acids, the vectors allowing the introduction of foreign DNA into the yeast host. The vector can be for example a plasmid, a phagemid, a cosmid, an artificial chromosome, in particular a YAC, or a BAC.
Les vecteurs d'expression peuvent comprendre des séquences nucléiques codant pour des marqueurs de sélection. Les marqueurs de sélection peuvent être des gènes de résistance à un ou plusieurs antibiotiques ou des gènes d'auxotrophie. Le gène d'auxotrophie peut par exemple être HIS5, URA3, LEU2 ou TRP1. Le gène de résistance aux antibiotiques peut par exemple être de préférence un gène de résistance à l'ampicilline, au chloramphénicol, à la spectinomycine, à la streptomycine, à la kanamycine, à l'hygromycine, à la généticine, à la fluoroacétamide, au fluorocitrate, à la phléomycine, à l'amphotéricine-B et/ou la nourséothricine. Expression vectors can include nucleic acid sequences encoding selection markers. The selection markers can be genes for resistance to one or more antibiotics or genes for auxotrophy. The auxotrophy gene can for example be HIS5, URA3, LEU2 or TRP1. The antibiotic resistance gene may for example preferably be a resistance gene to ampicillin, chloramphenicol, spectinomycin, streptomycin, kanamycin, hygromycin, geneticin, fluoroacetamide, fluorocitrate, phleomycin, amphotericin-B and / or nureseothricin.
L’introduction de vecteurs dans une levure hôte est un procédé largement connu de l’homme du métier. Plusieurs méthodes sont notamment décrites dans « Current Protocols in Molecular Biology», 13.7.1-13.7.10; ou encore dans Ellis T. et al., Intégrative Biology, 2011, 3(2), 109- 118. The introduction of vectors into a yeast host is a method widely known to those skilled in the art. Several methods are described in particular in “Current Protocols in Molecular Biology”, 13.7.1-13.7.10; or in Ellis T. et al., Integrative Biology, 2011, 3 (2), 109-118.
La levure hôte peut être transformée/transfectée de manière transitoire ou stable et l'acide nucléique, la cassette ou le vecteur peut être contenu dans celui-ci sous forme d'épisome ou sous forme intégré dans le génome de la levure hôte. The yeast host can be transiently or stably transformed / transfected and the nucleic acid, cassette or vector can be contained therein as an episome or as integrated into the genome of the yeast host.
Le vecteur d'expression peut également comprendre une ou plusieurs séquences permettant l'insertion ciblée du vecteur, de la cassette d'expression ou de l'acide nucléique dans le génome de la levure hôte. Toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ci-dessus ou une combinaison de certaines de celles-ci peuvent être insérées dans le/un chromosome de la levure recombinante. The expression vector can also comprise one or more sequences allowing the targeted insertion of the vector, of the expression cassette or of the nucleic acid into the genome of the yeast host. All or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described above or a combination of some of these can be inserted into the / a chromosome of the recombinant yeast.
A contrario, toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ou une combinaison de certaines de celles-ci peuvent être conservées sous forme épisomale, notamment sous forme de plasmide. Conversely, all or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described or a combination of some of these can be preserved in episomal form, in particular in the form of a plasmid.
Eventuellement, la levure peut comprendre plusieurs copies de séquences nucléiques codant pour une enzyme telle que décrite précédemment. Notamment, il peut comprendre 2 à 10 copies, par exemple 2, 3, 4, 5, 6, 7, 8, 9 ou 10 copies d'une séquence nucléique codant pour une enzyme telle que décrite précédemment. Optionally, the yeast can comprise several copies of nucleic acid sequences encoding an enzyme as described above. In particular, it can comprise 2 to 10 copies, for example 2, 3, 4, 5, 6, 7, 8, 9 or 10 copies of a nucleic acid sequence encoding an enzyme as described above.
La présente invention est relative à une méthode de préparation d'une levure selon la présente invention comprenant l'introduction d'un vecteur tel que défini précédemment dans la levure et la sélection des levures comprenant ledit vecteur. Elle est aussi relative à une méthode de préparation d'une levure selon la présente invention comprenant l'introduction d'une séquence d'acide nucléique codant pour une séquence d'acide nucléique codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine dans la levure et la sélection des levures comprenant lesdites séquences nucléiques. La méthode peut comprendre en outre l'introduction une ou plusieurs séquences d'acide nucléique choisies parmi : The present invention relates to a method for preparing a yeast according to the present invention comprising the introduction of a vector as defined above into the yeast and the selection of the yeasts comprising said vector. It also relates to a method for preparing a yeast according to the present invention comprising the introduction of a nucleic acid sequence encoding a nucleic acid sequence encoding a flavonoid 3′-monooxygenase (F3′H) capable of adding a hydroxyl in the 3 'position of naringenin and / or apigenin in yeast and the selection of yeasts comprising said nucleic sequences. The method can further comprise the introduction of one or more nucleic acid sequences chosen from:
une séquence d'acide nucléique codant pour une cytochrome P450 réductase ; de préférence une CPR de Saccharomyces cerevisiae, ou de plante, par exemple de Catharanthus roseus ou d’Arabidopsis thaliana ; de préférence une CPR comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase ; une séquence d'acide nucléique codant pour une flavone synthase (FNS), en particulier capable de produire une flavone à partir d'une flavanone, en particulier capable de transformer la naringénine en apigénine, et/ou l'ériodictyol en lutéoline, de préférence de transformer l'ériodictyol en lutéoline ; de préférence une FNS d’Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, ou Zea mays, de préférence de Lonicera japonica, Lonicera macranthoides, et Petroselinum crispum; de préférence une FNS comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; a nucleic acid sequence encoding a cytochrome P450 reductase; preferably a CPR of Saccharomyces cerevisiae, or of a plant, for example of Catharanthus roseus or of Arabidopsis thaliana; preferably a CPR comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with a of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity; a nucleic acid sequence encoding a flavone synthase (FNS), in particular capable of producing a flavone from a flavanone, in particular capable of converting naringenin to apigenin, and / or erodictyol to luteolin, preferably of converting erodictyol to luteolin; preferably an FNS of Arabidopsis thaüana, Lonicera japonica, Lonicera macranthoides, Medicago truncatula, Oryza sativa, Petroselinum crispum, Populus deltoïdes, or Zea mays, preferably of Lonicera japonica, Lonicera macranthoides, and Petroselinum crispum; preferably an FNS comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity;
une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), en particulier capable de produire de l'acide p-coumarique à partir de la tyrosine; de préférence de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 39 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a nucleic acid sequence encoding a tyrosine ammonia lyase (TAL), in particular capable of producing p-coumaric acid from tyrosine; preferably Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 39 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity ;
une séquence d'acide nucléique codant pour une 4-coumarate-CoA ligase (4CL), en particulier capable de produire du 4-coumaroyl-CoA à partir de l'acide p- coumarique et de Coenzyme A et/ou du caffeoyl-CoA à partir de l'acide caféique et de Coenzyme A; de préférence d’Arabidopsis thaliana, Petroselinum crispum ou Streptomyces clavuligerus ; une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 43, 45, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 45, 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4- coumarate-CoA ligase ; a nucleic acid sequence encoding a 4-coumarate-CoA ligase (4CL), in particular capable of producing 4-coumaroyl-CoA from p-coumaric acid and Coenzyme A and / or caffeoyl-CoA from caffeic acid and Coenzyme A; preferably Arabidopsis thaliana, Petroselinum crispum or Streptomyces clavuligerus; a 4CL comprising a sequence chosen from SEQ ID NOs: 43, 45, 47 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; preferably an enzyme comprising a sequence selected from SEQ ID NOs: 45, 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity;
une séquence d'acide nucléique codant pour une chalcone synthase (CHS), en particulier capable de produire de la naringénine-chalcone à partir du 4-coumaroyl- CoA et de malonyl-CoA et/ou de l'ériodictyol-chalcone à partir de caffeoyl-CoA et de malonyl-CoA ; de préférence de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 51, 53, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalconesynthase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 53 et 55 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase ; de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquences et présentant une activité chalcone synthase; a nucleic acid sequence encoding a chalcone synthase (CHS), in particular capable of producing naringenin-chalcone from 4-coumaroyl-CoA and malonyl-CoA and / or erodictyol-chalcone from caffeoyl-CoA and malonyl-CoA; preferably from Citrus sinensis, from Hordeum vulgare or from Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 51, 53, 55 and 57 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting chalconesynthase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NOs: 53 and 55 and polypeptides comprising a sequence having at least 60, 70 , 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity; preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequences and exhibiting chalcone synthase activity;
une séquence d'acide nucléique codant pour une chalcone isomérase (CHI), en particulier capable de produire la naringénine à partir de la naringénine chalcone et/ou de l'ériodictyol à partir de l'ériodictyol chalcone ; de préférence d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 59 et 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; a nucleic acid sequence encoding a chalcone isomerase (CHI), in particular capable of producing naringenin from naringenin chalcone and / or erodictyol from erodictyol chalcone; preferably Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 59 and 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity in sequence with one of these sequences and exhibiting chalcone isomerase activity;
une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), en particulier capable de produire de l'acide cinnamique à partir de la phénylalanine, de préférence une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65, 77 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, ; a nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular capable of producing cinnamic acid from phenylalanine, preferably a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65, 77 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting phenylalanine ammonia lyase activity;
une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H), en particulier capable de produire de l'acide p-coumarique à partir de l'acide cinnamique, de préférence une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; a nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular capable of producing p-coumaric acid from the acid cinnamic, preferably a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequenced and exhibiting cinnamate 4-hydroxylase activity;
une séquence d'acide nucléique codant pour une sous-unité 4- hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB), de préférence comprenant une séquence choisie parmi SEQ ID NO: 83 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et une séquence d'acide nucléique codant pour une sous-unité 4-hydroxyphénylacetate 3-monooxygénase réductase (HpaC), de préférence comprenant une séquence choisie parmi SEQ ID NO: 85 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec celle-ci et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase; ou une séquence d'acide nucléique codant pour une 4-méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydrolase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p- coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p-coumarate 3 hydroxylase. a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) subunit, preferably comprising a sequence chosen from SEQ ID NO: 83 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC) subunit , preferably comprising a sequence chosen from SEQ ID NO: 85 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity therewith and exhibiting 4-hydroxyphenylacetate activity 3-monooxygenase reductase; or a nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine into L-Dopa and also p coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID NOs: 73 and 75 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydrolase activity; or a heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 71 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% identity of a sequence with one of these sequences and exhibiting p-coumarate 3 hydroxylase activity.
une séquence d'acide nucléique hétérologue codant pour une dihydroxyphénylalanine ammonia-lyase (DAL). a heterologous nucleic acid sequence encoding a dihydroxyphenylalanine ammonia-lyase (DAL).
De préférence, la méthode comprend l'introduction de combinaisons de séquences codantes particulières telles que décrites ci-dessus. Preferably, the method comprises the introduction of combinations of particular coding sequences as described above.
Selon un mode de réalisation préféré, la méthode comprend l'introduction : - d'une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) capable d'hydroxyler en position 3' la naringénine et/ou l'apigénine et comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7 , 11, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence une enzyme comprenant une séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase, et de manière tout particulièrement préférée une enzyme comprenant une séquence sélectionnée parmi la SEQ ID NO: 7, et les polypeptides comprenant une séquence ayant au moins 75%, au moins 80%, au moins 85%, au moins 90% ou au moins 95% d'identité avec cette séquence et présentant l'activité flavonoïde 3'-monooxygénase ; et According to a preferred embodiment, the method comprises the introduction: - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of hydroxylating naringenin and / or apigenin in position 3 'and comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85 %, at least 90% or at least 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, and very particularly preferably an enzyme comprising a sequence selected from SEQ ID NO: 7, and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least less 95% identity with this sequence and exhibiting the flavonoid 3'-monooxygenase activity; and
et d'au moins une séquence d'acide nucléique choisie parmi : and at least one nucleic acid sequence chosen from:
une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) et comprenant une séquence choisie parmi SEQ ID NOs: 23, 25, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi la SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase ; et une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, et en particulier une flavone synthase (FNS) et comprenant une séquence choisie parmi SEQ ID NOs: 33, 35, 37 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; et a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) and comprising a sequence chosen from SEQ ID NOs: 23, 25, 27, 29 and 31 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity; and a heterologous nucleic acid sequence encoding a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting activity flavone synthase, and in particular a flavone synthase (FNS) and comprising a sequence chosen from SEQ ID NOs: 33, 35, 37 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably a flavone synthase (FNS) comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone activity synthase; and
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) from Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 41 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity ;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; en particulier une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 89, 91, 45, 43, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 89, 91 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4- coumarate-CoA ligase, et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) from Arabidopsis thaliana, Citrus clementina, Petroselinum crispum or Streptomyces clavuligerus; in particular a 4CL comprising a sequence chosen from SEQ ID NOs: 89, 91, 45, 43, 47 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; preferably a 4CL comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; very particularly preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting a 4- coumarate-CoA ligase activity, and
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 53, 51, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting a chalcone synthase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 61 and 59 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone isomerase activity; preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity .
De préférence, la méthode comprend l'introduction de toutes ces séquences. Preferably, the method comprises the introduction of all of these sequences.
De préférence, la méthode comprend en outre l'introduction : Preferably, the method further comprises introducing:
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4-hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4-hyd roxylase. - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cinnamate 4-hyd roxylase activity.
Production de l'ériodictyol et/ou de la lutéoline Production of erodictyol and / or luteolin
La présente invention est relative à l'utilisation d'une levure selon la présente invention pour la production de l'ériodictyol et/ou de la lutéoline. Dans un premier mode de réalisation préféré, elle est relative à l'utilisation d'une levure selon la présente invention pour la production de l'ériodictyol. Dans un deuxième mode de réalisation préféré, elle est relative à l'utilisation d'une levure selon la présente invention pour la production de la lutéoline. Dans un mode de réalisation préféré, elle est relative à l'utilisation d'une levure selon la présente invention pour la production de l'ériodictyol et de la lutéoline. The present invention relates to the use of a yeast according to the present invention for the production of erodictyol and / or luteolin. In a first preferred embodiment, it relates to the use of a yeast according to the present invention for the production of erodictyol. In a second preferred embodiment, it relates to the use of a yeast according to the present invention for the production of luteolin. In a preferred embodiment, it relates to the use of a yeast according to the present invention for the production of erodictyol and luteolin.
La présente invention est également relative à une méthode de production de l'ériodictyol et/ou de la lutéoline comprenant la mise en culture d'une levure selon la présente invention, notamment dans des conditions permettant ou favorables à la production de l'ériodictyol et/ou de la lutéoline et éventuellement la récupération et/ou purification de l'ériodictyol et/ou de la lutéoline produite. The present invention also relates to a method for producing erodictyol and / or luteolin comprising the cultivation of a yeast according to the present invention, in particular under conditions allowing or favorable to the production of erodictyol and / or luteolin and optionally the recovery and / or purification of the erodictyol and / or of the luteolin produced.
L'ériodictyol et/ou la lutéoline peuvent être soit le produit final soit un intermédiaire de synthèse ou de biosynthèse pour la préparation d'autres produits. Eriodictyol and / or luteolin can be either the final product or a synthetic or biosynthetic intermediate for the preparation of other products.
Les conditions de culture de la levure selon l’invention peuvent être adaptées selon les techniques classiques, bien connues de l’homme du métier. The conditions for cultivating the yeast according to the invention can be adapted according to conventional techniques, well known to those skilled in the art.
La levure est cultivée dans un milieu de culture approprié. Le terme « milieu de culture approprié » désigne d'une manière générale un milieu de culture apportant les nutriments essentiels ou bénéfiques à la maintenance et/ou à la croissance de ladite levure, tels que les sources carbonées ; les sources azotées telles que le sulfate d'ammonium ; les sources de phosphores, par exemple, le potassium phosphate monobasique ; les oligo-éléments, par exemple, les sels de cuivre, d'iodure, de fer, de magnésium, de zinc ou de molybdate ; les vitamines et autres facteurs de croissance tels que des acides aminés ou autres promoteurs de croissance. Un antimousse peut être ajouté selon les besoins. Selon l'invention, ce milieu de culture approprié peut être chimiquement défini ou complexe. Le milieu de culture peut ainsi être de composition identique ou similaire à un milieu synthétique, tel que défini par Verduyn et al., (Yeast. 1992. 8:501-17), adapté par Visser et al., (Biotechnology and bioengineering. 2002. 79:674-81), ou commercialement disponible tel que le milieu YN B (Yeast Nitrogen Base, M P Biomedicals ou Sigma-Aldrich). Notamment, le milieu de culture peut comprendre une source de carbone simple, telle que le glucose, le fructose, le xylose, l'éthanol, le glycérol, le galactose, le saccharose, la cellulose, la cellobiose, l'amidon, les polymères de glucose, les mélasses, ou les sous-produits de ces sucres. The yeast is cultivated in an appropriate culture medium. The term “suitable culture medium” generally designates a culture medium providing nutrients which are essential or beneficial for the maintenance and / or growth of said yeast, such as carbon sources; nitrogenous sources such as ammonium sulfate; sources of phosphorus, for example, potassium phosphate monobasic; trace elements, for example copper, iodide, iron, magnesium, zinc or molybdate salts; vitamins and other growth factors such as amino acids or other growth promoters. Defoamer can be added as needed. According to the invention, this suitable culture medium can be chemically defined or complex. The culture medium can thus be of identical or similar composition to a synthetic medium, as defined by Verduyn et al., (Yeast. 1992. 8: 501-17), adapted by Visser et al., (Biotechnology and bioengineering. 2002. 79: 674-81), or commercially available such as YN B medium (Yeast Nitrogen Base, MP Biomedicals or Sigma-Aldrich). Especially, the culture medium can comprise a simple carbon source, such as glucose, fructose, xylose, ethanol, glycerol, galactose, sucrose, cellulose, cellobiose, starch, glucose polymers , molasses, or by-products of these sugars.
De préférence, la production d'ériodictyol et/ou de lutéoline par la levure selon l'invention est obtenue sans apport de naringénine et/ou d'apigénine dans le milieu de culture, de préférence sans apport de naringénine, ni d'apigénine dans le milieu de culture. Preferably, the production of erodictyol and / or luteolin by the yeast according to the invention is obtained without supplying naringenin and / or apigenin in the culture medium, preferably without supplying naringenin or apigenin in the culture medium.
Selon l'invention, tout mode de culture permettant la production à l'échelle industrielle de molécules d'intérêt peut être envisagé. Avantageusement, la culture se fait en bioréacteurs, notamment en mode batch, fed-batch, chemostat et/ou culture continue. Une alimentation contrôlée en vitamines au cours du procédé peut également être bénéfique à la productivité (Alfenore et al., Appl Microbiol Biotechnol. 2002. 60:67-72). According to the invention, any mode of culture allowing the production on an industrial scale of molecules of interest can be envisaged. Advantageously, the culture is carried out in bioreactors, in particular in batch, fed-batch, chemostat and / or continuous culture mode. Controlled vitamin supply during the process may also benefit productivity (Alfenore et al., Appl Microbiol Biotechnol. 2002. 60: 67-72).
La culture est généralement conduite en bioréacteurs, avec de possibles étapes de précultures solides et/ou liquides en Erlenmeyers, avec un milieu de culture approprié. D'une manière générale, les conditions de culture des levures selon l'invention sont aisément adaptables par l'homme du métier, en fonction de la levure. Par exemple, la température de culture est notamment comprise pour les levures entre 20°C et 40°C, de préférence entre 28°C et 35°C, et plus particulièrement d'environ 30°C pour 5. cerevisiae. La levure selon la présente invention peut être cultivée pendant 1 à 30 jours, et de préférence de 1 à 10 jours. The culture is generally carried out in bioreactors, with possible steps of solid and / or liquid precultures in Erlenmeyer flasks, with an appropriate culture medium. In general, the conditions for cultivating the yeasts according to the invention are easily adaptable by those skilled in the art, depending on the yeast. For example, the culture temperature is in particular for yeasts between 20 ° C and 40 ° C, preferably between 28 ° C and 35 ° C, and more particularly around 30 ° C for 5. cerevisiae. The yeast according to the present invention can be cultured for 1 to 30 days, and preferably 1 to 10 days.
Une levure selon la présente invention est de préférence capable de produire de l'ériodictyol et/ou de la lutéoline en une quantité minimale de 1 mg/l de milieu de culture, de préférence de 10, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 mg/l de milieu de culture, éventuellement de 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 ou 1000 mg/l de milieu de culture. A yeast according to the present invention is preferably capable of producing erodictyol and / or luteolin in a minimum amount of 1 mg / l of culture medium, preferably 10, 20, 25, 30, 35, 40 , 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 mg / l of culture medium, optionally 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 or 1000 mg / l of culture medium.
DESCRIPTION DES DESSINS DESCRIPTION OF THE DRAWINGS
Figure 1 : Description des voies métaboliques de production d'ériodictyol et de la lutéoline. Figure 1: Description of the metabolic pathways for the production of erodictyol and luteolin.
Figure 2 : Production d'ériodictyol à partir de naringénine par la souche FL_405 (F3'H4 + CPR2). Souche témoin : CF235. Observation de la disparition du pic de naringénine et apparition d'un pic d'ériodictyol dans la souche FL-405. Figure 3 : Production de lutéoline à partir d'apigénine par la souche FL_405 (F3'H4 + CPR2). Souche témoin : CF235. Observation de la disparition du pic d'apigénine et apparition d'un pic de lutéoline dans la souche FL-405. Figure 2: Production of erodictyol from naringenin by the strain FL_405 (F3'H4 + CPR2). Control strain: CF235. Observation of the disappearance of the naringenin peak and the appearance of an erodictyol peak in the FL-405 strain. Figure 3: Production of luteolin from apigenin by the strain FL_405 (F3′H4 + CPR2). Control strain: CF235. Observation of the disappearance of the apigenin peak and appearance of a luteolin peak in strain FL-405.
Figure 4 : Production d'Apigénine à partir de naringénine par la souche SC744 (FNSII1 + CPR2). Souche témoin : CF234. Observation de la disparition du pic de naringénine et apparition d'un pic d'apigénine dans la souche. Figure 4: Production of Apigenin from naringenin by strain SC744 (FNSII1 + CPR2). Control strain: CF234. Observation of the disappearance of the naringenin peak and appearance of an apigenin peak in the strain.
Figure 5 : Production de lutéoline à partir d'ériodictyol SC744 (FNSII1 + CPR2). Souche témoin : CF234. Observation de la disparition du pic d'ériodictyol et apparition d'un pic de lutéoline dans la souche. Figure 6 : Production d'ériodictyol et de lutéoline par la souche SC1500. Souche témoin : CF237. Observation des pics d'ériodictyol et de lutéoline. Figure 5: Production of luteolin from erodictyol SC744 (FNSII1 + CPR2). Control strain: CF234. Observation of the disappearance of the erodictyol peak and appearance of a luteolin peak in the strain. Figure 6: Production of erodictyol and luteolin by strain SC1500. Control strain: CF237. Observation of erodictyol and luteolin peaks.
Figure 7 : Production d'ériodictyol et de lutéoline par les souches SC1500, SC2424, SC2425, SC2426, SC2427 et SC2428. Souche témoin : CF237. Figure 7: Production of erodictyol and luteolin by strains SC1500, SC2424, SC2425, SC2426, SC2427 and SC2428. Control strain: CF237.
[Tableau 1] DESCRIPTION DES SEQUENCES [Table 1] DESCRIPTION OF SEQUENCES
Figure imgf000086_0001
Figure imgf000087_0001
Figure imgf000088_0001
Figure imgf000089_0001
Figure imgf000090_0001
Figure imgf000086_0001
Figure imgf000087_0001
Figure imgf000088_0001
Figure imgf000089_0001
Figure imgf000090_0001
EXEMPLES EXAMPLES
Matériels et méthodes Materials and methods
Souches Les souches utilisées dans les exemples ont été obtenues à partir de Saccharomyces cerevisiae FY1679-28A (Tettelin et al., 1995 https://doi.org/10.1016/S1067-Strains The strains used in the examples were obtained from Saccharomyces cerevisiae FY1679-28A (Tettelin et al., 1995 https://doi.org/10.1016/S1067-
2389(06)80008-7). Cette levure possède une quadri auxotrophie pour l'uracile, le tryptophane, l'histidine et la leucine. 2389 (06) 80008-7). This yeast has a quadri auxotrophy for uracil, tryptophan, histidine and leucine.
Standards Les standards ont été acquis chez le fournisseur Extrasynthèse, France (Naringénine, Apigénine, Eriodictyol et Lutéoline). Clonage des gènes Standards The standards were acquired from the supplier Extrasynthèse, France (Naringenin, Apigenin, Eriodictyol and Luteolin). Gene cloning
Les gènes optimisés pour s'exprimer dans la levure ont été synthétisés par Eurofins genomics, Ebersberg, Allemagne ou Biomatik, Cambridge, Canada ou Twist Biosciences, San Francisco, USA ou DC Biosciences, Dundee, UK. Par PCR, le gène cpr2 (SEQ ID NO : 26) de S. cerevisiae a été amplifié à partir de l'ADN génomique. The genes optimized for expression in yeast have been synthesized by Eurofins genomics, Ebersberg, Germany or Biomatik, Cambridge, Canada or Twist Biosciences, San Francisco, USA or DC Biosciences, Dundee, UK. By PCR, the cpr2 gene (SEQ ID NO: 26) of S. cerevisiae was amplified from genomic DNA.
Les gènes obtenus par synthèse ou par PCR comprennent à l'extrémité 5' et 3', un site de restriction Bbsl (GAAGAC). The genes obtained by synthesis or by PCR comprise at the 5 'and 3' end, a BbsI restriction site (GAAGAC).
Tous les gènes, les promoteurs et les terminateurs ont été clonés par Bbsl, BsmBI (CGTCTC) et Bsal (GGTCTC) dans le vecteur pSBK. Les promoteurs et terminateurs (Wargner et al., 2015 DOI: 10.1016/j.fgb.2015.12.001) ont été récupérés par PCR à partir de l'ADN génomique de la levure S. cerevisiae. All the genes, promoters and terminators were cloned by BbsI, BsmBI (CGTCTC) and Bsal (GGTCTC) into the vector pSBK. The promoters and terminators (Wargner et al., 2015 DOI: 10.1016 / j.fgb.2015.12.001) were recovered by PCR from the genomic DNA of the yeast S. cerevisiae.
Le vecteur comprend un marqueur d'auxotrophie de la levure URA, ou LEU ou TRP ou HIS. The vector comprises a yeast auxotrophy marker URA, or LEU or TRP or HIS.
Conditions de culture Culture conditions
Les souches de levure ont été cultivées dans 1 ml de milieu minimum nitrogen base (Dutscher, Brumath, Fr) supplémenté de glucose à 20 g/l en plaque 24 puits (Starlab, Orsay, Fr) à 30°C pendant 72h sous agitation continu à 200 RPM. Dans certain cas, de la naringénine ou de l'apigénine a été ajoutée à une concentration de 100 mg.l 1 pour déterminer l'activité des F3'H et de la naringénine ou de l'ériodictyol a été ajoutée à une concentration de 100 mg.l 1 pour déterminer l'activité des FNSII. Chaque souche a été inoculée à DO 0,2 à partir d’une pré-culture de 24h cultivée dans les mêmes conditions. The yeast strains were cultured in 1 ml of minimum nitrogen base medium (Dutscher, Brumath, Fr) supplemented with 20 g / l glucose in a 24-well plate (Starlab, Orsay, Fr) at 30 ° C for 72 hours with continuous stirring. at 200 RPM. In some cases, naringenin or apigenin was added at a concentration of 100 mg.l 1 to determine the activity of F3'H and naringenin or erodictyol was added at a concentration of 100 mg.l 1 to determine the activity of FNSII. Each strain was inoculated at OD 0.2 from a 24 hour pre-culture cultivated under the same conditions.
Méthode analytique : Analytical method :
Préparation des échantillons : Les cultures de 1 mL sont congelées à -80°C puis lyophilisées pendant 12h à 0,10 mbar. Les échantillons sont ensuite repris dans 1 mL de diméthylsulfoxide (DMSO), agités pendant 30 secondes à 1000 rpm puis centrifugés pendant 5 min à 3000 rpm à température ambiante. Après centrifugation, un volume connu de surnageant est ajouté à un volume connu d'un mélange d’étalons internes solubilisés dans du méthanol. Preparation of the samples: The 1 mL cultures are frozen at -80 ° C. then lyophilized for 12 h at 0.10 mbar. The samples are then taken up in 1 mL of dimethylsulfoxide (DMSO), stirred for 30 seconds at 1000 rpm and then centrifuged for 5 min at 3000 rpm at room temperature. After centrifugation, a known volume of supernatant is added to a known volume of a mixture of internal standards solubilized in methanol.
Les concentrations finales des étalons internes sont : The final concentrations of the internal standards are:
Diosmine C13 0,5 mg/L Diosmetine C13 0,015 mg/L. Diosmin C13 0.5 mg / L Diosmetine C13 0.015 mg / L.
Analyse par UHPLC-TQ : Les échantillons ont été analysés par une UHPLC Vanquish-H (Thermo) couplée à un triple-quadripôle Quantis (Thermo). La colonne est une colonne Waters Acquity UPLC@ USST3 (8 miti 2,1 X 100 mm) associée à une pré-colonne HSST3 1,8 miti 2,1 X 5 mm. Analysis by UHPLC-TQ: The samples were analyzed by a UHPLC Vanquish-H (Thermo) coupled to a triple-quadrupole Quantis (Thermo). The column is a Waters Acquity UPLC @ USST3 column (8 miti 2.1 X 100 mm) associated with a HSST3 1.8 miti 2.1 X 5 mm pre-column.
La phase mobile A est une solution de 0,1 % d'acide formique dans de l'eau de qualité LC/MS et la phase mobile B est une solution de 0,1 % d'acide formique dans de l'acétonitrile pur de qualité LC/MS . La température de la colonne est de 50°C et la température du passeur d’échantillons à 10°C. Deux conditions chromatographiques ont pu être utilisés pour la détection des flavonoïdes aglycones : Mobile phase A is a solution of 0.1% formic acid in LC / MS grade water and mobile phase B is a solution of 0.1% formic acid in pure acetonitrile of LC / MS quality. The temperature of the column is 50 ° C and the temperature of the sample changer is 10 ° C. Two chromatographic conditions could be used for the detection of aglycone flavonoids:
[Tableau 2] Conditions chromatographiques méthode 1 [Table 2] Chromatographic conditions method 1
Figure imgf000092_0001
Figure imgf000092_0001
[Tableau 3] Conditions chromatographiques méthode 2 [Table 3] Chromatographic conditions method 2
Figure imgf000092_0002
Figure imgf000092_0002
Les paramètres de la source électrospray sont : voltage du spray mode négatif à 1000V gaz rideau : à 50 Arb gaz auxiliaire à 15 Arb température du tube de transfert à 300°C température du vaporisateur à 300°C The parameters of the electrospray source are: spray voltage negative mode at 1000V curtain gas: at 50 Arb auxiliary gas at 15 Arb transfer tube temperature at 300 ° C vaporizer temperature at 300 ° C
Les ions suivis et les conditions de fragmentation pour les molécules d'intérêts sont : The ions monitored and the fragmentation conditions for the molecules of interest are:
[Tableau 4] Pour la méthode 1 [Table 4] For method 1
Figure imgf000093_0001
Figure imgf000093_0001
Tableau 5] Pour la méthode 2 Table 5] For method 2
Figure imgf000093_0002
Figure imgf000093_0002
F3'H Des constructions pour chacune des F3'H ont été réalisées dans un vecteur portant le marqueur de sélection URA (Tableau 6). Des constructions comportant chacune SAM2 et un seul des différents CPR ont été créés dans un vecteur portant le marqueur de sélection LEU (Tableau 7). Deux vecteurs comportant uniquement le marqueur de sélection URA ou LEU ont aussi été créé comme témoin. Les gènes marqueurs permettent de repérer et de sélectionner les cellules ayant intégré le gène d'intérêt. F3′H Constructs for each of the F3′H were carried out in a vector carrying the URA selection marker (Table 6). Constructs each comprising SAM2 and only one of the different CPRs were created in a vector carrying the selection marker LEU (Table 7). Two vectors comprising only the URA or LEU selection marker were also created as a control. The marker genes make it possible to identify and select the cells which have integrated the gene of interest.
[Tableau 6] Liste des différentes constructions F3'H testées. [Table 6] List of the different F3′H constructions tested.
Figure imgf000094_0001
Figure imgf000094_0001
[Tableau 7] Listes des constructions réalisées avec les différents CPR [Table 7] Lists of constructions carried out with the different CPRs
Figure imgf000094_0002
Figure imgf000095_0001
Figure imgf000094_0002
Figure imgf000095_0001
Plusieurs souches ont été créées avec respectivement toutes les F3'H listées dans le tableau 6 pour qu'elles soient chacune testées avec toutes les constructions du tableau 7. Several strains were created with respectively all the F3′H listed in Table 6 so that they were each tested with all the constructs of Table 7.
Ces différents assemblages permettent de vérifier l'activité enzymatique des F3'H et permettent également de déterminer les couples F3'H - CPR les plus efficaces. These different assemblies make it possible to verify the enzymatic activity of F3′H and also make it possible to determine the most effective F3′H - CPR pairs.
Par exemple, la souche FL 405, figure 2 et figure 3, possède les constructions FL 26 et FL 401. For example, strain FL 405, Figure 2 and Figure 3, has the constructs FL 26 and FL 401.
La souche témoin (sans les gènes) possédant les constructions TT URA et TT LEU est nommée CF235. FNSII The control strain (without the genes) having the TT URA and TT LEU constructs is called CF235. FNSII
Pour chacune des FNSII suivantes, des constructions dans un vecteur TRP ont été effectués (Tableau 8). Les mêmes vecteurs avec le marqueur de sélection LEU contenant chacun SAM2 et un CPR différent ont été utilisés pour tester les FNSII (Tableau 9). For each of the following FNSII, constructs in a TRP vector were performed (Table 8). The same vectors with the LEU selection marker each containing SAM2 and a different CPR were used to test FNSII (Table 9).
[Tableau 8] Constructions comportant les différentes FNSII testées. [Table 8] Constructions comprising the different FNSII tested.
Figure imgf000095_0002
Figure imgf000096_0001
Figure imgf000095_0002
Figure imgf000096_0001
[Tableau 9] Listes des constructions réalisées avec les différents CPR [Table 9] Lists of constructions carried out with the different CPRs
Figure imgf000096_0002
Figure imgf000096_0002
Plusieurs souches ont été créées avec respectivement chacune des constructions des FNSII listées dans le tableau 8 et chacune des constructions des CPR du tableau 9. Several strains were created with, respectively, each of the FNSII constructs listed in Table 8 and each of the CPR constructs in Table 9.
Ces différents assemblages permettent de vérifier l'activité enzymatique des FNSII et permettent également de déterminer les FNSII les plus efficaces. Par exemple, la souche SC 744, figure 4 et figure 5, possède les constructions FL 620 et FL 401. These different assemblies make it possible to verify the enzymatic activity of the FNSII and also make it possible to determine the most effective FNSII. For example, strain SC 744, Figure 4 and Figure 5, has the constructs FL 620 and FL 401.
La souche témoin (sans les gènes) possédant les constructions TT TRP et TT LEU est nommé CF234. Des constructions similaires ont été réalisées pour tester les FNSII des SEQ ID Nos : 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 et 125. The control strain (without the genes) possessing the TT TRP and TT LEU constructs is named CF234. Similar constructions were carried out to test the FNSII of SEQ ID Nos: 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 and 125.
VOIE COMPLETE COMPLETE TRACK
Des souches comportant la voie complète ont également été testées : - la souche SC1500 comprend les constructions FL 26, FL 602, FL 808 et FL 822; Strains comprising the complete pathway were also tested: the strain SC1500 comprises the constructions FL 26, FL 602, FL 808 and FL 822;
- la souche SC2424 comprenant les constructions FL 1031 + FL 602 + FL 822 + TT H IS ; the strain SC2424 comprising the constructions FL 1031 + FL 602 + FL 822 + TT H IS;
- la souche SC2425 comprenant les constructions FL 26 + FL 602 + FL 822 + TT H IS ; the strain SC2425 comprising the constructions FL 26 + FL 602 + FL 822 + TT H IS;
- la souche SC2426 comprenant les constructions FL 31 + FL 602 + FL 822 + TT H IS ; the strain SC2426 comprising the constructions FL 31 + FL 602 + FL 822 + TT H IS;
- la souche SC2427 comprend les constructions FL 1031, FL 602, FL 808 et FL 822 ; et - la souche SC2428 comprenant les constructions FL 31 + FL 602 + FL 808 + FL 822. the strain SC2427 comprises the constructions FL 1031, FL 602, FL 808 and FL 822; and - strain SC2428 comprising the constructions FL 31 + FL 602 + FL 808 + FL 822.
[Tableau 10] Listes des constructions utilisées dans la souche comportant la voie complète [Table 10] Lists of constructs used in the strain comprising the complete route
Figure imgf000097_0001
Figure imgf000098_0001
Figure imgf000097_0001
Figure imgf000098_0001
La souche témoin (sans les gènes) possédant les constructions TT U RA, TT TRP, TT HIS et TT LEU est nommé CF237. The control strain (without the genes) possessing the constructions TT U RA, TT TRP, TT HIS and TT LEU is named CF237.
RESULTATS F3'H F3'H RESULTS
Les tableaux 11 et 12 ci-dessous présente la production d'ériodictyol (tableau 11) et de lutéoline (tableau 12) obtenue en cultivant les souches comprenant les F3'H listées dans le tableau 6 et les constructions du tableau 7 , en présence respectivement de naringénine et d'apigénine. Tables 11 and 12 below show the production of erodictyol (Table 11) and luteolin (Table 12) obtained by culturing the strains comprising the F3′H listed in Table 6 and the constructions of Table 7, in the presence respectively naringenin and apigenin.
[Tableau 11] Concentration en Eriodictyol (en mg.l 1) [Table 11] Eriodictyol concentration (in mg.l 1 )
Figure imgf000098_0002
Figure imgf000098_0002
LQ. : inférieur à la limite de quantification. Les différentes souches sont bien capables de produire de l'ériodictyol à partir de la naringénine, en concentrations différentes suivant les F3'H et le CPR utilisés (voir Figure 2). LQ. : below the limit of quantification. The different strains are well capable of producing erodictyol from naringenin, in different concentrations depending on the F3′H and the CPR used (see FIG. 2).
[Tableau 12] Concentration en Lutéoline (en mg.l _1) [Table 12] Luteolin concentration (in mg.l _1 )
Figure imgf000099_0001
Figure imgf000099_0001
LQ. : inférieur à la limite de quantification. Les différentes souches sont bien capables de produire de la lutéoline à partir d'apigénine, en concentrations différentes suivant les F3'H et le CPR utilisés (voir Figure 3). LQ. : below the limit of quantification. The different strains are well capable of producing luteolin from apigenin, in different concentrations depending on the F3′H and the CPR used (see FIG. 3).
FNS SNSF
Les tableaux 13 et 14 ci-dessous présente la production d'apigénine (tableau 13) et de lutéoline (tableau 14) obtenue en cultivant les souches comprenant les FNSII listées dans le tableau 8 et les constructions du tableau 9, en présence respectivement de naringénine et d'ériodictyol. Tables 13 and 14 below show the production of apigenin (Table 13) and luteolin (Table 14) obtained by culturing the strains comprising the FNSII listed in Table 8 and the constructions of Table 9, in the presence respectively of naringenin and erodictyol.
[Tableau 13] Concentration en Apigénine (en mg.l 1) [Table 13] Apigenin concentration (in mg.l 1 )
Figure imgf000099_0002
Figure imgf000100_0001
Figure imgf000099_0002
Figure imgf000100_0001
[Tableau 14] Concentration en Lutéoline (en mg.l 1) [Table 14] Luteolin concentration (in mg.l 1 )
Figure imgf000100_0002
Figure imgf000100_0002
Les différentes souches sont bien capables de produire de l'apigénine et de la lutéoline à partir de naringénine et d'ériodictyol, en concentrations différentes suivant le FNS utilisé (Figures 4 et 5). The different strains are well capable of producing apigenin and luteolin from naringenin and erodictyol, in different concentrations depending on the SNSF used (Figures 4 and 5).
Des résultats similaires ont été obtenus avec les FNSII des SEQ ID Nos : 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 et 125. SOUCHES COMPLETES Similar results were obtained with the FNSII of SEQ ID Nos: 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 and 125. COMPLETE STRAINS
Les souches SC2424, SC2425, SC2426, SC2427, SC1500 et SC2428 possèdent toutes les enzymes de la voie et sont capables de produire de la lutéoline et de l'ériodictyol à partir de glucose. Strains SC2424, SC2425, SC2426, SC2427, SC1500 and SC2428 possess all the enzymes of the pathway and are capable of producing luteolin and erodictyol from glucose.
Les résultats de la souche SC1500 correspondent à la figure 6, où les pics de l'ériodictyol et de la lutéoline sont observés. Des résultats similaires sont obtenus pour les souches SC2424, SC2425, SC2426, SC2427, et SC2428. La production d'ériodictyol et de lutéoline pour chacune des souches SC2424, SC2425, SC2426, SC2427, SC1500 et SC2428 est présentée sur la figure 7. The results of strain SC1500 correspond to Figure 6, where the peaks of erodictyol and luteolin are observed. Similar results are obtained for the strains SC2424, SC2425, SC2426, SC2427, and SC2428. The production of erodictyol and luteolin for each of the strains SC2424, SC2425, SC2426, SC2427, SC1500 and SC2428 is shown in Figure 7.
Il est à noter que l'ajout des enzymes PAL et C4H à la voie de biosynthèse permet d'obtenir des concentrations d'ériodictyol et de lutéoline nettement plus importantes Celles-ci peuvent être jusqu'à 6 fois plus importantes que les concentrations obtenues avec les souches contenant les mêmes enzymes à l'exception de PAL et C4H (cf. figure 7 , par exemple en comparant la souche SC2425 sans PAL/C4H et la souche SC1500 avec PAL/C4H ou la souche SC2426 sans PAL/C4H et la souche SC2428 avec PAL/C4H). It should be noted that the addition of the PAL and C4H enzymes to the biosynthetic pathway makes it possible to obtain significantly higher concentrations of erodictyol and luteolin.These can be up to 6 times greater than the concentrations obtained with strains containing the same enzymes with the exception of PAL and C4H (cf. figure 7, for example by comparing the strain SC2425 without PAL / C4H and the strain SC1500 with PAL / C4H or the strain SC2426 without PAL / C4H and the strain SC2428 with PAL / C4H).
VERIFICATION DE L'ACTIVITE DES F3'H Une activité d'hydroxylation spécifiquement en 3' étant désirée, l'activité d'hydroxylation en 5' conduisant à la formation de tricétine a été testée pour les F3'H codées par les séquences des SEQ ID NO : 8, 12, 18 et 88 sur l'apigénine avec le CPR codé par la séquence de la SEQ ID NO 24. VERIFICATION OF THE ACTIVITY OF THE F3′H A hydroxylation activity specifically in 3 ′ being desired, the hydroxylation activity in 5 ′ leading to the formation of triketin was tested for the F3′H encoded by the sequences of SEQ. ID NO: 8, 12, 18 and 88 on apigenin with the CPR encoded by the sequence of SEQ ID NO 24.
Figure imgf000101_0001
Figure imgf000101_0001
ND : non détecté ND: not detected
L'absence de tricétine démontre que les F3'H sélectionnées ne réalisent que The absence of tricetin demonstrates that the selected F3'H only achieve
l'hydroxylation en 3' et aucune hydroxylation en 5'. 3 'hydroxylation and no 5' hydroxylation.

Claims

REVENDICATIONS
1. Levure recombinante comprenant une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'-monooxygénase (F3'H) capable d'ajouter un hydroxyle en position 3' de la naringénine et/ou de l'apigénine. 1. Recombinant yeast comprising a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) capable of adding a hydroxyl in position 3 'of naringenin and / or apigenin.
2. Levure selon la revendication 1, dans laquelle la flavonoïde 3'-monooxygénase (F3'H) est une enzyme de Callistephus chinensis, Perilla frutescens var. crispa, Pétunia x hybrida, Gerbera hybrida, Citrus sinensis, Arabidopsis thaliana, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis ou Pilosella officinarum. 2. Yeast according to claim 1, wherein the flavonoid 3'-monooxygenase (F3'H) is an enzyme from Callistephus chinensis, Perilla frutescens var. crispa, Petunia x hybrida, Gerbera hybrida, Citrus sinensis, Arabidopsis thaliana, Citrus clementina, Osteospermum hybrid cultivar, Phanerochaete chrysosporium, Streptomyces avermitilis or Pilosella officinarum.
3. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NOs: 1 , 1, 3, 5, 9, 11, 13, 15, 17, 19, 21 et 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase, de préférence sélectionnée parmi les enzymes de SEQ ID NOs: 7, 1, 5, 11, 17, 19 et 87 et les polypeptides ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec une de ces séquences et présentant l'activité flavonoïde 3'- monooxygénase. 3. Yeast according to claim 1 or 2, in which the flavonoid 3'-monooxygenase (F3'H) is an enzyme comprising a sequence chosen from SEQ ID NOs: 1, 1, 3, 5, 9, 11, 13, 15 , 17, 19, 21 and 87 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity, preferably selected from the enzymes of SEQ ID NOs: 7, 1, 5, 11, 17, 19 and 87 and polypeptides having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting 3'-monooxygenase flavonoid activity.
4. Levure selon l'une quelconque des revendications 1-3, dans laquelle la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant u ne séquence sélectionnée parmi les SEQ ID NOs: 7, 11, 17 et 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. 4. Yeast according to any one of claims 1-3, wherein the flavonoid 3'-monooxygenase (F3'H) is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 11, 17 and 87 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
5. Levure selon l'une quelconque des revendications 1-4, dans laquelle la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant u ne séquence sélectionnée parmi les SEQ ID NOs: 7, 17 et 87 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité avec l'une de ces séquences et présentant l'activité flavonoïde 3'-monooxygénase. 5. Yeast according to any one of claims 1-4, wherein the flavonoid 3'-monooxygenase (F3'H) is an enzyme comprising a sequence selected from SEQ ID NOs: 7, 17 and 87 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity with one of these sequences and exhibiting the flavonoid 3'-monooxygenase activity.
6. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase. 6. Yeast according to claim 1 or 2, in which the flavonoid 3′-monooxygenase (F3′H) is an enzyme comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity.
7. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase. 7. Yeast according to claim 1 or 2, wherein the flavonoid 3'-monooxygenase (F3'H) is an enzyme comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 85%, at least 90% or at least 95% sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity.
8. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence ayant au moins 90 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase. 8. Yeast according to claim 1 or 2, in which the flavonoid 3'-monooxygenase (F3'H) is an enzyme comprising a sequence selected from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 90% identity. of sequence with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity.
9. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'-monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 17 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 17, et présentant l'activité flavonoïde 3'-monooxygénase. 9. Yeast according to claim 1 or 2, wherein the flavonoid 3'-monooxygenase (F3'H) is an enzyme comprising a sequence chosen from SEQ ID NO: 17 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% sequence identity with the sequence SEQ ID NO: 17, and exhibiting the flavonoid 3'-monooxygenase activity.
10. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'- monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 17 et les polypeptides comprenant une séquence ayant au moins 90 % d'identité de séquence avec la séquence SEQ ID NO: 17, et présentant l'activité flavonoïde 3'- monooxygénase. 10. Yeast according to claim 1 or 2, in which the flavonoid 3′-monooxygenase (F3′H) is an enzyme comprising a sequence selected from SEQ ID NO: 17 and polypeptides comprising a sequence having at least 90% identity. of sequence with the sequence SEQ ID NO: 17, and exhibiting the flavonoid 3'-monooxygenase activity.
11. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'- monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 87 et les polypeptides comprenant une séquence ayant au moins 70 %, au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 87, et présentant l'activité flavonoïde 3'-monooxygénase. 11. Yeast according to claim 1 or 2, in which the flavonoid 3′-monooxygenase (F3′H) is an enzyme comprising a sequence chosen from SEQ ID NO: 87 and polypeptides comprising a sequence having at least 70%, at least 75%, at least 80%, at least 85%, at least 90% or at least 95% of sequence identity with the sequence SEQ ID NO : 87, and exhibiting the flavonoid 3'-monooxygenase activity.
12. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'- monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 87 et les polypeptides comprenant une séquence ayant au moins 90 % d'identité de séquence avec la séquence SEQ ID NO: 87, et présentant l'activité flavonoïde 3'- monooxygénase 12. Yeast according to claim 1 or 2, in which the flavonoid 3′-monooxygenase (F3′H) is an enzyme comprising a sequence chosen from SEQ ID NO: 87 and polypeptides comprising a sequence having at least 90% identity. of sequence with the sequence SEQ ID NO: 87, and exhibiting the flavonoid 3'-monooxygenase activity
13. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'- monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 11 et les polypeptides comprenant une séquence ayant au moins 75 %, au moins 80 %, au moins 85 %, au moins 90 % ou au moins 95 % d'identité de séquence avec la séquence SEQ ID NO: 11, et présentant l'activité flavonoïde 3'-monooxygénase. 13. Yeast according to claim 1 or 2, in which the flavonoid 3′-monooxygenase (F3′H) is an enzyme comprising a sequence chosen from SEQ ID NO: 11 and polypeptides comprising a sequence having at least 75%, at least 80%, at least 85%, at least 90% or at least 95% sequence identity with the sequence SEQ ID NO: 11, and exhibiting the flavonoid 3'-monooxygenase activity.
14. Levure selon la revendication 1 ou 2, dans laquelle la flavonoïde 3'- monooxygénase (F3'H) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 11 et les polypeptides comprenant une séquence ayant au moins 90 % d'identité de séquence avec la séquence SEQ ID NO: 11, et présentant l'activité flavonoïde 3'- monooxygénase. 14. Yeast according to claim 1 or 2, in which the flavonoid 3′-monooxygenase (F3′H) is an enzyme comprising a sequence chosen from SEQ ID NO: 11 and polypeptides comprising a sequence having at least 90% identity. of sequence with the sequence SEQ ID NO: 11, and exhibiting the flavonoid 3'-monooxygenase activity.
15. Levure selon l'une quelconque des revendications 1-14, comprenant en outre un acide nucléique hétérologue ou endogène codant pour une cytochrome P450 réductase (CPR), de préférence de Saccharomyces cerevisiae, de Catharanthus roseus ou d’Arabidopsis thaliana. 15. Yeast according to any one of claims 1-14, further comprising a heterologous or endogenous nucleic acid encoding a cytochrome P450 reductase (CPR), preferably from Saccharomyces cerevisiae, Catharanthus roseus or Arabidopsis thaliana.
16. Levure selon la revendication 15, dans laquelle la cytochrome P450 réductase (CPR) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 25, 23, 27, 29 et 31 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase, de préférence parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 23, 25 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cytochrome P450 réductase. 16. Yeast according to claim 15, in which cytochrome P450 reductase (CPR) is selected from enzymes comprising a sequence chosen from SEQ ID NOs: 25, 23, 27, 29 and 31 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity, preferably among enzymes comprising a sequence chosen from SEQ ID NOs: 23, 25 and 29 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cytochrome P450 reductase activity .
17. Levure selon la revendication 15, dans laquelle la cytochrome P450 réductase (CPR) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi la SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase. 17. Yeast according to claim 15, in which cytochrome P450 reductase (CPR) is selected from enzymes comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting cytochrome P450 reductase activity.
18. Levure selon l'une quelconque des revendications 1-17, comprenant en outre une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS), en particulier une flavone synthase capable de produire la lutéoline à partir de l'ériodictyol et/ou produire l'apigénine à partir de la naringénine, de préférence Petroselinum crispum, Arabidopsis thaüana, Zea mays, Lonicera japonica, Lonicera mocronthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa cynapium, Angelica archangelica, Conium maculatum, Camellia sinensis, Cynara cordunculus var scolymus, Saussurea médusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata ou Erythranthe lewisii. 18. Yeast according to any one of claims 1-17, further comprising a heterologous nucleic acid sequence encoding a flavone synthase (FNS), in particular a flavone synthase capable of producing luteolin from erodictyol and / or produce apigenin from naringenin, preferably Petroselinum crispum, Arabidopsis thaüana, Zea mays, Lonicera japonica, Lonicera mocronthoides, Callistephus chinensis, Apium graveolens, Medicago truncatula, Cuminum cyminum, Aethusa changynapium, Angelica maculatium Camellia sinensis, Cynara cordunculus var scolymus, Saussurea medusa, Plectranthus barbatus, Scutellaria baicalensis, Dorcoceras hygrometricum, Antirrhinum majus, Perilla frutescens var crispa, Dahlia pinnata or Erythranthe lewisii.
19. Levure selon la revendication 18, dans laquelle la flavone synthase (FNS) est sélectionnée parmi les enzymes comprenant une séquence choisie parmi SEQ ID NOs: 37, 33, 35, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 et 125 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 37, 33, 35 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité flavone synthase. 19. Yeast according to claim 18, wherein the flavone synthase (FNS) is selected from enzymes comprising a sequence selected from SEQ ID NOs: 37, 33, 35, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 and 125 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity, preferably comprising a sequence selected from SEQ ID NOs: 37, 33, 35 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting flavone synthase activity.
20. Levure selon la revendication 18 ou 19, dans laquelle la flavone synthase (FNS) est une enzyme comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase. 20. Yeast according to claim 18 or 19, wherein the flavone synthase (FNS) is an enzyme comprising a sequence selected from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting flavone synthase activity.
21. Levure selon l'une quelconque des revendications 1-20, caractérisée en ce qu'elle comprend en outre : 21. Yeast according to any one of claims 1-20, characterized in that it further comprises:
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) et ; a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) and;
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl- CoA ligase (4CL) ;et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL); and
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) ; et a heterologous nucleic acid sequence encoding a chalcone synthase (CHS); and
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI). a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI).
22. Levure selon la revendication 21, caractérisée en ce qu'elle comprend : 22. Yeast according to claim 21, characterized in that it comprises:
une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) de Rhodotorula glutinis ou Flavobacterium johnsoniae ; en particulier une TAL comprenant une séquence choisie parmi SEQ ID NOs: 41 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité tyrosine ammonia lyase ; de préférence une TAL comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;et a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) from Rhodotorula glutinis or Flavobacterium johnsoniae; in particular a TAL comprising a sequence chosen from SEQ ID NOs: 41 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a tyrosine ammonia lyase activity; preferably a TAL comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity ;and
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl- CoA ligase (4CL) d’Arabidopsis thaliana, Citrus clementina, Petroselinum crispum ou Streptomyces clavuligerus ; en particulier une 4CL comprenant une séquence choisie parmi SEQ ID NOs: 89, 91, 45, 43, 47 et 49 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de préférence une 4CL comprenant une séquence sélectionnée parmi les SEQ ID NOs: 89, 91 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; de manière tout particulièrement préférée une 4CL comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase, et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) from Arabidopsis thaliana, Citrus clementina, Petroselinum crispum or Streptomyces clavuligerus; in particular a 4CL comprising a sequence chosen from SEQ ID NOs: 89, 91, 45, 43, 47 and 49 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; preferably a 4CL comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; very particularly preferably a 4CL comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting a 4-coumarate-CoA ligase activity, and
une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) de Citrus sinensis, de Hordeum vulgare ou de Streptomyces clavuligerus, en particulier une CHS comprenant une séquence choisie parmi SEQ ID NOs: 53, 51, 55 et 57 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone synthase, de préférence une CHS comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) of Citrus sinensis, of Hordeum vulgare or of Streptomyces clavuligerus, in particular a CHS comprising a sequence chosen from SEQ ID NOs: 53, 51, 55 and 57 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone synthase activity, preferably a CHS comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone synthase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) d’Arabidopsis thaliana ou Streptomyces clavuligerus, en particulier une CHI comprenant une séquence choisie parmi SEQ ID NOs: 61 et 59 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité chalcone isomérase ; de préférence une CHI comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) of Arabidopsis thaliana or Streptomyces clavuligerus, in particular a CHI comprising a sequence chosen from SEQ ID NOs: 61 and 59 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting chalcone isomerase activity; preferably a CHI comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting chalcone isomerase activity .
23. Levure selon la revendication 21 ou 22, caractérisée en ce qu'elle comprend : une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; et 23. Yeast according to claim 21 or 22, characterized in that it comprises: a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) comprising a sequence selected from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity sequenced with this sequence and exhibiting tyrosine ammonia lyase activity; and
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl- CoA ligase (4CL) comprenant une séquence sélectionnée parmi les SEQ ID NO: 89, 91 et 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité 4-coumarate-CoA ligase ; et une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisi parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NOs: 89, 91 and 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity; and a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity in sequence with this sequence and exhibiting chalcone synthase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone isomerase activity.
24. Levure selon la revendication 21 ou 22, caractérisée en ce qu'elle comprend : une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ;et 24. Yeast according to claim 21 or 22, characterized in that it comprises: a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with that sequence and exhibiting tyrosine ammonia lyase activity; and
une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl- CoA ligase (4CL) comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité 4-coumarate-CoA ligase ; et une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisi parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; et a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NO: 45 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with this sequence and exhibiting 4-coumarate-CoA ligase activity; and a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence selected from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone synthase activity; and
une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CHI) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase . a heterologous nucleic acid sequence encoding a chalcone isomerase (CHI) comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting chalcone isomerase activity.
25. Levure selon l'une quelconque des revendications 1-24, caractérisée en ce qu'elle comprend en outre une séquence d'acide nucléique hétérologue codant pour une 4- méthoxybenzoate O-déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID NOs: 73 et 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité L-tyrosine hydroxylase; ou une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p-coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 71 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité d'une séquence avec une de ces séquences et présentant une activité p- coumarate 3 hydroxylase. 25. Yeast according to any one of claims 1-24, characterized in that it further comprises a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine into L-Dopa and also p coumaric acid to caffeic acid, preferably comprising a sequence chosen from SEQ ID NOs: 73 and 75 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting L-tyrosine hydroxylase activity; or a heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 71 and polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% identity of a sequence with one of these sequences and exhibiting p-coumarate 3 hydroxylase activity.
26. Levure selon la revendication 25, caractérisée en ce qu'elle comprend en outre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O- déméthylase capable de convertir la tyrosine en L-Dopa et également l'acide p coumarique en acide caféique, et comprenant une séquence choisie parmi SEQ ID NO: 75 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité L-tyrosine hydroxylase. 26. Yeast according to claim 25, characterized in that it further comprises a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase capable of converting tyrosine into L-Dopa and also p coumaric acid into caffeic acid, and comprising a sequence chosen from SEQ ID NO: 75 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting L-tyrosine activity hydroxylase.
27. Levure selon l'une quelconque des revendications 1-26, caractérisée en ce qu'elle comprend en outre 27. Yeast according to any one of claims 1-26, characterized in that it further comprises
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) , en particulier une PAL comprenant une séquence choisie parmi SEQ ID NOs: 63, 65 et 77, de préférence SEQ ID NO : 65 et 77, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité phénylalanine ammonia lyase, et de manière plus particulièrement préférée une phénylalanine am monia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; et - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), in particular a PAL comprising a sequence chosen from SEQ ID NOs: 63, 65 and 77, preferably SEQ ID NOs: 65 and 77, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting a phenylalanine ammonia lyase activity, and more particularly preferably a phenylalanine am monia lyase (PAL) comprising a sequence selected from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), en particulier une C4H comprenant une séquence choisie parmi SEQ ID NOs: 67, 69, 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant une activité cinnamate 4-hydroxylase ; et de manière tout particulièrement préférée une cinnamate 4- hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4- hydroxylase . - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), in particular a C4H comprising a sequence chosen from SEQ ID NOs: 67, 69, 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting cinnamate 4-hydroxylase activity; and very particularly preferably a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting cinnamate 4-hydroxylase activity.
28. Levure selon l'une quelconque des revendications 1-27, caractérisée en ce qu'elle comprend : 28. Yeast according to any one of claims 1-27, characterized in that it comprises:
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) comprenant une séquence choisie parmi la SEQ ID NO: 65 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité phénylalanine ammonia lyase ; - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) comprising a sequence chosen from SEQ ID NO: 65 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting phenylalanine ammonia lyase activity;
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H) comprenant une séquence choisie parmi la SEQ ID NO: 79 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cinnamate 4- hydroxylase ; - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H) comprising a sequence chosen from SEQ ID NO: 79 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting cinnamate 4-hydroxylase activity;
- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL) comprenant une séquence choisie parmi SEQ ID NO: 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité tyrosine ammonia lyase ; - a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL) comprising a sequence chosen from SEQ ID NO: 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting tyrosine ammonia lyase activity;
- une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL) comprenant une séquence sélectionnée parmi la SEQ ID NO: 45 ou 89 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant une activité 4- coumarate-CoA ligase ; - a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL) comprising a sequence selected from SEQ ID NO: 45 or 89 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-coumarate-CoA ligase activity;
- une séquence d'acide nucléique hétérologue codant pour une chalcone synthase (CHS) comprenant une séquence choisie parmi SEQ ID NO: 53 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone synthase; - a heterologous nucleic acid sequence encoding a chalcone synthase (CHS) comprising a sequence chosen from SEQ ID NO: 53 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity in sequence with this sequence and exhibiting chalcone synthase activity;
- une séquence d'acide nucléique hétérologue codant pour une chalcone isomérase (CH I) comprenant une séquence choisie parmi la SEQ ID NO: 61 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité chalcone isomérase ; - a heterologous nucleic acid sequence encoding a chalcone isomerase (CH I) comprising a sequence chosen from SEQ ID NO: 61 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with this sequence and exhibiting chalcone isomerase activity;
- une séquence d'acide nucléique hétérologue codant pour une flavonoïde 3'- monooxygénase (F3'H) comprenant une séquence choisie parmi SEQ ID NO: 7 et les polypeptides comprenant une séquence a ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO: 7 et présentant l'activité flavonoïde 3'-monooxygénase ; - a heterologous nucleic acid sequence encoding a flavonoid 3'-monooxygenase (F3'H) comprising a sequence chosen from SEQ ID NO: 7 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 7 and exhibiting the flavonoid 3'-monooxygenase activity;
- une séquence d'acide nucléique hétérologue codant pour une flavone synthase (FNS) comprenant une séquence choisie parmi SEQ ID NO: 37 et un polypeptide comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité flavone synthase ; et - a heterologous nucleic acid sequence encoding a flavone synthase (FNS) comprising a sequence chosen from SEQ ID NO: 37 and a polypeptide comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with this sequence and exhibiting flavone synthase activity; and
- une séquence d'acide nucléique hétérologue codant pour une cytochrome P450 réductase (CPR) comprenant une séquence choisie parmi SEQ ID NO: 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec cette séquence et présentant une activité cytochrome P450 réductase. - a heterologous nucleic acid sequence encoding a cytochrome P450 reductase (CPR) comprising a sequence chosen from SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with this sequence and exhibiting cytochrome P450 reductase activity.
29. Levure selon l'une quelconque des revendications 1-28, caractérisée en ce la levure est du genre Saccharomyces, en particulier Saccharomyces cerevisiae. 29. Yeast according to any one of claims 1-28, characterized in that the yeast is of the genus Saccharomyces, in particular Saccharomyces cerevisiae.
30. Utilisation d'une levure selon l'une quelconque des revendications 1-29 pour produire de l'ériodictyol et/ou de la lutéoline. 30. Use of a yeast according to any one of claims 1-29 for producing erodictyol and / or luteolin.
31. Méthode de production de l'ériodictyol et/ou de la lutéoline comprenant la culture d'une levure selon l'une quelconque des revendications 1-29 et éventuellement la récolte de l'ériodictyol et/ou de la lutéoline. 31. A method of producing erodictyol and / or luteolin comprising culturing a yeast according to any one of claims 1-29 and optionally harvesting erodictyol and / or luteolin.
32. Utilisation selon la revendication 30 ou méthode selon la revendication 31, pour la production d'ériodictyol. 32. Use according to claim 30 or method according to claim 31, for the production of erodictyol.
33. Utilisation selon la revendication 30 ou méthode selon la revendication 31, pour la production de lutéoline. 33. Use according to claim 30 or a method according to claim 31, for the production of luteolin.
34. Utilisation selon l'une quelconque des revendications 30, 32 et 33 ou méthode selon l'une des revendication 31, 32 et 33, caractérisée en ce qu'il n'y a pas d'apport de naringénine ou d'apigénine dans le milieu. 34. Use according to any one of claims 30, 32 and 33 or method according to one of claims 31, 32 and 33, characterized in that there is no intake of naringenin or apigenin in the middle.
PCT/EP2020/053485 2019-02-11 2020-02-11 Method for biosynthesising eriodictyol and/or luteolin in a yeast WO2020165178A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP19305161 2019-02-11
EP19305161.2 2019-02-11

Publications (1)

Publication Number Publication Date
WO2020165178A1 true WO2020165178A1 (en) 2020-08-20

Family

ID=65635603

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2020/053485 WO2020165178A1 (en) 2019-02-11 2020-02-11 Method for biosynthesising eriodictyol and/or luteolin in a yeast

Country Status (1)

Country Link
WO (1) WO2020165178A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112391300A (en) * 2020-11-04 2021-02-23 江南大学 Silybum marianum-derived flavone 3 beta-hydroxylase and application of coenzyme thereof
CN117363504A (en) * 2023-12-04 2024-01-09 潍坊医学院 Saccharomyces cerevisiae engineering bacteria for simultaneously producing brown cyanidin and eupatorium, construction method and application thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8809028B2 (en) 2011-11-07 2014-08-19 University Of Georgia Research Foundation, Inc. Biosynthesis of caffeic acid and caffeic acid derivatives by recombinant microorganisms
WO2015092013A1 (en) 2013-12-20 2015-06-25 Deinove Is-targeting system for gene insertion and genetic engineering in deinococcus bacteria
WO2017050853A1 (en) * 2015-09-24 2017-03-30 Evolva Sa Production of anthocyanin from simple sugars

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8809028B2 (en) 2011-11-07 2014-08-19 University Of Georgia Research Foundation, Inc. Biosynthesis of caffeic acid and caffeic acid derivatives by recombinant microorganisms
WO2015092013A1 (en) 2013-12-20 2015-06-25 Deinove Is-targeting system for gene insertion and genetic engineering in deinococcus bacteria
WO2017050853A1 (en) * 2015-09-24 2017-03-30 Evolva Sa Production of anthocyanin from simple sugars

Non-Patent Citations (16)

* Cited by examiner, † Cited by third party
Title
"Genbank de NCBI", Database accession no. KR095306.1
AIGRAIN ET AL., EMBO REPORTS, vol. 10, 2009, pages 742 - 747
ALFENORE ET AL., APPL MICROBIOL BIOTECHNOL., vol. 60, 2002, pages 67 - 72
CHRISTIAN SEITZ ET AL: "Cloning, Functional Identification and Sequence Analysis of Flavonoid 3'-hydroxylase and Flavonoid 3',5'-hydroxylase cDNAs Reveals Independent Evolution of Flavonoid 3',5'-hydroxylase in the Asteraceae Family", PLANT MOLECULAR BIOLOGY, KLUWER ACADEMIC PUBLISHERS, DORDRECHT, NL, vol. 61, no. 3, 1 June 2006 (2006-06-01), pages 365 - 381, XP019405441, ISSN: 1573-5028, DOI: 10.1007/S11103-006-0012-0 *
CHRISTIAN SEITZ ET AL: "Multiple evolution of flavonoid 3',5'-hydroxylase", PLANTA., vol. 242, no. 3, 28 April 2015 (2015-04-28), DE, pages 561 - 573, XP055681756, ISSN: 0032-0935, DOI: 10.1007/s00425-015-2293-5 *
ELLIS T. ET AL., INTEGRATIVE BIOLOGY, vol. 3, no. 2, 2011, pages 109 - 118
HWANG EL ET AL., APPL ENVIRON MICROBIOL., vol. 69, no. 5, 2003, pages 2699 - 2706
ILEF LIMEM-BEN AMOR ET AL: "Biotransformation of naringenin to eriodictyol by Saccharomyces cerevisiea functionally expressing flavonoid 3' hydroxylase", NATURAL PRODUCT COMMUNICATIONS, 1 December 2010 (2010-12-01), United States, pages 1893, XP055594205, Retrieved from the Internet <URL:https://journals.sagepub.com/doi/pdf/10.1177/1934578X1000501211> [retrieved on 20190605] *
JIANG HL ET AL., APPL ENVIRON MICROBIOL., vol. 71, no. 6, 2005, pages 2962 - 9
KATHERINA GARCIA VANEGAS ET AL: "Indirect and direct routes to C-glycosylated flavones in Saccharomyces cerevisiae", MICROBIAL CELL FACTORIES, vol. 17, no. 1, 9 July 2018 (2018-07-09), XP055594222, DOI: 10.1186/s12934-018-0952-5 *
PANDEY ET AL., BIOTECHNOL ADV., vol. 34, 2016, pages 634 - 662
PANDEY RAMESH PRASAD ET AL: "Microbial production of natural and non-natural flavonoids: Pathway engineering, directed evolution and systems/synthetic biology", BIOTECHNOLOGY ADVANCES, ELSEVIER PUBLISHING, BARKING, GB, vol. 34, no. 5, 3 March 2016 (2016-03-03), pages 634 - 662, XP029637369, ISSN: 0734-9750, DOI: 10.1016/J.BIOTECHADV.2016.02.012 *
SEITZ C ET AL: "PUTATIVE FLAVONOID 3'-HYDROXYLASE (CALLISTEPHUS CHINENSIS)", GENBANK ACCESSION AF313488, 18 July 2006 (2006-07-18), XP003009282 *
VERDUYN ET AL., YEAST., vol. 8, 1992, pages 501 - 17
VISSER ET AL., BIOTECHNOLOGY AND BIOENGINEERING, vol. 79, 2002, pages 674 - 81
WELCH, M. ET AL., METHODS IN ENZYMOLOGY, vol. 498, 2011, pages 43 - 66

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112391300A (en) * 2020-11-04 2021-02-23 江南大学 Silybum marianum-derived flavone 3 beta-hydroxylase and application of coenzyme thereof
CN112391300B (en) * 2020-11-04 2022-08-23 江南大学 Application of flavone 3 beta-hydroxylase derived from silybum marianum and coenzyme thereof
CN117363504A (en) * 2023-12-04 2024-01-09 潍坊医学院 Saccharomyces cerevisiae engineering bacteria for simultaneously producing brown cyanidin and eupatorium, construction method and application thereof
CN117363504B (en) * 2023-12-04 2024-02-23 潍坊医学院 Saccharomyces cerevisiae engineering bacteria for simultaneously producing brown cyanidin and eupatorium, construction method and application thereof

Similar Documents

Publication Publication Date Title
EP3924498A1 (en) Method for the biosynthesis of diosmin and/or hesperidin in a microorganism
US9404129B2 (en) Metabolically engineered cells for the production of resveratrol or an oligomeric or glycosidically-bound derivative thereof
EP3924472A1 (en) Method for biosynthesising diosmetin and/or hesperetin in a microorganism
US7303900B2 (en) Methods for the production of tyrosine, cinnamic acid and para-hydroxycinnamic acid using recombinant microorganisms
JP2009543572A (en) Metabolically modified cells for producing pinosylvin
CN105555959B (en) Process for producing aromatic alcohols
WO2020165178A1 (en) Method for biosynthesising eriodictyol and/or luteolin in a yeast
US20220348974A1 (en) Biotin synthases for efficient production of biotin
EP4107276A1 (en) Method for the incorporation of formaldehyde into biomass
EP4055142A1 (en) Recombinant yeast capable of producing caffeic acid and/or ferulic acid
EP3656857A1 (en) Utilization of phosphoketolase for production of aromatic amino acid derived products
EP4153732A1 (en) Method for the biosynthesis of phenylpropanoids
WO2022241298A2 (en) Engineered cells, enzymes, and methods for producing cannabinoids
CN116981769A (en) Microbial production of tyrosol and salidroside
Zhou et al. Versatile CYP98A enzymes catalyse meta‐hydroxylation reveals diversity of salvianolic acids biosynthesis
WO2023094774A1 (en) Method for the biosynthesis of caffeic acid and ferulic acid
WO2019059337A1 (en) Nootkatone production method
CN114317304B (en) Construction method and application of saccharomyces cerevisiae chlorogenic acid-producing engineering strain

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20703065

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20703065

Country of ref document: EP

Kind code of ref document: A1