WO2019162620A1 - Method for determining a pathology by analysis of faecal material using maldi-tof mass spectrometry - Google Patents

Method for determining a pathology by analysis of faecal material using maldi-tof mass spectrometry Download PDF

Info

Publication number
WO2019162620A1
WO2019162620A1 PCT/FR2019/050397 FR2019050397W WO2019162620A1 WO 2019162620 A1 WO2019162620 A1 WO 2019162620A1 FR 2019050397 W FR2019050397 W FR 2019050397W WO 2019162620 A1 WO2019162620 A1 WO 2019162620A1
Authority
WO
WIPO (PCT)
Prior art keywords
values
relative intensities
peak
intensity
range
Prior art date
Application number
PCT/FR2019/050397
Other languages
French (fr)
Inventor
Hervé Chaudet
Didier Raoult
Jean-Christophe LAGIER
Grégory DUBOURG
Frédéric CADORET
Sophie AMRANE
Niokhor DIONE
Original Assignee
Fondation Mediterranee Infection
Universite D'aix-Marseille
Assistance Publique - Hopitaux De Marseille
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fondation Mediterranee Infection, Universite D'aix-Marseille, Assistance Publique - Hopitaux De Marseille filed Critical Fondation Mediterranee Infection
Publication of WO2019162620A1 publication Critical patent/WO2019162620A1/en

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • G01N33/6851Methods of protein analysis involving laser desorption ionisation mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/4833Physical analysis of biological material of solid biological material, e.g. tissue samples, cell cultures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8809Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
    • G01N2030/8813Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/005Assays involving biological materials from specific organisms or of a specific nature from viruses
    • G01N2333/08RNA viruses
    • G01N2333/15Retroviridae, e.g. bovine leukaemia virus, feline leukaemia virus, feline leukaemia virus, human T-cell leukaemia-lymphoma virus
    • G01N2333/155Lentiviridae, e.g. visna-maedi virus, equine infectious virus, FIV, SIV
    • G01N2333/16HIV-1, HIV-2
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/195Assays involving biological materials from specific organisms or of a specific nature from bacteria
    • G01N2333/33Assays involving biological materials from specific organisms or of a specific nature from bacteria from Clostridium (G)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/06Gastro-intestinal diseases
    • G01N2800/065Bowel diseases, e.g. Crohn, ulcerative colitis, IBS
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers

Definitions

  • the present invention relates to a method for determining a pathology of a human individual by analyzing a faecal sample of said human individual by MALDI-TOF mass spectrometry.
  • MALDI-TOF mass spectrometry is a technique that allows the desorption of proteins from a biological product, subjecting them to an electric field and measuring the time of flight of the peptides ("AM of flight") which is determined both by their weight and by their electrical charge.
  • AM of flight the time of flight of the peptides
  • mass spectrometry is a physical analysis technique for detecting and identifying molecules of interest by measuring their mass. Its principle lies in the gas phase separation of charged molecules (ions) according to their mass / charge ratio (m / z). It also makes it possible to characterize the chemical structure of the molecules by fragmenting them. Its easy, fast and inexpensive use has spread widely in many scientific fields, including biology. Thus, combined with other approaches, it allows the study of the proteome. Recently extended to medicine, it makes it possible to study the serum of patients, a complex mixture of proteins, which can be useful for the diagnosis of various diseases. Mass spectrometry under its MALDI-TOF variant (matrix-assisted laser desorption ionization-time-of-flight) has recently entered the microbiology laboratories.
  • MALDI-TOF variant matrix-assisted laser desorption ionization-time-of-flight
  • MALDI-TOF mass spectrometry allows the detection of bacterial toxins. It also identifies and classifies different bacterial types using intact bacteria. Indeed, among the various components identified in a MALDI-TOF mass spectrometry spectrum, some appear to be specific to a specific bacterial species. Thus, it has been possible to identify a large number of bacterial species in clinical specimens using databanks made from each of these species. In recent years, MALDI-TOF mass spectrometry has emerged in clinical microbiology laboratories for the identification of colonies of bacteria or yeasts isolated on solid culture medium from human samples. Indeed, its assets are numerous: (1) speed of identification (in minutes); (2) precision of identification (without the need to know the type of microorganism sought); and (3) low cost per sample (less than 50 cents per sample).
  • WO 2016066930 there is described a method for identifying microorganisms directly from urine samples of patients, without a culture step, in order to be able to obtain in a very short time the identification of pathogenic microorganisms in the patient samples. .
  • MALDI-TOF mass spectrometry has made it possible to characterize various spores of fungi, yeasts and pollens, in particular in US 2003/027231.
  • WO 2011154650 it has been described that it is possible to identify, that is, to characterize in a specific manner, from whole cells (that is to say cells that have not been previously lysed before analysis).
  • mammalian eukaryotic cell types by MALDI-TOF mass spectrometry. This has been made possible by taking into account all the peaks of the spectra, that is to say by a combinatorial analysis of the spectra involving spectrum-to-spectrum comparison and not the search for specific peaks in themselves. taken separately.
  • the present invention consists in the in vitro analysis by the MALDI-TOF mass spectrometry technique of faeces without prior treatment followed by the analysis of the spectra obtained by standardization treatment, smoothing and calibration of the spectra after definition. criteria of quality, allowing groupings perfectly corresponding to the identity of the pathologies of the subjects whose stool samples were tested.
  • the present invention provides a method for determining a pathology of a human individual by analysis of a sample of faeces without prior treatment, of said human individual by MALDI-TOF mass spectrometry, in which: a) a combination of a plurality of discriminating peaks is determined for which thresholds of intensity values are distinguishing the spectra of faecal specimens from individuals having said pathology from the spectra of faecal samples of individuals not having said pathology, as a function of the intensity values of said discriminating peaks; b) the spectrum of a sample of faeces to be analyzed is analyzed as it is without prior treatment of said sample and c) it is checked whether the spectrum of said sample of faeces to be analyzed comprises said discriminating peaks and if the values of the intensities of the Discriminant peaks correspond to a combination of intensity values corresponding to the spectra of individuals presenting the said pathology or of individuals not having the said pathology as determined in step a).
  • the inventors consider as likely without being bound by this theory that this discovery of a specificity of discrimination allowing the determination of a pathology of a human individual by analysis of a sample of faeces by MALDI-TOF type mass spectrometry. This may result from the fact that the protein composition of the feces is conditioned by the composition of the microbial ecosystem of the digestive tract and the eating habits which in practice would therefore be correlated with the pathology of the individual.
  • is meant a living being in the broad sense, human or animal, preferably a mammal and preferably a human being, man, woman or child.
  • the pathology of a human individual is an inflammatory pathology or an infectious disease.
  • infectious diseases, or infections are pathologies caused respectively by microbiological agents such as bacteria or viruses.
  • AIDS disease is an infectious disease caused by a virus.
  • the pathology of a human individual or the infectious disease is a pathology or a disease of the digestive system.
  • step a) a combination of a plurality of discriminant peaks is determined, characterized in that ranges of intensity values are determined which make it possible to distinguish the spectra of samples from the individuals presenting said pathology and the spectra of samples of individuals not presenting said pathology, as a function of the different values of the intensities of the discriminant peaks concerned in the spectrum of a sample to be analyzed, thus making it possible to determine the presence or absence of said pathology according to whether for said discriminant peaks the intensity of each discriminating peak is specifically within or outside at least a range of intensity values, said ranges may be identical or preferably different for the different discriminating peaks.
  • a said range is constituted by the values above or below a threshold of intensity values. More particularly, according to a first embodiment illustrated in Examples 1 to 3, in step a), the presence or absence of said pathology is determined, depending on whether for said discriminating peaks the intensity values are included in a first range of intensity values for determining the presence of said pathology or within a second range of intensity values for determining the absence of said pathology, said first and second ranges not overlapping each other not, and for each said discriminating peak.
  • step a) the probability of presence of said pathology is even greater than the number of said discriminating peaks for which the relative intensity values are at within said first ranges, is larger and greater than the number n2 of said discriminating peaks for which the relative intensity values are within said second ranges.
  • step a) the probability of presence of said pathology is 100% if, for all the said specific discriminant peaks, the relative intensity values are inside the said first ranges, and the probability of absence of said pathology is 100% if for all said discriminating peaks the values of relative intensities are within said second ranges.
  • the so-called 8 discriminant peaks are peaks at 2710, 3372, 3399, 3408, 3445, 4374, 5658 , 11047 Da at +/- 3x10 ⁇
  • said first and second intensity value ranges for said 8 subsequent discriminant peaks expressed as d Relative intensities with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
  • a said first range of values of relative intensities corresponds to the values of relative intensities lower than 4.56326002121813 ⁇ 10 5 .
  • a said second range of values of relative intensities corresponds to the values of relative intensities higher than 4.86226943144253x 10 5 ;
  • a said first range of values of relative intensities corresponds to the values of relative intensities greater than 0.000434223789748754,
  • a said second range of relative intensity values corresponds to values of relative intensities lower than 0.000339153329205546;
  • a said first range of values of relative intensities corresponds to values of relative intensities higher than
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 9.7561289741134 ⁇ 10 5 ;
  • a said first range of values of relative intensities corresponds to values of relative intensities higher than
  • a said second range of relative intensity values corresponds to the values of relative intensities lower than 9.78528309013007 x 10 5 ;
  • a said first range of values of relative intensities corresponds to values of relative intensities higher than
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000634234550815951;
  • a said first range of values of relative intensities corresponds to the values of relative intensities lower than 9.55157313225957 ⁇ 10 5 , and
  • a said second range of values of relative intensities corresponds to values of relative intensities higher than
  • a said first range of relative intensity values corresponds to values of relative intensities greater than 4.3325324409441 ⁇ 10 5 .
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 5.23774442820013 ⁇ 10 5 ;
  • a said first range of values of relative intensities corresponds to values of relative intensities lower than 4.98150891075045 ⁇ 10 5 , and
  • a said second range of values of relative intensities corresponds to the values of relative intensities greater than 5.199534671731 10 '5 .
  • Crohn's disease is determined for which in step a), 3 first and second ranges of intensity values of 3 discriminating peaks have been identified.
  • the said 3 discriminating peaks are peaks at 3343, 4134 and 4170 Da at +/- 0.5%.
  • said first and second ranges of intensity values for said 3 subsequent discriminating peaks expressed in values of relative intensities with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
  • a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000153184507861765, and
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000121099556323652; and -For the peak at 4134 Da,
  • a said first range of values of relative intensities corresponds to values of relative intensities higher than
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 5.33325181290711 ⁇ 10 5 ;
  • a said first range of relative intensity values corresponds to values of relative intensities higher than
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000115898008983965.
  • the presence or absence of the ulcero-haemorrhagic rectocolitis disease is determined for which, in step a), 11 first and second ranges of values are determined. intensities of 11 discriminating peaks.
  • the said 3 specific discriminating peaks are peaks at 3324, 3345, 3444, 3482, 3493, 6451, 7268, 9599, 9620, 9636, 9707 Da at +/- 0.5%.
  • the said first and second ranges of relative intensity values for the following discriminant peaks expressed in values of relative intensities with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
  • a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000202084, and a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000120628;
  • a said first range of values of relative intensities corresponds to the values of relative intensities greater than 9.9939 ⁇ 10 5 .
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 9.2912 ⁇ 10 5 ;
  • a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000201322;
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000122590
  • a said first range of values of relative intensities corresponds to the values of relative intensities greater than 0.0001360367
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000119304;
  • a said first range of values of relative intensities corresponds to the values of relative intensities greater than 0.000289962
  • a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000183699;
  • a said first range of relative intensity values corresponds to relative intensity values lower than 9.6737 ⁇ 10 5
  • a said second range of values of relative intensities corresponds to the values of relative intensities greater than 0.000107099 ⁇ 10 5 ;
  • a said first range of values of relative intensities corresponds to the values of relative intensities lower than 6.0910 ⁇ 10 5 .
  • a said second range of values of relative intensities corresponds to the values of relative intensities higher than 9.51116 ⁇ 10 5 ;
  • a said first range of values of relative intensities corresponds to the values of relative intensities lower than 5.4585 ⁇ 10 5 .
  • a said second range of values of relative intensities corresponds to the values of relative intensities greater than 8.0165 ⁇ 10 5 ;
  • a said first range of values of relative intensities corresponds to values of relative intensities lower than 5.48801 ⁇ 10 5 .
  • a said second range of values of relative intensities corresponds to the values of relative intensities greater than 7.5820 ⁇ 10 5 ;
  • a said first range of values of relative intensities corresponds to values of relative intensities lower than 5.75858 ⁇ 10 5 .
  • a said second range of values of relative intensities corresponds to relative intensity values greater than 7.473082 ⁇ 10 5 ;
  • a said first range of values of relative intensities corresponds to values of relative intensities lower than 4.9587 ⁇ 10 5 ; and a second range of values of relative intensities corresponds to the values of relative intensities greater than 7.322658 ⁇ 10 5 .
  • one or more combinations of said discriminating peaks are determined with: a) first ranges of intensity values of said discriminating peaks of said combination to determine the presence of the said pathology and b) second ranges of intensity values of said discriminating peaks of said combination to determine the absence of said pathology, c) at least some of said first and second overlapping forks for some of said discriminant peaks, but nevertheless allowing the plurality of the discriminating peaks to determine the presence of said pathology by the series of intensity values for said discriminating peaks of the combination according to whether they are inside or outside the said first forks or second forks.
  • this embodiment consists in constituting a decision tree for determining the presence of said pathology involving the comparison of the peaks and intensity values of a spectrum to be analyzed with respect to the plurality of pairs (peak-range (s) ) of intensities) of said combination.
  • said first ranges and second ranges are determined consisting of values above and below thresholds of intensity values.
  • said thresholds of intensity values are determined by approximation to median values of intensity values of the intervals between said first and second ranges.
  • the presence or absence of AIDS disease resulting from infection is determined. by the HIV for which in step a), 4 said first ranges and second ranges of intensity values of 4 discriminating peaks are determined.
  • the presence or absence of AIDS disease resulting from an HIV infection is determined for which in step a), 4 thresholds of intensity values are determined. 4 discriminating peaks such as:
  • the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1
  • the intensity of peak No. 2 is less than the threshold of intensity of peak No. 2
  • the intensity of peak No. 3 is greater than the intensity threshold of peak No. 3, or
  • the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1, the intensity of peak No. 2 is less than the threshold of intensity of peak No. 2, the intensity of peak No. 3 is below the threshold of intensity of peak 3 and the intensity of peak No. 4 is less than the intensity threshold of peak No. 4;
  • the intensity of peak no. 1 is below the intensity threshold of peak no. 1,
  • the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1 and the intensity of peak No. 2 is greater than the intensity threshold of peak No. 2, and
  • the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1, the intensity of peak No. 2 is less than the threshold of intensity of peak No. 2, the intensity of peak No. ° 3 is below the intensity threshold of peak No. 3 and the intensity of peak No. 4 is greater than the intensity threshold of peak No. 4.
  • peaks 1 to 4 are, at +/- 3x10 4 :
  • the relative intensity thresholds of said discriminant peaks are threshold values of Relative intensities expressed as relative intensity values with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
  • the presence or the absence of a pathology of a human individual is determined by analysis of a sample of feces by MALDI-TOF mass spectrometry in which the said Discriminant peaks are not present in the spectra of a pathogen sample responsible for said isolated pathology, but reflect a change in the composition of the feces associated with said pathology.
  • step a) a combination of a plurality of discriminant peaks is determined for which first ranges and second ranges of discriminant peak intensity values have been determined allowing to distinguish the spectra of samples from the individuals affected by the pathology and the spectra of samples of individuals not affected by the pathology, as a function of the different values of the intensities of the discriminating peaks in the spectrum of a sample to be analyzed thus making it possible to constitute a binary decision tree belonging or not to said species according to whether for said discriminant peaks taken successively the intensity of each peak is specifically within or outside said first ranges or second ranges.
  • said discriminant peaks are not present in the spectra of a protein sample specific for a pathology in said individual.
  • the peaks of said spectra are defined by a pair of coordinates composed of an abscissa consisting of the mass / charge ratio (m / z) of 2,000 to 20,000 Da, more particularly of 3,000 to 15,000 Da, the ordinate coordinate being a relative intensity or arbitrary unit, and is preferably retained in the spectrum at least 40 peaks of greater intensities.
  • the method according to the invention makes it possible to discriminate a group of subjects presenting a said pathology with a number of 1 to 15 discriminating peaks, preferably from 3 to 10 discriminating peaks.
  • the values of the molecular masses m / z may vary up to ⁇ 0.5%, preferably +/- 3 ⁇ 10 4 of the average value mentioned in the tables, and
  • the relative intensity values can vary up to ⁇ 0.5%, preferably +/- 3 ⁇ 10 5 of the average value of relative intensity mentioned in the tables, and
  • m / z the value of the ionized species.
  • the values reported in the tables were obtained by analysis in an ⁇ -cyano-4-hydroxycinnamic acid matrix solution. Specifically, the crude stools were mixed with a solution of ⁇ -cyano-4-hydroxycinnamic acid matrix, in said mass spectrometric analysis and not before.
  • Figures A to E illustrate the general method of spectral processing to identify the discriminant peaks described below.
  • FIGS. 1A, 2A, 3A, 4A show the results of the binary discriminant analyzes with the discriminant powers of the 40 peaks (on the ordinate: m / z (Da)) of better discriminant scores for the group of patients infected with Clostridium difficile (CDI).
  • CDI Clostridium difficile
  • FIGS. 1A, 2A, 3A, 4A show the results of the binary discriminant analyzes with the discriminant powers of the 40 peaks (on the ordinate: m / z (Da)) of better discriminant scores for the group of patients infected with Clostridium difficile (CDI).
  • CDI Clostridium difficile
  • FIGS. 1B, 2B, 3B and 4B show the distributions of the peak intensity values having a discriminating power of 100% for the group of patients infected with clostridium difficile (CDI) of Example 1 (FIG. 1B), the group of patients with ulcerative colitis (UC) of Example 2 ( Figure 2B), the group of patients with Crohn's disease of Example 3 ( Figure 3B), the group of patients with AIDS of the Example 4 ( Figure 4B).
  • CDI clostridium difficile
  • UC ulcerative colitis
  • Figure 3B the group of patients with Crohn's disease of Example 3
  • Figure 4B the group of patients with AIDS of the Example 4
  • Figure 5 shows the binary classification tree from 4 specific peaks discriminating for HIV disease as a function of intensity versus threshold values, of Example 4.
  • the method according to the present invention called the "MERDI-TOF method"("MERDI” from the Latin “merda” which means feces and “TOF”, from the English time of flight), with reference to the MALDI-mass spectrometry technique.
  • TOF consists of analysis by this technique of MALDI-TOF mass spectrometry of faeces without prior treatment followed by the analysis of the spectra.
  • the plate is dried for five minutes and then analyzed in Microflex-type mass spectrometry (Bruker Daltonics, Bremen, Germany).
  • the M ERDI-TOF method was evaluated on two types of stool: a stool of "normal" consistency, and a stool with diarrhea.
  • a 50th dilution range was made on 10 tubes with PBS (Phosphate Buffered Saline).
  • PBS Phosphate Buffered Saline
  • Each dilution and the undiluted stool was directly deposited on a MALDI-TOF plate and identified as described above.
  • PBS was used as a negative control.
  • the spectra obtained from the first to the 10th dilution were identical to the unadulterated stool spectrum that differed from the negative control spectrum. Thus we validated the method and its application to stools of any consistency.
  • the spectral acquisition method includes the following steps and features:
  • IS1 electrode 20.00 kV
  • IS2 electrode 18.05 kV
  • Focusing Electrode 6 kV
  • Laser Frequency 60 Hz
  • Gain detector 8.8 X
  • Post-ion-extraction 120 ns
  • Mass range from 700 to 20000 Da.
  • the purpose of this treatment and analysis is to identify the combination of peaks to discriminate groups of samples and allow the subsequent identification of a sample.
  • MALDIANT a versatile R package for the analysis of mass spectrometry data.
  • R package version 1.17 "binda” [Sebastian Gibb and Korbinian Strimmer (2015) binda: Multi-Class Discriminant Analysis using Binary Predictors.
  • R package version 1.0.3] and "C50” [Max Kuhn, Weston Steve, Culp Mark, Nathan Coulter, Ross Quinlan (2017).
  • C50 C5.0 Decision Trees and Rule-Based Models.
  • the spectra files are copied from the disks of the MALDI-TOF mass spectrometry automata. For each spectrum two files are needed: the file called "fid" by the PLC and containing the spectrum data and the file called "acqu” by the PLC and containing the spectrum acquisition parameters made by the FLEXCONTROL software.
  • the treatment of the raw spectra (FIG. A) from MALDI-TOF Brucker Microflex spectrometers comprises the following usual steps of:
  • each line is a spectrum with the relative intensities of the peaks
  • each column corresponding to a peak of the list of masses m / z of the protein peaks of the first line, the relative intensity of the peaks corresponding to the area of said peak relative to the sum of the peak areas of said spectrum.
  • This matrix of intensities is the experimental material which will be the subject of the spectral analyzes which follow.
  • the lines of the intensity matrix are firstly associated with the groups of samples that are to be discriminated (group of subjects presenting the pathology concerned vs the control group of healthy subjects).
  • a first step aims to identify the peaks having the greatest discriminating power between the groups. It is based on the iterative application of a binary discriminant analysis on each peak, ie the search for each peak of the relative intensity threshold value which allows to maximize the separation of the groups and the discrimination score (measure of overlap or separation of intensities) groups. This score makes it possible to build the list of the peaks according to their decreasing discriminating power.
  • At the end of this first step we search if there is a set of peaks having 100% contrast (that is to say without overlap), ie characteristics of each group. If this is the case, this peak set is retained, with the threshold values identified by the binary discriminant analysis.
  • the identification of the spectra is done here by a score resulting from a linear combination of presence of peaks (linear score of resemblance to a norm) as illustrated in Examples 1 to 3.
  • Example 1 Identification of ulcerative colitis with Clostridium difficile.
  • Clostridium difficile ulcerative colitis is a very serious disease that probably kills more than 100,000 people a year worldwide, 30,000 in Europe, 30,000 in the United States. This disease is due to the association of faecal flora disruption with the presence of a Clostridium difficile toxin-secreting microbe.
  • the gut microbiota of apparently healthy control controls and patients with Clostridium difficile ulcerative colitis detected by molecular techniques have been studied. had Clostridium difficile with its toxin in patients who had typical clinical signs of this disease.
  • C. difficile colitis defined by the presence of diarrhea were used concomitantly with the detection of C. difficile toxin in the stool.
  • the presence of C. difficile toxin was investigated by real-time PCR (RT-PCR) with the GeneXpert® IV kit (Cepheid, Sunnyvale, USA) detecting the tcd B gene of toxin B, the cdt toxin gene binary and deletion 117 of the tcdC regulator locus for detecting strains of genotype 027.
  • the binary discriminant analysis of these 17 samples made it possible to prioritize the 984 protein peaks retained in a matrix of relative intensities obtained by the pretreatment described above.
  • the result of the binary discriminant analysis showing the 40 peaks of the highest discriminating scores is shown in FIG. 1A in which the discriminant score is quantified from -4 to +4 for the infected group (CDI) and the control group (control). .
  • a positive score corresponds to the presence of the peak for the group considered and vice versa.
  • the discriminant analysis results of FIG. 1A result from the distributions of values of the relative intensities including the value distributions for the most discriminating peaks shown in FIG.
  • Table 1 Discriminant threshold values for peaks with 100% contrast. These thresholds are expressed in values of relative intensities with respect to the normalized surface at the value 1 of the total surface of the spectrum.
  • the standardized discriminant score is the score divided by the number of discriminating peaks (1: certainty of resemblance to cases, -1: certainty of resemblance to controls).
  • Example 2 Stool identification of subjects with hemorrhagic rectocolitis (RCH).
  • Table 2 Discriminant intensity threshold values for peaks with 100% contrast. These thresholds are expressed in values of relative intensities with respect to the normalized surface at the value 1 of the total surface of the spectrum.
  • Fig. 2A The discriminant analysis results of Fig. 2A result from the distributions of values of the relative intensities including the value distributions for the most discriminating peaks shown in Fig. 2B.
  • the method of identifying a spectrum from these discriminating peaks is as follows. After normalization, only the values of the 8 discriminating peaks are retained, with a tolerance of the value m / z of the peaks which can be set by default at 5% o, preferably 3x10
  • An identification score is calculated as follows: Each peak 3324, 3345, 3444, 3482, 3493 above its threshold in the preceding table and each peak 6451, 7268, 9599, 9620, 9636, 9707 below its threshold in the preceding table is equal to 1 point, 0 if the intensity of the peak is between the 2 value zones, and -1 if the intensity is in the opposite zone of values.
  • the normalized score is the score divided by the number of discriminating peaks (1: certainty of resemblance to cases, -1: certainty of resemblance to controls).
  • Example 3 Stool identification of subjects with Crohn's disease.
  • the discriminant scores are quantified from -4 to +4 for the group of patients (RCH) and the control group (control).
  • a positive score corresponds to the presence of the peak for the group considered.
  • Table 3 Discriminant threshold values for peaks with 100% contrast. These thresholds are expressed in values of relative intensities with respect to the normalized surface at the value 1 of the total surface of the spectrum.
  • Each peak 3443, 4134, 4170 greater than its threshold in the preceding table is worth 1 point, 0 if the intensity of the peak is between the 2 value zones, and -1 if the intensity is in the zone of opposite values.
  • the normalized score is the score divided by the number of discriminating peaks (1: certainty of resemblance to cases, -1: certainty of resemblance to controls).
  • the samples come from 54 HIV-positive patients, one HIV-Free patient, and 37 controls.
  • the 396 raw spectra were subjected to the treatments described above.
  • the peaks making it possible to discriminate the HIV positive patients (cases) from the controls were sought by the second treatment described.
  • the result of the binary discriminant analysis with the 40 most discriminating peaks is reported in Figure 4A.
  • FIG. 4B shows the distribution of the relative intensity values of the highest discriminating score peaks obtained by the analysis of FIG. 5. No peak makes it possible to discriminate a group with 100% contrast.
  • Table 4 Intensity discriminant threshold values for discriminating peaks +/- 3xl0 4. These thresholds are expressed in values of relative intensities with respect to the normalized surface at the value 1 of the total surface of the spectrum.
  • the discriminant scores are quantified from -5 to +5 for the group of patients (HIV) and the control group (control). A positive score corresponds to the presence of the peak for the group considered.
  • the relative intensity of the peak P2 is less than the intensity threshold of 0.0006103814 and the relative intensity of the peak P3 is greater than the intensity threshold of 0.000110201, or
  • the relative intensity of the peak P2 is less than the intensity threshold of 0.0006103814
  • the relative intensity of the peak P3 is less than the intensity threshold of
  • the relative intensity of peak P2 is less than the intensity threshold of

Abstract

The present invention concerns a method for determining a pathology of a human individual by analysis of a faecal material sample of said human individual by MALDI-TOF mass spectrometry, involving: a) determining a combination of a plurality of discriminating peaks for which thresholds of intensity values have been determined, making it possible to distinguish between the spectra of faecal material samples of individuals presenting said pathology and the spectra of faecal material samples of individuals not presenting said pathology, as a function of the values of the intensities of the so-called discriminating peaks; b) producing the spectrum of a faecal material sample to be analysed, and c) verifying whether the spectrum of said faecal material sample to be analysed includes said discriminating peaks and whether the values of the intensities of the discriminating peaks correspond to a combination of values of intensities corresponding to the spectra of individuals presenting said pathology or of individuals not presenting said pathology, as determined in step a).

Description

Méthode de détermination d'une pathologie par analyse de matière fécale par spectrométrie de masse de type MALDI-TOF.  Method of determining a pathology by fecal analysis by MALDI-TOF mass spectrometry.
La présente invention concerne une méthode de détermination d'une pathologie d'un individu humain par analyse d'un échantillon de matières fécales du dit individu humain par spectrométrie de masse de type MALDI-TOF. The present invention relates to a method for determining a pathology of a human individual by analyzing a faecal sample of said human individual by MALDI-TOF mass spectrometry.
La spectrométrie de masse de type MALDI-TOF est une technique qui permet la désorption des protéines d'un produit biologique, de les soumettre à un champ électrique et de mesurer le temps de vol des peptides (« AM of flight ») qui est déterminé à la fois par leur poids et par leur charge électrique. Cette technique a de très multiples usages et a été très largement utilisé pour l'identification bactérienne [ 1] mais aussi pour l'identification des animaux dont les arthropodes et les mammifères [2-5]. MALDI-TOF mass spectrometry is a technique that allows the desorption of proteins from a biological product, subjecting them to an electric field and measuring the time of flight of the peptides ("AM of flight") which is determined both by their weight and by their electrical charge. This technique has very many uses and has been widely used for bacterial identification [1] but also for the identification of animals including arthropods and mammals [2-5].
Plus précisément, la spectrométrie de masse est une technique physique d'analyse permettant de détecter et d'identifier des molécules d'intérêt par mesure de leur masse. Son principe réside dans la séparation en phase gazeuse de molécules chargées (ions) en fonction de leur rapport masse/charge (m/z). Elle permet en outre de caractériser la structure chimique des molécules en les fragmentant. Son utilisation, facile, rapide et peu coûteuse, s'est largement répandue dans de nombreux domaines scientifiques, y compris en biologie. C'est ainsi que, associée à d'autres approches, elle permet l'étude du protéome. Etendue récemment à la médecine, elle permet d'étudier le sérum des patients, un mélange complexe de protéines, ce qui peut être utile au diagnostic de différentes maladies. La spectrométrie de masse sous sa variante MALDI-TOF (matrix-assisted laser désorption ionization-time-of-flight) est récemment entrée dans les laboratoires de microbiologie. Elle permet en effet la détection des toxines bactériennes. Elle permet également d'identifier et de classifier différents types bactériens en utilisant des bactéries intactes. En effet, parmi les divers composants identifiés dans un spectre de spectrométrie de masse MALDI-TOF, certains semblent spécifiques d'une espèce bactérienne précise. Ainsi, il a été possible d'identifier un grand nombre d'espèces bactériennes dans des prélèvements cliniques en utilisant des banques de données fabriquées à partir de chacune de ces espèces. La spectrométrie de masse de type MALDI-TOF s'est imposée ces dernières années dans les laboratoires de microbiologie clinique pour l'identification des colonies de bactéries ou de levures isolées sur milieu de culture solide à partir de prélèvements humains. En effet, ses atouts sont nombreux : (1) rapidité de l'identification (en quelques minutes) ; (2) précision de l'identification (sans nécessité préalable de connaître le type de microorganisme recherché) ; et (3) faible coût par échantillon (moins de 50 centimes d'euros par échantillon). Specifically, mass spectrometry is a physical analysis technique for detecting and identifying molecules of interest by measuring their mass. Its principle lies in the gas phase separation of charged molecules (ions) according to their mass / charge ratio (m / z). It also makes it possible to characterize the chemical structure of the molecules by fragmenting them. Its easy, fast and inexpensive use has spread widely in many scientific fields, including biology. Thus, combined with other approaches, it allows the study of the proteome. Recently extended to medicine, it makes it possible to study the serum of patients, a complex mixture of proteins, which can be useful for the diagnosis of various diseases. Mass spectrometry under its MALDI-TOF variant (matrix-assisted laser desorption ionization-time-of-flight) has recently entered the microbiology laboratories. It allows the detection of bacterial toxins. It also identifies and classifies different bacterial types using intact bacteria. Indeed, among the various components identified in a MALDI-TOF mass spectrometry spectrum, some appear to be specific to a specific bacterial species. Thus, it has been possible to identify a large number of bacterial species in clinical specimens using databanks made from each of these species. In recent years, MALDI-TOF mass spectrometry has emerged in clinical microbiology laboratories for the identification of colonies of bacteria or yeasts isolated on solid culture medium from human samples. Indeed, its assets are numerous: (1) speed of identification (in minutes); (2) precision of identification (without the need to know the type of microorganism sought); and (3) low cost per sample (less than 50 cents per sample).
Parmi les fabricants de spectromètre de masse, deux systèmes MALDI-TOF complets sont disponibles à la vente, commercialisés par les sociétés Bruker Daltonics (Allemagne) et Biomérieux (France). Chaque instrument est accompagné d'un logiciel de pilotage, d'une banque de données obtenue à partir de colonies isolées en milieu solide et d'un système expert permettant l'identification du microorganisme reposant sur l'analyse du spectre généré par le spectromètre de masse. Une application de cette technologie à l'identification des bactéries implique actuellement l'isolement de colonies (obtenues après 24h - 48h de culture) et l'analyse de bactéries entières ou d'extraits protéiques de bactéries isolées, les dites bactéries étant isolées directement à partir des prélèvements de patients. Among mass spectrometer manufacturers, two complete MALDI-TOF systems are available for sale, marketed by Bruker Daltonics (Germany) and Biomérieux (France). Each instrument is accompanied by a control software, a database obtained from colonies isolated in solid medium and an expert system allowing the identification of the microorganism based on the analysis of the spectrum generated by the spectrometer. mass. An application of this technology to the identification of bacteria currently involves the isolation of colonies (obtained after 24h - 48h of culture) and the analysis of whole bacteria or protein extracts of isolated bacteria, said bacteria being isolated directly from from patient samples.
Dans WO 2016066930, on a décrit une méthode d'identification des microorganismes directement à partir de prélèvements d'urines de patients, sans étape de culture, afin de pouvoir obtenir dans des délais très rapides l'identification de microorganismes pathogènes dans les prélèvements de patients. In WO 2016066930, there is described a method for identifying microorganisms directly from urine samples of patients, without a culture step, in order to be able to obtain in a very short time the identification of pathogenic microorganisms in the patient samples. .
Enfin, la spectrométrie de masse MALDI-TOF a permis de caractériser différentes spores de champignons, levures et des pollens, notamment dans US 2003/027231. Finally, MALDI-TOF mass spectrometry has made it possible to characterize various spores of fungi, yeasts and pollens, in particular in US 2003/027231.
Dans WO 2011154650, on a décrit qu'il était possible d'identifier, c'est-à-dire de caractériser de manière spécifique, à partir de cellules entières (c'est-à-dire de cellules non préalablement lysées avant analyse) des types de cellules eucaryotes mammifères par spectrométrie de masse de type MALDI-TOF. Ceci a été rendu possible par une prise en compte de l'ensemble des pics des spectres, c'est-à-dire par une analyse combinatoire des spectres impliquant la comparaison spectre à spectre et non pas la recherche de pics spécifiques en eux-mêmes pris séparément. Cette caractérisation spécifique résulte de ce que, lors d'une spectrométrie de masse du type MALDI-TOF, lesdites protéines intracellulaires sont en nombre suffisant et leur nature et leur proportion relative sont suffisamment distinctes et variables et donc spécifiques entre les différents types cellulaires eucaryotes pour permettre une caractérisation spécifique du type de cellules par une analyse du spectre de masse de cette combinaison de protéines, sous réserve que l'on ne cherche pas à identifier lesdites cellules à partir de pics spécifiques, correspondant à des protéines spécifiques, mais par une analyse combinatoire de pics, à savoir par comparaison de spectres complets, notamment d'au moins 70 pics. In WO 2011154650, it has been described that it is possible to identify, that is, to characterize in a specific manner, from whole cells (that is to say cells that have not been previously lysed before analysis). mammalian eukaryotic cell types by MALDI-TOF mass spectrometry. This has been made possible by taking into account all the peaks of the spectra, that is to say by a combinatorial analysis of the spectra involving spectrum-to-spectrum comparison and not the search for specific peaks in themselves. taken separately. This specific characterization results from the fact that, in MALDI-TOF type mass spectrometry, said intracellular proteins are in sufficient number and their nature and relative proportion are sufficiently distinct and variable and therefore specific between the different eukaryotic cell types for allow a specific characterization of the cell type by mass spectral analysis of this combination of proteins, provided that it is not sought to identify said cells from specific peaks, corresponding to specific proteins, but by an analysis combination of peaks, ie by comparison of complete spectra, in particular of at least 70 peaks.
L'étude du microbiote digestif réalisée par des techniques de biologie moléculaire métagénomique mais aussi par des techniques de culture appelées culturomics [6, 7] révèle une diversité des microbes obtenus dans un certain nombre de situations pathologiques et/ou selon les espèces animales. The study of the digestive microbiota carried out by techniques of metagenomic molecular biology but also by culture techniques called culturomics [6, 7] reveals a diversity of microbes obtained in a certain number of pathological situations and / or according to the animal species.
Selon la présente invention, on a découvert que l'utilisation directe, sans traitement préalable des matières fécales qui sont constituées majoritairement de microbes, pouvait donner des signatures spécifiques d'une pathologie spécifique chez les humains même en l'absence d'identification d'un agent pathogène spécifique concerné par la dite pathologie. According to the present invention, it has been discovered that the direct use, without prior treatment, of feces which consist mainly of microbes, can give specific signatures of a specific pathology in humans even in the absence of identification of a specific pathogen concerned by the said pathology.
Pour ce faire, la présente invention consiste en l'analyse in vitro par la technique de spectrométrie de masse MALDI-TOF de matières fécales sans traitement préalable suivie de l'analyse des spectres obtenus par traitement de normalisation, lissage et calibrage des spectres après définition de critères de qualité, permettant des regroupements correspondant parfaitement à l'identité des pathologies des sujets dont les échantillons de selles étaient testés. To do this, the present invention consists in the in vitro analysis by the MALDI-TOF mass spectrometry technique of faeces without prior treatment followed by the analysis of the spectra obtained by standardization treatment, smoothing and calibration of the spectra after definition. criteria of quality, allowing groupings perfectly corresponding to the identity of the pathologies of the subjects whose stool samples were tested.
On a découvert qu'il était possible d'identifier une dite pathologie du fait des modifications du microbiote en cause dans cette maladie et ce même en l'absence de détection d'un extrait protéique d'une ou plusieurs protéines spécifiques de la dite pathologie. It has been discovered that it is possible to identify a said pathology because of the modifications of the microbiota involved in this disease, even in the absence of detection of a protein extract of one or more proteins specific for the said pathology. .
Plus précisément, la présente invention fournit une méthode de détermination d'une pathologie d'un individu humain par analyse d'un échantillon de matières fécales sans traitement préalable, du dit individu humain par spectrométrie de masse de type MALDI-TOF, dans laquelle : a) on détermine une combinaison d'une pluralité de pics discriminants pour lesquels on détermine des seuils de valeurs d'intensités permettant de distinguer les spectres d'échantillons de matières fécales des individus présentant ladite pathologie par rapport aux spectres d'échantillons de matières fécales d'individus ne présentant pas la dite pathologie, en fonction des valeurs des intensités des dits pics discriminants; b) on réalise le spectre d'un échantillon de matières fécales à analyser, tel quel sans traitement préalable dudit échantillon et c) on vérifie si le spectre dudit échantillon de matières fécales à analyser comprend les dits pics discriminants et si les valeurs des intensités des pics discriminants correspondent à une combinaison de valeurs des intensités correspondant aux spectres d'individus présentant la dite pathologie ou d'individus ne présentant pas la dite pathologie tel que déterminé à l'étape a). More specifically, the present invention provides a method for determining a pathology of a human individual by analysis of a sample of faeces without prior treatment, of said human individual by MALDI-TOF mass spectrometry, in which: a) a combination of a plurality of discriminating peaks is determined for which thresholds of intensity values are distinguishing the spectra of faecal specimens from individuals having said pathology from the spectra of faecal samples of individuals not having said pathology, as a function of the intensity values of said discriminating peaks; b) the spectrum of a sample of faeces to be analyzed is analyzed as it is without prior treatment of said sample and c) it is checked whether the spectrum of said sample of faeces to be analyzed comprises said discriminating peaks and if the values of the intensities of the Discriminant peaks correspond to a combination of intensity values corresponding to the spectra of individuals presenting the said pathology or of individuals not having the said pathology as determined in step a).
Les inventeurs considèrent comme vraisemblable sans être liés par cette théorie que cette découverte d'une spécificité de discrimination permettant la détermination d'une pathologie d'un individu humain par analyse d'un échantillon de matières fécales par spectrométrie de masse de type MALDI-TOF pourrait résulter de ce que la composition protéique des matières fécales est conditionnée par la composition de l'écosystème microbien du tube digestif et des habitudes alimentaires lesquels en pratique seraient donc corrélés à la pathologie de l'individu. The inventors consider as likely without being bound by this theory that this discovery of a specificity of discrimination allowing the determination of a pathology of a human individual by analysis of a sample of faeces by MALDI-TOF type mass spectrometry. This may result from the fact that the protein composition of the feces is conditioned by the composition of the microbial ecosystem of the digestive tract and the eating habits which in practice would therefore be correlated with the pathology of the individual.
On entend par « individu » un être vivant au sens large, humain ou animal, de préférence un mammifère et de préférence encore un être humain, homme, femme ou enfant. By "individual" is meant a living being in the broad sense, human or animal, preferably a mammal and preferably a human being, man, woman or child.
Plus particulièrement dans le cadre de l'invention, la pathologie d'un individu humain est une pathologie inflammatoire ou une maladie infectieuse. More particularly in the context of the invention, the pathology of a human individual is an inflammatory pathology or an infectious disease.
Les pathologies inflammatoires sont des désordres accompagnés d'une composante inflammatoire et peuvent être de différents types en fonction de leur localisation, de leurs causes et de leurs symptômes. Dans le cadre de la présente invention les maladies infectieuses, ou infections, sont des pathologies causées respectivement par des agents microbiologiques tels que des bactéries ou des virus. Inflammatory pathologies are disorders accompanied by an inflammatory component and can be of different types depending on their location, their causes and their symptoms. In the context of the present invention, infectious diseases, or infections, are pathologies caused respectively by microbiological agents such as bacteria or viruses.
A titre d'exemple, dans la présente invention la maladie du SIDA est une maladie infectieuse causée par un virus. For example, in the present invention AIDS disease is an infectious disease caused by a virus.
Plus particulièrement dans le cadre de la présente invention, la pathologie d'un individu humain ou la maladie infectieuse est une pathologie ou une maladie de l'appareil digestif. More particularly in the context of the present invention, the pathology of a human individual or the infectious disease is a pathology or a disease of the digestive system.
A titre d'exemple de pathologie inflammatoire de l'appareil digestif on peut faire référence à la maladie de Crohn ou à la maladie consistant en une recto- colite ulcéro-hémorragique. As an example of inflammatory pathology of the digestive tract, reference may be made to Crohn's disease or ulcerative ulcerative colitis.
A titre d'exemple de maladie infectieuse de l'appareil digestif on peut faire référence à une colite résultat d'une infection par Clostridium difficile. As an example of an infectious disease of the digestive system, reference can be made to colitis resulting from Clostridium difficile infection.
Plus particulièrement, on réalise le spectre d'un dit échantillon de matières fécales brut dissout dans une solution de matrice de préférence de solution saturée d'acide alpha-cyano-4-hydroxycinnamique dans 50 % d'acétonitrile et 2,5 % d'acide tri-fluoracétique. More particularly, the spectrum of a said sample of raw feces dissolved in a solution of matrix of saturated solution of alpha-cyano-4-hydroxycinnamic acid in 50% of acetonitrile and 2.5% of trifluoroacetic acid.
Plus particulièrement encore, à l'étape a) on détermine une combinaison d'une pluralité de pics discriminants caractérisée en ce qu'on détermine des fourchettes de valeurs d'intensité permettant de distinguer les spectres d'échantillons des individus présentant ladite pathologie et les spectres d'échantillons d'individus ne présentant pas la dite pathologie, en fonction des différentes valeurs des intensités des pics discriminants concernés dans le spectre d'un échantillon à analyser permettant ainsi de déterminer la présence ou non de la dite pathologie selon que pour lesdits pics discriminants l'intensité de chaque pic discriminant est spécifiquement à l'intérieur ou en dehors d'au moins une fourchette de valeurs d'intensités, les dites fourchettes pouvant être identiques ou de préférence différentes pour les différents pics discriminants. Even more particularly, in step a), a combination of a plurality of discriminant peaks is determined, characterized in that ranges of intensity values are determined which make it possible to distinguish the spectra of samples from the individuals presenting said pathology and the spectra of samples of individuals not presenting said pathology, as a function of the different values of the intensities of the discriminant peaks concerned in the spectrum of a sample to be analyzed, thus making it possible to determine the presence or absence of said pathology according to whether for said discriminant peaks the intensity of each discriminating peak is specifically within or outside at least a range of intensity values, said ranges may be identical or preferably different for the different discriminating peaks.
Dans un mode de réalisation, une dite fourchette est constituée par les valeurs au-dessus ou au-dessous d'un seuil de valeurs d'intensités. Plus particulièrement, selon un premier mode de réalisation illustré aux exemples 1 à 3, à l'étape a), on détermine la présence ou non de la dite pathologie, selon que pour les dits pics discriminants, les valeurs d'intensités sont comprises dans une première fourchette de valeurs d'intensités pour déterminer la présence de la dite pathologie ou à l'intérieur d'une deuxième fourchette de valeurs d'intensités pour déterminer l'absence de ladite pathologie, les dites première fourchette et deuxième fourchette ne se chevauchant pas, et ce pour chaque dit pic discriminant. In one embodiment, a said range is constituted by the values above or below a threshold of intensity values. More particularly, according to a first embodiment illustrated in Examples 1 to 3, in step a), the presence or absence of said pathology is determined, depending on whether for said discriminating peaks the intensity values are included in a first range of intensity values for determining the presence of said pathology or within a second range of intensity values for determining the absence of said pathology, said first and second ranges not overlapping each other not, and for each said discriminating peak.
Plus particulièrement encore, dans ce premier mode de réalisation, à l'étape a), la probabilité de présence de la dite pathologie est d'autant plus grande que le nombre ni de dits pics discriminants pour lesquels les valeurs d'intensité relative sont à l'intérieur des dites premières fourchettes, est plus grand et supérieur au nombre n2 de dits pics discriminants pour lesquels les valeurs d'intensité relative sont à l'intérieur des dites deuxièmes fourchettes. More particularly still, in this first embodiment, in step a), the probability of presence of said pathology is even greater than the number of said discriminating peaks for which the relative intensity values are at within said first ranges, is larger and greater than the number n2 of said discriminating peaks for which the relative intensity values are within said second ranges.
Plus particulièrement encore, dans ce premier mode de réalisation, on détermine un score d'identification S de « -1 » à « + 1 », « 1 » correspondant à une certitude à 100% de la présence de la dite pathologie et « -1 » correspondant à une certitude à 100% de l'absence de ladite pathologie, S étant calculé par la somme des scores « si » avec i = l à p, pour les p pics somme que l'on divise par le nombre p de pics, tel que pour chacun des p pics discriminants, le score si est de valeurs « 1 » si l'intensité du pic est dans la dite première fourchette, « -1 » si l'intensité du pic est dans la dite deuxième fourchette et « 0 » si l'intensité du pic n'est pas comprise dans les dites première et deuxième fourchettes. More particularly still, in this first embodiment, an identification score S is determined from "-1" to "+ 1", "1" corresponding to a 100% certainty of the presence of said pathology and "- 1 "corresponding to a 100% certainty of the absence of said pathology, S being calculated by the sum of the scores" if "with i = 1 to p, for the p peaks sum divided by the number p of peaks, such that for each of the p discriminating peaks, the score si is of values "1" if the intensity of the peak is in the said first range, "-1" if the peak intensity is in the said second range and "0" if the intensity of the peak is not included in said first and second ranges.
Plus particulièrement encore dans ce premier mode de réalisation, à l'étape a), la probabilité de présence de ladite pathologie est de 100% si pour tous les dits pics spécifiques discriminants, les valeurs d'intensités relatives sont à l'intérieur des dites premières fourchettes, et la probabilité d'absence de ladite pathologie est de 100% si pour tous les dits pics discriminants les valeurs d'intensités relatives sont à l'intérieur des dites deuxièmes fourchettes. More particularly still in this first embodiment, in step a), the probability of presence of said pathology is 100% if, for all the said specific discriminant peaks, the relative intensity values are inside the said first ranges, and the probability of absence of said pathology is 100% if for all said discriminating peaks the values of relative intensities are within said second ranges.
En pratique, on arrive à discriminer un groupe de sujets comme présentant une pathologie avec un nombre de 1 à 15 pics discriminants, de préférence de 3 à 10 pics discriminants. Plus particulièrement encore selon ce premier mode de réalisation, on détermine la présence ou l'absence de la maladie consistant en une colite résultat d'une infection par Clostridium difficile pour laquelle à l'étape a), on a identifié 8 dites premières et deuxièmes fourchettes de valeurs d'intensités de 8 pics discriminants. In practice, it is possible to discriminate a group of subjects as having a pathology with a number of 1 to 15 discriminating peaks, preferably from 3 to 10 discriminating peaks. More particularly still according to this first embodiment, the presence or absence of the disease consisting of colitis resulting from a Clostridium difficile infection for which in step a), 8 first and second ranges of intensity values of 8 discriminating peaks.
Plus particulièrement encore, pour déterminer la présence ou l'absence de la maladie consistant en une colite résultat d'une infection par Clostridium difficile, les dits 8 pics discriminants sont des pics à 2710, 3372, 3399, 3408, 3445, 4374, 5658, 11047 Da à +/- 3xl0 \ More particularly, to determine the presence or absence of the colitis disease resulting from Clostridium difficile infection, the so-called 8 discriminant peaks are peaks at 2710, 3372, 3399, 3408, 3445, 4374, 5658 , 11047 Da at +/- 3x10 \
Plus particulièrement encore, pour déterminer la présence ou l'absence de la maladie consistant en une colite résultat d'une infection par Clostridium difficile, les dites premières et deuxièmes fourchettes de valeurs d'intensités pour lesdits 8 pics discriminants suivants, exprimées en valeurs d'intensités relatives par rapport à la somme des valeurs d'intensités du spectre normalisée à la valeur 1, sont : More particularly, for determining the presence or absence of the colitis disease resulting from Clostridium difficile infection, said first and second intensity value ranges for said 8 subsequent discriminant peaks, expressed as d Relative intensities with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
-Pour le pic à 2710 Da, -For the peak at 2710 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 4.56326002121813 x 10 5, et a said first range of values of relative intensities corresponds to the values of relative intensities lower than 4.56326002121813 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 4.86226943144253x 10 5; et a said second range of values of relative intensities corresponds to the values of relative intensities higher than 4.86226943144253x 10 5 ; and
-Pour le pic à 3372 Da, -For the peak at 3372 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000434223789748754, et a said first range of values of relative intensities corresponds to the values of relative intensities greater than 0.000434223789748754, and
-une dite deuxième fourchette de valeurs d'intensité relative correspond aux valeurs d'intensités relatives inférieures à 0.000339153329205546 ; et a said second range of relative intensity values corresponds to values of relative intensities lower than 0.000339153329205546; and
-Pour le pic à 3399 Da, -une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à-For the peak at 3399 Da, a said first range of values of relative intensities corresponds to values of relative intensities higher than
9.98606712559408 x 10 5, et 9.98606712559408 x 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 9.7561289741134 x 10 5; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 9.7561289741134 × 10 5 ; and
-Pour le pic à 3408 Da, -For the peak at 3408 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures àa said first range of values of relative intensities corresponds to values of relative intensities higher than
0.000118664760690361, et 0.000118664760690361, and
-une dite deuxième fourchette de valeurs d'intensité relative correspond aux valeurs d'intensités relatives inférieures à 9.78528309013007 x 10 5 ; et a said second range of relative intensity values corresponds to the values of relative intensities lower than 9.78528309013007 x 10 5 ; and
-Pour le pic à 3445 Da, -For the peak at 3445 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures àa said first range of values of relative intensities corresponds to values of relative intensities higher than
0.000837188281840417, et 0.000837188281840417, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000634234550815951; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000634234550815951; and
-Pour le pic à 4374 Da, -For the peak at 4374 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 9.55157313225957 x 10 5, et a said first range of values of relative intensities corresponds to the values of relative intensities lower than 9.55157313225957 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures àa said second range of values of relative intensities corresponds to values of relative intensities higher than
0.0001002315521507 x 10 5; et 0.0001002315521507 x 10 5 ; and
-Pour le pic à 5658 Da, -une dite première fourchette de valeurs d'intensité relative correspond aux valeurs d'intensités relatives supérieures à 4.3325324409441 x 10 5, et -For the peak at 5658 Da, a said first range of relative intensity values corresponds to values of relative intensities greater than 4.3325324409441 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.23774442820013 x 10 5; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 5.23774442820013 × 10 5 ; and
-Pour le pic à 11047 Da, -For the peak at 11047 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 4.98150891075045 x 10 5, et a said first range of values of relative intensities corresponds to values of relative intensities lower than 4.98150891075045 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 5.199534671731 10' 5 . a said second range of values of relative intensities corresponds to the values of relative intensities greater than 5.199534671731 10 '5 .
Plus particulièrement, dans un deuxième exemple de pathologie, on détermine la maladie de Crohn pour laquelle à l'étape a), on a identifié 3 dites premières et deuxièmes fourchettes de valeurs d'intensités de 3 pics discriminants. More particularly, in a second example of pathology, Crohn's disease is determined for which in step a), 3 first and second ranges of intensity values of 3 discriminating peaks have been identified.
Plus particulièrement encore, dans ce deuxième exemple de pathologie, les dits 3 pics discriminants sont des pics à 3343, 4134 et 4170 Da à +/- 0.5%. More particularly still, in this second example of pathology, the said 3 discriminating peaks are peaks at 3343, 4134 and 4170 Da at +/- 0.5%.
Plus particulièrement, dans ce deuxième exemple de pathologie, les dites première et deuxième fourchettes de valeurs d'intensités pour lesdits 3 pics discriminants suivants, exprimées en valeurs d'intensités relatives par rapport à la somme des valeurs d'intensités du spectre normalisée à la valeur 1, sont : More particularly, in this second example of pathology, said first and second ranges of intensity values for said 3 subsequent discriminating peaks, expressed in values of relative intensities with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
-Pour le pic à 3343 Da, -For the peak at 3343 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000153184507861765, et a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000153184507861765, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000121099556323652; et -Pour le pic à 4134 Da, a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000121099556323652; and -For the peak at 4134 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures àa said first range of values of relative intensities corresponds to values of relative intensities higher than
0.000425424602595293, et 0.000425424602595293, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.33325181290711 x 10 5; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 5.33325181290711 × 10 5 ; and
-Pour le pic à 4170 Da, -For the peak at 4170 Da,
-une dite première fourchette de valeurs d'intensité relative correspond aux valeurs d'intensités relatives supérieures àa said first range of relative intensity values corresponds to values of relative intensities higher than
0.000148115657553745, et 0.000148115657553745, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000115898008983965. a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000115898008983965.
Plus particulièrement, dans un troisième exemple de pathologie, on détermine la présence ou l'absence de la maladie consistant en une recto-colite ulcéro-hémorragique pour laquelle à l'étape a), on détermine identifié 11 dites premières et deuxièmes fourchettes de valeurs d'intensités de 11 pics discriminants. More particularly, in a third example of pathology, the presence or absence of the ulcero-haemorrhagic rectocolitis disease is determined for which, in step a), 11 first and second ranges of values are determined. intensities of 11 discriminating peaks.
Plus particulièrement, dans ce troisième exemple de pathologie, les dits 3 pics spécifiques discriminants sont des pics à 3324, 3345, 3444, 3482, 3493, 6451, 7268, 9599, 9620, 9636, 9707 Da à +/-0.5%. More particularly, in this third example of pathology, the said 3 specific discriminating peaks are peaks at 3324, 3345, 3444, 3482, 3493, 6451, 7268, 9599, 9620, 9636, 9707 Da at +/- 0.5%.
Plus particulièrement, dans ce troisième exemple de pathologie, les dites première et deuxième fourchettes de valeurs d'intensités relatives pour lesdits pics discriminants suivants, exprimées en valeurs d'intensités relatives par rapport à la somme des valeurs d'intensités du spectre normalisée à la valeur 1, sont : More particularly, in this third example of pathology, the said first and second ranges of relative intensity values for the following discriminant peaks, expressed in values of relative intensities with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
-Pour le pic à 3324 Da, -For the peak at 3324 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000202084, et -une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000120628; et a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000202084, and a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000120628; and
-Pour le pic à 3345 Da, -For the peak at 3345 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 9.9939 x 105, et a said first range of values of relative intensities corresponds to the values of relative intensities greater than 9.9939 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 9.2912 x 105; a said second range of values of relative intensities corresponds to the values of relative intensities lower than 9.2912 × 10 5 ;
-Pour le pic à 3444 Da, -For the peak at 3444 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000201322 ; et a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000201322; and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000122590 ; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000122590; and
-Pour le pic à 3482 Da, -For the peak at 3482 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.0001360367, et a said first range of values of relative intensities corresponds to the values of relative intensities greater than 0.0001360367, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000119304; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000119304; and
-Pour le pic à 3493 Da, -For the peak at 3493 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000289962, et a said first range of values of relative intensities corresponds to the values of relative intensities greater than 0.000289962, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000183699; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000183699; and
-Pour le pic à 6451 Da, -For the peak at 6451 Da,
-une dite première fourchette de valeurs d'intensité relative correspond aux valeurs d'intensité relative inférieures à 9.6737 x 105, et -une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000107099 x 10‘5; a said first range of relative intensity values corresponds to relative intensity values lower than 9.6737 × 10 5 , and a said second range of values of relative intensities corresponds to the values of relative intensities greater than 0.000107099 × 10 5 ;
-Pour le pic à 7268 Da, -For the peak at 7268 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 6.0910x 105, et a said first range of values of relative intensities corresponds to the values of relative intensities lower than 6.0910 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 9.51116 x 105;et a said second range of values of relative intensities corresponds to the values of relative intensities higher than 9.51116 × 10 5 ;
-Pour le pic à 9599 Da, -For the peak at 9599 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.4585 x 105, et a said first range of values of relative intensities corresponds to the values of relative intensities lower than 5.4585 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 8.0165 x 105 ; et a said second range of values of relative intensities corresponds to the values of relative intensities greater than 8.0165 × 10 5 ; and
-Pour le pic à 9620 Da, -For the peak at 9620 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.48801 x 105, et a said first range of values of relative intensities corresponds to values of relative intensities lower than 5.48801 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 7.5820 x 105; et a said second range of values of relative intensities corresponds to the values of relative intensities greater than 7.5820 × 10 5 ; and
-Pour le pic à 9636 Da, -For the peak at 9636 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.75858 x 105, et a said first range of values of relative intensities corresponds to values of relative intensities lower than 5.75858 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensité relatives supérieures à 7.473082 x 105; a said second range of values of relative intensities corresponds to relative intensity values greater than 7.473082 × 10 5 ;
-Pour le pic à 9707 Da, -For the peak at 9707 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 4.9587 x 105; et -une deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 7.322658 x 10 5. a said first range of values of relative intensities corresponds to values of relative intensities lower than 4.9587 × 10 5 ; and a second range of values of relative intensities corresponds to the values of relative intensities greater than 7.322658 × 10 5 .
Dans un deuxième mode de réalisation, à l'étape a), on détermine une ou plusieurs combinaisons de dits pics discriminants avec : a) des premières fourchettes de valeurs d'intensités des dits pics discriminants de la dite combinaison pour déterminer la présence de la dite pathologie et b) des deuxièmes fourchettes de valeurs d'intensités des dits pics discriminants de la dite combinaison pour déterminer l'absence de ladite pathologie, c) certaines au moins des dites premières et deuxièmes fourchettes se chevauchant pour certains des dits pics discriminants, mais permettant néanmoins de par la pluralité des pics discriminants de déterminer la présence de la dite pathologie de par la série des valeurs d'intensités pour les dits pics discriminants de la combinaison selon qu'elles sont à l'intérieur ou en dehors des dites premières fourchettes ou deuxièmes fourchettes. In a second embodiment, in step a), one or more combinations of said discriminating peaks are determined with: a) first ranges of intensity values of said discriminating peaks of said combination to determine the presence of the said pathology and b) second ranges of intensity values of said discriminating peaks of said combination to determine the absence of said pathology, c) at least some of said first and second overlapping forks for some of said discriminant peaks, but nevertheless allowing the plurality of the discriminating peaks to determine the presence of said pathology by the series of intensity values for said discriminating peaks of the combination according to whether they are inside or outside the said first forks or second forks.
En pratique, ce mode de réalisation consiste à constituer un arbre décisionnel pour déterminer la présence de la dite pathologie impliquant la comparaison des pics et valeurs d'intensités d'un spectre à analyser par rapport à la pluralité de couples (pic- fourchette(s) d'intensités) de la dite combinaison. In practice, this embodiment consists in constituting a decision tree for determining the presence of said pathology involving the comparison of the peaks and intensity values of a spectrum to be analyzed with respect to the plurality of pairs (peak-range (s) ) of intensities) of said combination.
Plus particulièrement, dans ce deuxième mode de réalisation, on détermine des dites premières fourchettes et deuxièmes fourchettes constituées par des valeurs au-dessus et respectivement au-dessous de seuils de valeurs d'intensités. More particularly, in this second embodiment, said first ranges and second ranges are determined consisting of values above and below thresholds of intensity values.
Plus particulièrement encore, dans ce deuxième mode de réalisation, lesdits seuils de valeurs d'intensités sont déterminés par approximation à des valeurs médianes de valeurs d'intensités des intervalles entre des dites première et deuxième fourchettes. More particularly still, in this second embodiment, said thresholds of intensity values are determined by approximation to median values of intensity values of the intervals between said first and second ranges.
Plus particulièrement encore, dans ce deuxième mode de réalisation, on détermine la présence ou l'absence de la maladie du SIDA résultant d'une infection par le VIH pour laquelle à l'étape a), on détermine 4 dites premières fourchettes et deuxièmes fourchettes de valeurs d'intensités de 4 pics discriminants. Even more particularly, in this second embodiment, the presence or absence of AIDS disease resulting from infection is determined. by the HIV for which in step a), 4 said first ranges and second ranges of intensity values of 4 discriminating peaks are determined.
Plus particulièrement encore, dans ce deuxième mode de réalisation, on détermine la présence ou l'absence de la maladie du SIDA résultant d'une infection par le VIH pour laquelle à l'étape a), on détermine 4 seuils de valeurs d'intensités de 4 pics discriminants tels que : More particularly still, in this second embodiment, the presence or absence of AIDS disease resulting from an HIV infection is determined for which in step a), 4 thresholds of intensity values are determined. 4 discriminating peaks such as:
1) la maladie est présente si les valeurs d'intensités des 4 pics sont telles que: 1) the disease is present if the intensity values of the 4 peaks are such that:
1.1) -l'intensité du pic n°l est supérieure au seuil d'intensité du pic n°l, l'intensité du pic n°2 est inférieure au seuil d'intensité du pic n°2 et l'intensité du pic n°3 est supérieure au seuil d'intensité du pic n°3, ou 1.1) -the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1, the intensity of peak No. 2 is less than the threshold of intensity of peak No. 2 and the intensity of peak No. 3 is greater than the intensity threshold of peak No. 3, or
1.2) -l'intensité du pic n°l est supérieure au seuil d'intensité du pic n°l, l'intensité du pic n°2 est inférieure au seuil d'intensité du pic n°2, l'intensité du pic n°3 est inférieure au seuil d'intensité du picn°3 et l'intensité du pic n°4 est inférieure au seuil d'intensité du pic n°4 ; et 1.2) -the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1, the intensity of peak No. 2 is less than the threshold of intensity of peak No. 2, the intensity of peak No. 3 is below the threshold of intensity of peak 3 and the intensity of peak No. 4 is less than the intensity threshold of peak No. 4; and
2) la maladie n'est pas présente si les valeurs d'intensités des 4 pics sont telles que : 2) the disease is not present if the intensity values of the 4 peaks are such that:
2.1) l'intensité du pic n°l est inférieure au seuil d'intensité du pic n°l, 2.1) the intensity of peak no. 1 is below the intensity threshold of peak no. 1,
2.2) l'intensité du pic n°l est supérieure au seuil d'intensité du pic n°l et l'intensité du pic n°2 est supérieure au seuil d'intensité du pic n°2, et 2.2) the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1 and the intensity of peak No. 2 is greater than the intensity threshold of peak No. 2, and
2.3) l'intensité du pic n°l est supérieure au seuil d'intensité du pic n°l, l'intensité du pic n°2 est inférieure au seuil d'intensité du pic n°2, l'intensité du pic n°3 est inférieure au seuil d'intensité du pic n°3 et l'intensité du pic n°4 est supérieure au seuil d'intensité du pic n°4. 2.3) the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1, the intensity of peak No. 2 is less than the threshold of intensity of peak No. 2, the intensity of peak No. ° 3 is below the intensity threshold of peak No. 3 and the intensity of peak No. 4 is greater than the intensity threshold of peak No. 4.
Plus particulièrement encore, pour déterminer la présence ou l'absence de la maladie du SIDA, les pics n°l à 4 sont, à +/-3xl04: More particularly, to determine the presence or absence of AIDS disease, peaks 1 to 4 are, at +/- 3x10 4 :
- 4160 Da pour le pic n°l, - 4160 Da for peak No. 1,
- 3319 Da pour le pic n°2, - 3607 Da pour le pic n°3, et - 3319 Da for the peak n ° 2, - 3607 Da for peak 3, and
- 5143 Da pour le pic n°4. - 5143 Da for the peak n ° 4.
Plus particulièrement encore, dans ce deuxième mode de réalisation, pour déterminer la présence ou l'absence de la maladie du SIDA résultant d'une infection par le VIH, les seuils d'intensités relatives des dits pics discriminants sont des valeurs de seuils d'intensités relatives exprimées en valeurs d'intensités relatives par rapport à la somme des valeurs d'intensités du spectre normalisée à la valeur 1, sont : More particularly still, in this second embodiment, to determine the presence or absence of AIDS disease resulting from HIV infection, the relative intensity thresholds of said discriminant peaks are threshold values of Relative intensities expressed as relative intensity values with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
- pour le pic n°l à 4160 Da, une valeur de seuil d'intensité relative de 0.000116691, for peak No. 1 at 4160 Da, a relative intensity threshold value of 0.000116691,
- pour le pic n°2 à 3319 Da, une valeur de seuil d'intensité de 0.0006103814, for peak No. 2 at 3319 Da, an intensity threshold value of 0.0006103814,
- pour le pic n°3 à 3607 Da, une valeur de seuil d'intensité relative de 0.000110201, et for peak No. 3 at 3607 Da, a relative intensity threshold value of 0.000110201, and
- pour le pic n°4 à 5143 Da, une valeur de seuil d'intensité relative de 0.000144286. for peak No. 4 at 5143 Da, a relative intensity threshold value of 0.000144286.
Plus particulièrement encore, dans tous les modes de réalisation, on détermine la présence ou l'absence d'une pathologie d'un individu humain par analyse d'un échantillon de matières fécales par spectrométrie de masse de type MALDI-TOF dans laquelle les dits pics discriminants ne sont pas présents dans les spectres d'un échantillon d'agent pathogène responsable de ladite pathologie isolé, mais reflètent une modification de la composition des matières fécales associées à la dite pathologie. More particularly, in all the embodiments, the presence or the absence of a pathology of a human individual is determined by analysis of a sample of feces by MALDI-TOF mass spectrometry in which the said Discriminant peaks are not present in the spectra of a pathogen sample responsible for said isolated pathology, but reflect a change in the composition of the feces associated with said pathology.
Plus particulièrement encore, dans le deuxième mode de réalisation, à l'étape a), on détermine une combinaison d'une pluralité de pics discriminants pour lesquels on a déterminé des premières fourchettes et deuxièmes fourchettes de valeurs d'intensités de pics discriminants permettant de distinguer les spectres d'échantillons des individus atteints par la pathologie et les spectres d'échantillons d'individus non atteints par la pathologie, en fonction des différentes valeurs des intensités des pics discriminants dans le spectre d'un échantillon à analyser permettant ainsi de constituer un arbre de décisions binaires d'appartenance ou non à la dite espèce selon que pour lesdits pics discriminants pris successivement l'intensité de chaque pic est spécifiquement à l'intérieur ou en dehors des dites premières fourchettes ou deuxièmes fourchettes. More particularly still, in the second embodiment, in step a), a combination of a plurality of discriminant peaks is determined for which first ranges and second ranges of discriminant peak intensity values have been determined allowing to distinguish the spectra of samples from the individuals affected by the pathology and the spectra of samples of individuals not affected by the pathology, as a function of the different values of the intensities of the discriminating peaks in the spectrum of a sample to be analyzed thus making it possible to constitute a binary decision tree belonging or not to said species according to whether for said discriminant peaks taken successively the intensity of each peak is specifically within or outside said first ranges or second ranges.
Plus particulièrement encore, les dits pics discriminants ne sont pas présents dans les spectres d'un échantillon de protéine spécifique d'une pathologie chez ledit individu . More particularly, said discriminant peaks are not present in the spectra of a protein sample specific for a pathology in said individual.
Les pics desdits spectres sont définis par une paire de coordonnées composées d'une abscisse constituée du rapport masse/charge (m/z) de 2 000 à 20 000 Da, plus particulièrement de 3 000 à 15 000 Da, la coordonnée en ordonnée étant une intensité relative ou en unité arbitraire, et on retient de préférence dans le spectre au moins les 40 pics de plus grandes intensités. The peaks of said spectra are defined by a pair of coordinates composed of an abscissa consisting of the mass / charge ratio (m / z) of 2,000 to 20,000 Da, more particularly of 3,000 to 15,000 Da, the ordinate coordinate being a relative intensity or arbitrary unit, and is preferably retained in the spectrum at least 40 peaks of greater intensities.
Plus particulièrement encore, la méthode selon l'invention permet de discriminer un groupe de sujets présentant une dite pathologie avec un nombre de 1 à 15 pics discriminants, de préférence de 3 à 10 pics discriminants. More particularly, the method according to the invention makes it possible to discriminate a group of subjects presenting a said pathology with a number of 1 to 15 discriminating peaks, preferably from 3 to 10 discriminating peaks.
Dans les tableaux ci-après : In the tables below:
- les valeurs mentionnées sont des valeurs moyennes d'intensité relative et de masse moléculaire, the values mentioned are average values of relative intensity and molecular weight,
- les valeurs des masses moléculaires m/z peuvent varier jusqu'à ± 0.5%, de préférence de +/- 3xl0 4de la valeur moyenne mentionnée dans les tableaux, et the values of the molecular masses m / z may vary up to ± 0.5%, preferably +/- 3 × 10 4 of the average value mentioned in the tables, and
- les valeurs d'intensité relative peuvent varier jusqu'à ±0.5%, de préférence de +/- 3xl0 \ de la valeur moyenne d'intensité relative mentionnée dans les tableaux, et the relative intensity values can vary up to ± 0.5%, preferably +/- 3 × 10 5 of the average value of relative intensity mentioned in the tables, and
- Dans les tableaux et dans les figures, on fait état de la valeur m/z, z représentant la charge électrique de l'espèce ionisée. Mais, en pratique, m/z peut être assimilé à la masse moléculaire m, avec z= l, car la quantité de protéines qui s'ionisent 2 fois (z= + 2), voire 3 fois (z = + 3), est négligeable, compte-tenu de la limite de sensibilité des techniques de mesures. Les valeurs rapportées dans les tableaux ont été obtenus par une analyse dans une solution de matrice d'acide a-cyano-4-hydroxycinnamique. Plus précisément, les selles brutes étaient mélangées avec une solution de matrice d'acide a-cyano-4-hydroxycinnamique, lors de ladite analyse par spectrométrie de masse et pas avant. In the tables and in the figures, the value m / z is reported, where z represents the electric charge of the ionized species. But, in practice, m / z can be likened to the molecular mass m, with z = 1, because the quantity of proteins that ionize twice (z = + 2), or even 3 times (z = + 3), negligible, given the sensitivity limit of measurement techniques. The values reported in the tables were obtained by analysis in an α-cyano-4-hydroxycinnamic acid matrix solution. Specifically, the crude stools were mixed with a solution of α-cyano-4-hydroxycinnamic acid matrix, in said mass spectrometric analysis and not before.
D'autres caractéristiques et avantages de la présente invention apparaîtront à la lumière des exemples qui vont suivre, faits en référence aux figures A à E et figures 1 à 5 suivantes. Other features and advantages of the present invention will become apparent in the light of the examples which follow, made with reference to Figures A to E and Figures 1 to 5 below.
Les figures A à E illustrent la méthode générale de traitement des spectres pour identifier les pics discriminants décrite ci-après. Figures A to E illustrate the general method of spectral processing to identify the discriminant peaks described below.
Les figures IA, 2A, 3A, 4A représentent les résultats des analyses discriminantes binaires avec les pouvoirs discriminants des 40 pics (en ordonnée : m/z (Da)) de meilleurs scores discriminants pour le groupe de patients infectés par clostridium difficile (CDI) de l'exemple 1 (figure IA), le groupe de patients atteints de recto-colite hémorragique (RCH) de l'exemple 2 (figure 2A), le groupe de patients atteints de la maladie de Crohn de l'exemple 3 (figure 3A), le groupe de patients atteints du SIDA de l'exemple 4 (figure 4A). FIGS. 1A, 2A, 3A, 4A show the results of the binary discriminant analyzes with the discriminant powers of the 40 peaks (on the ordinate: m / z (Da)) of better discriminant scores for the group of patients infected with Clostridium difficile (CDI). of Example 1 (FIG. 1A), the group of patients with ulcerative colitis (UC) of Example 2 (FIG. 2A), the group of patients suffering from Crohn's disease of Example 3 (FIG. 3A), the group of AIDS patients of Example 4 (Figure 4A).
Les figures IB, 2B, 3B et 4B représentent les distributions des valeurs des intensités des pics ayant un pouvoir discriminant de 100% pour le groupe de patients infectés par clostridium difficile (CDI) de l'exemple 1 (figure IB), le groupe de patients atteints de recto-colite hémorragique (RCH) de l'exemple 2 (figure 2B), le groupe de patients atteints de la maladie de Crohn de l'exemple 3 (figure 3B), le groupe de patients atteints du SIDA de l'exemple 4 (figure 4B). FIGS. 1B, 2B, 3B and 4B show the distributions of the peak intensity values having a discriminating power of 100% for the group of patients infected with clostridium difficile (CDI) of Example 1 (FIG. 1B), the group of patients with ulcerative colitis (UC) of Example 2 (Figure 2B), the group of patients with Crohn's disease of Example 3 (Figure 3B), the group of patients with AIDS of the Example 4 (Figure 4B).
La Figure 5 représente l'arbre de classification binaire à partir de 4 pics spécifiques discriminants pour la maladie du VIH en fonction des intensités par rapport à des valeurs seuils, de l'exemple 4. Figure 5 shows the binary classification tree from 4 specific peaks discriminating for HIV disease as a function of intensity versus threshold values, of Example 4.
Dans les exemples 1 à 4 ci-après, on a mis en œuvre les matériels et méthodes explicitées suivants. In Examples 1 to 4 below, the following explicit materials and methods have been implemented.
La méthode selon la présente invention dénommée « méthode MERDI-TOF » ("MERDI" du latin "merda" qui signifie fèces et "TOF", de l'anglais time of flight), par référence à la technique de spectrométrie de masse MALDI-TOF consiste en l'analyse par cette technique de spectrométrie de masse MALDI-TOF de matières fécales sans traitement préalable suivie de l'analyse des spectres. The method according to the present invention called the "MERDI-TOF method"("MERDI" from the Latin "merda" which means feces and "TOF", from the English time of flight), with reference to the MALDI-mass spectrometry technique. TOF consists of analysis by this technique of MALDI-TOF mass spectrometry of faeces without prior treatment followed by the analysis of the spectra.
A) Préparation des échantillons de selles. A) Preparation of stool samples.
Les échantillons de selles sont déposés directement sur une plaque de spectromètre MALDI-TOF (Bruker Daltonics, Brême, Allemagne). Pour chaque échantillon, quatre dépôts sont effectués sur la plaque puis recouverts de 2p L d'une solution de matrice (solution saturée d'acide alpha-cyano-4- hydroxycinnamique dans 50 % d'acétonitrile et 2,5 % d'acide tri-fluoracétique). Stool samples are deposited directly on a MALDI-TOF spectrometer plate (Bruker Daltonics, Bremen, Germany). For each sample, four deposits are made on the plate and then covered with 2 μL of a matrix solution (saturated solution of alpha-cyano-4-hydroxycinnamic acid in 50% acetonitrile and 2.5% tri acid -fluoracétique).
La plaque est séchée pendant cinq minutes puis analysée en spectrométrie de masse de type Microflex (Bruker Daltonics, Brême, Allemagne). The plate is dried for five minutes and then analyzed in Microflex-type mass spectrometry (Bruker Daltonics, Bremen, Germany).
On a évalué la méthode M ERDI-TOF sur deux types de selles : une selle de consistance « normal », et une selle diarrhéique. Pour chacune des selles, on a fait une gamme de dilution au 50ème sur 10 tubes avec du PBS (Phosphate Buffered Saline). Chaque dilution ainsi que la selle non diluée a été directement déposée sur une plaque MALDI-TOF puis identifiées comme décrit précédemment. Le PBS a été utilisé comme témoin négatif. Pour chaque selle, les spectres obtenus de la première à la lOème dilution étaient identiques au spectre de la selle sans dilution qui différait du spectre du témoin négatif. Ainsi on a validé la méthode et son application à des selles de toute consistance. The M ERDI-TOF method was evaluated on two types of stool: a stool of "normal" consistency, and a stool with diarrhea. For each stool, a 50th dilution range was made on 10 tubes with PBS (Phosphate Buffered Saline). Each dilution and the undiluted stool was directly deposited on a MALDI-TOF plate and identified as described above. PBS was used as a negative control. For each stool, the spectra obtained from the first to the 10th dilution were identical to the unadulterated stool spectrum that differed from the negative control spectrum. Thus we validated the method and its application to stools of any consistency.
B) La méthode d'acquisition des spectres comprend les étapes et caractéristiques suivantes : B) The spectral acquisition method includes the following steps and features:
1- introduire la plaque (cible Microflex modèle de référence 224989 dénommé1- insert the plate (target Microflex reference model 224989 called
MSP 96) contenant les dépôts dans le spectromètre de masse Microflex LT, MSP 96) containing the deposits in the Microflex LT mass spectrometer,
2- démarrer l'ordinateur associé au spectromètre pour lancer les analyses, et 2- start the computer associated with the spectrometer to start the analyzes, and
3- lancer l'acquisition des spectres de masse MALDI-TOF. 3- Initiate the acquisition of the MALDI-TOF mass spectra.
4- les paramètres appliqués au spectromètre de masse sont les suivants : 4- The parameters applied to the mass spectrometer are as follows:
5- mode linéaire positif, Electrode IS1 : 20,00 kV, Electrode IS2 : 18,05 kV,5- positive linear mode, IS1 electrode: 20.00 kV, IS2 electrode: 18.05 kV,
Electrode de focalisation : 6 kV, Fréquence du laser : 60 Hz, Gain du détecteur : 8,8 X, Post-ion-extraction (PIE) : 120 ns, Gamme de masse : de 700 à 20000 Da. Focusing Electrode: 6 kV, Laser Frequency: 60 Hz, Gain detector: 8.8 X, Post-ion-extraction (PIE): 120 ns, Mass range: from 700 to 20000 Da.
6- les spectres sont obtenus via une méthode automatique contrôlée par le logiciel FLEXCONTROL® du fabricant BRUKER DALTONICS® les paramètres sont les suivants pour chaque spot : 6- the spectra are obtained via an automatic method controlled by the FLEXCONTROL® software of the manufacturer BRUKER DALTONICS® the parameters are the following for each spot:
7- nombres séries de 40 tirs : 6 sur des positions différentes du spot (6x40 = 240 spectres), 7- numbers series of 40 shots: 6 on different positions of the spot (6x40 = 240 spectra),
8- afin que les tirs aient balayé l'ensemble de l'échantillon de façon homogène l'acquisition se fait sur 6 positions différentes selon une géométrie hexagonale, 8- so that the shots swept the whole sample homogeneously the acquisition is done in 6 different positions according to a hexagonal geometry,
9- pré-tirs : 10 tirs à 40% de la puissance maximum laser servent à dessaler l'échantillon (contamination par les sels minéraux), 9- pre-shots: 10 shots at 40% of the maximum laser power are used to desalt the sample (contamination by mineral salts),
10- puissance laser : 30 % à 45 % régulée via le logiciel FLEXCONTROL®, 10- laser power: 30% to 45% regulated via FLEXCONTROL® software,
11- sélection du spectre : sur une gamme de masse de 2000 à 20 000 Da. 11- spectrum selection: over a mass range of 2000 to 20 000 Da.
C) Traitement et analyse des spectres C) Spectrum processing and analysis
Le but de ces traitement et analyse est d'identifier la combinaison de pics permettant de discriminer les groupes de prélèvements et de permettre l'identification ultérieure d'un prélèvement. The purpose of this treatment and analysis is to identify the combination of peaks to discriminate groups of samples and allow the subsequent identification of a sample.
Cette analyse est effectuée avec un programme d'analyse des spectres MALDI-TOF écrit dans le langage libre de programmation R [R Development Core Team (2008). R: A language and environment for statistical computing . R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http ://www. R-project.org], et nécessitant les bibliothèques statistiques complémentaires « MALDIquant » [S. Gibb and K. Strimmer (2012)This analysis is performed with a MALDI-TOF spectrum analysis program written in the free programming language R [R Development Core Team (2008). A: Language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http: // www. R-project.org], and requiring the complementary statistical libraries "MALDIquant" [S. Gibb and K. Strimmer (2012)
MALDIquant: a versatile R package for the analysis of mass spectrometry data. R package version 1.17], « binda » [Sébastian Gibb and Korbinian Strimmer (2015) binda : Multi-Class Discriminant Analysis using Binary Predictors. R package version 1.0.3] et « C50 » [Max Kuhn, Weston Steve, Culp Mark, Coulter Nathan, Ross Quinlan (2017). C50 : C5.0 Decision Trees and Rule-Based Models. R package version 0.1.1]. Les fichiers de spectres sont copiés depuis les disques des automates de spectrométrie de masse MALDI-TOF. Pour chaque spectre deux fichiers sont nécessaires : le fichier dénommé « fid » par l'automate et contenant les données du spectre et le fichier dénommé « acqu » par l'automate et contenant les paramètres d'acquisition du spectre faite par le logiciel FLEXCONTROL. MALDIANT: a versatile R package for the analysis of mass spectrometry data. R package version 1.17], "binda" [Sebastian Gibb and Korbinian Strimmer (2015) binda: Multi-Class Discriminant Analysis using Binary Predictors. R package version 1.0.3] and "C50" [Max Kuhn, Weston Steve, Culp Mark, Nathan Coulter, Ross Quinlan (2017). C50: C5.0 Decision Trees and Rule-Based Models. R package version 0.1.1]. The spectra files are copied from the disks of the MALDI-TOF mass spectrometry automata. For each spectrum two files are needed: the file called "fid" by the PLC and containing the spectrum data and the file called "acqu" by the PLC and containing the spectrum acquisition parameters made by the FLEXCONTROL software.
Le traitement des spectres bruts (figure A) issus de spectromètres MALDI- TOF Brucker Microflex comprend les étapes usuelles suivantes de : The treatment of the raw spectra (FIG. A) from MALDI-TOF Brucker Microflex spectrometers comprises the following usual steps of:
1) Normalisation des spectres : 1) Normalization of spectra:
1.1) Sélection de la bande protéique de 2 à 20 kDa  1.1) Selection of the protein band from 2 to 20 kDa
1.2) Lissage du spectre pour éliminer les pics aléatoires (figure B) par la technique de la moyenne glissante avec une demi-fenêtre de 12 Daltons. 1.2) Smoothing of the spectrum to eliminate the random peaks (figure B) by the sliding average technique with a half-window of 12 Daltons.
1.3) Estimation du décalage de la ligne de base du spectre brut lié aux conditions experimentales par l'algorithme « Statistics-sensitive Non-linear Itérative Peak-clipping » [Morhâc M, Matousek V. Peak clipping algorithms for background estimation in spectroscopic data. Appl Spectrosc. 2008 Jan;62(l) :91-106. doi : 10.1366/000370208783412762] réglé sur 100 itérations, puis correction de la ligne de base du spectre laquelle est alignée (figure C). 1.3) Estimation of the baseline shift of the gross spectrum related to the experimental conditions by the algorithm "Statistics-sensitive Non-linear Iterative Peak-clipping" [Morhâc M, Matousek V. Peak clipping algorithms for background estimation in spectroscopic data. Appl Spectrosc. 2008 Jan; 62 (l): 91-106. doi: 10.1366 / 000370208783412762] set to 100 iterations, then correction of the baseline of the spectrum which is aligned (figure C).
1.4) On réalise une calibration (correction d'échelle) de l'intensité des spectres pour rendre les spectres comparables : L'intensité totale de chaque spectre est normalisée de façon à ce que la somme de la surface du signal constituant le spectre soit égale à 1 (figure D). 1.4) Perform a calibration (scale correction) of the intensity of the spectra to make the spectra comparable: The total intensity of each spectrum is normalized so that the sum of the signal surface constituting the spectrum is equal to 1 (Figure D).
1.5) Les différents spectres sont ensuite alignés en utilisant des pics témoins d'intensités remarquables pour corriger les décalages de pics causés par les fluctuations de conditions expérimentales d'une acquisition à l'autre. 1.5) The different spectra are then aligned using remarkable intensity control peaks to correct for peak offsets caused by fluctuations in experimental conditions from one acquisition to another.
1.6) Détection des pics par rapport au bruit de fond, ce dernier étant estimé en calculant la médiane des déviations absolues depuis la médiane (MAD) avec une demi-fenêtre de 8 Da et un rapport signal-bruit de 4. 1.7) Fusion des 4 spectres des 4 prélèvements d'un même échantillon sont fusionnés en construisant la moyenne des spectres. 1.6) Detection of peaks with respect to background noise, the latter being estimated by calculating the median of absolute deviations from the median (MAD) with a half-window of 8 Da and a signal-to-noise ratio of 4. 1.7) Fusion of the 4 spectra of the 4 samplings of the same sample are merged by constructing the average of the spectra.
2) Construction de la matrice d'intensités (figure E). 2) Construction of the matrix of intensities (figure E).
2.1) Détection des pics par rapport au bruit de fond sur la base d'un rapport signal-bruit de 4 avec une tolérance de fluctuation de 8 Da. 2.1) Peak detection with respect to background noise based on a signal-to-noise ratio of 4 with a fluctuation tolerance of 8 Da.
2.2) Filtrage des spectres en ne retenant que les pics détectés (S/N supérieur ou égal à 4) et les pics présents dans au moins 30% des spectres du lot de spectres étudiés à chacun des exemples 1 à 4, à savoir spectres d'échantillons de sujets présentant la pathologie concernée et témoins. 2.2) Filtering the spectra by retaining only the detected peaks (S / N greater than or equal to 4) and the peaks present in at least 30% of the spectra of the spectral batch studied in each of Examples 1 to 4, namely spectra of samples of subjects presenting the pathology concerned and controls.
2.3) construction de la matrice dans laquelle chaque ligne est un spectre avec les intensités relatives des pics, chaque colonne correspondant à un pic de la liste des masses m/z des pics protéiques de la première ligne, l'intensité relative des pics correspondant à la surface du dit pic par rapport à la somme de la surfaces des pics dudit spectre. Cette matrice d'intensités est le matériel expérimental qui fera l'objet des analyses de spectres qui suivent. 2.3) construction of the matrix in which each line is a spectrum with the relative intensities of the peaks, each column corresponding to a peak of the list of masses m / z of the protein peaks of the first line, the relative intensity of the peaks corresponding to the area of said peak relative to the sum of the peak areas of said spectrum. This matrix of intensities is the experimental material which will be the subject of the spectral analyzes which follow.
3) Recherche des pics discriminants 3) Search for discriminating peaks
Les lignes de la matrice d'intensité sont tout d'abord associées aux groupes de prélèvements que l'on veut discriminer (groupe de sujets présentant la pathologie concernée vs groupe témoins de sujets sains). The lines of the intensity matrix are firstly associated with the groups of samples that are to be discriminated (group of subjects presenting the pathology concerned vs the control group of healthy subjects).
Une première étape a pour but d'identifier les pics ayant le plus grand pouvoir discriminant entre les groupes. Elle repose sur l'application itérative d'une analyse discriminante binaire sur chaque pic, c'est à dire la recherche pour chaque pic de la valeur seuil d'intensité relative qui permet maximiser la séparation des groupes et du score de discrimination (mesure du chevauchement ou de la séparation des intensités) des groupes. Ce score permet de construire la liste des pics en fonction de leur pouvoir discriminant décroissant. A la fin de cette première étape on recherche s'il existe un ensemble de pics ayant 100% de contraste (c'est-à-dire sans chevauchement), c'est à dire caractéristiques de chaque groupe. Si c'est le cas cet ensemble de pic est retenu, avec les valeurs seuils identifiées par l'analyse discriminante binaire. L'identification des spectres se fait ici par un score résultant d'une combinaison linéaire de présence de pics (score linéaire de ressemblance par rapport à une norme) comme illustré aux exemples 1 à 3. A first step aims to identify the peaks having the greatest discriminating power between the groups. It is based on the iterative application of a binary discriminant analysis on each peak, ie the search for each peak of the relative intensity threshold value which allows to maximize the separation of the groups and the discrimination score (measure of overlap or separation of intensities) groups. This score makes it possible to build the list of the peaks according to their decreasing discriminating power. At the end of this first step we search if there is a set of peaks having 100% contrast (that is to say without overlap), ie characteristics of each group. If this is the case, this peak set is retained, with the threshold values identified by the binary discriminant analysis. The identification of the spectra is done here by a score resulting from a linear combination of presence of peaks (linear score of resemblance to a norm) as illustrated in Examples 1 to 3.
Si ce n'est pas le cas il est alors nécessaire de procéder à une seconde étape afin de rechercher les combinaisons de pics en cascade qui permettent de différencier les groupes (exemple 4). Cette combinaison est organisée sous la forme d'un arbre binaire de décision dont chaque feuille est la détermination d'un groupe à discriminer et chaque nœud est une règle de décision de la forme : « si la valeur du pic est supérieure ou égale au seuil x alors choix n°l sinon choix n°2 ». Chaque choix peut mener soit à une autre règle de décision soit aboutir à une autre feuille (détermination d'un autre groupe à discriminer). Les règles de décision peuvent ainsi s'enchaîner en cascade jusqu'à l'identification d'un groupe. L'identification de ces arbres binaires de décision se fait en appliquant l'algorithme d'apprentissage symbolique et de data mining C5.0 de Quinlan mentionné ci-dessus. Pour contrôler l'application de cet algorithme en réduisant son espace de recherche et le forcer à utiliser les pics de pouvoir discriminant optimal, on restreindra la matrice d'intensité qui sera traitée aux seuls pics ayant les plus hauts scores de l'analyse discriminante binaire précédente. If this is not the case then it is necessary to proceed to a second step in order to look for the cascaded peak combinations that make it possible to differentiate the groups (example 4). This combination is organized in the form of a decision binary tree whose each sheet is the determination of a group to be discriminated and each node is a decision rule of the form: "if the value of the peak is greater than or equal to the threshold x then choice n ° l otherwise choice n ° 2 ". Each choice can either lead to another decision rule or lead to another sheet (determination of another group to discriminate). The decision rules can thus be linked in cascade until the identification of a group. The identification of these decision binary trees is done by applying the Quinlan symbolic learning and data mining algorithm C5.0 mentioned above. To control the application of this algorithm by reducing its search space and forcing it to use peaks of optimal discriminating power, we restrict the intensity matrix that will be processed to only the peaks with the highest scores of the binary discriminant analysis. former.
Pareille utilisation des arbres binaires dans ce contexte d'identification de spectres MALDI-TOF comme illustré à l'exemple 4 n'a jamais été proposée. Such use of the binary trees in this context of identification of MALDI-TOF spectra as illustrated in Example 4 has never been proposed.
Exemple 1 : Identification de colite ulcéreuse à Clostridium difficile. Example 1: Identification of ulcerative colitis with Clostridium difficile.
La colite ulcéreuse à Clostridium difficile est une maladie très grave tuant probablement plus de 100.000 personnes par an dans le monde, 30 000 en Europe, 30 000 aux Etats Unis. Cette maladie est due à l'association d'une perturbation de la flore fécale avec la présence d'un microbe Clostridium difficile sécréteur de toxines. On a étudié le microbiote intestinal de témoins contrôles apparemment sains et de patients porteurs d'une colite ulcéreuse à Clostridium difficile détecté par des techniques moléculaires permettant d'affirmer qu'il y avait du Clostridium difficile avec sa toxine chez des patients qui présentaient des signes cliniques typiques de cette maladie. Clostridium difficile ulcerative colitis is a very serious disease that probably kills more than 100,000 people a year worldwide, 30,000 in Europe, 30,000 in the United States. This disease is due to the association of faecal flora disruption with the presence of a Clostridium difficile toxin-secreting microbe. The gut microbiota of apparently healthy control controls and patients with Clostridium difficile ulcerative colitis detected by molecular techniques have been studied. had Clostridium difficile with its toxin in patients who had typical clinical signs of this disease.
On a utilisé neuf selles de patient ayant une colite à C. difficile (CDI) définie par la présence de diarrhées de façon concomitante avec la détection de toxine de C. difficile dans les selles. La présence de toxine de C. difficile était recherchée par PCR en temps réel (RT-PCR) avec le kit GeneXpert® IV (Cepheid, Sunnyvale, Etats Unis) détectant le gène tcd B de la toxine B, le gène cdt de la toxine binaire et la délétion 117 du locus régulateur tcdC permettant de détecter les souches de génotype 027. Nine stools of patients with C. difficile colitis (CDI) defined by the presence of diarrhea were used concomitantly with the detection of C. difficile toxin in the stool. The presence of C. difficile toxin was investigated by real-time PCR (RT-PCR) with the GeneXpert® IV kit (Cepheid, Sunnyvale, USA) detecting the tcd B gene of toxin B, the cdt toxin gene binary and deletion 117 of the tcdC regulator locus for detecting strains of genotype 027.
En tant que groupe contrôle on a utilisé huit échantillons contrôles de selles de sujets sains. La recherche de toxine C. difficile par RT-PCR était négative sur ces selles. As a control group eight stool controls were used of healthy subjects. The search for C. difficile toxin by RT-PCR was negative on these stools.
Tous les échantillons utilisés dans le cadre de cette analyse étaient stockés à -80°C avant l'analyse. All samples used in this analysis were stored at -80 ° C prior to analysis.
L'analyse discriminante binaire de ces 17 prélèvements a permis de hiérarchiser les 984 pics protéiques retenus dans une matrice d'intensités relatives obtenue par le prétraitement ci-dessus décrit. Le résultat de l'analyse discriminante binaire montrant les 40 pics de scores discriminants les plus élevés est présenté en Figure IA dans laquelle le score discriminant est quantifié de -4 à +4 pour le groupe infecté (CDI) et le groupe témoin (control). Un score positif correspond à la présence du pic pour le groupe considéré et vice versa. The binary discriminant analysis of these 17 samples made it possible to prioritize the 984 protein peaks retained in a matrix of relative intensities obtained by the pretreatment described above. The result of the binary discriminant analysis showing the 40 peaks of the highest discriminating scores is shown in FIG. 1A in which the discriminant score is quantified from -4 to +4 for the infected group (CDI) and the control group (control). . A positive score corresponds to the presence of the peak for the group considered and vice versa.
Les résultats d'analyse discriminante de la figure IA résultent des distributions de valeurs des intensités relatives incluant les distributions de valeurs pour les pics les plus discriminants montrés à la Figure I B. The discriminant analysis results of FIG. 1A result from the distributions of values of the relative intensities including the value distributions for the most discriminating peaks shown in FIG.
Parmi les 50 pics de plus haut score discriminant on a recherché ceux ayant 100% de contraste, c'est à dire avec une sensibilité et une spécificité de 1. Au total 8 pics ont pu être identifiés, et sont décrits en Tableau 1. Among the 50 peaks of highest discriminating score were searched those having 100% contrast, ie with a sensitivity and specificity of 1. A total of 8 peaks could be identified, and are described in Table 1.
Tableau 1 : Valeurs des seuils discriminants pour les pics avec 100% de contraste. Ces seuils sont exprimés en valeurs d'intensités relatives par rapport à la surface normalisée à la valeur 1 de la surface totale du spectre.
Figure imgf000026_0001
Table 1: Discriminant threshold values for peaks with 100% contrast. These thresholds are expressed in values of relative intensities with respect to the normalized surface at the value 1 of the total surface of the spectrum.
Figure imgf000026_0001
La méthode d'identification d'un spectre à partir de ces pics discriminants est la suivante. The method of identifying a spectrum from these discriminating peaks is as follows.
Après normalisation on ne retient que les valeurs des 8 pics discriminants, avec une tolérance de la valeur m/z des pics que l'on peut fixer par défaut à 5%o . After normalization, only the values of the 8 discriminating peaks are retained, with a tolerance of the m / z value of the peaks which can be fixed by default at 5% o.
Calcul du score d'identification : Calculation of the identification score:
Pour chacun des 8 pics : For each of the 8 peaks:
-« 1 » si l'intensité du pic est dans la zone de valeur des cas ; - "1" if the intensity of the peak is in the value area of the cases;
-« -1 » si l'intensité du pic est dans la zone de valeur des témoins ; - "-1" if the intensity of the peak is in the value zone of the witnesses;
-« 0 » si l'intensité du pic est entre les 2 zones de valeur. - "0" if the intensity of the peak is between the 2 zones of value.
On fait la somme (score), qui est dans l'intervalle [-8,8]. Le score discriminant normalisé est le score divisé par le nombre de pics discriminants (1 : certitude de ressemblance aux cas, -1 : certitude de ressemblance aux témoins). We do the sum (score), which is in the interval [-8.8]. The standardized discriminant score is the score divided by the number of discriminating peaks (1: certainty of resemblance to cases, -1: certainty of resemblance to controls).
Aucun des pics spécifiques discriminants ne correspond à une protéine de Clostridium difficile actuellement identifiée dans les bases de données internationales de référence telle que SWISSPROT. None of the specific discriminant peaks corresponds to a Clostridium difficile protein currently identified in international reference databases such as SWISSPROT.
Exemple 2 : Identification de selles de sujets atteints de Rectocolite hémorragique (RCH). Example 2: Stool identification of subjects with hemorrhagic rectocolitis (RCH).
On a analysé 4 échantillons de patients présentant une recto-colite hémorragique stable (RCH) et 15 échantillons contrôles. L'analyse discriminante binaire de ces 19 prélèvements a permis de hiérarchiser les 157 pics protéiques dans la matrice des intensités obtenue par le prétraitement. Four samples of patients with stable hemorrhagic rectocolitis (RCH) and 15 control samples were analyzed. The binary discriminant analysis of these 19 samples made it possible to prioritize the 157 protein peaks in the matrix of intensities obtained by the pretreatment.
Le résultat de l'analyse discriminante binaire montrant les 40 pics de scores discriminants les plus élevés est présenté en Figure 2A avec un score de -4 à +4 pour le groupe de patients (RCH) et le groupe témoin (contrôle). Un score positif correspond à la présence du pic pour le groupe considéré. The result of the binary discriminant analysis showing the 40 peaks of the highest discriminant scores is shown in Figure 2A with a score of -4 to +4 for the group of patients (RCH) and the control group (control). A positive score corresponds to the presence of the peak for the group considered.
Parmi les 50 pics de plus haut score discriminant on a recherché ceux ayant 100% de contraste, c'est à dire avec une sensibilité et une spécificité de 1. Au total 11 pics ont pu être identifiés, et sont décrits en Tableau 2. Among the 50 peaks of highest discriminating score, those having 100% contrast, ie with sensitivity and specificity of 1, were searched. A total of 11 peaks could be identified, and are described in Table 2.
Leur distribution statistique des pics avec les pouvoirs discriminants les plus élevés est présentée en Figure 2B. Their statistical distribution of peaks with the highest discriminant powers is presented in Figure 2B.
Tableau 2 : Valeurs des seuils d'intensités discriminants pour les pics avec 100% de contraste. Ces seuils sont exprimés en en valeurs d'intensités relatives par rapport à la surface normalisée à la valeur 1 de la surface totale du spectre. Table 2: Discriminant intensity threshold values for peaks with 100% contrast. These thresholds are expressed in values of relative intensities with respect to the normalized surface at the value 1 of the total surface of the spectrum.
Figure imgf000027_0001
Figure imgf000027_0001
Les résultats d'analyse discriminante de la figure 2A résultent des distributions de valeurs des intensités relatives incluant les distributions de valeurs pour les pics les plus discriminants montrés à la Figure 2B. The discriminant analysis results of Fig. 2A result from the distributions of values of the relative intensities including the value distributions for the most discriminating peaks shown in Fig. 2B.
La méthode d'identification d'un spectre à partir de ces pics discriminants est la suivante. Après normalisation, on ne retient que les valeurs des 8 pics discriminants, avec une tolérance de la valeur m/z des pics que l'on peut fixer par défaut à 5%o, de préférence 3xlO \ The method of identifying a spectrum from these discriminating peaks is as follows. After normalization, only the values of the 8 discriminating peaks are retained, with a tolerance of the value m / z of the peaks which can be set by default at 5% o, preferably 3x10
On calcule un score d'identification comme suit : Chaque pic 3324, 3345, 3444, 3482, 3493 supérieur à son seuil du tableau précédent et chaque pic 6451, 7268, 9599, 9620, 9636, 9707 inférieur à son seuil du tableau précédent vaut 1 point, 0 si l'intensité du pic est entre les 2 zones de valeur, et -1 si l'intensité est dans la zone de valeurs opposée. An identification score is calculated as follows: Each peak 3324, 3345, 3444, 3482, 3493 above its threshold in the preceding table and each peak 6451, 7268, 9599, 9620, 9636, 9707 below its threshold in the preceding table is equal to 1 point, 0 if the intensity of the peak is between the 2 value zones, and -1 if the intensity is in the opposite zone of values.
On fait la somme (score). Le score normalisé est le score divisé par le nombre de pics discriminants (1 : certitude de ressemblance aux cas, -1 : certitude de ressemblance aux témoins). We do the sum (score). The normalized score is the score divided by the number of discriminating peaks (1: certainty of resemblance to cases, -1: certainty of resemblance to controls).
Exemple 3 : Identification de selles de sujets atteints la maladie de Crohn. Example 3: Stool identification of subjects with Crohn's disease.
On a analysé 13 échantillons de patients présentant une maladie de Crohn, (dont 7 traités et stables, 5 en échec thérapeutique, et 1 non traité mais stable) et 29 échantillons contrôles. 13 samples of patients with Crohn's disease (7 treated and stable, 5 treatment failure, and 1 untreated but stable) and 29 control samples were analyzed.
L'analyse discriminante binaire de ces 19 prélèvements a permis de hiérarchiser les 116 pics protéiques retenus par le prétraitement. Le résultat de l'analyse discriminante binaire montrant les 40 pics de scores discriminants les plus élevés est présenté en Figure 3A. The binary discriminant analysis of these 19 samples made it possible to prioritize the 116 protein peaks retained by the pretreatment. The result of the binary discriminant analysis showing the 40 peaks of the highest discriminant scores is shown in Figure 3A.
Parmi les 50 pics de plus haut score discriminant on a recherché ceux ayant 100% de contraste, c'est à dire avec une sensibilité et une spécificité de 1. Au total 3 pics ont pu être identifiés, et sont décrits en Tableau 3. Among the 50 peaks of highest discriminating score, those having 100% contrast, ie with sensitivity and specificity of 1, were searched. A total of 3 peaks could be identified, and are described in Table 3.
La distribution statistique des 8 meilleurs pics, présentée en Figure 3B, montre que le pic 4134 possède un pouvoir discriminant le plus élevé. The statistical distribution of the 8 best peaks, shown in Figure 3B, shows that peak 4134 has the highest discriminating power.
Sur la figure 3A, les scores discriminants sont quantifiés de -4 à +4 pour le groupe de patients (RCH) et le groupe témoin (control). Un score positif correspond à la présence du pic pour le groupe considéré. Tableau 3 : Valeurs des seuils discriminants pour les pics avec 100% de contraste. Ces seuils sont exprimés en en valeurs d'intensités relatives par rapport à la surface normalisée à la valeur 1 de la surface totale du spectre. In FIG. 3A, the discriminant scores are quantified from -4 to +4 for the group of patients (RCH) and the control group (control). A positive score corresponds to the presence of the peak for the group considered. Table 3: Discriminant threshold values for peaks with 100% contrast. These thresholds are expressed in values of relative intensities with respect to the normalized surface at the value 1 of the total surface of the spectrum.
Figure imgf000029_0001
Figure imgf000029_0001
Les dits pics discriminants ne sont pas présents dans les spectres d'un échantillon d'agents pathogènes actuellement identifiée dans les bases de données internationales de référence telle que SWISSPROT. These discriminating peaks are not present in the spectra of a pathogen sample currently identified in international reference databases such as SWISSPROT.
La méthode d'identification d'un spectre à partir de ces pics discriminants est la suivante. The method of identifying a spectrum from these discriminating peaks is as follows.
Après normalisation on ne retient que les valeurs des 3 pics discriminants, avec une tolérance de la valeur m/z des pics que l'on peut fixer par défaut à 5%o, de préférence 3xlO \ After normalization, only the values of the 3 discriminating peaks are retained, with a tolerance of the value m / z of the peaks which can be set by default at 5% o, preferably 3x10
On calcul un score d'identification : Chaque pic 3443, 4134, 4170 supérieur à son seuil du tableau précédent vaut 1 point, 0 si l'intensité du pic est entre les 2 zones de valeur, et -1 si l'intensité est dans la zone de valeurs opposées. An identification score is calculated: Each peak 3443, 4134, 4170 greater than its threshold in the preceding table is worth 1 point, 0 if the intensity of the peak is between the 2 value zones, and -1 if the intensity is in the zone of opposite values.
On fait la somme (score). Le score normalisé est le score divisé par le nombre de pics discriminants (1 : certitude de ressemblance aux cas, -1 : certitude de ressemblance aux témoins). We do the sum (score). The normalized score is the score divided by the number of discriminating peaks (1: certainty of resemblance to cases, -1: certainty of resemblance to controls).
Exemple 4 : Identification de selles de sujets atteints de HIV Example 4: stool identification of subjects with HIV
Les prélèvements sont issus de 54 patients HIV positifs, d'un patient HIV- Free, et de 37 témoins. Les 396 spectres bruts ont fait objet des traitements décrit plus haut. Les pics permettant de discriminer les patients HIV positifs (cas) des témoins ont été recherchés par le second traitement décrit. Le résultat de l'analyse discriminante binaire avec les 40 pics les plus discriminants est rapporté en figure 4A. La figure 4B montre la distribution des valeurs d'intensités relatives des 10 pics de score discriminant les plus élevés obtenus par l'analyse de la figure 5. Aucun pic ne permet de discriminer un groupe avec 100% de contraste. Dans ce cas on a recherché et trouvé une combinaison de couples (pic-seuil d'intensité) permettant de déterminer l'appartenance à un groupe HIV ou groupe témoin constituant un arbre de décisions en appliquant la méthode décrite ci-dessus basée sur l'algorithme C5.0 de Quinlan. The samples come from 54 HIV-positive patients, one HIV-Free patient, and 37 controls. The 396 raw spectra were subjected to the treatments described above. The peaks making it possible to discriminate the HIV positive patients (cases) from the controls were sought by the second treatment described. The result of the binary discriminant analysis with the 40 most discriminating peaks is reported in Figure 4A. FIG. 4B shows the distribution of the relative intensity values of the highest discriminating score peaks obtained by the analysis of FIG. 5. No peak makes it possible to discriminate a group with 100% contrast. In this case we sought and found a combination of pairs (peak-intensity threshold) to determine membership in an HIV group or control group constituting a decision tree by applying the method described above based on the Quinlan algorithm C5.0.
Ainsi, cette recherche d'arbre binaire de classification a permis d'identifier 4 pics avec leurs valeurs seuil permettant une classification des deux groupes avec une exactitude de 96,8% (3,2% de classification erronée) présenté en figure 5. Thus, this search for a binary tree of classification made it possible to identify 4 peaks with their threshold values permitting a classification of the two groups with an accuracy of 96.8% (3.2% misclassification) presented in FIG.
Tableau 4 : Valeurs des seuils discriminants d'intensités pour les pics discriminants +/-3xl0 4 .Ces seuils sont exprimés en valeurs d'intensités relatives par rapport à la surface normalisée à la valeur 1 de la surface totale du spectre. Table 4: Intensity discriminant threshold values for discriminating peaks +/- 3xl0 4. These thresholds are expressed in values of relative intensities with respect to the normalized surface at the value 1 of the total surface of the spectrum.
Figure imgf000030_0001
Figure imgf000030_0001
Les dits pics discriminants ne sont pas présents dans les spectres d'un échantillon du virus HIV responsable de la dite pathologie isolé actuellement identifiée dans les bases de données internationales de référence telle que SWISSPROT. These discriminating peaks are not present in the spectra of a sample of the HIV virus responsible for the said isolated pathology currently identified in international reference databases such as SWISSPROT.
La Figure 4A montre les résultats de l'analyse discriminante binaire sur les prélèvements de patients HIV (Control = patients témoins, cases = patients HIV). Sur la figure 4B, les scores discriminants sont quantifiés de -5 à +5 pour le groupe de patients (HIV) et le groupe témoin (control). Un score positif correspond à la présence du pic pour le groupe considéré. Figure 4A shows the results of the binary discriminant analysis on the samples of HIV patients (Control = control patients, cells = HIV patients). In FIG. 4B, the discriminant scores are quantified from -5 to +5 for the group of patients (HIV) and the control group (control). A positive score corresponds to the presence of the peak for the group considered.
La Figure 5 montre l'arbre de classification binaire obtenu par application de l'algorithme C5.0 (Control = patients témoins, cases = patients HIV). On détermine la présence ou l'absence de la maladie du SIDA résultant d'une infection par le VIH pour laquelle à l'étape a), on a identifié 4 seuils de 4 pics spécifiques tels que : Figure 5 shows the binary classification tree obtained by applying algorithm C5.0 (Control = control patients, cells = HIV patients). The presence or absence of AIDS disease resulting from HIV infection is determined for which in step a), 4 thresholds of 4 specific peaks such as:
1) la maladie est présente si les valeurs d'intensités relatives des 4 pics sont telles que: 1) the disease is present if the relative intensity values of the 4 peaks are such that:
1.1) -l'intensité relative du pic PI est supérieure au seuil d'intensité de1.1) -the relative intensity of the PI peak is greater than the intensity threshold of
0.000116691, l'intensité relative du pic P2 est inférieure au seuil d'intensité de 0.0006103814 et l'intensité relative du pic P3 est supérieure au seuil d'intensité de 0.000110201, ou 0.000116691, the relative intensity of the peak P2 is less than the intensity threshold of 0.0006103814 and the relative intensity of the peak P3 is greater than the intensity threshold of 0.000110201, or
1.2) -l'intensité relative du pic PI est supérieure au seuil d'intensité de1.2) -the relative intensity of the PI peak is greater than the intensity threshold of
0.000116691, l'intensité relative du pic P2 est inférieure au seuil d'intensité de 0.0006103814, l'intensité relative du pic P3 est inférieure au seuil d'intensité de0.000116691, the relative intensity of the peak P2 is less than the intensity threshold of 0.0006103814, the relative intensity of the peak P3 is less than the intensity threshold of
0.000110201 et l'intensité relative du pic P4 est inférieure au seuil d'intensité de0.000110201 and the relative intensity of the peak P4 is below the intensity threshold of
0.0001444286; et 0.0001444286; and
2) la maladie n'est pas présente si les valeurs d'intensités relatives des 4 pics sont telles que : 2) the disease is not present if the relative intensity values of the 4 peaks are such that:
2.1) l'intensité relative du pic PI est inférieure au seuil d'intensité de2.1) the relative intensity of the PI peak is below the intensity threshold of
0.000116691, 0.000116691,
2.2) l'intensité relative du pic PI est supérieure au seuil d'intensité de2.2) the relative intensity of the PI peak is greater than the intensity threshold of
0.000116691 et l'intensité relative du pic P2 est supérieure au seuil d'intensité de 0.0006103814, 0.000116691 and the relative intensity of the peak P2 is greater than the intensity threshold of 0.0006103814,
2.3) l'intensité relative du pic PI est supérieure au seuil d'intensité de2.3) the relative intensity of the PI peak is greater than the intensity threshold of
0.000116691, l'intensité relative du pic P2 est inférieure au seuil d'intensité de0.000116691, the relative intensity of peak P2 is less than the intensity threshold of
0.0006103814, l'intensité relative du pic P3 est inférieure au seuil d'intensité du pic P3 de 0.000110201 et l'intensité relative du pic P4 est supérieure au seuil d'intensité du pic P4 de 0.0001444286. Références bibliographiques 0.0006103814, the relative intensity of the peak P3 is less than the peak intensity threshold P3 of 0.000110201 and the relative intensity of the peak P4 is greater than the intensity threshold of the peak P4 of 0.0001444286. Bibliographical references
(1) Seng P, Drancourt M, Gouriet F, et al . Ongoing révolution in bacteriology: routine identification of bacteria by matrix-assisted laser desorption ionization time-of-flight mass spectrometry. Clin Infect Dis 2009 Aug 15; 49(4) : 543-51. (1) Seng P, Drancourt M, Gouriet F, et al. Ongoing revolution in bacteriology: routine identification of bacteria by matrix-assisted laser desorption ionization time-of-flight mass spectrometry. Clin Infect Dis 2009 Aug 15; 49 (4): 543-51.
(2) Yssouf A, Flaudrops C, Drali R, et al. Matrix-assisted laser desorption ionization-time of flight mass spectrometry for rapid identification of tick vectors. J Clin Microbiol 2013 Feb; 51(2) : 522-8. (2) Yssouf A, Flaudrops C, Drali R, et al. Matrix-assisted laser desorption ionization-time of mass spectrometry for rapid identification of tick vectors. J Clin Microbiol 2013 Feb; 51 (2): 522-8.
(3) Yssouf A, Socolovschi C, Leulmi H, et al. Identification of flea species using MALDI-TOF/MS. Comp Immunol Microbiol Infect Dis 2014 May; 37(3) : 153-7. (3) Yssouf A, Socolovschi C, Leulmi H, et al. Identification of flea species using MALDI-TOF / MS. Comp Immunol Microbiol Infect Dis 2014 May; 37 (3): 153-7.
(4) Yssouf A, Socolovschi C, Flaudrops C, et al. Matrix-assisted laser desorption ionization--time of flight mass spectrometry: an emerging tool for the rapid identification of mosquito vectors. PLoS One 2013; 8(8) :e72380. (4) Yssouf A, Socolovschi C, Flaudrops C, et al. Matrix-assisted laser desorption ionization - time of flight mass spectrometry: an emerging tool for rapid identification of mosquito vectors. PLoS One 2013; 8 (8): e72380.
(5) Tran TN, Aboudharam G, Gardeisen A, et al . Classification of ancient mammal individuals using dental pulp MALDI-TOF MS peptide profiling . PLoS One 2011 Feb 25; 6(2) :el7319. (5) Tran TN, Aboudharam G, Gardeisen A, et al. Classification of ancient mammal individuals using dental pulp MALDI-TOF MS peptide profiling. PLoS One 2011 Feb 25; 6 (2): el7319.
(6) Lagier JC, Armougom F, Million M, et al . Microbial culturomics : paradigm shift in the human gut microbiome study. Clin Microbiol Infect 2012 Dec; 18(12) : 1185-93. (6) Lagier JC, Armougom F, Million M, et al. Microbial culturomics: paradigm shift in the human gut microbiome study. Clin Microbiol Infect 2012 Dec; 18 (12): 1185-93.
(7) Lagier JC, Khelaifia S, Tidjani-Alou M . Cultu re of previously uncultured members of the human gut microbiota by culturomics. Nat Microbiol . [in press] 2016. (7) Lagier JC, Khelaifia S, Tidjani-Alou M. Cultu re of previously uncultured members of the human gut microbiota by culturomics. Nat Microbiol. [in press] 2016.
(8) Hocquart M, Lagier JC, Cassir N, et al . Early Faecal Microbiota Transplantation Improves Survival in Severe Clostridium difficile Infections. Clin Infect Dis 2017 Aug 24. (8) Hocquart M, Lagier JC, Cassir N, et al. Early Faecal Microbiota Transplant Improves Survival in Severe Clostridium difficile Infections. Clin Infect Dis 2017 Aug 24.

Claims

REVENDICATIONS
1. Méthode de détermination d'une pathologie d'un individu humain par analyse d'un échantillon de matières fécales sans traitement préalable, du dit individu humain par spectrométrie de masse de type MALDI-TOF, dans laquelle : a) on détermine une combinaison d'une pluralité de pics discriminants pour lesquels on détermine des seuils de valeurs d'intensités permettant de distinguer les spectres d'échantillons de matières fécales des individus présentant ladite pathologie par rapport aux spectres d'échantillons de matières fécales d'individus ne présentant pas la dite pathologie, en fonction des valeurs des intensités des dits pics discriminants; b) on réalise le spectre d'un échantillon de matières fécales à analyser, tel quel sans traitement préalable dudit échantillon, et c) on vérifie si le spectre dudit échantillon de matières fécales à analyser comprend les dits pics discriminants et si les valeurs des intensités des pics discriminants correspondent à une combinaison de valeurs des intensités correspondant aux spectres d'individus présentant la dite pathologie ou d'individus ne présentant pas la dite pathologie, tel que déterminés à l'étape a). 1. Method for determining a pathology of a human individual by analysis of a faeces sample without prior treatment, of said human individual by MALDI-TOF mass spectrometry, in which: a) a combination is determined of a plurality of discriminating peaks for which thresholds of intensity values are determined making it possible to distinguish the spectra of faecal specimens from individuals presenting said pathology with respect to the spectra of faecal samples of individuals not exhibiting the said pathology, as a function of the values of the intensities of the said discriminating peaks; b) the spectrum of a sample of faeces to be analyzed is analyzed, as it is without prior treatment of said sample, and c) it is checked whether the spectrum of said sample of faeces to be analyzed comprises said discriminating peaks and if the values of the intensities discriminant peaks correspond to a combination of intensity values corresponding to the spectra of individuals presenting said pathology or of individuals not having said pathology, as determined in step a).
2. Méthode selon la revendication 1 dans laquelle la pathologie d'un individu humain est une pathologie inflammatoire ou une maladie infectieuse. The method of claim 1 wherein the pathology of a human individual is an inflammatory pathology or an infectious disease.
3. Méthode selon la revendication 2 dans laquelle la pathologie inflammatoire ou la maladie infectieuse est une pathologie ou maladie infectieuse de l'appareil digestif. 3. Method according to claim 2 wherein the inflammatory pathology or the infectious disease is a pathology or infectious disease of the digestive system.
4. Méthode selon l'une des revendications 1 à 3, caractérisée en ce qu'on réalise le spectre d'un dit échantillon de matières fécales brut dissout dans une solution de matrice de préférence de solution saturée d'acide alpha-cyano-4-hydroxycinnamique dans 50 % d'acétonitrile et 2,5 % d'acide tri-fluoracétique. 4. Method according to one of claims 1 to 3, characterized in that realizes the spectrum of a said sample of raw faeces dissolve in a solution of matrix preferably saturated solution of alpha-cyano-4-hydroxycinnamic acid in 50% acetonitrile and 2.5% trifluoroacetic acid.
5. Méthode selon l'une des revendications 1 à 4, caractérisée en ce qu'à l'étape a), on détermine une combinaison d'une pluralité de pics discriminants caractérisée en ce qu'on détermine des fourchettes de valeurs d'intensités permettant de distinguer les spectres d'échantillons des individus présentant ladite pathologie et les spectres d'échantillons d'individus ne présentant pas la dite pathologie, en fonction des différentes valeurs des intensités des pics discriminants concernés dans le spectre d'un échantillon à analyser permettant ainsi de déterminer la présence ou non de la dite pathologie selon que pour lesdits pics discriminants l'intensité de chaque pic discriminant est spécifiquement à l'intérieur ou en dehors d'au moins une fourchette de valeurs d'intensités, les dites fourchettes pouvant être identiques ou de préférence différentes pour les différents pics discriminants. 5. Method according to one of claims 1 to 4, characterized in that in step a), a combination of a plurality of discriminating peaks is determined, characterized in that ranges of intensity values are determined. for distinguishing the spectra of samples from individuals presenting said pathology and the spectra of samples of individuals not presenting said pathology, as a function of the different values of the intensities of the discriminant peaks concerned in the spectrum of a sample to be analyzed allowing thus to determine the presence or absence of said pathology according to whether for said discriminating peaks the intensity of each discriminating peak is specifically within or outside at least a range of intensity values, said ranges being able to be identical or preferably different for the different discriminating peaks.
6. Méthode selon la revendication 5, caractérisé en ce qu'à l'étape a), on détermine la présence ou non de la dite pathologie, selon que pour les dits pics discriminants, les valeurs d'intensités sont comprises dans une première fourchette de valeurs d'intensités pour déterminer la présence de la dite pathologie ou à l'intérieure d'une deuxième fourchette de valeurs d'intensités pour déterminer l'absence de ladite pathologie, les dites première fourchette et deuxième fourchette ne se chevauchant pas, et ce pour chaque dit pic discriminant. 6. Method according to claim 5, characterized in that in step a), the presence or absence of said pathology is determined, according to whether for said discriminating peaks the intensity values are included in a first range. intensity values for determining the presence of said pathology or within a second range of intensity values for determining the absence of said pathology, said first and second ranges not overlapping, and this for each said discriminating peak.
7. Méthode selon la revendication 6, caractérisée en ce qu'à l'étape a), la probabilité de présence de la dite pathologie est d'autant plus grande que le nombre n i de dits pics discriminants pour lesquels les valeurs d'intensités relatives sont à l'intérieur des dites premières fourchettes, est plus grand et supérieur au nombre n2 de dits pics discriminants pour lesquels les valeurs d'intensités relatives sont à l'intérieur des dites deuxièmes fourchettes. 7. Method according to claim 6, characterized in that in step a), the probability of presence of said pathology is even greater than the number of said discriminating peaks for which the relative intensity values are within said first ranges, is larger and greater than the number n2 of said discriminating peaks for which the relative intensity values are within said second ranges.
8. Méthode selon la revendication 7, caractérisée en ce qu'à l'étape a), la probabilité de présence de ladite pathologie est de 100% si pour tous les dits pics spécifiques discriminants, les valeurs d'intensités relatives sont à l'intérieur des dites premières fourchettes, et la probabilité d'absence de ladite pathologie est de 100% si pour tous les dits pics discriminants les valeurs d'intensités relatives sont à l'intérieur des dites deuxièmes fourchettes. 8. Method according to claim 7, characterized in that in step a), the probability of presence of said pathology is 100% if for all so-called discriminant specific peaks, the relative intensity values are within said first ranges, and the probability of absence of said pathology is 100% if for all the said discriminating peaks the relative intensity values are equal to 100%. interior of said second forks.
9. Méthode selon l'une des revendications 6 à 8, caractérisée en ce qu'on détermine la présence ou l'absence de la maladie consistant en une colite résultat d'une infection par Clostridium difficile pour laquelle à l'étape a), on détermine 8 dites premières et deuxièmes fou rchettes de valeurs d'intensités de 8 pics discriminants. 9. Method according to one of claims 6 to 8, characterized in that determining the presence or absence of the disease consisting of a colitis resulting from a Clostridium difficile infection for which in step a), 8 first and second mad lines of intensity values of 8 discriminating peaks are determined.
10. Méthode selon la revendication 9, caractérisé en ce que les dits 8 pics discriminants sont des pics à 2710, 3372, 3399, 3408, 3445, 4374, 5658, 11047 Da à +/- 3xl0 4. 10. Method according to claim 9, characterized in that the said 8 discriminating peaks are peaks at 2710, 3372, 3399, 3408, 3445, 4374, 5658, 11047 Da at +/- 3x10 4 .
11. Méthode selon la revendication 10, caractérisé en ce que les dites première et deuxième fourchettes de valeurs d'intensités pour lesdits 8 pics discriminants suivants, exprimées en valeurs d'intensités relatives par rapport à la somme des valeurs d'intensités du spectre normalisée à la valeur 1, sont : 11. Method according to claim 10, characterized in that said first and second intensity value ranges for said 8 following discriminating peaks, expressed in values of relative intensities with respect to the sum of the intensity values of the normalized spectrum. at the value 1, are:
-Pour le pic à 2710Da, -For the peak at 2710Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 4.56326002121813 x 10 5, et a said first range of values of relative intensities corresponds to the values of relative intensities lower than 4.56326002121813 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 4.86226943144253x 10 5 ; et a said second range of values of relative intensities corresponds to the values of relative intensities higher than 4.86226943144253x 10 5 ; and
-Pour le pic à 3372Da, -For the peak at 3372Da,
-une dite première fourchette de valeurs d'intensité relative correspond aux valeurs d'intensités relatives supérieures à 0.000434223789748754, et -une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000339153329205546 ; et a said first range of relative intensity values corresponds to the values of relative intensities higher than 0.000434223789748754, and a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000339153329205546; and
-Pour le pic à 3399Da, -For the peak at 3399Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures àa said first range of values of relative intensities corresponds to values of relative intensities higher than
9.98606712559408 x 10 5, et 9.98606712559408 x 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 9.7561289741134 x 10 5; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 9.7561289741134 × 10 5 ; and
-Pour le pic à 3408Da, -For the peak at 3408Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures àa said first range of values of relative intensities corresponds to values of relative intensities higher than
0.000118664760690361, et 0.000118664760690361, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 9.78528309013007 x 10 5; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 9.78528309013007 x 10 5 ; and
-Pour le pic à 3445Da, -For the peak at 3445Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures àa said first range of values of relative intensities corresponds to values of relative intensities higher than
0.000837188281840417, et 0.000837188281840417, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000634234550815951 ; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000634234550815951; and
-Pour le pic à 4374Da, -For the peak at 4374Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 9.55157313225957 x 10 5, et -une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.0001002315521507 x 10 5; et a said first range of values of relative intensities corresponds to the values of relative intensities lower than 9.55157313225957 × 10 5 , and a said second range of values of relative intensities corresponds to the values of relative intensities greater than 0.0001002315521507 x 10 5 ; and
-Pour le pic à 5658 Da, -For the peak at 5658 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 4.3325324409441 x 10 5; et a said first range of values of relative intensities corresponds to the values of relative intensities greater than 4.3325324409441 × 10 5 ; and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.23774442820013 x 10 5; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 5.23774442820013 × 10 5 ; and
-Pour le pic à 11047 Da, -For the peak at 11047 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 4.98150891075045 x 10 5, et a said first range of values of relative intensities corresponds to values of relative intensities lower than 4.98150891075045 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 5.199534671731x 10' 5 . a said second range of values of relative intensities corresponds to the values of relative intensities higher than 5.199534671731x 10 '5 .
12. Méthode selon l'une des revendications 6 à 8, caractérisée en ce qu'on détermine la maladie de Crohn pour laquelle à l'étape a), on détermine 3 dites premières et deuxièmes fourchettes de valeurs d'intensités de 3 pics discriminants. 12. Method according to one of claims 6 to 8, characterized in that the Crohn's disease is determined for which in step a), 3 said first and second ranges of intensity values of 3 discriminating peaks are determined. .
13. Méthode selon la revendication 12, caractérisé en ce que les dits 3 pics discriminants sont des pics à 3343, 4134 et 4170 Da à +/- 0.5%. 13. The method of claim 12, characterized in that said 3 discriminating peaks are peaks at 3343, 4134 and 4170 Da at +/- 0.5%.
14. Méthode selon la revendication 13, caractérisé en ce que les dites première et deuxième fourchettes de valeurs d'intensités pour lesdits 3 pics discriminants suivants, exprimées en valeurs d'intensités relatives par rapport à la somme des valeurs d'intensités du spectre normalisée à la valeur 1, sont : 14. Method according to claim 13, characterized in that said first and second intensity value ranges for said 3 subsequent discriminating peaks, expressed in values of relative intensities with respect to the sum of the intensity values of the normalized spectrum. at the value 1, are:
-Pour le pic à 3343 Da, -une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000153184507861765, et -For the peak at 3343 Da, a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000153184507861765, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000121099556323652; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000121099556323652; and
-Pour le pic à 4134 Da, -For the peak at 4134 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000425424602595293, et a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000425424602595293, and
-une dite deuxième fourchette de valeurs d'intensité relative correspond aux valeurs d'intensités relatives inférieures à 5.33325181290711 x 10 5; et a said second range of relative intensity values corresponds to the values of relative intensities lower than 5.33325181290711 × 10 5 ; and
-Pour le pic à 4170 Da, -For the peak at 4170 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000148115657553745, et a said first range of values of relative intensities corresponds to the values of relative intensities greater than 0.000148115657553745, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000115898008983965. a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000115898008983965.
15. Méthode selon l'une des revendications 6 à 8, caractérisé en ce qu'on détermine la présence ou l'absence de la maladie consistant en une recto-colite ulcéro-hémorragique pour laquelle à l'étape a), on détermine 11 dites premières et deuxièmes fourchettes de valeurs d'intensités de 11 pics discriminants. 15. Method according to one of claims 6 to 8, characterized in that the presence or absence of the ulcero-haemorrhagic rectocolitis disease is determined for which in step a), 11 say first and second ranges of intensity values of 11 discriminating peaks.
16. Méthode selon la revendication 15 caractérisé en ce que les dits 3 pics spécifiques discriminants sont des pics à 3324, 3345, 3444, 3482, 3493, 6451, 7268, 9599, 9620, 9636, 9707 Da à +/-0.5%. 16. The method of claim 15 characterized in that said 3 specific discriminating peaks are peaks at 3324, 3345, 3444, 3482, 3493, 6451, 7268, 9599, 9620, 9636, 9707 Da at +/- 0.5%.
17. Méthode selon la revendication 16, caractérisée en ce que les dites première et deuxième fourchettes de valeurs d'intensités relatives pour lesdits pics discriminants suivants, exprimées en valeurs d'intensités relatives par rapport à la somme des valeurs d'intensités du spectre normalisée à la valeur 1, sont : 17. The method of claim 16, characterized in that said first and second ranges of values of relative intensities for said following discriminant peaks, expressed as relative intensity values with respect to the sum of the intensity values of the spectrum normalized to the value 1, are:
-Pour le pic à 3324 Da, -For the peak at 3324 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000202084, et a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000202084, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.0001206288, et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.0001206288, and
-Pour le pic à 3345 Da, -For the peak at 3345 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 9.9939x 105, et a said first range of values of relative intensities corresponds to the values of relative intensities greater than 9.9939 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 9.2912 x 105; a said second range of values of relative intensities corresponds to the values of relative intensities lower than 9.2912 × 10 5 ;
-Pour le pic à 3444 Da, -For the peak at 3444 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000201322 ; et a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000201322; and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000122590 ; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000122590; and
-Pour le pic à 3482 Da, -For the peak at 3482 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000136037, et a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.000136037, and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000119304 ; et a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000119304; and
-Pour le pic à 3493 Da, -For the peak at 3493 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.0002899612, et -une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 0.000183699 ; et a said first range of values of relative intensities corresponds to the values of relative intensities higher than 0.0002899612, and a said second range of values of relative intensities corresponds to the values of relative intensities lower than 0.000183699; and
-Pour le pic à 6451 Da, -For the peak at 6451 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensité relative inférieures à 9.6737 x 105, et a said first range of values of relative intensities corresponds to the relative intensity values lower than 9.6737 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 0.000107099 x 10‘5; a said second range of values of relative intensities corresponds to the values of relative intensities greater than 0.000107099 × 10 5 ;
-Pour le pic à 7268 Da, -For the peak at 7268 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 6.0910x 105, et a said first range of values of relative intensities corresponds to the values of relative intensities lower than 6.0910 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 9.5111 x 105 ; et a said second range of values of relative intensities corresponds to the values of relative intensities greater than 9.5111 × 10 5 ; and
-Pour le pic à 9599 Da, -For the peak at 9599 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.4585x 10-5, et a said first range of values of relative intensities corresponds to values of relative intensities lower than 5.4585 × 10 -5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 8.0165 x 105; et a said second range of values of relative intensities corresponds to the values of relative intensities greater than 8.0165 × 10 5 ; and
-Pour le pic à 9620 Da, -For the peak at 9620 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.48801 x 105, et a said first range of values of relative intensities corresponds to values of relative intensities lower than 5.48801 × 10 5 , and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 7.5820 x 105 ; et a said second range of values of relative intensities corresponds to the values of relative intensities greater than 7.5820 × 10 5 ; and
-Pour le pic à 9636 Da, -For the peak at 9636 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 5.75858 x 105, et -une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensité relatives supérieures à 7.47308 xlO 5 ; a said first range of values of relative intensities corresponds to values of relative intensities lower than 5.75858 × 10 5 , and a said second range of values of relative intensities corresponds to the relative intensity values greater than 7.47308 × 10 5 ;
-Pour le pic à 9707 Da, -For the peak at 9707 Da,
-une dite première fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives inférieures à 4.9587x 10 5 ; et a said first range of values of relative intensities corresponds to values of relative intensities lower than 4.9587 × 10 5 ; and
-une dite deuxième fourchette de valeurs d'intensités relatives correspond aux valeurs d'intensités relatives supérieures à 7.322658x 10 5. a said second range of values of relative intensities corresponds to the values of relative intensities greater than 7.322658 × 10 5 .
18. Méthode selon les revendications 1 à 2 et I revendication 5, caractérisée en ce qu'à l'étape a), on détermine une ou plusieurs combinaisons de dits pics discriminants avec a) des premières fourchettes de valeurs d'intensités des dits pics discriminants de la dite combinaison pour déterminer la présence de la dite pathologie et b) des deuxièmes fourchettes de valeurs d'intensités des dits pics discriminants de la dite combinaison pour déterminer l'absence de ladite pathologie, c) certaines au moins des dites premières et deuxièmes fourchettes se chevauchant pour certains des dits pics discriminants, mais permettant néanmoins de par la pluralité des pics discriminants de déterminer la présence de la dite pathologie de par la série des valeurs d'intensités pour les dits pics discriminants de la combinaison selon qu'elles sont à l'intérieur ou en dehors des dites premières fourchettes ou deuxièmes fourchettes. 18. Method according to claims 1 to 2 and claim 5, characterized in that in step a), one or more combinations of said discriminating peaks are determined with a) first ranges of intensity values of said peaks. discriminants of said combination to determine the presence of said pathology and b) second ranges of intensity values of said discriminating peaks of said combination to determine the absence of said pathology, c) at least some of said first and second overlapping forks for some of said discriminating peaks, but nevertheless allowing by the plurality of discriminating peaks to determine the presence of said pathology by the series of intensity values for said discriminating peaks of the combination according to whether are inside or outside said first forks or second forks.
19. Méthode selon la revendication 18, caractérisée en ce qu'on détermine des dites premières et deuxièmes fourchettes constituées par des valeurs au-dessus et respectivement au-dessous de seuils de valeurs d'intensités. 19. The method of claim 18, characterized in that said first and second ranges are determined by values above and below thresholds of intensity values.
20. Méthode selon la revendication 19, caractérisée en ce que lesdits seuils de valeurs d'intensités sont déterminés par approximation à des valeurs médianes de valeurs d'intensités des intervalles entre des dites première et deuxième fourchettes. 20. The method of claim 19, characterized in that said thresholds of intensity values are determined by approximation to median values of intensity values of the intervals between said first and second ranges.
21. Méthode selon la revendication 18 ou 19, caractérisée en ce qu'on détermine la présence ou l'absence de la maladie du SIDA résultant d'une infection par le VIH pour laquelle à l'étape a), on détermine 4 dites premières et deuxièmes fourchettes de valeurs d'intensités de 4 pics discriminants. 21. Method according to claim 18 or 19, characterized in that the presence or absence of the AIDS disease resulting from an infection with HIV is determined for which in step a), 4 first sayings are determined. and second ranges of intensity values of 4 discriminating peaks.
22. Méthode selon la revendication 21, caractérisée en ce qu'on détermine la présence ou l'absence de la maladie du SIDA résultant d'une infection par le VIH pour laquelle à l'étape a), on détermine 4 seuils de valeurs d'intensités de 4 pics discriminants tels que : 22. Method according to claim 21, characterized in that the presence or absence of the AIDS disease resulting from an infection with HIV is determined for which in step a), four thresholds of values of d are determined. intensities of 4 discriminating peaks such as:
1) la maladie est présente si les valeurs d'intensités des 4 pics sont telles que: 1) the disease is present if the intensity values of the 4 peaks are such that:
1.1) l'intensité du pic n°l est supérieure au seuil d'intensité du pic n°l, l'intensité du pic n°2 est inférieure au seuil d'intensité du pic n°2 et l'intensité du pic n°3 est supérieure au seuil d'intensité du pic n°3, ou 1.1) the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1, the intensity of peak No. 2 is less than the intensity threshold of peak No. 2 and the intensity of peak No. ° 3 is greater than the intensity threshold of peak No. 3, or
1.2) l'intensité du pic n°l est supérieure au seuil d'intensité du pic n°l, l'intensité du pic n°2 est inférieure au seuil d'intensité du pic n°2, l'intensité du pic n°3 est inférieure au seuil d'intensité du picn°3 et l'intensité du pic n°4 est inférieure au seuil d'intensité du pic n°4 ; et 1.2) the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1, the intensity of peak No. 2 is less than the intensity threshold of peak No. 2, the intensity of peak No. ° 3 is below the threshold of intensity of picn ° 3 and the intensity of peak No. 4 is lower than the threshold of intensity of peak No. 4; and
2) la maladie n'est pas présente si les valeurs d'intensités des 4 pics sont telles que : 2) the disease is not present if the intensity values of the 4 peaks are such that:
2.1) l'intensité du pic n°l est inférieure au seuil d'intensité du pic n°l, 2.1) the intensity of peak no. 1 is below the intensity threshold of peak no. 1,
2.2) l'intensité du pic n°l est supérieure au seuil d'intensité du pic n°l et l'intensité du pic n°2 est supérieure au seuil d'intensité du pic n°2, et 2.2) the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1 and the intensity of peak No. 2 is greater than the intensity threshold of peak No. 2, and
2.3) l'intensité du pic n°l est supérieure au seuil d'intensité du pic n°l, l'intensité du pic n°2 est inférieure au seuil d'intensité du pic n°2, l'intensité du pic n°3 est inférieure au seuil d'intensité du pic n°3 et l'intensité du pic n°4 est supérieure au seuil d'intensité du pic n°4. 2.3) the intensity of peak No. 1 is greater than the intensity threshold of peak No. 1, the intensity of peak No. 2 is less than the threshold of intensity of peak No. 2, the intensity of peak No. ° 3 is below the intensity threshold of peak No. 3 and the intensity of peak No. 4 is greater than the intensity threshold of peak No. 4.
23. Méthode selon la revendication 22 caractérisé en ce que les pics n°l à 4 sont, à +/-3xl0 4 : 23. The method of claim 22 characterized in that the peaks No. 1 to 4 are, +/- 3xl0 4 :
- 4160 Da pour le pic n°l, - 4160 Da for peak No. 1,
- 3319 Da pour le pic n°2, - 3319 Da for the peak n ° 2,
- 3607 Da pour le pic n°3, et - 3607 Da for peak 3, and
- 5143 Da pour le pic n°4. - 5143 Da for the peak n ° 4.
24. Méthode selon les revendications 22 et 23, caractérisé en ce que les seuils d'intensités relatives des dits pics discriminants sont des valeurs de seuils d'intensités relatives exprimées en valeurs d'intensités relatives par rapport à la somme des valeurs d'intensités du spectre normalisée à la valeur 1, sont : 24. The method of claims 22 and 23, characterized in that the relative intensity thresholds of said discriminating peaks are values of relative intensity thresholds expressed in relative intensity values with respect to the sum of the intensity values. spectrum normalized to the value 1, are:
- pour le pic n°l à 4160 Da, une valeur de seuil d'intensité relative de 0.000116691, for peak No. 1 at 4160 Da, a relative intensity threshold value of 0.000116691,
- pour le pic n°2 à 3319 Da, une valeur de seuil d'intensité de 0.0006103814, for peak No. 2 at 3319 Da, an intensity threshold value of 0.0006103814,
- pour le pic n°3 à 3607 Da, une valeur de seuil d'intensité relative de 0.000110201, et for peak No. 3 at 3607 Da, a relative intensity threshold value of 0.000110201, and
- pour le pic n°4 à 5143 Da, une valeur de seuil d'intensité relative de 0.000144286. for peak No. 4 at 5143 Da, a relative intensity threshold value of 0.000144286.
25. Méthode selon l'une des revendications 1 à 24, caractérisé en ce qu'on détermine la présence ou l'absence d'une pathologie d'un individu humain par analyse d'un échantillon de matières fécales par spectrométrie de masse de type MALDI-TOF dans laquelle les dits pics discriminants ne sont pas présents dans les spectres d'un échantillon d'agent pathogène responsable de ladite pathologie isolé, mais reflètent une modification de la composition des matières fécales associées à la dite pathologie. 25. Method according to one of claims 1 to 24, characterized in that the presence or absence of a pathology of a human individual is determined by analysis of a sample of faeces by mass spectrometry type MALDI-TOF in which said discriminating peaks are not present in the spectra of a pathogen sample responsible for said isolated pathology, but reflect a change in the composition of the feces associated with said pathology.
26. Méthode selon l'une des revendications 18 à 20, caractérisée en ce qu'à l'étape a), on détermine une combinaison d'une pluralité de pics discriminants pour lesquels on détermine des premières fourchettes et deuxièmes fourchettes de valeurs d'intensités de pics discriminants permettant de distinguer les spectres d'échantillons des individus atteints par la pathologie et les spectres d'échantillons d'individus non atteints par la pathologie, en fonction des différentes valeurs des intensités des pics discriminants dans le spectre d'un échantillon à analyser permettant ainsi de constituer un arbre de décisions binaires de présence ou non de ladite pathologie selon que pour lesdits pics discriminants pris successivement l'intensité de chaque pic est spécifiquement à l'intérieur ou en dehors des dites premières fourchettes ou deuxièmes fourchettes. 26. Method according to one of claims 18 to 20, characterized in that in step a), a combination of a plurality of peaks is determined. discriminants for which first ranges and second ranges of discriminant peak intensity values are determined to discriminate between the spectra of samples of individuals affected by the pathology and the spectra of samples of individuals not affected by the pathology, based on different values of the intensities of the discriminating peaks in the spectrum of a sample to be analyzed thus making it possible to constitute a binary decision tree of presence or absence of said pathology according to whether for said discriminant peaks taken successively the intensity of each peak is specifically inside or outside said first forks or second forks.
27. Méthode selon l'une des revendications 18 à 20, caractérisé en ce que les dits pics discriminants ne sont pas présents dans les spectres d'un échantillon de protéine spécifique d'une pathologie chez ledit individu. 27. Method according to one of claims 18 to 20, characterized in that said discriminating peaks are not present in the spectra of a protein sample specific for a pathology in said individual.
28. Méthode selon l'une des revendications 1 à 27, caractérisé en ce qu'on arrive à discriminer un groupe de sujets présentant une dite pathologie avec un nombre de 1 à 15 pics discriminants, de préférence de 3 à 10 pics discriminants. 28. Method according to one of claims 1 to 27, characterized in that one succeeds in discriminating a group of subjects having a said pathology with a number of 1 to 15 discriminating peaks, preferably from 3 to 10 discriminating peaks.
PCT/FR2019/050397 2018-02-22 2019-02-21 Method for determining a pathology by analysis of faecal material using maldi-tof mass spectrometry WO2019162620A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1851537A FR3078166A1 (en) 2018-02-22 2018-02-22 METHOD OF DETERMINING A PATHOLOGY OR SPECIES BY ANALYSIS OF FECAL MATERIAL BY MALDI-TOF TYPE MASS SPECTROMETRY
FR1851537 2018-02-22

Publications (1)

Publication Number Publication Date
WO2019162620A1 true WO2019162620A1 (en) 2019-08-29

Family

ID=62597629

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2019/050397 WO2019162620A1 (en) 2018-02-22 2019-02-21 Method for determining a pathology by analysis of faecal material using maldi-tof mass spectrometry

Country Status (2)

Country Link
FR (1) FR3078166A1 (en)
WO (1) WO2019162620A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11798656B2 (en) * 2019-02-22 2023-10-24 Nevada Research & Innovation Corporation Computer-implemented methods and systems for identifying a species from mass spectra

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030027231A1 (en) 2002-01-15 2003-02-06 Bryden Wayne A. Methods for using mass spectrometry to identify and classify filamentous fungi, yeasts, molds and pollen
US7109038B2 (en) * 2002-06-13 2006-09-19 The Johns Hopkins University Occult blood detection in biological samples by laser desorption and matrix-assisted laser desorption/ionization mass spectrometry for biomedical applications
US20080046224A1 (en) * 2006-03-29 2008-02-21 Cangen Biotechnologies, Inc. Apparatus and method for predicting disease
WO2011154650A2 (en) 2010-06-10 2011-12-15 Assistance Publique - Hopitaux De Marseille Method for identifying mammalian cells by maldi-tof mass spectrometry on whole cells
US8871438B2 (en) * 2008-05-26 2014-10-28 Korea Research Institute Of Standards And Science Disease diagnosis method, marker screening method and marker using TOF-SIMS
WO2016066930A1 (en) 2014-10-27 2016-05-06 Fondation Mediterranee Infection Method for identifying a microbe in a clinical sample and bank of mass spectra obtained by maldi-tof mass spectrometry

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030027231A1 (en) 2002-01-15 2003-02-06 Bryden Wayne A. Methods for using mass spectrometry to identify and classify filamentous fungi, yeasts, molds and pollen
US7109038B2 (en) * 2002-06-13 2006-09-19 The Johns Hopkins University Occult blood detection in biological samples by laser desorption and matrix-assisted laser desorption/ionization mass spectrometry for biomedical applications
US20080046224A1 (en) * 2006-03-29 2008-02-21 Cangen Biotechnologies, Inc. Apparatus and method for predicting disease
US8871438B2 (en) * 2008-05-26 2014-10-28 Korea Research Institute Of Standards And Science Disease diagnosis method, marker screening method and marker using TOF-SIMS
WO2011154650A2 (en) 2010-06-10 2011-12-15 Assistance Publique - Hopitaux De Marseille Method for identifying mammalian cells by maldi-tof mass spectrometry on whole cells
WO2016066930A1 (en) 2014-10-27 2016-05-06 Fondation Mediterranee Infection Method for identifying a microbe in a clinical sample and bank of mass spectra obtained by maldi-tof mass spectrometry

Non-Patent Citations (13)

* Cited by examiner, † Cited by third party
Title
"R: A language and environment for statistical computing", 2008, R FOUNDATION FOR STATISTICAL COMPUTING, article "R Development Core Team"
BISSOUME SAMB-BA ET AL: "MALDI-TOF Identification of the Human Gut Microbiome in People with and without Diarrhea in Senegal", PLOS ONE, vol. 9, no. 5, 1 May 2014 (2014-05-01), pages e87419, XP055514351, DOI: 10.1371/journal.pone.0087419 *
HOCQUART M; LAGIER JC; CASSIR N ET AL.: "Early Faecal Microbiota Transplantation Improves Survival in Severe Clostridium difficile Infections", CLIN INFECT DIS, 24 August 2017 (2017-08-24)
LAGIER JC; ARMOUGOM F; MILLION M ET AL.: "Microbial culturomics: paradigm shift in the human gut microbiome study", CLIN MICROBIOL INFECT, vol. 18, no. 12, December 2012 (2012-12-01), pages 1185 - 93, XP055164381, DOI: doi:10.1111/1469-0691.12023
LAGIER JC; KHELAIFIA S; TIDJANI-ALOU M: "Culture of previously uncultured members of the human gut microbiota by culturomics", NAT MICROBIOL., 2016
MORHÂC M; MATOUSEK V: "Peak clipping algorithms for background estimation in spectroscopic data", APPL SPECTROSC., vol. 62, no. 1, January 2008 (2008-01-01), pages 91 - 106
REIL M ET AL: "Recognition of PCR-ribotypes 001, 027 and 126/078 using an extended MALDI-TOF MS system", EUROPEAN JOURNAL OF CLINICAL MICROBIOLOGY & INFECTIOUS DISEASES, SPRINGER, BERLIN, DE, vol. 30, no. 11, 20 April 2011 (2011-04-20), pages 1431 - 1436, XP019963209, ISSN: 1435-4373, DOI: 10.1007/S10096-011-1238-6 *
SENG P; DRANCOURT M; GOURIET F ET AL.: "Ongoing revolution in bacteriology: routine identification of bacteria by matrix-assisted laser desorption ionization time-of-flight mass spectrometry", CLIN INFECT DIS, vol. 49, no. 4, 15 August 2009 (2009-08-15), pages 543 - 51, XP002601280, DOI: doi:10.1086/600885
TRAN TN; ABOUDHARAM G; GARDEISEN A ET AL.: "Classification of ancient mammal individuals using dental pulp MALDI-TOF MS peptide profiling", PLOS ONE, vol. 6, no. 2, 25 February 2011 (2011-02-25), pages e17319, XP002631775
WU CHEN-I ET AL: "Diagnosis of occult blood in human feces using matrix-assisted laser desorption ionization/time-of-flight mass spectrometry", CLINICA CHIMICA ACTA, vol. 384, no. 1, 26 June 2007 (2007-06-26), pages 86 - 92, XP029160731, ISSN: 0009-8981, DOI: 10.1016/J.CCA.2007.06.013 *
YSSOUF A; FLAUDROPS C; DRALI R ET AL.: "Matrix-assisted laser desorption ionization-time of flight mass spectrometry for rapid identification of tick vectors", J CLIN MICROBIOL, vol. 51, no. 2, February 2013 (2013-02-01), pages 522 - 8
YSSOUF A; SOCOLOVSCHI C; FLAUDROPS C ET AL.: "Matrix-assisted laser desorption ionization--time of flight mass spectrometry: an emerging tool for the rapid identification of mosquito vectors", PLOS ONE, vol. 8, no. 8, 2013, pages e72380, XP055250248, DOI: doi:10.1371/journal.pone.0072380
YSSOUF A; SOCOLOVSCHI C; LEULMI H ET AL.: "Identification of flea species using MALDI-TOF/MS", COMP IMMUNOL MICROBIOL INFECT DIS, vol. 37, no. 3, May 2014 (2014-05-01), pages 153 - 7

Also Published As

Publication number Publication date
FR3078166A1 (en) 2019-08-23

Similar Documents

Publication Publication Date Title
Marinach et al. MALDI‐TOF MS‐based drug susceptibility testing of pathogens: the example of Candida albicans and fluconazole
Leung et al. Identification of the ESKAPE pathogens by mass spectrometric analysis of microbial membrane glycolipids
Marinach-Patrice et al. Rapid species diagnosis for invasive candidiasis using mass spectrometry
Ting et al. Normalization and statistical analysis of quantitative proteomics data generated by metabolic labeling
Beck et al. Visual proteomics of the human pathogen Leptospira interrogans
US20120197535A1 (en) Methods for identifying bacteria
US10910205B2 (en) Categorization data manipulation using a matrix-assisted laser desorption/ionization time-of-flight mass spectrometer
Radovic et al. Contribution of pyrolysis-mass spectrometry (Py-MS) to authenticity testing of honey
Kuehl et al. MALDI-ToF mass spectrometry–multivariate data analysis as a tool for classification of reactivation and non-culturable states of bacteria
Mörtelmaier et al. Identification performance of MALDI-ToF-MS upon mono-and bi-microbial cultures is cell number and culture proportion dependent
AlMasoud et al. Optimization of matrix assisted desorption/ionization time of flight mass spectrometry (MALDI-TOF-MS) for the characterization of Bacillus and Brevibacillus species
CN105829544B (en) Identification of microorganisms by mass spectrometry and infrared spectroscopy
Lima et al. MALDI-TOF MS for identification of food spoilage filamentous fungi
García‐Timermans et al. Discriminating bacterial phenotypes at the population and single‐cell level: a comparison of flow cytometry and Raman spectroscopy fingerprinting
Bi et al. Differentiation and authentication of fishes at the species level through analysis of fish skin by matrix‐assisted laser desorption/ionization time‐of‐flight mass spectrometry
Zhang et al. Biomarker-and similarity coefficient-based approaches to bacterial mixture characterization using matrix-assisted laser desorption ionization time-of-flight mass spectrometry (MALDI-TOF MS)
Hendrickx MALDI-TOF MS and filamentous fungal identification: a success story?
AlMasoud et al. Classification of Bacillus and Brevibacillus species using rapid analysis of lipids by mass spectrometry
Kanno et al. Machine learning-assisted single-cell Raman fingerprinting for in situ and nondestructive classification of prokaryotes
US20200141864A1 (en) Identification of microorganisms using reflection infrared spectroscopy
Sonthayanon et al. Whole cell matrix assisted laser desorption/ionization time-of-flight mass spectrometry (MALDI-TOF MS) for identification of Leptospira spp. in Thailand and Lao PDR
Arafah et al. MALDI–MS profiling to address honey bee health status under bacterial challenge through computational modeling
US20140309121A1 (en) Categorisation Of Biological Deposits Using Matrix Assisted Laser Desorption Ionisation Mass Spectrometry
WO2019162620A1 (en) Method for determining a pathology by analysis of faecal material using maldi-tof mass spectrometry
US20040234952A1 (en) Process for identifying microoraganisms by means of mass spectrometry

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19711981

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19711981

Country of ref document: EP

Kind code of ref document: A1