WO2011120785A1 - Procede d'analyse spectrometrique et dispositif apparente - Google Patents

Procede d'analyse spectrometrique et dispositif apparente Download PDF

Info

Publication number
WO2011120785A1
WO2011120785A1 PCT/EP2011/053774 EP2011053774W WO2011120785A1 WO 2011120785 A1 WO2011120785 A1 WO 2011120785A1 EP 2011053774 W EP2011053774 W EP 2011053774W WO 2011120785 A1 WO2011120785 A1 WO 2011120785A1
Authority
WO
WIPO (PCT)
Prior art keywords
spectrum
collection
channel
significant
expression
Prior art date
Application number
PCT/EP2011/053774
Other languages
English (en)
Inventor
Eric Barat
Thomas Dautremer
Thierry Montagu
Original Assignee
Commissariat A L'energie Atomique Et Aux Energies Alternatives
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Commissariat A L'energie Atomique Et Aux Energies Alternatives filed Critical Commissariat A L'energie Atomique Et Aux Energies Alternatives
Priority to EP11708046A priority Critical patent/EP2553496A1/fr
Priority to JP2013501720A priority patent/JP2013527433A/ja
Priority to US13/639,079 priority patent/US20130197861A1/en
Publication of WO2011120785A1 publication Critical patent/WO2011120785A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01TMEASUREMENT OF NUCLEAR OR X-RADIATION
    • G01T1/00Measuring X-radiation, gamma radiation, corpuscular radiation, or cosmic radiation
    • G01T1/36Measuring spectral distribution of X-rays or of nuclear radiation spectrometry

Definitions

  • the method according to the invention comprises, for example, a step of estimating the intensity of the peaks over a significant region R m , said intensity being determined using the expressions:
  • Z k is the position of the k component of the Dirichlet process produced by the MCMC procedure
  • the method according to the invention comprises, for example, a step of estimating the centroid at each region of significant peaks in
  • the denominator corresponds to the number of MCMC prints for which there is at least one component belonging to the region R m , the other prints not being able to be taken into account in the Monte Carlo estimation.
  • the method according to the invention comprises, for example, an estimation step of the standard deviation of the energy distribution restricted to the region R m using the expression:
  • the method according to the invention comprises for example a step of calculating a 95% credibility interval for using the expression:
  • the collection corresponds to the collection of samples ordered in ascending order.
  • the method according to the invention comprises, for example, a step of estimating the width of the deconvolved region at its base, defined as the 99% higher probability interval of the restriction at R m of the energy density ( denoted , using the expression
  • the method according to the invention comprises for example a step of calculating a credibility interval at 95% for using the expression in which the collection corresponds to the collection
  • the subject of the invention is also a device for analyzing spectrometric measurements, said measurements being classified in a
  • Figure 2 gives an example of a method of construction and analysis of sampled spectrum
  • FIG. 5 illustrates the analyzes that can be conducted after application of the Kolmogorov-Smirnov test for the purpose of analyzing the detected peaks
  • the statistical nature of the noise of an accumulation channel is taken into account because the histogram corresponds to the ranked count of a collection of realizations generated by a probability distribution.
  • This approach has a non-parametric character insofar as a quantity that can evolve in the whole space of the probability distributions on the space of the positions is estimated.
  • any model imperfection in the shape of the peaks, corresponding to instrumental noise will be supported by the desired probability measure by means of the potential presence of an infinite number of peaks.
  • This method ensures that all the strokes present in the spectrum observed are found in the sum of the spectrum and deconvolved background. There is thus conservation of the integral of the spectrum.
  • a deconvoluted spectrum is obtained with on one side the peaks and on the other the background.
  • the integral of said spectrum is strictly identical to that of the starting histogram.
  • the resolution of the spectrum obtained is significantly improved compared to the initial spectrum, without having limited the search to a finite number of peaks
  • the method proposed in the context of the invention used a Gibbs 100 sampler, said sampler having three objectives in particular.
  • the first objective is to automatically separate the peaks of the background over the entire spectrum, in a non-parametric way.
  • the second objective is to improve the output resolution by performing a Gaussian deconvolution.
  • the peaks to be detected are usually spread before treatment and have a shape that can be likened to a Gaussian curve. Deconvolution makes it possible to reduce the width of the peaks to be detected. Consequently, the width of the peaks is reduced and the detection accuracy is thus improved.
  • the sampler provides a random draw of the elements constituting the normalized peak spectrum and the standard spectrum (at 1) background. These different random draws correspond to:
  • Dirac pulses the amplitude p of Dirac pulses, said pulses also being called Dirac masses;
  • p and Z are representative random draws of the normalized peak spectrum and are expressed in the energy space as vectors.
  • a priori that is, conditional probability distributions, are computed using non-parametric Bayesian inference techniques. The Dirichlet process and polya trees can thus be used to determine the said a priori as described in the article by E. Barat et al. cited previously in the description.
  • a first property is that this technique is non-parametric.
  • the solution is sought in the set containing all probability distributions with positive real values. This set is noted M (3 ⁇ 4 + ).
  • each random selection involved in the MCMC 100 sampling procedure of a deconvolved peak spectrum is thus a discrete probability distribution whose number of masses, ie deconvolved peaks, is potentially infinite.
  • the objective pursued is to analyze a spectrum sampled in energy channels with the aim of detecting and characterizing significant peaks, that is to say Spectrum peaks representative of physical quantities present in the medium measured by spectrometry.
  • a significant channel detection is conducted 101, the significant channels being channels having measurements relating to a significant peak.
  • the significant channels are then grouped into significant regions 102 and the peaks present in said regions are then analyzed 103, the results being output, for example on a screen. Examples of implementation of these treatments are detailed later in the description with reference to FIGS. 2 to 4.
  • FIG. 2 gives an example of a method for constructing and detecting significant channels.
  • the method described below requires the use of the posterior distributions obtained by the semi-parametric Bayesian inference method, that is to say by the Gibbs sampler described previously.
  • the accumulation channels are processed one after the other, the index channel j noted B. being the current channel.
  • the amplitude p of the Dirac masses, the Z position of said Dirac masses and the amplitude q of the background are used by the sampled spectrum construction and analysis method according to the invention.
  • a peak energy sample spectrum per accumulation channel is constructed 201 to allow the detection of significant regions including peaks.
  • the principle of detection of significant regions is based firstly on a statistical test performed on each energy interval Bj constituting a channel. Then, a significant region is defined as a set of contiguous channels for which the statistical test is positive.
  • the L number of Monte Carlo runs of the Gibbs sampler defines the size of the population of events used to perform the statistical test.
  • a value of L limited does not guarantee to find probability masses from the draws of the Dirichlet process in large numbers on each interval B. of a significant region.
  • a condition that ensures that the number of Monte Carlo draws is sufficient is the number of channels in the largest region
  • the user adjusts the number L according to the size of the significant regions obtained.
  • the quantity ⁇ is defined. as the probability mass of the B-channel. of the standardized spectrum of peaks: expression in which:
  • j is the index associated with an interval B. given;
  • N is the number of components (Dirac masses) of the Dirichlet process for the draw considered
  • Z k is the position of the k component of the Dirichlet process produced by the MCMC procedure
  • the probability mass of the B channel.
  • the standard background spectrum for each j by: The normalized spectrum of peaks can then be estimated 201, so that it can be used for the detection of significant regions including peaks.
  • the sampler Similarly, the notation represents the generated values of the random variable at the iteration / sampler.
  • a peak spectrum estimator is chosen, for example, as the conditional average weighted by the average number of
  • n is the number of photons recorded and is the probability of the peak spectrum in the full spectrum defined as the weighted sum of the normalized peak spectrum and the normalized background spectrum.
  • the application example selected is that of gamma spectrometry, but the method described can be used in the context of X-ray spectrometry or time-of-flight mass spectrometry, for example.
  • Monte Carlo estimators are constructed using the following expression: in which :
  • C represents the observed histogram containing in each B-channel. the sum of the events (photons) whose energy belongs to B. . C may also be referred to as "data” or "observations";
  • the values of can, for example, be graphically presented using a display device.
  • estimators provide the user with a global representation of the density of the deconvolved energy distribution.
  • the proposed method makes it possible, beyond the sole calculation of the posterior mean, to determine a credibility interval, for example at 95%, over each interval B. .
  • the uncertainty associated with each energy channel is estimated, for example by defining a 95% credibility interval.
  • ⁇ So represents the collection of generated samples sorted in ascending order
  • n the total number of photons recorded
  • represents a variable characterizing the intensity of the peak spectrum for the considered energy channel.
  • a Kolmogorov-Smirnov 210 test can be applied. The purpose of this test 210 is to determine whether on each interval B. quantity distribution corresponding to the probability of the channel
  • the two-sample Kolmogorov-Smirnov test can be used within the scope of the invention.
  • the quantity is
  • This example comprises three phases.
  • the first phase is an initialization phase 301
  • the second 31 1 corresponds to a calculation loop and the third 312 to a so-called finalization phase.
  • Regions R (m) can be determined using the following expression:
  • J is the number of energy channels.
  • the intensity of the peaks can be estimated 500.
  • the semi-parametric Bayesian technique allows to directly calculate any other moment or functional of the distribution of
  • centroid estimator for region m is then given by
  • quantiles of the collection can be determined, for example, in
  • the semi-parametric Bayesian technique allows to directly calculate any other moment or functional of the distribution of
  • the quantity is estimated using for example
  • the estimator m of the standard deviation of the energy distribution restricted to R m is then estimated by the posterior mean of for example using the following expression:
  • the collection corresponds to the collection of samples ordered in ascending order.
  • the semi-parametric Bayesian technique allows to directly calculate any other moment or functional of the distribution of
  • the estimator equivalent to the 99% greater probability interval of the energy distribution restricted to R m , is then given by the posterior mean of, that is, by the expression:

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Molecular Biology (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Measurement Of Radiation (AREA)

Abstract

L'invention a pour objet un procédé d'analyse de mesures spectrométriques, lesdites mesures C = {c 1 ,...,c r } étant classées dans un histogramme, ledit histogramme étant composé de canaux d'accumulation, un canal j correspondant à un intervalle d'énergie B j . Ledit procédé comporte au moins trois étapes de traitement. Une première étape (100) détermine par canal d'accumulation j des distributions p représentatives de l'amplitude et Z représentatives de la position des impulsions de Dirac composant le spectre normalisé de pics ainsi que des distributions q représentatives de l'arbre de Pόlya caractérisant le spectre normalisé de fond, lesdits éléments étant obtenus par échantillonnage de Gibbs. Une seconde étape (101 ) de détecte des canaux significatifs, ladite détection étant réalisée par application d'un test de Kolmogorov-Smirnov par canal d'accumulation de l'histogramme sur la base des résultats de la première étape (100). Une troisième étape (102) identifie des régions significatives du spectre par regroupement des intervalles B j des canaux significatifs identifiés lors de la seconde étape (101), lesdites régions comportant au moins un pic significatif.

Description

Procédé d'analyse spectrométrique et dispositif apparenté
L'invention concerne un procédé d'analyse spectrométrique et un dispositif apparenté. L'invention s'applique notamment aux domaines de la spectrométrie Gamma, de la spectrométrie X et de la spectrométrie de masse à temps de vol.
L'analyse de données spectrométriques a notamment pour objectif l'identification d'un nombre inconnu de pics superposés à un fond également inconnu, lesdits pics étant représentatifs de quantité physiques présentent dans le milieu à analyser.
Plusieurs difficultés affectent cette analyse. La forme des pics présents dans le spectre n'est habituellement modélisable que partiellement par des fonctions paramétrables. De la même façon, il est difficile de décomposer les fonds en utilisant une base de fonctions paramétrables. Le fait que le nombre de pics soit inconnu complique également l'analyse.
Plusieurs méthodes d'analyse automatique de spectres sont proposées dans l'état de la technique pour contourner ces difficultés et faciliter l'analyse de données spectrométriques. Deux catégories des méthodes peuvent être distinguées.
Une première catégorie comprend les méthodes d'analyse s'appuyant sur des bases de données. Ces techniques sont répandues dans le domaine de la spectrométrie nucléaire et de la spectrométrie de masse. Le principe est de rechercher les pics au sein d'une base de données qui les caractérise en position et en intensité. Ce type de méthode permet de chercher les positions et intensités sur des espaces continus en fixant le nombre de composantes. Il est alors possible d'estimer la quantité de chaque élément composant la base de donnée en minimisant une fonction de coût. La forme des pics est dans ce cas supposée déterministe et connue. Pour ce qui est du fond, celui-ci est modélisé au préalable sous chaque pic d'une région d'intérêt donnée par une fonction polynomiale. L'utilisation d'une procédure d'ajustement et de modèles paramétriques figés sur des données bruitées induit une erreur de reconstruction constituée de deux composantes, la première correspondant à une erreur statistique et la seconde à une erreur de modèle. De plus, cette approche suppose l'exactitude de la base de données de référence, cette hypothèse étant rarement vérifiée dans la mesure où une part expérimentale importante contribue à l'élaboration desdites bases. Il est alors difficile d'estimer l'incertitude totale liée à l'analyse.
Une seconde catégorie comprend des méthodes d'analyse basées sur une détection automatique de pics. Cette approche ne requiert pas l'utilisation de bases de données mais suit une approche statistique fondée sur la minimisation d'un risque ou la maximisation de vraisemblance.
La recherche de la position desdits pics est effectuée sur un espace discret constitué des canaux du spectre acquis. En effet, des analyseurs multicanaux sont habituellement utilisés pour analyser des spectres tels que des spectres X ou γ. Des contraintes techniques, comme la résolution limitée des convertisseurs analogiques-numériques par exemple, ne permettent pas de générer directement un spectre continu. C'est pourquoi ces analyseurs présentent en sortie des histogrammes composés de plusieurs canaux. Un canal j d'histogramme correspond par exemple à un intervalle d'énergie B . , les quantités à mesurer, des photons par exemple, sont classés par canaux en fonction de leur niveau d'énergie. Deux pics distincts peuvent être détectés si ils sont séparés d'au moins un canal de spectre. Ces canaux sont également appelés canaux d'accumulation dans la suite de la description. L'ensemble des canaux d'accumulation représentatifs d'un spectre composent un histogramme.
Dans le cadre des méthodes d'analyse basées sur une détection automatique de pics, l'estimation de l'intensité des pics s'opère sur un espace continu. Le nombre de pics peut être supposé connu à l'avance sur une région d'intérêt limitée ou bien estimé à partir des données. Les fonds peuvent être estimés empiriquement ou modélisés suivant des combinaisons linéaires de splines telles que les B-splines, par exemple. Dans tous les cas, le nombre de pics est fini. Le nombre fini de pics recherchés et la forme paramétrée desdits pics induit une erreur statistique et une erreur de modèle lors de la reconstruction du spectre. Moyennant une hypothèse de bruit, ledit bruit correspondant à la nature statistique du bruit d'un canal d'histogramme, il est possible d'accéder à l'incertitude des mesures en utilisant l'inverse de la matrice du Hessien. Cette estimation est efficace pour une hypothèse de bruit gaussien, mais n'est pas représentative de la réalité en cas de bruit Poisson, et ne prend pas en compte les éventuelles erreurs de modèle.
Un exemple de méthode de détection automatique de pics est décrit dans l'article de S. Gulam Razul, W. J. Fitzgerald et C. Andrieu intitullé Bayesian model sélection and parameter estimation of nuclear émission spectra using RJMCMC, Elsevier, Nuclear Instrument and Methods in Physics Research, A 497, pages 492-510, 2003. Cette approche est paramétrique au sens où un nombre de pics inconnu mais fini est considéré.
Les méthodes d'analyse spectrométrique décrites précédemment ne permettent pas une détection fiable des pics présents dans le spectre lorsque le nombre de pics présents est potentiellement infini. De plus, il n'est pas possible d'estimer le niveau d'incertitude de ladite détection par canal d'accumulation. Avantageusement, la méthode proposée prend en compte le bruit de quantification du au fait que les systèmes d'acquisition traditionnels mémorisent les échantillons de mesures dans des histogrammes. L'invention a aussi comme avantage de permettre une implémentation ne requérant pas un puissance de calcul important, les traitements étant faits par canaux d'accumulation et non par échantillon.
Un but de l'invention est notamment de pallier les inconvénients précités.
A cet effet l'invention a pour objet un procédé d'analyse de mesures spectrométriques, lesdites mesures C = { ,...,^ } étant classées dans un histogramme, ledit histogramme étant composé de canaux d'accumulation, un canal j correspondant à un intervalle d'énergie B . . Ledit procédé comporte au moins trois étapes de traitement. Une première étape détermine par canal d'accumulation j des distributions p représentatives de l'amplitude et Z représentatives de la position des impulsions de Dirac composant le spectre normalisé de pics ainsi que des distributions q représentatives de l'arbre de Pôlya caractérisant le spectre normalisé de fond, lesdits éléments étant obtenus par échantillonnage de Gibbs. Une seconde étape de détecte des canaux significatifs, ladite détection étant réalisée par application d'un test de Kolmogorov-Smirnov par canal d'accumulation de l'histogramme sur la base des résultats de la première étape. Une troisième étape identifie des régions significatives du spectre par regroupement des intervalles B . des canaux significatifs identifiés lors de la seconde étape, lesdites régions comportant au moins un pic significatif.
Procédé selon un aspect de l'invention, le spectre de pics est déterminé pour tout canal d'accumulation d'indice j , en utilisant des estimateurs Monte-Carlo définis par une expression telle que :
Figure imgf000006_0001
dans laquelle :
correspond à la masse de probabilité du canal B . pour le Z 'EME tirage du processus MCMC ;
L correspond au nombre de tirages Monte Carlo de l'échantillonneur de Gibbs ;
est la probabilité du spectre de pics dans le spectre complet
Figure imgf000006_0002
défini comme étant la somme pondérée du spectre normalisé de pics et du spectre normalisé de fond ;
représente le poids du spectre de pics pour le Z 'EME tirage du processus MCMC ;
n est le nombre de photons enregistré.
Le spectre de fond est déterminé, par exemple, pour tout canal d'accumulation d'indice j , en utilisant l'expression suivante :
Figure imgf000006_0003
dans laquelle :
représente les valeurs générées de la variable aléatoire Φ à l'itération l de l'échantillonneur, Φ . représentant la masse de probabilité du canal B . du spectre normalisé de fond pour chaque j
L'incertitude associée à chaque canal énergétique est estimée par exemple en définissant un intervalle de crédibilité à 95% déterminé
Figure imgf000006_0004
en utilisant les expressions suivantes :
Figure imgf000007_0003
dans lesquelles :
pour tout x , la notation
Figure imgf000007_0005
représente la collection des échantillons x triée par ordre croissant ;
pour tout x et pour tout j la notation représente le
Figure imgf000007_0004
j 'eme échantillon de la collection x triée par ordre croissant.
ainsi, représente la collection des échantillons générés
Figure imgf000007_0006
triés par ordre croissant ;
Figure imgf000007_0007
indique la partie entière ;
n représente le nombre total de photons enregistrés ;
η représente une variable caractérisant l'intensité du spectre de pic pour le canal d'énergie considéré.
Une quantité est déterminée par exemple pour
Figure imgf000007_0008
application du test de Kolmogorov-Smirnov (210) en utilisant l'expression :
Figure imgf000007_0001
dans laquelle :
correspond à la probabilité du canal B . dans le spectre complet normalisé ;
est une quantité correspondant au fond seul ;
représente la collection des échantillons générés pour
Figure imgf000007_0009
Figure imgf000007_0010
représente la collection des échantillons générés pour
Figure imgf000007_0011
Figure imgf000007_0012
la fonction cumulative empirique de la distribution de
Figure imgf000007_0014
Figure imgf000007_0013
Figure imgf000007_0002
la fonction cumulative empirique de la distribution de
Figure imgf000007_0015
Figure imgf000007_0016
telle que
Figure imgf000008_0003
η représente une variable caractérisant l'intensité du spectre complet pour le canal d'énergie considéré.
La présence d'un élément de pic significatif sur un intervalle B . est détectée par exemple si étant défini tel que
Figure imgf000008_0004
Figure imgf000008_0005
correspondant à un niveau choisi de signifiance.
Le procédé selon l'invention comporte par exemple une étape d'estimation de l'intensité des pics sur une région significative Rm , ladite intensité étant déterminée en utilisant les expressions :
Figure imgf000008_0001
dans lesquelles :
la fonction ï(Cond) = ï si la condition Cond est vraie et ï(Cond) = 0 sinon ;
{Rm } la collection de régions significatives du spectre ;
Zk est la position de la composante k du processus de Dirichlet produit par la procédure MCMC ;
Le procédé selon l'invention comporte par exemple une étape de calcul d'un intervalle de crédibilité à 95% pour Àm en utilisant l'expression :
Figure imgf000008_0006
dans laquelle la collection correspond à la collection
Figure imgf000008_0007
d'échantillons ordonnée par ordre croissant.
Figure imgf000008_0008
Le procédé selon l'invention comporte par exemple une étape d'estimation du centroïde àe chaque région de pics significatifs en
Figure imgf000008_0009
utilisant l'expression suivante :
Figure imgf000008_0002
dans laquelle :
est une quantité estimée sur chaque région significative Rm et
Figure imgf000009_0004
pour chaque tirage de la procédure MCMC en utilisant l'expression :
Figure imgf000009_0001
le dénominateur correspond aux nombre de tirages MCMC pour lesquels il y a au moins une composante appartenant à la région Rm , les autres tirages ne pouvant pas être pris en compte dans l'estimation Monte Carlo.
Le procédé selon l'invention comporte par exemple une étape de calcul d'un intervalle de crédibilité à 95% pour en utilisant l'expression :
Figure imgf000009_0002
dans laquelle la collection correspond à la collection
Figure imgf000009_0005
d'échantillons
Figure imgf000009_0006
ordonnée par ordre croissant.
Le procédé selon l'invention comporte par exemple une étape d'estimation
Figure imgf000009_0007
de l'écart-type
Figure imgf000009_0008
de la distribution d'énergie restreinte à la région Rm en utilisant l'expression :
Figure imgf000009_0003
Le procédé selon l'invention comporte par exemple une étape de calcul d'un intervalle de crédibilité à 95% pour en utilisant l'expression :
Figure imgf000009_0010
Figure imgf000009_0009
dans laquelle la collection
Figure imgf000010_0003
correspond à la collection d'échantillons ordonnée par ordre croissant.
Figure imgf000010_0004
Le procédé selon l'invention comporte par exemple une étape d'estimation de la largeur de la région déconvoluée en sa base, définie comme l'intervalle de plus forte probabilité à 99% de la restriction à Rm de la densité d'énergie (notée
Figure imgf000010_0005
, en utilisant l'expression
Figure imgf000010_0001
dans laquelle
Figure imgf000010_0002
Le procédé selon l'invention comporte par exemple une étape de calcul d'un intervalle de crédibilité à 95% pour
Figure imgf000010_0009
en utilisant l'expression
Figure imgf000010_0006
dans laquelle la collection correspond à la collection
Figure imgf000010_0007
d'échantillons ordonnée par ordre croissant.
Figure imgf000010_0008
L'invention a aussi pour objet un dispositif d'analyse de mesures spectrométriques, lesdites mesures étant classées dans un
Figure imgf000010_0010
histogramme, ledit histogramme étant composé de canaux d'accumulation, un canal j correspondant à un intervalle d'énergie B . , ledit dispositif étant caractérisé en ce qu'il comporte des moyens pour mettre en œuvre le procédé décrit précédemment. D'autres caractéristiques et avantages de l'invention apparaîtront à l'aide de la description qui suit donnée à titre illustratif et non limitatif, faite en regard des dessins annexés parmi lesquels : - la figure 1 illustre le principe de la méthode d'analyse de spectre selon l'invention ;
la figure 2 donne un exemple de méthode de construction et d'analyse de spectre échantillonné ;
la figure 3 donne un exemple de mise en œuvre du test de Kolmogorov-Smirnov dans le cadre d'une application de spectrométrie Bayésienne semi paramétrique ; la figure 4 donne un exemple de traitement de construction séquentielle des régions de pics significatifs ;
la figure 5 illustre les analyses pouvant être conduites après application du test Kolmogorov-Smirnov dans le but d'analyser les pics détectés ;
La figure 1 illustre le principe de la méthode d'analyse de spectre selon l'invention. Celui-ci comprend un module échantillonneur de Gibbs 100 ainsi qu'un module de construction et d'analyse de spectre échantillonné 101 .
Dans l'article de E. Barat et al. T. Dautremer et T. Montagu intitulé Nonparametric bayesian inference in nuclear spectrometry, IEEE Nuclear Science Symposium Record, NSS/MI 2007, une extension des méthodes de détection automatique de pics décrites précédemment est présentée. Cette extension propose de considérer le nombre de pics comme potentiellement infini. Le principe est de rechercher une mesure de probabilité qui, par convolution d'un noyau donne une distribution de probabilité dont des échantillons rangés forment l'histogramme observé, un noyau étant ici une fonction positive, normalisée à 1 , correspondant à la distribution du bruit instrumental variant avec la position sur l'histogramme, ladite position correspondant par exemple à un niveau d'énergie ou de masse.
La nature statistique du bruit d'un canal d'accumulation est prise en compte car l'histogramme correspond au comptage rangé d'une collection de réalisations générée par une distribution de probabilité. Cette approche présente un caractère non paramétrique dans la mesure où une quantité pouvant évoluer dans tout l'espace des distributions de probabilités sur l'espace des positions est estimée. Ainsi, une éventuelle imperfection de modèle dans la forme des pics, correspondant à du bruit instrumental, sera prise en charge par la mesure de probabilité recherchée au moyen de la présence potentielle d'une infinité de pics.
Par ailleurs, le fond est également modélisé par une mesure de probabilité obtenue par convolution avec le même noyau. La discrimination entre la mesure de probabilité correspondant aux pics et celle correspondant au fond est basée sur le fait que la distribution des pics sans convolution présente un caractère discret par rapport à la distribution sans convolution du fond, supposée continue à ce niveau de modélisation. D'autre part, cette méthode présente également un caractère paramétrique car la densité de la distribution de bruit instrumental est supposée paramétrique, mais ne cherche pas nécessairement à estimer complètement la forme potentiellement complexe du pic. Cette densité peut être, par exemples, gaussienne pour un spectre gamma, ou correspondre à une fonction de Voigt pour un spectre X. Pour ces raisons, cette approche peut être qualifiée de semi-paramétrique. Cette méthode, à la différence des techniques rappelées précédemment, garantit que la totalité des coups présents dans le spectre observé se retrouvent dans la somme du spectre et du fond déconvolué. Il y a ainsi conservation de l'intégrale du spectre. En partant d'un histogramme, un spectre déconvolué est obtenu avec d'un côté les pics et de l'autre le fond. L'intégrale dudit spectre est rigoureusement identique à celle de l'histogramme de départ. La résolution du spectre obtenu est significativement améliorée par rapport au spectre initial, sans pour autant avoir limité la recherche à un nombre fini de pics
Ce résultat est obtenu en utilisant la méthode d'échantillonnage de Gibbs, ladite méthode faisant partie des méthodes MCMC, acronyme venant de l'expression anglo-saxonne « Markov Chain Monte Carlo ».
La méthode proposée dans le cadre de l'invention utilisa un échantillonneur de Gibbs 100, ledit échantillonner ayant notamment trois objectifs.
Le premier objectif est de séparer automatiquement les pics du fond sur l'ensemble du spectre, et ce de manière non-paramétrique. Le second objectif est d'améliorer la résolution en sortie en réalisant une déconvolution de forme gaussienne. En effet, les pics à détecter sont habituellement étalés avant traitement et ont une forme pouvant s'apparenter à une courbe gaussienne. La déconvolution permet de réduire la largeur des pics à détecter. Par conséquent, la largeur des pics est réduite et la précision de détection est ainsi améliorée.
Enfin, l'échantillonneur fournit un tirage aléatoire des éléments constitutifs du spectre normalisé de pic et du spectre normalisé (à 1 ) de fond. Ces différents tirages aléatoires correspondent à :
- l'amplitude p des impulsions de Dirac, lesdites impulsions étant également appelées masses de Dirac ;
- la position Z desdites masses de Dirac ;
- l'amplitude q du fond. p et Z sont des tirages aléatoires représentatifs du spectre normalisé des pics et sont exprimés dans l'espace des énergies sous forme de vecteurs.
q est un tirage aléatoire représentatif du spectre normalisé de fond et exprimé sous forme de vecteur.
L'échantillonnage de Gibbs appliqué dans le cadre de la spectrométrie tel que décrit dans l'article d'E. Barat et al. cité précédemment peut être mis en œuvre afin d'obtenir les distributions de p , Z et q .
Le module d'échantillonnage 100 est capable de traiter des échantillons de mesures collectés sous forme d'histogrammes 104 par un analyseur multicanaux, lesdites données d'entrée pouvant s'écrire sous la forme d'un vecteur C : C = {cl t...,cr } dans lequel les éléments c . représentent le nombre de coups dans le j' eme canal d'accumulation B . , un nombre de coups c . étant équivalent à un nombre d'impulsions générées par le détecteur. D'autres données d'entrée sont requises par l'échantillonneur de Gibbs afin de générer les tirages aléatoires p , Z et q . Ainsi, des a priori, c'est-à-dire des distributions de probabilité conditionnelles, sont calculés en utilisant des techniques non paramétriques d'inférence Bayésienne. Le processus de Dirichlet et des arbres de Pôlya peuvent ainsi être utilisés pour déterminer lesdits à priori tels que décrits dans l'article de E. Barat et al. cité précédemment dans la description.
La technique de déconvolution et de séparation des pics et des fonds présentée précédemment présente plusieurs propriétés.
Une première propriété est que cette technique est non- paramétrique. En d'autres termes, la solution est recherchée dans l'ensemble contenant toutes les distributions de probabilités à valeurs réelles positives. Cet ensemble est noté M(¾+ ).
Une seconde propriété est liée à son caractère Bayésien. La distribution a posteriori des processus de Dirichlet est disponible après échantillonnage de Gibbs et peut être déterminée par la collection de tirages aléatoires de p et Z . La distribution a posteriori des arbres de Pôlya peut être déterminée par la collection de tirages aléatoires de q .
Le caractère non paramétrique de cette technique permet une grande flexibilité de modélisation puisqu'elle s'affranchit de toute liste finie et déterminée à l'avance de positions possibles de pics d'énergie. Avantageusement, chaque tirage aléatoire intervenant dans la procédure d'échantillonnage MCMC 100 d'un spectre de pics déconvolués (processus de Dirichlet) est ainsi une distribution de probabilité discrète dont le nombre de masses, c'est-à-dire de pics déconvolués, est potentiellement infini.
Cette flexibilité de modélisation induit cependant une difficulté d'interprétation. Au cours des itérations de la procédure MCMC, il est possible que des masses de Dirac apparaissent en toute valeur d'énergie, conduisant asymptotiquement à une quantité mesurée quasi-continue. Afin de fournir à l'utilisateur une liste de positions et d'intensités de pics pouvant être interprétée, il est possible de déterminer des régions significatives, c'est- à-dire des intervalles en énergie non explicable statistiquement par une fluctuation aléatoire du fond. Le caractère Bayésien offre ici un élément clé.
L'accès aux distributions a posteriori permet en premier lieu de mettre en œuvre un estimateur du spectre de pics déconvolué mais permet également d'estimer l'incertitude associée à ce spectre de pics pour tout intervalle (région) en énergie. L'incertitude peut également être déterminée pour le spectre de fond.
Dans la suite de la description, la génération des tirages aléatoires par l'échantillonneur de Gibbs est aussi désignée par l'expression « procédure MCMC ».
Ainsi, suite à la génération des tirages aléatoires par la procédure MCMC, l'objectif poursuivi est d'analyser un spectre échantillonné en canaux d'énergies dans le but de détecter et de caractériser des pics significatifs, c'est-à-dire des pics du spectre représentatifs de quantités physiques présentes dans le milieu mesuré par spectrométrie. Ainsi une détection des canaux significatifs est conduite 101 , les canaux significatifs étant des canaux comportant des mesures relatives à un pic significatif. Les canaux significatifs sont ensuite regroupés en régions significatives 102 et les pics présents dans lesdites régions sont ensuite analysés 103, les résultats étant présentés en sortie, par exemple sur un écran. Des exemples de mise en œuvre de ces traitements sont détaillés plus loin dans la description à l'aide des figures 2 à 4. La figure 2 donne un exemple de méthode de construction et détection des canaux significatifs.
La méthode décrite ci-après requiert l'utilisation des distributions a posteriori obtenues par la méthode d'inférence Bayésienne semi paramétrique, c'est-à-dire par l'échantillonneur de Gibbs décrit précédemment. Les canaux d'accumulation sont traités les uns après les autres, le canal d'indice j noté B . étant le canal courant.
Après échantillonnage de Gibbs, l'amplitude p des masses de Dirac, la position Z desdites masses de Dirac et l'amplitude q du fond sont utilisées par la méthode de construction et d'analyse de spectre échantillonné selon l'invention.
Après initialisation 200, un spectre de pics échantillonné en énergie par canal d'accumulation est construit 201 pour permettre la détection de régions significatives comprenant des pics.
Le principe de détection des régions significatives repose tout d'abord sur un test statistique effectué sur chaque intervalle d'énergie Bj constituant un canal. Puis, on définit une région significative comme un ensemble de canaux contigus pour lesquels le test statistique est positif.
Le nombre L de tirages Monte Carlo de l'échantillonneur de Gibbs définit la taille de la population des événements utilisés pour réaliser le test statistique. Une valeur de L limitée ne garantit pas de retrouver des masses de probabilité issues des tirages du processus de Dirichlet en nombre important sur chaque intervalle B . d'une région significative. Une condition garantissant que le nombre de tirages Monte Carlo s'avère suffisant est que est le nombre de canaux de la plus grande région
Figure imgf000016_0001
significative. En pratique, l'utilisateur ajuste le nombre L en fonction de la taille des régions significatives obtenues.
Pour chaque tirage aléatoire de la procédure MCMC et pour tout j , on définit la quantité Π . comme étant la masse de probabilité du canal B . du spectre normalisé de pics :
Figure imgf000016_0002
expression dans laquelle :
j est l'indice associé à un intervalle B . donné ;
N est le nombre de composantes (masses de Dirac) du processus de Dirichlet pour le tirage considéré;
Zk est la position de la composante k du processus de Dirichlet produit par la procédure MCMC ;
la fonction ï(Cond) = ï si la condition Cond est vraie et ï(Cond) = 0 sinon.
En parallèle, on définit Φ la masse de probabilité du canal B . du spectre normalisé de fond pour chaque j par :
Figure imgf000016_0003
Le spectre normalisé de pics peut ensuite être estimé 201 , de manière à ce que celui-ci puisse être utilisé pour la détection de régions significatives comprenant des pics.
L tirages issus de l'échantillonneur de Gibbs sont disponibles. Dans la suite de la description, la notation représente les
Figure imgf000017_0002
valeurs générées de la variable aléatoire à l'itération / de
Figure imgf000017_0003
l'échantillonneur. De même, la notation
Figure imgf000017_0001
représente les valeurs générées de la variable aléatoire à l'itération / de l'échantillonneur.
Figure imgf000017_0004
Un estimateur du spectre de pics est choisi, par exemple, comme étant la moyenne conditionnelle de pondérée par le nombre moyen de
Figure imgf000017_0005
photons enregistrés affectés aux pics ( w- n ) où n est le nombre de photons enregistré et
Figure imgf000017_0006
est la probabilité du spectre de pics dans le spectre complet défini comme étant la somme pondérée du spectre normalisé de pics et du spectre normalisé de fond. A l'exemple d'application choisi est celui de la spectrométrie Gamma, mais la méthode décrite peut être utilisée dans le cadre de la spectrométrie X ou de la spectrométrie de masse à temps de vol, par exemples.
Pour tout canal d'accumulation d'indice j , des estimateurs Monte- Carlo sont construits en utilisant l'expression suivante :
Figure imgf000017_0007
dans laquelle :
C représente l'histogramme observé contenant dans chaque canal B . la somme des événements (photons) dont l'énergie appartient à B . . C peut être aussi désigné par les expressions « données » ou « observations » ;
Pour ce qui est de l'estimation du fond, l'expression suivante est utilisée :
dans laquelle : représente le poids du spectre de pics pour le tirage du processus
Figure imgf000018_0009
MCMC.
Les valeurs de
Figure imgf000018_0001
peuvent, par exemple, être présentées graphiquement à l'aide d'un dispositif d'affichage.
Ces estimateurs offrent à l'utilisateur une représentation globale de la densité de la distribution en énergie déconvoluée. Avantageusement, la méthode proposée permet, au-delà du seul calcul de la moyenne a posteriori, de déterminer un intervalle de crédibilité, par exemple à 95%, sur chaque intervalle B . .
Ainsi, l'incertitude associée à chaque canal énergétique est estimée, par exemple en définissant un intervalle de crédibilité à 95%
Figure imgf000018_0002
déterminé en utilisant les expressions :
Figure imgf000018_0003
dans lesquelles :
• pour tout x , la notation représente la collection des échantillons
Figure imgf000018_0005
x triée par ordre croissant ;
• pour tout x et pour tout j la notation
Figure imgf000018_0004
représente le
Figure imgf000018_0008
échantillon de la collection x triée par ordre croissant.
· Ainsi,
Figure imgf000018_0006
représente la collection des échantillons générés triés par ordre croissant ;
Figure imgf000018_0007
• indique la partie entière ;
• n représente le nombre total de photons enregistrés ;
• η représente une variable caractérisant l'intensité du spectre de pic pour le canal d'énergie considéré.
Une fois que le spectre de pics échantillonné en énergie est déterminé, un test de Kolmogorov-Smirnov 210 peut être appliqué. L'objectif de ce test 210 est de déterminer si sur chaque intervalle B . la distribution de la quantité
Figure imgf000019_0004
correspondant à la probabilité du canal
B . dans le spectre complet normalisé, et définie par l'expression :
Figure imgf000019_0002
est significativement distincte de la distribution de étant une quantité
Figure imgf000019_0005
correspondant au fond seul sur le
Figure imgf000019_0006
canal et étant défini par l'expression :
Figure imgf000019_0003
Pour ce faire, il est possible, par exemple, de mettre en œuvre un test d'hypothèses non paramétrique permettant de déterminer si les deux échantillons associés au canal d'accumulation suivent la
Figure imgf000019_0008
Figure imgf000019_0007
même loi ou non.
Le test de Kolmogorov-Smirnov à deux échantillons peut être utilisé dans le cadre de l'invention. Pour cela, la quantité est
Figure imgf000019_0009
déterminée en utilisant l'expression suivante :
Figure imgf000019_0001
dans laquelle :
• représente la collection des échantillons générés pour
Figure imgf000019_0010
Figure imgf000019_0014
;
• représente la collection des échantillons générés pour
Figure imgf000019_0011
Figure imgf000019_0015
;
• ( ) la fonction cumulative empirique de la distribution de
Figure imgf000019_0016
Figure imgf000019_0012
telle que
Figure imgf000019_0013
• la fonction cumulative empirique de la distribution de
Figure imgf000020_0002
Figure imgf000020_0004
telle que
Figure imgf000020_0003
Le théorème de Glivenko-Cantelli assure que si ont la
Figure imgf000020_0005
même distribution, alors la quantité tend vers 0 quand L tend
Figure imgf000020_0006
vers l'infini, et ce presque sûrement.
Kolmogorov apporte un résultat supplémentaire sur la vitesse de convergence, en effet si ont même distribution alors :
Figure imgf000020_0007
Figure imgf000020_0008
expression dans laquelle B(-) est un pont Brownien, la distribution étant définie par l'expression :
Figure imgf000020_0009
Figure imgf000020_0001
Par conséquent, l'hypothèse que les deux échantillons ∑j et Γ . possèdent des distributions distinctes, c'est-à-dire que l'on est en présence d'un élément de pic significatif sur l'intervalle Bj est vérifié si :
Figure imgf000020_0010
expression dans laquelle : ·
Figure imgf000020_0011
• est le niveau de signifiance (ou risque).
Les valeurs typiques pour a sont de l'ordre de 0,05. La valeur de
Figure imgf000020_0013
correspond au
Figure imgf000020_0012
-quantile de la distribution de Kolmogorov obtenu par inversion de l'expression (1 1 ). Dans le cadre d'applications spectrométriques, les échantillons de sont corrélés par la présence du fond dans les deux
Figure imgf000021_0006
Figure imgf000021_0005
échantillons. Comme tout est supérieur ou égal à zéro,
Figure imgf000021_0004
. Par conséquent, l'égalité suivante permet de
Figure imgf000021_0002
déterminer :
Figure imgf000021_0003
Figure imgf000021_0001
Où η représente une variable caractérisant l'intensité du spectre complet pour le canal d'énergie considéré.
Après calcul 203 de la quantité , le test correspondant à l'inégalité
Figure imgf000021_0007
(12) est par exemple appliqué 204. Un algorithme simplifié peut être utilisé pour mettre en œuvre le test de Kolmogorov-Smirnov 210, comme celui décrit plus loin dans la description à l'aide de la figure 3.
Le résultat du test de Kolmogorov-Smirnov détermine les étapes de traitements à appliquer ensuite. En effet : si , il est considéré qu'un pic significatif a été
Figure imgf000021_0008
détecté sur l'intervalle Bj , et dans ce cas, des traitements 205 sont exécutés afin d'analyser ledit pic ;
si, au contraire, , il est considéré que
Figure imgf000021_0009
l'intervalle courant Bj ne contient pas de pic significatif.
Il est ensuite vérifié s'il reste ou non des canaux d'accumulation à analyser 207.
Si l'intervalle courant B . ne correspond pas au dernier canal d'accumulation à traiter, j est incrémenté 208 et un test de Kolmogorov- Smirnov est appliqué sur le nouvel intervalle courant.
Si l'intervalle courant B . correspond au dernier canal d'accumulation, le processus de traitement se termine. La figure 3 donne un exemple de mise en œuvre du test de
Kolmogorov-Smirnov dans le cadre d'une application de spectrométrie Bayésienne semi paramétrique en un canal B . .
Cet exemple comprend trois phases. La première phase est une phase d'initialisation 301 , la seconde 31 1 correspond à une boucle de calcul et la troisième 312 à une phase dite de finalisation.
La phase d'initialisation a pour but d'initialiser des variables intermédiaires utilisées par les deuxième 31 1 et troisième 312 phases. Ces variables sont notamment les variables ei sont initialisées 301
Figure imgf000022_0012
telles que :
Figure imgf000022_0002
• correspond à l'indice de parcours de la collection
Figure imgf000022_0003
Figure imgf000022_0006
• correspond à l'indice de parcours de la collection
Figure imgf000022_0004
Figure imgf000022_0007
• correspond au décalage maximum entre les
Figure imgf000022_0005
deux indices précédemment définis.
La seconde phase 31 1 , c'est-à-dire la boucle de calcul, est ensuite exécutée.
Dans la suite de la description, pour tout intervalle B . , la collection correspond à la collection d'échantillons obtenue par
Figure imgf000022_0011
Figure imgf000022_0008
échantillonnage de Gibbs et ordonnée par ordre croissant.
En suivant le même principe de notation, pour tout intervalle B . , la collection
Figure imgf000022_0001
correspond à la collection d'échantillons obtenue par
Figure imgf000022_0009
échantillonnage de Gibbs et ordonnée par ordre croissant.
Un premier test 302 est ensuite appliqué de manière à vérifier l'inégalité suivante :
Figure imgf000022_0010
Où correspond au échantillon de la collection
Figure imgf000023_0001
Figure imgf000023_0013
triée par ordre croissant. Par analogie, est le
Figure imgf000023_0005
Figure imgf000023_0002
Figure imgf000023_0003
échantillon de la collection triée par ordre croissant.
Figure imgf000023_0004
Si l'inégalité (14) est vérifiée, la variable est incrémenté 303,
Figure imgf000023_0011
c'est-à-dire que
Figure imgf000023_0009
Si l'inégalité (14) n'est pas vérifiée, la variable est incrémenté
Figure imgf000023_0012
304, c'est-à-dire que
Figure imgf000023_0010
Un second test 305 est ensuite appliqué de manière à vérifier l'inégalité suivante :
Figure imgf000023_0006
Si l'inégalité (15) est vérifiée, la variable dmax es. mise à jour 306 telle que, Puis un troisième test 307 est appliqué.
Figure imgf000023_0014
Si l'inégalité (15) n'est pas vérifiée le troisième test 307 est appliqué directement.
Le troisième test 307 a pour but de vérifier si l'inégalité suivante est vérifiée :
Figure imgf000023_0007
Si l'inégalité (16) est vérifiée, la deuxième phase 31 1 est bouclée, c'est-à-dire que les traitements décrits précédemment sont exécutés de nouveau à partir du test 302 vérifiant l'inégalité (14).
Si l'inégalité (16) n'est pas vérifiée, la phase de finalisation 312 est exécutée.
La phase de finalisation 312 comprend un test 308 dont le but est de vérifier l'inégalité suivante :
Figure imgf000023_0008
Une variable de sortie v j booléenne est définie telle que celle-ci prend la valeur « 1 » si la présence d'un élément de pic significatif a été détectée sur l'intervalle B . et la valeur « 0 » sinon.
La valeur de vj est déterminée en fonction du résultat du test 308 vérifiant l'inégalité (17).
Si l'inégalité (17) est vérifiée 310, v} = 1 et la présence d'un pic est détectée sur l'intervalle B . . Si l'inégalité (17) n'est pas vérifiée 309, v, = 0 . La figure 4 donne un exemple de traitement de construction séquentielle des régions de pics significatifs.
Une région de pics significatifs correspond à une région comprenant au moins un pic significatif, ladite région étant déterminée par détermination des canaux d'accumulation B . contigus pour lesquels vj = l . Cette opération correspond à une segmentation des canaux énergétiques.
L'objectif de ce traitement est de fournir une liste de M régions définies par leurs indices minimum et maximum
Figure imgf000024_0004
Figure imgf000024_0003
lesdits indices correspondant à des indices de canaux d'accumulation. Les régions R(m) peuvent être déterminées en utilisant l'expression suivante :
Figure imgf000024_0001
Les indices minimum et maximum ainsi que le nombre de
Figure imgf000024_0007
Figure imgf000024_0006
régions identifiées M sont déterminés par l'exécution des traitements décrits ci-après.
Une première étape 400 a pour but d'initialiser des variables intermédiaires. Ces variables sont notamment les variables j correspondant à l'indice de canal d'accumulation, m et
Figure imgf000024_0005
qui représentent respectivement l'indice de la région significative courante et la taille en nombre de canaux de ladite région.
Ces trois variables sont mises à zéro. Un premier test 401 est ensuite appliqué de manière à vérifier si Vj = 1 . En d'autres termes, il est vérifié que le canal d'accumulation courant comporte un pic significatif ou une portion de pic significatif.
Si Vj = 1 , la variable δ est incrémentée 402, c'est-à-dire
Figure imgf000025_0004
Sinon un second test 403 est appliqué, ledit test ayant pour objectif de vérifier si , c'est-à-dire de vérifier si le canal d'accumulation
Figure imgf000025_0005
précédent le canal courant contient un pic ou une portion de pic significatif.
, les variables sont mises à jours 405 de
Figure imgf000025_0002
Figure imgf000025_0003
la manière suivante :
Figure imgf000025_0001
Un troisième test 406 est ensuite appliqué, ledit test vérifiant l'inégalité suivante :
Figure imgf000025_0006
Où J est le nombre de canaux d'énergies.
Si l'inégalité j < J est vérifiée, la variable j est incrémentée 404, c'est-à-dire que j = j + ï , et les traitements décrit précédemment sont ré-é- exécutés à partir du premier test 401 .
Si l'inégalité j < J n'est pas vérifiée, la variable M est mise à jour telle que M = m 407.
La figure 5 illustre les analyses pouvant être conduites après application du test Kolmogorov-Smirnov dans le but d'analyser les pics détectés.
La collection de régions significatives {Rm } permet d'estimer statistiquement par la procédure MCMC les caractéristiques de chaque région de pic en termes d'intensité et de localisation en énergie, notamment le centroïde et l'étalement étalement desdits pics. La méthode proposée exploite avantageusement l'incertitude associée à ces caractéristiques sous forme de distribution a posteriori. En effet, outre les moyennes a posteriori sur ces grandeurs, des intervalles de crédibilité peuvent être évalués, ou toute autre statistique associée aux régions de pics.
Ainsi, l'intensité des pics peut être estimée 500.
Pour tout m < M , sur chaque Rm et pour chaque tirage de la procédure MCMC, une quantité est déterminée en utilisant par exemple
Figure imgf000026_0003
l'expression :
Figure imgf000026_0004
Où la fonction ï(Cond) = ï si la condition Cond est vraie et ï(Cond) = 0 sinon. L'estimateur d'intensité pour la région m est alors donné par la moyenne a posteriori :
Figure imgf000026_0001
Un intervalle de crédibilité à 95% pour
Figure imgf000026_0005
est donné par les quantiles de la collection
Figure imgf000026_0002
} en utilisant, par exemple, l'expression suivante :
Figure imgf000026_0006
dans laquelle la collection correspond à la collection d'échantillons
Figure imgf000026_0007
ordonnée par ordre croissant.
Figure imgf000026_0009
La technique Bayésienne semi paramétrique permet de calculer directement tout autre moment ou fonctionnelle de la distribution de
Figure imgf000026_0008
II est également possible d'estimer 501 la localisation énergétique du centroïde de chaque région de pics significatifs.
Pour cela, une estimation ûe la moyenne de la distribution l'énergie restreinte à Pm est déterminée. Pour tout m < M , pour chaque tirage de la procédure MCMC et pour tout k tel que peut être
Figure imgf000027_0004
déterminée en utilisant l'expression suivante :
Figure imgf000027_0001
Pour chaque itération / , le nombre de composantes du processus de Dirichlet dont la localisation et est déterminé en
Figure imgf000027_0006
utilisant, par exemple, l'expression suivante :
Figure imgf000027_0002
Pour tout m < M , une quantité est ensuite estimée sur
Figure imgf000027_0007
chaque région significative Rm et pour chaque tirage de la procédure MCMC en utilisant, par exemple, l'expression suivante :
Figure imgf000027_0005
L'estimateur du centroïde pour la région m est alors donné par
Figure imgf000027_0008
la moyenne a posteriori déterminée à partir des quantités (22) et (23) en utilisant, par exemple, l'expression :
Figure imgf000027_0003
Le dénominateur de l'expression (24) correspond aux nombre de tirages MCMC pour lesquels il y a au moins une composante appartenant à la région Rm , les autres tirages ne pouvant pas être pris en compte dans l'estimation Monte Carlo. L'intervalle de crédibilité à 95% pour est donné par les
Figure imgf000028_0004
quantiles de la collection et peut être déterminé, par exemple, en
Figure imgf000028_0003
utilisant l'expression suivante :
Figure imgf000028_0001
dans laquelle la collection correspond à la collection d'échantillons
Figure imgf000028_0005
Figure imgf000028_0006
ordonnée par ordre croissant.
La technique Bayésienne semi paramétrique permet de calculer directement tout autre moment ou fonctionnelle de la distribution de
Figure imgf000028_0007
Les régions de pics peuvent aussi être analysées en estimant l'étendue de chaque région de pics significatifs 502.
Plusieurs quantités peuvent être fournies afin d'appréhender cette grandeur. Par exemple, une estimation de l'écart-type de la distribution
Figure imgf000028_0011
d'énergie restreinte à la région Rm peut être utilisée.
Pour tout m < M , sur chaque Rm et pour chaque tirage de la procédure MCMC, la quantité est estimée en utilisant par exemple
Figure imgf000028_0008
l'expression :
Figure imgf000028_0009
L'estimateur âm de l'écart-type de la distribution d'énergie restreinte à Rm est alors estimée par la moyenne a posteriori de
Figure imgf000028_0010
en utilisant par exemple l'expression suivante :
Figure imgf000028_0002
L'intervalle de crédibilité à 95% pour est donné par les
Figure imgf000028_0013
quantiles de la collection
Figure imgf000028_0012
Figure imgf000029_0002
dans laquelle la collection
Figure imgf000029_0003
correspond à la collection d'échantillons ordonnée par ordre croissant.
Figure imgf000029_0007
La technique Bayésienne semi paramétrique permet de calculer directement tout autre moment ou fonctionnelle de la distribution de
Figure imgf000029_0004
L'écart-type , dans le cas d'une loi gaussienne sur Rm peut être
Figure imgf000029_0006
un indicateur de l'étendue de qui peut être déterminée en
Figure imgf000029_0005
utilisant par exemple l'expression suivante :
Figure imgf000029_0008
Étant donné que la restriction de la distribution d'énergie à tout Rm peut être nettement différente d'une loi gaussienne, l'estimateur peut ne
Figure imgf000029_0012
pas être pertinent pour estimer l'étendue de la région. Une estimation de l'intervalle de plus forte probabilité à 99% de la restriction à Rm de la densité d'énergie, notée , peut être estimée.
Figure imgf000029_0009
correspond à la largeur de la région de pics prise en sa
Figure imgf000029_0010
base. Pour cette quantité un estimateur basé sur sa moyenne conditionnelle et un intervalle de crédibilité 95% sont proposés.
Pour tout m < M , sur chaque Rm et pour chaque tirage de la procédure MCMC est estimée la fonction cumulative de la distribution de l'énergie restreinte à R en utilisant par exemple l'expression :
Figure imgf000029_0011
Figure imgf000029_0001
Où est une variable représentant l'énergie.
peut alors être déduite de l'expression suivante :
Figure imgf000029_0014
Figure imgf000029_0013
dans laquelle : est la fonction de quantiles (inverse de telle que pour tout
Figure imgf000030_0003
Figure imgf000030_0004
Figure imgf000030_0001
L'estimateur
Figure imgf000030_0006
, équivalent à l'intervalle de plus grande probabilité à 99% de la distribution d'énergie restreinte à Rm , est alors donné par la moyenne a posteriori de , c'est-à-dire par l'expression :
Figure imgf000030_0005
Figure imgf000030_0002
L'intervalle de crédibilité à 95% pour est donné par les quantiles de la
Figure imgf000030_0009
collection , c'est-à-dire par l'expression :
Figure imgf000030_0008
Figure imgf000030_0007
dans laquelle la collection correspond à la collection d'échantillons
Figure imgf000030_0010
ordonnée par ordre croissant.
Figure imgf000030_0011
La technique Bayésienne semi paramétrique permet avantageusement de calculer directement tout autre moment ou fonctionnelle de la distribution de
Figure imgf000030_0012

Claims

REVENDICATIONS 1- Procédé d'analyse de mesures spectrométriques, lesdites mesures C = { ,...,cr } étant classées dans un histogramme, ledit histogramme étant composé de canaux d'accumulation, un canal j correspondant à un intervalle d'énergie B . , ledit procédé étant caractérisé en ce qu'il comporte au moins trois étapes de traitement :
une première étape (100) déterminant par canal d'accumulation j des distributions p représentatives de l'amplitude et Z représentatives de la position des impulsions de Dirac composant le spectre normalisé de pics ainsi que des distributions q représentatives de l'arbre de Pôlya caractérisant le spectre normalisé de fond, lesdits éléments étant obtenus par échantillonnage de Gibbs ;
une seconde étape (101 ) de détection des canaux significatifs, ladite détection étant réalisée par application d'un test de Kolmogorov-Smirnov par canal d'accumulation de l'histogramme sur la base des résultats de la première étape
(100) ;
une troisième étape (102) d'identification de régions significatives du spectre par regroupement des intervalles B . des canaux significatifs identifiés lors de la seconde étape
(101 ) , lesdites régions comportant au moins un pic significatif. 2- Procédé selon la revendication 1 caractérisé en ce que le spectre de pics est déterminé (202) pour tout canal d'accumulation d'indice j , en utilisant des estimateurs Monte-Carlo définis par une expression telle que :
Figure imgf000031_0001
dans laquelle :
correspond à la masse de probabilité du canal B . pour le Z 'eme tirage du processus MCMC ; L correspond au nombre de tirages Monte Carlo de l'échantillonneur de Gibbs ;
Figure imgf000032_0002
est la probabilité du spectre de pics dans le spectre complet défini comme étant la somme pondérée du spectre normalisé de pics et du spectre normalisé de fond ;
représente le poids du spectre de pics pour le
Figure imgf000032_0003
tirage du processus MCMC ;
n est le nombre de photons enregistré.
3- Procédé selon l'une quelconque de revendications précédentes caractérisé en ce que le spectre de fond est déterminé pour tout canal d'accumulation d'indice j , en utilisant l'expression suivante :
Figure imgf000032_0001
dans laquelle :
représente les valeurs générées de la variable aléatoire à
Figure imgf000032_0009
l'itération / de l'échantillonneur, représentant la masse de
Figure imgf000032_0004
probabilité du canal B . du spectre normalisé de fond pour chaque j
4- Procédé selon l'une quelconque de revendications précédentes caractérisé en ce que l'incertitude associée à chaque canal énergétique est estimée en définissant un intervalle de crédibilité à 95% déterminé en utilisant les expressions suivantes :
Figure imgf000032_0005
Figure imgf000032_0006
dans lesquelles :
pour tout x , la notation
Figure imgf000032_0007
représente la collection des échantillons x triée par ordre croissant ;
pour tout x et pour tout j la notation représente le
Figure imgf000032_0010
échantillon de la collection x triée par ordre croissant. ainsi, représente la collection des échantillons générés
Figure imgf000033_0003
trjgS par orc|re croissant ;
Figure imgf000033_0004
indique la partie entière ;
n représente le nombre total de photons enregistrés ;
η représente une variable caractérisant l'intensité du spectre de pic pour le canal d'énergie considéré ;
5- Procédé selon l'une quelconque de revendications précédentes caractérisé en ce qu'une quantité ( ) est déterminée pour
Figure imgf000033_0005
application du test de Kolmogorov-Smirnov (210) en utilisant l'expression :
Figure imgf000033_0001
dans laquelle :
correspond à la probabilité du canal B . dans le spectre complet normalisé ;
est une quantité correspondant au fond seul ;
représente la collection des échantillons générés
Figure imgf000033_0009
pour
Figure imgf000033_0011
représente la collection des échantillons générés pour
Figure imgf000033_0006
Figure imgf000033_0010
Figure imgf000033_0012
( ) la fonction cumulative empirique de la distribution de
Figure imgf000033_0007
Figure imgf000033_0013
Figure imgf000033_0008
la fonction cumulative empirique de la distribution de
Figure imgf000033_0014
Figure imgf000033_0015
Figure imgf000033_0002
η représente une variable caractérisant l'intensité du spectre complet pour le canal d'énergie considéré
6- Procédé selon la revendication 5 caractérisé en ce que la présence d'un élément de pic significatif sur un intervalle B . est détectée si étant défini tel que
Figure imgf000034_0001
Figure imgf000034_0002
correspondant à un niveau choisi de signifiance.
Procédé selon l'une quelconque des revendications précédentes caractérisé en ce qu'il comporte une étape d'estimation de l'intensité des pics sur une région significative Rm , ladite intensité étant déterminée en utilisant les expressions :
Figure imgf000034_0003
dans lesquelles :
la fonction ï(Cond) = ï si la condition Cond est vraie et ï(Cond) = 0 sinon ;
{Rm } la collection de régions significatives du spectre ;
Zk est la position de la composante k du processus de Dirichlet produit par la procédure MCMC ;
8- Procédé selon la revendication 7 caractérisé en ce qu'il comporte une étape de calcul d'un intervalle de crédibilité à 95% pour en utilisant
Figure imgf000034_0005
l'expression :
Figure imgf000034_0004
dans laquelle la collection
Figure imgf000034_0006
correspond à la collection d'échantillons ordonnée par ordre croissant.
Figure imgf000034_0007
9- Procédé selon l'une quelconque des revendications précédentes caractérisé en ce qu'il comporte une étape d'estimation du centroïde « de chaque région de pics significatifs en utilisant l'expression suivante :
Figure imgf000035_0001
dans laquelle :
est une quantité estimée sur chaque région significative Rm et pour chaque tirage de la procédure MCMC en utilisant l'expression :
Figure imgf000035_0002
le dénominateur correspond aux nombre de tirages MCMC pour lesquels il y a au moins une composante appartenant à la région Rm , les autres tirages ne pouvant pas être pris en compte dans l'estimation Monte Carlo.
10- Procédé selon la revendication 9 caractérisé en ce qu'il comporte une étape de calcul d'un intervalle de crédibilité à 95% pour en utilisant
Figure imgf000035_0009
l'expression :
Figure imgf000035_0003
dans laquelle la collection correspond à la collection
Figure imgf000035_0005
d'échantillons ordonnée par ordre croissant.
Figure imgf000035_0006
1 1 - Procédé selon l'une quelconque des revendications précédentes caractérisé en ce qu'il comporte une étape d'estimation de l'écart-
Figure imgf000035_0007
type de la distribution d'énergie restreinte à la région Rm en
Figure imgf000035_0008
utilisant l'expression :
Figure imgf000035_0004
dans laquelle
Figure imgf000036_0001
12- Procédé selon la revendication 1 1 caractérisé en ce qu'il comporte une étape de calcul d'un intervalle de crédibilité à 95% pour en
Figure imgf000036_0003
utilisant l'expression :
Figure imgf000036_0004
dans laquelle la collection correspond à la collection
Figure imgf000036_0005
d'échantillons
Figure imgf000036_0006
ordonnée par ordre croissant
13- Procédé selon l'une quelconque des revendications précédentes caractérisé en ce qu'il comporte une étape d'estimation de la largeur de la région déconvoluée en sa base, définie comme l'intervalle de plus forte probabilité à 99% de la restriction à Rm de la densité d'énergie (notée , en utilisant l'expression
Figure imgf000036_0007
Figure imgf000036_0002
dans laquelle :
Figure imgf000036_0008
14- Procédé selon la revendication 13 caractérisé en ce qu'il comporte une étape de calcul d'un intervalle de crédibilité à 95% pour
Figure imgf000036_0010
en utilisant l'expression :
Figure imgf000036_0009
dans laquelle la collection correspond à la collection
Figure imgf000037_0001
d'échantillons ordonnée par ordre croissant.
Figure imgf000037_0002
15- Dispositif d'analyse de mesures spectrométriques, lesdites mesures
Figure imgf000037_0003
étant classées dans un histogramme, ledit histogramme étant composé de canaux d'accumulation, un canal j correspondant à un intervalle d'énergie B . , ledit dispositif étant caractérisé en ce qu'il comporte des moyens pour mettre en œuvre le procédé selon l'une quelconque de revendications 1 à 14.
PCT/EP2011/053774 2010-04-02 2011-03-14 Procede d'analyse spectrometrique et dispositif apparente WO2011120785A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP11708046A EP2553496A1 (fr) 2010-04-02 2011-03-14 Procede d'analyse spectrometrique et dispositif apparente
JP2013501720A JP2013527433A (ja) 2010-04-02 2011-03-14 分光分析の方法および関連装置
US13/639,079 US20130197861A1 (en) 2010-04-02 2011-03-14 Method for spectrometric analysis and related device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1052526 2010-04-02
FR1052526A FR2958411B1 (fr) 2010-04-02 2010-04-02 Procede d'analyse spectrometrique et dispositif apparente

Publications (1)

Publication Number Publication Date
WO2011120785A1 true WO2011120785A1 (fr) 2011-10-06

Family

ID=43127160

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2011/053774 WO2011120785A1 (fr) 2010-04-02 2011-03-14 Procede d'analyse spectrometrique et dispositif apparente

Country Status (5)

Country Link
US (1) US20130197861A1 (fr)
EP (1) EP2553496A1 (fr)
JP (1) JP2013527433A (fr)
FR (1) FR2958411B1 (fr)
WO (1) WO2011120785A1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2985817A1 (fr) * 2012-01-17 2013-07-19 Commissariat Energie Atomique Procede de detection de changement d'activite dans un spectre construit a partir d'interactions corpusculaires
WO2016150935A1 (fr) * 2015-03-24 2016-09-29 Commissariat A L'energie Atomique Et Aux Energies Alternatives Procede et dispositif pour detecter des radioelements

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8809798B2 (en) * 2013-01-11 2014-08-19 Baker Hughes Incorporated Methods to enhance nuclear spectroscopy analysis
JP7477890B2 (ja) 2019-09-25 2024-05-02 国立大学法人大阪大学 γ線計測方法およびγ線計測装置
FR3117609B1 (fr) * 2020-12-14 2022-12-09 Commissariat Energie Atomique Système de spectroscopie et procédé de spectroscopie associé
CN115097513B (zh) * 2022-06-20 2023-03-21 上海市计量测试技术研究院 能谱计数窗口的定位方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1014281A2 (fr) * 1998-12-22 2000-06-28 Ncr International Inc. Méthode et appareil pour estimer des observations manquantes dans une base de données

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1014281A2 (fr) * 1998-12-22 2000-06-28 Ncr International Inc. Méthode et appareil pour estimer des observations manquantes dans une base de données

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ERIC BARAT ET AL: "Nonparametric bayesian inference in nuclear spectrometry", NUCLEAR SCIENCE SYMPOSIUM CONFERENCE RECORD, 2007. NSS '07. IEEE, IEEE, PI, 1 October 2007 (2007-10-01), pages 880 - 887, XP031205985, ISBN: 978-1-4244-0922-8 *
ERIC BARAT, THOMAS DAUTREMER, THIERRY MONTAGU, STÉPHANE NORMAND: "Adonis: a new concept of x / gamma pulse analyzer", ANIMMA 2009 - ORAL PRESENTATION, 9 June 2009 (2009-06-09), Marseille, XP002611983, Retrieved from the Internet <URL:http://www.animma.com/conference/ANIMMA_09_oraux_a_telecharger/2-2_Morgiou/Paper_210_Eric_BARAT.pdf> [retrieved on 20101129] *
MOULINES E., RUOEFF F., SOULOUMIAC A., TRIGANO T.: "Nonparametric inference of photon energy distribution from indirect measurement", BERNOULLI, vol. 13, no. 2, 2007, pages 365 - 388, XP002611984, DOI: 10.3150/07-BEJ5184 *
S. GULAM RAZUL; W. J. FITZGERALD; C. ANDRIEU: "Nuclear Instrument and Methods in Physics Research", vol. 497, 2003, ELSEVIER, article "Bayesian model selection and parameter estimation of nuclear emission spectra using RJMCMC", pages: 492 - 510
T. DAUTREMER; T. MONTAGU: "Nonparametric bayesian inference in nuclear spectrometry", IEEE NUCLEAR SCIENCE SYMPOSIUM RECORD, 2007

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2985817A1 (fr) * 2012-01-17 2013-07-19 Commissariat Energie Atomique Procede de detection de changement d'activite dans un spectre construit a partir d'interactions corpusculaires
WO2016150935A1 (fr) * 2015-03-24 2016-09-29 Commissariat A L'energie Atomique Et Aux Energies Alternatives Procede et dispositif pour detecter des radioelements
FR3034221A1 (fr) * 2015-03-24 2016-09-30 Commissariat Energie Atomique Procede et dispositif pour detecter des radioelements

Also Published As

Publication number Publication date
FR2958411B1 (fr) 2012-06-08
US20130197861A1 (en) 2013-08-01
EP2553496A1 (fr) 2013-02-06
JP2013527433A (ja) 2013-06-27
FR2958411A1 (fr) 2011-10-07

Similar Documents

Publication Publication Date Title
WO2011120785A1 (fr) Procede d&#39;analyse spectrometrique et dispositif apparente
EP2565904B1 (fr) Procédé et dispositif d&#39;estimation d&#39;un paramètre de masse moléculaire dans un échantillon
WO2015185846A1 (fr) Procédé d&#39;analyse d&#39;une scène dynamique, module d&#39;analyse et programme d&#39;ordinateur associés
EP2297564A1 (fr) Procédé et dispositif d&#39;analyse fréquentielle de données
EP2364490A1 (fr) Dispositif a architecture pipeline de flot de donnees pour la reconnaissance et la localisation d&#39;objets dans une image par balayage de fenetres de detection
WO2016150935A1 (fr) Procede et dispositif pour detecter des radioelements
FR2920235A1 (fr) Procede d&#39;estimation de concentrations de molecules dans un releve d&#39;echantillon et appareillage
EP3857512A1 (fr) Procede, programme d&#39;ordinateur et systeme de detection et localisation d&#39;objet dans une scene tridimensionnelle
FR2890450A1 (fr) Procede de determination par analyse doppler a haute resolution du champ de vitesse d&#39;une masse d&#39;air
EP2726815B1 (fr) Procede et dispositif d&#39;identification d&#39;un materiau par analyse spectrale de rayonnements electromagnetiques traversant ce materiau
FR3082962A1 (fr) Determination automatique et auto-optimisee des parametres d&#39;execution d&#39;une application logicielle sur une plateforme de traitement de l&#39;information
EP1007961A1 (fr) Appareil de classification destine notamment a la reconnaissance d&#39;odeurs
JP2016186489A (ja) 分光分析の方法および関連装置
WO2021122291A1 (fr) Procede et dispositif de detection d&#39;equipement intrus
EP3066525B1 (fr) Système informatique pour l&#39;exploitation de mesures hétérogènes issues de différents appareils de métrologie en vue de l&#39;estimation de valeurs de caractéristiques de dispositifs microélectroniques, procédé et programme d&#39;ordinateur correspondants
EP2939179B1 (fr) Procédé de segmentation d&#39;une image d&#39;un oeil et dispositif associé
WO2020128284A1 (fr) Procede de caracterisation d&#39;un spectrometre, produit programme d&#39;ordinateur et calculateur associes
WO2013135977A1 (fr) Système pour déterminer l&#39;identification d&#39;un appareil photographique a partir d&#39;une photographie et procédé mis en oeuvre dans un tel système
EP1412872A2 (fr) Procede de traitement d&#39;images numeriques, notamment d&#39;images satellitaires
WO2022153016A1 (fr) Méthode de mesure paramétrique en ligne de la distribution statistique d&#39;un signal physique
WO2023135379A1 (fr) Detection d&#39;anomalies de mesure par filtre de kalman appliquee a la navigation
WO2023247128A1 (fr) Methode de generation de donnees spectrales synthetiques
WO2023237498A1 (fr) Dispositif de traitement de donnees par voie d&#39;apprentissage, procede, programme et systeme correspondant
FR2952733A1 (fr) Procede d&#39;analyse discriminante de donnees d&#39;observations
FR2967512A1 (fr) Procede d&#39;analyse de donnees longitudinales, programme d&#39;ordinateur et systeme correspondants

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11708046

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011708046

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2013501720

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 13639079

Country of ref document: US