FR3092399A1 - Analyse de melanges complexes, notamment d’hydrocarbures, par traitement statistique de donnees spectrometriques - Google Patents
Analyse de melanges complexes, notamment d’hydrocarbures, par traitement statistique de donnees spectrometriques Download PDFInfo
- Publication number
- FR3092399A1 FR3092399A1 FR1900992A FR1900992A FR3092399A1 FR 3092399 A1 FR3092399 A1 FR 3092399A1 FR 1900992 A FR1900992 A FR 1900992A FR 1900992 A FR1900992 A FR 1900992A FR 3092399 A1 FR3092399 A1 FR 3092399A1
- Authority
- FR
- France
- Prior art keywords
- mass
- parameter
- values
- characteristic
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
L'invention concerne l’analyse de mélanges complexes, notamment de mélanges complexes de molécules hydrocarbonées telles que les mélanges d’hydrocarbures, notamment par spectrométrie de masse couplée à au moins une technique de caractérisation isomérique, et plus précisément la classification de ces mélanges. La présente invention utilise un traitement statistique de données spectrométriques traduisant la dispersion isomérique pour identifier des paramètres caractéristiques (ou marqueurs) d’une ou plusieurs molécules organiques. La connaissance de ces paramètres caractéristiques pour des molécules organiques particulières peut ensuite être utilisée pour l’analyse de mélanges d’origine inconnue. Figure pour l’abrégé : figure 3
Description
Le domaine de l’invention concerne l’analyse de mélanges complexes, notamment de mélanges complexes de molécules hydrocarbonées telles que les mélanges d’hydrocarbures, notamment par spectrométrie de masse couplée à au moins une technique de caractérisation isomérique, et plus précisément la classification de ces mélanges.
L’invention a ainsi pour objet un système et une méthode de détermination d’un paramètre caractéristique de la présence de molécule(s) organique(s) dans un mélange complexe de molécules organiques et un système, un dispositif et une méthode d’analyse d’un mélange complexe.
Dans le domaine du raffinage, l’optimisation des procédés de conversion nécessite la détermination de la présence de composés susceptibles d’avoir un impact sur le procédé en question. Notamment, dans les procédés de conversion en gazole de charges lourdes de type DSV (Distillat Sous Vide, ou VGO en terminologie anglo-saxonne pour « Vacuum gas oil »), il est apparu que certaines charges pouvaient avoir des comportements très différents alors qu’elles possédaient des propriétés macroscopiques proches. Par exemple, les charges utilisées en hydrocraquage pour produire du gazole sont en général des DSV « Straight-Run », à savoir qu’elles n’ont pas subi de modification moléculaire. Mais ces charges peuvent aussi provenir d’autres unités de la raffinerie ou être achetées. De telles charges alternatives peuvent contenir des molécules organiques provenant de coupes plus lourdes et/ou être issues de procédé de conversion du fond du baril : ces charges contiennent ainsi une proportion plus ou moins grande de molécules déjà craquées ou hydrogénées qui sont réfractaires au procédé de conversion.
Actuellement, la présence de ces molécules réfractaires est estimée sur la base des propriétés physico-chimiques macroscopiques et élémentaires de la charge globale, par exemple par distillation simulée, par détermination du ratio N sur S, détermination du résidu de carbone Conradson (CCR), etc.
Si ces méthodes permettent dans certains cas de déceler la présence de grandes quantités de molécules craquées, elles sont pour la plupart incapables d’en déceler une présence plus faible, par exemple de l’ordre de quelques pourcents. La spectrométrie de masse à très haute résolution permet de détecter et d’attribuer à chaque masse mesurée une unique formule brute de type CcHhNnOoSs. L’obtention d’informations sur la structure, le nombre et la nature des isomères présents à chaque masse nécessite cependant l’emploi de techniques chromatographiques résolutives à l’échelle de l’isomère. Ces techniques chromatographiques existent uniquement en phase gazeuse, de sorte que ce type d’analyse ne peut être utilisé pour caractériser des mélanges d’hydrocarbures qui ne sont pas distillables à pression atmosphérique.
Il existe donc un besoin pour un système et une méthode de détermination d’un paramètre caractéristique de la présence de molécule(s) organique(s) dans un mélange complexe de molécules organiques tel qu’un mélange d’hydrocarbures, permettant notamment de détecter des molécules organiques craquées ou hydrogénées, même à faible teneur, et pour tout type de mélange complexe.
La spectrométrie de masse couplée à la mobilité ionique est une technique efficace pour caractériser des mélanges complexes tels que des fractions de pétrole. Cependant, l’identification des espèces isomériques est difficile en raison de la complexité moléculaire des pétroles et de l’absence de disponibilité de molécules standards : il est ainsi illusoire de chercher à déterminer la présence et la structure de chaque isomère.
Sans vouloir être lié par une théorie, il est supposé que pour chaque molécule organique de formule CcHhNnOoSs, il existe des structures isomériques dans les fractions d’hydrocarbures ayant traversé un procédé de conversion qui n’existent pas dans les fractions qualifiées de Straight Run, lesquelles n’ont pas subi de transformation moléculaire. Notamment, il est supposé que l’obtention d’informations sur la dispersion isomérique des molécules organiques devrait permettre de savoir si une fraction d’hydrocarbures contient des molécules issues d’un procédé de conversion ou non.
La publication « Effective Ion Mobility Peak Width as a New Isomeric Descriptor for the Untargeted Analysis of Complex Mixtures Using Ion Mobility-Mass Spectrometry », Mathilde Farenc et al, J. Am. Soc. Mass Spectrom. (2017) met en évidence l’élargissement des pics de mobilité obtenus pour des mélanges complexes par spectrométrie de masse couplée à la mobilité ionique lorsque plusieurs isomères sont présents pour une même masse. Cette publication propose d’utiliser comme indicateur de la dispersion isomérique la différence entre les largeurs à mi-hauteur d’un pic de mobilité d’un mélange complexe et d’un pic de mobilité d’un composé de référence, la poly-alanine. La détection de la présence de molécules organiques dans un mélange complexe n’est pas mentionnée.
Il est proposé un système et une méthode de détermination de paramètres caractéristiques de la présence de molécules organiques dans un mélange complexe de molécules organiques. Notamment, la méthode selon l’invention permet, par exemple, de déterminer la présence de molécules organiques craquées ou hydrogénées dans un mélange d’hydrocarbures, sans rechercher la structure et conformation précise des molécules organiques.
Un premier objet de l’invention concerne un système de détermination d’un paramètre caractéristique de la présence de molécule(s) organique(s) prédéterminée(s) dans un mélange complexe de molécules organiques, notamment un mélange d’hydrocarbures, comprenant :
a. des moyens de réception de données spectrométriques d’un nombre n d’échantillons de référence constitués par des mélanges complexes d’origine connue dont certains contiennent la(les) molécule(s) organique(s) prédéterminée(s), ces données spectrométriques étant acquises par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique des espèces contenues dans l’échantillon et comprenant au moins, un paramètre de masse représentatif de la masse de chaque espèce ionisée détectée par le spectromètre de masse, et, pour chaque masse détectée, une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée est détectée et la donnée d’intensité est représentative de l’intensité du signal correspondant détecté,
b. des moyens de sélection, pour chaque échantillon de référence, des valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à une valeur d’intérêt du paramètre de masse correspondant à la masse de chaque molécule organique prédéterminée,
c. des moyens de traitement des valeurs des données sélectionnées agencés pour :
i. reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur d’intérêt du paramètre de masse de chaque échantillon de référence,
ii. calculer une valeur d’au moins un paramètre de forme représentatif de la forme de chaque courbe reconstruite choisi parmi le nombre de pics de la courbe et un paramètre représentatif de la forme de chaque pic choisi parmi l’abscisse, l’ordonnée au sommet (ou intensité du pic), l’aire du pic, la largeur à mi-hauteur, l’aplatissement, l’asymétrie et tout autre paramètre caractéristique de la forme d’un pic et notamment de sa caractérisation,
iii. déterminer un intervalle de valeurs pour chaque paramètre de forme en dehors duquel une valeur du paramètre de forme est une valeur extrêmes, cet intervalle étant déterminé par application d’un test statistique sur les valeurs calculées du paramètre de forme pour chaque valeur d’intérêt du paramètre de masse pour l’ensemble des échantillons de référence ne contenant pas la(les) molécule(s) organique(s) ou pour la totalité des échantillons de référence,
iv. identifier les valeurs extrêmes des paramètres de forme associées à des échantillons de référence contenant la(les) molécule(s) organique(s) prédéterminée(s) et les ensembles {paramètres de masse ; paramètre de forme} correspondants à ces valeurs extrêmes et définir au moins un de ces ensembles en tant qu’ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s).
Un autre objet de l’invention concerne une méthode de détermination de la présence de molécule(s) organique(s) prédéterminée(s) dans un mélange complexe de molécules organiques, notamment un mélange d’hydrocarbures, par spectrométrie de masse couplée à au moins une technique de caractérisation isomérique, comprenant :
a. la réception des données spectrométriques d’un nombre n d’échantillons de référence constitués par des mélanges complexes d’origine connue dont certains contiennent la(les) molécule(s) organique(s) prédéterminées, ces données spectrométriques étant acquises par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique des espèces contenues dans l’échantillon et comprenant au moins un paramètre de masse représentatif de la masse de chaque espèce ionisée détectée par le spectromètre de masse, et, pour chaque masse détectée, une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée est détectée et la donnée d’intensité est représentative de l’intensité du signal correspondant détecté,
b. la sélection, pour chaque échantillon de référence, des valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à une valeur d’intérêt du paramètre de masse correspondant à la masse de chaque molécule organique dont on veut détecter la présence,
c. le traitement des valeurs des données sélectionnées pour:
i. reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur d’intérêt du paramètre de masse de chaque échantillon de référence,
ii. calculer une valeur d’au moins un paramètre de forme représentatif de la forme de chaque courbe reconstruite choisi parmi le nombre de pics de la courbe et un paramètre représentatif de la forme de chaque pic choisi parmi l’abscisse au sommet, l’ordonnée au sommet (ou intensité du pic), l’aire du pic, la largeur à mi-hauteur, l’aplatissement, l’asymétrie, et tout autre paramètre caractéristique de la forme d’un pic et notamment de sa caractérisation,
iii. déterminer un intervalle de valeurs pour chaque paramètre de forme en dehors duquel une valeur du paramètre de forme est une valeur extrême, cet intervalle étant déterminé par application d’un test statistique sur les valeurs calculées du paramètre de forme pour chaque valeur d’intérêt du paramètre de masse pour l’ensemble des échantillons de référence ne contenant pas la(les) molécule(s) organique(s) ou pour la totalité des échantillons de référence,
iv. identifier les valeurs extrêmes des paramètres de forme associées à des échantillons de référence contenant la(les) molécule(s) organique(s) prédéterminée(s) et les ensembles {paramètres de masse ; paramètre de forme} correspondants à ces valeurs extrêmes et définir au moins un de ces ensembles en tant qu’ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s).
Les données spectrométriques reçues à l’étape a) sont obtenues par spectrométrie de masse couplée à au moins une technique de caractérisation isomérique des espèces contenues dans l’échantillon analysé par le spectromètre de masse, autrement dit après caractérisation des isomères (ou espèces isomériques) contenus dans l’échantillon.
La technique de caractérisation isomérique peut être une technique de séparation isomérique (dans le temps), éventuellement couplée à une technique de distribution des intensités des masses de fragments des isomères, le spectromètre de masse utilisé étant alors capable de faire de la fragmentation.
La séparation isomérique peut être obtenue par chromatographie, électrophorèse capillaire, spectrométrie de mobilité ionique.
Du fait de cette séparation isomérique, chaque donnée temporelle reçue à l’étape a) comprend une composante spécifique de l’espèce isomérique détectée. Autrement dit, une donnée temporelle est représentative de l’instant auquel une espèce isomérique ionisée est détectée.
Ainsi, la courbe reconstruite à l’étape i) traduit la dispersion isomérique observée pour un paramètre de masse. Cette courbe est appelée courbe de mobilité lorsque la caractérisation isomérique est une séparation isomérique obtenue par spectrométrie de mobilité ionique.
La technique de distribution des intensités des masses de fragments des isomères peut être une technique de type MS-MS dans laquelle on fragmente les isomères. Dans ce cas, chaque donnée temporelle est représentative de l’instant auquel un fragment d’une espèce isomérique est détecté.
L’utilisation de données spectrométriques traduisant la dispersion isomérique permet ainsi l’obtention de données pour tout type de mélanges complexes, notamment de mélanges d’hydrocarbures, et en particulier pour les mélanges lourds, dont la composition ne peut être déterminée par les techniques chromatographiques à haute résolution actuellement sur le marché.
En outre, la sélection des données liées uniquement à la ou aux molécules recherchées permet de limiter le nombre de données traitées par les moyens de traitement et de réduire ainsi le temps de global de traitement ainsi que les ressources nécessaires à ce traitement.
Enfin, le système et la méthode de détermination selon l’invention permettent d’identifier des paramètres caractéristiques (ou marqueurs) d’une ou plusieurs molécules organiques dont la valeur varie de manière significative et/ou dont le nombre de paramètres de masse pour lequel cette valeur est extrême est significatif, même lorsque la teneur du mélange en cette molécule est faible, par exemple de l’ordre de quelques pourcents en masse. La connaissance de ces paramètres caractéristiques pour des molécules organiques particulières peut ensuite être utilisée pour l’analyse de mélanges d’origine inconnue et la détection de ces molécules organiques dans ces mélanges le cas échéant, sans avoir à connaître la structure et la forme de la molécule, seule la masse de celle-ci étant connue.
Le système et la méthode selon l’invention sont particulièrement adaptés pour déterminer des paramètres caractéristiques de la présence de molécules organiques existant sous la forme de nombreux isomères dans des mélanges complexes, ces différents isomères rendant très complexe, voire impossible, une identification par les techniques d’analyse usuelles.
Dans un mode de réalisation, au cours de l’étape iv) mise en œuvre par les moyens de traitement, tous les ensembles {paramètres de masse ; paramètre de forme} identifiés sont définis comme ensembles caractéristiques de la présence de la (des) molécule(s) organique(s) prédéterminée(s).
Dans une variante, un ou plusieurs de ces ensembles correspondant à un ou plusieurs paramètres de forme sont choisis. A titre d’exemple, les ensembles choisis peuvent être ceux associés à un paramètre de forme pour lesquels les valeurs extrêmes sont les plus éloignées des bornes de l’intervalle.
Un autre objet de l’invention concerne un système d’analyse d’au moins un mélange complexe de molécules organiques, notamment un mélange d’hydrocarbures, contenant une(des) molécule(s) organique(s) prédéterminée(s), comprenant
a. des moyens de réception de données spectrométriques d’au moins un mélange complexe à analyser et de mélanges complexes d’origine connue dont certains contiennent la(les) molécule(s) organique(s) prédéterminée(s), ces données spectrométriques étant acquises dans les mêmes conditions par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique des espèces contenues dans le mélange complexe et comprenant au moins un paramètre de masse représentatif de la masse de chaque espèce ionisée détectée par le spectromètre de masse, et, pour chaque masse détectée, une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée est détectée et la donnée d’intensité est représentative de l’intensité du signal correspondant détecté,
b. des moyens de réception d’au moins un ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s), notamment reçu du système de détermination de la revendication 1,
c. des moyens de sélection, pour chaque mélange complexe, des valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à chaque valeur du paramètre de masse correspondant à un paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) prédéterminée(s),
d. des moyens de traitement des valeurs des données sélectionnées agencés pour :
i. reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur du paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) prédéterminée(s) de chaque mélange complexe,
ii. calculer la valeur du ou des paramètres de forme caractéristiques de la présence des molécules organiques de chaque courbe reconstruite,
iii. comparer les valeurs calculées pour chaque mélange complexe d’origine inconnue avec les valeurs calculées pour les mélanges complexes d’origine connue et en déduire une estimation de la présence ou l’absence des molécules organiques.
Dans un mode de réalisation, les moyens de traitement peuvent être agencés pour que l’étape d)iii) de comparaison comprenne :
- réaliser une analyse statistique multivariée sur les valeurs des ensembles {paramètre de masse caractéristique; paramètre de forme caractéristique} du mélange complexe d’origine inconnue et des mélanges complexes d’origine connue,
- comparer chaque mélange complexe d’origine inconnue en fonction de ses similitudes avec les mélanges complexes d’origine connue et en déduire une estimation de la présence ou l’absence des molécules organiques.
Dans un mode de réalisation, le système d’analyse peut inclure le système de détermination.
Un autre objet de l’invention concerne une méthode d’analyse d’au moins un mélange complexe de molécules organiques notamment un mélange d’hydrocarbures, contenant une(des) molécule(s) organique(s) prédéterminée(s), comprenant :
a. la réception de données spectrométriques d’au moins un mélange complexe à analyser et de mélanges complexes d’origine connue dont certains contiennent la(les) molécule(s) organique(s) prédéterminée(s), ces données spectrométriques étant acquises dans les mêmes conditions par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique des espèces contenues dans le mélange complexe et comprenant au moins un paramètre de masse représentatif de la masse de chaque espèce ionisée détectée par le spectromètre de masse, et, pour chaque masse détectée, une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée est détectée et la donnée d’intensité est représentative de l’intensité du signal correspondant détecté,
b. la réception d’au moins un ensemble {paramètre masse caractéristique ; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s), notamment déterminés au moyen de la méthode de détermination de l’invention,
c. la sélection, pour chaque mélange complexe, des valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à chaque valeur du paramètre de masse correspondant à un paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) prédéterminée(s),
d. le traitement des valeurs des données sélectionnées pour :
i. reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur du paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) prédéterminée(s) de chaque mélange complexe,
ii. calculer la valeur du ou des paramètres de forme caractéristiques de la présence des molécules organiques de chaque courbe reconstruite,
iii. comparer les valeurs calculées pour chaque mélange complexe d’origine inconnue avec les valeurs calculées pour les mélanges complexes d’origine connue et en déduire une estimation de la présence ou l’absence des molécules organiques.
Dans un mode de réalisation, l’étape d)iii de comparaison peut comprendre :
- réaliser une analyse statistique multivariée sur les valeurs des ensembles {paramètre de masse caractéristique ; paramètre de forme caractéristique} du mélange complexe d’origine inconnue et des mélanges complexes d’origine connue,
- comparer chaque mélange complexe d’origine inconnue en fonction de ses similitudes avec les mélanges complexes d’origine connue et en déduire une estimation de la présence ou l’absence des molécules organiques.
On notera que l’ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s) reçu à l’étape b) par les moyens de réception peut être déterminé au moyen de la méthode de détermination selon l’invention précédemment décrite, notamment au moyen du système de détermination de l’invention. Ainsi, le paramètre de forme caractéristique est un paramètre de forme représentatif de la forme d’une courbe reconstruite pour un paramètre de masse caractéristique, cette courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour la valeur de ce paramètre de masse caractéristique. Le paramètre de forme est un paramètre représentatif de la courbe reconstruite choisi tel que décrit plus haut. Le paramètre de forme caractéristique est un paramètre présentant une valeur extrême, tel qu’identifié par un test statistique et décrit plus haut.
Par l’utilisation des paramètres caractéristiques (ou marqueurs) de la présence de molécules organiques prédéterminées, la méthode d’analyse selon l’invention permet d’estimer la présence (ou l’absence) de ces molécules organiques dans un mélange complexe, sans pouvoir en faire une analyse quantitative, mais sans nécessiter une analyse structurelle.
Lorsqu’un ou deux ensembles {paramètre masse caractéristique ; paramètre de forme caractéristique} sont reçus, la comparaison peut être facilement réalisée valeur par valeur, éventuellement sur un graphe à une, deux ou trois dimensions. La présence ou l’absence des molécules organiques peut alors être estimée en fonction d’un seuil minimum entre les valeurs de l’échantillon inconnu et les valeurs des échantillons connus. Un tel seuil peut être déterminé par l’homme du métier en fonction de l’application et des exigences requises pour cette application.
Lorsque le nombre de valeurs à comparer est important, la comparaison peut être réalisée au moyen d’une analyse statistique multivariée, en particulier une analyse statistique multivariée de classification des valeurs.
Dans ce cas, l’analyse statistique multivariée permet une analyse rapide des résultats et facilite la comparaison des différents mélanges complexes. Il est ainsi possible de déterminer si un mélange à analyser est proche ou non de mélanges complexes connus et d’en déduire une estimation de la présence ou l’absence des molécules organiques. Notamment, une analyse statistique multivariée de classification des valeurs regroupe les valeurs analysées en classes. La comparaison de chaque mélange complexe d’origine inconnue consiste alors à positionner ce mélange par rapport à la ou aux classe(s) identifiée(s) par l’analyse multivariée.
On notera que les moyens de réception, de sélection et de traitement du système d’analyse peuvent être agencés pour réaliser les fonctions des moyens de réception, de sélection et de traitement du système de détermination. Dans ce cas, le système d’analyse comprend le système de détermination selon l’invention. Ces différents moyens du système de détermination et du système d'analyse, pris seuls ou ensembles, peuvent être un ou plusieurs processeurs de type microprocesseur, microcontrôleur ou autre. Par exemple un seul et unique ordinateur programmé de manière adéquate peut être utilisé, mais deux ordinateurs programmés peuvent être prévus, l’un pour la mise en œuvre du système de détermination et l’autre pour la mise en œuvre du système d’analyse.
Le ou les processeurs comportent notamment des moyens d’exécution de programme d’ordinateur adaptés pour mettre en œuvre les méthodes décrites dans la présente invention.
Dans un mode de réalisation, le ou les processeurs peuvent être agencés pour recevoir des données. Le ou les processeurs peuvent également être agencés pour transmettre des données, notamment vers un dispositif d’affichage tel qu’un écran.
Dans un mode de réalisation, le ou les processeurs peuvent comporter des moyens de mémorisation qui peuvent être une mémoire vive ou une mémoire RAM (de l’anglais « Random Access Memory »), une EEPROM (de l’anglais « (Electrically-Erasable Programmable Read-Only Memory »), une mémoire flash, une mémoire externe, ou autre. Ces moyens de mémorisation peuvent notamment mémoriser les données reçues, et éventuellement de(s) programme(s) d’ordinateur.
Avantageusement, les résultats de l’analyse statistique multivariée peuvent être représentés graphiquement. La comparaison peut alors être faite par un opérateur ou bien automatiquement par des techniques de corrélation ou de reconnaissance d’image.
L’analyse statistique multivariée peut être choisie parmi une analyse en composantes principales, un séparateur à vaste marge, une analyse factorielle discriminante, un réseau de neurones artificiels. Ces analyses sont des analyses statistiques multivariées de classification.
Dans un mode de réalisation, la (les) molécule(s) organique(s) prédéterminée(s) peuvent avoir subi une réaction modifiant le nombre de ses (leurs) isomères, par exemple une réaction d’hydrogénation ou une réaction de craquage. Dans une variante, la (les) molécule(s) organique(s) prédéterminée(s) peuvent être des molécules organiques contenant au moins un atome d’azote.
Dans un mode de réalisation, notamment en combinaison avec le précédent mode de réalisation dans toutes ses variantes, le mélange complexe peut être un mélange d’hydrocarbures issu du traitement d’un brut pétrolier.
Dans un mode de réalisation, les mélanges d’hydrocarbures d’origine connue peuvent être classés en groupes distincts selon leur origine, par exemple selon la nature des traitements qu’ils ont subis, ces traitements pouvant comprendre un ou plusieurs traitements choisis parmi une distillation atmosphérique, une distillation sous vide, une réaction de conversion thermique sous couverture d’H2ou non, une réaction de craquage thermique sans H2, et tout autre procédé de conversion ou de raffinage. Dans ce mode de réalisation, l’étape (d)iii) de comparaison peut alors comprendre en outre une classification du mélange d’origine inconnue dans l’un des groupes des mélanges d’hydrocarbures d’origine connue, notamment par mise en œuvre d’une analyse statistique multivariée de classification.
A titre d’exemple, un groupe peut comprendre des mélanges d’hydrocarbures issus directement d’une ou plusieurs distillations d’un brut pétrolier, notamment d’une distillation atmosphérique et/ou d’une distillation sous vide. Il peut s’agir par exemple de distillats sous vide, de résidus atmosphériques ou de toute autre fraction issue d’une distillation atmosphérique et/ou sous vide d’un brut pétrolier. Un ou plusieurs autres groupes peuvent comprendre des mélanges d’hydrocarbures provenant de procédés de conversion thermique sous couverture d’H2et de procédés de craquage thermique sans H2.
Un autre objet de l’invention concerne un dispositif d’analyse de mélanges complexes, comprenant :
- un spectromètre de masse couplé à au moins une technique de caractérisation isomérique,
- un système de détermination selon l’invention,
- un système d’analyse d’un mélange complexe selon l’invention, connecté au système de détermination.
Notamment, le spectromètre de masse peut être capable de faire de la fragmentation.
Un autre objet de l’invention concerne un programme d’ordinateur comprenant des portions de code de programme pour l’exécution des étapes de la méthode d’analyse selon l’invention et des étapes de la méthode de détermination selon l’invention, lorsque ledit programme est exécuté au moins par un système d’analyse, notamment selon l’invention, comprenant notamment au moins un processeur, et optionnellement un système de détermination, notamment selon l’invention. Ce programme peut par exemple être stocké sur un support mémoire de type disque dur, téléchargé, ou autre.
Description détaillée de l’invention
Par « molécule organique », on entend une molécule qui contient des atomes de carbone liés à des atomes d’hydrogène. Les atomes de carbone y forment la chaîne principale, ils sont liés aux hydrogènes et éventuellement à d’autres atomes tels que le soufre, l’oxygène, l’azote, les halogènes, des métaux.
Le terme “hydrocarbures” désigne des composés chimiques formés uniquement de carbone et d'hydrogène. Ce sont les principaux constituants solides, liquides ou gazeux des pétroles bruts, du gaz naturel et des produits pétroliers.
Par « Mélange d’hydrocarbures », on entend tout mélange contenant des hydrocarbures, notamment les pétroles bruts et toute fraction provenant du traitement des pétroles bruts.
Un DSV désigne un distillat sous vide dans l'intervalle de distillation 370°C - 560°C (selon la norme NF EN 15199-1 :2007). La Norme s’applique aux distillats dont le point d’ébullition initial (PEI) est supérieur à 100°C et le point d’ébullition final (PEF) est inférieur à 750°C.
Détermination d’un paramètre caractéristique de la présence de molécule(s) organique(s) dans un mélange complexe
Sélection des mélanges complexes de référence
Les échantillons de référence peuvent être choisis en fonction de la ou des molécules organiques prédéterminées dont on souhaite déterminer la présence, appelées également ci-après « molécules d’intérêt ». Ainsi, si tous les échantillons de référence sont choisis parmi des mélanges d’hydrocarbures d’origine connue, seuls certains de ces échantillons de référence contiennent la(les) molécule(s) d’intérêt.
Le nombre d’échantillons de référence sera suffisant pour obtenir un ensemble d’échantillons représentatif des différents types de mélanges complexes dans lesquels on trouve la(les) molécule(s) d’intérêt, notamment dans toutes ses formes isomériques. On pourra par exemple prévoir au moins 5 échantillons. De manière générale et usuelle en matière de statistiques, l’homme du métier choisira un nombre d’échantillons de référence suffisamment grand et varié pour assurer la robustesse des statistiques réalisées.
A titre d’exemple, pour l’analyse d’un mélange complexe qui correspond à une fraction pétrolière d’intervalle de distillation particulier, par exemple un DSV, on pourra choisir des échantillons de référence qui sont des fractions présentant le même intervalle de distillation mais provenant de différents bruts pétroliers.
D’autres fractions pétrolières pourraient être analysées, par exemple des résidus atmosphériques (intervalle typique de distillation : Point d’ébullition initial (PEI) à 375°C jusqu’au Point d’ébullition final (PEF) supérieur à 750°C, selon la NF EN 15199-2 :2007), des résidus sous vide (intervalle typique de distillation : Point d’ébullition initial (PEI) à 550°C jusqu’au Point final d’ébullition (PFE) supérieur à 750°C selon la NF EN 15199-2 :2007) – ou toutes coupes pétrolières non distillables à pression atmosphérique, ou encore des pétroles bruts (NF EN 15199-3 :2008).
Analyse spectrométrique des échantillons de référence
L’ensemble des échantillons de référence sont analysés par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique.
Les données spectrométriques acquises par le spectromètre de masse sont ensuite traitées statistiquement pour la détermination des paramètres caractéristiques de la ou des molécules d’intérêt.
Une technique de caractérisation isomérique peut être mise en œuvre avant et/ou après l’ionisation des espèces contenues dans l’échantillon par le spectromètre de masse.
La technique de caractérisation isomérique est de préférence une technique de séparation isomérique (dans le temps), optionnellement couplée à une technique de distribution des intensités des masses de fragments des isomères.
A titre d’exemple, une séparation avant ionisation peut être obtenue par électrophorèse capillaire ou par chromatographie, notamment toute technique de chromatographie permettant de séparer dans le temps des isomères (par exemple une chromatographie en phase gazeuse ou liquide). Une séparation après ionisation peut être obtenue par une technique de spectrométrie de mobilité ionique.
Dans le cas d’une séparation avant ionisation, la séparation isomérique a lieu avant l’introduction de l’échantillon dans un spectromètre de masse classique. Lorsque la séparation isomérique est réalisée après ionisation, dans le cas de la spectrométrie de mobilité ionique, le spectromètre de masse comprend alors une ou plusieurs cellules de mobilité ionique.
Une technique de distribution des intensités des masses de fragments des isomères, telle qu’une spectrométrie de masse tandem (MS/MS), met en œuvre, après ionisation, une sélection simple ou multiple d’un rapport masse/charge dans un premier analyseur puis sa fragmentation dans un second analyseur (appelé couramment cellule de collision), puis la mesure de la masse des fragments ioniques qui résultent de sa fragmentation, dans un troisième analyseur. La distribution de la masse des fragments permet d’obtenir des informations sur le type d’isomère présent dans l’échantillon, des isomères donnant en général naissance à des fragments de masses et d’intensités différentes.
Cette technique de distribution des intensités des masses de fragments des isomères doit être couplée à une technique de séparation.
On notera qu’il est possible de coupler plusieurs techniques de séparation isomérique avant et après ionisation. On peut par exemple réaliser une chromatographie ou électrophorèse capillaire sur l’échantillon avant son introduction dans un spectromètre de masse équipé d’une ou plusieurs cellules de mobilité ionique.
La technique de caractérisation isomérique peut avantageusement être choisie en fonction de la nature des échantillons à analyser.
Par exemple, l’utilisation de la technique de spectrométrie de mobilité ionique est adaptée à des mélanges d’hydrocarbures, notamment les mélanges lourds possédant un intervalle de distillation élevé, qui ne peuvent être analysés par les techniques chromatographiques à haute résolution actuellement sur le marché.
La spectrométrie de mobilité ionique (Ion Mobility Spectrometry - IMS) est une technique d'analyse permettant de séparer les molécules ionisées dans un champ électrique en présence d'un courant de gaz. La mobilité des ions va donc dépendre de la masse des ions, de leur charge et de leur taille (mesurée par leur section efficace de collision ou CCS : collision cross-section) ainsi que de la nature du gaz. On peut donc parler de séparation d'ions par mobilité ionique.
Différentes techniques de spectrométrie de mobilité ionique peuvent être utilisées, telles que la technique TWIMS « Travelling Wave Ion Mobility Spectrometry », TIMS (« Trapped Ion Mobility Spectrometry »), FAIMS « Field Asymetric Ion Mobility Spectrometry » aussi appelé DMS (« diffential mobility spectrometry »), DT-IMS « Drift Tube Ion Mobility Spectrometry » utilisant un champ électrique uniforme. Ces techniques sont bien connues et ne sont pas détaillées.
Un spectromètre de masse couplé à un spectromètre de mobilité ionique pouvant être utilisé comprend classiquement, dans cet ordre, une source d’ionisation, une cellule de mobilité ionique, un analyseur de masse et un détecteur. Un tel spectromètre de masse comprend également de manière classique d’autres éléments tels que piège à ions et guides d’ions qui ne sont pas décrits ici. Certains spectromètres peuvent comprendre plusieurs analyseurs de masse et/ou cellules de mobilité ionique.
L’échantillon peut être introduit directement dans la source d’ionisation, sous forme gazeuse, liquide ou solide (canne d’introduction directe) ou encore par l'association à une méthode séparative (chromatographie en phase liquide, chromatographie en phase gazeuse,...) lorsque l’échantillon le permet.
La source d’ionisation vaporise les molécules de l’échantillon et les ionise, elle peut être utilisée en mode positif pour étudier les ions chargés positivement ou en mode négatif pour étudier les ions chargés négativement. La source d’ionisation est généralement une source à pression atmosphérique. A titre d’exemple, on peut utiliser l’électronébulisation (ESI), l’ionisation chimique à pression atmosphérique (APCI), la photo-ionisation à pression atmosphérique (APPI), la désorption-ionisation laser assistée par matrice (MALDI), ou toute autre technique d’ionisation.
L’analyseur de masse sépare ensuite les ions en fonction de leur rapport masse/charge (m/z). Un analyseur à haute résolution peut être utilisé, par exemple un analyseur à temps de vol (TOF) ou hybride quadripôle/temps de vol (Q/TOF), secteur magnétique, ou une trappe ionique de type Orbitrap® ou à résonnance cyclotronique d’ion (ICR) suivie d’une transformée de Fourier.
Enfin, le détecteur transforme les ions en signal électrique et amplifie le signal dont l’intensité augmente avec le nombre d’ions.
Les données enregistrées expérimentalement pour chaque ion détecté (et donc chaque rapport m/z) correspondent ainsi généralement à l’intensité du signal du courant ionique détecté en fonction du temps d’arrivée qui correspond au temps mis par les ions pour arriver au détecteur à partir de leur temps d’injection.
Lorsque la séparation isomérique a lieu avant l’ionisation, le temps d’arrivée intègre le temps de séparation avant ionisation (on parle de temps de rétention dans le cas de la chromatographie).
Lorsque la séparation isomérique a lieu après l’ionisation (cas de la spectrométrie de mobilité ionique), le temps d’arrivée est égal à la somme du temps de dérive des ions à travers la cellule de mobilité (drift time en anglais) et du temps passé par les ions en dehors de la cellule de mobilité (temps mort). On notera qu’un temps de séparation peut s’ajouter au temps d’arrivée lorsqu’il y a séparation isomérique avant et après ionisation.
Selon les appareils, les intensités du signal du courant ionique détecté pour une espèce ionisée peuvent être enregistrées au fur et à mesure de leur détection, sans enregistrement du temps d’arrivée en lui-même.
Un spectromètre de masse acquiert ainsi après séparation isomérique des espèces contenues dans chaque mélange analysé des données spectrométriques qui comprennent au moins :
- un paramètre de masse représentatif de la masse de l’espèce ionisée, notamment de l’espèce isomérique ionisée, détectée,
- et, pour chaque paramètre de masse (pour chaque masse détectée), une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée, notamment l’espèce isomérique ionisée, est détectée et la donnée d’intensité est représentative de l’intensité détectée correspondante.
Le paramètre de masse peut être la valeur du rapport m/z, la valeur de la masse m. La donnée temporelle peut être le temps d’arrivée (compté depuis l’injection du produit), le temps de dérive, le temps d’arrivée dans la source d’ionisation du spectromètre de masse de l’espèce ionisée, notamment de l’espèce isomérique ionisée. La donnée d’intensité peut être la valeur du courant ionique détecté, éventuellement après amplification ou un nombre d’impulsions détectées.
D’autres données spectrométriques peuvent être enregistrées telles que la valeur de la charge z, la fréquence d’acquisition, le nombre de points d’acquisition, le pas d’acquisition.
Selon les spectromètres, il peut être possible de régler la fréquence d’acquisition afin que chaque courbe représentant les données d’intensité en fonction des données temporelles dispose d’un nombre de points suffisant (par exemple de 15 à 20 points) pour permettre un ajustement (fitting) de cette courbe, par exemple par une gaussienne ou pseudo-gaussienne.
Il arrive que les données spectrométriques acquises par le spectromètre de masse soient enregistrées au moment de l’acquisition sous un format uniquement lisible par un outil de visualisation de données fourni par le fabricant du spectromètre. Il peut alors être nécessaire de convertir ces données afin d’accéder aux données spectrométriques « brutes » comprenant les informations relatives à la masse (paramètre de masse) et à la mobilité (ensembles {donnée temporelle ; donnée d’intensité}). Cette conversion peut être réalisée à partir de programmes adaptés, notamment fournis par le fabriquant.
Sélection des données spectrométriques à traiter
Le volume des données spectrométriques de chaque échantillon est important en raison de la complexité des mélanges analysés.
L’étape de sélection permet de réduire le volume de données qui est ensuite traité et de réduire ainsi le temps de traitement de ces données.
La sélection porte sur les valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à une valeur d’intérêt du paramètre de masse correspondant à la masse de chaque molécule organique d’intérêt.
Cette sélection peut porter sur une unique valeur d’intérêt du paramètre de masse ou peut porter sur un ensemble de valeurs d’intérêt du paramètre de masse, par exemple situées dans un intervalle prédéfini.
Par exemple, cette sélection peut consister à sélectionner, dans un intervalle de paramètres de masse dans lequel se trouvent des molécules d’intérêt, les valeurs des paramètres de masse correspondant à ces molécules d’intérêts et aux isomères correspondants.
En particulier, choisir un intervalle de valeurs du paramètre de masse peut permettre d’éliminer des valeurs correspondant à des molécules susceptibles de ne pas correspondre aux molécules recherchées et présentes à titre exceptionnel dans un échantillon.
A titre d’exemple, pour l’analyse de mélanges d’hydrocarbures tels que des DSV, on peut sélectionner les molécules organiques comportant un atome d’azote. Ces molécules azotées sont en effet susceptibles d’être hydrogénées lors des procédés de conversion sous dihydrogène, créant de nouvelles molécules qui ne sont pas présentes dans les mélanges hydrocarbonés n’ayant pas subi ce type de conversion dans l’intervalle d’ébullition d’un DSV. Ces molécules possédant une CCS proche des molécules de même masse mais légèrement différente (du fait de leur absence à l'état naturel) ont pour effet de faire varier la diversité isométrique à cette masse et donc la largeur de la courbe représentant les données d’intensité en fonction des données temporelles (appelée pic de mobilité dans le cas d’une séparation isomérique par mobilité ionique). L’étude de cette évolution devrait donc permettre de distinguer les DSV issus des procédés de conversion de ceux issus de distillation d’un brut (Straight Run). Pour cette application particulière, d’autres molécules d’intérêt pourraient être choisies, notamment celles pour lesquelles les isomères sont les plus impactés par les réactions de craquage ou de conversion. De manière générale, il est possible par cette méthode de détecter (ou d’estimer) la présence de molécules organiques dont la dispersion isomérique peut-être modifiée par un procédé.
L’invention n’est toutefois pas limitée à cette application et peut servir à la détection (ou l’estimation) de la présence de toute molécule organique.
Traitement des données sélectionnées
Les données sélectionnées sont ensuite traitées par les moyens de traitement afin de déterminer le ou les paramètres caractéristiques de la présence d’une molécule d’intérêt.
La première étape (i) de ce traitement consiste à reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur d’intérêt du paramètre de masse de chaque échantillon de référence.
Dans un mode de réalisation, préalablement à la reconstruction de la courbe, les moyens de traitement peuvent enregistrer ces données sélectionnées dans une table de données, par exemple sous la forme d’un tableau à deux dimensions dans lequel chaque ligne correspond à une valeur du paramètre de masse et les différentes valeurs des données d’intensité sont reportées en colonne, en fonction de leur donnée temporelle. Les données pourraient toutefois être organisées différemment.
Cette table de données peut par exemple être enregistrée dans des moyens de mémorisation du système de détermination selon l’invention.
Cette étape de reconstruction consiste à construire une courbe, ou fonction mathématique, et à ajuster les paramètres de cette fonction pour se rapprocher au plus près des valeurs des données sélectionnées.
Un exemple de courbe reconstruite est représenté sur la figure 2.
L’étape de reconstruction est suivie d’une étape (ii) de calcul des valeurs de paramètres de forme représentatifs de la forme de chaque courbe reconstruite. Ces paramètres de forme sont choisis parmi :
- le nombre de modes de la courbe (ou nombre de pics ou sommets)
- pour chaque mode (ou pic) de la courbe :
- l’abscisse au sommet, notée ABS ci-après,
- l’ordonnée au sommet (ou intensité du pic),
- l’aire du pic,
- la largeur à mi-hauteur, FWHM (Full Width at Half Maximum),
- l’aplatissement,
- l’asymétrie,
- tout autre paramètre caractéristique de la forme d’un pic.
Si la courbe dispose d’un seul mode, on parlera de courbe unimodale (ou monomodale). Dans le cas de plusieurs modes, on parlera de courbe bimodale (2 modes) ou plurimodale (plusieurs modes)
Dans le cas où la courbe présente un seul mode (tel que représenté sur la figure 2), on pourra calculer les différents moments de cette courbe en tant que paramètres caractéristiques de la forme de la courbe. Les quatre premiers moments sont : la moyenne (ordre 1), la variance (ordre 2), l’asymétrie (ordre 3), l’aplatissement (ordre 4).
Dans le cas d’une courbe présentant plusieurs modes, il faut alors désommer (ou déconvoluer) la courbe initiale en autant de courbes que de modes détectés. Le calcul des différents moments pourra ensuite être effectué sur chaque courbe obtenue.
L’aplatissement ou kurtosis reflète la répartition des données autour de leur centre. Il peut être caractérisé par le coefficient d’aplatissement de Pearson (dans le cas d’une distribution normale, ce coefficient est égal à 3) ou le coefficient de Fisher (qui est égal à la valeur du coefficient de Pearson – 3). L’asymétrie mesure l’écart de la distribution des données par rapport à la symétrie. Elle peut être caractérisée par le coefficient d’asymétrie de Fisher (une valeur proche de 0 correspond à une distribution approximativement symétrique) ou des coefficients empiriques, tel que le coefficient empirique de Pearson ou le coefficient empirique de Yule et Kendall. Ces différents coefficients sont bien connus et ne seront pas détaillés ici.
On pourra se limiter au calcul d’un seul paramètre afin de réduire le volume des données traitées dans les étapes suivantes, toutefois, il peut être préférable de calculer plusieurs paramètres par exemple 3, 4 ou plus afin de disposer de davantage de données potentiellement discriminantes, autrement dit caractéristiques. L’invention n’est ainsi pas limitée par un nombre de paramètres, le nombre maximal de paramètres ne pouvant toutefois dépasser le nombre de points d’une courbe reconstruite.
A la sortie de l’étape de calcul, on dispose ainsi du calcul d’un certain nombre de paramètres de forme pour chaque masse d’intérêt de chaque échantillon de référence, notamment pour une unique masse d’intérêt ou pour un ensemble de masses d’intérêt.
Dans un mode de réalisation, les moyens de traitement peuvent alors enregistrer ces données dans de nouvelles tables de données. Ces tables sont par exemple des tableaux à deux dimensions, chaque tableau donnant les valeurs d’un paramètre de forme. A titre d’exemple non limitatif, chaque ligne peut correspondre à une valeur du paramètre de masse et chaque colonne peut correspondre à un échantillon, les valeurs correspondantes du paramètre de forme considérée étant reportées aux intersections entre les lignes et les colonnes appropriées.
Ces tables peuvent être enregistrées dans les moyens d’enregistrement.
L’étape suivante consiste à déterminer un intervalle de valeurs pour chaque paramètre de forme en dehors duquel une valeur du paramètre de forme est une valeur extrême du paramètre de forme. Cet intervalle est déterminé par application d’un test statistique sur les valeurs calculées de ce paramètre pour chaque valeur d’intérêt du paramètre de masse pour l’ensemble des échantillons de référence ne contenant pas la(les) molécule(s) organique(s) ou pour la totalité des échantillons de référence.
Il s’agit d’effectuer un test statistique pour observer le comportement des échantillons de manière globale.
Lors de cette étape (iii), chaque paramètre de forme peut être étudié séparément ou les différents paramètres peuvent être traités ensemble.
La détermination des intervalles en dehors desquels se trouvent les valeurs extrêmes pour chaque paramètre de forme peut être réalisée par application d’un test statistique, par exemple basé sur la médiane des données et sur l’écart absolu par rapport à la médiane pour chaque masse d’intérêt. Le test pourrait être basé sur un autre descripteur des données, par exemple la moyenne. De manière générale, un test statistique permettant de déterminer des valeurs extrêmes définit des bornes au-delà desquelles les valeurs sont considérées comme extrêmes. Les tests statistiques varient par la manière dont sont déterminées ces bornes.
Il peut s’agir par exemple d’un test de Huber («Robust approaches for mean and variance outliers detection in Round Robin Tests, SAE Technical Papers 2007»). On notera que d’autres tests statistiques que le test de Huber sont envisageables pour la mise en œuvre de l’étape (iii), tels que par exemple le test de Grubbs.
Le principe du test de Huber est le suivant.
Soit Si(où i entier de 1 à p représente le nombre d’échantillons), la valeur d’un paramètre de forme d’un échantillon i calculée pour un paramètre de masse particulier. Pour ce paramètre de masse, la médiane des valeurs est notée Smed.
On appelle résidu uil’écart absolu par rapport à la médiane :
La médiane de ces résidus est notée Umed.
Toutes les valeurs Si qui ne se trouvent pas dans l’intervalle ci-dessous, appelé par la suite intervalle de Huber, sont exclues, autrement dit considérées comme des valeurs extrêmes :
Où le coefficient c est donné par :
Où α = 5%
et
avec N0;1;(1-α/2) 1/p= la valeur d’une variable aléatoire suivant une loi normale pour une probabilité (1-α/2)1/p, une moyenne de 0 et un écart type de 1.
On notera que le test est décrit ici avec un risque α de 5%. Bien entendu, pour la mise en œuvre de ce test (ou de tout autre test similaire), l’homme du métier pourra choisir un risque différent, supérieur ou inférieur à 5% en fonction de l’utilisation des résultats. Dans le cadre de la présente application, un risque de 5% ou moins est considéré comme acceptable, mais un risque supérieur est envisageable pourvu qu’il permette de déterminer la présence de la ou des molécules d’intérêts. L’homme du métier pourra déterminer un risque acceptable par des essais avec des échantillons de référence contenant des quantités connues de la ou des molécules d’intérêt.
Ce test est ainsi appliqué sur les valeurs d’un paramètre de forme associées à un paramètre de masse et est répété pour toutes les valeurs des paramètres de masse et pour tous les paramètres de forme.
On obtient ainsi, pour chaque paramètre de forme, un intervalle en dehors duquel les valeurs du paramètre de forme sont considérées comme extrêmes, notamment selon la valeur de risque considéré.
L’étape suivante consiste à identifier les valeurs extrêmes des paramètres de forme associées à des échantillons de référence contenant la(les) molécule(s) organique(s) prédéterminée(s) et les ensembles {paramètres de masse ; paramètre de forme} correspondants à ces valeurs extrêmes. Dès lors, il est possible de définir au moins l’un de ces ensembles en tant qu’ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s).
Ainsi, un « ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} », regroupe un nombre N de couples de valeurs (paramètre de masse ; valeur extrême du paramètre de forme), pour le paramètre de forme considéré.
Choisir un seul ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} consiste à choisir un seul paramètre de forme caractéristique et l’ensemble des N couples de valeurs (paramètre de masse ; valeur extrême du paramètre de forme).
Ce nombre N est un nombre entier non nul, par exemple supérieur à 10, de préférence supérieur à 50, 100, 200 ou plus. Ce nombre N varie d’un paramètre de forme à un autre. De manière générale, ce nombre N est inférieur ou égal au nombre des valeurs d’intérêt du paramètre de masse sélectionnées.
Lorsqu’une unique valeur d’intérêt d’un paramètre de masse est choisie dans le cas de la recherche d’une unique molécule organique, le nombre N est alors égal à 1.
Autrement dit, on choisit un, plusieurs ou la totalité des ensembles {paramètres de masse ; paramètre de forme} correspondants à ces valeurs extrêmes en tant que paramètres caractéristiques ou marqueurs.
Ce choix peut être réalisé en comparant ce ou ces ensembles avec ceux obtenus pour les mêmes paramètres de forme et les mêmes valeurs des paramètres de masse pour les échantillons de référence ne contenant pas la(les) molécule(s) organique(s) prédéterminée(s).
Par exemple, un ensemble {paramètres de masse ; paramètre de forme} correspondant à des valeurs extrêmes d’un échantillon de référence contenant la(les) molécule(s) organique(s) prédéterminée(s) peut être considéré comme marqueur si le nombre d’éléments de cet ensemble est statistiquement significatif par rapport au nombre d’éléments de l’ensemble des valeurs extrêmes pour les échantillons de référence ne contenant pas la(les) molécule(s) organique(s) prédéterminée(s).
La significativité statistique « p » (ou niveau p) d'un résultat est une mesure estimée du degré pour lequel ce résultat est "juste" (au sens, "représentatif d’une population d’échantillons"). De manière usuelle, un niveau p inférieur ou égal à 0,05 est considéré commune une limite acceptable pour le niveau d’erreur.
Dans le cas où un ensemble {paramètres de masse ; paramètre de forme} contient un unique couple de valeurs (cas où N=1), un paramètre de forme peut alors être considéré comme caractéristique quand pour cette unique valeur du paramètre de masse, la valeur du paramètre de forme est extrême pour un échantillon (ou pour un nombre représentatif d’échantillons) contenant la molécule organique concernée alors que pour un nombre représentatif d’échantillons ne contenant pas cette molécule, cette valeur du paramètre de forme n’est pas extrême. Un nombre d’échantillons est considéré comme représentatif lorsqu’il est suffisamment grand et les échantillons suffisamment variés pour assurer la robustesse des statistiques réalisées.
Lorsque l’on ne choisit qu’un ou plusieurs des ensembles {paramètres de masse ; paramètre de forme} correspondants à ces valeurs extrêmes, on peut par exemple choisir les paramètres de forme dont les valeurs extrêmes présentent les variations les plus significatives comme marqueurs de la présence d’une molécule particulière.
On pourrait par exemple calculer l’écart absolu entre chaque valeur extrême et la borne la plus proche définie par le test statistique et ne retenir que les paramètres de forme dont les valeurs extrêmes présentent l’écart absolu le plus grand.
On notera que les valeurs particulières (caractéristiques) des paramètres de masse peuvent être considérées comme des indicateurs de la dispersion isomérique de cette masse dans les échantillons.
Application aux échantillons inconnus
Le ou les ensembles {paramètre de masse caractéristique ; paramètre de forme caractéristique} déterminés à l’étape précédente peuvent ensuite être utilisés afin d’estimer la présence de molécules d’intérêt dans un échantillon inconnu. L’invention est particulièrement adaptée à l’analyse d’échantillons dont des molécules d’intérêt présentent plusieurs dizaines, voire centaines ou milliers ou encore bien davantage, d’isomères impossibles à séparer réellement.
A cet effet, les données spectrométriques du ou des mélanges complexes d’origine inconnue sont acquises par un spectromètre de masse après caractérisation isomérique dans les mêmes conditions que les conditions d’acquisition d’échantillons de référence (également appelés mélanges complexes d’origine connue).
L’acquisition des données spectrométriques des mélanges complexes d’origine inconnue peut être réalisée à la suite ou lors de l’acquisition des échantillons de référence, de préférence sans ordre spécifique entre les échantillons de référence et les mélanges complexes d’origine inconnue de manière à éviter l’introduction d’un biais dû à l’ordre d’analyse. En variante, ces acquisitions peuvent être réalisées séparément et ultérieurement. Dans ce dernier cas, il est préférable de repasser avec le mélange complexe d’origine inconnu au moins l’un des échantillons de référence, afin de vérifier la non dérive de la mesure. Dans les deux cas, les données spectrométriques sont traitées en deux temps.
Dans un premier temps, les données spectrométriques des échantillons de référence sont traitées pour déterminer les ensembles {paramètre de masse caractéristique ; paramètre de forme caractéristique}, en mettant en œuvre la méthode de détermination de l’invention au moyen du système de détermination de l’invention, tel que précédemment décrit.
Dans un second temps, les données spectrométriques de l’ensemble des échantillons de référence et mélanges d’origine inconnue sont traités pour l’analyse du ou des mélanges d’origine inconnue, en mettant en œuvre la méthode d’analyse de l’invention au moyen du système d’analyse de l’invention, tel que décrit ci-après.
On commence par réaliser une sélection des données spectrométriques similaire à la sélection précédemment décrite mais cette fois-ci, les données spectrométriques sélectionnées sont les valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à chaque valeur du paramètre de masse correspondant à un paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) d’intérêt (appelé ci-après paramètre de masse caractéristique), pour chaque mélange complexe d’origine connue et inconnue. Le volume de données sélectionnées sera ainsi en général plus faible que le volume de données sélectionnées lors de la mise en œuvre de la méthode de détermination de l’invention, ce qui peut réduire le temps de traitement de ces données lors des étapes suivantes.
Les données sélectionnées sont ensuite traitées par les moyens de traitement afin d’analyser le(s) mélange(s) complexe(s) d’origine inconnue.
La première étape (i) de ce traitement est similaire à la première étape (i) du traitement de la méthode de détermination. Les deux étapes peuvent être mises en œuvre de la même manière.
Il s’agit ici de reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur du paramètre de masse caractéristique.
L’étape de reconstruction est suivie d’une étape (ii) de calcul des valeurs de paramètres de forme représentatifs de la forme de chaque courbe de mobilité reconstruite pour chacun des mélanges complexes, mais cette fois-ci on se limite aux paramètres de forme caractéristiques de la présence de(s) molécule(s) organique(s) d’intérêt (appelés paramètres de forme caractéristiques ci-après).
A la sortie de l’étape de calcul, on dispose ainsi, pour chaque paramètre de masse caractéristique, de la valeur des paramètres de forme caractéristiques, et ce, pour chaque échantillon de référence et mélange complexe d’origine inconnue.
Dans un mode de réalisation, les moyens de traitement peuvent alors enregistrer ces données dans de nouvelles tables de données. Ces tables sont par exemple des tableaux à deux dimensions, chaque tableau donnant les valeurs d’un paramètre de forme caractéristique dans lequel une ligne correspond à une valeur du paramètre de masse caractéristique et une colonne correspond à un échantillon de référence ou mélange complexe.
Ces tables peuvent être enregistrées dans les moyens d’enregistrement.
L’étape suivante (iii) consiste ainsi à comparer les valeurs calculées pour chaque mélange complexe d’origine inconnue avec les valeurs calculées pour les mélanges complexes d’origine connue et en déduire une estimation de la présence ou l’absence des molécules organiques.
Cette comparaison consiste par exemple à examiner le positionnement des mélanges complexes d’origine inconnue par rapport aux mélanges complexes d’origine connue. Notamment, cette comparaison peut consister en une classification des mélanges d’origines connue et inconnue.
Cette comparaison peut avantageusement être mise en œuvre en utilisant une représentation graphique des valeurs calculées.
Lorsqu’un ou deux paramètres de forme sont calculés, cette comparaison peut être réalisée par la représentation d’un simple graphe à une, deux ou trois dimensions.
Lorsque le nombre de paramètres est plus important, il est préférable de réaliser une analyse statistique multivariée sur les valeurs des ensembles {paramètre de masse caractéristique ; paramètre de forme caractéristique} du mélange complexe à analyser et des mélanges complexes d’origine connue, notamment une analyse statistique multivariée de classification.
Cette analyse statistique multivariée va permettre un groupement (ou classement) des mélanges testés en fonction des différents paramètres, ce qui permet ensuite de faciliter la comparaison des différents mélanges.
L’analyse statistique multivariée peut être une méthode factorielle de réduction du nombre de variables, telle que par exemple une analyse en composantes principales (ou PCA en anglais pour Principal Component Analysis), ou une analyse factorielle discriminante.
L’analyse en composantes principales consiste à construire un ensemble d’axes indépendants ou orthogonaux (composantes principales) qui sont des combinaisons linéaires des variables de l’ensemble de données à traiter et qui sont calculés de manière à ce que la variance dans les données soit expliquée par un nombre de composantes principales aussi réduit que possible. L’ensemble des données sont organisées en une matrice sur laquelle on effectue une série de calculs matriciels dont le dernier fournit les composantes principales et les variances associées, ces composantes étant classées par ordre décroissant de variance associée. Ainsi, la première composante principale est calculée pour tenir compte de la plus grande variance dans les données, la deuxième composante principale tient compte de la plus grande variance dans les données orthogonales à la première composante principale, la troisième tient compte de la plus grande variance des données orthogonales aux deux premières composantes principales, et ainsi de suite. Pour chaque composante principale, la variance est de moins en moins prise en compte. Finalement, l’utilisation de composantes principales supplémentaires ne prend plus en compte de variance supplémentaire significative dans les données. Ainsi, un jeu de données multidimensionnel (multi-variable) peut être réduit à un nombre inférieur de dimensions (composantes principales), tout en conservant autant d'informations utiles que possible dans les données, ce qui simplifie l'analyse des données et la détection d'éventuels événements anormaux.
Un ensemble de données utilisé dans une analyse en composantes principales comprend généralement un certain nombre de points de données avec une valeur pour chacune de la ou des variables en question, à savoir les couples {paramètre de masse ; paramètre de forme}.
Dans la présente invention, les valeurs pertinentes pour chaque variable sont les valeurs calculées des paramètres de forme et les valeurs du paramètre de masse détectées par le spectromètre de masse.
Un ensemble de composantes principales orthogonales est ensuite extrait de manière à extraire le moins possible de composantes principales des données, tout en prenant en compte le plus de variance possible.
La position d'un point de données le long d'une composante principale donnée est appelée son "score". La pondération d'une variable pour une composante principale donnée est redéfinie comme son "poids". Les scores sont analysés pour détecter les événements anormaux. Les poids peuvent être utilisés pour établir les variables associées à un événement anormal.
En variante, l’analyse statistique multivariée peut être un réseau de neurones artificiels ou encore une méthode de classification telle qu’un séparateur à vaste marge également appelé machine à vecteurs supports. Cette méthode consiste à identifier dans un jeu de données à n variables quels éléments de celui-ci constituent les points frontières (séparateurs) entre les différents sous-groupes de données. Cette identification se fait en cherchant les combinaisons de n+1 éléments qui maximisent les distances (marge) entre-elles (au sens euclidien du terme par exemple). Une fois identifié, on déduit des combinaisons de points (un jeu de coordonnées en somme) une équation analytique définissant chaque frontière entre chaque sous-groupe. Par exemple, s’il y a 2 variables, on trouvera des droites, s’il y a 3 variables on trouvera des plans, etc… Ces définitions étant connues, elles permettent de classer les différents éléments dans les différents sous-groupes avec la meilleure probabilité.
Cette analyse statistique permet ensuite de classer chaque mélange complexe à analyser en fonction de ses similitudes avec les mélanges complexes d’origine connue et d’en déduire une estimation de la présence ou l’absence des molécules organiques.
Cette comparaison peut être visuelle, réalisée par un opérateur en utilisant une représentation graphique de l’analyse statistique multivariée, ou bien automatique au moyen de techniques de corrélation ou de reconnaissance d’image.
L'invention est maintenant décrite en référence aux dessins annexés, non limitatifs, dans lesquels :
La figure 1 représente un dispositif 10 d’analyse d’un mélange complexe comprenant un spectromètre de masse 20 équipé dans l’exemple d’une cellule de mobilité ionique 22, un système de détermination 30 selon un mode de réalisation de l’invention, connecté au spectromètre de masse, et un système d’analyse 40 selon un mode de réalisation de l’invention connecté au spectromètre de masse 20 et au système de détermination 30.
Le spectromètre de masse 20 comprend en outre classiquement une source d’ionisation 21, un analyseur de masse 23 et un détecteur de masse 24. Le détecteur de masse 24 est connecté au système de détermination 30 et au système d’analyse 40 par des lignes de communication 25, 26 pour la transmission des données spectrométriques, qui peuvent être des liaisons filaires ou sans fil (communication Bluetooth, WIFI ou autre). En variante, les données spectrométriques pourraient également être enregistrées sur un support pour être transmises aux systèmes de détermination 30 et d’analyse 40.
Le système de détermination 30 et le système d’analyse 40 comprennent chacun des moyens de réception 31, 41 des moyens de sélection 32, 42 et des moyens de traitement 33, 43. Les moyens de réception 31, 41 peuvent être des interfaces d’entrée ou d’entrée/sortie. Il peut s’agir d’interfaces de communication sans fil (Bluetooth, WIFI ou autre) ou de connecteurs (port réseau, port USB, port série, port Firewire®, port SCSI ou autre). Les moyens de sélection 32, 42 et les moyens de traitement 33, 43 peuvent être un ou plusieurs processeurs, par exemple faisant partie d’un ordinateur 35 comme dans l’exemple. Les moyens de réception 31, 41, les moyens de sélection 32, 42 et les moyens de traitement 33, 43 de chaque système sont reliés entre eux tels que représenté et peuvent communiquer avec une mémoire 36 (mémoire ROM, RAM, flash, EEPROM, ou autre), laquelle peut faire partie du ou des processeurs ou non. En variante non représentée ou en combinaison, ces différents éléments pourraient communiquer avec un support de stockage (USB, disque dur, DVD, …). Dans une variante non représentée, les deux systèmes 20, 30 peuvent partager des moyens de réception, de sélection et de traitement. Dans l’exemple, le système d’analyse est en outre relié à un dispositif d’affichage 38 (écran), via des moyens de transmission 37. Ces derniers peuvent être des interfaces de sortie ou d’entrée/sortie, similaires aux interfaces d’entrée précédemment mentionnées.
Exemple : détection de molécules organiques comprenant un seul atome d’azote dans des DSV
Différents distillats sous vide (DSV), qui sont des fractions lourdes de pétrole, ont été analysés par un spectromètre de masse équipé d’une cellule de mobilité ionique en utilisant une source d’ionisation à électronébulisation en mode positif afin d’ioniser majoritairement les composés organiques comprenant de l’azote
Les DSV suivants ont été analysés, rassemblés en trois groupes :
- 1ergroupe : 30 DSV straight run issus du fractionnement de bruts, notés A, B, C, …, Z et AA, AB, AC, AD sur la figure 3. Ces DSV ne contiennent pas de molécules craquées ou hydrogénées,
- 2èmegroupe : 4 DSV contenant des molécules craquées ou hydrogénées. Certains de ces DSV sont issus de procédés de conversion thermique (sans H2), tel que les d’effluents de procédés de cokage, aussi appelés « effluents coker ». Les autres DSV sont issus de procédés de conversion thermique sous couverture d‘H2(procédés d’hydroconversion en phase slurry, à savoir utilisant des catalyseurs en suspension). Sur la figure 3, ces DSV sont notés α, β pour les DSV issus de procédés de conversion thermique sous couverture d’H2et δ, χ pour les DSV issus de procédés de conversion thermique sans H2,
- 3 échantillons (aussi DSV) mais d’origine inconnue (notés Inconnu 1, Inconnu 2 et Inconnu 3 sur la figure 3).
A cet effet, environ 50mg de chaque DSV a été pesé et dissout dans 10mL de toluène. On prélève ensuite 0,2 mL de chaque DSV dilué et on le mélange à 1,8 mL d'une solution toluène : méthanol (50/50 v/v) acidifiée à 1 % avec de l’acide formique pour une concentration finale d’environ 0,5 mg/mL.
Un spectromètre de masse Synapt G2-Si HDMS (Waters Corp., Manchester, U.K.) a été utilisé pour obtenir les mesures de spectrométrie de masse couplée à de la mobilité ionique. Cet appareil comporte une source d’ionisation, un détecteur hybride Q/TOF et une cellule de mobilité ionique à base d'ondes progressives (onde T) utilisé avec de l'azote (pureté 99,9999%).
Les conditions expérimentales d’ionisation par électronébulisation ont été définies comme suit : débit de gaz de désolvatation, 500 L/h, température de la source, 120°C, température de désolvatation, 300°C, débit de gaz des cellules à hélium, 180 ml/min, tension capillaire, 2,5 kV, cône de prélèvement (« sampling cone »), 50V ; cône d’extraction (« source offset »), 50V; débit de gaz IMS, 90 ml/min de N2(2,96 mbars de pression de la cellule N2IMS); hauteur / vitesse des ondes mobiles IMS, 40,0 V / 800 ms-1.Les données ont été acquises en mode positif sur la plage de m/z de 50-1200 pendant 5 min.
L'analyseur TOF a été réglé en mode reflectron W avec une résolution d’environ 40000. Le contrôle des instruments et l'acquisition des données ont été réalisés à l'aide du logiciel MassLynx (version 4.1). L’analyseur de masse a été étalonné en m/z de manière externe en utilisant une solution de formiate de sodium avant l’analyse des échantillons sur la gamme de masse étudiée. Un étalonnage interne a été réalisé de manière usuelle après les premières mesures.
Les paramètres de mobilité ont été optimisés afin d'étaler au maximum les pics de mobilité des molécules afin de disposer plus de points d'acquisition, à savoir environ 15-20 points d’acquisition par courbe de mobilité.
Une chaine de chromatographique liquide (i-class de Waters) a été utilisée pour réaliser une injection en flux continu (FIA) des échantillons dans le spectromètre de masse. Une boucle externe de 50µL a été installée afin de permettre d'obtenir un temps d'infusion permettant une accumulation suffisante de scans ainsi qu’une stabilité de la quantité d’échantillon arrivant dans la source.
Détermination des paramètres caractéristiques
Dans un premier temps, les données spectrométriques acquises pour les différents échantillons sont traitées afin de déterminer les paramètres caractéristiques de la présence de composés organiques comprenant un seul atome d’azote.
Si les données spectrométriques ne sont pas fournies par le spectromètre de masse sous un format de fichier exploitable, il peut être nécessaire de convertir le fichier de données en un format exploitable, par exemple en « .TXT ».
Ces données comprennent notamment, pour un échantillon, pour chaque scan, les valeurs des paramètres de masse, et pour chaque valeur d’un paramètre de masse, les valeurs des ensembles {donnée temporelle, donnée d’intensité}. L’instrument est réglé ici pour réaliser un scan par seconde. Une acquisition de 5min contiendra donc 300 scans. L’ensemble des données de ces 300 scans constituent les données spectrométriques.
On commence par procéder à une sélection (ou filtrage) de ces données pour ne conserver que les données correspondant à des espèces ioniques d’intérêt, à savoir dans l’exemple les espèces ioniques provenant de l’ionisation des molécules organiques azotées présentes dans tous les échantillons et comportant un seul atome d’azote. Il est ainsi possible de calculer la masse ou la valeur m/z de toutes les molécules hydrocarbonées à un seul atome d’azote et qui présentent :
- un rapport m/z de 200 à 500,
- un nombre d’insaturations de 5 à 15, le nombre d’insaturations DBE (« Double bond equivalent ») est calculé comme suit pour un composé de formule CcHhNn:
- un nombre d’insaturations inférieur à 0,9 fois le nombre de carbones de la molécule (publication : Compositional Space Boundaries for Organic Compounds : Anal. Chem., 2012, 84 (7), pp 3410–3416).
Ces conditions permettent de retenir ici 235 valeurs de m/z.
Les données sélectionnées sont ainsi celles pour lequel ces valeurs du paramètre de masse, ici égal au rapport m/z, sont comprises dans la plage (bornes comprises) mentionnée ci-dessus.
Ces données peuvent être enregistrées, pour chaque échantillon, dans une table de donnée à deux dimensions, où chaque ligne représente une valeur (m/z) du paramètre de masse et chaque colonne représente la valeur de la donnée temporelle, la valeur de la donnée d’intensité correspondant à l’intensité du signal étant reportée à l’intersection.
Pour chaque échantillon et chacun des paramètres de masse m/z sélectionnés, on peut ensuite reconstruire une courbe qui représente l’intensité du signal acquis en fonction de la donnée temporelle. La courbe reconstruite pour la valeur m/z de 334.2535 est représentée sur la figure 2, où l’intensité du signal est reportée en ordonnée et le temps de dérive (exprimé en secondes) est reporté en abscisse.
La courbe représentée figure 2 est monomodale (ou unimodale). Dans ce cas on peut calculer les différents moments de cette courbe et les utiliser comme descripteurs de la forme de la courbe. Les quatre premiers moments sont choisis ici.
A partir des courbes reconstruites, on calcule ici les quatre paramètres suivants :
FWHM : largeur à mi-hauteur du pic,
ABS : abscisse du sommet de la courbe de mobilité,
ASYM : valeur d’asymétrie de la courbe de mobilité (utilisation du coefficient d’asymétrie de Fisher),
KURT : aplatissement de la courbe de mobilité (utilisation du coefficient de Pearson).
Ce type de calcul peut être aisément mis en œuvre par un logiciel de calcul mathématique, par exemple le logiciel MatLab. Il peut être préférable de calculer ces paramètres à partir de la courbe reconstruite après ajustement (« fitting » en anglais).
Les valeurs de ces trois paramètres peuvent être enregistrées dans un tableau à deux dimensions pour chaque échantillon, où chaque ligne correspond à une valeur de m/z et les colonnes correspondent chacune à l’un des paramètres.
Un traitement statistique des valeurs des trois paramètres est ensuite effectué afin de détecter les paramètres dont les variations sont les plus significatives. Chacun des paramètres FWHM, ABS, ASYM et KURT est soumis au traitement statistique séparément, et pour chaque paramètre, on réalise l’analyse statistique pour chaque masse séparément mais sur l’ensemble des échantillons.
On utilise ici le test de Huber précédemment décrit, avec un risque de 5%. Un tel traitement statistique permet de déterminer les valeurs de FWHM qui sont en dehors de l’intervalle de Huber pour une masse et qui peuvent être considérées comme des valeurs extrêmes. L’intervalle de Huber peut être déterminé à partir des valeurs des échantillons du 1ergroupe seul ou des valeurs des échantillons des 1eret 2èmegroupes.
On identifie alors les ensembles de valeurs {m/z ; FWHM } pour lesquels la valeur du paramètre de forme FWHM est en dehors de l’intervalle de Huber sur l’ensemble des échantillons testés contenant la ou les molécules organiques d’intérêt. De manière similaire des ensembles de valeurs {m/z ; ABS}, {m/z ; ASYM } et {m/z ; KURT } pour lesquels les paramètres de forme sont en dehors de l’intervalle de Huber sont identifiés.
Dans le présent exemple, on observe une forte exclusion des masses de l’intervalle de Huber pour un échantillon « effluent coker » du 2èmegroupe pour les quatre paramètres observés (FWHM, ABS, ASYM et KURT) tandis que pour les échantillons du 1ergroupe, l’exclusion se limite à quelques masses (<10) sur les 235 masses par paramètre.
Ci-dessous, on a reporté pour cet échantillon, pour chaque paramètre de forme observé, le nombre de masses pour lesquelles la valeur du paramètre de forme est en dehors de l’intervalle de Huber :
FWHM : 39% des masses (92 masses sur 235)
ABS : 46% des masses (108/235)
ASYM : 40% des masses (93/235)
KURT: 38% des masses (89/235)
Avant de comparer ces ensembles {m/z ; FWHM }, {m/z ; ABS} et {m/z ; ASYM } ; {m/z ; KURT } comportant des valeurs extrêmes, afin de s’assurer que le poids d’un paramètre ne soit pas biaisé par sa gamme de variations possibles, ie qu’un paramètre qui varie de 0 à 1000 ait autant de poids qu’un paramètre qui varie de 0 à 5, il est en général préférable de procéder à un centrage avec réduction. A cet effet, à titre d’exemple, pour chaque paramètre de forme, on calcule d’abord la moyenne et l’écart-type sur l’ensemble des paramètres de masses. Puis, pour chaque valeur du paramètre de forme associée au paramètre de masse, on soustrait la moyenne puis on divise par l’écart-type.
On peut alors comparer ces ensembles comportant des valeurs extrêmes. En particulier, on peut comparer les ensembles de valeurs correspondants à des échantillons particuliers, comme par exemple le groupe des DSV de type straight-Run, le groupe des DSV issus des procédés de conversion thermique sous converture d'H2et des DSV issus des procédés de conversion thermique sans couverture d’H2.
On peut ainsi déterminer quel paramètre de forme peut servir d’indicateur de la présence d’une molécule organique mais aussi de la nature d’un groupe pour une valeur de paramètre de masse particulière.
On notera que ces valeurs particulières des paramètres de masse peuvent être considérées comme des indicateurs de la dispersion isomérique de cette masse dans les échantillons observés en lien avec le procédé de conversion utilisé.
On comprend que la valeur particulière du paramètre de masse correspond à une ou plusieurs molécule(s) particulière(s) dont la dispersion isomérique est différente d’un groupe d’échantillons à un autre et qui peut servir à caractériser ce groupe, et ce, sans avoir à connaître la structure exacte de cet ensemble de molécules.
Il est ainsi possible de définir des paramètres qui vont permettre de caractériser des groupes d’échantillons de référence. Ces paramètres vont ensuite permettre de déterminer si un échantillon inconnu appartient à un groupe particulier en déterminant la valeur de ce paramètre pour l’échantillon inconnu et en le comparant aux valeurs du même paramètre dans les échantillons de référence.
Dans le présent exemple, on a pu identifier des masses pour lesquelles les paramètres de forme (FWHM, ABS, ASYM, KURT) présentent des valeurs extrêmes uniquement pour le 2èmegroupe des DSV ou en nombre significatif pour le 2èmegroupe, à savoir pour les échantillons contenant la ou les molécules organiques d’intérêt. On a considéré par la suite que ces paramètres de forme pour ces masses particulières (autrement dit les différents ensembles {m/z ; FWHM }, {m/z ; ABS}, {m/z ; ASYM } et {m/z ; KURT } des échantillons du 2èmegroupe pour lesquels le paramètre prend une valeur extrême) sont caractéristiques de ces molécules, et aussi du 2èmegroupe et par conséquent caractéristiques de l’impact du procédé de conversion sur les molécules correspondantes. La totalité de ces ensembles sont conservés dans l’exemple et considérés comme des marqueurs de la présence de molécules craquées ou hydrogénées.
Application à la classification d’un DSV inconnu
Les DSV d’origine inconnue (Inconnus 1, 2, 3) sont analysés par le même spectromètre de masse et dans les mêmes conditions que les précédents DSV.
Parmi les données spectrométriques acquises, on sélectionne les données correspondant aux valeurs de paramètres de masse caractéristiques du 2èmegroupe des DSV, autrement dit considérées comme des marqueurs de la présence de molécules craquées/hydrogénées. On reconstruit les courbes de mobilité du DSV pour ces valeurs de paramètre de masse, puis on calcule la valeur du paramètre de forme caractéristique qui a été identifié comme marqueur.
Une manière simple et rapide d'observer le résultat est d'effectuer, pour l'ensemble des échantillons, une analyse en composantes principales (PCA) sur les ensembles {m/z ; FWHM}, {m/z ; ABS} ; {m/z ; ASYM} et {m/z ; KURT } déterminés précédemment et considérés comme des marqueurs.
La figure 3 représente l’analyse PCA effectué sur les échantillons de référence et les échantillons d’origine inconnue.
L’examen de la figure 3 montre que les DSV Straight-Run du 1ergroupe sont contenus dans une enveloppe, et que les DSV du 2èmegroupe sont rassemblés en deux sous-groupes correspondant respectivement aux DSV issus de procédés de conversion thermique sous couverture d’H2et aux DSV issus de procédés de conversion thermique sans H2. On observe donc bien que les descripteurs choisis permettent de séparer et classer les échantillons de référence. Pour les DSV inconnus, l’inconnu 1, situé à l’intérieur de l’enveloppe du 1ergroupe, peut être considéré comme un DSV Straight-Run, autrement dit le DSV inconnu 1 ne contient pas ou peu de molécules converties. Les DSV Inconnus 2 et 3 situés en dehors des enveloppes des 1eret 2èmegroupes mais entre ces groupes, peuvent être considérés comme des DSV contenant une part non négligeable de molécules craquées/converties.
La méthode décrite ci-dessus permet donc de déterminer si un échantillon de DSV inconnu est en partie issu d'un procédé de conversion profonde en comparaison avec des DSV issus de procédé Straight-Run et de procédés de conversion profonde.
Claims (15)
- Système de détermination d’un paramètre caractéristique de la présence de molécule(s) organique(s) prédéterminée(s) dans un mélange complexe de molécules organiques, notamment un mélange d’hydrocarbures, comprenant :
- des moyens de réception de données spectrométriques d’un nombre n d’échantillons de référence constitués par des mélanges complexes d’origine connue dont certains contiennent la(les) molécule(s) organique(s) prédéterminée(s), ces données spectrométriques étant acquises par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique des espèces contenues dans l’échantillon et comprenant au moins, un paramètre de masse représentatif de la masse de chaque espèce ionisée détectée par le spectromètre de masse, et, pour chaque masse détectée, une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée est détectée et la donnée d’intensité est représentative de l’intensité du signal correspondant détecté,
- des moyens de sélection, pour chaque échantillon de référence, des valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à une valeur d’intérêt du paramètre de masse correspondant à la masse de chaque molécule organique prédéterminée,
- des moyens de traitement des valeurs des données sélectionnées agencés pour :
- reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur d’intérêt du paramètre de masse de chaque échantillon de référence,
- calculer une valeur d’au moins un paramètre de forme représentatif de la forme de chaque courbe reconstruite choisi parmi le nombre de pics de la courbe et un paramètre représentatif de la forme de chaque pic choisi parmi l’abscisse au sommet, l’ordonnée au sommet, l’aire du pic, la largeur à mi-hauteur, l’aplatissement, l’asymétrie et tout autre paramètre caractéristique de la forme d’un pic,
- déterminer un intervalle de valeurs pour chaque paramètre de forme en dehors duquel une valeur du paramètre de forme est une valeur extrême, cet intervalle étant déterminé par application d’un test statistique sur les valeurs calculées du paramètre de forme pour chaque valeur d’intérêt du paramètre de masse pour l’ensemble des échantillons de référence ne contenant pas la(les) molécule(s) organique(s) ou pour la totalité des échantillons de référence,
- identifier les valeurs extrêmes des paramètres de forme associées à des échantillons de référence contenant la(les) molécule(s) organique(s) prédéterminée(s) et les ensembles {paramètres de masse ; paramètre de forme} correspondants à ces valeurs extrêmes et définir au moins un de ces ensembles en tant qu’ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s).
- Système d’analyse d’au moins un mélange complexe de molécules organiques, notamment un mélange d’hydrocarbures, contenant une(des) molécule(s) organique(s) prédéterminée(s), comprenant
- des moyens de réception de données spectrométriques d’au moins un mélange complexe à analyser et de mélanges complexes d’origine connue dont certains contiennent la(les) molécule(s) organique(s) prédéterminée(s), ces données spectrométriques étant acquises dans les mêmes conditions par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique des espèces contenues dans le mélange complexe et comprenant au moins un paramètre de masse représentatif de la masse de chaque espèce ionisée détectée par le spectromètre de masse, et, pour chaque masse détectée, une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée est détectée et la donnée d’intensité est représentative de l’intensité du signal correspondant détecté,
- des moyens de réception d’au moins un ensemble {paramètre de masse caractéristique; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s), notamment reçus du système de détermination de la revendication 1,
- des moyens de sélection, pour chaque mélange complexe, des valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à chaque valeur du paramètre de masse correspondant à un paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) prédéterminée(s),
- des moyens de traitement des valeurs des données sélectionnées agencés pour :
- reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur du paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) prédéterminée(s) de chaque mélange complexe,
- calculer la valeur du ou des paramètres de forme caractéristiques de la présence des molécules organiques de chaque courbe reconstruite,
- comparer les valeurs calculées pour chaque mélange complexe d’origine inconnue avec les valeurs calculées pour les mélanges complexes d’origine connue et en déduire une estimation de la présence ou l’absence des molécules organiques.
- Système d’analyse selon la revendication 2, caractérisé en ce que les moyens de traitement sont agencés de sorte que l’étape d)iii) de comparaison comprend :
- réaliser une analyse statistique multivariée sur les valeurs des ensembles {paramètre de masse caractéristique; paramètre de forme caractéristique} du mélange complexe d’origine inconnue et des mélanges complexes d’origine connue,
- comparer chaque mélange complexe d’origine inconnue en fonction de ses similitudes avec les mélanges complexes d’origine connue et en déduire une estimation de la présence ou l’absence des molécules organiques. - Système d’analyse selon la revendication 2 ou 3, caractérisé en ce que l’analyse statistique multivariée est choisie parmi une analyse en composantes principales, un séparateur à vaste marge, une analyse factorielle discriminante et un réseau de neurones artificiels.
- Dispositif d’analyse de mélanges complexes, comprenant :
- un spectromètre de masse couplé à au moins une technique de caractérisation isomérique,
- un système de détermination selon la revendication 1,
- un système d’analyse d’un mélange complexe selon l’une quelconque des revendications 2 à 4, connecté au système de détermination. - Méthode de détermination de la présence de molécule(s) organique(s) prédéterminée(s) dans un mélange complexe de molécules organiques, notamment un mélange d’hydrocarbures, par spectrométrie de masse couplée à au moins une technique de caractérisation isomérique, comprenant :
- la réception des données spectrométriques d’un nombre n d’échantillons de référence constitués par des mélanges complexes d’origine connue dont certains contiennent la(les) molécule(s) organique(s) prédéterminée(s), ces données spectrométriques étant acquises par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique des espèces contenues dans l’échantillon et comprenant au moins un paramètre de masse représentatif de la masse de chaque espèce ionisée détectée par le spectromètre de masse, et, pour chaque masse détectée, une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée est détectée et la donnée d’intensité est représentative de l’intensité du signal correspondant détecté,
- la sélection, pour chaque échantillon de référence, des valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à une valeur d’intérêt du paramètre de masse correspondant à la masse de chaque molécule organique dont on veut détecter la présence,
- le traitement des valeurs des données sélectionnées pour :
- reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur d’intérêt du paramètre de masse de chaque échantillon de référence,
- calculer une valeur d’au moins un paramètre de forme représentatif de la forme de chaque courbe reconstruite choisi parmi le nombre de pics de la courbe et un paramètre représentatif de la forme de chaque pic choisi parmi l’abscisse au sommet, l’ordonnée au sommet, l’aire du pic, la largeur à mi-hauteur, l’aplatissement, l’asymétrie et tout autre paramètre caractéristique de la forme d’un pic,
- déterminer un intervalle de valeurs pour chaque paramètre de forme en dehors duquel une valeur du paramètre de forme est une valeur extrême, cet intervalle étant déterminé par application d’un test statistique sur les valeurs calculées du paramètre de forme pour chaque valeur d’intérêt du paramètre de masse pour l’ensemble des échantillons de référence ne contenant pas la(les) molécule(s) organique(s) ou pour la totalité des échantillons de référence,
- identifier les valeurs extrêmes des paramètres de forme associées à des échantillons de référence contenant la(les) molécule(s) organique(s) prédéterminée(s) et les ensembles {paramètres de masse ; paramètre de forme} correspondants à ces valeurs extrêmes et définir au moins un de ces ensembles en tant qu’ ensemble(s) {paramètre de masse caractéristique; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s).
- Méthode d’analyse d’au moins un mélange complexe de molécules organiques notamment un mélange d’hydrocarbures, contenant une(des) molécule(s) organique(s) prédéterminée(s), comprenant :
- la réception de données spectrométriques d’au moins un mélange complexe à analyser et de mélanges complexes d’origine connue dont certains contiennent la(les) molécule(s) organique(s) prédéterminée(s), ces données spectrométriques étant acquises dans les mêmes conditions par un spectromètre de masse couplé à au moins une technique de caractérisation isomérique des espèces contenues dans le mélange complexe et comprenant au moins un paramètre de masse représentatif de la masse de chaque espèce ionisée détectée par le spectromètre de masse, et, pour chaque masse détectée, une pluralité d’ensembles {donnée temporelle ; donnée d’intensité} où la donnée temporelle est représentative de l’instant auquel cette espèce ionisée est détectée et la donnée d’intensité est représentative de l’intensité du signal correspondant détecté,
- la réception d’au moins un ensemble {paramètre masse caractéristique ; paramètre de forme caractéristique} caractéristique de la présence de la (des) molécule(s) organique(s) prédéterminée(s), notamment déterminés au moyen de la méthode de détermination de la revendication 6,
- la sélection, pour chaque mélange complexe, des valeurs des ensembles {donnée temporelle ; donnée d’intensité} associés à chaque valeur du paramètre de masse correspondant à un paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) prédéterminée(s),
- le traitement des valeurs des données sélectionnées pour :
- reconstruire une courbe représentant les valeurs des données d’intensité en fonction de la valeur de leur donnée temporelle pour chaque valeur du paramètre de masse caractéristique de la présence de(s) molécule(s) organique(s) prédéterminée(s) de chaque mélange complexe,
- calculer la valeur du ou des paramètres de forme caractéristiques de la présence des molécules organiques de chaque courbe reconstruite,
- comparer les valeurs calculées pour chaque mélange complexe d’origine inconnue avec les valeurs calculées pour les mélanges complexes d’origine connue et en déduire une estimation de la présence ou l’absence des molécules organiques.
- Méthode d’analyse selon la revendication 7, caractérisée en ce que l’étape d)iii de comparaison comprend :
- réaliser une analyse statistique multivariée sur les valeurs des ensembles {paramètre de masse caractéristique ; paramètre de forme caractéristique} du mélange complexe d’origine inconnue et des mélanges complexes d’origine connue,
- comparer chaque mélange complexe d’origine inconnue en fonction de ses similitudes avec les mélanges complexes d’origine connue et en déduire une estimation de la présence ou de l’absence des molécules organiques. - Méthode d’analyse selon la revendication 7 ou 8, caractérisée en ce que le traitement par analyse statistique multivariée est choisi parmi une analyse en composantes principales, un séparateur à vaste marge, une analyse factorielle discriminante et un réseau de neurones artificiels.
- Méthode d’analyse selon l’une quelconque des revendications 7 à 9, caractérisée en ce que l’au moins un mélange complexe d’origine inconnue et les mélanges complexes d’origine connue sont analysés à la suite les uns des autres, en particulier dans un ordre quelconque.
- Méthode d’analyse selon l’une quelconque des revendications 7 à 9, caractérisée en ce que l’au moins un mélange complexe d’origine inconnue et au moins un mélange complexe d’origine connue sont analysés à la suite les uns de l’autre, mais séparément et ultérieurement à l’analyse d’autres mélanges complexes d’origine connue.
- Méthode d’analyse selon l’une quelconque des revendications 7 à 11, caractérisée en ce que la (les) molécule(s) organique(s) prédéterminée(s) ont subi une réaction modifiant le nombre de ses (leurs) isomères.
- Méthode d’analyse selon l’une quelconque des revendications 7 à 12, caractérisée en ce que le mélange complexe est un mélange d’hydrocarbures issu du traitement d’un brut pétrolier.
- Méthode d’analyse selon l’une quelconque des revendications 7 à 13, caractérisée en ce que
les mélanges d’hydrocarbures d’origine connue sont classés en groupes distincts selon leur origine, par exemple selon la nature des traitements qu’ils ont subis, ces traitements pouvant comprendre un ou plusieurs traitement choisi parmi une distillation atmosphérique, une distillation sous vide, une réaction de conversion thermique sous couverture d'H2ou non, une réaction de craquage thermique sans H2, et tout autre procédé de conversion ou de raffinage, et en ce que l’étape (iv) de comparaison comprend en outre une classification du mélange d’origine inconnue dans l’un des groupes des mélanges d’hydrocarbures d’origine connue. - Programme d’ordinateur comprenant des portions de code de programme pour l’exécution des étapes de la méthode d’analyse selon l’une quelconque des revendications 7 à 14 et des étapes de la méthode de détermination selon la revendication 6, lorsque ledit programme est exécuté au moins par un système d’analyse.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1900992A FR3092399A1 (fr) | 2019-02-01 | 2019-02-01 | Analyse de melanges complexes, notamment d’hydrocarbures, par traitement statistique de donnees spectrometriques |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1900992A FR3092399A1 (fr) | 2019-02-01 | 2019-02-01 | Analyse de melanges complexes, notamment d’hydrocarbures, par traitement statistique de donnees spectrometriques |
FR1900992 | 2019-02-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
FR3092399A1 true FR3092399A1 (fr) | 2020-08-07 |
Family
ID=67185253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1900992A Pending FR3092399A1 (fr) | 2019-02-01 | 2019-02-01 | Analyse de melanges complexes, notamment d’hydrocarbures, par traitement statistique de donnees spectrometriques |
Country Status (1)
Country | Link |
---|---|
FR (1) | FR3092399A1 (fr) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090179147A1 (en) * | 2008-01-16 | 2009-07-16 | Milgram K Eric | Systems, methods, and computer-readable medium for determining composition of chemical constituents in a complex mixture |
CN101936973B (zh) * | 2009-06-30 | 2012-11-14 | 中国石油化工股份有限公司 | 气相色谱-质谱联用对烃类油品进行快速分类的方法 |
US20130187037A1 (en) * | 2007-07-11 | 2013-07-25 | Excellims Corporation | Parallel ion mass and ion mobility analysis |
-
2019
- 2019-02-01 FR FR1900992A patent/FR3092399A1/fr active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130187037A1 (en) * | 2007-07-11 | 2013-07-25 | Excellims Corporation | Parallel ion mass and ion mobility analysis |
US20090179147A1 (en) * | 2008-01-16 | 2009-07-16 | Milgram K Eric | Systems, methods, and computer-readable medium for determining composition of chemical constituents in a complex mixture |
CN101936973B (zh) * | 2009-06-30 | 2012-11-14 | 中国石油化工股份有限公司 | 气相色谱-质谱联用对烃类油品进行快速分类的方法 |
Non-Patent Citations (6)
Title |
---|
DOBLE P. ET AL: "Classification of premium and regular gasoline by gas chromatography/mass spectrometry, principal component analysis and artificial neural networks", FORENSIC SCIENCE INTERNATIONAL, vol. 132, no. 1, 1 March 2003 (2003-03-01), AMSTERDAM, NL, pages 26 - 39, XP055656558, ISSN: 0379-0738, DOI: 10.1016/S0379-0738(03)00002-1 * |
FARENC M. ET AL: "Effective Ion Mobility Peak Width as a New Isomeric Descriptor for the Untargeted Analysis of Complex Mixtures Using Ion Mobility-Mass Spectrometry", JOURNAL OF THE AMERICAN SOCIETY FOR MASS SPECTROMETRY, ELSEVIER SCIENCE INC, US, vol. 28, no. 11, 18 July 2017 (2017-07-18), pages 2476 - 2482, XP036550960, ISSN: 1044-0305, [retrieved on 20170718], DOI: 10.1007/S13361-017-1749-1 * |
KIND T. ET AL: "Advances in structure elucidation of small molecules using mass spectrometry", BIOANALYTICAL REVIEWS, vol. 2, no. 1-4, 21 August 2010 (2010-08-21), AUT, pages 23 - 60, XP055644154, ISSN: 1867-2086, DOI: 10.1007/s12566-010-0015-9 * |
LALLI P. M. ET AL: "Isomeric Separation and Structural Characterization of Acids in Petroleum by Ion Mobility Mass Spectrometry", ENERGY & FUELS, vol. 29, no. 6, 10 June 2015 (2015-06-10), WASHINGTON, DC, US., pages 3626 - 3633, XP055656227, ISSN: 0887-0624, DOI: 10.1021/acs.energyfuels.5b00503 * |
MATHILDE FARENC ET AL.: "Effective Ion Mobility Peak Width as a New Isomeric Descriptor for the Untargeted Analysis of Complex Mixtures Using Ion Mobility-Mass Spec-trometry", J. AM. SOC. MASS SPECTROM., 2017 |
PONTHUS J. ET AL: "Evaluating the Multiple Benefits Offered by Ion Mobility-Mass Spectrometry in Oil and Petroleum Analysis", INT. J. ION MOBIL. SPEC., vol. 16, no. 2, 1 January 2013 (2013-01-01), pages 95 - 103, XP002788328, Retrieved from the Internet <URL:https://link.springer.com/article/10.1007/s12127-013-0128-2> [retrieved on 20130306], DOI: 10.1007/S12127-013-0128-2 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Parsons et al. | Tile-based Fisher ratio analysis of comprehensive two-dimensional gas chromatography time-of-flight mass spectrometry (GC× GC–TOFMS) data using a null distribution approach | |
Weber et al. | Characterization of isotopic abundance measurements in high resolution FT-ICR and Orbitrap mass spectra for improved confidence of metabolite identification | |
Kaufmann | High‐resolution mass spectrometry for bioanalytical applications: is this the new gold standard? | |
US9791424B2 (en) | Use of windowed mass spectrometry data for retention time determination or confirmation | |
Hyung et al. | Gas-phase unfolding and disassembly reveals stability differences in ligand-bound multiprotein complexes | |
Klitzke et al. | Petroleomics by ultrahigh-resolution time-of-flight mass spectrometry | |
Herzog et al. | LipidXplorer: software for quantitative shotgun lipidomics compatible with multiple mass spectrometry platforms | |
US10818485B2 (en) | Multidimensional mass spectrometry data processing device | |
US7985948B2 (en) | Systems and methods for analyzing substances using a mass spectrometer | |
JP4704034B2 (ja) | クロマトグラフィ/分光測定データの解析でデータビンニングを用いる方法 | |
WO2018003011A1 (fr) | Dispositif d'analyse | |
Kaufmann | Strategy for the elucidation of elemental compositions of trace analytes based on a mass resolution of 100 000 full width at half maximum | |
Kim et al. | Automated electrospray ionization FT-ICR mass spectrometry for petroleum analysis | |
Meier et al. | Silver dopants for targeted and untargeted direct analysis of unsaturated lipids via infrared matrix‐assisted laser desorption electrospray ionization (IR‐MALDESI) | |
JP2016061670A (ja) | 時系列データ解析装置及び方法 | |
Gavard et al. | Rhapso: Automatic stitching of mass segments from Fourier transform ion cyclotron resonance mass spectra | |
CN113748339A (zh) | 实时峰检测 | |
Olanrewaju et al. | Characterization of deasphalted crude oils using gas chromatography–atmospheric pressure laser ionization–trapped ion mobility spectrometry–time-of-flight mass spectrometry | |
EP3218703B1 (fr) | Détermination de l'identité de composés modifiés | |
FR3092399A1 (fr) | Analyse de melanges complexes, notamment d’hydrocarbures, par traitement statistique de donnees spectrometriques | |
Wolters et al. | Enhancing data acquisition for the analysis of complex organic matter in direct‐infusion Orbitrap mass spectrometry using micro‐scans | |
CN107703243A (zh) | 用于代谢组学的气相色谱‑质谱分析处理方法和系统 | |
Bergmann et al. | Toward a More Comprehensive Approach for Dissolved Organic Matter Chemical Characterization Using an Orbitrap Fusion Tribrid Mass Spectrometer Coupled with Ion and Liquid Chromatography Techniques | |
Kaufmann | High mass resolution versus MS/MS | |
Chen et al. | Automated intensity descent algorithm for interpretation of complex high-resolution mass spectra |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20200807 |
|
RX | Complete rejection |
Effective date: 20210218 |