FR3109455A1 - Détermination d’états de santé de systèmes équipés de capteurs - Google Patents

Détermination d’états de santé de systèmes équipés de capteurs Download PDF

Info

Publication number
FR3109455A1
FR3109455A1 FR2003946A FR2003946A FR3109455A1 FR 3109455 A1 FR3109455 A1 FR 3109455A1 FR 2003946 A FR2003946 A FR 2003946A FR 2003946 A FR2003946 A FR 2003946A FR 3109455 A1 FR3109455 A1 FR 3109455A1
Authority
FR
France
Prior art keywords
sub
subsequences
sequence
group
subsequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR2003946A
Other languages
English (en)
Other versions
FR3109455B1 (fr
Inventor
Themis Palpanas
Michele LINARDI
Paul BONIOL
Federico RONCALLO
Mohammed Meftah
Emmanuel REMY
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electricite de France SA
Universite Paris Cite
Original Assignee
Electricite de France SA
Universite de Paris
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electricite de France SA, Universite de Paris filed Critical Electricite de France SA
Priority to FR2003946A priority Critical patent/FR3109455B1/fr
Priority to US17/229,899 priority patent/US11471113B2/en
Publication of FR3109455A1 publication Critical patent/FR3109455A1/fr
Application granted granted Critical
Publication of FR3109455B1 publication Critical patent/FR3109455B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7282Event detection, e.g. detecting unique waveforms indicative of a medical condition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • G01M99/005Testing of complete machines, e.g. washing-machines or mobile phones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Psychiatry (AREA)
  • Cardiology (AREA)
  • Physiology (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)

Abstract

Un procédé de détermination d’un état de santé d’un système d’intérêt est proposé. Le procédé comprend une obtention (S1) d’une série temporelle, une extraction (S2) de sous-séquences, une sélection (S3) d’un ensemble de sous-séquences, un classement (S4) des sous-séquences de l’ensemble en une pluralité de groupes sur la base d’au moins un critère de ressemblance avec au moins une sous-séquence de référence et une construction (S5) d’un modèle normal de fonctionnement du système d’intérêt. La construction comprend, pour chaque groupe, une modélisation (S51) d’une sous-séquence représentative et une détermination (S52) d’un poids associé. Le modèle normal est défini par les sous-séquences modélisées et les poids associés. Le procédé comprend en outre une attribution (S6) d’un score de normalité à chaque sous-séquence extraite par comparaison avec le modèle normal, une identification (S7) d’au moins une sous-séquence anormale, et une détermination (S8) de l’état de santé du système d’intérêt. Figure de l’abrégé : Figure 8

Description

Détermination d’états de santé de systèmes équipés de capteurs
La présente divulgation relève du domaine de la science des données.
Plus particulièrement, la présente divulgation porte sur des procédés de détermination d’état de santé de systèmes équipés de capteurs, ainsi que sur des programmes informatiques, des dispositifs de stockage lisibles par ordinateur et des circuits de traitement pour la mise en œuvre de tels procédés.
La surveillance d’un matériel en fonctionnement consiste à mettre en place un système qui rende compte en temps réel de l’état du matériel. Très classiquement, le matériel est équipé de capteurs, en particulier de capteurs numériques qui mesurent des paramètres physiques (un débit, une pression, une température, un nombre de battements par minute…).
Les mesures de ces capteurs peuvent donc être stockées et analysées, principalement sous forme de séries temporelles, qui sont des séquences de valeurs horodatées.
L’analyse de ces séries temporelles, en particulier la détection d’anomalie, permet donc de surveiller l’état du matériel et le cas échéant de lancer des alarmes lors d’une sortie du domaine de fonctionnement normal du matériel, pouvant avoir des conséquences sur l’exploitation comme des blocages de production, de l’usure prématurée ou autres.
La détection d’anomalies dans des séries temporelles de grande taille, typiquement dans des séries temporelles formées de données accumulées au cours de plusieurs années avec une granularité de l’ordre de la seconde, est un problème important trouvant des applications dans un grand nombre de domaines, incluant notamment :
- l’aéronautique, l’automobile et le ferroviaire, par exemple pour la surveillance du fonctionnement de véhicules,
- les villes et usines intelligentes, par exemple pour la prévision de consommation électrique,
- l’internet des objets, par exemple pour la détection de gestes et mouvements provenant d’une montre connectée,
- l’internet industriel des objets, par exemple pour la surveillance du fonctionnement d’un appareil ou d’un système industriel, tel que par exemple une ligne de production rassemblant plusieurs appareils, ou encore un site industriel tel qu’une usine ou un groupement de tel sites,
- les systèmes de contrôle tel que les systèmes SCADA, par exemple intégrés au sein de sites de production d’électricité,
- la santé, par exemple pour la surveillance d’un paramètre physiologique tel que l'activité cardiaque ou l’activité du sommeil,
- l’économie et la finance par exemple pour la détection des fraudes,
- les télécommunications et les systèmes d’information, par exemple pour la gestion de centres de données,
- la cybersécurité, par exemple pour la détection d’intrusions,
- les services web, par exemple pour l’analyse de sessions web utilisateur pour la détection de comportements nouveaux, et
- le droit, par exemple pour l’analyse des affaires judiciaires et la caractérisation d’éléments discriminants.
Il est alors souhaitable de détecter, parmi des échantillons de données issus d’une série temporelle, chaque échantillon étant formé d’une sous-séquence de valeurs horodatées extraites de la série temporelle, ceux s’écartant d’une norme et constituant ainsi des anomalies.
Plusieurs méthodes connues de détection d’anomalies peuvent être appliquées soit directement aux échantillons de données sans prétraitement préliminaire, soit en s’appuyant sur une représentation discrète de la série temporelle.
Il est en effet connu de définir un espace de représentation, utilisant un nombre minimal de variables, dans lequel les échantillons de données peuvent être représentés et classifiés. Différentes méthodes connues permettent de définir un tel espace de représentation, notamment les transformées de Fourier discrètes, les transformées par ondelettes, les décompositions en valeurs singulières en utilisant une analyse en composantes principales, les approximations par fonctions linéaires par morceaux telles que SAX, etc. Ces méthodes permettent de transformer chaque échantillon de données obtenu en un jeu de n valeurs. Il est ainsi possible de représenter graphiquement l’ensemble des échantillons de données sous la forme d’un nuage de points dans un espace à n dimensions, chaque point correspondant à un échantillon de données. La ressemblance entre deux échantillons de données peut être exprimée comme la distance euclidienne entre les deux points correspondant à ces deux échantillons dans l’espace à n dimensions. Plus cette distance est faible, plus les deux échantillons sont ressemblants.
Une méthode de détection d’anomalie connue consiste à détecter les échantillons de données dont la distance euclidienne avec leur plus proche voisin dans l’espace à n dimensions est la plus grande. Cette méthode s’appuie sur la notion de discord. La notion de discord d’une série temporelle T est définie comme suit. Parmi toutes les sous-séquences de taille ℓ dans T, le discord de T est la sous-séquence Ti,ℓqui a la distance la plus grande avec son plus proche voisin. Formellement, le plus proche voisin est défini comme suit :. Le discord est donc défini comme suit :. Une illustration de cette définition est représentée sur la figure 1. Sur cette figure, un point symbolise une sous-séquence de T. Trois groupes de sous-séquences y sont représentés de même qu’une sous-séquence isolée Ti,ℓ. Même si l’information que la notion de discord apporte est utile et intéressante dans certains cas d’usage, les approches l’utilisant échouent dès lors que la série temporelle d’intérêt contient plusieurs échantillons anormaux similaires. Ici, seules les sous-séquences anormales isolées, comme la sous-séquence Ti,ℓpeuvent être détectées par leur distance diavec leur plus proche voisin. Des anomalies récurrentes Tj,ℓou Tk,ℓayant une distance djou dkrelativement faible avec leur plus proche voisin restent indétectées.
La notion de mthDiscord a été proposée pour résoudre ce problème. La notion de mthDiscord d’une série temporelle T est définie comme suit. Parmi toutes les sous-séquences de taille ℓ dans T, le mthDiscord de T est la sous-séquence Ti,ℓqui a la distance la plus grande avec son mièmeplus proche voisin. Une illustration de cette définition est représentée sur la figure 2. Sur cette figure, un point symbolise une sous-séquence de T. Comme sur la figure 1, trois groupes de sous-séquences y sont représentés de même qu’une sous-séquence isolée Ti,ℓ. Si le 3rdDiscord de T, c’est-à-dire la distance entre chaque sous-séquence et son troisième plus proche voisin, est retenu comme paramètre définissant une anormalité d’une sous-séquence, alors chaque sous-séquence isolée Ti,ℓ, chaque paire isolée de sous-séquences et chaque triplet isolé Tk,ℓde sous-séquences sont détectés comme anomalies par leur distance di,3, dk,3. En revanche, les groupes de sous-séquences Tj,ℓcomprenant plus de trois sous-séquences, donc ayant une distance dj,3relativement faible avec leur troisième plus proche voisin, ne sont pas détectés comme anomalies.
Les deux notions précédentes peuvent être regroupées dans la notion de Top k mthDiscord, définie comme suit. Une sous-séquence Ti,ℓest le Top k mthDiscord de T si celle-ci a la kièmedistance la plus grande avec son mièmeplus proche voisin. Par conséquent, le discord de T est également le Top 1 1thDiscord. De plus, mthDiscord de T se note Top 1 mthDiscord. De manière générale, les méthodes connues s’appuyant sur la notion de mthDiscord ont pour but de chercher les sous-séquences ayant le mièmeplus proche voisin le plus éloigné. Cependant, ces méthodes se trouvent être très sensibles au changement de valeur du paramètre m. De petites variations de ce paramètre peuvent causer l’apparition de faux positifs, c’est-à-dire de sous-séquences détectées comme anormales alors qu’elles ne le sont pas.
Les méthodes précédemment citées ne permettent pas de couvrir tous les cas possibles de détection d’anomalies. Dans le cas où le nombre d’anomalies n’est pas connu (en outre la majorité des cas, dont ceux concernant la détection de défaillance matérielle de capteurs dans leur historique de fonctionnement), et dans le cas où les anomalies se répètent (et donc chaque anomalie possédant un très proche voisin), les méthodes utilisant ces définitions ne fonctionnent pas de manière optimale. Elles présentent soit des difficultés à fournir une réponse fiable (avec un taux faible de détections correctes), ou nécessitent un temps de calcul élevé.
D’autres méthodes relevant du domaine de la détection de valeurs aberrantes, pas spécifiquement dédié au domaine des séries temporelles, sont connues. Des méthodes basées sur le facteur local aberrant (l’expression en anglais « Local Outlier Factor » (LOF) est fréquemment utilisée) sont des exemples de telles méthodes connues. De manière similaire aux méthodes utilisant le mthDiscord, les méthodes basées sur le facteur local aberrant comprennent une étape de calcul d’un degré mesurant la densité du voisinage de chaque sous-séquence. Cette méthode exige un paramètre k indiquant le nombre de voisins à considérer pour mesurer la densité du voisinage.
De même, d’autres méthodes connues visent à évaluer l’isolement de chaque sous-séquence. Cet isolement est mesuré en construisant des arbres binaires aléatoires divisant l’espace des sous-séquences de la série temporelle en question en deux à chaque nœud, jusqu’à obtenir seulement une sous-séquence dans chaque zone de l’espace. La profondeur de l’arbre est utilisée pour construire un score indiquant les sous-séquences considérées anormales. Plus la profondeur pour atteindre la sous-séquence à évaluer est grande, plus la sous-séquence en question est considérée comme normale. Réciproquement, plus la profondeur est courte, plus la sous-séquence sera considérée anormale. Dans le but d’homogénéiser et stabiliser le score, plusieurs arbres aléatoires sont construits et un score moyen est établi.
Comme indiqué précédemment, ces méthodes ne sont pas spécifiquement dédiées aux sous-séquences de séries temporelles, celles-ci échouent donc dans certains cas testés lors de notre évaluation expérimentale. Ne pas pouvoir détecter tous les types d’anomalies est préjudiciable car l’état du système étudié n’est alors pas précisément surveillé. Ainsi, la capacité de prédiction d’une usure prématurée, d’une défaillance ou d’une dégradation s’en trouve affectée négativement.
Finalement, des solutions utilisant des méthodes d’apprentissage machine profond, plus particulièrement des réseaux de neurones récurrents, désignés par l’expression en anglais « Long Short Term Memory », ont été récemment proposées. Un inconvénient de ces méthodes est que le taux de détection correcte n’est optimisé qu’à la condition que des exemples de sous-séquences normales, voire dans certains cas des exemples de différents types d’anomalies soient préalablement fournis et identifiés comme tels. Ces méthodes nécessitent donc une supervision préalable, ce qui représente un frein à leur diffusion.
Les approches qui ont été proposées jusqu'à présent dans la littérature pour la détection d’anomalies dans des séries temporelles, par exemple issues de capteurs, rassemblant des mesures d’un paramètre physique au cours du temps ont de sérieuses limites : soit elles requièrent des connaissances préalables du domaine, soit elles deviennent lourdes et coûteuses à utiliser dans des situations où des anomalies récurrentes du même type se présentent.
Il existe donc un besoin de pouvoir détecter un grand nombre de type d’anomalies de fonctionnement de manière générique et scalable, adaptable à la surveillance de tout système équipé d’un capteur apte à mesurer une valeur indicative d’un état de fonctionnement courant du système. Il est souhaitable que la détection soit fiable, c’est-à-dire que les anomalies de fonctionnement comme les fonctionnements normaux soient correctement identifiés comme tels. Il est, de plus, souhaitable que la détection ne nécessite aucune supervision.
Résumé
La présente divulgation vient améliorer la situation.
Il est proposé un procédé de détermination d’un état de santé d’un système d’intérêt équipé d’un capteur, le procédé comprenant :
- une obtention d’une série temporelle formée d’une séquence de mesures issues du capteur en fonction du temps,
- une extraction d’une pluralité de sous-séquences à partir de la série temporelle, chaque sous-séquence extraite étant formée d’une pluralité de mesures, consécutives dans le temps, extraites de ladite séquence de mesures,
- une sélection d’un ensemble de sous-séquences, l’ensemble formant une partie de la pluralité de sous-séquences extraites,
- un classement des sous-séquences de l’ensemble sélectionné en une pluralité de groupes de sous-séquences sur la base d’au moins un critère de ressemblance entre chaque sous-séquence de l’ensemble sélectionné et au moins une sous-séquence de référence,
- une construction d’un modèle normal de fonctionnement du système d’intérêt, la construction comprenant, pour chaque groupe de sous-séquences, une modélisation d’une sous-séquence représentative des sous-séquences dudit groupe et une détermination d’un poids associé à la sous-séquence modélisée par comparaison d’une répartition collective des sous-séquences formant ledit groupe avec une répartition collective de référence, le modèle normal de fonctionnement du système d’intérêt étant défini par les sous-séquences modélisées et les poids associés,
- une attribution d’un score de normalité à chaque sous-séquence extraite sur la base d’une comparaison entre ladite sous-séquence extraite et le modèle normal de fonctionnement du système d’intérêt,
- une identification d’au moins une sous-séquence anormale, indiquant une anomalie de fonctionnement du système d’intérêt, sur la base des scores de normalité attribués, et
- sur la base de ladite au moins une sous-séquence anormale identifiée, une détermination de l’état de santé du système d’intérêt.
Les capteurs rendant compte de l’état du matériel, un objectif visé est donc de pouvoir surveiller le fonctionnement d’un matériel (ou plus largement d’un sujet, par un exemple un humain en médecine). La détection de possibles anomalies renseigne donc sur l’état de santé du matériel et peut avoir comme conséquence l’activation d’alarmes pouvant nécessiter une action de correction ou de réparation a posteriori. Cela peut aussi aider à accroître la connaissance sur les différents modes de fonctionnement du matériel, que ces modes de fonctionnement soient déjà connus ou non.
Un objectif visé est de détecter des anomalies de mesure d’un capteur pour déterminer un état de santé du capteur. L’état de santé ainsi déterminé peut donner lieu à des alertes et peut entraîner des actions de correction de mesures, de réparation du capteur, de prédiction ou anticipation d’un besoin de maintenance du capteur, d’enrichissement d’une base de données relative au fonctionnement de capteurs de même type…
Le procédé proposé s’appuie sur la construction d’un modèle normal de fonctionnement et sur son utilisation pour détecter des anomalies. Il a été constaté de manière surprenante que les avantages du procédé proposé, par rapport aux méthodes connues basées sur la notion de discord ou de nthdiscord, sont :
  1. une meilleure fiabilité,
  2. un temps de calcul réduit ce qui entraîne une meilleure scalabilité, et
  3. le fait que la méthode est agnostique, ne nécessitant aucune supervision ni aucune connaissance préalable des plages de fonctionnement normal, ce qui permet des applications industrielles dans des domaines techniques variés.
Les caractéristiques exposées dans les paragraphes suivants peuvent, optionnellement, être mises en œuvre. Elles peuvent être mises en œuvre indépendamment les unes des autres ou en combinaison les unes avec les autres :
Dans un exemple, le procédé comprend, conjointement à la sélection, une exclusion dans laquelle chaque sous-séquence dont une proportion excédant un seuil prédéterminé se retrouve intégralement dans au moins une autre sous-séquence est écartée de l’ensemble sélectionné. Ainsi, tout biais lié à une prise en compte redondante d’une même portion d’une série temporelle est évité.
Dans un exemple, la sélection est une sélection aléatoire de sous-séquences parmi la pluralité de sous-séquences. Une telle sélection aléatoire présente l’avantage de nécessiter un temps de calcul minimal, sans pour autant s’avérer préjudiciable à la qualité de la détection d’anomalies dans des grandes séries temporelles, d’après des premiers tests expérimentaux.
Dans un exemple, la sélection est basée sur une comparaison des sous-séquences de la pluralité de sous-séquences entre elles, l’ensemble étant formé de sorte que chaque sous-séquence de l’ensemble présente un degré de ressemblance excédant un seuil prédéterminé avec au moins une autre sous-séquence de l’ensemble. Une telle sélection permet de forcer la formation de groupes entres sous-séquences statistiquement plus ressemblantes que la moyenne des sous-séquences extraites, donc facilite l’identification pertinente de types récurrents de comportements du système d’intérêt.
Dans un exemple, le critère de ressemblance entre une sous-séquence donnée A et une sous-séquence de référence B résulte :
- d’une détermination d’une distance dist(A, B) entre la sous-séquence donnée et la sous-séquence de référence, la distance dist(A, B) étant définie comme
, où Ai,1et Bi,1désignent une première mesure dans le temps, µAet µBdésignent une moyenne et σAet σBdésignent un écart-type de la première sous-séquence A et de la deuxième sous-séquence B respectivement, et
- d’une comparaison de la distance déterminée avec une valeur de référence.
Une telle distance, normalisée, permet de quantifier la ressemblance entre deux sous-séquences. Il est également possible par exemple de classer différentes sous-séquences par ordre de plus grande ressemblance avec une sous-séquence de référence.
Dans un exemple, le classement est basé sur un regroupement hiérarchique des sous-séquences de l’ensemble, le regroupement hiérarchique étant effectué en répétant l’enchaînement suivant jusqu’à ce qu’un critère d’arrêt soit atteint :
- déterminer, pour chaque paire de sous-séquences de l’ensemble, un degré de ressemblance,
- former un groupe de niveau i, où i représente le nombre de sous-séquences de l’ensemble, sur la base du critère de ressemblance de sorte que le groupe de niveau i consiste en la paire de sous-séquences de l’ensemble dont le degré de ressemblance déterminé est le plus élevé,
- générer une sous-séquence représentative dudit groupe de niveau i, intermédiaire entre les sous-séquences dudit groupe de niveau i, et
- réduire l’ensemble en remplaçant la paire de sous-séquences formant ledit groupe de niveau i par la sous-séquence générée représentative dudit groupe de niveau i.
Ainsi, il est possible de représenter toutes les sous-séquences de l’ensemble par un dendrogramme à n niveaux, où le passage d’un niveau i à un niveau i+1 correspond à une réduction de l’ensemble d’une unité, par remplacement d’une paire de sous-séquences par une sous-séquence générée la représentant.
Dans un exemple, lors de chaque itération de l’enchaînement, avant d’effectuer chaque réduction de l’ensemble, les sous-séquences formant l’ensemble sont encodées et la taille mémoire totale des sous-séquences encodées est déterminée, et le critère d’arrêt est basé sur une comparaison de la taille mémoire totale déterminée pour deux itérations consécutives de l’enchaînement. Ainsi, la taille de chaque groupe est choisie de manière à rassembler en un même groupe des sous-séquences indiquant un même mode de fonctionnement normal récurrent du capteur. Par ailleurs, les besoins matériels en termes d’espace mémoire requis pour la mise en œuvre du procédé sont optimisés.
Dans un exemple, au cours de la modélisation d’une sous-séquence représentative des sous-séquences dudit groupe, la sous-séquence modélisée est intermédiaire entre les sous-séquences dudit groupe. Par exemple, la sous-séquence modélisée peut être l’isobarycentre des sous-séquences d’origine formant le groupe, donc être équireprésentative des sous-séquences dudit groupe. Ainsi, la sous-séquence modélisée représentative d’un groupe de sous-séquences correspondant à un comportement type du système d’intérêt peut éventuellement être vue comme un signal moyen, type, ou débruité correspondant à ce comportement type.
Dans un exemple, le poids de chaque groupe est basé sur le nombre de sous-séquences formant ledit groupe. En effet, plus le nombre de sous-séquences formant un groupe donné est récurrent, plus le comportement associé du système d’intérêt est récurrent.
Dans un exemple, le poids de chaque groupe est basé sur une couverture temporelle dudit groupe. En d’autres termes, chaque sous-séquence extraite ayant un indice temporel, le poids de chaque groupe est ici basé sur les indices des sous-séquences formant ledit groupe. Plus la différence entre l’indice maximal et l’indice minimal des sous-séquences formant le groupe est importante, plus les sous-séquences formant le groupe représentent un comportement récurrent du système d’intérêt sur une longue période.
Dans un exemple, le poids de chaque groupe est basé sur une centralité dudit groupe par rapport à la pluralité de groupes. En d’autres termes, un comportement récurrent donné du système d’intérêt est considéré d’autant plus central qu’il est similaire à un maximum d’autres comportements récurrents du système d’intérêt.
Dans un exemple, le score de normalité d’une sous-séquence donnée est obtenu sur la base d’une comparaison de la sous-séquence donnée avec chaque sous-séquence du modèle normal et sur la base d’une pondération des résultats desdites comparaisons par les poids respectifs associés à chaque sous-séquence du modèle normal. Il a été constaté de manière surprenante que l’association de cette comparaison et de cette pondération permet d’accroître davantage la pertinence de la détection de comportements atypiques, ou statistiquement anormaux, par rapport à d’autres méthodes connues.
Dans un exemple, l’état de santé déterminé est utilisé pour générer une alerte indiquant une défaillance du système d’intérêt. Une telle alerte peut comprendre par exemple l’émission d’un signal visuel, d’un signal auditif ou d’un signal de commande du système d’intérêt.
Dans un exemple, l’état de santé déterminé est utilisé pour corriger des mesures ultérieurement reçues du capteur. Une telle correction permet de compenser une dérive constatée du capteur alors que le système d’intérêt ne présente aucune anormalité par ailleurs.
Dans un exemple, l’état de santé déterminé est utilisé pour prédire une évolution ultérieure de l’état de santé du système d’intérêt. Une telle prédiction peut être utile par exemple dans le cadre d’une programmation d’actions de maintenance.
Dans un exemple, l’état de santé déterminé est utilisé pour alimenter une base de données d’états de santé de systèmes d’un type similaire au système d’intérêt. En effet, l’état de santé déterminé pour un système d’intérêt donné peut être comparé à des états de santé déterminés de manière similaire pour une flotte de systèmes d’intérêt.
Il est également proposé un programme informatique comportant des instructions pour la mise en œuvre du procédé ci-avant lorsque ce programme est exécuté par un processeur.
Il est également proposé un support d’enregistrement non transitoire lisible par un ordinateur sur lequel est enregistré un programme pour la mise en œuvre du procédé ci-avant lorsque ce programme est exécuté par un processeur.
Il est également proposé un circuit de traitement comprenant un processeur connecté au support d’enregistrement non transitoire ci-avant.
D’autres caractéristiques, détails et avantages apparaîtront à la lecture de la description détaillée ci-après, et à l’analyse des dessins annexés, sur lesquels :
Fig. 1
représente graphiquement un exemple connu de détection d’anomalie pour un exemple de répartition de sous-séquences.
Fig. 2
représente graphiquement un autre exemple connu de détection d’anomalie pour un exemple de répartition de sous-séquences.
Fig. 3
représente graphiquement une détection d’anomalie dans un exemple particulier de réalisation, pour le même exemple de répartition de sous-séquences.
Fig. 4
représente un regroupement de sous-séquences, dans un exemple particulier de réalisation, en vue de la construction d’un modèle normal de fonctionnement d’un système.
Fig. 5
représente, dans un exemple particulier de réalisation, une détection d’anomalie de fonctionnement d’un système s’appuyant sur une comparaison de sous-séquences avec un modèle normal de fonctionnement dudit système.
Fig. 6
représente, dans un autre exemple particulier de réalisation, une détection d’anomalie de fonctionnement d’un système s’appuyant sur une comparaison de sous-séquences avec un modèle normal de fonctionnement dudit système.
Fig. 7
illustre schématiquement la structure d’un circuit de traitement, dans un exemple particulier de réalisation, pour la mise en œuvre du procédé de détermination proposé.
Fig. 8
représente un ordinogramme d’un algorithme général d’un programme informatique, dans un exemple particulier de réalisation, pour la mise en œuvre du procédé de détermination proposé.
Les dessins et la description ci-après contiennent, pour l’essentiel, des éléments de caractère certain. Ils pourront donc non seulement servir à mieux faire comprendre la présente divulgation, mais aussi contribuer à sa définition, le cas échéant.
De nombreux systèmes sont équipés de capteurs permettant de mesurer des grandeurs indicatives de leur fonctionnement sous la forme de séries temporelles qui sont des séquences de valeurs horodatées.
Par exemple, dans un site industriel, une pompe est équipée d’un capteur de débit rendant compte de la vitesse de sortie d’un fluide. En médecine, on peut équiper un patient d’un appareil électrocardiographe pour rendre compte de l’activité cardiaque (en particulier le rythme cardiaque).
Ces systèmes peuvent être équipés de circuits de traitement permettant de stocker et de traiter les mesures localement. Avec l’émergence des systèmes dits intelligents et communicants, il est de plus possible de transmettre les mesures acquises à un circuit de traitement distant en vue d’un traitement centralisé. Le traitement des mesures acquises peut permettre de qualifier le fonctionnement du système considéré.
Par exemple, en considérant comme système un appareil industriel devant suivre un cycle de température préprogrammé et en considérant comme capteur associé une sonde de température, un objectif peut être de détecter sur la base de mesures de température par le capteur si l’appareil industriel fonctionne correctement. Idéalement, cette détection est mise en œuvre automatiquement et sans connaissance préalable du cycle de température préprogrammé.
Par exemple, en considérant comme système une personne ou un animal et en considérant comme capteur associé un électrocardiographe, un objectif peut être de détecter sur la base d’électrocardiogrammes si l’activité électrique du cœur de la personne ou de l’animal est normale. Idéalement, cette détection est mise en œuvre automatiquement et sans supervision, notamment sans fournir au préalable d’exemples d’électrocardiogrammes normaux ou d’électrocardiogrammes présentant des caractéristiques anormales.
Un exemple d’un tel circuit de traitement est représenté sur la figure. Le circuit de traitement représenté comporte un processeur PROC (100) raccordé à un support d’enregistrement non transitoire MEM (200) sur lequel est enregistré un programme pour la mise en œuvre d’un procédé tel que décrit ci-après lorsque ce programme est exécuté par le processeur PROC (100).
On se réfère à présent à la figure 8 qui illustre un exemple de réalisation d’un procédé de détermination d’un état de santé d’un système d’intérêt équipé d’un capteur. Dans cet exemple, le système d’intérêt est le réseau routier d’une ville. Le capteur est un compteur d’un nombre de courses assurées par l’ensemble des taxis circulant dans le réseau routier de la ville.
Une série temporelle T, formée d’une séquence de mesures issues du capteur en fonction du temps, est obtenue OBT T (S1). Ici, la série temporelle obtenue est un historique de mesures horodatées, espacées d’un intervalle de temps régulier, chaque mesure correspondant au nombre de courses assurées au cours de l’intervalle de temps précédent. La taille de la série temporelle T, c’est-à-dire le nombre total de points de mesure, est notée |T|. La série temporelle ainsi obtenue est ensuite traitée afin de déterminer, en tant qu’« état de santé du système d’intérêt », si le trafic routier est normal ou anormal au cours d’une période temporelle donnée au regard du trafic routier habituel.
Il est à noter que, bien évidemment, dans diverses applications industrielles, de nombreux systèmes d’intérêt sont équipés d’une pluralité de capteurs et configurés pour obtenir de chaque capteur une série temporelle. Bien que le procédé de détermination permette de traiter, ensemble ou séparément, plusieurs séries temporelles, il est considéré dans cet exemple de réalisation, pour des raisons de simplicité, le traitement d’une seule série temporelle afin de déterminer l’état de santé d’un système d’intérêt.
Plusieurs sous-séquences Ti,ℓ(300) sont extraites EXTR Ti,ℓ(S2) à partir de la série temporelle T. Les sous-séquences Ti,ℓ(300) extraites sont des sous-ensembles de points de mesure consécutives au sein de la série temporelle. Chaque sous-séquence Ti,ℓcommence à l’indice i, soit au ièmepoint de T, et contient les ℓ points qui suivent. Par conséquent, une sous-séquence Ti,ℓdonnée a pour taille ℓ et un simple point de T peut être vu comme une sous-séquence de taille 1. Par exemple le point de la série temporelle T ayant pour indice i peut être alternativement noté Ti,1, ou Ti.
Dans l’exemple considéré, chaque sous-séquence ainsi extraite peut correspondre à un nombre fixe de mesures consécutives, par exemple de l’ordre de 10, 20, 50 ou 100 mesures, au sein d’une séquence temporelle couvrant plusieurs mois ou années, avec un pas de mesure par exemple de l’ordre de quinze minutes, trente minutes ou une heure.
A ce stade, un prétraitement des sous-séquences extraites peut être effectué pour rendre l’information contenue dans les sous-séquences moins redondante et, éventuellement pour réduire le nombre de variables. Par exemple, il est possible d’effectuer une analyse en composantes principales des sous-séquences de l’ensemble. En effet, chaque sous-séquence Ti,ℓextraite a une longueur ℓ correspondant à ℓ mesures du nombre de courses de taxi au cours de ℓ intervalles de temps consécutifs. Il est possible d’établir des corrélations entre ces ℓ mesures.
Le prétraitement permet de déterminer un jeu de nouvelles variables expliquant au mieux la variabilité des mesures entre différentes sous-séquences extraites. Ainsi, par le prétraitement, chaque sous-séquence Ti,ℓextraite est transformée en une sous-séquence, formée de jusqu’à ℓ valeurs décorrélées, ou composantes principales, obtenues à partir des ℓ mesures d’origine. Le prétraitement peut inclure une normalisation des sous-séquences transformées afin d’en fixer la moyenne et l’écart-type à des valeurs prédéfinies. La normalisation facilite le traitement informatique ultérieur des sous-séquences.
Dans cet exemple, compte tenu des variations habituelles du trafic routier en fonction de l’heure de la journée ou du jour de la semaine, la série temporelle T obtenue est susceptible de comprendre des sous-séquences Ti,ℓrécurrentes. Ainsi, pouvoir correctement identifier à la fois des sous-séquences récurrentes correspondant à différents types de trafic normal correspondant à différents moments d’une journée ou d’une semaine type et des sous-séquences inhabituelles permet de valider de manière générale l’efficacité de la méthode de détection d’anomalies proposée par rapport à d’autres méthodes, connues, de détection d’anomalies.
Un échantillon de sous-séquences est sélectionné, l’échantillon comprenant idéalement tous les comportements récurrents, donc toutes les sous-séquences récurrentes, de la série temporelle T. Pour cela, certaines des sous-séquences extraites sont sélectionnées SEL Ti,ℓ(S3) et forment un ensemble de sous-séquences.
La sélection peut être par exemple aléatoire. Ainsi, un certain pourcentage r de sous-séquences Ti,ℓde T est sélectionné aléatoirement (ce pourcentage r étant par exemple fixé à 20%). Un tel mode de sélection n’offre aucune garantie sur la récurrence des sous-séquences sélectionnées. Cependant, pour les séries temporelles de grande taille, il est très probable que la sélection faite soit représentative de la réelle distribution des différents comportements / sous-séquences. Expérimentalement, cette hypothèse est vérifiée. De plus, la taille de cette sélection est radicalement plus faible que celle de la série temporelle T.
Alternativement, la sélection peut être effectuée sur la base d’un critère discriminant. Un critère discriminant basé sur un auto-appariement de la série temporelle T peut être défini à titre d’exemple. A cet effet, les notions mathématiques de moyenne empirique, écart-type, distance, appariement et auto-appariement sont définies ci-après dans le contexte des séries temporelles.
La moyenne empirique de la série temporelle T est donnée par.
L’écart-type de la série temporelleest donné par.
La distance entre deux séries temporelles (notées et et de taille égale) est donnée par.
L’appariement entre les deux séries temporelles A et B est le résultat du calcul de NN(Ai,ℓ,B) dans B pour chaque sous-séquence Ai,ℓde A. Formellement,.
L’auto-appariement de la série temporelle T est le résultat du calcul de NN(Ti,ℓ,T) dans T pour chaque sous-séquence Ti,ℓde T. Formellement,.
Dans l’exemple évoqué de sélection basé sur un critère discriminant, l’auto-appariementde la série temporelle T est déterminé, et toutes les sous-séquences Ti,ℓremplissant le critère discriminant Si< ∈ sont sélectionnées, ∈ étant un paramètre fixé à la valeur. Les sous-séquences ainsi sélectionnées ont un plus proche voisin ayant une distance inférieure à la moyenne. En d’autres termes, dans cet exemple, chaque sous-séquence ainsi sélectionnée présente un degré de ressemblance, ici une distance, excédant un seuil prédéterminé, ici une distance moyenne, avec au moins une autre sous-séquence de l’ensemble, ici le plus proche voisin. Ce mode de sélection facilite la présence de groupes de sous-séquences similaires, ces groupes étant susceptibles d’être représentatifs des récurrences de la série temporelle. Cependant, ce mode de sélection nécessite un temps de calcul quadratique.
Il peut être en outre prévu d’exclure EXCL Ti,ℓ(S31) de la sélection certaines sous-séquences. Par exemple, si deux séquences se chevauchent trivialement, alors il peut être prévu d’exclure l’une de ces deux sous-séquences. Ainsi, chaque sous-séquence dont une proportion excédant un seuil prédéterminé se retrouve intégralement dans au moins une autre sous-séquence est écartée de l’ensemble sélectionné. Par exemple, il est possible de considérer que deux sous-séquences Ti,ℓet Tj,ℓde T se chevauchent trivialement si et seulement si |i-j| < ℓ/2. Eviter la sélection de sous-séquences se chevauchant trivialement permet de garantir que les sous-séquences sélectionnées sont récurrentes à l’échelle de l’ensemble de la série temporelle T, donc potentiellement représentatives du fonctionnement normal du système d’intérêt.
La sélection SEL Ti,ℓ(S3) et l’exclusion EXCL Ti,ℓ(S31) précitées sont indépendantes et peuvent être effectuées dans n’importe quel ordre ou conjointement.
A l’issue de la sélection SEL Ti,ℓ(S3) et, le cas échéant, de l’exclusion EXCL Ti,ℓ(S31) de sous-séquences, un ensemble de sous-séquences est obtenu. Cet ensemble peut être réaligné, par exemple à l’aide d’une méthode de cross-corrélation ou de simples alignements des valeurs maximales et minimales. Ce réalignement est non-discriminant et demande une complexité en temps de calcul négligeable au regard de la mise en œuvre de l’ensemble du procédé de détection d’anomalie.
Il est à présent fait référence à la figure 3, qui illustre schématiquement un exemple de répartition d’un ensemble de sous-séquences sélectionné à partir d’une pluralité de sous-séquences extraites de la série temporelle T. Pour des raisons de simplicité, les sous-séquences de l’ensemble sont normalisées et représentées en fonction de deux composantes principales. Ainsi, chaque sous-séquence de l’ensemble est représentée par un point dans un repère orthonormal d’un plan. Un avantage de cette représentation est que, plus la distance euclidienne entre deux de ces points est faible, plus les deux sous-séquences correspondantes sont similaires. De manière générale, les sous-séquences peuvent être représentées dans un repère à d dimensions, où d désigne le nombre de composantes principales retenues.
Il est proposé de classer CLASS SEL (S4) les sous-séquences de l’ensemble sélectionné en une pluralité de groupes de sous-séquences sur la base d’au moins un critère de ressemblance entre chaque sous-séquence de l’ensemble sélectionné et au moins une sous-séquence de référence.
Sur la figure 3, six groupes de sous-séquences sont représentés, soit, respectivement :
  • trois groupes (101, 102, 103) correspondant à trois différents types de sous-séquences pouvant être identifiés comme normaux, ces trois groupes pouvant ainsi être rassemblés en un seul groupe (100) pouvant être identifié comme un groupe de sous-séquences normales, et
  • trois groupes (201, 202, 203), chaque groupe comprenant un nombre différent de sous-séquences, ces trois groupes correspondant à trois différents types de sous-séquences pouvant être identifiés comme anormaux.
Différentes méthodes connues de classement automatique, ou « clustering », permettent d’identifier ces différents groupes de sous-séquences, sans présomption sur la normalité ou l’anormalité des groupes ainsi formés ou des sous-séquences les formant.
Il est à présent fait référence à la figure 4, qui illustre schématiquement un exemple de méthode de classement automatique proposée. Le classement est ici hiérarchique avec un couplage total. Le classement s’appuie sur la notion introduite ci-avant de distance dist(A,B) entre sous-séquences. Plus particulièrement, cette distance correspond, dans cet exemple, à la distance euclidienne entre les points représentant les différentes sous-séquences sur la figure 3.
Les sous-séquences sélectionnées (300) peuvent être toutes comparées les unes aux autres afin de déterminer DET DEG (S41), pour chaque paire de sous-séquences de l’ensemble, un degré de ressemblance. Les deux sous-séquences sélectionnées ayant le plus haut degré de ressemblance peuvent être rassemblées, formant FORM GRP (S42) un groupe de niveau 1. En l’occurrence, il s’agit des deux sous-séquences A et B ayant la distance dist(A,B) la plus faible.
Ce groupe de niveau 1 peut être identifié par une sous-séquence AB, générée GEN SS SEQ (S43) de manière à être représentative du groupe et intermédiaire entre les sous-séquences A et B. En d’autres termes, selon une composante principale donnée, la valeur de la sous-séquence AB est calculable comme étant intermédiaire entre la valeur correspondante de la sous-séquence A et la valeur correspondante de la sous-séquence B. Les valeurs de la sous-séquence AB selon chaque composante principale sont calculables comme étant, par exemple, une moyenne de la valeur correspondante de la sous-séquence A et de la valeur correspondante de la sous-séquence B. Ainsi, la sous-séquence AB générée peut être représentée, dans cet exemple, par le milieu du segment reliant les points représentant les sous-séquences A et B.
L’ensemble de sous-séquences peut être réduit RED ENS (S44) en remplaçant la paire de sous-séquences A et B formant le groupe de niveau 1 par la sous-séquence AB représentative du groupe de niveau 1. Ainsi, à l’issue d’une première itération, l’ensemble de sous-séquences est réduit d’une unité, une paire de sous-séquences étant représentée par une sous-séquence générée représentant un groupe de niveau 1. L’ensemble comprend ainsi un groupe de niveau 1.
A l’issue d’une deuxième itération, l’ensemble de sous-séquences est réduit d’une deuxième unité, une autre paire de sous-séquences étant représentée par une sous-séquence générée représentant un groupe de niveau 2. L’ensemble comprend ainsi un groupe de niveau 1 et un groupe de niveau 2. Ainsi, si l’ensemble de sous-séquences comprend initialement n sous-séquences, alors à l’issue de (n-1) itérations, l’ensemble de sous-séquences est formé de (n-1) groupes, soit un groupe de chaque niveau compris entre 1 et (n-1), et chaque sous-séquence sélectionnée initialement est incluse dans l’un des groupes ainsi formés.
Le couplage de toutes les sous-séquences sélectionnées initialement entre elles peut ainsi être représenté sous la forme d’un dendrogramme à n niveaux, du niveau 0 au niveau (n-1), le numéro de chaque niveau correspondant au nombre de groupes formés à ce niveau. Un couplage total, c’est-à-dire la mise en œuvre de (n-1) itérations afin de coupler n sous-séquences sélectionnées initialement, garantit qu’en aval, les groupes de sous-séquences obtenus sont nécessairement adjacents et non superposés. Deux groupes différents obtenus correspondent donc nécessairement à deux comportements différents du système.
Il est également possible de mettre en œuvre un couplage partiel, c’est-à-dire soit de stopper le classement des sous-séquences après i itérations de manière à former i groupes, i étant inférieur à (n-1), en fonction d’un critère d’arrêt, soit, à l’issue du couplage total, de déterminer un niveau i de coupe du dendrogramme, de sorte que les groupes de niveau 1 à i sont à considérer. Sur la figure 4, un niveau de coupe 4 permet par exemple de regrouper un nombre total de sept sous-séquences en quatre groupes, de niveaux respectifs 4 (301), 3 (302), 2 (303) et 1, le groupe de niveau 1 étant ici un sous-groupe du groupe de niveau 3.
La valeur de i est déterminée en fonction d’un critère d’arrêt qui peut être prédéfini avant la mise en œuvre de la méthode algorithmique de classement ou déterminé itérativement par comparaison de différents niveaux du dendrogramme.
Dans un exemple, le niveau i de coupe est choisi automatiquement sur la base du principe dit de « longueur de description minimale » ou, en anglais, de « Minimum Description Length ». La longueur de description d’une sous-séquence désigne le nombre total de bits nécessaire pour encoder la sous-séquence, ce nombre étant également appelé entropie de la sous-séquence. Cette entropie est définie par. La notation P(T=Ti,1) correspond à la probabilité de trouver la valeur Ti,1dans T.
La longueur de description de la série temporelle T est définie par DL(T)=|T|*H(T) et quantifie l’espace nécessaire pour le stockage de la sous-séquence Ti,1. Cette valeur est minimale si la sous-séquence en question contient un maximum de valeurs similaires. Dans ce cas la compression des bits réduit l’espace de stockage nécessaire. Pour simplifier les calculs, la représentation SAX (Symbolic Aggregate approXimation) des sous-séquences est utilisée. Chaque sous-séquence d’un groupe peut être représentée par sa distance au centre du groupe. Le centre du groupe désigne la sous-séquence générée, représentative des sous-séquences sélectionnées formant le groupe et intermédiaire à ces sous-séquences sélectionnées. Plus les distances respectives entre le centre et chaque sous-séquence sélectionnée formant le groupe sont petites, plus le regroupement (ou clustering) est optimal.
La longueur de description conditionnelle DL d’une sous-séquence Ti,ℓquantifie le nombre de bits nécessaires pour stocker cette sous-séquence connaissant le centre du groupe c auquel elle appartient. Formellement,. La longueur de description conditionnelle DLC d’un groupe c quantifie le nombre de bits nécessaire pour stocker les sous-séquences du groupe c connaissant le centre du groupe. Formellement,. La longueur de description non conditionnelle d’un groupe est définie par.
Considérant un ensemble de groupes A (comme celui obtenu après la sélection d’un niveau pour couper le dendrogramme), la mesure bitsave peut être appliquée pour quantifier le nombre de bits nécessaires pour stocker tous les groupes. Cette mesure est définie par. Cette mesure est maximale quand la similarité intra-groupe est maximale et quand le nombre de groupes est minimal. Il est donc possible de tester chaque niveau de manière itérative (du plus haut niveau au plus bas, et donc du plus petit nombre de cluster au plus grand), et de stopper le test quand la mesure bitsave arrête de croître, formant ainsi un nombre définitif de groupes correspondant au numéro du dernier niveau testé.
Ainsi, l’ensemble de sous-séquences sélectionné peut être classé en un nombre de groupes pertinent, c’est-à-dire que les différents types de comportements récurrents du système d’intérêt sont représentés par autant de groupes. Ce classement est effectué de manière automatique sans qu’il soit nécessaire de renseigner au préalable le nombre de groupes pertinent. Les m groupes construits sont respectivement notés c1, …, cm.
A partir des groupes de sous-séquences formés, il est possible de construire CONST NM(S5) un modèle normal de fonctionnement du système d’intérêt.
Dans ce modèle normal, chaque groupe cide sous-séquences est représenté par une sous-séquence représentative des sous-séquences dudit groupe.
Cette sous-séquence, représentative, est modélisée MODEL NM i(S51), ou déterminée, de manière à être par exemple intermédiaire entre les sous-séquences dudit groupe. Comme indiqué ci-avant, chaque groupe ci, formé à l’issue du classement CLASS SEL (S4) en utilisant le critère de la longueur de description minimale, est stocké par rapport à son centre Center(ci), c’est-à-dire par rapport au barycentre des sous-séquences dudit groupe. Ce barycentre peut désigner la sous-séquence NM imodélisée représentant ledit groupe ci.
Dans ce modèle normal, chaque sous-séquence ainsi modélisée, représentative d’un groupe ci, est associée à un poids wirespectif, c’est-à-dire une contribution respective du groupe. Ainsi, chaque groupe ciest représenté, dans le modèle normal, par un tuple (NM i, wi).
Le poids wiest déterminé DET wi(S52) par comparaison d’une répartition collective des sous-séquences formant ledit groupe avec une répartition collective de référence. L’avantage est, en pondérant les groupes, de permettre de qualifier plus précisément le fonctionnement normal du capteur sur l’ensemble de la série temporelle, donc d’identifier plus précisément si une sous-séquence donnée correspond ou non à une anomalie de fonctionnement.
Plus particulièrement, chacun des critères suivants peut être utilisé, seul ou en combinaison, pour déterminer le poids de chaque groupe ci:
  • le nombre |ci| de sous-séquences formant le groupe,
  • la couverture temporelle Coverage du groupe, et
  • la centralité Centrality du groupe.
La couverture temporelle d’un groupe donné (Coverage) est déterminée à partir des indices des sous-séquences du groupe. Pour rappel, comme précisé ci-avant, chaque sous-séquence Ti,ℓcommence à l’indice i, soit au ièmepoint de T, et contient les ℓ points qui suivent. Plus particulièrement, il est possible de s’appuyer sur l’indice le plus grand parmi les indices de toutes les sous-séquences du groupe, dit index maximal (MaxOffset), et sur l’indice le plus petit parmi les indices de toutes les sous-séquences du groupe, dit index minimal (MinOffset). Formellement, une détermination possible, telle que plus la différence entre l’index maximal et l’index minimal est grande, plus la couverture temporelle est grande, est.
La centralité (Centrality) d’un groupe est déterminée à partir de la distance entre le centre (Center) du groupe et les centres de chaque autre groupe. Une détermination possible est. Ainsi, plus les distances entre la sous-séquence représentative d’un groupe donné et les sous-séquences représentatives des autres groupes sont faibles, plus ce groupe donné est central.
Un exemple de combinaison de critères pour déterminer le poids d’un groupe peut être le produit du carré du nombre de sous-séquences formant le groupe par la taille de la partie de T couverte par le groupe et par la centralité du groupe. Ainsi, dans cet exemple, le tuple (NM i, wi) est exprimé comme suit :.
De manière générale, le modèle normal NMest défini par les tuples (NM i, wi) pour chacun des groupes construits, soit.
En se référant à la figure 3, six groupes c1(101), c2(102), c3(103), c4(201), c5(203) et c6(202), peuvent être construits, et le modèle normal NMpeut être défini par six tuples (NM 1, w1), (NM 2, w2), (NM 3, w3), (NM 4, w4), (NM 5, w5) et (NM 6, w6), les grandeurs NM idésignant les centres de leur groupe cirespectif et les grandeurs widésignant les poids de leur groupe cirespectif. En déterminant les moyennes arithmétiques des coordonnées des centres NM ides groupes construits, pondérées par leur poids wirespectif, il est possible d’obtenir un barycentre B du modèle normal.
Chaque sous-séquence Tj,ℓextraite est alors comparée avec le modèle normal de fonctionnement, défini ci-avant, du système d’intérêt.
Plus particulièrement, une sous-séquence donnée peut être comparée avec chaque sous-séquence NM imodélisée représentative d’un groupe cidans le modèle normal. La comparaison peut être une détermination d’une distance entre la sous-séquence donnée et la sous-séquence représentative.
Sur la base de cette comparaison, il est possible de déterminer et d’attribuer SCOR Tj,ℓ(S6) un score de normalité à cette sous-séquence extraite.
Par exemple, le score de normalité d’une sous-séquence donnée peut être obtenu sur la base d’une comparaison de la sous-séquence donnée avec chaque sous-séquence du modèle normal et sur la base d’une pondération des résultats desdites comparaisons par les poids respectifs associés à chaque sous-séquence du modèle normal.
Ainsi, le score de normalité d’une sous-séquence Tj,ℓdonnée, extraite de la série temporelle T, peut désigner la distance de cette sous-séquence Tj,ℓau modèle normal, définie par :.
Ceci revient à considérer comme score d’anormalité d’une sous-séquence donnée la distance entre cette sous-séquence donnée et le barycentre B du modèle normal de fonctionnement.
Sur la base des scores de normalité attribuée, il est possible d’identifier ID Tk,ℓ(S7) au moins une sous-séquence anormale, indiquant une anomalie de fonctionnement du système d’intérêt.
Par exemple, une sous-séquence avec une grande distance au modèle normal peut être considérée comme anormale. De manière plus formelle, dans cet exemple, la sous-séquence Tj,ℓest moins fréquente (et donc plus anormale) que la sous-séquence Tk,ℓsi d(Tj,ℓ,NM)> d(Tk,ℓ,NM).
Sur la base d’au moins une sous-séquences anormale identifiée, il est de plus possible de déterminer DET SoH (S8) un état de santé du système d’intérêt.
Un état de santé peut être exprimé sous la forme d’une échelle de valeurs, par exemple un pourcentage (0 à 100%), ou sous une forme binaire (sain ou non).
Il est à présent fait référence à la figure 5, qui illustre un processus de détection d’anomalies dans la série temporelle T de mesures de nombre de courses de taxi assurées par intervalle de temps. La détection est effectuée, comme décrit ci-avant, par comparaison de sous-séquences extraites avec un modèle normal NM. Le modèle normal NMest basé sur n groupes construits à partir d’un ensemble de sous-séquences sélectionnées parmi les sous-séquences extraites. Le modèle normal NMest formé de n tuples (NM i, wi). Chaque tuple correspond à l’un des n groupes construits et est formé d’une sous-séquence modélisée (301, 302, 303) représentative dudit groupe et d’un poids associé.
Une première sous-séquence Tj,ℓ(304) extraite de la série temporelle T est comparée au modèle normal NM, c’est-à-dire que la distance de la première sous-séquence au barycentre du modèle normal est déterminée. Par la comparaison, un score d’anormalité normalisé (404) est obtenu. La valeur de ce score est d’autant plus faible que la distance de la première sous-séquence au barycentre du modèle normal est faible. Ici, on constate visuellement sur la figure 5 que l’allure de la première sous-séquence (304) est proche de celles de certaines sous-séquences modélisées (301) et (302) utilisées pour construire le modèle normal. Le score d’anormalité déterminé, ici proche de zéro, confirme cette observation et indique une proximité avec le modèle normal suffisante pour considérer la première sous-séquence comme correspondant à un comportement normal du système. Ainsi, le score d’anormalité indique, pour un instant considéré du système, un état de santé satisfaisant.
Une deuxième sous-séquence T’j,ℓ(305) extraite de la série temporelle T est comparée au modèle normal NM. Un score d’anormalité normalisé (405) est ainsi obtenu. Ici, on constate visuellement sur la figure 5 que l’allure de la deuxième sous-séquence (305) ne se rapproche d’aucune des sous-séquences modélisées (301, 302, 303) utilisées pour construire le modèle normal. La valeur de ce score, ici supérieur à 1, confirme cette observation et indique une distance statistiquement anormale avec le modèle normal. La deuxième sous-séquence est détectée comme correspondant à un comportement anormal du système. Ainsi, le score d’anormalité indique, pour un instant considéré du système, un état de santé insuffisant.
Il est maintenant fait référence à la figure 6, dans laquelle le système considéré est une personne et le capteur est un électrocardiographe. La série temporelle T est un électrocardiogramme de la personne enregistré sur une période de temps de plusieurs heures. Les groupes de sous-séquences (301, 302, 303) construits sur lesquels le modèle normal est basé illustrent différentes portions types, ou récurrentes de l’électrocardiogramme, donc plusieurs séries de pulsations cardiaques récurrentes de la personne. Par comparaison d’un grand nombre de portions, ou sous-séquences (304, 305), extraites de l’électrocardiogramme, avec le modèle normal, il est possible d’obtenir pour chacune de ces portions un score d’anormalité associé. Par comparaison automatique de ce score d’anormalité avec un seuil prédéfini, il est possible de repérer toutes les sous-séquences s’écartant significativement du modèle normal, donc constituant des anomalies statistiques, donc pouvant être considérées comme correspondant à un état de santé pouvant requérir une analyse par un praticien. Il est de plus possible de différencier ces sous-séquences statistiquement anormales, sur la base de leur score d’anormalité, en différents types d’anormalité. Ainsi, deux scores d’anormalité (404, 405), bien que tous deux supérieurs à un seuil constitutif d’une anormalité statistique, peuvent être significativement différents l’un de l’autre et correspondre à deux types d’anomalie différente. Il est alors possible de recenser chaque type d’anomalie présente sur l’électrocardiogramme et de présenter, par exemple à un praticien, un exemple de sous-séquence extraite pour chaque type identifié. Bien que l’association d’une sous-séquence, d’un type d’anomalie statistique, d’un état de santé déterminé ou de toute autre grandeur avec un éventuel tableau clinique soit hors du cadre de ce document, le diagnostic d’un praticien est facilité et accéléré dans ce cas d’espèce car le praticien n’a pas besoin de consulter l’ensemble de l’électrocardiogramme mais, au contraire, peut en visualiser immédiatement des extraits potentiellement pertinents pour la mise en œuvre du diagnostic, car correspondant aux différentes anomalies statistiques éventuellement présentes.
De manière générale, quel que soit le système d’intérêt considéré, les sous-séquences anormales indiquent les moments et les différents types d’anomalies relevées par le capteur du système d’intérêt.
Dans un système industriel, ceci est utilisable pour décrire l’état de santé du système par symptômes (via des alertes par exemple), et le cas échéant, d’aiguiller quant aux possibles causes physiques (dégradation, usure, évènement inopiné etc…).
Par suite, différentes actions peuvent être entreprises, telles que des actions de correction (suite à une sortie de domaine de fonctionnement normal), des actions de réparation (si ces anomalies ont eu des répercussions physiques sur le matériel), des actions de prédiction/d’anticipation (si ces anomalies ont souligné des dégradations ou usures, elles pourront être prises en compte lors des prochains entretiens techniques ou de maintenance), des actions d’enrichissement d’un retour d’expérience quant au fonctionnement du matériel.
Ainsi, l’état de santé déterminé peut être utilisé pour générer une alerte indiquant une potentielle défaillance du système d’intérêt, et/ou pour corriger des mesures ultérieurement reçues du capteur et/ou pour prédire une évolution ultérieure de l’état de santé du système d’intérêt et/ou pour alimenter une base de données d’états de santé de systèmes d’un type similaire au système d’intérêt.

Claims (15)

  1. Procédé de détermination d’un état de santé d’un système d’intérêt équipé d’un capteur, le procédé comprenant :
    - une obtention OBT T (S1) d’une série temporelle formée d’une séquence de mesures issues du capteur en fonction du temps,
    - une extraction EXTR Ti,ℓ(S2) d’une pluralité de sous-séquences à partir de la série temporelle, chaque sous-séquence extraite étant formée d’une pluralité de mesures, consécutives dans le temps, extraites de ladite séquence de mesures,
    - une sélection SEL Ti,ℓ(S3) d’un ensemble de sous-séquences, l’ensemble formant une partie de la pluralité de sous-séquences extraites,
    - un classement CLASS SEL (S4) des sous-séquences de l’ensemble sélectionné en une pluralité de groupes de sous-séquences sur la base d’au moins un critère de ressemblance entre chaque sous-séquence de l’ensemble sélectionné et au moins une sous-séquence de référence,
    - une construction CONST NM(S5) d’un modèle normal de fonctionnement du système d’intérêt, la construction comprenant, pour chaque groupe de sous-séquences, une modélisation MODEL NM i(S51) d’une sous-séquence représentative des sous-séquences dudit groupe et une détermination DET wi(S52) d’un poids associé à la sous-séquence modélisée par comparaison d’une répartition collective des sous-séquences formant ledit groupe avec une répartition collective de référence, le modèle normal de fonctionnement du système d’intérêt étant défini par les sous-séquences modélisées et les poids associés,
    - une attribution SCOR Tj,ℓ(S6) d’un score de normalité à chaque sous-séquence extraite sur la base d’une comparaison entre ladite sous-séquence extraite et le modèle normal de fonctionnement du système d’intérêt,
    - une identification ID Tk,ℓ(S7) d’au moins une sous-séquence anormale, indiquant une anomalie de fonctionnement du système d’intérêt, sur la base des scores de normalité attribués, et
    - sur la base de ladite au moins une sous-séquence anormale identifiée, une détermination DET SoH (S8) de l’état de santé du système d’intérêt.
  2. Procédé selon la revendication précédente, comportant, conjointement à la sélection SEL Ti,ℓ(S3), une exclusion EXCL Ti,ℓ(S31) dans laquelle chaque sous-séquence dont une proportion excédant un seuil prédéterminé se retrouve intégralement dans au moins une autre sous-séquence est écartée de l’ensemble sélectionné.
  3. Procédé selon l’une des revendications précédentes, dans lequel la sélection SEL Ti,ℓ(S3) est une sélection aléatoire de sous-séquences parmi la pluralité de sous-séquences.
  4. Procédé selon la revendication 1 ou 2, dans lequel la sélection SEL Ti,ℓ(S3) est basée sur une comparaison des sous-séquences de la pluralité de sous-séquences entre elles, l’ensemble étant formé de sorte que chaque sous-séquence de l’ensemble présente un degré de ressemblance excédant un seuil prédéterminé avec au moins une autre sous-séquence de l’ensemble.
  5. Procédé selon l’une des revendications précédentes, dans lequel le critère de ressemblance entre une sous-séquence donnée A et une sous-séquence de référence B résulte :
    - d’une détermination d’une distance dist(A,B) entre la sous-séquence donnée et la sous-séquence de référence, la distance dist(A, B) étant définie comme, où Ai,1et Bi,1désignent une première mesure dans le temps, µAet µBdésignent une moyenne et σAet σBdésignent un écart-type de la première sous-séquence A et de la deuxième sous-séquence B respectivement, et
    - d’une comparaison de la distance déterminée avec une valeur de référence.
  6. Procédé selon l’une des revendications précédentes, dans lequel le classement CLASS SEL (S4) est basé sur un regroupement hiérarchique des sous-séquences de l’ensemble, le regroupement hiérarchique étant effectué en répétant l’enchaînement suivant jusqu’à ce qu’un critère d’arrêt soit atteint :
    - déterminer DET DEG (S41), pour chaque paire de sous-séquences de l’ensemble, un degré de ressemblance,
    - former FORM GRP (S42) un groupe de niveau i, où i représente le nombre de sous-séquences de l’ensemble, sur la base du critère de ressemblance de sorte que le groupe de niveau i consiste en la paire de sous-séquences de l’ensemble dont le degré de ressemblance déterminé est le plus élevé,
    - générer GEN SS SEQ (S43) une sous-séquence représentative dudit groupe de niveau i, intermédiaire entre les sous-séquences dudit groupe de niveau i, et
    - réduire RED ENS (S44) l’ensemble en remplaçant la paire de sous-séquences formant ledit groupe de niveau i par la sous-séquence générée représentative dudit groupe de niveau i.
  7. Procédé selon la revendication précédente, dans lequel :
    • lors de chaque itération de l’enchaînement, avant d’effectuer chaque réduction RED ENS (S44) de l’ensemble, les sous-séquences formant l’ensemble sont encodées et la taille mémoire totale des sous-séquences encodées est déterminée, et
    • le critère d’arrêt est basé sur une comparaison de la taille mémoire totale déterminée pour deux itérations consécutives de l’enchaînement.
  8. Procédé selon l’une des revendications précédentes, dans lequel au cours de la modélisation MODEL NM i(S51) d’une sous-séquence représentative des sous-séquences dudit groupe, la sous-séquence modélisée est intermédiaire entre les sous-séquences dudit groupe.
  9. Procédé selon l’une des revendications précédentes, dans laquelle le poids de chaque groupe est basé sur le nombre de sous-séquences formant ledit groupe.
  10. Procédé selon l’une des revendications précédentes, dans laquelle le poids de chaque groupe est basé sur une couverture temporelle dudit groupe.
  11. Procédé selon l’une des revendications précédentes, dans laquelle le poids de chaque groupe est basé sur une centralité dudit groupe par rapport à la pluralité de groupes.
  12. Procédé selon la revendication précédente, dans laquelle le score de normalité d’une sous-séquence donnée est obtenu sur la base d’une comparaison de la sous-séquence donnée avec chaque sous-séquence du modèle normal et sur la base d’une pondération des résultats desdites comparaisons par les poids respectifs associés à chaque sous-séquence du modèle normal.
  13. Programme informatique comportant des instructions pour la mise en œuvre du procédé selon l’une des revendications 1 à 12 lorsque ce programme est exécuté par un processeur.
  14. Support d’enregistrement non transitoire lisible par un ordinateur sur lequel est enregistré un programme pour la mise en œuvre du procédé selon l’une des revendications 1 à 12 lorsque ce programme est exécuté par un processeur.
  15. Circuit de traitement comprenant un processeur connecté à un support d’enregistrement non transitoire selon la revendication 14.
FR2003946A 2020-04-20 2020-04-20 Détermination d’états de santé de systèmes équipés de capteurs Active FR3109455B1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR2003946A FR3109455B1 (fr) 2020-04-20 2020-04-20 Détermination d’états de santé de systèmes équipés de capteurs
US17/229,899 US11471113B2 (en) 2020-04-20 2021-04-14 Determination of health status of systems equipped with sensors

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR2003946A FR3109455B1 (fr) 2020-04-20 2020-04-20 Détermination d’états de santé de systèmes équipés de capteurs
FR2003946 2020-04-20

Publications (2)

Publication Number Publication Date
FR3109455A1 true FR3109455A1 (fr) 2021-10-22
FR3109455B1 FR3109455B1 (fr) 2024-01-05

Family

ID=71662051

Family Applications (1)

Application Number Title Priority Date Filing Date
FR2003946A Active FR3109455B1 (fr) 2020-04-20 2020-04-20 Détermination d’états de santé de systèmes équipés de capteurs

Country Status (2)

Country Link
US (1) US11471113B2 (fr)
FR (1) FR3109455B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548259A (zh) * 2022-02-18 2022-05-27 东北大学 一种基于半监督Semi-KNN模型的PISA故障识别方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220377094A1 (en) * 2021-04-08 2022-11-24 University Of Maryland, Baltimore County Systems and methods of graph-based vehicular intrusion detection
CN118512154B (zh) * 2024-07-20 2024-09-20 北京市中医药研究所 基于腕带式可穿戴设备的生理信号采集方法及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10699040B2 (en) * 2017-08-07 2020-06-30 The Boeing Company System and method for remaining useful life determination

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BONIOL P ET AL: "Automated Anomaly Detection in Large Sequences", 2020 IEEE 36TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING (ICDE), 20-24 APRIL 2020, 16 April 2020 (2020-04-16), pages 1834 - 1837, XP033774271, DOI: 10.1109/ICDE48307.2020.00182 *
BONIOL P ET AL: "SAD: An Unsupervised System for Subsequence Anomaly Detection", 2020 IEEE 36TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING (ICDE), 20-24 APRIL 2020, 16 April 2020 (2020-04-16), pages 1778 - 1781, XP033774378, DOI: 10.1109/ICDE48307.2020.00168 *
BONIOL P ET AL: "Series2Graph : graph-based subsequence anomaly detection for time series", PROCEEDINGS OF THE VLDB ENDOWMENT, vol. 13, no. 12, August 2020 (2020-08-01), New York, NY, pages 1821 - 1834, XP055766870, ISSN: 2150-8097, DOI: 10.14778/3407790.3407792 *
BONIOL P ET AL: "Unsupervised Subsequence Anomaly Detection in Large Sequences", PROCEEDINGS OF THE VLDB 2020 PHD WORKSHOP, 31 AUGUST 2020, 31 August 2020 (2020-08-31), XP055766872, Retrieved from the Internet <URL:http://ceur-ws.org/Vol-2652/paper02.pdf> [retrieved on 20210119] *
RODPONGPUN S ET AL: "Selective subsequence time series clustering", KNOWLEDGE-BASED SYSTEMS, vol. 35, 27 April 2012 (2012-04-27), pages 361 - 368, XP055766877 *
VASHEGHANI FARAHANI I ET AL: "Time Series Anomaly Detection from a Markov Chain Perspective", 2019 18TH IEEE INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND APPLICATIONS (ICMLA), 16 December 2019 (2019-12-16), pages 1000 - 1007, XP033719660, DOI: 10.1109/ICMLA.2019.00170 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548259A (zh) * 2022-02-18 2022-05-27 东北大学 一种基于半监督Semi-KNN模型的PISA故障识别方法
CN114548259B (zh) * 2022-02-18 2023-10-10 东北大学 一种基于半监督Semi-KNN模型的PISA故障识别方法

Also Published As

Publication number Publication date
FR3109455B1 (fr) 2024-01-05
US20210321956A1 (en) 2021-10-21
US11471113B2 (en) 2022-10-18

Similar Documents

Publication Publication Date Title
FR3109455A1 (fr) Détermination d’états de santé de systèmes équipés de capteurs
FR3082963A1 (fr) Systeme et procede d&#39;evaluation et de deploiement de modeles d&#39;apprentissage automatique non supervises ou semi-supervises
CA2954812C (fr) Procede pour detecter des anomalies dans un reseau de distribution, en particulier d&#39;eau potable
CN114528934A (zh) 时序数据异常检测方法、装置、设备及介质
CN116344050B (zh) 一种基于多维度健康管理模型的评测方法
Adhikari et al. ICovidCare: Intelligent health monitoring framework for COVID-19 using ensemble random forest in edge networks
Wen et al. Degradation assessment for the ball screw with variational autoencoder and kernel density estimation
Duan et al. Epileptic seizure prediction based on convolutional recurrent neural network with multi-timescale
CN112732690A (zh) 一种用于慢病检测及风险评估的稳定系统及方法
US20220183566A1 (en) Systems and methods for diurnal curve tracking and analysis
Vinisha et al. Study on missing values and outlier detection in concurrence with data quality enhancement for efficient data processing
Bhoomika et al. Ensemble Learning Approaches for Detecting Parkinson's Disease
NavyaSree et al. Predicting the Risk Factor of Kidney Disease using Meta Classifiers
WO2020011988A1 (fr) Systeme et procede de generation d&#39;une liste de probabilites associee a une liste de maladies, produit programme d&#39;ordinateur
WO2021009364A1 (fr) Procédé d&#39;identification de données aberrantes dans d&#39;un jeu de données d&#39;entrée acquises par au moins un capteur
CN116013511A (zh) 基于知识图谱的糖尿病干预智能推荐方法及系统
Niu et al. Detecting anomalous sequences in electronic health records using higher-order tensor networks
CN112768090A (zh) 一种用于慢病检测及风险评估的过滤系统及方法
FR3070851B1 (fr) Systeme pour detecter et alerter le personnel soignant d’un risque de decompensation ou d’hospitalisation d’un patient
Martin-del-Campo et al. Algorithmic performance constraints for wind turbine condition monitoring via convolutional sparse coding with dictionary learning
Alharbi et al. Novel Computer-Aided Diagnosis System for the Early Detection of Alzheimer’s Disease.
Muthulakshmi et al. Big Data Analytics for Heart Disease Prediction using Regularized Principal and Quadratic Entropy Boosting
WO2021233758A1 (fr) Détermination de l&#39;état de santé d&#39;un système à partir d&#39;un réseau de séquences temporelles mesurées
US20240321465A1 (en) Machine Learning Platform for Predictive Malady Treatment
CN114548259B (zh) 一种基于半监督Semi-KNN模型的PISA故障识别方法

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20211022

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

CD Change of name or company name

Owner name: ELECTRICITE DE FRANCE, FR

Effective date: 20230330

Owner name: UNIVERSITE PARIS CITE, FR

Effective date: 20230330

PLFP Fee payment

Year of fee payment: 5