FR3113151A1 - procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié - Google Patents
procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié Download PDFInfo
- Publication number
- FR3113151A1 FR3113151A1 FR2008243A FR2008243A FR3113151A1 FR 3113151 A1 FR3113151 A1 FR 3113151A1 FR 2008243 A FR2008243 A FR 2008243A FR 2008243 A FR2008243 A FR 2008243A FR 3113151 A1 FR3113151 A1 FR 3113151A1
- Authority
- FR
- France
- Prior art keywords
- individuals
- atypicality
- atypical
- index
- multivariate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000005259 measurement Methods 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000004519 manufacturing process Methods 0.000 claims description 13
- 229960005486 vaccine Drugs 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 5
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000012360 testing method Methods 0.000 description 17
- 238000001514 detection method Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000007547 defect Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 238000003908 quality control method Methods 0.000 description 5
- 235000012431 wafers Nutrition 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000012847 principal component analysis method Methods 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000003116 impacting effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/406—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by monitoring or safety
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/32—Operator till task planning
- G05B2219/32368—Quality control
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Optimization (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Human Computer Interaction (AREA)
- Manufacturing & Machinery (AREA)
- Automation & Control Theory (AREA)
- Complex Calculations (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
L’invention concerne un procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un jeu de données préalablement récoltées, issues de mesures de paramètres d’individus réalisées par une pluralité de systèmes de mesures, caractérisé en ce qu’il comporte les étapes de : - prétraitement 100 des données ; - détermination 200 d’un indice d’atypicité multivarié, ledit indice étant transformé par une fonction f pour être compris entre 0 et 1, sur l’ensemble des mesures pour chaque individu, à partir des données prétraitées ; - Identification 300 des individus atypiques. Figure pour l’abrégé : Fig. 1
Description
Domaine technique de l’invention
La présente invention appartient au domaine du contrôle de qualité, tel que celui des composants électroniques ou des produits issus de l’industrie pharmaceutique, par exemple des vaccins. Notamment, l’invention concerne un procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié, c’est-à-dire que les individus sont caractérisés par plusieurs tests ou mesures.
Dans la présente demande, on désigne par le terme « individu », toute pièce ou lot produit en petite, moyenne ou grande série par des moyens de production industrielle ou autres.
Un individu atypique est notamment un individu qui a passé tous les tests avec succès mais qui est statistiquement atypique, et donc, un individu potentiellement non conforme. En effet, l’expérience montre sur les composants électroniques ou les vaccins, que l’atypicité statistique, même sur des pièces ou des lots ayant passés avec succès les tests de contrôle qualité, peut révéler un problème de qualité ou de fiabilité latent.
La présente invention peut avantageusement être appliquée au secteur de l’industrie des semi-conducteurs. Cette industrie produit des circuits intégrés, dits « composants électroniques », qui sont fabriqués sur des lots de plaquettes de silicium, chaque plaquette comprenant plusieurs centaines de composants électroniques.
Afin de s’assurer du fonctionnement de ces composants électroniques, des séries de tests sont effectuées sur chacun des composants alors qu’ils font encore partie d'une plaquette.
A chacun de ces tests est associée une ou deux limites de spécification.
Les composants électroniques dont la réponse a au moins un test non conforme à la spécification de ce test, c’est-à-dire dont la réponse est en dehors des limites de ladite spécification, sont alors considérés comme défectueux, et sont rejetés lors de leur séparation d'avec la plaquette.
Ce contrôle qualité classique peut être complété par des méthodes statistiques de détection d’anomalies, par exemple dans les composants destinés à l’industrie automobile, pour minimiser les problèmes de qualité vus par le client. Il s’agit alors d’éliminer des pièces bonnes (qui ont passé tous les tests) car elles sont statistiquement anormales et peuvent parfois se révéler mauvaises chez le client. Cet objectif de zéro défaut fait appel à des méthodes dites « univariées » ou « bivariées ».
Par exemple, une méthode univariée appelée Part Average Testing (PAT) compare la réponse d’un test d’un composant électronique à la distribution moyenne des réponses de ce test des autres composants électroniques et considère comme composant électronique atypique, un composant électronique dont la réponse est trop distante de la répartition des réponses des autres composants électroniques.
Cette méthode n’est généralement pas satisfaisante en pratique car elle mène souvent à de nombreuses fausses alertes puisqu’il suffit qu’une valeur soit à plus de k écarts types de la moyenne sur un seul des p paramètres pour que l’individu soit considéré comme atypique. Plus le nombre p de paramètres augmente, plus il y a de chances pour que l’individu soit atypique sur au moins un test.
En utilisant ces méthodes univariées (PAT, etc.) ou bivariées (régressions simples entre un test et un autre et détection des atypiques sur la base de ces régressions) sur un très grand nombre de tests, les fabricants rejettent donc trop de composants, dont de nombreux composants corrects, ce qui les prive de quelques pourcents de leur production, tout en ne leur garantissant cependant pas d'éliminer tous les composants potentiellement défectueux.
En effet, ces méthodes sont appliquées sur chaque mesure d’un test de manière indépendante et donc le taux de fausses alertes augmente de façon spectaculaire avec le nombre de mesures. Afin de limiter ce nombre de fausses alertes (et donc le coût par rapport à la détection) les limites statistiques sont choisies de manière souvent trop permissive, au risque de ne pas être suffisantes.
Ces méthodes présentent donc le risque de permettre à des composants électroniques comportant un défaut latent qui peut se révéler lors de l’utilisation de la pièce dans le cadre de l’application du client, d'être considérés comme fiables et livrables au client.
Cet inconvénient est gênant, d'une part, parce qu'il oblige le fabricant à renvoyer au client une nouvelle pièce de remplacement en cas d’identification du défaut latent, et diminue son niveau de qualité perçu par le client, mais, plus encore, parce que certains de ces composants, bien que d'un coût unitaire faible, sont des composants critiques dans le fonctionnement d'un système plus complexe, par exemple un contrôleur moteur ou un système de freinage ABS. Dans ce cas, une panne du composant peut conduire à un accident grave, dont les conséquences vont très au-delà de la simple valeur financière du composant.
Quoique déjà dotées d’une certaine performance, ces méthodes sont donc insuffisantes pour atteindre le zéro défaut.
Des solutions ont donc été développées pour répondre à ce besoin avec la mise en œuvre de méthodes statistiques multivariées, notamment des méthodes d’analyse en composantes principales ou bien la distance de Mahalanobis et le T² de Hotelling.
Toutefois, ces solutions ne répondent que partiellement aux attentes du contexte de fabrication industrielle. En effet, comme les méthodes d’analyse en composantes principales ne sont spécialement conçues pour détecter des individus atypiques, elles sont souvent en difficulté pour réaliser une telle tâche.
Plus précisément, la distance de Mahalanobis et le T² de Hotelling sont des distances multivariées de similarité des individus qui peuvent donc être utilisées pour identifier des individus atypiques. Toutefois, ces méthodes sont en difficulté dès lors que l’atypicité est due seulement à un sous-ensemble de mesures et non pas à la majorité, ce qui est en fait la pratique dans le contexte de fabrication industrielle, au vu des hauts standards de qualité recherchés.
D’autres méthodes multivariées existent, telle que la méthode connue par l’homme du métier sous l’acronyme anglophone « LOF », pour « local outlier factor ». Toutefois, cette méthode présente plusieurs inconvénients majeurs : il n’existe pas de règle statistique claire pour identifier les individus atypiques, elle requiert une optimisation d’un paramètre intrinsèque à l’algorithme (le nombre de voisins) et elle demande une capacité de calcul d’autant plus importante que le volume de données augmente ; ce qui représente des contraintes non négligeables. Notamment, compte-tenu de ces inconvénients, l’utilisation en temps réel sur les lignes de production est impossible.
Certaines méthodes s’appuient quant à elles sur de la connaissance des défauts à détecter, ce sont alors des méthodes dites « supervisées », ce qui oblige les industriels à calibrer de nouveau la méthode à chaque nouveau produit et/ou ajout de tests dans le processus d’amélioration de la couverture de tests.
De nombreuses méthodes se contentent d’attribuer à chaque individu un indicateur d’atypicité sans véritable identification des individus atypiques. Concrètement elles ordonnent ou classent les individus des plus atypiques aux moins atypiques mais ne peuvent assurer que le premier individu soit véritablement atypique.
Enfin, de manière générale, la plus grande limitation de ces méthodes réside dans le fait qu’elles ne sont généralement plus applicables dès lors que le nombre de mesures est supérieur au nombre d’individus ou dès qu’il y a de la corrélation entre les variables, ce qui est chose courante dans un contexte industriel ou pharmaceutique. En effet, les données analysées sont souvent issues d’un grand nombre de mesures réalisées par un certain nombre de tests, typiquement des centaines, voire des milliers, sur chaque composant électronique ou individu.
Présentation de l'invention
La présente invention a pour objectif de palier les inconvénients précités.
À cet effet, l’invention concerne un procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un jeu de données préalablement récoltées, issues de mesures de paramètres d’individus réalisées par une pluralité de systèmes de mesures.
Le procédé comporte les étapes de :
- prétraitement des données ;
- détermination d’un indice d’atypicité multivarié, ledit indice étant transformé par une fonction f pour être compris entre 0 et 1, sur l’ensemble des mesures pour chaque individu, à partir des données prétraitées ;
- Identification des individus atypiques.
- prétraitement des données ;
- détermination d’un indice d’atypicité multivarié, ledit indice étant transformé par une fonction f pour être compris entre 0 et 1, sur l’ensemble des mesures pour chaque individu, à partir des données prétraitées ;
- Identification des individus atypiques.
Dans des modes particuliers de réalisation, l’invention répond en outre aux caractéristiques suivantes, mises en œuvre séparément ou en chacune de leurs combinaisons techniquement opérantes.
Dans des modes de mise en œuvre de l’invention, l’étape de prétraitement est réalisée par une étape de standardisation dans laquelle pour chaque paramètre j mesuré, on centre chaque individu x(i,j) par la moyenne empirique μj de l’ensemble des valeurs du paramètre j et on divise par l’écart-type empirique σj.
Dans des modes de mise en œuvre de l’invention, l’étape de prétraitement est réalisée par une étape de standardisation robuste mettant en œuvre des indicateurs statistiques robustes.
Dans des modes de mise en œuvre de l’invention, à la suite de l’étape de détermination, une étape d’identification et de sélection d’un sous-ensemble d’individus dont l’indice d’atypicité est nul est réalisée.
Dans des modes de mise en œuvre de l’invention, lors de l’étape de détermination d’un indice d’atypicité multivarié, on somme les écarts en valeur absolue à la moyenne sur chaque variablep, pour chaque individuiet pour tout écart supérieur à une valeur de référencek.
Dans des modes de mise en œuvre de l’invention, on applique aux indices bruts d’atypicité multivarié la transformation suivante, avec Φ la fonction de répartition d’une loi inverse gaussienne:
Dans des modes de mise en œuvre de l’invention, l’étape de détermination d’un indice d’atypicité multivarié comporte une sous-étape dans laquelle on détermine l’indice d’atypicité d’individus formant un sous-ensemble dit « sous-ensemble de référence », et une sous-étape dans laquelle on détermine un indice d’atypicité multivarié d’un nouvel individu, l’étape d’identification des individus atypiques étant ensuite appliquée au nouvel individu au regard des indices d’atypicité des individus du sous-ensemble de référence, ledit nouvel individu étant alors intégré au sous-ensemble de référence s’il est considéré comme non atypique, et étant alors directement rejeté s’il est considéré comme atypique.
Dans des modes de mise en œuvre de l’invention, l’étape d’identification d’individus atypiques comporte des sous étapes dans lesquelles :
- les indices d’atypicitéz i déterminés des individus sont ordonnés par ordre croissant ;
- l’écart entre deux indices d’atypicitéz i consécutifs est mesuré ;
- des groupes d’individus ayant des indices d’atypicité statistiquement similaires sont déterminés et
- les individus, et plus particulièrement les groupes d’individus, atypiques sont identifiés sur la base d’un taux maximal d’individus atypiques acceptables prédéfini.
- les indices d’atypicitéz i déterminés des individus sont ordonnés par ordre croissant ;
- l’écart entre deux indices d’atypicitéz i consécutifs est mesuré ;
- des groupes d’individus ayant des indices d’atypicité statistiquement similaires sont déterminés et
- les individus, et plus particulièrement les groupes d’individus, atypiques sont identifiés sur la base d’un taux maximal d’individus atypiques acceptables prédéfini.
Dans des modes de mise en œuvre de l’invention, lors de l’étape d’identification d’individus atypiques, on détermine si le groupe d’individus dans lequel les individus présentent des indices d’atypicité les plus élevés comporte un nombre d’individu moins élevé qu’un seuil maximal d’individus atypiques acceptables prédéterminé en fonction du taux maximal prédéfini. Si c’est le cas, on procède à la détermination d’un ensemble de groupes comportant le premier groupe et le ou les groupes suivants par ordre successif et décroissant, de telle sorte que la somme des individus des groupes de l’ensemble soit inférieure au seuil prédéterminé.
Selon un autre aspect, la présente invention concerne également une utilisation du procédé tel que décrit précédemment, pour détecter des lots de vaccins atypiques dans un échantillon de lots de vaccins. C’est-à-dire que les individus sont des lots de vaccins.
Selon un autre aspect, la présente invention concerne également une utilisation du procédé tel que décrit précédemment, pour détecter des composants électroniques atypiques dans un échantillon de composants électroniques. C’est-à-dire que les individus sont des composants électroniques.
Selon un autre aspect, la présente invention concerne également une utilisation du procédé tel que décrit précédemment, pour détecter des mesures atypiques issues de données provenant de capteurs installés sur des équipements de production ou de mesure.
Ainsi, dans le présent texte, le terme « individu » s’étend également à des données représentatives de mesures.
Ces caractéristiques permettent avantageusement à l’invention de s’intégrer dans des applications de maintenance prévisionnelle, l’atypicité d’une mesure pouvant être un indicateur d’un défaut latent de l’équipement de production ou de mesure duquel sont issues les données.
Brève description des figures
L’invention sera mieux comprise à la lecture de la description suivante, donnée à titre d’exemple nullement limitatif, et faite en se référant aux figures qui représentent :
Dans ces figures, des références numériques identiques d’une figure à l’autre désignent des éléments identiques ou analogues. Par ailleurs, pour des raisons de clarté, les dessins ne sont pas à l’échelle, sauf mention contraire.
Le procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques selon la présente invention s’applique sur un jeu de données préalablement récoltées et caractérisées par une ou plusieurs mesures réalisées par des systèmes de mesures sur une pluralité d’individus.
Dans la présente demande un système de mesures peut être un testeur électrique, un système de mesure biologique, un capteur de mesure physique ou plus généralement tout outil adapté à réaliser une mesure.
Par exemple, ce jeu de données peut être organisé sous forme d’un tableau de données dont les lignes représentent n individus et dont les colonnes représentent p variables correspondant aux mesures effectuées sur les individus. Les valeurs de ces mesures sont numériques ou binaires.
Avantageusement, le jeu de données peut contenir un nombre de mesures différent pour chaque individu sans que cela soit préjudiciable au bon fonctionnement du procédé selon l’invention. En outre, le nombre de mesures peut être supérieur ou égal au nombre d’individus, et inversement, le nombre d’individus peut être supérieur ou égal au nombre de mesures, sans que cela impacte le fonctionnement du procédé selon l’invention.
Le jeu de données est issu d’un échantillon d’au moins trois individus, le nombre de variables pouvant être compris entre un et plusieurs milliers, la seule limite étant la puissance de calcul des moyens informatiques avec lesquels l’invention est destinée à être mise en œuvre.
A titre d’exemple d’application non limitatif, les individus peuvent être des composants électroniques, des lots de vaccins, etc.
En outre, les mesures peuvent être réalisées sur des paramètres ou des caractéristiques physiques d’individus produits par des moyens de production industrielle, par exemple en fin de production, dans le cadre d’un contrôle qualité desdits individus.
Comme le montre le logigramme de la figure 1, le procédé comporte les étapes successives de :
- prétraitement 100 des données ;
- détermination 200 d’un indice d’atypicité multivarié, ledit indice étant transformé par une fonction f pour être compris entre 0 et 1, sur l’ensemble des mesures pour chaque individu ;
- identification 300 des individus atypiques.
- prétraitement 100 des données ;
- détermination 200 d’un indice d’atypicité multivarié, ledit indice étant transformé par une fonction f pour être compris entre 0 et 1, sur l’ensemble des mesures pour chaque individu ;
- identification 300 des individus atypiques.
Le prétraitement des données permet d’obtenir des données indépendantes de leur unité ou de leur échelle de mesure.
Dans la suite du texte, on définitx 1 , …, x n ,nobservations caractérisées parpvariables quantitatives. Plus précisément, dans l’exemple d’application du procédé selon l’invention,x i représente l’ensemble des mesures effectuées sur la piècei.
Dans cette étape de prétraitement 100, on cherche à standardiser des données initialesx i, j afin d’obtenir de nouvelles donnéesy i, j .
Dans un exemple de réalisation de l’invention, l’étape de prétraitement 100 peut être réalisée par une étape de standardisation non robuste pouvant être caractérisée comme décrit ci-dessous.
Pour chaque paramètrejmesuré, on centre chaque individux i, j par la moyenne empiriqueμ j de l’ensemble des valeurs du paramètrejet on divise par l’écart-type empiriqueσ j :
Dans un autre exemple de réalisation de l’invention, l’étape de prétraitement 100 peut être réalisée par une étape de standardisation robuste.
Plus précisément, l’étape de standardisation robuste peut mettre en œuvre des indicateurs statistiques robustes tels que la médiane ou la moyenne tronquée en guise de paramètre de position, c’est-à-dire à la place de la moyenne empiriqueμ j dans l’équation formulée ci-avant, et de l’écart interquartile ou la déviation médiane absolue pour le paramètre d’échelle, c’est-à-dire à la place de l’écart-type empiriqueσ j dans l’équation formulée ci-avant.
Concrètement, l’étape de standardisation non robuste est préférée à l’étape de standardisation robuste en présence de données ne suivant pas une loi Normale ou lorsque les valeurs de ces données sont très extrêmes. En effet, les estimateurs non robustes comme la moyenne sont sensibles à la présence de valeurs extrêmes, contrairement à la médiane.
L’étape de détermination 200 d’un indice d’atypicité multivarié est ensuite mise en œuvre sur l’ensemble des mesures pour chaque individu.
Plus particulièrement, dans cette étape on cherche à déterminer un indice brut d’atypicité multivarié pour chaque pièce ou individuià partir des données prétraitéesy i, j .
A cet effet, pour chaque individui, on somme les écarts en valeur absolue à la moyenne sur chaque variablep, pour tout écart supérieur à une valeur de référencek, avec .
Les indices brut d’atypicité à valeurs dans subissent une transformationfqui les projettent entre [0,1]. On obtient alors des indices d’atypicitész i dont la valeur est comprise entre 0 et 1, ce qui les rend comparables les uns avec les autres.
Alternativement à la transformation précédente, on peut appliquer aux indices bruts d’atypicité la transformation suivante :
Avec Φ la fonction de répartition d’une loi inverse gaussienne de moyenne et de dispersion égales à 1.
Avantageusement, l’étape de détermination 200 d’un indice d’atypicité multivarié permet de créer un indice qui agrège les atypicités univariées, même faibles.
Plus particulièrement, l’indice d’atypicité permet d’identifier comme potentiellement atypiques des individus, d’une part, faiblement atypiques de manière univariée sur un grand nombre de paramètres, et d’autre part, fortement atypique sur un ou peu de paramètres.
Il y a lieu de noter que les individus dont l’indice d’atypicité est nul ne présente pas d’atypicité, et que plus un individu aura un indice d’atypicité proche de 1, plus il sera susceptible d’être atypique.
On comprend ici qu’un individu dont l’indice d’atypicité est non nul peut être soit non atypique soit atypique.
La présente invention permet donc avantageusement de détecter les individus ne présentant aucune atypicité, dans la mesure où l’indice d’atypicité d’un individu peut être nul. Si l’ensemble des individus présente un indice d’atypicité nul, il n’y a pas d’individu atypique dans l’échantillon d’individus analysé.
Ainsi, il est possible d’identifier et de sélectionner, à la suite de l’étape de détermination 200, un sous-ensemble d’individus dont on est sûr qu’ils ne sont pas atypiques, en identifiant et sélectionnant les individus dont l’indice d’atypicité est nul.
Ce sous-ensemble est appelé ici « sous-ensemble de référence ». Cette sélection des « meilleurs » individus, meilleurs au sens où ils n’ont aucune atypicité, n’est pas juste le symétrique de la procédure qui consiste à éliminer tous les atypiques car cette dernière juge statistiquement du niveau d’atypicité alors que la sélection d’un sous-ensemble de référence va plus loin en éliminant des individus qui ont un peu d’atypicité même si elle n’est pas avérée statistiquement.
La sélection d’un sous-ensemble de référence est particulièrement avantageuse, notamment car elle permet d’isoler des pièces ne présentant aucune atypicité et d’employer ces pièces. Ceci est capital dans certains types d’industrie, par exemple, dans l’industrie spatiale ou dans les grands programmes spatiaux, seules les pièces ne présentant aucune atypicité sont envoyées dans l’espace.
Pour résumer, le procédé selon l’invention permet d’identifier des individus atypiques et des individus ne présentant pas d’atypicité.
En outre, l’indice d’atypicité multivarié est calculable même s’il y a plus de variables que d’observations, contrairement à la plupart des méthodes de détection multivariée.
Cette particularité est particulièrement avantageuse dans la mesure où un nombre trop important de variables au regard du nombre d’observations peut générer un bruit susceptible d’empêcher ou de complexifier l’identification d’individus atypiques.
Enfin, ces caractéristiques permettent avantageusement de pouvoir appliquer le procédé à des jeux de données comportant des données manquantes.
La normalisation entre 0 et 1 des indices d’atypicité, à l’issue de l’étape de détermination 200 desdits indices, confère un avantage industriel important notamment quand la traçabilité des pièces n’est pas assurée lors de leur contrôle qualité après production.
En effet, grâce au procédé selon l’invention, dans un mode particulier de réalisation de l’invention, l’étape de détermination 200 d’un indice d’atypicité multivarié comporte une sous-étape dans laquelle on détermine un indice d’atypicité d’individus formant un sous-ensemble dit « sous-ensemble de référence », et une sous-étape dans laquelle on détermine un indice d’atypicité d’un nouvel individu.
L’étape d’identification 300 des individus atypiques est ensuite appliquée au nouvel individu au regard des indices d’atypicité des individus du sous-ensemble de référence.
Ledit nouvel individu est alors directement rejeté s’il est considéré comme atypique.
De façon alternative, l’étape de détermination 200 d’un indice d’atypicité multivarié peut comporter des sous-étape dans lesquelles on détermine l’indice d’atypicité d’individus formant le sous-ensemble de référence, puis on détermine des limites d’indices d’atypicité dudit sous-ensemble de référence sur la base des indices d’atypicité de ses individus. Par exemple, ces limites sont définies selon l’écart-type du sous-ensemble de référence, de typeμ±kσavec k=3 par exemple, μ et σ étant déterminés en fonction des valeurs du sous-ensemble de référence.
Ensuite, de manière analogue à ce qui a précédemment été décrit, on réalise une sous-étape de détermination d’un indice d’atypicité d’un nouvel individu.
Il est ainsi possible de réaliser un roulement du type « premier entré, premier sorti », connu de l’homme du métier sous l’acronyme anglophone « FIFO » pour « first in first out ».
Par conséquent, il est possible d’éliminer toute pièce atypique de façon intégrée au process de production industriel, en continue.
Ces modes de mise en œuvre dynamique de l’invention sont particulièrement avantageux dans les cas dans lesquels lors de la production la traçabilité des individus produits n’est pas assurée physiquement, et que les individus atypiques détectées avec les méthodes conventionnelles de détection d’individus atypiques, dites « post-processing », ne peuvent pas être rebutés.
Les méthodes de post-processing consistent à identifier statistiquement les individus atypiques à partir d’un échantillon d’individus, ensuite d’identifier physiquement les individus atypiques pour les éliminer. Ceci nécessite donc la traçabilité de chaque individu produit et de traiter un échantillon d’individus. La présente invention lève cette contrainte et permet d’éliminer les individus à la volée.
Il y a lieu de noter que grâce à la normalisation des indices d’atypicité, celui du nouvel individu observé est comparable à celui des autres individus, même s’il est issu d’un nouveau lot ce qui n’est pas forcément le cas avec les méthodes de détection statistiques connues.
L’étape d’identification 300 des individus atypiques peut consister préférentiellement à mettre en œuvre les sous-étapes suivantes :
- ordonner les indices d’atypicitéz i déterminés des individus par ordre croissant, comme le montre le graphe de la figure 2, soit :
- mesurer l’écart entre deux indices d’atypicitéz i consécutifs : Ces différencesw i suivent la loi de distribution suivante : de moyenne - identifier les individus atypiques par rapport à l’ensemble des individus.
- ordonner les indices d’atypicitéz i déterminés des individus par ordre croissant, comme le montre le graphe de la figure 2, soit :
- mesurer l’écart entre deux indices d’atypicitéz i consécutifs :
Cette dernière sous-étape est réalisée par identification de groupes d’individus ayant des indices d’atypicité statistiquement similaires. Cette identification est réalisée selon les écarts entre deux indices d’atypicité successifs.
Dans le graphe de la figure 2, les groupes d’individus sont séparés par des traits discontinus horizontaux.
Plus particulièrement, les écarts entre deux indices d’atypicité successifs supérieurs au α-ième percentile sont identifiés :
Dans l’exemple de réalisation représenté sur la figure 2, la valeur de percentile choisie est α = 90%.
On calcule ces écarts, car théoriquement les différences des écarts suivent la loi de distribution décrite précédemment en [Math.7], et le procédé peut s’appuyer sur un seuil théorique pour identifier des groupes d’individus.
Ainsi, une comparaison entre individus est avantageusement réalisée de sorte que si un individu est statistiquement atypique mais pas significativement beaucoup plus que les autres individus alors il n’est pas identifié comme atypique.
Grâce à cette opération d’identification, des groupes d’individus au niveau d’atypicité sensiblement semblables ou analogues sont déterminés. De cette manière l’ensemble des individus formant un groupe est identifié comme atypique ou comme non atypique. Ainsi, la fiabilité de la détection des individus atypique est considérablement augmentée dans la mesure où le procédé garanti que deux individus ayant un indice d’atypicité très proche sont tous les deux identifiés comme atypiques ou comme non atypiques. Et il est donc possible d’aller au-delà de la détection d’individus atypiques, puisqu’il est ainsi possible de générer un sous-ensemble d’individus présentant des indices d’atypicité homogènes.
Avantageusement, l’approche du procédé de la présente invention est ainsi d’identifier des groupes d’individus atypiques.
Les groupes d’individus au niveau d’atypicité sensiblement semblables ou analogues étant déterminés et les indices d’atypicitéz i déterminés des individus étant ordonnés par ordre croissant, les groupes sont, de fait, ordonnés par ordre croissant suivant le niveau d’atypicité de leurs individus respectifs, comme le montre la figure 2.
L’étape suivante du procédé est l’identification des groupes d’individus atypiques en fonction d’un taux maximal d’individus atypiques acceptables prédéterminé.
Dans l’exemple de réalisation représenté sur la figure 2, le taux maximal d’individus atypiques acceptables est de 10%. Le graphe représentant 57 individus, le seuil maximal d’individus atypiques acceptables est de 5.
Plus spécifiquement, lors de cette étape, on détermine si le groupe d’individus dans lequel les individus présentent des indices d’atypicité les plus élevés, dit « premier groupe », comporte un nombre d’individu inférieur ou égal au seuil maximal d’individus atypiques acceptables prédéterminé.
Si c’est le cas, alors tous les individus de ce groupe sont identifiés comme atypiques, sinon ils sont considérés comme non atypiques.
Si les individus du premier groupe sont identifiés comme atypiques, on procède à l’identification du groupe dont le ou les individus présentent des indices d’atypicité immédiatement inférieurs et chacun des groupes suivants, de façon successive, tant que la somme des individus dudit groupe ou de l’ensemble desdits groupes est inférieure ou égale au seuil maximal, les individus dudit ou desdits groupes identifiés étant alors identifiés comme atypiques.
En d’autres termes, si les individus du premier groupe sont identifiés comme atypiques, on cherche à savoir si ceux du groupe dans lequel les individus présentent des indices d’atypicité immédiatement inférieur à ceux du premier groupe, dit « deuxième groupe » le sont également.
Dans l’exemple représenté sur la figure 2, le premier groupe comporte un seul individu, la recherche d’individus atypiques est donc étendue au groupe suivant, c’est-à-dire au deuxième groupe.
On additionne alors ensuite le nombre d’individus des premier et deuxième groupes.
Si la somme des individus des premier et deuxième groupes est inférieure ou égale au seuil maximal, alors tous les individus du deuxième groupe sont également identifiés comme atypiques, sinon ils sont considérés comme non atypiques.
Dans l’exemple représenté sur la figure 2, le deuxième groupe comportant trois individus, la somme d’individus des premier et deuxième groupes est égale à quatre, la recherche d’individus atypique est étendue au groupe suivant, c’est-à-dire au troisième groupe. Les individus des premiers et deuxième groupe sont considérés comme atypiques.
On itère ces opérations jusqu’à identifier un groupe dont les individus sont non atypiques, c’est-à-dire, jusqu’à ce que la somme des individus des groupes étudiés soit supérieure au seuil maximal. A partir de ce groupe, tous les groupes suivants, c’est-à-dire les groupes présentant des individus dont les indices d’atypicité sont inférieurs à ceux des groupes étudiés, sont donc constitués individus non atypiques.
Dans l’exemple représenté sur la figure 2, comme le troisième groupe comporte un unique individu, la somme d’individus du premier au troisième groupes est égale à cinq. Les individus du premier au troisième groupes sont considérés comme atypiques, les individus des autres groupes étant considérés comme non atypiques.
Avantageusement, grâce à ces opérations, le taux de fausses alertes, c’est-à-dire d’erreur dans l’identifications d’individus atypiques, est sensiblement réduit, et ce, sans nécessiter d’imposer un taux strict d’individus atypiques à respecter.
Une fois détecté, les individus atypiques peuvent enfin être identifiés grâce à une traçabilité physique, ou bien être éliminés directement grâce au mode de mise en œuvre dynamique.
Alternativement, dans un autre mode de mise en œuvre du procédé selon l’invention, l’étape d’identification 300 des individus atypiques peut consister en l’application d’une méthode statistique sur l’indice d’atypicité pour détecter les individus atypiques.
Par exemple, on peut calculer une limite de typeμ±kσavec k=3 par exemple, μ et σ étant déterminés en fonction des valeurs de l’échantillon. Ces individus atypiques sont alors éliminés de la production, si le process de production des individus permet la traçabilité des individus produits.
La présente invention permet alors de revenir à un cas univarié dans la mesure où il n’y a qu’un seul indice d’atypicité par individu, mais en éliminant ou en limitant considérablement les fausses alarmes par rapport aux méthodes de détection statistiques de l’état de l’art.
De manière plus générale, il est à noter que les modes de mise en œuvre et de réalisation de l’invention considérés ci-dessus ont été décrits à titre d’exemples non limitatifs et que d’autres variantes sont par conséquent envisageables.
Claims (12)
- Procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un jeu de données préalablement récoltées, issues de mesures de paramètres d’individus réalisées par une pluralité de systèmes de mesures,caractérisé en ce qu’ilcomporte les étapes de :
- prétraitement 100 des données ;
- détermination 200 d’un indice d’atypicité multivarié, ledit indice étant transformé par une fonction f pour être compris entre 0 et 1, sur l’ensemble des mesures pour chaque individu, à partir des données prétraitées ;
- Identification 300 des individus atypiques. - Procédé selon la revendication 1, dans lequel l’étape de prétraitement est réalisée par une étape de standardisation dans laquelle pour chaque paramètre j mesuré, on centre chaque individu x(i,j) par la moyenne empirique μj de l’ensemble des valeurs du paramètre j et on divise par l’écart-type empirique σj.
- Procédé selon la revendication 1, dans lequel l’étape de prétraitement 100 est réalisée par une étape de standardisation robuste mettant en œuvre des indicateurs statistiques robustes.
- Procédé selon l’une des revendications 1 à 3, dans lequel à la suite de l’étape de détermination 200, une étape d’identification et de sélection d’un sous-ensemble d’individus dont l’indice d’atypicité est nul est réalisée.
- Procédé selon l’une des revendications 1 à 4, dans lequel lors de l’étape de détermination 200 d’un indice d’atypicité multivarié, on somme les écarts en valeur absolue à la moyenne sur chaque variablep, pour chaque individuiet pour tout écart supérieur à une valeur de référencekafin de déterminer un indice brut d’atypicité multivarié.
- Procédé selon la revendication 5, dans lequel on applique aux indices bruts d’atypicité multivarié la transformation suivante, avec Φ la fonction de répartition d’une loi inverse gaussienne:
- Procédé selon l’une des revendications 1 à 6, dans lequel l’étape de détermination 200 d’un indice d’atypicité multivarié comporte une sous-étape dans laquelle on détermine un indice d’atypicité d’individus formant un sous-ensemble dit « sous-ensemble de référence », et une sous-étape dans laquelle on détermine un indice d’atypicité multivarié d’un nouvel individu, l’étape d’identification 300 des individus atypiques étant ensuite appliquée au nouvel individu au regard des indices d’atypicité des individus du sous-ensemble de référence, ledit nouvel individu étant alors intégré au sous-ensemble de référence s’il est considéré comme non atypique, et étant rejeté s’il est considéré comme atypique.
- Procédé selon l’une des revendications 1 à 7, dans lequel l’étape d’identification 300 d’individus atypiques comporte des sous étapes dans lesquelles :
- les indices d’atypicitéz i déterminés des individus sont ordonnés par ordre croissant ;
- l’écart entre deux indices d’atypicitéz i consécutifs est mesuré ;
- des groupes d’individus ayant des indices d’atypicité statistiquement similaires sont déterminés et
- les individus atypiques sont identifiés sur la base d’un taux maximal d’individus atypiques acceptables prédéfini. - Procédé selon la revendication 8, dans lequel lors de l’étape d’identification 300 d’individus atypiques, on détermine si le groupe d’individus dans lequel les individus présentent des indices d’atypicité les plus élevés comporte un nombre d’individu moins élevé qu’un seuil maximal d’individus atypiques acceptables prédéterminé en fonction du taux maximal prédéfini, si c’est le cas, on procède à la détermination d’un ensemble de groupes comportant le premier groupe et le ou les groupes suivants par ordre successif et décroissant, de telle sorte que la somme des individus des groupes de l’ensemble soit inférieure au seuil prédéterminé.
- Utilisation du procédé selon l’une des revendications 1 à 9, pour détecter des lots de vaccins atypiques dans un échantillon de lots de vaccins.
- Utilisation du procédé selon l’une des revendications 1 à 9, pour détecter des composants électroniques atypiques dans un échantillon de composants électroniques.
- Utilisation du procédé selon l’une des revendications 1 à 9, pour détecter des mesures atypiques issues de données provenant de capteurs installés sur des équipements de production ou de mesure.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR2008243A FR3113151A1 (fr) | 2020-08-03 | 2020-08-03 | procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié |
IL293896A IL293896A (en) | 2020-08-03 | 2021-08-03 | A method for determining the level of abnormality of individuals, in particular in order to statistically identify abnormal individuals in a multivariable context |
JP2022540925A JP2023537652A (ja) | 2020-08-03 | 2021-08-03 | 特に多変量の状況において異常個体を統計的に検出するため、個体の異常レベルを決定する方法 |
PCT/EP2021/071671 WO2022029122A1 (fr) | 2020-08-03 | 2021-08-03 | Procédé de détermination du niveau d'atypicité d'individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié |
US17/784,615 US20230018313A1 (en) | 2020-08-03 | 2021-08-03 | Method for determining the level of unusualness of individuals, in particular in order to statistically detect unusual individuals in a multivariate context |
EP21754972.4A EP4189560A1 (fr) | 2020-08-03 | 2021-08-03 | Procédé de détermination du niveau d'atypicité d'individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR2008243A FR3113151A1 (fr) | 2020-08-03 | 2020-08-03 | procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié |
FR2008243 | 2020-08-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
FR3113151A1 true FR3113151A1 (fr) | 2022-02-04 |
Family
ID=74045562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR2008243A Pending FR3113151A1 (fr) | 2020-08-03 | 2020-08-03 | procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230018313A1 (fr) |
EP (1) | EP4189560A1 (fr) |
JP (1) | JP2023537652A (fr) |
FR (1) | FR3113151A1 (fr) |
IL (1) | IL293896A (fr) |
WO (1) | WO2022029122A1 (fr) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3010200B1 (fr) * | 2013-09-05 | 2015-09-18 | Snecma | Procede et dispositif de normalisation de valeurs de parametres de fonctionnement d'un moteur d'aeronef |
-
2020
- 2020-08-03 FR FR2008243A patent/FR3113151A1/fr active Pending
-
2021
- 2021-08-03 JP JP2022540925A patent/JP2023537652A/ja active Pending
- 2021-08-03 IL IL293896A patent/IL293896A/en unknown
- 2021-08-03 EP EP21754972.4A patent/EP4189560A1/fr active Pending
- 2021-08-03 WO PCT/EP2021/071671 patent/WO2022029122A1/fr active Application Filing
- 2021-08-03 US US17/784,615 patent/US20230018313A1/en active Pending
Non-Patent Citations (2)
Title |
---|
CHRISTOPHER J TRALIE ET AL: "Multi-scale Geometric Summaries for Similarity-based Sensor Fusion", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 13 October 2018 (2018-10-13), XP081069712 * |
SHUCHU HAN ET AL: "Supervised Feature Subset Selection and Feature Ranking for Multivariate Time Series without Feature Extraction", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 1 May 2020 (2020-05-01), XP081656918 * |
Also Published As
Publication number | Publication date |
---|---|
JP2023537652A (ja) | 2023-09-05 |
WO2022029122A1 (fr) | 2022-02-10 |
US20230018313A1 (en) | 2023-01-19 |
IL293896A (en) | 2022-08-01 |
EP4189560A1 (fr) | 2023-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102513713B1 (ko) | 결함 분류를 위한 방법 및 시스템 | |
JP5735499B2 (ja) | 基板処理中に自動的に障害状態を検出及び分類するための方法及び装置 | |
EP2376989B1 (fr) | Identification de defaillances dans un moteur d'aeronef | |
US20050055175A1 (en) | Industrial process fault detection using principal component analysis | |
KR102564629B1 (ko) | 공간 왜곡 유사도를 사용하는 툴 오류 분석 | |
EP2912526B1 (fr) | Système de surveillance d'un ensemble de composants d'un équipement | |
US8170707B2 (en) | Failure detecting method, failure detecting apparatus, and semiconductor device manufacturing method | |
TW202004947A (zh) | 基於製造資料針對性召回半導體裝置 | |
TWI791930B (zh) | 用於分類半導體樣本中的缺陷的系統、方法及電腦可讀取媒體 | |
WO2010086456A1 (fr) | Procédé de détection de composants électroniques atypiques | |
CN113488401B (zh) | 一种芯片测试方法及装置 | |
FR3113151A1 (fr) | procédé de détermination du niveau d’atypicité d’individus, permettant notamment de détecter statistiquement des individus atypiques dans un cadre multivarié | |
CN117272122B (zh) | 晶圆异常的共性分析方法及装置、可读存储介质、终端 | |
FR3026882A1 (fr) | Procede de determination d'au moins un equipement defaillant d'un aeronef et systeme correspondant | |
US8682058B2 (en) | Defect analysis method, apparatus, and recording medium using pattern dependence degree | |
FR3124868A1 (fr) | Procédé de contrôle d’un système et produit programme d’ordinateur associé | |
FR2916290A1 (fr) | Systeme de selection d'une donnee representative d'un parametre de l'air, procede et programme d'ordinateur associes | |
JP7025459B2 (ja) | 半導体試料の欠陥を分類する方法およびそのシステム | |
EP3846047A1 (fr) | Procédé et système d'identification de variables pertinentes | |
US9437506B2 (en) | Semiconductor defect characterization | |
CN110226160B (zh) | 状态分析装置、状态分析方法、以及存储介质 | |
EP2533063A1 (fr) | Système d'analyse de données de test de semiconducteurs | |
FR3136856A1 (fr) | Méthode de validation des prédictions d’un modèle supervisé d’analyse quantitative multivariée de données spectrales | |
FR3064387A1 (fr) | Procede de fabrication de pieces base sur une analyse de stabilite d'une dimension caracteristique | |
FR2918775A1 (fr) | Normalisation des variables de processus dans un processus de fabrication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20220204 |
|
PLFP | Fee payment |
Year of fee payment: 3 |
|
PLFP | Fee payment |
Year of fee payment: 4 |
|
PLFP | Fee payment |
Year of fee payment: 5 |