FR3034230A1

FR3034230A1 - Procede d'explication d'un score

Info

Publication number: FR3034230A1
Application number: FR1500602A
Authority: FR
Inventors: Helia Pouyllau; Christophe Labreuche; Benedicte Goujon
Original assignee: Thales SA
Current assignee: Thales SA
Priority date: 2015-03-26
Filing date: 2015-03-26
Publication date: 2016-09-30
Also published as: CA2980875A1; WO2016151145A1; IL254658A0; US20180060746A1; CN107660288A; US11195110B2; CN107660288B; IL254658B; SG11201707927RA; EP3274929A1

Abstract

Il est proposé un procédé d'explication d'un score comprenant au moins des étapes de : a1) fourniture d'un premier score associé à un premier vecteur contenant des premières valeurs des paramètres, b) génération d'un premier ensemble de listes, chaque liste comprenant un deuxième nombre d'indicateurs, c) génération, à partir d'une liste, d'au moins un troisième vecteur dans lequel chaque paramètre présente une troisième valeur, la troisième valeur étant égale à la première valeur correspondante lorsque la liste ne comprend pas un indicateur du paramètre correspondant, et différente de la premièrevaleur correspondante dans le cas contraire, d) calcul du score d'au moins un troisième vecteur, e) évaluation, à partir des scores des troisièmes vecteurs, d'un indicateur d'importance de chaque paramètre, f) élaboration d'une explication du premier score.

Description

1 Procédé d'explication d'un score La présente invention concerne un procédé d'explication d'un score associé à un vecteur par une fonction. L'invention se rapporte également à un produit programme d'ordinateur associé et à un support d'information sur lequel est encodé un tel produit programme d'ordinateur. L'invention concerne aussi un système d'explication d'un score associé à un vecteur par une fonction. Dans de nombreux domaines, des systèmes d'aide à la décision sont utilisés pour évaluer des choix s'offrant à des décideurs. Par exemple, un banquier évalue la capacité de remboursement d'un client en se basant sur des informations telles que le salaire mensuel, l'existence de prêts antérieurs ou le capital apporté par le client. Ces données sont regroupées par le système d'aide à la décision, qui calcule un score à partir de ces données. Le banquier décide alors, en fonction du score obtenu par le client, de lui accorder ou non un prêt et, le cas échéant, à quel taux.

Le système d'aide à la décision utilise, pour calculer le score, un modèle mathématique établi à partir des connaissances d'experts du domaine d'application concerné. Ainsi, un tel système d'aide à la décision permet de prendre rapidement une décision qui peut, être complexe, notamment dans le cas où chaque, alternative comprend un grand nombre de paramètres. En effet, au lieu de devoir considérer l'ensemble des paramètres, dont certains peuvent être favorables et d'autres défavorables, le décideur n'a à considérer que le score calculé. En outre, de tels modèles mathématiques sont en général élaborés à partir de l'expertise de plusieurs experts. Cependant, le modèle mathématique utilisé peut ne pas s'appliquer de la même manière à toutes les situations et sa complexité peut rendre le score global peu compréhensible pour le décideur. Ceci est d'autant plus vrai que le nombre de paramètres considérés est élevé. Il peut donc être important pour le décideur de savoir quels paramètres ont joué le rôle le plus important dans le calcul du score, afin de pouvoir adapter en conséquence la décision prise. Il existe donc des procédés permettant de générer une explication d'un score.

Cependant, la mise en oeuvre de tels procédés suppose un grand nombre de calculs, et le temps nécessaire à l'élaboration de l'explication peut être trop élevé pour certains domaines d'application. Si le temps de calcul est réduit, le procédé perd en précision. En outre, l'explication générée n'est pas toujours pertinente. De plus, de tels procédés sont en général liés au système d'aide à la décision utilisé : les explications sont générées à partir du modèle mathématique utilisé. Il n'est donc pas aisé d'adapter les procédés existants à des systèmes utilisant d'autres modèles 3034230 2 mathématiques. Ainsi, les procédés d'explication existants supposent la connaissance du modèle mathématique avec lequel il sera utilisé. Il existe donc un besoin pour un procédé d'explication d'un score, obtenu à l'aide d'une fonction connue ou non, présentant de meilleures performances notamment en 5 ternies de pertinence de l'explication. A cet effet, il est proposé un procédé d'explication d'un score associé à un vecteur d'un premier nombre de paramètres par une fonction, chaque paramètre étant ordonné avec un indicateur variant de un au premier nombre, le premier nombre étant un nombre entier strictement supérieur à un, le procédé comprenant au moins des étapes de : 10 a1) fourniture d'un premier score associé à un premier vecteur contenant des premières valeurs des paramètres, b) génération d'un premier ensemble de listes, chaque liste comprenant un deuxième nombre d'indicateurs, le deuxième nombre étant un nombre entier strictement inférieur au premier nombre et supérieur strictement à zéro, 15 c) génération, à partir d'une liste, d'au moins un troisième vecteur dans lequel chaque paramètre présente une troisième valeur, la troisième valeur étant égale à la première valeur correspondante lorsque la liste ne comprend pas un indicateur du paramètre correspondant, et différente de la première valeur correspondante dans le cas contraire, 20 d) calcul du score d'au moins un troisième vecteur, e) évaluation, à partir des scores des troisièmes vecteurs calculés, d'un indicateur d'importance de chaque paramètre, f) élaboration, à partir des indicateurs d'importance évalués, d'une explication du premier score.

25 Suivant un mode de réalisation particulier, le procédé comprend une ou plusieurs des caractéristiques suivantes, prise(s) isolément ou suivant toutes les combinaisons techniquement possibles : - les indicateurs d'importance calculés lors de l'étape e sont soit des valeurs de Shapley, soit des indices de Sobol ; 30 - le premier ensemble comprend un nombre total de listes, le nombre total vérifiant l'inégalité mathématique : Nt < Co* 2N' dans laquelle Co est un coefficient prédéterminé ; 3034230 3 - l'étape b comprend la génération d'au moins une partie des listes du premier ensemble selon une loi de probabilité portant soit sur le deuxième nombre soit sur les indicateurs contenus dans la liste ; - l'étape b comprend la génération de toutes les listes dont le deuxième nombre est inférieur ou égal à un deuxième nombre entier prédéterminé strictement inférieur au premier nombre ; - le procédé comprend, en outre, une étape a2 de fourniture d'un deuxième score associé à un deuxième vecteur contenant des deuxièmes valeurs des paramètres, et dans lequel, lors de l'étape c, la troisième valeur est égale à la deuxième 10 valeur correspondante lorsque la liste comprend un indicateur du paramètre correspondant ; Il est également proposé un procédé d'explication d'un score associé à un vecteur par une fonction, la fonction présentant un maximum global associé à un premier vecteur extrême et un minimum global associé à un deuxième vecteur extrême, le 15 procédé comprenant : g1) la mise en oeuvre, à partir du premier score et du maximum global, des étapes b à e d'un procédé d'explication tel que défini ci-dessus pour obtenir des premiers indicateurs d'importance, g2) la mise en oeuvre, à partir du premier score et du minimum global, des 20 étapes b à e d'un procédé d'explication tel que défini ci-dessus pour obtenir des deuxièmes indicateurs d'importance, et h) génération, à partir des premiers et deuxièmes indicateurs d'importance, d'une explication du premier score. Il est également proposé un produit programme d'ordinateur comportant des 25 instructions logicielles qui, lorsqu'elles sont exécutées par un ordinateur, mettent en oeuvre un procédé d'explication tel que décrit ci-dessus. Il est également proposé un support d'informations sur lequel est mémorisé un produit programme d'ordinateur tel que décrit ci-dessus. Il est également proposé un système d'explication d'une fonction associant un 30 score à un vecteur d'un premier nombre de paramètres, chaque paramètre étant ordonné avec un indicateur variant de un au premier nombre, le premier nombre étant un nombre entier strictement supérieur à un, le système étant propre à : - fournir un premier score associé à un premier vecteur contenant des premières valeurs des paramètres, 3034230 4 - générer un premier ensemble de listes, chaque liste comprenant un deuxième nombre d'indicateurs, le deuxième nombre étant un nombre entier inférieur strictement au premier nombre et supérieur strictement à zéro, - générer, à partir d'une liste, d'au moins un troisième vecteur dans lequel 5 chaque paramètre présente une troisième valeur, la troisième valeur étant égale à la première valeur correspondante lorsque la liste ne comprend pas un indicateur du paramètre correspondant, et différente de la première valeur correspondante dans le cas contraire, - calculer le score d'au moins un troisième vecteur, 10 - évaluer, à partir des scores calculés pour chacun des troisièmes vecteurs, un indicateur d'importance de chaque paramètre, - élaborer, à partir des indicateurs d'importance évalués, une explication du premier score. Les caractéristiques et avantages de l'invention apparaîtront à la lecture de la 15 description qui va suivre, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels : - la figure 1 est une vue schématique d'un exemple de système permettant la mise en oeuvre d'un procédé d'explication ; - la figure 2 est un organigramme d'un premier exemple de mise en oeuvre d'un 20 procédé d'explication ; - la figure 3 est une représentation graphique de vecteurs utilisés et/ou générés par le procédé d'explication de la figure 2 ; - la figure 4 est un organigramme d'un autre exemple de mise en oeuvre d'un procédé d'explication ; 25 - la figure 5 est un organigramme d'un autre exemple de mise en oeuvre d'un procédé d'explication ; Un système 10 et un produit programme d'ordinateur 12 sont représentés sur la figure 1. L'interaction du produit programme d'ordinateur 12 avec le système 10 permet de 30 mettre en oeuvre un procédé. Le système 10 est un ordinateur. Plus généralement, le système 10 est un calculateur électronique propre à manipuler et/ou transformer des données représentées comme des quantités électroniques ou physiques dans des registres du système 10 et/ou des mémoires en 35 d'autres données similaires correspondant à des données physiques dans des mémoires, 3034230 5 des registres ou d'autres types de dispositifs d'affichage, de transmission ou de mémorisation. Le système 10 comporte une unité de traitement de données 14 comprenant un processeur 16, des mémoires 18 et un lecteur 20 de support d'informations. Le système 5 10 comprend également un clavier 22 et une unité d'affichage 24. Le produit programme d'ordinateur 12 comporte un support lisible d'informations 20. Un support lisible d'informations 20 est un support lisible par le système 10, usuellement par l'unité de traitement d'informations 14. Le support lisible d'informations 10 20 est un médium adapté à mémoriser des instructions électroniques et capables d'être couplé à un bus d'un système informatique. A titre d'exemple, le support lisible d'informations 20 est un disque optique, un CD- ROM, un disque magnéto-optique, une mémoire ROM, une mémoire RAM, une mémoire EPROM, une mémoire EEPROM, une carte magnétique ou une carte optique.

15 Sur le support lisible d'informations 20 est mémorisé le programme comprenant des instructions de programme. Le programme d'ordinateur est chargeable sur l'unité de traitement de données 14 et est adapté pour entraîner la mise en oeuvre d'un procédé d'explication d'un, score associé à un vecteur par une fonction lorsque le programme d'ordinateur est mis en 20 oeuvre sur le processeur 16. Le fonctionnement du système 10 en interaction avec le produit programme d'ordinateur 12 est maintenant décrit en référence à la figure 2 qui illustre un exemple de mise en oeuvre d'un procédé d'explication d'un score associé à un vecteur par une fonction.

25 Ce procédé sera expliqué ci-dessous à l'aide du cas simplifié, donné uniquement à titre d'exemple, de la comparaison entre deux automobiles. La fonction est notée U dans la suite. La fonction U associe un score à un vecteur. La fonction U est, par exemple, une intégrale de Choquet. L'intégrale de Choquet est une intégrale définie par le mathématicien Gustave Choquet en 1953. L'intégrale de 30 Choquet a initialement été utilisée dans le cadre de la mécanique statistique et de la théorie du potentiel avant d'être appliquée à la théorie de la décision dans les années 1980. L'intégrale de Choquet permet de représenter, entre autres, des stratégies de décision complexes telles que des critères de veto, des critères de préférence, des synergies entre critères et la redondance entre des critères.

35 En variante, la fonction U est un modèle d'Indépendance Additive Généralisée. Introduit par Fishburn en 1970, le modèle d'Indépendance Additive Généralisée construit 3034230 6 une fonction U par addition de fonctions d'utilité u portant chacune sur un sous-ensemble de paramètres. Les modèles d'Indépendance Additive Généralisée permettent la modélisation de décisions où les paramètres ne sont pas indépendants individuellement, mais où l'on observe des indépendances entre des sous-ensembles de paramètres (pas 5 forcément disjoints). Ainsi un paramètre peut être utilisé par plusieurs fonctions d'utilité u lorsque le paramètre est présent dans plusieurs sous-ensembles. L'importance d'un paramètre dans le score obtenu est donc difficile à établir. En variante, la fonction U est une somme pondérée. Chaque score est noté Uv, où V est le nom du vecteur. Ainsi, pour un premier 10 vecteur X, le premier score associé est noté Ux, et pour un deuxième vecteur Y, le deuxième score associé est noté Uy. Le score Ux,Uy est une valeur unique associée au vecteur X,Y par la fonction U. Le score Ux, Uy est, de préférence, un nombre réel. Chaque vecteur X,Y est un ensemble de valeurs xi,yi, chaque valeur xi,yi étant 15 associée à un paramètre. De préférence, chaque paramètre est distinct. Chaque vecteur X,Y contient un premier nombre N1 de valeurs xi, yi des paramètres. Chaque valeur xi, yi est repérée par un indice i représentatif de la position de la 20 valeur xi, yi dans chaque vecteur X, Y. Par exemple, chaque vecteur X, Y prend la forme d'un N1-uplet de valeurs xi, yi. Chaque vecteur X, Y comprend une unique valeur xi, yi de chaque paramètre. De préférence, chaque vecteur X, Y prend la forme d'un N1-uplet de valeurs xi, yi, et la valeur xi, yi associée au paramètre Xi occupe la même position dans chaque 25 vecteur X, Y. Le premier nombre N1 est un nombre entier strictement supérieur à un. Par exemple, le premier nombre N1 est supérieur ou égal à 3, de préférence supérieur ou égal à 10, de préférence supérieur ou égal à 15, de préférence supérieur ou égal à 20, de préférence supérieur ou égal à 50, de préférence supérieur ou égal à 100.

30 Chaque paramètre est une caractéristique d'une entité. Les paramètres sont notés Xi, où i est l'indice représentatif de la position de la valeur xi, yi associée au paramètre Xi dans chaque vecteur X, Y. L'indice i est un indicateur du paramètre Xi. Cela signifie que chaque indice i est associé à un unique paramètre Xi, et réciproquement.

35 Les paramètres Xi sont donc ordonnés par l'indice i.

3034230 7 L'indice i est un nombre entier. L'indice i est, d'une part, supérieur ou égal à un, et d'autre part inférieur ou égal au premier nombre N1. A titre d'exemple, l'entité est un objet physique, un concept, une action, ou bien encore un ensemble d'actions ou un ensemble d'objets physiques. 5. Par exemple, l'entité comporte cinq paramètres qui sont, dans l'ordre : un premier paramètre X1, un deuxième paramètre X2, un troisième paramètre X3, un quatrième paramètre X4, et un cinquième paramètre X5. Par exemple, l'entité est une automobile. Dans ce cas, le premier paramètre X1 est le prix en Euros de l'automobile, le deuxième paramètre X2 est le nombre de 10 places assises dans l'automobile, le troisième paramètre X3 est le nombre de portes de l'automobile, le quatrième paramètre X4 est la consommation de carburant en litres pour cent kilomètres parcourus, et le cinquième paramètre X5 est la puissance en chevaux du moteur. Chaque paramètre X, peut prendre une pluralité de valeurs xi, yi comprises dans 15 une plage Pi respective. La plage Pi est, par exemple, continue. Par exemple, chaque valeur x4, y4 du quatrième paramètre X4 (« consommation ») est un nombre réel strictement supérieur à 2 et strictement inférieur à 15. Selon un autre exemple, la plage Pi est une plage discrète. Par exemple, chaque 20 valeur x2, y2 du deuxième paramètre X2 (« nombre de places ») est un nombre entier supérieur ou égal à 1 et inférieur ou égal à 8. Le procédé d'explication comprend une étape 100 de fourniture, une étape 110 de génération d'un premier ensemble El de listes Lj, une étape 120 d'initialisation, une étape 130 de sélection d'une liste Lj, une étape 140 de génération d'un troisième vecteur, 25 une étape 150 de calcul, une étape 160 d'évaluation, une étape 170 de sélection d'un ensemble de paramètres Xi, et une étape 180 d'élaboration d'une explication. Lors de l'étape 100 de fourniture, un premier score Ux et un deuxième score Uy sont fournis. Le premier score Ux est associé à un premier vecteur X par la fonction U. Le 30 premier vecteur X contient le premier nombre N1 de premières valeurs xi des paramètres Xi. Le deuxième score Uy est associé à un deuxième vecteur Y par la fonction U. Le premier score Ux est, par exemple, strictement supérieur au deuxième score Uy.

35 Le deuxième vecteur Y contient le premier nombre N1 de deuxièmes valeurs yi des paramètres Xi.

3034230 8 Dans le cas où chaque entité est une automobile, le premier vecteur X et le deuxième vecteur Y représentent deux automobiles A et B à comparer. Le premier vecteur X (10 000 ; 5 ; 3 ; 4,5 ; 75) représente l'automobile A, et le deuxième vecteur Y (12 000 ; 6 ; 5 ; 4,8 ; 80) représente l'automobile B.

5 Par exemple, le premier vecteur X et le deuxième vecteur Y sont générés par un dispositif d'acquisition externe au système 10, et transmis par le dispositif d'acquisition au système 10 qui calcule le premier score Ux à partir du premier vecteur X, et le deuxième score Uy à partir du deuxième vecteur Y. Dans l'exemple ci-dessus, le premier vecteur X est transmis par un utilisateur au 10 système 10 par l'intermédiaire du clavier 22. L'utilisateur entre tout d'abord la première valeur x1, égale à 10000 et représentant le prix de l'automobile A. Puis, l'utilisateur tape la première valeur x2, égale à 5 et représentant le nombre de places de l'automobile A.

15 Ensuite, l'utilisateur tape la première valeur x3 égale à 3 et représentant le nombre de portes de l'automobile A. Puis, l'utilisateur transmet la première valeur x4 égale à 4,5 et représentant la consommation de carburant de l'automobile A. Enfin, l'utilisateur tape la première valeur x5 égale à 75 et représentant la 20 puissance du moteur de l'automobile A. En variante, le premier score Ux et le deuxième score Uy sont fournis par un dispositif externe au système 10. A l'issue de l'étape 110 de génération, il est généré un premier ensemble El de listes.

25 Chaque liste est notée Lj, où j est un indice repérant la position de la liste Lj dans le premier ensemble E1. Chaque liste Lj comprend au moins un indicateur d'un paramètre Xi. Chaque indicateur compris dans la liste Lj est noté ij. En effet, chaque indicateur ij est associé à un paramètre Xi, et contenu dans une liste Lj.

30 Chaque indicateur est associé à un unique paramètre Xi, et vice-versa. Chaque liste Lj est donc propre à définir un sous-ensemble SE2j de paramètres Xi. Cela signifie qu'un paramètre Xi est dans le sous-ensemble SE2j associé à la liste Lj si et seulement si la liste Lj contient l'indicateur ij associé au paramètre Xi. Chaque liste Li comprend un deuxième nombre N2j d'indicateurs ij des 35 paramètres Xi.

3034230 9 Le deuxième nombre N2j est un nombre entier strictement supérieur à zéro. Le deuxième nombre N2j est strictement inférieur au premier nombre Nl. Par exemple, le premier ensemble El contient une première liste Ll, une deuxième liste L2 et une troisième liste L3. La première liste Ll contient l'indicateur 11 du premier paramètre X1 , l'indicateur 31 du troisième paramètre X3, et l'indicateur 51 du cinquième paramètre X5. La deuxième liste L2 contient l'indicateur 22 du deuxième paramètre X2, et l'indicateur 42 du quatrième paramètre X4. La troisième liste L3 contient l'indicateur 13 du premier paramètre X1, et 10 l'indicateur 23 du deuxième paramètre X2. Par exemple, la liste Lj est un N2j-uplet d'indicateurs ij, chaque indicateur ij de la liste Lj étant un nombre entier égal à l'indice i du paramètre Xi correspondant. Selon cet exemple, la première liste Ll est (1,3,5), la deuxième liste L2 est (2,4), et la troisième liste L3 est (1,2) 15 Dans un exemple préférentiel, chaque indicateur ij est un nombre entier égal à 1. La liste Lj est un N1-uplet contenant N2j indicateurs ij et des éléments ei,j. Chaque élément ei,j est un nombre égal à zéro. L'indicateur ij associé au paramètre Xi est situé en i-ème position dans la liste Lj. Selon cet exemple préférentiel, la première liste Ll est le 5-uplet (1 ; 0 ; 1 ; 0 ; 1), 20 la deuxième liste L2 est le 5-uplet (0 ; 1 ; 0 ; 1 ; 0) et la troisième liste L3 est le 5-uplet (1 ; 1 ; 0 ; 0 ; 0). Dans un autre exemple, chaque indicateur ij est le nom du paramètre Xi correspondant. Le premier ensemble El comprend une pluralité de premiers sous-ensembles SE1 25 comprenant chacun un troisième nombre N3 de listes Lj. Chaque premier sous- ensemble SE1 regroupe toutes les listes Lj comprenant le même deuxième nombre N2j d'indicateurs ij. Le premier ensemble El contient un nombre total Nt de listes Lj. Le nombre total Nt de listes Lj est inférieur ou égal au produit d'un coefficient Co et 30 du nombre maximum Nm de listes Lj possibles. Le nombre maximum Nm est égal à deux à la puissance du premier nombre Nl. L'inégalité s'écrit donc mathématiquement : Nt Co * 2N' Le coefficient Co est un nombre réel prédéterminé. Le coefficient Co est, par exemple, strictement inférieur à un. De préférence, le 35 coefficient Co est égal à un dixième.

3034230 10 Au moins une partie des listes Lj du premier ensemble El sont générées selon une loi de probabilité P. La loi de probabilité P porte, par exemple, sur les indicateurs ij contenus dans chaque liste Lj.

5 Par exemple, les listes -sont générées aléatoirement selon un algorithme d'hypercube latin. Cela signifie que le troisième nombre N3 de chaque premier sous-ensemble SE1 est égal à un premier nombre prédéterminé Np, le premier nombre prédéterminé Np étant commun à chaque premier sous-ensemble SE1, et les listes Lj de chaque premier sous-ensemble SE1 sont générées aléatoirement.

10 Cela signifie que les indicateurs ij de chaque liste sont générés suivant une loi de probabilité P dans laquelle chaque indicateur ij a une probabilité égale à celle de chaque autre indicateur ij d'être contenu dans la liste Lj. Dans le cas où le premier nombre prédéterminé Np est égal à trois, le premier ensemble El comprend trois listes Lj contenant un seul indicateur ij, trois listes contenant 15 deux indicateurs ij, et ainsi de suite. Selon un autre exemple, la loi de probabilité P porte sur le deuxième nombre N2j de chaque liste. Cela signifie que la loi de probabilité P est utilisée par le système 10 pour déterminer le nombre de listes Li de chaque premier sous-ensemble:SE1, et les listes Lj de chaque premier sous-ensemble SE1 sont générées aléatoirement.

20 De préférence, le troisième nombre N3 de chaque premier sous-ensemble SE1 est calculé, au cours de l'étape 110 de génération du premier ensemble E1, suivant une loi de Gauss (également appelée « loi normale »). La loi de Gauss est une loi de probabilité dans laquelle la densité de probabilité f(N3) est donnée par l'équation : 25 f (N3) = 1 ( N3-0- p )2 e 2 dans laquelle : - a est l'écart-type de la loi de Gauss, - p est l'espérance de la loi de Gauss, - -rr est le rapport du périmètre d'un cercle à son diamètre, et 30 - e désigne la fonction exponentielle. En variante, la loi de probabilité P est une loi uniforme ou normale portant sur le nombre total de listes Nt.

3034230 11 En variante, le coefficient Co est égal à un. Cela signifie que toutes les listes Lj possibles sont générées. A l'issue de l'étape 120 d'initialisation, un indicateur d'importance Ri de chaque paramètre Xi est généré.

5 L'indicateur d'importance Ri est une grandeur représentative de l'importance que- le paramètre Xi a dans le calcul du premier score Ux et du deuxième score Uy. De préférence, l'indicateur d'importance Ri est représentatif de l'importance du paramètre Xi dans la différence entre le premier score Ux et le deuxième score Uy. L'indicateur d'importance Ri est un élément d'un espace totalement ordonné. Cela 10 signifie que chaque indicateur d'importance Ri est propre à être comparé à chaque autre indicateur d'importance Ri. L'indicateur d'importance Ri est, de préférence, un nombre réel. L'indicateur d'importance Ri est, par exemple, une valeur de Shapley. La valeur de Shapley est une grandeur développée dans le cadre de la théorie des 15 jeux. Dans le cadre d'un jeu coopératif dans lequel des joueurs doivent s'allier pour parvenir à un objectif, la valeur de Shapley est évaluée pour chaque joueur à partir du nombre de coalitions gagnantes comprenant le joueur et devenant perdantes si le joueur se retire de la coalition. La valeur de Shapley permet donc d'évaluer le pouvoir d'un joueur (c'est-à-dire sa capacité à influer sur le résultat final), et est, en particulier, utilisée 20 pour déterminer la répartition des gains en cas de victoire. Dans notre cas, la valeur de Shapley Ri est évaluée pour chaque paramètre Xi et permet d'évaluer l'importance du paramètre Xi dans la différence entre le premier score Ux et le deuxième score Uy. En variante, l'indicateur d'importance Ri est un indice de Sobol.

25 Les indices de Sobol sont des estimations de la sensibilité d'une fonction d'au moins un paramètre à une variation de ce paramètre. L'indice de sensibilité du premier ordre de la fonction U au paramètre Xi est défini à partir de la variance V(U) de la fonction U par l'équation: Ri(U)- V (E(U I Xi)) V(U) 30 dans laquelle E(Lei) est l'espérance de la fonction U lorsque le paramètre Xi est fixé. La valeur de chaque indicateur d'importance Ri est fixée égale à zéro. A l'issue de l'étape 130 de sélection, une liste Lj est sélectionnée. Par exemple, si aucune liste Lj n'a été sélectionnée au cours d'une précédente 35 étape 130 de sélection, la liste L1 d'indice j égal à un est sélectionnée.

3034230 12 L'indice j de la liste Lj est, par exemple, mémorisé dans la mémoire 18. Dans l'exemple donné ci-dessus de la comparaison entre deux automobiles, la liste L1 (1 ; 0 ; 1 ; 0 ; 1) est sélectionnée. A l'issue de l'étape 140 de génération, un troisième vecteur Cj et au moins un 5 quatrième vecteur Di,j sont générés. Le troisième vecteur Cj comprend des troisièmes valeurs ci,j des paramètres Xi. Le troisième vecteur Cj est généré à partir de la liste Lj sélectionnée et au moins du premier vecteur X. Chaque troisième valeur ci,j est égale à la première valeur xi correspondante 10 lorsque la liste Lj ne comprend pas un indicateur ij du paramètre Xi correspondant. Dans le cas contraire, la troisième valeur ci,j est différente de la première valeur xi. De préférence, lorsque la liste Lj comprend un indicateur ij du paramètre Xi, la troisième valeur ci,j correspondante est égale à la deuxième valeur yi correspondante. Dans le cas donné de la comparaison entre deux automobiles, le troisième 15 vecteur Cl (12 000 ; 5 ; 5 ; 4,5; 80) est généré à partir de la liste Ll (1 ; 0 ; 1 ; 0 ; 1), du premier vecteur X (10 000 ; 5 ; 3 ; 4,5 ; 75), et du deuxième vecteur Y (12 000 ; 6 ; 5 ; 4,8 ; 80). Le premier vecteur .X, le deuxième vecteur Y et le troisième ,vecteur Cl sont représentés graphiquement en trois dimensions sur la figure 3. Seuls le premier 20 paramètre X1, le deuxième paramètre X2 et le troisième paramètre X3 ont été représentés, pour des raisons de clarté. A l'issue de l'étape 140 de génération, un quatrième vecteur est également généré, pour chaque paramètre Xi, à partir du troisième vecteur Cj. Le quatrième vecteur est noté Di,j, et repéré par l'indice j du troisième vecteur Cj et 25 par l'indice i du paramètre Xi. Chaque quatrième vecteur Di,j comprend des quatrièmes valeurs des paramètres Xi. Chaque quatrième valeur du quatrième vecteur Di,j est notée di,j,m, où m est un indice entier repérant la position de la quatrième valeur di,j,m dans le quatrième 30 vecteur Di,j. L'indice m -de la quatrième valeur di,j,m est supérieur ou égal à un, et inférieur ou égal au premier nombre Nl. Chaque quatrième valeur di,j,m est égale à la troisième valeur ci,j correspondante si l'indice m de la quatrième valeur di,j,m est différent de l'indice i du paramètre Xi. Dans le cas contraire, la quatrième valeur di,j,m est différente de la troisième 35 valeur ci,j. De préférence, la quatrième valeur di,j,m est égale à la première valeur xi si la 3034230 13 troisième valeur ci,j est égale à la deuxième valeur yi, et est égale à la deuxième valeur yi si la troisième valeur ci,j est égale à la première valeur xi. En d'autres termes, le quatrième vecteur.Dij associé au paramètre Xi d'indice i est construit, à partir du troisième vecteur Cj, en remplaçant la troisième valeur ci,j d'indice i, et uniquement celle-ci, par, selon les cas, la première valeur xi ou la deuxième valeur yi correspondante de manière à ce que le quatrième vecteur Di,j soit différent du troisième vecteur Cj. Dans le cas donné en exemple de la comparaison entre deux automobiles, cinq quatrièmes vecteurs Di,1 sont générés à partir du troisième vecteur Cl (12 000 ; 5 ; 5 ; 10 4,5; 80). Le quatrième vecteur D1,1 (10 000 ; 5 ; 5 ; 4,5 ; 80) est généré pour le premier paramètre Xl. Seule la quatrième valeur d'indice m, qui est égal à un, est différente de la troisième valeur c1,1 correspondante. Le quatrième vecteur D2,1 (12 000 ; 6 ; 5 ; 4,5 ; 80) est généré pour le deuxième 15 paramètre X2. Seule la quatrième valeur d'indice m, qui est égal à deux, est différente de la troisième valeur c3,2 correspondante. Le quatrième vecteur D3,1 (12 000 ; 5 ; 3 ; 4,5 ; 80) est généré pour le troisième paramètre X3. Seule la quatrième valeur d'indice sn, qui est égal à. trois, est différente de la troisième valeur c3,1 correspondante.

20 Le quatrième vecteur D4,1 (12 000 ; 5 ; 5 ; 4,8 ; 80) est généré pour le quatrième paramètre X4. Seule la quatrième valeur d'indice m, qui est égal à quatre, est différente de la troisième valeur c4,1 correspondante. Le quatrième vecteur D5,1 (12 000 ; 5 ; 5 ; 4,5 ; 75) est généré pour le cinquième paramètre X5. Seule la quatrième valeur d'indice m, qui est égal à cinq, est différente de 25 la troisième valeur c5,1 correspondante. A l'issue de l'étape 150 de calcul, un troisième score Ucj est calculé à partir du troisième vecteur Cj et un quatrième score Udi,j est calculé à partir de chaque quatrième vecteur Di,j Par exemple, le troisième score Ucj et les quatrièmes scores Udi,j sont calculés 30 par l'unité de traitement d'informations 14. Selon un autre exemple, le troisième vecteur Cj et les quatrièmes vecteurs Di,j sont transmis à un dispositif de calcul externe que l'unité de traitement d'informations 14 est propre à commander. Le dispositif de calcul transmet en retour au système 10 le troisième score Ucj et les quatrièmes scores Udi,j.

35 A l'issue de l'étape 160 d'évaluation, l'indicateur d'importance Ri de chaque paramètre Xi est évalué.

3034230 14 De préférence, l'indicateur d'importance Ri est évalué à partir du troisième score Ucj et des quatrièmes scores Udi,j. Pour cela, la valeur absolue de la différence entre le troisième score Ucj et le quatrième score Udi,j associé au paramètre Xi est calculée. La valeur de l'indicateur d'importance Ri est alors augmentée d'une quantité Q égale à la valeur.absolue calculée, divisée par le nombre total Nt de listes Lj du premier ensemble El. Cela s'écrit mathématiquement : lUcj -Udi, jl Ri = Ri + Nt L'indicateur d'importance Ri évalué est alors une approximation d'une valeur de 10 Shapley. En variante, lors de cette étape 160 d'évaluation, seuls les paramètres Xi pour lesquels la première valeur xi est différente de la deuxième valeur yi sont considérés. Cela signifie que, lorsque la première valeur xi et la deuxième valeur yi sont égales, l'indicateur d'importance Ri du paramètre Xi correspondant n'est pas évalué lors de cette 15 étape 160 d'évaluation. Si toutes les listes Lj n'ont pas encore été sélectionnées, l'étape 130 de sélection est réitérée. La réitération ést représentée sur la figuré 2 par une flèche 165. L'étape 130 de sélection d'une liste Lj, l'étape 140 de génération d'un troisième vecteur Cj, l'étape 150 de calcul d'au moins un score et l'étape 160 d'évaluation d'au 20 moins un indicateur d'importance Ri sont ensuite réitérées dans l'ordre présenté ci-dessus pour une autre liste Lj. Par exemple, l'indice j mémorisé est augmenté de un, et l'étape 130 de sélection d'une liste Lj, l'étape 140 de génération d'un troisième vecteur Cj, l'étape 150 de calcul d'au moins un score et l'étape 160 d'évaluation d'au moins un indicateur d'importance Ri 25 sont mises en oeuvre pour la liste Lj correspondante. Lorsque l'étape 130 de sélection d'une liste Lj, l'étape 140 de génération d'un troisième vecteur Cj, l'étape 150 de calcul d'au moins un score et l'étape 160 d'évaluation d'au moins un indicateur d'importance Ri ont été mises en oeuvre pour chacune des listes Lj, l'étape 160 d'évaluation est suivie d'une étape 170 de sélection d'au moins un 30 paramètre Xi. Par exemple, lorsque l'indice j de la liste Lj est égal au nombre total Nt de listes Lj, l'étape 160 d'évaluation est suivie de l'étape 170 de sélection d'au moins un paramètre Xi. Dans le cas donné en exemple, après que chaque étape 160 d'évaluation a été mise en oeuvre, un premier indicateur d'importance R1, un deuxième indicateur 3034230 15 d'importance R2, un troisième indicateur d'importance R3, un quatrième indicateur d'importance R4 et un cinquième indicateur d'importance R5 ont été évalués. Le premier indicateur d'importance R1 est associé au premier paramètre X1, le deuxième indicateur d'importance R2 est associé au deuxième paramètre X2, et ainsi de suite. Le premier indicateur d'importance R1 est égal à 0,5, le deuxième indicateur d'importance R2 est égal à 0,05, le troisième indicateur d'importance R3 est égal à 0,10, le quatrième indicateur d'importance R4 est égal à 0,30, et le cinquième indicateur d'importance R5 est égal à 0,05.

10 Cela signifie que le paramètre Xi qui a la plus grande importance dans la différence entre le premier score Ux et le deuxième score Uy est le premier paramètre X1. Les paramètres Xi qui ont la plus petite importance dans la différence entre le premier score Ux et le deuxième score Uy sont le deuxième paramètre X2 et le cinquième paramètre X5.

15 A l'issue de l'étape 170 de sélection d'au moins un paramètre Xi, un quatrième ensemble E4 de paramètres Xi est sélectionné. Le quatrième ensemble E4 comprend un quatrième nombre N4 de paramètres Xi. Le quatrième nombre N4 est, par exemple, prédéterminé. En variante, le quatrième nombre N4 est déterminé, au cours de l'étape 170 de 20 sélection d'au moins un paramètre Xi, à partir des indicateurs d'importance Ri évalués. Les paramètres Xi sélectionnés au cours de l'étape de sélection 170 d'au moins un paramètre Xi sont les paramètres Xi dont les indicateurs d'importance Ri sont les plus élevés. Dans l'exemple présenté ci-dessus, le quatrième nombre N4 est égal à deux, et le 25 premier paramètre X1 associé au premier indicateur d'importance R1 égal à 0,5 et le quatrième paramètre X4 associé au quatrième indicateur d'importance R4 égal à 0,30 sont sélectionnés. A l'issue de l'étape 180 d'élaboration, une explication Ex est élaborée. L'explication Ex est propre à expliquer à un décideur le premier score Ux.

30 L'explication Ex est, par exemple, une explication relative du premier score Ux par rapport au deuxième score Uy. Cela signifie que l'explication Ex est propre à expliquer à un décideur la différence entre le premier score Ux et le deuxième score Uy. En particulier, l'explication Ex est propre à expliquer à un décideur les raisons qui font qu'un score Ux,Uy est supérieur à un 35 autre score Ux, Uy.

3034230 16 L'explication Ex est élaborée à partir des paramètres Xi sélectionnés. Par exemple, l'explication Ex comprend une liste des paramètres Xi sélectionnés. L'explication Ex comprend, par exemple, une phrase à trous telle que : « [1] est préférée à [2] en raison de : », où [1] est le nom de l'entité associée au score le plus 5 élevé. La phrase à trou est suivie de la liste des paramètres Xi sélectionnés. Dans le cas donné en exemple de la comparaison entre deux automobiles A et B, l'explication Ex est donc : « A est préférée à B en raison de : son prix, sa consommation de carburant. » L'explication est affichée sur l'unité d'affichage 24.

10 Le procédé d'explication du score Ux ne suppose pas que la fonction U soit connue. Le procédé d'explication peut donc être utilisé en conjonction avec un dispositif externe de calcul d'un score dont les détails de fonctionnement ne sont pas connus. Seuls les premier et deuxième scores Ux,Uy et les premier et deuxième vecteurs associés x,y sont connus.

15 De plus, le procédé d'explication est adaptable puisqu'il n'est pas relatif à une fonction particulière. Aucune hypothèse concernant la fonction U n'est utilisée. Dans un deuxième exemple de réalisation, l'étape 160 de sélection d'évaluation est suivie de l'étape 170 de sélection d'au moins un paramètre Xi si' toutes les listes Lj n'ont pas encore été sélectionnées et, lors de l'étape 160 d'évaluation la quantité Q est 20 inférieure strictement à un seuil S prédéterminé. Cela s'écrit mathématiquement : lUcj -Udi, j Ri - (Ri + Nt Le procédé d'explication ne prend pas en compte certaines listes Lj non significatives (pour lesquelles la quantité Q est inférieure au seuil S). Le procédé 25 d'explication est donc plus rapide à mettre en oeuvre. Un organigramme d'un troisième exemple de mise en oeuvre d'un procédé d'explication est représenté sur la figure 4. Les éléments identiques au premier exemple de la figure 2 ne sont pas décrits à nouveau. Seules les différences sont mises en évidence.

30 La fonction U présente un maximum global Ug associé à un premier vecteur extrême G, et un minimum global Ub associé à un deuxième vecteur extrême B. Le maximum global Ug et le minimum global Ub de la fonction U sont mémorisés dans la mémoire 18. <S 3034230 17 Par exemple, le maximum global Ug et le minimum global Ub de la fonction U ont été obtenus par une analyse mathématique de la fonction U. En variante, le maximum global Ug et le minimum global Ub de la fonction U sont obtenus par une méthode expérimentale. Par exemple, tous les vecteurs X,Y possibles 5 sont générés et le score Ux, Uy associé à chacun des vecteurs X,Y est calculé. Le fonctionnement du troisième exemple va maintenant être décrit. Seul le premier score Ux est fourni à l'issue de l'étape 100 de fourniture d'un premier score. Aucun deuxième score Uy n'est fourni. L'étape 110 de génération d'un premier ensemble E1, l'étape 120 d'initialisation, 10 l'étape 130 de sélection d'une liste Lj, l'étape 140 de génération d'un troisième vecteur Cj, l'étape 150 de calcul d'au moins un score, l'étape 160 d'évaluation d'au moins un indicateur d'importance Ri, et l'étape 170 de sélection d'un ensemble de paramètres Xi sont alors mises en oeuvre à partir du premier vecteur x et du premier vecteur extrême G. Cela signifie que, lors de l'étape 110 de génération d'un premier ensemble E1, de 15 l'étape 120 d'initialisation, de l'étape 130 de sélection d'une liste Lj, de l'étape 140 de génération d'un troisième vecteur Cj, de l'étape 150 de calcul d'au moins un score, de l'étape 160 d'évaluation d'au moins un indicateur d'importance Ri, et de l'étape 170 de sélection d'un ensemble de paramètres Xi, le maximum global Ug est utilisé en lieu-et place du deuxième score Uy, et le premier vecteur extrême G est utilisé en lieu et place 20 du deuxième vecteur Y. A l'issue de l'étape 160 d'évaluation, un premier indicateur d'importance Rpi est obtenu pour chaque paramètre Xi. A l'issue de l'étape 170 de sélection d'au moins un paramètre Xi, un cinquième ensemble E5 de paramètres Xi est sélectionné sur la base des premiers indicateurs 25 d'importance Rpi évalués. Ensuite, l'étape 110 de génération d'un premier ensemble E1, l'étape 120 d'initialisation, l'étape 130 de sélection d'une liste Lj, l'étape 140 de génération d'un troisième vecteur Cj, l'étape 150 de calcul d'au moins un score, l'étape 160 d'évaluation d'au moins un indicateur d'importance Ri, et l'étape 170 de sélection d'un ensemble de 30 paramètres Xi sont mises en oeuvre à partir du premier vecteur x et du deuxième vecteur extrême B. Cela signifie que, lors de l'étape 110 de génération d'un premier ensemble E1, de l'étape 120 d'initialisation, de l'étape 130 de sélection d'une liste Lj, de l'étape 140 de génération d'un troisième vecteur Cj, de l'étape 150 de calcul d'au moins un score, de 35 l'étape 160 d'évaluation d'au moins un indicateur d'importance Ri, et de l'étape 170 de sélection d'un ensemble de paramètres Xi, le minimum global Ub est utilisé en lieu et 3034230 18 place du deuxième score Uy, et le deuxième vecteur extrême B est utilisé en lieu et place du deuxième vecteur Y. A l'issue de l'étape 160 d'évaluation, un deuxième indicateur d'importance Rdi est obtenu pour chaque paramètre Xi.

5 A l'issue de l'étape 170 de sélection d'au moins un paramètre Xi, un sixième ensemble E6 de paramètres Xi est sélectionné sur la base des deuxièmes indicateurs d'importance Rdi évalués. A l'issue de l'étape 180 d'élaboration, l'explication Ex est élaborée à partir du cinquième ensemble E5 et du sixième ensemble E6.

10 Le procédé d'explication permet alors d'expliquer le premier score Ux de manière absolue. Cela signifie que le procédé est propre à expliquer le premier score Ux sans le comparer à un deuxième score Uy. Un organigramme d'un quatrième exemple de mise en oeuvre d'un procédé d'explication est représenté sur la figure 5.

15 Les éléments identiques au premier exemple de la figure 2 ne sont pas décrits à nouveau. Seules les différences sont mises en évidence. Les coefficients de Môbius sont les éléments obtenus, à partir d'une première suite,..par la. formule d'inversion de Môbius. La formule d'inversion, de_ Môbius a été introduite dans la théorie des nombres au cours du xixe siècle par August Ferdinand 20 Môbius. Selon la formule d'inversion de Miibius, un coefficient de Môbius m(Lj) est défini, pour chaque liste Lj, par l'équation : m(Lj) = E(_1)14\Tiv(T) TçLj dans laquelle : 25 - T est une liste secondaire contenant des indicateurs ij et incluse dans la liste Lj, - 114 \TI est le nombre d'indicateurs ij contenus dans la liste Lj et n'étant pas contenus dans la liste secondaire T, et - v(T) est la différence entre un troisième score Ut associé à un troisième 30 vecteur Cj et le premier score Ux, le troisième vecteur Cj étant calculé à partir de la liste secondaire T. La fonction U est k-additive. Cela signifie qu'il existe un deuxième nombre prédéterminé k pour lequel le coefficient de Môbius m(Lj) de chaque liste Lj est égal à zéro si le deuxième nombre N2j 35 de la liste Lj est strictement supérieur au deuxième nombre prédéterminé k.

3034230 19 Le deuxième nombre prédéterminé k est un nombre entier strictement supérieur à 1 et strictement inférieur au premier nombre Nl. Par exemple, le deuxième nombre prédéterminé k est égal à 3. De préférence, le deuxième nombre prédéterminé k est égal à 2. A l'issue de l'étape 110 de génération du premier ensemble El, toutes les listes Lj dont le deuxième nombre N2j est inférieur ou égal à un deuxième nombre prédéterminé k sont générées. Aucune liste dont le deuxième nombre N2j est strictement supérieur au deuxième nombre prédéterminé k n'est générée.

10 Seuls les premiers sous-ensembles SE1 associés à un deuxième nombre N2j inférieur ou égal au deuxième nombre prédéterminé k sont donc générés. On définit également, pour chaque paramètre Xi, un troisième sous-ensemble SE3i de listes Lj. Le troisième sous-ensemble SE3i comprend chacune des listes Lj comprenant l'indicateur ij du paramètre Xi. Chaque troisième sous-ensemble SE3i 15 est donc inclus dans le premier ensemble El. L'étape 120 d'initialisation et l'étape 130 de sélection ne sont pas mises en oeuvre. A l'issue de de l'étape 140 de génération d'un troisième vecteur Cj, le troisième vecteur associé à chaque liste Lj est généré. Aucun quatrième vecteur Di,j n'est généré.

20 Seul le troisième score Ucj de chaque troisième vecteur Cj est calculé à l'issue de l'étape 150 de calcul. L'étape 160 d'évaluation comprend une sous-étape 162 d'initialisation, puis une sous-étape 165 de calcul d'au moins un coefficient de Môbius, et ensuite une sous-étape 167 d'évaluation d'au moins un indicateur d'importance Ri.

25 Le coefficient m(Lj) est un nombre réel égal à la différence entre le troisième score Ucj associé au troisième vecteur Cj généré à partir de la liste Lj et le premier score Ux. Cela s'écrit mathématiquement : in (Lj) = Ucj -Ux Un itérateur n est également généré. L'itérateur n est fixé égal à zéro.

30 A l'issue de la sous-étape de calcul 165, l'itérateur n est augmenté de un. Cela s'écrit mathématiquement : n n +1 Une liste réduite Lrj est générée, pour chaque liste Lj, si la liste Lj contient un indicateur ij du paramètre Xn d'indice égal à l'itérateur n, 35 La liste réduite Lrj est construite, à partir de la liste Lj, par la suppression de l'indicateur ij associé au paramètre Xn d'indice égal à l'itérateur n. Cela signifie que la liste 3034230 20 réduite Lrj contient chacun des indicateurs ij contenus dans la liste Lj, à l'exception de l'indicateur ij égal à l'itérateur n. Par exemple, à l'issue de la première sous-étape 165 de calcul, la liste réduite Lr1 (0 ; 0 ; 1 ; 0 ; 1) est générée à partir de la liste L1 (1 ; 0 ; 1 ; 0 ; 1).

5 Le coefficient m(Lj) de chaque liste est fixé égal .à la différence entre le coefficient m(Lj) associé à la liste Lj, et le coefficient m(Lr,j) associé à la liste réduite Lrj. Cela s'écrit mathématiquement : m(Lj) := m(Lj) - m(Lrj) Si la liste Lj ne contient pas un indicateur ij égal à l'itérateur n, le coefficient m(Lj) 10 n'est pas modifié. Si l'itérateur n est strictement inférieur au premier nombre N1, la première sous-étape de calcul 165 est réitérée. La réitération est représentée sur la figure 5 par une flèche 190. Sinon, la première sous-étape de calcul 165 est suivie d'une deuxième sous-étape 15 de calcul 167. A l'issue de la deuxième sous-étape de calcul 167, l'indicateur d'importance Ri associé à chaque paramètre Xi est évalué. Chaque indicateur d'importance Ri est égal à la somme, pour chaque liste Lj contenant l'indicateur ij du paramètre Xi, du rapport entre le coefficient m(Lj) d'indice 20 associé à la liste Lj et le deuxième nombre N2j de la liste Lj. Cela s'écrit mathématiquement : Ri = z mk(Lj) LjESE3i N2 j Lorsque la deuxième sous-étape de calcul 167 est achevée, l'étape 170 de sélection d'au moins un paramètre Xi est mise en oeuvre.

25 Lorsque la fonction U est k-additive, l'indicateur d'importance Ri associé à chaque paramètre est alors une valeur de Shapley et non une approximation d'une valeur de Shapley. Le procédé d'explication d'un score Ux est donc plus précis. L'explication Ex générée est alors plus pertinente.

30 Le procédé d'explication est adaptable puisqu'il n'est pas relatif à une fonction particulière. Le procédé d'explication suppose seulement de savoir que la fonction U est k-additive.

3034230 21 Dans un cinquième exemple de procédé d'explication, à l'issue de l'étape 170 de sélection d'au moins un paramètre Xi, au moins deux quatrièmes sous-ensembles SE4m de paramètres sont sélectionnés. Les éléments identiques au premier exemple de la figure 2 ne sont pas décrits à 5 nouveau. Seules les différences sont mises en évidence. A l'issue de l'étape 170 de sélection, un cinquième nombre N5 de quatrièmes sous-ensembles SE4 sont générés à partir des indicateurs d'importance Ri reçus. Dans la suite de cette description, chaque quatrième sous-ensemble SE4 sera repéré par un indice m et noté SE4m.

10 Chaque quatrième sous-ensemble SE4m contient au moins un paramètre Xi. De préférence, les quatrièmes sous-ensembles SE4m sont générés selon une méthode de partitionnement de données. Le partitionnement de données (ou data clustering en anglais) est une des méthodes statistiques d'analyse des données. Le partitionnement de données vise à 15 diviser un ensemble de données en différents sous-ensembles homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité entre objets. Dans le- cas des quatrièmes sous-ensembles SE4m, le critère de proximité utilisé est la différence entre les indicateurs d'importance Ri.

20 Les paramètres Xi sont classés dans les quatrièmes sous-ensembles SE4m selon un ordre croissant des indicateurs d'importance Ri calculés. Cela signifie que chacun des paramètres Xi du quatrième sous-ensemble SE41 d'indice m égal à 1 est associé à un indicateur d'importance Ri supérieur à chacun des indicateurs d'importance Ri associés aux paramètres Xi du quatrième sous-ensemble SE42 d'indice m égal à 2, et ainsi de 25 suite. A l'issue de l'étape 180 d'élaboration, l'explication Ex est élaborée à partir des quatrièmes sous-ensembles SE4m de paramètres Xi générés. Par exemple, l'explication Ex prend la forme d'une phrase à trous du type : « L'automobile A est préférée à l'automobile B tout d'abord en raison des 30 paramètres [1], puis des paramètres [2], et enfin en raison des paramètres [3]», où [1] est une liste des paramètres Xi du quatrième sous-ensemble SE41, [2] est une liste des paramètres Xi du quatrième sous-ensemble SE42 et [3] est une liste des paramètres Xi du quatrième sous-ensemble SE43. Le procédé d'explication adapte automatiquement le nombre de paramètres Xi 35 utilisés dans l'explication Ex aux indicateurs d'importance Ri évalués. L'explication Ex élaborée est donc plus pertinente.

3034230 22 Chacun des exemples ci-dessus du procédé d'explication est propre à être mis en oeuvre avec une fonction U qui n'est pas connue précisément. Le procédé d'explication ne dépend pas de la fonction U utilisée. Le procédé d'explication est donc adaptable à un grand nombre de fonctions U. De plus, l'explication Ex est élaborée à partir des valeurs de Shapley associées à chaque paramètre Xi. L'explication Ex est donc pertinente. Enfin, au cours de la mise en oeuvre du procédé d'explication, seul un nombre réduit de listes Lj est généré. Le procédé d'explication présente donc de bonnes performances, en particulier en termes de temps de calcul. 10

Claims

REVENDICATIONS1.- Procédé d'explication d'un score (Ux) associé à un vecteur (x) d'un premier nombre (N1) de paramètres (X,) par une fonction (U), chaque paramètre (X,) étant ordonné avec un indicateur (ij) variant de un au premier nombre (N1), le premier nombre (N1) étant un nombre entier strictement supérieur à un, le procédé comprenant au moins des étapes de : a1) fourniture d'un premier score (Ux) associé à un premier vecteur (x) contenant des premières valeurs (x,) des paramètres (X,), 10 b) génération d'un premier ensemble (El ) de listes (11), chaque liste (11) comprenant un deuxième nombre (N21) d'indicateurs (ij), le deuxième nombre (N2j) étant un nombre entier strictement inférieur au premier nombre (N1) et supérieur strictement à zéro, c) génération, à partir d'une liste (Li), d'au moins un troisième vecteur (Cj) dans 15 lequel chaque paramètre (X1) présente une troisième valeur (c1,j), la troisième valeur (c,4) étant égale à la première valeur (x,) correspondante lorsque la liste (Li) ne comprend pas un indicateur (ij) du paramètre (X,) correspondant, et différente de la première.valeur (x,) correspondante dans le cas contraire, d) calcul du score (UCj) d'au moins un troisième vecteur (Cj), 20 e) évaluation, à partir des scores (UCj) des troisièmes vecteurs (Cj) calculés, d'un indicateur d'importance (R,) de chaque paramètre (X,), f) élaboration, à partir des indicateurs d'importance (R,) évalués, d'une explication (E) du premier score (Ux). 25
2.- Procédé selon la revendication 1, dans lequel les indicateurs d'importance (R,) calculés lors de l'étape e sont soit des valeurs de Shapley, soit des indices de Sobol.
3.- Procédé selon la revendication 1 ou 2, dans lequel le premier ensemble (El ) comprend un nombre total (Nt) de listes (Lj), le nombre total (Nt) vérifiant l'inégalité 30 mathématique : Nt < Co* 2N1 dans laquelle Co est un coefficient prédéterminé.
4.- Procédé selon l'une quelconque des revendications 1 à 3, dans lequel 35 l'étape b comprend la génération d'au moins une partie des listes (Li) du premier 3034230 24 ensemble (El) selon une loi de probabilité (P) portant soit sur le deuxième nombre (N2j) soit sur les indicateurs ij contenus dans la liste (Lj).
5.- Procédé selon l'une quelconque des revendications 1 à 3, dans lequel l'étape b comprend la génération de toutes les listes (1_,) dont le deuxième nombre (N2j) est inférieur ou égal à un deuxième nombre entier prédéterminé (k) strictement inférieur au premier nombre (N1).
6.- Procédé selon l'une quelconque des revendications 1 à 5, dans lequel le 10 procédé comprend, en outre, une étape a2 de fourniture d'un deuxième score (Uy) associé à un deuxième vecteur (Y) contenant des deuxièmes valeurs (y,) des paramètres (X,), et dans lequel, lors de l'étape c, la troisième valeur (c,,i) est égale à la deuxième valeur (y,) correspondante lorsque la liste (Li) comprend un indicateur (ij) du 15 paramètre (X,) correspondant,
7.- Procédé d'explication d'un score (Ux) associé à un vecteur (X) par une fonction (U), la fonction (U) présentant un maximum global (Ug) associé à un premier vecteur extrême (G) et un minimum global (Ub) associé à un deuxième vecteur extrême 20 (B), le procédé comprenant : g1) la mise en oeuvre, à partir du premier score (Ux) et du maximum global (Ug), des étapes b à e d'un procédé d'explication selon la revendication 6 pour obtenir des premiers indicateurs d'importance (Rg,), g2) la mise en oeuvre, à partir du premier score (Ux) et du minimum global 25 (Ub), des étapes b à e d'un procédé d'explication selon la revendication 6 pour obtenir des deuxièmes indicateur d'importance (Rb,), et h) génération, à partir des premiers (Rg,) et deuxièmes (Rb,) indicateurs d'importance, d'une explication (E) du premier score (Ux). 30
8.- Produit programme d'ordinateur comportant des instructions logicielles qui, lorsqu'elles sont exécutées par un ordinateur, mettent en oeuvre un procédé selon l'une quelconque des revendications 1 à 7.
9.- Support d'information sur lequel est mémorisé un produit programme 35 d'ordinateur selon la revendication 8. 3034230 25
10.- Système (10) d'explication d'une fonction (U) associant un score (Ux) à un vecteur (x) d'un premier nombre (N1) de paramètres (X,), chaque paramètre (X1) étant ordonné avec un indicateur (ij) variant de un au premier nombre (N1), le premier nombre (N1) étant un nombre entier strictement supérieur à un, le système (10) étant propre à : - fournir un premier score (Ux) associé à un premier vecteur (X) contenant des premières valeurs (xi) des paramètres (XI - générer un premier ensemble (El) de listes (Li), chaque liste (Li) comprenant un deuxième nombre (N2j) d'indicateurs (ij), le deuxième nombre (N2,) étant un nombre entier inférieur strictement au premier nombre (N1) et supérieur strictement à zéro, - générer, à partir d'une liste (1_,), d'au moins un troisième vecteur (Cj) dans lequel chaque paramètre (X,) présente une troisième valeur (c,,j), la troisième valeur (c,,i) étant égale à la première valeur (x,) correspondante lorsque la liste (Li) ne comprend pas un indicateur (ij) du paramètre (X,) correspondant, et différente de la première valeur (x,) correspondante dans le cas contraire, - calculer le score (UCj) d'au moins un troisième vecteur (Cj), - évaluer, à partir des scores (UCj) calculés pour chacun des troisièmes vecteurs (Cj), un indicateur d'importance (R,) de chaque paramètre (X,), - élaborer, à partir des indicateurs d'importance (Ri) évalués, une explication (E) du premier score (Ux).20