EP3815001A1 - Procede de modelisation pour le controle des resultats fournis par un reseau de neurones artificiels et autres procedes associes - Google Patents

Procede de modelisation pour le controle des resultats fournis par un reseau de neurones artificiels et autres procedes associes

Info

Publication number
EP3815001A1
EP3815001A1 EP19733051.7A EP19733051A EP3815001A1 EP 3815001 A1 EP3815001 A1 EP 3815001A1 EP 19733051 A EP19733051 A EP 19733051A EP 3815001 A1 EP3815001 A1 EP 3815001A1
Authority
EP
European Patent Office
Prior art keywords
variables
neural network
function
variable
artificial neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP19733051.7A
Other languages
German (de)
English (en)
Inventor
Benoît SCHMAUCH
Johan FERRET
Nicolas MERIC
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dreamquark
Original Assignee
Dreamquark
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dreamquark filed Critical Dreamquark
Publication of EP3815001A1 publication Critical patent/EP3815001A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence

Definitions

  • the technical field of the invention is that of artificial neural networks.
  • the present invention relates to a method for monitoring the results provided by an artificial neural network and more particularly to a modeling process for monitoring the results provided by an artificial neural network.
  • the present invention also relates to a method for monitoring the results supplied by an artificial neural network, a method for comparing the performance of two artificial neural networks, a method for analyzing a decision-making of an artificial neural network , a device and a computer program product implementing such methods and a recording medium for the computer program product.
  • Neural networks or artificial neural networks constitute the main tool of deep learning or deep learning which tries to model data in order to be able thereafter to perform specific tasks with new data, such as classification or detection.
  • a neural network goes through a training phase or learning phase during which it learns by browsing over several iterations a training database and then through a generalization phase during which it performs, on a basis of generalization data, the task for which he was trained.
  • a neural network is a complex algorithm, involving several thousand - even millions of parameters in its decision-making. If this complexity is necessary for the neural network to have the capacity to detecting structures in data, it limits the interpretation that can be made of the results by a user, preventing him from checking their relevance.
  • an image is supplied as input to the neural network and the latter ideally provides the same image as output in which it has framed the people.
  • the neural network can output the image in which it will have properly framed all those present - which will suggest to the user that the neural network is efficient - without however the parameters that he used to detect people are all relevant. For example, if all the images which were supplied to the neural network during its learning represent a person on a blue sky background, the neural network could have chosen to base its result notably on the color of the background and not only on the characteristics of a person. The neural network then detects people very well on a blue background but will be unable to detect a person on a red background. In this case, the neural network is not suitable for detecting people. However, the user could have concluded the opposite based on the results provided by the neural network on images with a blue background.
  • the preferred variables are, for example, more easily interpretable variables.
  • polar bear and grizzly bear from data including for example the color of the coat, the type of feeding, the age of the animal, the size of the animal etc.
  • a user preferred variable could be the color of the coat since this is the most obvious difference between the two species.
  • the two neural networks can both present the same performances and correctly classify the data but the user will prefer to use in his application the first neural network which mainly uses the color of the coat and whose functioning is therefore more easily comprehensible than the second neural network which also uses the animal's age and size to conclude.
  • the invention offers a solution to the problems mentioned above, by making it possible to control the relevance of the data used in decision-making of an artificial neural network.
  • a first aspect of the invention relates to a modeling method for controlling the results provided by an artificial neural network comprising the following steps implemented by a computer: - Generate a network of artificial neurons;
  • an operating model of the neural network is generated for each data item tested, each operating model depending on a reduced number of variables which are the variables having the most weight in the decision making of the neurons. It is thus possible to monitor the results of the neural network in order, for example, to be able to diagnose a training database, compare the performance of two neural networks or even analyze a decision made by a neural network.
  • the modeling process thus defined is deterministic and reproducible, that is to say that the operating model generated is the same as long as we keep the same neural network, the same training database and the same data tested.
  • the modeling method according to a first aspect of the invention may have one or more complementary characteristics among the following, considered individually or in all technically possible combinations.
  • the first function Fi is an unbounded function.
  • the linear approximation of the first function Fi is more relevant since a linear function is unbounded.
  • the first function Fi is defined by:
  • the result R can be obtained by applying to the function Fi the sigmoid function which is used in logistic regression, one of the simplest algorithms used in machine learning.
  • the second function F 2 is the development limited to the first order of the first function F in the vicinity of a datum. Thus, it suffices to calculate the gradient of the first function F with respect to the variables v, to obtain the second function F 2 .
  • the second function F 2 is expressed as the sum of a coefficient of ordinate at the origin b and of the sum of the variables v, each multiplied by a directing coefficient a,:
  • the second function F 2 is a linear approximation of the first function Fi with respect to the set of variables v, on which the result depends.
  • a first variable vi correlated with a second variable v 2 is expressed as a function of the second variable v 2 as the sum of an uncorrelated variable Si and of a correlation coefficient Ci 2 multiplied with the second variable v 2 :
  • the simplification step comprises the following sub-steps:
  • the third function F 3 is expressed as the sum of the coefficient of ordinate at the origin b and of the sum of the remaining variables vr p each multiplied by its director coefficient of remaining variable ar p :
  • the third function F 3 depends on a smaller number of variables than the result, which makes it easier to control this result.
  • the method according to a first aspect of the invention comprises a step of synthesis of the operating models obtained.
  • a step of synthesis of the operating models obtained it is possible to check the consistency of the results of the neural network.
  • a second aspect of the invention relates to a method for controlling the results provided by an artificial neural network characterized in that it comprises all the steps of the modeling method according to a first aspect of the invention and an additional step of evaluation of the training database from at least one operating model.
  • a third aspect of the invention relates to a method for comparing the performance of a first network of artificial neurons and a second network of artificial neurons, characterized in that it comprises the following steps:
  • a fourth aspect of the invention relates to a method for analyzing a decision-making of an artificial neural network, the decision having been taken on the basis of at least one test datum, characterized in that it comprises the steps of the modeling method according to any one of claims 1 to 5 followed by a step of generating an explanatory report of the decision-making from the operating model of the artificial neural network corresponding to the data of test.
  • a fifth aspect of the invention relates to a computer characterized in that it is suitable for implementing the modeling method according to a first aspect of the invention and / or the control method according to a second aspect of the invention and / or the comparison method according to a third aspect of the invention.
  • a sixth aspect of the invention relates to a computer program product comprising instructions which, when the program is executed by computer, lead the latter to implement the steps of the modeling method according to a first aspect of the invention and / or of the control method according to a second aspect of the invention and / or the comparison method according to a third aspect of the invention.
  • a seventh aspect of the invention relates to a computer-readable recording medium on which the computer program product according to a fifth aspect of the invention is recorded.
  • FIG. 1 shows a block diagram of the modeling method according to a first aspect of the invention.
  • FIG. 2 shows a block diagram of the control method according to a second aspect of the invention.
  • FIG. 3 shows a block diagram of the comparison method according to a third aspect of the invention.
  • FIG. 4 shows a block diagram of the analysis method according to a fourth aspect of the invention.
  • a first aspect of the invention relates to a modeling method 100 for controlling the results provided by an artificial neural network.
  • neural network In the rest of the application, the terms “neuron” and “artificial neuron” will be used interchangeably.
  • a neural network has a plurality of layers, each comprising a plurality of neurons.
  • a neural network has between 2 and 20 layers and each layer of the neural network has between 10 and 2000 neurons.
  • each neuron in each layer is connected to each neuron in the previous layer and to each neuron in the next layer through an artificial synapse.
  • a connection between two neurons is assigned a synaptic weight or coefficient and each neuron is assigned a bias coefficient.
  • the coefficient of bias of a neuron is its default value, that is to say its value when the neurons of the previous layer to which it is connected do not send it any signal.
  • the objective of the modeling method 100 is to generate a simplified model for each result R generated by the neural network.
  • the term “result generated by a neural network” is understood to mean an output datum associated with the decision-making of the neural network concerning an input datum.
  • the neural network is trained on a training database or training database to be adapted to a predefined task. Learning can be supervised or unsupervised. In supervised learning, learning is constrained by the learning database. Indeed, the learning database is annotated to signal to the neural network the structures that it must locate. In contrast, in unsupervised learning, the neural network itself finds underlying structures from the raw data in the training database.
  • the predefined task is for example detection, classification or even recognition.
  • Classifying data consists in separating them into several classes, that is, to classify them, and to identify each of the classes. For example, in a sample containing black data and white data, classifying the data corresponds to separating it into two classes while classifying the data corresponds to separating it into two classes and assigning one the name of “black class And to the other the name of "white class”.
  • a neural network having received supervised training is capable of classifying data whereas a neural network having received unsupervised training is only capable of classifying data.
  • the neural network is then tested on a test database or generalization database. For each test data item in the test database, the neural network then supplies a result R illustrating its decision concerning the test data item. For example, if the task for which the neural network was trained is for classification and the neural network has made the decision that the test data belonged to class C, the result R provided by the neural network is the probability associated with class C.
  • training database and the test database can be two separate databases or two separate parts of the same database.
  • the data used in the training database and in the test database are for example biological data, data relating to the carrying out of a process or a product, images, audio data or else electrical signals.
  • a datum has a plurality of variables v, and each datum used has the same number of variables v ,.
  • a data item has between 10 and 10,000 variables v ,.
  • the variables v can be of numeric, binary, categorical type such as for example a nationality or a profession or even dates.
  • the variables v are for example information on a patient such as his age, his symptoms, his weight as well as information on the results of exams he has taken such as blood tests or MRI scans.
  • the variables v are for example information on the product such as its name, its composition as well as information on its manufacturing process such as its manufacturing time, the name of the assembly line on which it was made.
  • the variables v are for example the variance and the average of the gray levels.
  • the data used can be tabular data comprising a plurality of examples, each example depending on a plurality of variables v ,.
  • a tabular type of data used comprises for example between 1,000 and 1,000,000 examples, each comprising between 10 and 10,000 variables v ,.
  • the expression h +1) of the neuron k of layer 1 + 1 is expressed as a function of the N neurons i of layer I in the following way:
  • f (z) max (z, 0)
  • the expression of the neuron k of a layer is therefore expressed as a function of the expressions of the neurons of the previous layer and the expression h® ) of the neuron k of the layer 1 is expressed as a function of the variables v, of the data input as follows:
  • the probability p k associated with the class k is then expressed as follows:
  • the result R then corresponds to the maximum probability p k .
  • the result R generated by a neural network is therefore a function of the set of variables v, of the test data for which the result R is generated, parameterized by the synaptic coefficients P ki assigned to the connections of the neural network and by the bias coefficients b k assigned to each neuron.
  • the modeling method 100 provides a model which is an approximation of the result R generated by a neural network by a simplified expression, which is a function of a more limited number of variables v ,.
  • the modeling method 100 comprises several stages, the sequence of which is shown in FIG. 1. These steps are implemented by a computer comprising at least one processor and one memory.
  • the first step 101 of the modeling method 100 is a step of generating an artificial neural network.
  • the number of layers and the number of neurons per layer of the neural network are fixed as well as other parameters such as the learning step and the coefficient of regularization, which describe its learning process.
  • the neural network learning step defines the frequency with which the weights of the neural network are updated during the learning phase and the regularization coefficient limits the over-learning of the neural network.
  • the neural network is ready to be trained.
  • the second step 102 of the modeling method 100 is a step of training the neural network on a training database.
  • the neural network is able to perform a predefined task on a certain type of data, the type of data present in the training database.
  • the third step 103 of the modeling method 100 is a step of testing the neural network on at least one test datum depending on a plurality of variables v ,.
  • the test data is the same type as the data in the training database.
  • the neural network generates a result R per processed test data, the result R depending on the same variables v, as the processed test data.
  • the fourth step 104 of the modeling method 100 is a step of linear approximation of a first function F-i depending on a result R generated in the previous step 103.
  • a result R is a function of the variables v ,, function whose values are between 0 and 1.
  • the result R is therefore a bounded function.
  • a linear function is not bounded.
  • a transformation is therefore advantageously applied to the result R to obtain a first unbounded function Fi which will be linearly approximated.
  • the first function Fi is unbounded and depends on the same variables v, as the result R.
  • the first function Fi is thus obtained by applying to the result R the inverse function of the sigmoid function s defining itself as:
  • the sigmoid function is used in logistic regression, one of the simplest machine learning algorithms to separate a class from the set of other problem classes.
  • logistic regression consists in the application of a sigmoid function to a linear expression.
  • approximating the function Fi by a linear function L amounts to approximating the result R by a logistic regression a (L).
  • the first function F is then linearly approximated, by carrying out for example a development limited to the first order in the vicinity of the test datum, to obtain a second function F 2 .
  • the second function F 2 is then expressed as follows:
  • the fifth step 105 of the modeling method 1 00 according to a first aspect of the invention is a step of simplifying the second function F 2 .
  • the simplification step 105 comprises a first phase consisting in classifying the variables v, by eliminating the correlations between the variables v ,.
  • variables v are normalized. For example, all variables v, have a zero mean and a standard deviation of 1.
  • a contribution coefficient W is calculated for each variable v, of the test data.
  • the contribution coefficient W k of the variable k is expressed as follows:
  • variable v ref The variable v, with the contribution coefficient W, having the highest absolute value is designated as the reference variable v ref .
  • Each variable v, different from the reference variable v ref is then expressed as a function of the reference value v ref in the following manner:
  • the number of iterations is predefined.
  • the number of iterations is strictly less than the number of variables v, of the second function F 2 and greater than or equal to 1.
  • the relevance of the value chosen for the number of iterations can be checked by comparing the linear function obtained for this number of iterations and the linear function obtained for a higher number of iterations, using a proximity measure. , for example the ratio of the norms of the vectors of directing coefficients of the linear functions obtained.
  • the reference value obtained at each iteration is a synthetic variable, the synthetic variables being independent of each other.
  • p synthetic variables are obtained and at the end of these iterations, the contribution coefficients of all the other variables are set to zero.
  • the first phase of step 105 of simplification consists, first, to calculate the correlation coefficient of each variable Wi, W 2 , W 3 , W 4 and W 5 .
  • W 3 is worth:
  • W 3 a 3 + C ⁇ a- L + C 32 a 2 + C 4 a 4 -I- C 35 a 5
  • the absolute values of the correlation coefficients Wi, W 2 , W 3 , W 4 and W 5 are compared with each other and the variable with the highest absolute value correlation coefficient is selected as the reference value. For example, vi is selected as the reference value.
  • v 2 is:
  • v 2 ' is selected as the reference variable.
  • v 3 ', v 4 ' and v 5 ' are then expressed as a function of v 2 '.
  • v 3 'is is: Then, new variables v 3 ”, v 4 ” and v 5 ”are calculated.
  • v 3 ”is At the end of these calculations, the second iteration is finished.
  • a reference variable is selected from the new variables v 3 ”, v 4 ” and v 5 ”as before. For example, v 3 ”is selected as the reference variable. Then, the contribution coefficients of the remaining variables v 4 ”and v 5 ” are set to zero.
  • the synthetic variables are therefore expressed as a function of the variables v, of the test datum using the following formula until their expression depends only on the variables v, of the second function F 2 :
  • the variables v, of the test data on which the synthetic variables depend are the remaining variables vr p .
  • the number of remaining variables vr p is strictly less than the number of variables v, of the test data.
  • the third function F 3 is then expressed as:
  • the synthetic variables are scanned in reverse order from the last selected to the first selected.
  • the governing coefficient of the k-th synthetic variable selected at the k-th iteration of the first phase of l simplification step 105 is updated as follows: while the guiding coefficients of the variables selected after the k-th synthetic variable, that is to say the synthetic variables selected after the k-th iteration, are updated as follows:
  • the synthetic variables are vi, v 2 'and v 3 ”.
  • step 1 of calculating the remaining variable governing coefficients the governing coefficient of the third synthetic variable v 3 ”is updated as follows:
  • step 2 of calculating the guiding coefficients of the remaining variable the guiding coefficient of the second synthetic variable v 2 ′ is updated as follows:
  • step 3 of calculating the guiding coefficients of the remaining variable the guiding coefficient of the first synthetic variable vi is updated as follows:
  • the guiding coefficients of the second and third synthetic variable v 2 'and v 3 ”selected after the first synthetic variable vi are updated as follows: ar-,
  • the third function F 3 therefore depends only on the remaining variables vr p , that is to say on a reduced number of variables v, on the test datum.
  • Step 106 of the modeling method 100 consists in applying the inverse function of the first function Fi to the third function F 3 to obtain an operating model of the neural network for the result R.
  • the neural network operating model is a simplified R result, dependent on a reduced number of variables v, facilitating the control of the R result provided by the neural network.
  • the modeling method 100 generates an operating model for each result R. If several results R have been generated by the neural network, the modeling method 100 may for example include an additional synthesis step operating models. Since the test data are similar, the synthesis step can be used to check the consistency of the results of the neural network.
  • a second aspect of the invention relates to a monitoring method 200 for monitoring the results provided by an artificial neural network.
  • the control method 200 according to a second aspect of the invention comprises several steps, the sequence of which is shown in FIG. 2.
  • the control method 200 according to a second aspect of the invention comprises all the steps 101 to 106 of the modeling method 100 according to a first aspect of the invention making it possible to obtain at least one operating model of the neural network.
  • the control method 200 then comprises a step 201 of evaluating the training database consisting in comparing the restricted number of variables v, on which each operating model depends with a certain number of variables v, relevant.
  • the variables v are for example the mean and the variance of each pixel of the image
  • the relevant variables v are therefore the mean and the variance of the pixels on which the people are located.
  • the operating model depends mainly on variables v, linked to pixels not corresponding to a person in the image but to background pixels, this means that the variables v, taken into account in the decision-making of the network of neurons are wrong, and therefore that the learning did not allow the neural network to become efficient for the expected task. This is an indication that the training database is not suitable for detecting people.
  • the irrelevant variables v taken into account by the neural network then provide leads making it possible to understand why the training database is not suitable and thus to remedy it.
  • the fact that the neural network takes into account the pixels of the background may be due to too much homogeneity of the backgrounds behind the people.
  • One solution is therefore to add images to the training database with more varied backgrounds.
  • the operating model depends mainly on relevant variables v, this means that the training database is well suited for the expected task.
  • a third aspect of the invention relates to a comparison method 300 for comparing the performance of two artificial neural networks.
  • the two neural networks can, for a given test data, have similar results, for example, in the case where we want to predict a patient's disease based on symptoms, the two neural networks output the same disease with the same probability of certainty, or different results, for example, the two neural networks do not give the same disease as output.
  • this can then make it possible to choose a preferred neural network, which uses more relevant variables in its decision-making.
  • this can for example make it possible to understand why one of the neural networks is failing.
  • the comparison method 300 according to a third aspect of the invention comprises several stages, the sequence of which is shown in FIG. 3.
  • the comparison method 300 comprises all the steps 101 to 106 of the modeling method 100 according to a first aspect of the invention for a first neural network making it possible to obtain at least a first operating model of the first neural network and all the steps 101 to 106 of the modeling method 100 according to a first aspect of the invention for a second neural network making it possible to obtain at least a second operating model of the second neural network.
  • the comparison method 300 then comprises a step 301 of comparing the performances of the first neural network and the second neural network by comparing for the same test data, the first operating model of the first artificial neural network and the second operating model of the second artificial neural network. More precisely, the comparison step 301 consists in comparing the variables v, on which the first operating model depends and the variables v, on which the second operating model depends. The variables v, taken into account in one of the two operating models and not in the other operating model are then compared with a certain number of relevant variables v. Thus, the neural network using the fewest variables v, irrelevant in its decision-making is considered to be the most efficient.
  • the first operating model takes into account fever, fatigue and aches while the second operating model takes into account fever, fatigue, and ear pain to diagnose the flu.
  • the variables v taken into account in one of the two operating models and not in the other operating model, are the aches for the first operating model and the ear pain for the second operating model.
  • the relevant variables v are the symptoms commonly seen in a patient with influenza. Aches are therefore part of the relevant variables v, which is not the case for ear pain.
  • the most efficient neural network to perform this task is therefore the first neural network.
  • control method 200 and the comparison method 300 are compatible, that is to say that the comparison method 300 may include the step 201 of evaluation of the training database.
  • the step 201 for evaluating the training database of the control method 200 and the step 301 for comparing the performances of the two neural networks can be implemented by a computer or performed manually.
  • a fourth aspect of the invention relates to a method for analyzing a decision making of an artificial neural network.
  • Decision-making is automatic, i.e. it is carried out by a neural network that has been trained for this decision-making.
  • the decision is made based on at least one test data.
  • the decision to make a neural network adapted to the detection of pedestrians can be to brake or not depending on the presence or not of a pedestrian in the environment close to the car .
  • the analysis method 400 according to a fourth aspect of the invention comprises several stages, the sequence of which is shown in FIG. 4.
  • the analysis method 400 comprises all the steps 101 to 106 of the modeling method 100 according to a first aspect of the invention for a neural network making it possible to obtain at least one operating model of the neural network from at least one test datum.
  • the analysis method 400 then comprises a step 401 of generating a report explaining the decision-making of the neural network from the operating model or models corresponding to the one or more test data (s).
  • the step 401 of generating a report consists, for example, of synthesizing the operating models if there are several of them to identify the variables having the most weight in decision making and of generating a report comprising these variables.
  • the synthesis consists, for example, of only keeping the variables having a percentage of presence in the operating models above a certain threshold of presence.
  • the report includes, for example, the variables accompanied by their percentage of presence and their weight in decision-making.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)

Abstract

Un aspect de l'invention concerne un procédé de modélisation pour le contrôle des résultats fournis par un réseau de neurones artificiels comportant les étapes suivantes : - Générer un réseau de neurones artificiels; - Entraîner le réseau de neurones artificiels sur une base de données d'entraînement; - Tester le réseau de neurones artificiels sur au moins une donnée de test dépendant d'une pluralité de variables vi; de manière à obtenir un résultat R par donnée de test, le résultat R dépendant des variables vi; - Pour chaque résultat R : · Approximer par un modèle linéaire une première fonction F1 dépendant uniquement du résultat R pour obtenir une deuxième fonction F2 , la première fonction F1 et la deuxième fonction F2 dépendant des variables vi; · Simplifier la deuxième fonction F2 pour obtenir une troisième fonction F3 dépendant d'un nombre plus réduit de variables vi; · Appliquer à la troisième fonction F3 la fonction inverse de la première fonction F1 pour obtenir un modèle de fonctionnement du réseau de neurones.

Description

PROCEDE DE MODELISATION POUR LE CONTROLE DES RESULTATS FOURNIS PAR UN RESEAU DE NEURONES ARTIFICIELS ET AUTRES
PROCEDES ASSOCIES
DOMAINE TECHNIQUE DE L’INVENTION
Le domaine technique de l’invention est celui des réseaux de neurones artificiels.
La présente invention concerne un procédé permettant le contrôle des résultats fournis par un réseau de neurones artificiels et plus particulièrement un procédé de modélisation pour le contrôle des résultats fournis par un réseau de neurones artificiels. La présente invention concerne également un procédé de contrôle des résultats fournis par un réseau de neurones artificiels, un procédé de comparaison des performances de deux réseaux de neurones artificiels, un procédé d’analyse d’une prise de décision d’un réseau de neurones artificiels, un dispositif et un produit-programme d’ordinateur mettant en oeuvre de tels procédés et un support d’enregistrement du produit-programme d’ordinateur.
ARRIERE-PLAN TECHNOLOGIQUE DE L’INVENTION
Les réseaux de neurones ou réseaux de neurones artificiels constituent le principal outil de l’apprentissage profond ou deep learning qui tente de modéliser des données afin d’être capable par la suite d’effectuer des tâches spécifiques avec de nouvelles données, comme des tâches de classification ou de détection. Pour cela, un réseau de neurones passe par une phase d'entraînement ou phase d’apprentissage pendant laquelle il apprend en parcourant sur plusieurs itérations une base de données d’entraînement puis par une phase de généralisation pendant laquelle il réalise, sur une base de données de généralisation, la tâche pour laquelle il a été entraîné.
Un réseau de neurones est un algorithme complexe, faisant intervenir plusieurs milliers - voire millions de paramètres dans sa prise de décision. Si cette complexité est nécessaire pour que le réseau de neurones ait la capacité de détecter des structures dans des données, elle limite l’interprétation qui peut être faite des résultats par un utilisateur, l’empêchant de contrôler leur pertinence.
Par exemple, dans le cas de la détection de personnes dans une image, on fournit en entrée une image au réseau de neurones et celui-ci fournit idéalement en sortie la même image dans laquelle il a encadré les personnes. Le réseau de neurones peut fournir en sortie l’image dans laquelle il aura bien encadré toutes les personnes présentes - ce qui suggérera à l’utilisateur que le réseau de neurones est performant - sans pour autant que les paramètres qu’il a utilisés pour détecter les personnes soient tous pertinents. Par exemple, si toutes les images qui ont été fournies au réseau de neurones lors de son apprentissage représentent une personne sur un fond de ciel bleu, le réseau de neurones aura pu choisir de baser son résultat notamment sur la couleur du fond et non uniquement sur les caractéristiques propres à une personne. Le réseau de neurones détecte alors très bien les personnes sur un fond bleu mais sera incapable de détecter une personne sur un fond rouge. Dans ce cas précis, le réseau de neurones n’est pas adapté à la détection de personnes. Pourtant, l’utilisateur aurait pu conclure le contraire sur la base des résultats fournis par le réseau de neurones sur les images avec un fond bleu.
Dans le domaine du traitement des images, il existe des outils visuels permettant d’afficher les zones de l’image sur la base desquelles le réseau de neurones a pris sa décision. Cependant, ces outils ne sont pas adaptés à d’autres types de données, comme des enregistrements sonores ou des données biologiques.
Un autre exemple serait le cas où l’utilisateur a deux réseaux de neurones différents présentant des performances similaires sur une base de test et où il veut déterminer celui des deux réseaux de neurones qui utilise dans sa prise de décision des variables préférées par l’utilisateur. Les variables préférées sont par exemple des variables plus facilement interprétables. Par exemple, dans le cas de la classification d’animaux en deux classes, ours polaire et ours grizzly, à partir de données comprenant par exemple la couleur du pelage, le type d’alimentation, l’âge de l’animal, la taille de l’animal etc., une variable préférée de l’utilisateur pourrait être la couleur du pelage puisqu’il s’agit de la différence la plus évidente entre les deux espèces. Les deux réseaux de neurones peuvent tous les deux présenter les mêmes performances et classifier correctement la donnée mais l’utilisateur préférera utiliser dans son application le premier réseau de neurones qui utilise principalement la couleur du pelage et dont le fonctionnement est donc plus facilement appréhendable que le deuxième réseau de neurones qui utilise également l’âge de l’animal et sa taille pour conclure.
Ainsi, quand un réseau de neurones est impliqué dans une prise de décision pouvant avoir de graves conséquences, par exemple la décision ou non de freiner pour le véhicule autonome ou encore la décision ou non d’opérer une personne malade, il n’existe actuellement aucun moyen d’appréhender les raisons de la prise de décision du réseau de neurones, à savoir les variables ayant eu le plus d’influence sur la prise de décision, ce qui peut poser problème au niveau légal/ réglementaire.
Il existe donc un besoin pour un utilisateur de contrôler facilement les résultats fournis par un réseau de neurones artificiels pour s’assurer que celui-ci ne prend pas en compte des données non pertinentes, quel que soit le type de données traitées et donc de disposer d’éléments techniques factuels et objectifs pour pouvoir analyser et comprendre une prise de décision par un réseau de neurones artificiels.
RESUME DE L’INVENTION
L’invention offre une solution aux problèmes évoqués précédemment, en permettant de contrôler la pertinence des données utilisées dans la prise de décision d’un réseau de neurones artificiels.
Un premier aspect de l’invention concerne un procédé de modélisation pour le contrôle des résultats fournis par un réseau de neurones artificiels comportant les étapes suivantes mises en oeuvre par un calculateur : - Générer un réseau de neurones artificiels ;
- Entraîner le réseau de neurones artificiels sur une base de données d’entraînement ;
- Tester le réseau de neurones artificiels sur au moins une donnée de test dépendant d’une pluralité de variables v, de manière à obtenir un résultat R par donnée de test, le résultat R dépendant des variables v, ;
- Pour chaque résultat R :
• Approximer par un modèle linéaire une première fonction Fi dépendant uniquement du résultat R pour obtenir une deuxième fonction F2, la première fonction F-i et la deuxième fonction F2 dépendant des variables v, ;
• Simplifier la deuxième fonction F2 pour obtenir une troisième fonction F3 dépendant d’un nombre plus réduit de variables v, ;
• Appliquer à la troisième fonction F3 la fonction inverse de la première fonction F-i pour obtenir un modèle de fonctionnement du réseau de neurones.
Grâce à l’invention, un modèle de fonctionnement du réseau de neurones est généré pour chaque donnée testée, chaque modèle de fonctionnement dépendant d’un nombre réduit de variables qui sont les variables ayant le plus de poids dans la prise de décision du réseau de neurones. Il est ainsi possible de contrôler les résultats du réseau de neurones pour pouvoir par exemple diagnostiquer une base de données d’entraînement, comparer les performances de deux réseaux de neurones ou encore analyser une prise de décision par un réseau de neurones. Le procédé de modélisation ainsi défini est déterministe et reproductible, c’est-à- dire que le modèle de fonctionnement généré est le même tant que l’on conserve le même réseau de neurones, la même base de données d’entraînement et la même donnée testée.
Outre les caractéristiques qui viennent d’être évoquées dans le paragraphe précédent, le procédé de modélisation selon un premier aspect de l’invention peut présenter une ou plusieurs caractéristiques complémentaires parmi les suivantes, considérées individuellement ou selon toutes les combinaisons techniquement possibles.
Avantageusement, la première fonction Fi est une fonction non bornée. Ainsi, l’approximation linéaire de la première fonction Fi est plus pertinente étant donné qu’une fonction linéaire est non bornée.
Avantageusement, la première fonction F-i est définie par :
Ainsi, le résultat R peut être obtenu en appliquant à la fonction Fi la fonction sigmoïde qui est utilisée dans la régression logistique, l’un des algorithmes les plus simples utilisés en apprentissage automatique.
Avantageusement, la deuxième fonction F2 est le développement limité au premier ordre de la première fonction F au voisinage d’une donnée. Ainsi, il suffit de calculer le gradient de la première fonction F par rapport aux variables v, pour obtenir la deuxième fonction F2.
Avantageusement, la deuxième fonction F2 s’exprime comme la somme d’un coefficient d’ordonnée à l’origine b et de la somme des variables v, multipliées chacune par un coefficient directeur a, :
Ainsi, la deuxième fonction F2 est une approximation linéaire de la première fonction Fi par rapport à l’ensemble des variables v, dont dépend le résultat.
Avantageusement, une première variable vi corrélée à une deuxième variable v2 s’exprime en fonction de la deuxième variable v2 comme la somme d’une variable non corrélée Si et d’un coefficient de corrélation Ci2 multiplié à la deuxième variable v2 :
V1 Cl2V2 + 8-L Avantageusement, l’étape de simplification comporte les sous-étapes suivantes :
- Créer un vecteur de variables Vv comportant les variables v, ;
- Créer un vecteur de variables synthétiques VVs vide ;
- Créer un vecteur de coefficients de contribution Vc vide ;
- Réaliser au moins une fois les sous-étapes suivantes :
• Pour chaque variable vk du vecteur de variables Vv, exprimer un coefficient de contribution Wk en fonction du coefficient directeur ak de ladite variable vk, des coefficients directeurs a, et des coefficients de corrélation Cki des variables v, du vecteur de variables Vv corrélées à ladite variable vk ;
• Comparer les valeurs absolues des coefficients de contribution W, et déterminer une variable de référence vref ayant le coefficient de contribution Wref de valeur absolue la plus élevée ;
• Ajouter au vecteur de variables synthétiques VVs ladite variable de référence vref ;
• Ajouter au vecteur de coefficients de contribution Vc le coefficient de contribution Wret de ladite variable de référence vref ;
• Pour chaque variable vk du vecteur de variables Vv différente de la variable de référence vref et corrélée à la variable de référence vref, exprimer ladite variable vk corrélée en fonction de la variable de référence vref et normaliser la variable non corrélée sk pour obtenir une nouvelle variable vk’ ;
• Vider le vecteur de variables Vv et remplir le vecteur de variables Vv avec les nouvelles variables n,’ ;
- Exprimer les variables contenues dans le vecteur de variables synthétiques VVs en fonction des variables v, de la deuxième fonction F2 pour obtenir des variables restantes vrp ;
- Exprimer un coefficient directeur de variable restante arp pour chaque variable restante vrp à l’aide du vecteur de coefficients de contribution Vc.
Ainsi, on ne conserve que les variables v, ayant un coefficient de contribution important en prenant en compte les corrélations entre variables. Avantageusement, la troisième fonction F3 s’exprime comme la somme du coefficient d’ordonnée à l’origine b et de la somme des variables restantes vrp multipliées chacune par son coefficient directeur de variable restante arp :
Ainsi, la troisième fonction F3 dépend d’un nombre plus réduit de variables que le résultat ce qui rend plus facile le contrôle de ce résultat.
Avantageusement, le procédé selon un premier aspect de l’invention comporte une étape de synthèse des modèles de fonctionnement obtenus. Ainsi, il est possible de contrôler la cohérence des résultats du réseau de neurones.
Un deuxième aspect de l’invention concerne un procédé de contrôle des résultats fournis par un réseau de neurones artificiels caractérisé en ce qu’il comporte toutes les étapes du procédé de modélisation selon un premier aspect de l’invention et une étape additionnelle d’évaluation de la base de données d’entraînement à partir d’au moins un modèle de fonctionnement.
Ainsi, à partir du modèle de fonctionnement obtenu, il est possible de diagnostiquer une base de données d’entraînement qui n’est pas adaptée à la tâche que l’utilisateur souhaite réaliser avec le réseau de neurones.
Un troisième aspect de l’invention concerne un procédé de comparaison des performances d’un premier réseau de neurones artificiels et d’un deuxième réseau de neurones artificiels, caractérisé en ce qu’il comporte les étapes suivantes :
- Appliquer le procédé de modélisation selon un premier aspect de l’invention au premier réseau de neurones pour obtenir au moins un premier modèle de fonctionnement du premier réseau de neurones artificiels ;
- Appliquer le procédé de modélisation selon un premier aspect de l’invention au deuxième réseau de neurones pour obtenir au moins un deuxième modèle de fonctionnement du deuxième réseau de neurones artificiels ;
- Comparer les performances du premier réseau de neurones artificiels et du deuxième réseau de neurones artificiels en comparant chaque premier modèle de fonctionnement du premier réseau de neurones artificiels et chaque deuxième modèle de fonctionnement du deuxième réseau de neurones artificiels correspondants à une même donnée de test.
Ainsi, en comparant le premier modèle de fonctionnement et le deuxième modèle de fonctionnement correspondant à une même donnée testée, il est possible de comparer les performances d’un premier réseau de neurones et d’un deuxième réseau de neurones pour choisir le réseau de neurones qui prend en compte les variables de la donnée testée les plus pertinentes.
Un quatrième aspect de l’invention concerne un procédé d’analyse d’une prise de décision d’un réseau de neurones artificiels, la décision ayant été prise sur la base d’au moins une donnée de test, caractérisé en ce qu’il comporte les étapes du procédé de modélisation selon l’une quelconque des revendications 1 à 5 suivies d’une étape de génération d’un rapport explicatif de la prise de décision à partir du modèle de fonctionnement du réseau de neurones artificiels correspondant à la donnée de test.
Ainsi, grâce au modèle de fonctionnement du réseau de neurones, il est possible de comprendre objectivement les raisons de la prise de décision d’un réseau de neurones en identifiant les variables ayant le plus de poids dans cette prise de décision.
Un cinquième aspect de l’invention concerne un calculateur caractérisé en ce qu’il est adapté pour mettre en oeuvre le procédé de modélisation selon un premier aspect de l’invention et/ou le procédé de contrôle selon un deuxième aspect de l’invention et/ou le procédé de comparaison selon un troisième aspect de l’invention.
Un sixième aspect de l’invention concerne un produit programme d’ordinateur comprenant des instructions qui, lorsque le programme est exécuté par ordinateur, conduisent celui-ci à mettre en oeuvre les étapes du procédé de modélisation selon un premier aspect de l’invention et/ou du procédé de contrôle selon un deuxième aspect de l’invention et/ou du procédé de comparaison selon un troisième aspect de l’invention.
Un septième aspect de l’invention concerne un support d’enregistrement lisible par un ordinateur, sur lequel est enregistré le produit programme d’ordinateur selon un cinquième aspect de l’invention.
L’invention et ses différentes applications seront mieux comprises à la lecture de la description qui suit et à l’examen des figures qui l’accompagnent.
BREVE DESCRIPTION DES FIGURES
Les figures sont présentées à titre indicatif et nullement limitatif de l’invention.
- La figure 1 montre un schéma synoptique du procédé de modélisation selon un premier aspect de l’invention.
- La figure 2 montre un schéma synoptique du procédé de contrôle selon un deuxième aspect de l’invention.
- La figure 3 montre un schéma synoptique du procédé de comparaison selon un troisième aspect de l’invention.
- La figure 4 montre un schéma synoptique du procédé d’analyse selon un quatrième aspect de l’invention.
DESCRIPTION DETAILLEE D’AU MOINS UN MODE DE REALISATION DE L’INVENTION
Sauf précision contraire, un même élément apparaissant sur des figures différentes présente une référence unique.
Un premier aspect de l’invention concerne un procédé de modélisation 100 pour le contrôle des résultats fournis par un réseau de neurones artificiels. Dans la suite de la demande, on utilisera indifféremment les termes « neurone » et « neurone artificiel ».
Un réseau de neurones comporte une pluralité de couches comportant chacune une pluralité de neurones. Par exemple, un réseau de neurones comporte entre 2 et 20 couches et chaque couche du réseau de neurones comporte entre 10 et 2000 neurones. De manière générale, chaque neurone de chaque couche est connecté à chaque neurone de la couche précédente et à chaque neurone de la couche suivante par le biais d’une synapse artificielle. Cependant, on pourrait envisager le cas où chaque neurone de chaque couche est connecté uniquement à une partie des neurones de la couche précédente et/ou à une partie des neurones de la couche suivante. Une connexion entre deux neurones est affectée d’un poids ou coefficient synaptique et chaque neurone est affecté d’un coefficient de biais. Le coefficient de biais d’un neurone est sa valeur par défaut, c’est-à-dire sa valeur quand les neurones de la couche précédente auxquels il est connecté ne lui envoient aucun signal.
L’objectif du procédé de modélisation 100 est de générer un modèle simplifié pour chaque résultat R généré par le réseau de neurones. On entend par « résultat généré par un réseau de neurones », une donnée de sortie associée à la prise de décision du réseau de neurones concernant une donnée d’entrée. Avant de pouvoir générer des résultats, le réseau de neurones est entraîné sur une base de données d’entraînement ou base de données d’apprentissage pour être adapté à une tâche prédéfinie. L’apprentissage peut être supervisé ou non supervisé. En apprentissage supervisé, l’apprentissage est contraint par la base de données d’apprentissage. En effet, la base de données d’apprentissage est annotée pour signaler au réseau de neurones les structures qu’il doit repérer. Au contraire, en apprentissage non supervisé, le réseau de neurones trouve lui-même des structures sous-jacentes à partir des données brutes de la base de données d’entraînement.
La tâche prédéfinie est par exemple de la détection, de la classification ou encore de la reconnaissance. Classifier des données consiste à les séparer en plusieurs classes, c’est-à-dire à les classer, et à identifier chacune des classes. Par exemple, dans un échantillon contenant des données noires et des données blanches, classer les données correspond à les séparer en deux classes alors que classifier les données correspond à les séparer en deux classes et à attribuer à l’une le nom de « classe noire » et à l’autre le nom de « classe blanche ». Ainsi, un réseau de neurones ayant reçu un apprentissage supervisé est capable de classifier des données alors qu’un réseau de neurones ayant reçu un apprentissage non supervisé est seulement capable de classer des données.
Le réseau de neurones est ensuite testé sur une base de données de test ou base de données de généralisation. Pour chaque donnée de test de la base de données de test, le réseau de neurones fournit alors un résultat R illustrant sa prise de décision concernant la donnée de test. Par exemple, si la tâche pour laquelle le réseau de neurones a été entraîné est de la classification et que le réseau de neurones a pris la décision que la donnée de test faisait partie de la classe C, le résultat R fourni par le réseau de neurones est la probabilité associée à la classe C.
En pratique, la base de données d’entraînement et la base de données de test peuvent être deux bases de données distinctes ou deux parties séparées d’une même base de données.
Les données utilisées dans la base de données d’entraînement et dans la base de données de test sont par exemple des données biologiques, des données relatives à la réalisation d’un procédé ou d’un produit, des images, des données audios ou encore des signaux électriques. Une donnée comporte une pluralité de variables v, et chaque donnée utilisée comporte le même nombre de variables v,. Par exemple, une donnée comporte entre 10 et 10 000 variables v,.
Les variables v, peuvent être de type numérique, binaire, catégorique comme par exemple une nationalité ou une profession ou encore des dates. Dans le cas de données biologiques, les variables v, sont par exemple des informations sur un patient comme son âge, ses symptômes, son poids ainsi que des informations sur le résultat d’examens qu’il a passés comme des examens sanguins ou des examens IRM. Dans le cas de données relatives à la réalisation d’un produit, les variables v, sont par exemple des informations sur le produit comme son nom, sa composition ainsi que des informations sur son procédé de fabrication comme son temps de fabrication, le nom de la chaîne de montage sur laquelle il a été réalisé. Dans le cas de données relatives à des images, les variables v, sont par exemple la variance et la moyenne des niveaux de gris.
Les données utilisées peuvent être des données tabulaires comportant une pluralité d’exemples, chaque exemple dépendant d’une pluralité de variables v,. Une donnée utilisée de type tabulaire comporte par exemple entre 1000 et 1 000 000 exemples, comportant chacun entre 10 et 10 000 variables v,.
Prenons l’exemple d’un réseau de neurones comportant L couches de N neurones, utilisé sur une donnée de test dépendant de N variables v,.
L’expression h +1) du neurone k de la couche 1+1 s’exprime en fonction des N neurones i de la couche I de la manière suivante :
Avec f une fonction non linéaire, P^+1) le poids affecté à la connexion entre le neurone k de la couche 1+1 et le neurone i de la couche I, h® l’expression du neurone i de la couche I et b^1+1) le coefficient de biais affecté au neurone k de la couche 1+1.
La fonction f se définit par exemple comme : f(z) = max(z, 0)
L’expression du neurone k d’une couche s’exprime donc en fonction des expressions des neurones de la couche précédente et l’expression h®) du neurone k de la couche 1 s’exprime en fonction des variables v, de la donnée d’entrée de la manière suivante :
Pour un problème de classification, la probabilité pk associée à la classe k s’exprime alors de la manière suivante :
Le résultat R correspond alors à la probabilité pk maximale.
Le résultat R généré par un réseau de neurones est donc une fonction de l’ensemble des variables v, de la donnée de test pour laquelle le résultat R est généré, paramétrisée par les coefficients synaptiques Pki affectés aux connexions du réseau de neurones et par les coefficients de biais bk affectés à chaque neurone.
Il devient donc vite très compliqué de contrôler les résultats fournis par un réseau de neurones, le nombre de variables v, des données de test pouvant aller jusqu’à 10 000. Le procédé de modélisation 100 fournit un modèle qui est une approximation du résultat R généré par un réseau de neurones par une expression simplifiée, qui est fonction d’un nombre plus restreint de variables v,.
Le procédé de modélisation 100 selon un premier aspect de l’invention comporte plusieurs étapes dont l’enchaînement est représenté à la figure 1 . Ces étapes sont mises en oeuvre par un calculateur comportant au moins un processeur et une mémoire.
La première étape 101 du procédé de modélisation 100 est une étape de génération d’un réseau de neurones artificiels. Pour cela, le nombre de couches et le nombre de neurones par couche du réseau de neurones sont fixés ainsi que d’autres paramètres comme le pas d’apprentissage et le coefficient de régularisation, qui décrivent son processus d’apprentissage. Le pas d’apprentissage du réseau de neurones définit la fréquence à laquelle sont mis à jour les poids du réseau de neurones durant la phase d’apprentissage et le coefficient de régularisation limite le sur-apprentissage du réseau de neurones.
A la fin de cette étape 101 de génération du réseau de neurones, le réseau de neurones est prêt à être entraîné.
La deuxième étape 102 du procédé de modélisation 100 est une étape d’entraînement du réseau de neurones sur une base de données d’entraînement. A la fin de cette étape 102 d’entraînement du réseau de neurones, le réseau de neurones est apte à réaliser une tâche prédéfinie sur un certain type de données, le type des données présentes dans la base de données d’entraînement.
La troisième étape 103 du procédé de modélisation 100 est une étape de test du réseau de neurones sur au moins une donnée de test dépendant d’une pluralité de variables v,. Les données de test sont de même type que les données de la base de données d’entraînement. Durant cette étape, le réseau de neurones génère un résultat R par donnée de test traitée, le résultat R dépendant des mêmes variables v, que la donnée de test traitée.
La quatrième étape 104 du procédé de modélisation 100 est une étape d’approximation linéaire d’une première fonction F-i dépendant d’un résultat R généré à l’étape précédente 103.
Un résultat R est une fonction des variables v,, fonction dont les valeurs sont comprises entre 0 et 1 . Le résultat R est donc une fonction bornée. Or, une fonction linéaire n’est pas bornée. On applique donc avantageusement une transformation au résultat R pour obtenir une première fonction Fi non bornée qui sera approximée linéairement.
La première fonction F-, est par exemple définie par : Fi = log
Ainsi, la première fonction F-i est non bornée et dépend des mêmes variables v, que le résultat R. La première fonction F-i est ainsi obtenue en appliquant au résultat R la fonction inverse de la fonction sigmoïde s se définissant comme :
La fonction sigmoïde est utilisée dans la régression logistique, l’un des algorithmes d’apprentissage automatique les plus simples permettant de séparer une classe de l’ensemble des autres classes du problème. En effet, la régression logistique consiste en l’application d’une fonction sigmoïde à une expression linéaire. Ainsi, approximer la fonction Fi par une fonction linéaire L revient à approximer le résultat R par une régression logistique a(L). La première fonction F est ensuite approximée linéairement, en effectuant par exemple un développement limité au premier ordre au voisinage de la donnée de test, pour obtenir une deuxième fonction F2.
La deuxième fonction F2 s’exprime alors de la manière suivante :
Avec : b un coefficient d’ordonnée à l’origine, a, un coefficient directeur et v, les variables de la donnée de test.
Si l’approximation linéaire est réalisée en effectuant un développement limité au premier ordre au voisinage de la donnée de test, on a :
Avec : X, le point de données voisin de la donnée de test auquel est réalisé le développement limité.
Il suffit alors de calculer les gradients de la première fonction Fi par rapport aux variables v, de la donnée de test pour obtenir la deuxième fonction F2.
La cinquième étape 105 du procédé de modélisation 1 00 selon un premier aspect de l’invention est une étape de simplification de la deuxième fonction F2.
L’étape 105 de simplification comporte une première phase consistant à classer les variables v, en éliminant les corrélations entre les variables v,.
Initialement, les variables v, sont normalisées. Par exemple, toutes les variables v, ont une moyenne nulle et un écart type de 1 .
Un coefficient de contribution W, est calculée pour chaque variable v, de la donnée de test. Le coefficient de contribution Wk de la variable k s’exprime de la manière suivante :
Avec ak le coefficient directeur de la variable k dans la deuxième fonction F2, , le coefficient directeur de la variable j dans la deuxième fonction F2 et CkJ- le coefficient de corrélation entre la variable k et la variable j.
La variable v, avec le coefficient de contribution W, ayant la valeur absolue la plus élevée est désignée comme variable de référence vref. Chaque variable v, différente de la variable de référence vref est alors exprimée en fonction de la valeur de référence vref de la manière suivante :
vi refvref 5 Avec i une variable non corrélée à la variable vref et Ciref le coefficient de corrélation entre la variable i et la variable de référence vref. sj est ensuite normalisé pour obtenir une nouvelle variable n,’ :
Les nouvelles variables v,’ ainsi obtenues sont comparables car de même moyenne et de même écart-type.
Le coefficient directeur a,’ de chaque variable v,’ est alors exprimé de la manière suivante :
Les mêmes étapes sont alors appliquées aux nouvelles variables v,’, c’est-à-dire qu’un coefficient de contribution W,’ dépendant des coefficients directeurs a,’ et des coefficients de corrélation entre les nouvelles variables C’ est calculé pour chaque nouvelle variable v,’, une nouvelle valeur de référence vref’ est sélectionnée et de nouvelles variables v,” sont obtenues et ainsi de suite sur plusieurs itérations.
Le nombre d’itérations est prédéfini. Le nombre d’itérations est strictement inférieur au nombre de variables v, de la deuxième fonction F2 et supérieur ou égal à 1 . La pertinence de la valeur choisie pour le nombre d’itérations pourra être contrôlée en comparant la fonction linéaire obtenue pour ce nombre d’itérations et la fonction linéaire obtenue pour un nombre d’itérations supérieur, à l’aide d’une mesure de proximité, par exemple le rapport des normes des vecteurs de coefficients directeurs des fonctions linéaires obtenues.
La valeur de référence obtenue à chaque itération est une variable synthétique, les variables synthétiques étant indépendantes les unes des autres. Ainsi, si p itérations sont réalisées, p variables synthétiques sont obtenues et au bout de ces p itérations, les coefficients de contribution de toutes les autres variables sont mis à zéro.
Par exemple, si la deuxième fonction F2 dépend de 5 variables v-i, v2, v3, v4 et v5, et que le nombre d’itérations choisi est trois, la première phase de l’étape 105 de simplification consiste, dans un premier temps, à calculer le coefficient de corrélation de chaque variable W-i, W2, W3, W4 et W5. Par exemple, W3 vaut :
W3 = a3 + C^a-L + C32a2 + C 4a4 -I- C35a5
Les valeurs absolues des coefficients de corrélation W-i, W2, W3, W4 et W5 sont comparées entre elles et la variable ayant le coefficient de corrélation de valeur absolue la plus élevée est sélectionnée comme valeur de référence. Par exemple, v-i est sélectionnée comme valeur de référence.
Les variables restantes v2, v3, v4 et v5 sont alors exprimées en fonction de la variable de référence v-i . Par exemple, v2 vaut :
v2 = C21 v4 + e2
A partir de ces expressions, de nouvelles variables v2’, v3’, v4’ et v5’ sont calculées. Par exemple, v2’ vaut :
A l’issue de ces calculs, la première itération est terminée et l’on applique les mêmes étapes que précédemment aux nouvelles variables v2’, v3’, v4’ et v5’. Par exemple, v2’ est sélectionnée comme variable de référence. v3’, v4’ et v5’ sont alors exprimées en fonction de v2’. Par exemple, v3’ vaut : Puis, de nouvelles variables v3”, v4” et v5” sont calculées. Par exemple, v3” vaut : A l’issue de ces calculs, la deuxième itération est terminée.
Pendant la troisième et dernière itération, une variable de référence est sélectionnée parmi les nouvelles variables v3”, v4” et v5” comme précédemment. Par exemple, v3” est sélectionnée comme variable de référence. Puis, les coefficients de contribution des variables restantes v4” et v5” sont mis à zéro.
A la fin de la première phase de l’étape 105 de simplification, trois variables synthétiques v-i , v2’ et v3” sont obtenues. Les variables synthétiques ainsi exprimées ne correspondent pas aux variables v, de la donnée de test. Pour pouvoir contrôler le résultat R du réseau de neurones, il faudrait que le résultat R dépende des variables v, de la donnée de test.
Dans une deuxième phase de l’étape 105 de simplification, les variables synthétiques sont donc exprimées en fonction des variables v, de la donnée de test en utilisant la formule suivante jusqu’à ce que leur expression ne dépende plus que des variables v, de la deuxième fonction F2 :
Avec v® la variable variable
variable de référence à l’itération I correspondant initialement à la variable i et
C.·· ^ le coefficient de corrélation entre la variable i et la variable j à l'itération I. En reprenant l’exemple précédent de la deuxième fonction F2 dépendant de 5 variables, la valeur de référence de la première itération est la variable v-i et la valeur de référence de la deuxième itération est la variable v2’, donc la valeur de référence de la deuxième itération s’exprime comme :
La valeur de référence de la troisième itération est la variable v3”, qui s’exprime donc comme :
Avec
Les variables v, de la donnée de test dont dépendent les variables synthétiques sont des variables restantes vrp. Le nombre de variables restantes vrp est strictement inférieur au nombre de variables v, de la donnée de test.
La troisième fonction F3 s’exprime alors ainsi :
Avec arp un coefficient directeur de variable restante.
Pour calculer les coefficients directeurs de variable restante arp, les variables synthétiques sont parcourues en ordre inverse de la dernière sélectionnée à la première sélectionnée. Ainsi, si l’on a p itérations, à l’étape p - k + 1 de calcul des coefficients directeurs de variable restante, le coefficient directeur de la k-ème variable synthétique sélectionnée à la k-ème itération de la première phase de l’étape 105 de simplification est mis à jour suivant : tandis que les coefficients directeurs des variables sélectionnées après la k-ème variable synthétique, c’est-à-dire les variables synthétiques sélectionnées après la k-ème itération, sont mis à jour suivant :
En reprenant l’exemple précédent de la deuxième fonction F2 dépendant de 5 variables, les variables synthétiques sont v-i, v2’ et v3”.
A l’étape 1 de calcul des coefficients directeurs de variable restante, le coefficient directeur de la troisième variable synthétique v3” est mis à jour suivant :
Les autres variables synthétiques ayant été sélectionnées avant la troisième variable synthétique, leurs coefficients directeurs ne sont pas mis à jour à cette étape.
A l’étape 2 de calcul des coefficients directeurs de variable restante, le coefficient directeur de la deuxième variable synthétique v2’ est mis à jour suivant :
Le coefficient directeur de la troisième variable synthétique v3” sélectionnée après la deuxième variable synthétique v2’ est mis à jour suivant :
A l’étape 3 de calcul des coefficients directeurs de variable restante, le coefficient directeur de la première variable synthétique vi est mis à jour suivant : Les coefficients directeurs des deuxième et troisième variable synthétique v2’ et v3” sélectionnée après la première variable synthétique v-i sont mis à jour suivant : ar-,
A l’issue de l’étape 105 de simplification, la troisième fonction F3 dépend donc uniquement des variables restantes vrp, c’est-à-dire d’un nombre réduit de variables v, de la donnée de test.
L’étape 106 du procédé de modélisation 100 selon un premier aspect de l’invention consiste à appliquer la fonction inverse de la première fonction Fi à la troisième fonction F3 pour obtenir un modèle de fonctionnement du réseau de neurones pour le résultat R. Le modèle de fonctionnement du réseau de neurones est un résultat R simplifié, dépendant d’un nombre réduit de variables v, facilitant le contrôle du résultat R fourni par le réseau de neurones.
Le procédé de modélisation 100 selon un premier aspect de l’invention génère un modèle de fonctionnement pour chaque résultat R. Si plusieurs résultats R ont été générés par le réseau de neurones, le procédé de modélisation 100 peut par exemple comporter une étape additionnelle de synthèse des modèles de fonctionnement. Les données de test étant similaires, l’étape de synthèse peut permettre de contrôler la cohérence des résultats du réseau de neurones.
Un deuxième aspect de l’invention concerne un procédé de contrôle 200 pour contrôler les résultats fournis par un réseau de neurones artificiels.
Le procédé de contrôle 200 selon un deuxième aspect de l’invention comporte plusieurs étapes dont l’enchaînement est représenté à la figure 2. Le procédé de contrôle 200 selon un deuxième aspect de l’invention comporte toutes les étapes 101 à 106 du procédé de modélisation 100 selon un premier aspect de l’invention permettant d’obtenir au moins un modèle de fonctionnement du réseau de neurones.
Le procédé de contrôle 200 selon un deuxième aspect de l’invention comporte ensuite une étape 201 d’évaluation de la base de données d’entraînement consistant à comparer le nombre restreint de variables v, dont dépend chaque modèle de fonctionnement avec un certain nombre de variables v, pertinentes.
Par exemple, dans le cas de la détection de personnes dans une image, seuls les pixels de l’image sur lesquels se trouvent les personnes sont pertinents. Si les variables v, sont par exemple la moyenne et la variance de chaque pixel de l’image, les variables v, pertinentes sont donc la moyenne et la variance des pixels sur lesquels se trouvent les personnes. Si le modèle de fonctionnement dépend majoritairement de variables v, liées à des pixels ne correspondant pas à une personne dans l’image mais à des pixels du fond, cela signifie que les variables v, prises en compte dans la prise de décision du réseau de neurones sont erronées, et donc que l’apprentissage n’a pas permis au réseau de neurones de devenir performant pour la tâche escomptée. Ceci est une indication que la base de données d’entraînement n’est pas adaptée à la détection de personnes. Les variables v, non pertinentes prises en compte par le réseau de neurones donnent alors des pistes permettant de comprendre pourquoi la base de données d’entraînement n’est pas adaptée et ainsi d’y remédier. Dans cet exemple, le fait que le réseau de neurones prenne en compte des pixels du fond peut être dû à une trop grande homogénéité des fonds derrière les personnes. Une solution est donc d’ajouter à la base de données d’entraînement des images avec des fonds plus variés. Au contraire, si le modèle de fonctionnement dépend majoritairement de variables v, pertinentes, cela signifie que la base de données d’entraînement est bien adaptée pour la tâche escomptée.
Un troisième aspect de l’invention concerne un procédé de comparaison 300 pour comparer les performances de deux réseaux de neurones artificiels. Les deux réseaux de neurones peuvent, pour une donnée de test donnée, avoir des résultats similaires, par exemple, dans le cas où l’on veut prédire la maladie d’un patient à partir de symptômes, les deux réseaux de neurones donnent en sortie la même maladie avec une même probabilité de certitude, ou des résultats différents, par exemple, les deux réseaux de neurones ne donnent pas la même maladie en sortie. Pour deux réseaux de neurones ayant des performances similaires, cela peut alors permettre de choisir un réseau de neurone préféré, qui utilise des variables plus pertinentes dans sa prise de décision. Pour deux réseaux de neurones ayant des performances différentes, cela peut par exemple permettre de comprendre pourquoi l’un des réseaux de neurones est défaillant.
Le procédé de comparaison 300 selon un troisième aspect de l’invention comporte plusieurs étapes dont l’enchaînement est représenté à la figure 3.
Le procédé de comparaison 300 selon un troisième aspect de l’invention comporte toutes les étapes 101 à 106 du procédé de modélisation 100 selon un premier aspect de l’invention pour un premier réseau de neurones permettant d’obtenir au moins un premier modèle de fonctionnement du premier réseau de neurones et toutes les étapes 101 à 106 du procédé de modélisation 100 selon un premier aspect de l’invention pour un deuxième réseau de neurones permettant d’obtenir au moins un deuxième modèle de fonctionnement du deuxième réseau de neurones.
Le procédé de comparaison 300 selon un troisième aspect de l’invention comporte ensuite une étape 301 de comparaison des performances du premier réseau de neurones et du deuxième réseau de neurones en comparant pour une même donnée de test, le premier modèle de fonctionnement du premier réseau de neurones artificiels et le deuxième modèle de fonctionnement du deuxième réseau de neurones artificiels. Plus précisément, l’étape 301 de comparaison consiste à comparer les variables v, dont dépend le premier modèle de fonctionnement et les variables v, dont dépend le deuxième modèle de fonctionnement. Les variables v, prises en compte dans un des deux modèles de fonctionnement et pas dans l’autre modèle de fonctionnement sont alors comparées avec un certain nombre de variables v, pertinentes. Ainsi, le réseau de neurones utilisant le moins de variables v, non pertinentes dans sa prise de décision est considéré comme le plus performant.
Par exemple, dans le cas où l’on veut prédire la maladie d’un patient à partir de ses symptômes, le premier modèle de fonctionnement prend en compte la fièvre, la fatigue et les courbatures alors que le deuxième modèle de fonctionnement prend en compte la fièvre, la fatigue et la douleur à l’oreille pour diagnostiquer la grippe. Les variables v, prises en compte dans un des deux modèles de fonctionnement et pas dans l’autre modèle de fonctionnement sont les courbatures pour le premier modèle de fonctionnement et la douleur à l’oreille pour le deuxième modèle de fonctionnement. Les variables v, pertinentes sont les symptômes couramment observés chez un patient atteint de la grippe. Les courbatures font donc partie des variables v, pertinentes ce qui n’est pas le cas de la douleur à l’oreille. Le réseau de neurones le plus performant pour réaliser cette tâche est donc le premier réseau de neurones.
Le procédé de contrôle 200 et le procédé de comparaison 300 sont compatibles, c’est-à-dire que le procédé de comparaison 300 peut comporter l’étape 201 d’évaluation de la base de données d’entraînement.
L’étape 201 d’évaluation de la base de données d’entraînement du procédé de contrôle 200 et l’étape 301 de comparaison des performances des deux réseaux de neurones peuvent être mises en oeuvre par un calculateur ou réalisées manuellement. Un quatrième aspect de l’invention concerne un procédé d’analyse d’une prise de décision d’un réseau de neurones artificiels.
La prise de décision est automatique, c’est-à-dire qu’elle est réalisée par un réseau de neurones ayant été entraîné pour cette prise de décision.
La décision est prise à partir d’au moins une donnée de test.
Par exemple dans le contexte du véhicule autonome, la prise de décision d’un réseau de neurones adapté à la détection de piétons peut être de freiner ou non en fonction de la présence ou non d’un piéton dans l’environnement proche de la voiture.
Le procédé d’analyse 400 selon un quatrième aspect de l’invention comporte plusieurs étapes dont l’enchaînement est représenté à la figure 4.
Le procédé d’analyse 400 selon un quatrième aspect de l’invention comporte toutes les étapes 101 à 106 du procédé de modélisation 100 selon un premier aspect de l’invention pour un réseau de neurones permettant d’obtenir au moins un modèle de fonctionnement du réseau de neurones à partir d’au moins une donnée de test.
Le procédé d’analyse 400 selon un quatrième aspect de l’invention comporte ensuite une étape 401 de génération d’un rapport expliquant la prise de décision du réseau de neurones à partir du ou des modèle(s) de fonctionnement correspondant à la ou aux donnée(s) de test.
L’étape 401 de génération d’un rapport consiste par exemple à synthétiser les modèles de fonctionnement s’il y en a plusieurs pour identifier les variables ayant le plus de poids dans la prise de décision et à générer un rapport comportant ces variables. La synthèse consiste par exemple à ne garder que les variables ayant un pourcentage de présence dans les modèles de fonctionnement supérieur à un certain seuil de présence.
Le rapport comporte par exemple les variables accompagnées de leur pourcentage de présence et de leur poids dans la prise de décision.
Ainsi, dans le cas d’un réseau de neurones adapté au diagnostic d’une maladie sur la base de symptômes, les principaux symptômes ayant abouti au diagnostic de telle maladie sont indiqués dans le rapport généré. Il est alors possible d’identifier les éventuelles failles du réseau de neurones et de les corriger.
En cas de faute grave liée à la prise de décision d’un réseau de neurones, par exemple une mauvaise médication liée à un mauvais diagnostic ayant entraîné des complications ou encore un accident impliquant un véhicule autonome, un tel rapport permet de déterminer les causes de la faute et éventuellement le ou les responsable(s), répondant ainsi à un impératif légal/réglementaire.

Claims

REVENDICATIONS
1. Procédé de modélisation (100) pour le contrôle des résultats fournis par un réseau de neurones artificiels comportant les étapes suivantes mises en oeuvre par un calculateur :
- Générer un réseau de neurones artificiels (101 ) ;
- Entraîner le réseau de neurones artificiels sur une base de données d’entraînement (102) ;
- Tester le réseau de neurones artificiels sur au moins une donnée de test dépendant d’une pluralité de variables v, de manière à obtenir un résultat R par donnée de test, le résultat R dépendant des variables Vi (103) ;
- Pour chaque résultat R :
• Approximer par un modèle linéaire une première fonction F-i dépendant uniquement du résultat R pour obtenir une deuxième fonction F2, la première fonction Fi et la deuxième fonction F2 dépendant des variables v, (104) ;
• Simplifier la deuxième fonction F2 pour obtenir une troisième fonction F3 dépendant d’un nombre plus réduit de variables v, (105) ;
• Appliquer à la troisième fonction F3 la fonction inverse de la première fonction Fi pour obtenir un modèle de fonctionnement du réseau de neurones (106).
2. Procédé de modélisation (100) selon la revendication 1 , caractérisé en ce que la deuxième fonction F2 s’exprime comme la somme d’un coefficient d’ordonnée à l’origine b et de la somme des variables v, multipliées chacune par un coefficient directeur a, :
3. Procédé de modélisation (100) selon l’une quelconque des revendications précédentes, caractérisé en ce qu’une première variable vi corrélée à une deuxième variable v2 s’exprime en fonction de la deuxième variable v2 comme la somme d’une variable non corrélée Si et d’un coefficient de corrélation Ci2 multiplié à la deuxième variable v2 :
V1 = Cl2v2 + Si
4. Procédé de modélisation (100) selon la revendication 2 et la revendication 3, caractérisé en ce que l’étape de simplification (105) comporte les sous- étapes suivantes :
- Créer un vecteur de variables Vv comportant les variables v, ;
- Créer un vecteur de variables synthétiques VVs vide ;
- Créer un vecteur de coefficients de contribution Vc vide ;
- Réaliser au moins une fois les sous-étapes suivantes :
• Pour chaque variable vk du vecteur de variables Vv, exprimer un coefficient de contribution Wk en fonction du coefficient directeur ak de ladite variable vk, des coefficients directeurs a, et des coefficients de corrélation Ck, des variables v, du vecteur de variables Vv corrélées à ladite variable vk ;
• Comparer les valeurs absolues des coefficients de contribution W, et déterminer une variable de référence vref ayant le coefficient de contribution Wref de valeur absolue la plus élevée ;
• Ajouter au vecteur de variables synthétiques VVs ladite variable de référence vret ;
• Ajouter au vecteur de coefficients de contribution Vc le coefficient de contribution Wret de ladite variable de référence vref ;
• Pour chaque variable vk du vecteur de variables Vv différente de la variable de référence vret et corrélée à la variable de référence vref, exprimer ladite variable vk corrélée en fonction de la variable de référence vref et normaliser la variable non corrélée sk pour obtenir une nouvelle variable vk’ ;
• Vider le vecteur de variables Vv et remplir le vecteur de variables Vv avec les nouvelles variables n,’ ; - Exprimer les variables contenues dans le vecteur de variables synthétiques VVs en fonction des variables v, de la deuxième fonction F2 pour obtenir des variables restantes vrp ;
- Exprimer un coefficient directeur de variable restante arp pour chaque variable restante vrp à l’aide du vecteur de coefficients de contribution Vc.
5. Procédé de modélisation selon la revendication 4, caractérisé en ce que la troisième fonction F3 s’exprime comme la somme du coefficient d’ordonnée à l’origine b et de la somme des variables restantes vrp multipliées chacune par son coefficient directeur de variable restante arp :
6. Procédé de contrôle (200) des résultats fournis par un réseau de neurones artificiels caractérisé en ce qu’il comporte toutes les étapes du procédé de modélisation selon l’une quelconque des revendications précédentes et une étape (201 ) additionnelle d’évaluation de la base de données d’entraînement à partir d’au moins un modèle de fonctionnement.
7. Procédé de comparaison (300) des performances d’un premier réseau de neurones artificiels et d’un deuxième réseau de neurones artificiels, caractérisé en ce qu’il comporte les étapes suivantes :
- Appliquer le procédé de modélisation (100) selon l’une quelconque des revendications 1 à 5 au premier réseau de neurones artificiels pour obtenir au moins un premier modèle de fonctionnement du premier réseau de neurones artificiels ;
- Appliquer le procédé de modélisation (100) selon l’une quelconque des revendications 1 à 5 au deuxième réseau de neurones artificiels pour obtenir au moins un deuxième modèle de fonctionnement du deuxième réseau de neurones artificiels ;
- Comparer les performances du premier réseau de neurones artificiels et du deuxième réseau de neurones artificiels en comparant chaque premier modèle de fonctionnement du premier réseau de neurones artificiels et chaque deuxième modèle de fonctionnement du deuxième réseau de neurones artificiels correspondants à une même donnée de test (301 ).
8. Calculateur caractérisé en ce qu’il est adapté pour mettre en oeuvre le procédé de modélisation (100) selon l’une quelconque des revendications 1 à 5 et/ou le procédé de contrôle (200) selon la revendication 6 et/ou le procédé de comparaison (300) selon la revendication 7.
9. Produit programme d’ordinateur comprenant des instructions qui, lorsque le programme est exécuté par ordinateur, conduisent celui-ci à mettre en oeuvre les étapes du procédé de modélisation (100) selon l’une quelconque des revendications 1 à 5 et/ou du procédé de contrôle (200) selon la revendication 6 et/ou du procédé de comparaison (300) selon la revendication 7.
10. Support d’enregistrement lisible par un ordinateur, sur lequel est enregistré le produit programme d’ordinateur selon la revendication 9.
1 1. Procédé (400) d’analyse d’une prise de décision d’un réseau de neurones artificiels, la décision ayant été prise sur la base d’au moins une donnée de test, caractérisé en ce qu’il comporte les étapes du procédé de modélisation (100) selon l’une quelconque des revendications 1 à 5 suivies d’une étape (401 ) de génération d’un rapport explicatif de la prise de décision à partir du modèle de fonctionnement du réseau de neurones artificiels correspondant à la donnée de test.
EP19733051.7A 2018-06-29 2019-06-28 Procede de modelisation pour le controle des resultats fournis par un reseau de neurones artificiels et autres procedes associes Withdrawn EP3815001A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1856012A FR3083354A1 (fr) 2018-06-29 2018-06-29 Procede de modelisation pour le controle des resultats fournis par un reseau de neurones artificiels et autres procedes associes
PCT/EP2019/067289 WO2020002573A1 (fr) 2018-06-29 2019-06-28 Procede de modelisation pour le controle des resultats fournis par un reseau de neurones artificiels et autres procedes associes

Publications (1)

Publication Number Publication Date
EP3815001A1 true EP3815001A1 (fr) 2021-05-05

Family

ID=65443896

Family Applications (1)

Application Number Title Priority Date Filing Date
EP19733051.7A Withdrawn EP3815001A1 (fr) 2018-06-29 2019-06-28 Procede de modelisation pour le controle des resultats fournis par un reseau de neurones artificiels et autres procedes associes

Country Status (6)

Country Link
US (1) US20210279526A1 (fr)
EP (1) EP3815001A1 (fr)
CA (1) CA3104759A1 (fr)
FR (1) FR3083354A1 (fr)
SG (1) SG11202012987TA (fr)
WO (1) WO2020002573A1 (fr)

Also Published As

Publication number Publication date
FR3083354A1 (fr) 2020-01-03
WO2020002573A1 (fr) 2020-01-02
SG11202012987TA (en) 2021-02-25
CA3104759A1 (fr) 2020-01-02
US20210279526A1 (en) 2021-09-09

Similar Documents

Publication Publication Date Title
Suriyal et al. Mobile assisted diabetic retinopathy detection using deep neural network
FR3095042A1 (fr) Procede de definition d’un chemin
FR3018118A1 (fr) Procede de test d'un systeme electronique
Shamia et al. An Online Platform for Early Eye Disease Detection using Deep Convolutional Neural Networks
EP4099228A1 (fr) Apprentissage automatique sans annotation ameliore par regroupements adaptatifs en ensemble ouvert de classes
EP3660748A1 (fr) Procédé d'analyse d'un jeu de paramètres d'un réseau de neurones en vue d'obtenir une amélioration technique, par exemple un gain en mémoire
EP3815001A1 (fr) Procede de modelisation pour le controle des resultats fournis par un reseau de neurones artificiels et autres procedes associes
WO2020229310A1 (fr) Procédé d'analyse automatique d'images pour reconnaître automatiquement au moins une caractéristique rare
WO2019211367A1 (fr) Procede de generation automatique de reseaux de neurones artificiels et procede d'evaluation d'un risque associe
EP3929809A1 (fr) Procédé de détection d'au moins un trait biométrique visible sur une image d entrée au moyen d'un réseau de neurones à convolution
EP2825995B1 (fr) Système pour déterminer l'identification d'un appareil photographique a partir d'une photographie et procédé mis en oeuvre dans un tel système
FR3126253A1 (fr) Procédé pour normaliser la variabilité d’une image, application de ce procédé à la détection d’anomalie et système d’inspection visuelle implémentant cette détection
EP1554687B1 (fr) SystEme associatif flou de description d objets multimEdia
EP4012620A1 (fr) Méthode d'apprentissage automatique par transfert
EP4191530A1 (fr) Procédé de localisation et cartographie simultanées intégrant un masquage temporel auto-supervisé et modèle d'apprentissage automatique pour générer un tel masquage
FR3112879A1 (fr) Procédé de contrôle automatique de qualité d’une pièce aéronautique
FR3133472A1 (fr) Methode pour la detection d'anomalie utilisant un modele global-local
EP4309118A1 (fr) Échantillonnage neutre de données et fonction de perte de corrélation différenciable
FR3113155A1 (fr) Procédé d’identification d’un implant dentaire visible sur une image d’entrée au moyen d’au moins un réseau de neurones à convolution.
FR3117646A1 (fr) Méthode de compression d’un réseau de neurones artificiel
WO2021009364A1 (fr) Procédé d'identification de données aberrantes dans d'un jeu de données d'entrée acquises par au moins un capteur
EP4189642A1 (fr) Prédiction d'étiquettes pour images numériques notamment médicales et fourniture d'explications associées auxdites étiquettes
FR3128045A1 (fr) Procédé de gestion d'une structure multitâche d'un ensemble de réseaux neuronaux convolutifs
WO2021245227A1 (fr) Procédé de génération d'un système d'aide à la décision et systèmes associés
WO2024002959A1 (fr) Procédé de classification d'images, dispositif électronique et produit programme d'ordinateur correspondant

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20201228

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20210817