FR3101715A1

FR3101715A1 - Procédé et système multimodal d’identification d’objets

Info

Publication number: FR3101715A1
Application number: FR1911022A
Authority: FR
Inventors: Antoine LEGER; Rémi KORNALEWSKI
Original assignee: F2j Reman Chaumont
Current assignee: F2j Reman Chaumont
Priority date: 2019-10-04
Filing date: 2019-10-04
Publication date: 2021-04-09
Anticipated expiration: 2039-10-04
Also published as: FR3101715B1

Abstract

Procédé et système multimodal d’identification d’objets La présente invention a pour objet un procédé d’identification d’objets (1) basé sur un algorithme d’apprentissage automatique comportant une phase d’initialisation (P1) au cours de laquelle, au moins une base de donnée d’images d’objets annotées ou annotées et segmentées est créée de sorte à former une base de donnée d’images d’entraînement (B1) , une phase d’entraînement (P2) au cours de laquelle l’algorithme s’entraîne à l’identification d’objets sur ladite base de donnée d’images d’entraînement (B1) et une phase de déploiement (P3) permettant d’associer un objet à sa classe (13) en capturant une image dudit objet à identifier (11) et en analysant ladite image (11), ledit procédé (1) étant caractérisé en ce qu’il comporte au moins les étapes de: - Création d’au moins une base de données de masses (B2) associant chaque classe à la masse moyenne des objets de cette classe, - Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée, - Utilisation d’une fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini, - Analyse des classes restantes et proposition d’un résultat ;

Description

Procédé et système multimodal d’identification d’objets

Domaine technique de l'invention

La présente invention concerne le domaine de la vision par ordinateur (intelligence artificielle) et plus particulièrement de l’identification de pièces mécaniques par l’utilisation de l’apprentissage profond (communément appelé en anglais « Deep Learning »).

Etat de la technique

Dans le domaine de l’identification de pièces mécaniques par ordinateur, il est connu d'utiliser un algorithme de type réseau de neurones convolutifs (aussi appelé réseau de neurones convolutionnels) que l’on va entraîner à l’aide de données d’entrée (apprentissage supervisé), en général une base de données d’images brutes associées à des annotations, afin qu’il puisse accomplir sa tâche d’identification de pièce.

Plusieurs éléments peuvent diminuer les performances du système: luminosité faible ou trop élevée lors de la capture d’une image de la pièce par exemple…Ce problème de luminosité est régulièrement observé sur les sites industriels et entraînent l’acquisition d’images floues ou de mauvaise qualité. La maîtrise de l’ensemble des paramètres pouvant influencer la qualité de l’acquisition de l’image est d’autant plus importante, lors de l’identification de pièces mécaniques complexes, qui ont très peu d’éléments distinctifs, par exemple, des pièces détachées de moteurs industriels.

Pour pallier à ces inconvénients, un éclairage adapté est généralement positionné au niveau de l’appareil d’acquisition de l’image. Cependant, l’angle de positionnement de l’éclairage peut entraîner l’apparition de zones d’ombre au niveau des pièces comprenant de nombreux reliefs (aspérités, ouvertures…) et perturber l’identification.

Le but de la présente invention est donc de pallier les inconvénients précédemment cités et de proposer un procédé, un système et un dispositif d’identification d’objets basés sur un réseau de neurones convolutifs et permettant l’identification de pièces mécaniques complexes dans un contexte industriel.

Conformément à l’invention, il est donc proposé un procédé d’identification d’objets basé sur un algorithme d’apprentissage automatique (communément appelé en anglais « Machine Learning ») comportant une phase d’initialisation au cours de laquelle, au moins une base de donnée d’images d’objets est créée, lesdites images étant au moins annotées de sorte à former une base de donnée d’images d’entraînement, une phase d’entraînement au cours de laquelle l’algorithme s’entraîne à l’identification d’objets sur ladite base de donnée d’images d’entraînement et une phase de déploiement permettant d’associer un objet à sa classe en capturant une image dudit objet à identifier et en analysant ladite image, ledit procédé étant remarquable en ce qu’il comporte lors de la phase d’initialisation, au moins l’étape de:
- Création d’au moins une base de données de masses associant chaque classe à la masse moyenne des objets de cette classe,
lors de la phase de déploiement, au moins les étapes de:
- Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée (communément appelée en anglais « Softmax »),
- Utilisation d’une fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
- Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier par un appareil d’acquisition de la masse, et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier,
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images d’entraînement, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement,
lesdites phases d’entraînement et de déploiement au moins, étant effectuées par un algorithme de classification multi-classes basé sur un apprentissage supervisé.

On appelle « apprentissage automatique », un processus par lequel un algorithme évalue et améliore ses performances sans l’intervention d’un programmeur, en répétant son exécution sur des jeux de données jusqu’à obtenir, de manière régulière, des résultats pertinents.

On appelle « apprentissage supervisé », un processus d’apprentissage dans lequel les données en entrée sont déjà catégorisées et selon lequel, les algorithmes doivent s’en servir pour prédire un résultat en vue de pouvoir le faire plus tard lorsque les données ne seront plus catégorisées ou annotées.

On appelle « algorithme de classification multi classes », un algorithme qui permet d’effectuer une tâche de classification comportant plus de deux catégories. La classification multi classes suppose que chaque échantillon est attribué à une seule et même « étiquette » ou annotation.

On appelle « images annotées », des images qui se sont vues assigner automatiquement des mots clés par un système informatique.

Avantageusement, le procédé comporte lors de la phase d’initialisation, au moins les étapes suivantes :
a) Acquisition d’images d’au moins un objet, lesdites images étant annotées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images d’entraînement,
b) Création d’au moins une base de données de masses associant chaque classe à la masse moyenne des objets de cette classe,
lors de la phase d’entraînement, au moins l’étape suivante :
c) Entraînement du réseau de neurones convolutifs sur ladite base de donnée d’images d’entraînement,
lors de la phase de déploiement, au moins les étapes suivantes :
d) Entrée : Capture d’une image de l’objet à identifier par un appareil de capture d’images et transmission de ladite image au réseau de neurones convolutifs entraîné,
e) Traitement de ladite image par le réseau de neurones convolutifs:
-e1 : Extraction des caractéristiques (communément appelée en anglais « features extraction ») par les couches de convolution (communément appelée en anglais « convolution layers ») et les couches de regroupement (communément appelé en anglais « pooling layers »),
- e2 : Classification de l’objet à identifier par la couche totalement connectée (communément appelée en anglais « fully connected layer »)
-e3 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée,
-e4 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
-e5 : Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier par un appareil d’acquisition de la masse, et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier,
-- si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement,
lesdites phases d’entraînement et de déploiement au moins, étant effectuées par un réseau de neurones convolutifs (communément appelé en anglais « Convolutional Neural Network : CNN »).

De manière préférentielle, au moins les phases d’entraînement et de déploiement sont effectuées par un réseau de neurones convolutifs basé sur les régions (communément appelé en anglais « Region based Convolutional Neural Network : R-CNN ») et l’étape e commence par une sous étape e0 : Extraction des propositions de régions (communément appelées en anglais « Region proposals »).

De manière encore plus préférentielle, l’étape a devient l’étape a’ : Acquisition d’images d’au moins un objet, lesdites images étant annotées et segmentées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images d’entraînement, l’étape e devient l’étape e’ : Analyse de ladite image par le réseau de neurones convolutifs basé sur des régions masquées :
-e’1 : Génération de la carte des caractéristiques (communément appelée en anglais « Feature Map ») par le réseau convolutionnel et en parallèle, proposition de régions par le réseau de proposition de région (communément appelé en anglais « Region Proposal Network »),
-e’2 : Détection des régions d’intérêt (communément appelées en anglais « Region of Interest : ROI »),
-e’3 : Alignement des régions d’intérêt (ROI) par la couche d’alignement des ROI,
-e’4 : Utilisation des Fonctions de Classification, de Régression (communément appelé en anglais « Bounding Regression function ») par la couche complétement connectée (communément appelé en anglais « fully connected layer»), et en parallèle, génération des masques pour chaque ROI par la branche masque,
-e’5 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée et amélioration des cadres de limitation (communément appelés « bounding box » en anglais),
-e’6 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
-e’6 : Analyse des classes restantes et proposition d’un résultat en sortie:
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier par un appareil d’acquisition de la masse, et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier,
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement,
les phases d’entraînement et de déploiement au moins, étant effectuées par un réseau de neurones convolutifs avec masquage de régions (communément appelé en anglais « Mask R-CNN : Mask Region-based Convolutional Neural Network »).

De manière avantageuse, au moins les phases d’entraînement et de déploiement sont effectuées par le réseau de neurones convolutifs avec masquage de régions pré-entraîné à la classification sur une base de données d’images de pré-entraînement (processus communément appelé en anglais « Transfer learning»), ladite phase d’entraînement sur la base de données d’images d’entraînement adaptant ledit réseau de neurones convolutifs à l’identification des nouveaux objets (communément appelé en anglais « fine tuning »).

L’invention concerne également un système d’identification d’objet remarquable en ce qu’il comporte au moins :
-un dispositif permettant l’acquisition d’images de l’objet à identifier,
-un dispositif permettant l’acquisition de la masse de l’objet à identifier,
- un dispositif informatique en communication avec au moins lesdits dispositifs d’acquisition d’images et de masses, ledit dispositif informatique étant conçu pour mettre en œuvre au moins le procédé de classification dudit objet décrit précédemment.

Préférentiellement, le dispositif d’acquisition d’images permet l’acquisition d’images de haute résolution.

Avantageusement, le dispositif d’acquisition de la masse a une précision de deux décimales après la virgule.

L’invention concerne enfin, un dispositif informatique d’identification d’objets, conçu pour mettre en œuvre au moins le procédé de classification dudit objet décrit précédemment, et comportant au moins :
-un processeur,
-une mémoire de stockage accessible au moins audit processeur et stockant un programme informatique pour exécuter le procédé décrit précédemment.

Brèves descriptions des figures :

D’autres avantages et caractéristiques ressortiront mieux de la description qui va suivre d’un mode de réalisation d’un procédé, d’un système et d’un dispositif informatique selon l’invention :

est une représentation d’un réseau de neurones convolutifs basé sur les masques de régions (communément appelé en anglais « Mask R-CNN : « Mask Region-based Convolutional Neural Network : Mask R-CNN ») sur lequel s’appuie un mode de réalisation du procédé d’identification d’objets conforme à l’invention.

est un organigramme de la phase d’initialisation d’un mode de réalisation du procédé conforme à l’invention,

est un organigramme de la phase d’entraînement d’un mode de réalisation du procédé conforme à l’invention,

est un organigramme de la phase de déploiement d’un mode de réalisation du procédé conforme à l’invention,

est une représentation schématique de la phase de pré-entraînement, de la phase d’entraînement et de la phase de déploiement d’un réseau de neurones convolutifs basé sur les masques de régions (communément appelé en anglais « Mask R-CNN : « Mask Region-based Convolutional Neural Network : Mask R-CNN ») sur lequel s’appuie un mode de réalisation du procédé d’identification d’objets conforme à l’invention,

est une représentation schématique d’un système d’identification d’objet selon l’invention,

est une représentation schématique d’un dispositif informatique d’identification d’objet selon l’invention,

Description des modes de réalisations :

Conformément aux figures 1 à 7, il est donc proposé un procédé d’identification d’objets 1 basé sur un algorithme d’apprentissage automatique (communément appelé en anglais « Machine Learning ») comportant une phase d’initialisation P1 au cours de laquelle, au moins une base de donnée d’images d’objets est créée, lesdites images étant au moins annotées de sorte à former une base de donnée d’images d’entraînement B1, une phase d’entraînement P2 au cours de laquelle l’algorithme s’entraîne à l’identification d’objets sur ladite base de donnée d’images d’entraînement B1 et une phase de déploiement P3 permettant d’associer un objet à sa classe 13 en capturant une image dudit objet à identifier 11 et en analysant ladite image 11, ledit procédé 1 étant remarquable en ce qu’il comporte lors de la phase d’initialisation P1, au moins l’étape de:
- Création d’au moins une base de données de masses B2 associant chaque classe à la masse moyenne des objets de cette classe,
lors de la phase de déploiement P3, au moins les étapes de:
- Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée (communément appelée en anglais « Softmax »),
- Utilisation d’une fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
- Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier 10 par un appareil d’acquisition de la masse A2, et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier 10 est la classe de l’objet 13,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier 13,
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier 13 n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images d’entraînement B1, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement P3,
lesdites phases d’entraînement P2 et de déploiement P3 au moins, étant effectuées par un algorithme de classification multi-classes basé sur un apprentissage supervisé.

La phase d’initialisation P1 peut se faire manuellement ou automatiquement, à l’aide d’un outil informatique ou de l’algorithme lui-même.

Plusieurs types d’algorithmes de classification multi classes basé sur un apprentissage supervisé pourront être choisis: l’algorithme de classification naïve Bayésienne, réseau de neurones convolutifs etc…Ce choix dépendra de la complexité des objets à identifier, du nombre de classes d’objets existant et de la ressemblance entre les objets. Dans le cas où, les classes d’objets sont nombreuses et où la ressemblance est grande, on travaillera avec des algorithmes de type réseau de neurones. Le seuil X est choisi pour être assez élevé, de sorte à éviter les faux positif. On choisira par exemple des taux entre 0.97 et 0.95. Ceci permet de ne garder que les résultats les plus fiables.

Dans le cas où l’objet à identifier ne fait pas partie de la base de donnée d’entraînement B1, il est possible de l’y ajouter. La qualité de l’image 11 capturée au début du processus d’identification influe énormément le système. Si la pièce n’est pas positionnée correctement ou que la lumière entraîne l’apparition de certaines zones d’ombre, l’identification de la pièce par l’algorithme peut échouer.

Avantageusement, le procédé 1 comporte lors de la phase d’initialisation P1, au moins les étapes suivantes :
a) Acquisition d’images d’au moins un objet, lesdites images étant annotées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images d’entraînement B1,
b) Création d’au moins une base de données de masses B2 associant chaque classe à la masse moyenne des objets de cette classe 80,
lors de la phase d’entraînement P2, au moins l’étape suivante :
c) Entraînement du réseau de neurones convolutifs sur ladite base de donnée d’images B1 d’entraînement 90,
lors de la phase de déploiement P3, au moins les étapes suivantes :
d) Entrée : Capture d’une image de l’objet à identifier 11 par un appareil de capture d’images A1 et transmission de ladite image 11 au réseau de neurones convolutifs entraîné 100,
e) Traitement de ladite image par le réseau de neurones convolutifs:
-e1 : Extraction des caractéristiques (communément appelée en anglais « features extraction ») par les couches de convolution (communément appelées en anglais « convolution layers ») et les couches de regroupement (communément appelées en anglais « pooling layers »),
- e2 : Classification de l’objet à identifier par la couche totalement connectée (communément appelée en anglais « fully connected layer »)
-e3 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée,
-e4 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
-e5 : Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier 10 par un appareil d’acquisition de la masse A2, et comparaison de ladite masse 10 aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet 13,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier 13,
-- si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier 13 n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images B1, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement P3,
lesdites phases d’entraînement P2 et de déploiement P3 au moins, étant effectuées par un réseau de neurones convolutifs (communément appelé en anglais « Convolutional Neural Network : CNN »).

De manière préférentielle, au moins les phases d’entraînement P2 et de déploiement P3 sont effectuées par un réseau de neurones convolutif basé sur les régions (communément appelé en anglais « Region based Convolutional Neural Network : R-CNN ») et l’étape e commence par une sous étape e0 : Extraction des propositions de régions (communément appelée en anglais « Region proposals »).

Il existe différents types de réseaux de neurones convolutifs basé sur les régions : Réseau de neurones convolutifs basé sur les régions rapide (communément appelé en anglais « Fast R-CNN »), réseau de neurones convolutifs basé sur les régions plus rapide (communément appelé en anglais « Faster R-CNN »), … Ces réseaux sont le fruit d’une évolution dans le temps qui les a rendus de plus en plus robustes, précis et rapides.

De manière encore plus préférentielle, l’étape a devient l’étape a’ : Acquisition d’images d’au moins un objet, lesdites images étant annotées et segmentées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images B1 d’entraînement 70, en ce que l’étape e devient l’étape e’ : Analyse de ladite image par le réseau de neurones convolutifs basé sur des régions masquées :
-e’1 : Génération de la carte des caractéristiques (communément appelée en anglais « Feature Map ») 110 par le réseau convolutionnel 21 et en parallèle, proposition de régions 111 par le réseau de proposition de région (communément appelée en anglais « Region Proposal Network ») 22,
-e’2 : Détection des régions d’intérêt (communément appelée en anglais « Region of Interest : ROI ») 120,
-e’3 : Alignement des régions d’intérêt (ROI) 130 par la couche d’alignement des ROI 23,
-e’4 : Utilisation des Fonctions de Classification 140, de Régression (communément appelée en anglais « Bounding Regression function ») 141 par la couche complétement connectée 24, et en parallèle, génération des masques pour chaque ROI 143 par la branche masque 25,
-e’5 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée 150 et amélioration des cadres de limitation 151,
-e’6 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini 160,
-e’6 : Analyse des classes restantes et proposition d’un résultat en sortie:
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier 11 par un appareil A2 d’acquisition de la masse 180, et comparaison de ladite masse 11 aux masses moyennes des objets associés aux classes restantes 181, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier 11 est la classe 13 de l’objet 190,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe 13 de l’objet à identifier 190,
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier 13 n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images B1, soit il a été mal positionné lors de la capture d’image 100 et doit donc être repositionné 170 avant de recommencer les étapes de la phase de déploiement P3,
les phases d’entraînement P2 et de déploiement P3 au moins, étant effectuées par un réseau de neurones convolutifs avec masquage de régions (communément appelé en anglais « Mask R-CNN : Mask Region-based Convolutional Neural Network ») 20.

Ici, on travaillera avec un réseau de neurones convolutifs avec masquage de régions 20 car c’est le réseau le plus rapide et le plus robuste connu à ce jour, pour les tâches d’identification.

De manière avantageuse, au moins les phases d’entraînement P2 et de déploiement P3 sont effectuées par le réseau de neurones convolutifs avec masquage de régions 20 pré-entraîné à la classification sur une base de données d’images de pré-entraînement B3 (processus communément appelé en anglais « Transfer learning»), ladite phase d’entraînement P2 sur la base de données d’images d’entraînement B1 adaptant ledit réseau de neurones convolutifs 20 à l’identification des nouveaux objets (communément appelé en anglais « fine tuning »).

Le pré-entraînement est réalisé à partir de la base de données d’images « ImageNet ». Ce processus consiste à prendre un modèle de réseau qui a déjà été formé pour une tâche donnée et à lui faire exécuter une deuxième tâche similaire. Cela permet d'optimiser l'apprentissage et de ne pas commencer de zéro.

L’invention concerne également un système d’identification d’objets 2 remarquable en ce qu’il comporte au moins :
-un dispositif A1 permettant l’acquisition d’images de l’objet à identifier 11,
-un dispositif A2 permettant l’acquisition de la masse de l’objet à identifier 10,
- un dispositif informatique A3 en communication avec au moins lesdits dispositifs d’acquisition d’images A1 et de masses A2, ledit dispositif informatique A3 étant conçu pour mettre en œuvre au moins le procédé 1 tel que décrit précédemment.

Plusieurs éléments pourront être mis en place pour améliorer le système 2 : mise en place d’une source de lumière polarisée pour supprimer les réflexions, mise en place d’un dôme de lumière afin d’avoir un éclairage diffus de l’objet à identifier…

Préférentiellement, le dispositif d’acquisition d’images A1 permet l’acquisition d’images 11 de haute résolution. Les images 11 auront préférentiellement une résolution de 2560 x 1920 pixels. Il est important d’avoir des images 11 dont la résolution est assez bonne mais qui ne soient pas trop lourdes pour ne pas surcharger la mémoire 31 du système 2 lors de l'apprentissage.

Avantageusement, le dispositif d’acquisition de la masse A2 a une précision de deux décimales après la virgule. La précision de la mesure de masse est importante pour que ce facteur joue le rôle de facteur discriminant entre deux objets à identifier.

L’invention concerne enfin, un dispositif informatique A3 d’identification d’objets, conçu pour mettre en œuvre au moins le procédé 1 décrit précédemment de classification dudit objet, remarquable en ce qu’il comporte au moins :
-un processeur 30,
-une mémoire 31 de stockage accessible au moins audit processeur 30 et stockant un programme informatique pour exécuter le procédé 1 tel que précédemment décrit.

On choisira un dispositif informatique A3 de type ordinateur ayant une carte graphique puissante pour les phases d’entraînement P2 (GTX 1080Ti par exemple). Une interface Homme-machine permettra à l’utilisateur d’interagir facilement avec le dispositif d’identification. Des boutons permettront le déclenchement de la capture image de l’objet 11, de l’acquisition de sa masse 10, de l’affichage du résultat de l’identification etc…

Claims

Procédé d’identification d’objets (1) basé sur un algorithme d’apprentissage automatique comportant une phase d’initialisation (P1) au cours de laquelle, au moins une base de donnée d’images d’objets est créée, lesdites images étant au moins annotées de sorte à former une base de donnée d’images d’entraînement (B1), une phase d’entraînement (P2) au cours de laquelle l’algorithme s’entraîne à l’identification d’objets sur ladite base de donnée d’images d’entraînement (B1) et une phase de déploiement (P3) permettant d’associer un objet à sa classe (13) en capturant une image dudit objet à identifier (11) et en analysant ladite image (11), ledit procédé (1) étant caractérisé en ce qu’il comporte lors de la phase d’initialisation (P1), au moins l’étape de:
- Création d’au moins une base de données de masses (B2) associant chaque classe à la masse moyenne des objets de cette classe,
lors de la phase de déploiement (P3), au moins les étapes de:
- Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée,
- Utilisation d’une fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
- Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier (10) par un appareil d’acquisition de la masse (A2), et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier (10) est la classe de l’objet (13),
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier (13),
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier (13) n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images d’entraînement (B1), soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement (P3),
lesdites phases d’entraînement (P2) et de déploiement (P3) au moins, étant effectuées par un algorithme de classification multi-classes basé sur un apprentissage supervisé.
Procédé d’identification d’objets (1) selon la revendication 1 caractérisé en ce qu’il comporte lors de la phase d’initialisation (P1), au moins les étapes suivantes :
a) Acquisition d’images d’au moins un objet, lesdites images étant annotées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images d’entraînement (B1),
b) Création d’au moins une base de données de masses (B2) associant chaque classe à la masse moyenne des objets de cette classe (80),
lors de la phase d’entraînement (P2), au moins l’étape suivante :
c) Entraînement du réseau de neurones convolutifs sur ladite base de donnée d’images (B1) d’entraînement (90),
lors de la phase de déploiement (P3), au moins les étapes suivantes :
d) Entrée : Capture d’une image de l’objet à identifier (11) par un appareil de capture d’images (A1) et transmission de ladite image (11) au réseau de neurones convolutifs entraîné (100),
e) Traitement de ladite image par le réseau de neurones convolutifs:
-e1 : Extraction des caractéristiques par les couches de convolution et les couches de regroupement,
- e2 : Classification de l’objet à identifier par la couche totalement connectée
-e3 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée,
-e4 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
-e5 : Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier (10) par un appareil d’acquisition de la masse (A2), et comparaison de ladite masse (10) aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet (13),
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier (13),
-- si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier (13) n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images (B1), soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement (P3),
lesdites phases d’entraînement (P2) et de déploiement (P3) au moins, étant effectuées par un réseau de neurones convolutifs.
Procédé d’identification d’objets (1) selon la revendication précédente caractérisé en ce qu’au moins les phases d’entraînement (P2) et de déploiement (P3) sont effectuées par un réseau de neurones convolutif basé sur les régions et en ce que l’étape e commence par une sous étape e0 : Extraction des propositions de régions.
Procédé d’identification d’objets (1) selon la revendication 2 caractérisé en ce que l’étape a devient l’étape a’ : Acquisition d’images d’au moins un objet, lesdites images étant annotées et segmentées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images (B1) d’entraînement (70), en ce que l’étape e devient l’étape e’ : Analyse de ladite image par le réseau de neurones convolutifs basé sur des régions masquées :
-e’1 : Génération de la carte des caractéristiques (110) par le réseau convolutionnel (21) et en parallèle, proposition de régions(111) par le réseau de proposition de région (22),
-e’2 : Détection des régions d’intérêt (120),
-e’3 : Alignement des régions d’intérêt (ROI) (130) par la couche d’alignement des ROI (23),
-e’4 : Utilisation des Fonctions de Classification (140), de Régression (141) par la couche complétement connectée (24), et en parallèle, génération des masques pour chaque ROI (143) par la branche masque (25),
-e’5 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée (150) et amélioration des cadres de limitation (151),
-e’6 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini (160),
-e’6 : Analyse des classes restantes et proposition d’un résultat en sortie:
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier (11) par un appareil (A2) d’acquisition de la masse (180), et comparaison de ladite masse (11) aux masses moyennes des objets associés aux classes restantes (181), la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier (11) est la classe (13) de l’objet (190),
--si le nombre de classes restantes est égal à 1: la classe restante est la classe (13) de l’objet à identifier (190),
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier (13) n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images (B1), soit il a été mal positionné lors de la capture d’image (100) et doit donc être repositionné (170) avant de recommencer les étapes de la phase de déploiement (P3),
les phases d’entraînement (P2) et de déploiement (P3) au moins, étant effectuées par un réseau de neurones convolutifs avec masquage de régions (20).
Procédé d’identification d’objets (1) selon la revendication précédente caractérisé en ce qu’au moins les phases d’entraînement (P2) et de déploiement (P3) sont effectuées par le réseau de neurones convolutifs avec masquage de régions (20) pré-entraîné à la classification sur une base de données d’images de pré-entraînement (B3), ladite phase d’entraînement (P2) sur la base de données d’images d’entraînement (B1) adaptant ledit réseau de neurones convolutifs (20) à l’identification des nouveaux objets.
Système d’identification d’objets (2) caractérisé en ce qu’il comporte au moins :
-un dispositif (A1) permettant l’acquisition d’images de l’objet à identifier (11),
-un dispositif (A2) permettant l’acquisition de la masse de l’objet à identifier (10),
- un dispositif informatique (A3) en communication avec au moins lesdits dispositifs d’acquisition d’images (A1) et de masses (A2), ledit dispositif informatique (A3) étant conçu pour mettre en œuvre au moins le procédé (1) selon les revendications 1 à 5 de classification dudit objet.
Système d’identification d’objets (2) selon la revendication 6, caractérisé en ce que le dispositif d’acquisition d’images (A1) permet l’acquisition d’images (11) de haute résolution.
Système d’identification d’objets (2) selon les revendications 6 et 7, caractérisé en ce que le dispositif d’acquisition de la masse (A2) a une précision au centième.
Dispositif informatique (A3) d’identification d’objets, conçu pour mettre en œuvre au moins le procédé (1) selon les revendications 1 à 5 de classification dudit objet, caractérisé en ce qu’il comporte au moins :
-un processeur (30),
-une mémoire (31) de stockage accessible au moins audit processeur (30) et stockant un programme informatique pour exécuter le procédé (1) selon les revendications 1 à 5.