FR3101715A1 - Procédé et système multimodal d’identification d’objets - Google Patents

Procédé et système multimodal d’identification d’objets Download PDF

Info

Publication number
FR3101715A1
FR3101715A1 FR1911022A FR1911022A FR3101715A1 FR 3101715 A1 FR3101715 A1 FR 3101715A1 FR 1911022 A FR1911022 A FR 1911022A FR 1911022 A FR1911022 A FR 1911022A FR 3101715 A1 FR3101715 A1 FR 3101715A1
Authority
FR
France
Prior art keywords
class
mass
training
identified
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1911022A
Other languages
English (en)
Other versions
FR3101715B1 (fr
Inventor
Antoine LEGER
Rémi KORNALEWSKI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F2j Reman Chaumont
Original Assignee
F2j Reman Chaumont
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F2j Reman Chaumont filed Critical F2j Reman Chaumont
Priority to FR1911022A priority Critical patent/FR3101715B1/fr
Publication of FR3101715A1 publication Critical patent/FR3101715A1/fr
Application granted granted Critical
Publication of FR3101715B1 publication Critical patent/FR3101715B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

Procédé et système multimodal d’identification d’objets La présente invention a pour objet un procédé d’identification d’objets (1) basé sur un algorithme d’apprentissage automatique comportant une phase d’initialisation (P1) au cours de laquelle, au moins une base de donnée d’images d’objets annotées ou annotées et segmentées est créée de sorte à former une base de donnée d’images d’entraînement (B1) , une phase d’entraînement (P2) au cours de laquelle l’algorithme s’entraîne à l’identification d’objets sur ladite base de donnée d’images d’entraînement (B1) et une phase de déploiement (P3) permettant d’associer un objet à sa classe (13) en capturant une image dudit objet à identifier (11) et en analysant ladite image (11), ledit procédé (1) étant caractérisé en ce qu’il comporte au moins les étapes de: - Création d’au moins une base de données de masses (B2) associant chaque classe à la masse moyenne des objets de cette classe, - Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée, - Utilisation d’une fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini, - Analyse des classes restantes et proposition d’un résultat ;

Description

Procédé et système multimodal d’identification d’objets
Domaine technique de l'invention
La présente invention concerne le domaine de la vision par ordinateur (intelligence artificielle) et plus particulièrement de l’identification de pièces mécaniques par l’utilisation de l’apprentissage profond (communément appelé en anglais « Deep Learning »).
Etat de la technique
Dans le domaine de l’identification de pièces mécaniques par ordinateur, il est connu d'utiliser un algorithme de type réseau de neurones convolutifs (aussi appelé réseau de neurones convolutionnels) que l’on va entraîner à l’aide de données d’entrée (apprentissage supervisé), en général une base de données d’images brutes associées à des annotations, afin qu’il puisse accomplir sa tâche d’identification de pièce.
Plusieurs éléments peuvent diminuer les performances du système: luminosité faible ou trop élevée lors de la capture d’une image de la pièce par exemple…Ce problème de luminosité est régulièrement observé sur les sites industriels et entraînent l’acquisition d’images floues ou de mauvaise qualité. La maîtrise de l’ensemble des paramètres pouvant influencer la qualité de l’acquisition de l’image est d’autant plus importante, lors de l’identification de pièces mécaniques complexes, qui ont très peu d’éléments distinctifs, par exemple, des pièces détachées de moteurs industriels.
Pour pallier à ces inconvénients, un éclairage adapté est généralement positionné au niveau de l’appareil d’acquisition de l’image. Cependant, l’angle de positionnement de l’éclairage peut entraîner l’apparition de zones d’ombre au niveau des pièces comprenant de nombreux reliefs (aspérités, ouvertures…) et perturber l’identification.
Le but de la présente invention est donc de pallier les inconvénients précédemment cités et de proposer un procédé, un système et un dispositif d’identification d’objets basés sur un réseau de neurones convolutifs et permettant l’identification de pièces mécaniques complexes dans un contexte industriel.
Conformément à l’invention, il est donc proposé un procédé d’identification d’objets basé sur un algorithme d’apprentissage automatique (communément appelé en anglais « Machine Learning ») comportant une phase d’initialisation au cours de laquelle, au moins une base de donnée d’images d’objets est créée, lesdites images étant au moins annotées de sorte à former une base de donnée d’images d’entraînement, une phase d’entraînement au cours de laquelle l’algorithme s’entraîne à l’identification d’objets sur ladite base de donnée d’images d’entraînement et une phase de déploiement permettant d’associer un objet à sa classe en capturant une image dudit objet à identifier et en analysant ladite image, ledit procédé étant remarquable en ce qu’il comporte lors de la phase d’initialisation, au moins l’étape de:
- Création d’au moins une base de données de masses associant chaque classe à la masse moyenne des objets de cette classe,
lors de la phase de déploiement, au moins les étapes de:
- Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée (communément appelée en anglais « Softmax »),
- Utilisation d’une fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
- Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier par un appareil d’acquisition de la masse, et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier,
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images d’entraînement, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement,
lesdites phases d’entraînement et de déploiement au moins, étant effectuées par un algorithme de classification multi-classes basé sur un apprentissage supervisé.
On appelle « apprentissage automatique », un processus par lequel un algorithme évalue et améliore ses performances sans l’intervention d’un programmeur, en répétant son exécution sur des jeux de données jusqu’à obtenir, de manière régulière, des résultats pertinents.
On appelle « apprentissage supervisé », un processus d’apprentissage dans lequel les données en entrée sont déjà catégorisées et selon lequel, les algorithmes doivent s’en servir pour prédire un résultat en vue de pouvoir le faire plus tard lorsque les données ne seront plus catégorisées ou annotées.
On appelle « algorithme de classification multi classes », un algorithme qui permet d’effectuer une tâche de classification comportant plus de deux catégories. La classification multi classes suppose que chaque échantillon est attribué à une seule et même « étiquette » ou annotation.
On appelle « images annotées », des images qui se sont vues assigner automatiquement des mots clés par un système informatique.
Avantageusement, le procédé comporte lors de la phase d’initialisation,  au moins les étapes suivantes :
a) Acquisition d’images d’au moins un objet, lesdites images étant annotées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images d’entraînement,
b) Création d’au moins une base de données de masses associant chaque classe à la masse moyenne des objets de cette classe,
lors de la phase d’entraînement, au moins l’étape suivante :
c) Entraînement du réseau de neurones convolutifs sur ladite base de donnée d’images d’entraînement,
lors de la phase de déploiement, au moins les étapes suivantes :
d) Entrée : Capture d’une image de l’objet à identifier par un appareil de capture d’images et transmission de ladite image au réseau de neurones convolutifs entraîné,
e) Traitement de ladite image par le réseau de neurones convolutifs:
-e1 : Extraction des caractéristiques (communément appelée en anglais « features extraction ») par les couches de convolution (communément appelée en anglais « convolution layers ») et les couches de regroupement (communément appelé en anglais « pooling layers »),
- e2 : Classification de l’objet à identifier par la couche totalement connectée (communément appelée en anglais « fully connected layer »)
-e3 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée,
-e4 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
-e5 : Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier par un appareil d’acquisition de la masse, et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier,
-- si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement,
lesdites phases d’entraînement et de déploiement au moins, étant effectuées par un réseau de neurones convolutifs (communément appelé en anglais « Convolutional Neural Network : CNN »).
De manière préférentielle, au moins les phases d’entraînement et de déploiement sont effectuées par un réseau de neurones convolutifs basé sur les régions (communément appelé en anglais « Region based Convolutional Neural Network : R-CNN ») et l’étape e commence par une sous étape e0 : Extraction des propositions de régions (communément appelées en anglais « Region proposals »).
De manière encore plus préférentielle, l’étape a devient l’étape a’ : Acquisition d’images d’au moins un objet, lesdites images étant annotées et segmentées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images d’entraînement, l’étape e devient l’étape e’ : Analyse de ladite image par le réseau de neurones convolutifs basé sur des régions masquées :
-e’1 : Génération de la carte des caractéristiques (communément appelée en anglais « Feature Map ») par le réseau convolutionnel et en parallèle, proposition de régions par le réseau de proposition de région (communément appelé en anglais « Region Proposal Network »),
-e’2 : Détection des régions d’intérêt (communément appelées en anglais « Region of Interest : ROI »),
-e’3 : Alignement des régions d’intérêt (ROI) par la couche d’alignement des ROI,
-e’4 : Utilisation des Fonctions de Classification, de Régression (communément appelé en anglais « Bounding Regression function ») par la couche complétement connectée (communément appelé en anglais « fully connected  layer»), et en parallèle, génération des masques pour chaque ROI par la branche masque,
-e’5 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée et amélioration des cadres de limitation (communément appelés « bounding box » en anglais),
-e’6 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
-e’6 : Analyse des classes restantes et proposition d’un résultat en sortie:
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier par un appareil d’acquisition de la masse, et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier,
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement,
les phases d’entraînement et de déploiement au moins, étant effectuées par un réseau de neurones convolutifs avec masquage de régions (communément appelé en anglais « Mask R-CNN :  Mask Region-based Convolutional Neural Network »).
De manière avantageuse, au moins les phases d’entraînement et de déploiement sont effectuées par le réseau de neurones convolutifs avec masquage de régions pré-entraîné à la classification sur une base de données d’images de pré-entraînement (processus communément appelé en anglais « Transfer learning»), ladite phase d’entraînement sur la base de données d’images d’entraînement adaptant ledit réseau de neurones convolutifs à l’identification des nouveaux objets (communément appelé en anglais « fine tuning »).
L’invention concerne également un système d’identification d’objet remarquable en ce qu’il comporte au moins :
-un dispositif permettant l’acquisition d’images de l’objet à identifier,
-un dispositif permettant l’acquisition de la masse de l’objet à identifier,
- un dispositif informatique en communication avec au moins lesdits dispositifs d’acquisition d’images et de masses, ledit dispositif informatique étant conçu pour mettre en œuvre au moins le procédé de classification dudit objet décrit précédemment.
Préférentiellement, le dispositif d’acquisition d’images permet l’acquisition d’images de haute résolution.
Avantageusement, le dispositif d’acquisition de la masse a une précision de deux décimales après la virgule.
L’invention concerne enfin, un dispositif informatique d’identification d’objets, conçu pour mettre en œuvre au moins le procédé de classification dudit objet décrit précédemment, et comportant au moins :
-un processeur,
-une mémoire de stockage accessible au moins audit processeur et stockant un programme informatique pour exécuter le procédé décrit précédemment.
Brèves descriptions des figures :
D’autres avantages et caractéristiques ressortiront mieux de la description qui va suivre d’un mode de réalisation d’un procédé, d’un système et d’un dispositif informatique selon l’invention :
est une représentation d’un réseau de neurones convolutifs basé sur les masques de régions (communément appelé en anglais « Mask R-CNN : « Mask Region-based Convolutional Neural Network : Mask R-CNN ») sur lequel s’appuie un mode de réalisation du procédé d’identification d’objets conforme à l’invention.
est un organigramme de la phase d’initialisation d’un mode de réalisation du procédé conforme à l’invention,
est un organigramme de la phase d’entraînement d’un mode de réalisation du procédé conforme à l’invention,
est un organigramme de la phase de déploiement d’un mode de réalisation du procédé conforme à l’invention,
est une représentation schématique de la phase de pré-entraînement, de la phase d’entraînement et de la phase de déploiement d’un réseau de neurones convolutifs basé sur les masques de régions (communément appelé en anglais « Mask R-CNN : « Mask Region-based Convolutional Neural Network : Mask R-CNN ») sur lequel s’appuie un mode de réalisation du procédé d’identification d’objets conforme à l’invention,
est une représentation schématique d’un système d’identification d’objet selon l’invention,
est une représentation schématique d’un dispositif informatique d’identification d’objet selon l’invention,
Description des modes de réalisations :
Conformément aux figures 1 à 7, il est donc proposé un procédé d’identification d’objets 1 basé sur un algorithme d’apprentissage automatique (communément appelé en anglais « Machine Learning ») comportant une phase d’initialisation P1 au cours de laquelle, au moins une base de donnée d’images d’objets est créée, lesdites images étant au moins annotées de sorte à former une base de donnée d’images d’entraînement B1, une phase d’entraînement P2 au cours de laquelle l’algorithme s’entraîne à l’identification d’objets sur ladite base de donnée d’images d’entraînement B1 et une phase de déploiement P3 permettant d’associer un objet à sa classe 13 en capturant une image dudit objet à identifier 11 et en analysant ladite image 11, ledit procédé 1 étant remarquable en ce qu’il comporte lors de la phase d’initialisation P1, au moins l’étape de:
- Création d’au moins une base de données de masses B2 associant chaque classe à la masse moyenne des objets de cette classe,
lors de la phase de déploiement P3, au moins les étapes de:
- Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée (communément appelée en anglais « Softmax »),
- Utilisation d’une fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
- Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier 10 par un appareil d’acquisition de la masse A2, et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier 10 est la classe de l’objet 13,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier 13,
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier 13 n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images d’entraînement B1, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement P3,
lesdites phases d’entraînement P2 et de déploiement P3 au moins, étant effectuées par un algorithme de classification multi-classes basé sur un apprentissage supervisé.
La phase d’initialisation P1 peut se faire manuellement ou automatiquement, à l’aide d’un outil informatique ou de l’algorithme lui-même.
Plusieurs types d’algorithmes de classification multi classes basé sur un apprentissage supervisé pourront être choisis: l’algorithme de classification naïve Bayésienne, réseau de neurones convolutifs etc…Ce choix dépendra de la complexité des objets à identifier, du nombre de classes d’objets existant et de la ressemblance entre les objets. Dans le cas où, les classes d’objets sont nombreuses et où la ressemblance est grande, on travaillera avec des algorithmes de type réseau de neurones. Le seuil X est choisi pour être assez élevé, de sorte à éviter les faux positif. On choisira par exemple des taux entre 0.97 et 0.95. Ceci permet de ne garder que les résultats les plus fiables.
Dans le cas où l’objet à identifier ne fait pas partie de la base de donnée d’entraînement B1, il est possible de l’y ajouter. La qualité de l’image 11 capturée au début du processus d’identification influe énormément le système. Si la pièce n’est pas positionnée correctement ou que la lumière entraîne l’apparition de certaines zones d’ombre, l’identification de la pièce par l’algorithme peut échouer.
Avantageusement, le procédé 1 comporte lors de la phase d’initialisation P1,  au moins les étapes suivantes :
a) Acquisition d’images d’au moins un objet, lesdites images étant annotées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images d’entraînement B1,
b) Création d’au moins une base de données de masses B2 associant chaque classe à la masse moyenne des objets de cette classe 80,
lors de la phase d’entraînement P2, au moins l’étape suivante :
c) Entraînement du réseau de neurones convolutifs sur ladite base de donnée d’images B1 d’entraînement 90,
lors de la phase de déploiement P3, au moins les étapes suivantes :
d) Entrée : Capture d’une image de l’objet à identifier 11 par un appareil de capture d’images A1 et transmission de ladite image 11 au réseau de neurones convolutifs entraîné 100,
e) Traitement de ladite image par le réseau de neurones convolutifs:
-e1 : Extraction des caractéristiques (communément appelée en anglais « features extraction ») par les couches de convolution (communément appelées en anglais « convolution layers ») et les couches de regroupement (communément appelées en anglais « pooling layers »),
- e2 : Classification de l’objet à identifier par la couche totalement connectée (communément appelée en anglais « fully connected layer »)
-e3 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée,
-e4 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
-e5 : Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier 10 par un appareil d’acquisition de la masse A2, et comparaison de ladite masse 10 aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet 13,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier 13,
-- si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier 13 n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images B1, soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement P3,
lesdites phases d’entraînement P2 et de déploiement P3 au moins, étant effectuées par un réseau de neurones convolutifs (communément appelé en anglais « Convolutional Neural Network : CNN »).
De manière préférentielle, au moins les phases d’entraînement P2 et de déploiement P3 sont effectuées par un réseau de neurones convolutif basé sur les régions (communément appelé en anglais « Region based Convolutional Neural Network : R-CNN ») et l’étape e commence par une sous étape e0 : Extraction des propositions de régions (communément appelée en anglais « Region proposals »).
Il existe différents types de réseaux de neurones convolutifs basé sur les régions : Réseau de neurones convolutifs basé sur les régions rapide (communément appelé en anglais « Fast R-CNN »), réseau de neurones convolutifs basé sur les régions plus rapide (communément appelé en anglais « Faster R-CNN »), … Ces réseaux sont le fruit d’une évolution dans le temps qui les a rendus de plus en plus robustes, précis et rapides.
De manière encore plus préférentielle, l’étape a devient l’étape a’ : Acquisition d’images d’au moins un objet, lesdites images étant annotées et segmentées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images B1 d’entraînement 70, en ce que l’étape e devient l’étape e’ : Analyse de ladite image par le réseau de neurones convolutifs basé sur des régions masquées :
-e’1 : Génération de la carte des caractéristiques (communément appelée en anglais « Feature Map ») 110 par le réseau convolutionnel 21 et en parallèle, proposition de régions 111 par le réseau de proposition de région (communément appelée en anglais « Region Proposal Network ») 22,
-e’2 : Détection des régions d’intérêt (communément appelée en anglais « Region of Interest : ROI ») 120,
-e’3 : Alignement des régions d’intérêt (ROI) 130 par la couche d’alignement des ROI 23,
-e’4 : Utilisation des Fonctions de Classification 140, de Régression (communément appelée en anglais « Bounding Regression function ») 141 par la couche complétement connectée 24, et en parallèle, génération des masques pour chaque ROI 143 par la branche masque 25,
-e’5 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée 150 et amélioration des cadres de limitation 151,
-e’6 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini 160,
-e’6 : Analyse des classes restantes et proposition d’un résultat en sortie:
-- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier 11 par un appareil A2 d’acquisition de la masse 180, et comparaison de ladite masse 11 aux masses moyennes des objets associés aux classes restantes 181, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier 11 est la classe 13 de l’objet 190,
--si le nombre de classes restantes est égal à 1: la classe restante est la classe 13 de l’objet à identifier 190,
--si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier 13 n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images B1, soit il a été mal positionné lors de la capture d’image 100 et doit donc être repositionné 170 avant de recommencer les étapes de la phase de déploiement P3,
les phases d’entraînement P2 et de déploiement P3 au moins, étant effectuées par un réseau de neurones convolutifs avec masquage de régions (communément appelé en anglais « Mask R-CNN :  Mask Region-based Convolutional Neural Network ») 20.
Ici, on travaillera avec un réseau de neurones convolutifs avec masquage de régions 20 car c’est le réseau le plus rapide et le plus robuste connu à ce jour, pour les tâches d’identification.
De manière avantageuse, au moins les phases d’entraînement P2 et de déploiement P3 sont effectuées par le réseau de neurones convolutifs avec masquage de régions 20 pré-entraîné à la classification sur une base de données d’images de pré-entraînement B3 (processus communément appelé en anglais « Transfer learning»), ladite phase d’entraînement P2 sur la base de données d’images d’entraînement B1 adaptant ledit réseau de neurones convolutifs 20 à l’identification des nouveaux objets (communément appelé en anglais « fine tuning »).
Le pré-entraînement est réalisé à partir de la base de données d’images « ImageNet ». Ce processus consiste à prendre un modèle de réseau qui a déjà été formé pour une tâche donnée et à lui faire exécuter une deuxième tâche similaire. Cela permet d'optimiser l'apprentissage et de ne pas commencer de zéro.
L’invention concerne également un système d’identification d’objets 2 remarquable en ce qu’il comporte au moins :
-un dispositif A1 permettant l’acquisition d’images de l’objet à identifier 11,
-un dispositif A2 permettant l’acquisition de la masse de l’objet à identifier 10,
- un dispositif informatique A3 en communication avec au moins lesdits dispositifs d’acquisition d’images A1 et de masses A2, ledit dispositif informatique A3 étant conçu pour mettre en œuvre au moins le procédé 1 tel que décrit précédemment.
Plusieurs éléments pourront être mis en place pour améliorer le système 2 : mise en place d’une source de lumière polarisée pour supprimer les réflexions, mise en place d’un dôme de lumière afin d’avoir un éclairage diffus de l’objet à identifier…
Préférentiellement, le dispositif d’acquisition d’images A1 permet l’acquisition d’images 11 de haute résolution. Les images 11 auront préférentiellement une résolution de 2560 x 1920 pixels. Il est important d’avoir des images 11 dont la résolution est assez bonne mais qui ne soient pas trop lourdes pour ne pas surcharger la mémoire 31 du système 2 lors de l'apprentissage.
Avantageusement, le dispositif d’acquisition de la masse A2 a une précision de deux décimales après la virgule. La précision de la mesure de masse est importante pour que ce facteur joue le rôle de facteur discriminant entre deux objets à identifier.
L’invention concerne enfin, un dispositif informatique A3 d’identification d’objets, conçu pour mettre en œuvre au moins le procédé 1 décrit précédemment de classification dudit objet, remarquable en ce qu’il comporte au moins :
-un processeur 30,
-une mémoire 31 de stockage accessible au moins audit processeur 30 et stockant un programme informatique pour exécuter le procédé 1 tel que précédemment décrit.
On choisira un dispositif informatique A3 de type ordinateur ayant une carte graphique puissante pour les phases d’entraînement P2 (GTX 1080Ti par exemple). Une interface Homme-machine permettra à l’utilisateur d’interagir facilement avec le dispositif d’identification. Des boutons permettront le déclenchement de la capture image de l’objet 11, de l’acquisition de sa masse 10, de l’affichage du résultat de l’identification etc…

Claims (9)

  1. Procédé d’identification d’objets (1) basé sur un algorithme d’apprentissage automatique comportant une phase d’initialisation (P1) au cours de laquelle, au moins une base de donnée d’images d’objets est créée, lesdites images étant au moins annotées de sorte à former une base de donnée d’images d’entraînement (B1), une phase d’entraînement (P2) au cours de laquelle l’algorithme s’entraîne à l’identification d’objets sur ladite base de donnée d’images d’entraînement (B1) et une phase de déploiement (P3) permettant d’associer un objet à sa classe (13) en capturant une image dudit objet à identifier (11) et en analysant ladite image (11), ledit procédé (1) étant caractérisé en ce qu’il comporte lors de la phase d’initialisation (P1), au moins l’étape de:
    - Création d’au moins une base de données de masses (B2) associant chaque classe à la masse moyenne des objets de cette classe,
    lors de la phase de déploiement (P3), au moins les étapes de:
    - Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée,
    - Utilisation d’une fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
    - Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
    -- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier (10) par un appareil d’acquisition de la masse (A2), et comparaison de ladite masse aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier (10) est la classe de l’objet (13),
    --si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier (13),
    --si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier (13) n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images d’entraînement (B1), soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement (P3),
    lesdites phases d’entraînement (P2) et de déploiement (P3) au moins, étant effectuées par un algorithme de classification multi-classes basé sur un apprentissage supervisé.
  2. Procédé d’identification d’objets (1) selon la revendication 1 caractérisé en ce qu’il comporte lors de la phase d’initialisation (P1),  au moins les étapes suivantes :
    a) Acquisition d’images d’au moins un objet, lesdites images étant annotées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images d’entraînement (B1),
    b) Création d’au moins une base de données de masses (B2) associant chaque classe à la masse moyenne des objets de cette classe (80),
    lors de la phase d’entraînement (P2), au moins l’étape suivante :
    c) Entraînement du réseau de neurones convolutifs sur ladite base de donnée d’images (B1) d’entraînement (90),
    lors de la phase de déploiement (P3), au moins les étapes suivantes :
    d) Entrée : Capture d’une image de l’objet à identifier (11) par un appareil de capture d’images (A1) et transmission de ladite image (11) au réseau de neurones convolutifs entraîné (100),
    e) Traitement de ladite image par le réseau de neurones convolutifs:
    -e1 : Extraction des caractéristiques par les couches de convolution et les couches de regroupement,
    - e2 : Classification de l’objet à identifier par la couche totalement connectée
    -e3 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée,
    -e4 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini,
    -e5 : Analyse des classes restantes et proposition d’un résultat en sortie de la manière suivante :
    -- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier (10) par un appareil d’acquisition de la masse (A2), et comparaison de ladite masse (10) aux masses moyennes des objets associés aux classes restantes, la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier est la classe de l’objet (13),
    --si le nombre de classes restantes est égal à 1: la classe restante est la classe de l’objet à identifier (13),
    -- si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier (13) n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images (B1), soit il a été mal positionné lors de la capture d’image et doit donc être repositionné avant de recommencer les étapes de la phase de déploiement (P3),
    lesdites phases d’entraînement (P2) et de déploiement (P3) au moins, étant effectuées par un réseau de neurones convolutifs.
  3. Procédé d’identification d’objets (1) selon la revendication précédente caractérisé en ce qu’au moins les phases d’entraînement (P2) et de déploiement (P3) sont effectuées par un réseau de neurones convolutif basé sur les régions et en ce que l’étape e commence par une sous étape e0 : Extraction des propositions de régions.
  4. Procédé d’identification d’objets (1) selon la revendication 2 caractérisé en ce que l’étape a devient l’étape a’ : Acquisition d’images d’au moins un objet, lesdites images étant annotées et segmentées de sorte à être associées à la classe dudit objet, et de sorte à former au moins une base de donnée d’images (B1) d’entraînement (70), en ce que l’étape e devient l’étape e’ : Analyse de ladite image par le réseau de neurones convolutifs basé sur des régions masquées :
    -e’1 : Génération de la carte des caractéristiques (110) par le réseau convolutionnel (21) et en parallèle, proposition de régions(111) par le réseau de proposition de région (22),
    -e’2 : Détection des régions d’intérêt (120),
    -e’3 : Alignement des régions d’intérêt (ROI) (130) par la couche d’alignement des ROI (23),
    -e’4 : Utilisation des Fonctions de Classification (140), de Régression (141) par la couche complétement connectée (24), et en parallèle, génération des masques pour chaque ROI (143) par la branche masque (25),
    -e’5 : Attribution d’une probabilité d’appartenance dudit objet à chaque classe par la fonction exponentielle normalisée (150) et amélioration des cadres de limitation (151),
    -e’6 : Utilisation d’un fonction de suppression des non maxima pour supprimer les classes dont les probabilités sont inférieures à un seuil X prédéfini (160),
    -e’6 : Analyse des classes restantes et proposition d’un résultat en sortie:
    -- si le nombre de classes restantes est strictement supérieur à 1: acquisition de la masse de l’objet à identifier (11) par un appareil (A2) d’acquisition de la masse (180), et comparaison de ladite masse (11) aux masses moyennes des objets associés aux classes restantes (181), la classe associée aux objets dont la masse moyenne est la plus proche de la masse de l’objet à identifier (11) est la classe (13) de l’objet (190),
    --si le nombre de classes restantes est égal à 1: la classe restante est la classe (13) de l’objet à identifier (190),
    --si le nombre de classes restantes est égal à 0 : la classe de l’objet à identifier (13) n’a pas été retrouvée, soit ledit objet ne fait pas parti de la base de donnée d’images (B1), soit il a été mal positionné lors de la capture d’image (100) et doit donc être repositionné (170) avant de recommencer les étapes de la phase de déploiement (P3),
    les phases d’entraînement (P2) et de déploiement (P3) au moins, étant effectuées par un réseau de neurones convolutifs avec masquage de régions (20).
  5. Procédé d’identification d’objets (1) selon la revendication précédente caractérisé en ce qu’au moins les phases d’entraînement (P2) et de déploiement (P3) sont effectuées par le réseau de neurones convolutifs avec masquage de régions (20) pré-entraîné à la classification sur une base de données d’images de pré-entraînement (B3), ladite phase d’entraînement (P2) sur la base de données d’images d’entraînement (B1) adaptant ledit réseau de neurones convolutifs (20) à l’identification des nouveaux objets.
  6. Système d’identification d’objets (2) caractérisé en ce qu’il comporte au moins :
    -un dispositif (A1) permettant l’acquisition d’images de l’objet à identifier (11),
    -un dispositif (A2) permettant l’acquisition de la masse de l’objet à identifier (10),
    - un dispositif informatique (A3) en communication avec au moins lesdits dispositifs d’acquisition d’images (A1) et de masses (A2), ledit dispositif informatique (A3) étant conçu pour mettre en œuvre au moins le procédé (1) selon les revendications 1 à 5 de classification dudit objet.
  7. Système d’identification d’objets (2) selon la revendication 6, caractérisé en ce que le dispositif d’acquisition d’images (A1) permet l’acquisition d’images (11) de haute résolution.
  8. Système d’identification d’objets (2) selon les revendications 6 et 7, caractérisé en ce que le dispositif d’acquisition de la masse (A2) a une précision au centième.
  9. Dispositif informatique (A3) d’identification d’objets, conçu pour mettre en œuvre au moins le procédé (1) selon les revendications 1 à 5 de classification dudit objet, caractérisé en ce qu’il comporte au moins :
    -un processeur (30),
    -une mémoire (31) de stockage accessible au moins audit processeur (30) et stockant un programme informatique pour exécuter le procédé (1) selon les revendications 1 à 5.
FR1911022A 2019-10-04 2019-10-04 Procédé et système multimodal d’identification d’objets Active FR3101715B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1911022A FR3101715B1 (fr) 2019-10-04 2019-10-04 Procédé et système multimodal d’identification d’objets

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1911022 2019-10-04
FR1911022A FR3101715B1 (fr) 2019-10-04 2019-10-04 Procédé et système multimodal d’identification d’objets

Publications (2)

Publication Number Publication Date
FR3101715A1 true FR3101715A1 (fr) 2021-04-09
FR3101715B1 FR3101715B1 (fr) 2022-08-12

Family

ID=69743310

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1911022A Active FR3101715B1 (fr) 2019-10-04 2019-10-04 Procédé et système multimodal d’identification d’objets

Country Status (1)

Country Link
FR (1) FR3101715B1 (fr)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284669A (zh) * 2018-08-01 2019-01-29 辽宁工业大学 基于Mask RCNN的行人检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284669A (zh) * 2018-08-01 2019-01-29 辽宁工业大学 基于Mask RCNN的行人检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HE KAIMING ET AL: "Mask R-CNN", 2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV), IEEE, 22 October 2017 (2017-10-22), pages 2980 - 2988, XP033283165, DOI: 10.1109/ICCV.2017.322 *
USHA MITTAL ET AL: "Review of different techniques for object detection using deep learning", ADVANCED INFORMATICS FOR COMPUTING RESEARCH, ACM, 2 PENN PLAZA, SUITE 701NEW YORKNY10121-0701USA, 15 June 2019 (2019-06-15), pages 1 - 8, XP058440000, ISBN: 978-1-4503-6652-6, DOI: 10.1145/3339311.3339357 *

Also Published As

Publication number Publication date
FR3101715B1 (fr) 2022-08-12

Similar Documents

Publication Publication Date Title
CN112837282A (zh) 一种基于云边协同和深度学习的小样本图像缺陷检测方法
TW201942814A (zh) 物件分類方法、裝置、伺服器及儲存媒體
EP1792278B1 (fr) Procede de detection et de pistage de cibles ponctuelles, dans un systeme de surveillance optronique
WO2018138423A1 (fr) Detection automatique de fraudes dans un flux de transactions de paiement par reseaux de neurones integrant des informations contextuelles
FR3107376A1 (fr) Procédé d’authentification ou d’identification d’un individu
EP0449353A1 (fr) Dispositif de traitement de données et procédé pour sélectionner des mots de données contenus dans un dictionnaire
FR3101715A1 (fr) Procédé et système multimodal d’identification d’objets
FR3094104A1 (fr) Procédé et dispositif de détermination de la taille mémoire globale d’une zone mémoire globale allouée aux données d’un réseau de neurones compte tenu de sa topologie
Göring et al. Rule of thirds and simplicity for image aesthetics using deep neural networks
EP3385899A1 (fr) Procédé de détection en temps réel d'une scène par un appareil et appareil correspondant
WO2019129985A1 (fr) Procede de formation d'un reseau de neurones pour la reconnaissance d'une sequence de caracteres et procede de reconnaissance associe
EP3933626B1 (fr) Evaluation du biais d'une fonction d'identification biométrique
CN115587297A (zh) 构建图像识别模型和图像识别的方法、装置、设备及介质
FR3123748A1 (fr) Apprentissage automatique sans annotation ameliore par regroupements adaptatifs en ensemble ouvert de classes
EP3966739A1 (fr) Procédé d'analyse automatique d'images pour reconnaître automatiquement au moins une caractéristique rare
WO2020212619A1 (fr) Procédé de traitement d'image d'un document d'identité.
EP2939179B1 (fr) Procédé de segmentation d'une image d'un oeil et dispositif associé
EP4071672A1 (fr) Classification de pannes inconnues dans un système de communications électroniques
FR3119038A1 (fr) Contrôle visuel d’un élément se déplaçant sur une ligne de production
EP3815001A1 (fr) Procede de modelisation pour le controle des resultats fournis par un reseau de neurones artificiels et autres procedes associes
WO2008149047A2 (fr) Dispositif et methode de traitement d'images pour determiner une signature d'un film
WO2020136264A1 (fr) Procédé de génération d'un exemple adversaire pour un modèle d'apprentissage automatique, procédé de robustification, dispositif de génération et programme produit ordinateur associés
FR3130061A1 (fr) Procédé de localisation et cartographie simultanées intégrant un masquage temporel auto-supervisé et modèle d’apprentissage automatique pour générer un tel masquage.
FR3128045A1 (fr) Procédé de gestion d'une structure multitâche d'un ensemble de réseaux neuronaux convolutifs
CN115294364A (zh) 分类图像清洗方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

EXTE Extension to a french territory

Extension state: PF

PLSC Publication of the preliminary search report

Effective date: 20210409

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5