WO2023016859A1

WO2023016859A1 - Entraînement de réseaux neuronaux pour une équivariance ou une invariance par rapport à des changements dans l'image d'entrée

Info

Publication number: WO2023016859A1
Application number: PCT/EP2022/071667
Authority: WO
Inventors: Ivan Sosnovik; Sadaf Gulshad; Arnold Smeulders; Jan Hendrik Metzen
Original assignee: Robert Bosch Gmbh
Priority date: 2021-08-12
Filing date: 2022-08-02
Publication date: 2023-02-16
Also published as: DE102021208877A1

Abstract

L'invention concerne un procédé (100) pour l'entraînement d'un réseau neuronal (1) qui est conçu pour traiter des images d'entrée (2) et comprend de multiples couches de convolution, chaque couche de convolution étant conçue pour mapper l'entrée f de la couche de convolution respective sur au moins une carte de caractéristiques K) à l'aide d'au moins un cœur de filtre K. Le procédé comprend les étapes consistant à : • fournir (110) une quantité T de transformations T, par rapport à laquelle le réseau neuronal (1) doit être capable d'apprendre comment générer au moins une carte de caractéristiques équivariante ou invariante K) lorsque lesdites transformations sont appliquées à l'entrée f d'au moins une couche de convolution ; • exprimer (120) la carte de caractéristiques K) par une agrégation (5) de cartes de caractéristiques O7(f, T7 [K]) paramétrées par des paramètres (5a), chaque carte de caractéristiques étant obtenue par application de transformations 7) e T au(x) cœur(s) de filtre K ; • fournir (130) des images d'apprentissage (2a) et des sorties d'apprentissage (3a) sur lesquelles le réseau neuronal entraîné (1) doit idéalement mapper les images d'apprentissage (2a) ; • mapper (140) les images d'apprentissage (2a) sur des sorties (3) par le réseau neuronal (1) ; • évaluer (150) des écarts des sorties (3) à partir des sorties d'apprentissage (3a) à l'aide d'une fonction de coût spécifiée (4) ; et • optimiser (160) des paramètres (5a) de l'agrégation paramétrée (5) ainsi que des paramètres supplémentaires (la) qui caractérisent le comportement du réseau neuronal (1), en ayant pour but une amélioration attendue du processus d'évaluation (4a) à l'aide de la fonction de coût (4) lors du traitement ultérieur d'autres images d'apprentissage (2a).