EP4165605A1

EP4165605A1 - Procédé de génération d'images d'une caméra intérieure de véhicule

Info

Publication number: EP4165605A1
Application number: EP21730593.7A
Authority: EP
Inventors: Martin PETROV; Sonia Yousfi; Paul MENDEZ; Holmer-Geert Grundmann
Original assignee: Continental Automotive Technologies GmbH
Current assignee: Continental Automotive Technologies GmbH
Priority date: 2020-06-16
Filing date: 2021-06-07
Publication date: 2023-04-19
Also published as: FR3111460A1; WO2021254805A1; CN115769267A; FR3111460B1; US20230230359A1

Abstract

L'invention propose un procédé de génération d'images de synthèse, chaque image simulant une image d'un individu acquise par une caméra intérieure de véhicule, comprenant : - la génération d'une pluralité de modèles d'individus, chaque modèle comprenant une représentation en trois dimensions d'une tête d'un individu, - la réception d'un ensemble de paramètres variables et d'une distribution de probabilités associée à chaque paramètre, les paramètres étant relatifs à au moins l'un de l'environnement du modèle d'individu, la pose ou la position du modèle d'individu relativement à son environnement, - la génération d'un ensemble de configurations, chaque configuration correspondant à une combinaison de valeurs ou d'états pris par chaque paramètre, de telle sorte que l'ensemble des configurations soit représentatif de la distribution de probabilité de chaque paramètre, - la génération, pour chaque modèle d'individu, d'un ensemble d'images simulant des images du modèle d'individu acquise par une caméra intérieure de véhicule, où chaque image correspond à une configuration générée pour un paramètre variable, et où chaque image comprend en outre les positions en trois dimensions d'un ensemble de points caractéristiques de la tête de l'individu, et - l'enregistrement de toutes les images dans une mémoire.

Description

Titre : Procédé de génération d’images d’une caméra intérieure de véhicule

Domaine technique [0001] La présente demande concerne un procédé de génération d’images de synthèse, simulant des images d’individus acquises par une caméra intérieure de véhicule. La demande trouve une application avantageuse dans l’apprentissage ou la validation d’algorithmes de traitement d’images acquises par une caméra intérieure de véhicule. Technique antérieure

[0002] Les algorithmes d’apprentissage automatique nécessitent, pour être fiables, des quantités importantes de données d’entrainement. C’est notamment le cas pour des algorithmes basés sur le traitement d’images acquises par une caméra intérieure de véhicule, et orientée vers un conducteur ou un passager du véhicule, et qui peuvent avoir des applications diverses telles que détection des points caractéristiques du visage, détection de somnolence ou de distraction, etc.

[0003] Il peut être difficile d’obtenir des données d’entrainement, c’est-à-dire des images acquises par une caméra intérieure de véhicule, qui couvre suffisamment grande diversité des conditions d’acquisition possible, car cela implique de faire circuler différents modèles de véhicules, dans différentes conditions, avec différents passagers ou conducteurs, etc. De plus, pour entraîner ou valider de tels algorithmes, il convient aussi que la base de données d’apprentissage comprennent des cas extrêmes, quel que soit le paramètre considéré (position de l’utilisateur, luminosité, niveau de flou, etc.), qui peuvent être difficiles à obtenir. [0004] De plus, la constitution d’une base de données d’entrainement peut être extrêmement chronophage car chaque image acquise par une caméra intérieure de véhicule doit ensuite être manuellement annotée pour identifier des points caractéristiques de l’image. En considérant un temps d’annotation manuel de l’ordre de 2 à 4 minutes par image, on mesure facilement le coût et le temps nécessaires à l’annotation d’une base de données d’images pouvant comprendre des dizaines, voire des centaines de milliers d’images.

Résumé

[0005] L’invention a pour but d’améliorer la situation. En particulier, un but de l’invention est de permettre la constitution d’une base de données d’images acquises par une caméra intérieure de véhicule plus simple et moins coûteuse.

[0006] Un autre but de l’invention est d’obtenir une base de données d’image incluant également des cas extrêmes pour les paramètres variables.

[0007] A cet égard, l’invention propose un procédé de génération d’images de synthèse, chaque image simulant une image d’un individu acquise par une caméra intérieure de véhicule, le procédé étant mis en oeuvre par un calculateur et comprenant :

- la génération d’une pluralité de modèles d’individus, chaque modèle comprenant une représentation en trois dimensions d’une tête d’un individu,

- la réception d’un ensemble de paramètres variables et d’une distribution de probabilités associée à chaque paramètre, les paramètres étant relatifs à au moins l’un de l’environnement du modèle d’individu, la pose ou la position du modèle d’individu relativement à son environnement,

- la génération d’un ensemble de configurations, chaque configuration correspondant à une combinaison de valeurs ou d’états pris par chaque paramètre, de telle sorte que l’ensemble des configurations soit représentatif de la distribution de probabilité de chaque paramètre,

- la génération, pour chaque modèle d’individu, d’un ensemble d’images simulant des images du modèle d’individu acquise par une caméra intérieure de véhicule, où chaque image correspond à une configuration générée pour un paramètre variable, et où chaque image comprend en outre les positions en trois dimensions d’un ensemble de points caractéristiques de la tête de l’individu, et

- l’enregistrement de toutes les images dans une mémoire. [0008] Dans un mode de réalisation, le procédé comprend en outre la génération de plusieurs modèles de véhicules, et la génération des images est mise en oeuvre pour chaque modèle d’individu dans chaque modèle de véhicule.

[0009] Dans un mode de réalisation, le procédé comprend la génération, pour chaque modèle d’individu, d’un ensemble d’images comprenant une image pour chacune des configurations générées pour chacun des paramètres variables reçus.

[0010] Dans un mode de réalisation, le procédé comprend en outre la réception d’un nombre N de configurations par modèle d’individu, et la génération, pour chaque modèle d’individu, d’un ensemble de configurations comprenant un total de N configurations pour l’ensemble des paramètres variables.

[0011] Dans un mode de réalisation, le procédé comprend la réception d’au moins un paramètre variable concernant la caméra parmi le groupe consistant en :

- position et/ou orientation de la caméra,

- niveau de contraste,

- niveau de flou,

- exposition de la caméra,

- niveau de bruit.

[0012] Dans un mode de réalisation, le procédé comprend la réception d’au moins un paramètre variable concernant une position de l’individu par rapport à un siège du véhicule et/ou d’au moins un paramètre variable concernant l’environnement du modèle d’individu, incluant :

- intensité lumineuse et/ou direction de la lumière,

- environnement à l’extérieur du véhicule.

[0013] Dans un mode de réalisation, le procédé comprend en outre :

- la réception, pour chaque modèle d’individu, d’au moins un mouvement effectué par le modèle d’individu,

- la génération, pour au moins une configuration des paramètres variables, d’une vidéo représentant le modèle d’individu effectuant le mouvement, et

- l’enregistrement dans la mémoire de ladite vidéo et de chaque image composant ladite vidéo. [0014] L’invention a également pour objet un procédé d’apprentissage ou de validation d’un algorithme basé sur un traitement d’une image acquise par une caméra intérieure de véhicule, comprenant :

- la détermination, d’un ensemble de paramètres variables et d’une distribution de probabilités associée à chaque paramètre variable,

- la création d’une base de données d’images où chaque image de synthèse où chaque image simule une image d’un individu acquise par une caméra intérieure de véhicule et comprend en outre des positions de trois dimensions de points caractéristiques du visage de l’individu, par la mise en oeuvre du procédé selon l’une des revendications précédentes, et

- l’apprentissage ou la validation de l’algorithme sur la base de données d’images ainsi créée.

[0015] L’invention a également pour objet l’utilisation d’une base de données d’images générées par la mise en oeuvre du procédé selon la description qui précède pour l’apprentissage ou la validation d’un algorithme basé sur un traitement d’une image acquise par une caméra intérieure de véhicule.

[0016] L’invention porte également sur un produit programme d’ordinateur, comprenant des instructions de code pour la mise en oeuvre des procédés selon la description qui précède, lorsqu’il est exécuté par un calculateur.

[0017] L’invention porte enfin sur un dispositif de génération d’images de synthèse simulant des images d’individus acquises par une caméra intérieure de véhicule, comprenant un calculateur et une mémoire, dans lequel le calculateur est configuré pour la mise en oeuvre des procédés selon la description qui précède.

[0018] L’invention proposée permet de générer artificiellement une base de données d’images où chaque image simule une image prise par une caméra intérieure de véhicule. Les images de la base de données d’images représentent plusieurs modèles d’individus, dans des contextes variables obtenus en faisant varier différents paramètres selon des probabilités de distribution. Ceci permet que la base de données d’images soit représentative de toutes les configurations et de leurs probabilités d’occurrence. [0019] En outre, les images générées comprennent déjà, grâce aux modèles d’individus qui sont des modèles en trois dimensions de visages, des positions en trois dimensions de points caractéristiques de la tête de l’individu représenté. Il n’est donc pas nécessaire de procéder à une annotation manuelle de chaque image, ce qui représente un gain de temps important.

Brève description des dessins

[0020] D’autres caractéristiques, détails et avantages apparaîtront à la lecture de la description détaillée ci-après, et à l’analyse des dessins annexés, sur lesquels :

[Fig. 1] représente schématiquement un exemple de mise en oeuvre d’un procédé de génération d’images de synthèse.

[Fig. 2] représente un exemple d’image de synthèse générée par la mise en oeuvre du procédé.

Description des modes de réalisation

[0021] En référence à la figure 1 , le procédé de génération d’images de synthèse est mis en oeuvre par un calculateur 1 pouvant être par exemple un processeur, un microprocesseur, un contrôleur, un microcontrôleur, etc.

[0022] Ce procédé permet de générer rapidement une grande quantité d’images de synthèse, ou chaque image de synthèse représente la tête d’un individu dans un véhicule, et simule une image qui aurait été prise de l’individu par une caméra intérieure de véhicule. Comme décrit plus en détails ci-après, les images sont générées en faisant varier de nombreux paramètres, afin d’enrichir la base de données d’images ainsi obtenue.

[0023] Le procédé comprend une génération 100 d’une pluralité de modèles d’individus, également appelés avatars. Chaque modèle d’individu comprend une représentation en trois dimensions de la tête d’un individu. Plus précisément, chaque modèle d’individu peut comprendre un nuage de points en trois dimensions, correspondants aux contours de la tête et du visage, et une texture appliquée sur le nuage de points, simulant l’apparence de la tête de l’individu, c’est-à-dire une image dont les points sont associés à une couleur ou un niveau d’intensité permettant, une fois plaquée sur les contours de la tête, de donner à la tête une apparence humaine.

[0024] Dans un mode de réalisation, au moins dix, et de préférence plusieurs dizaines de modèles d’individus différents sont générés.

[0025] De plus, les modèles d’individus sont générés en faisant varier un ensemble de paramètres comprenant tout ou partie des paramètres suivants :

- genre,

- ethnicité,

- présence d’accessoires sur la tête (bijoux, lunettes, etc.),

- caractéristiques du visage (taille du visage et de ses composants, présence ou non d’une barbe, oreilles plus ou moins décollées, etc.),

- caractéristiques capillaires,

- âge.

[0026] La génération de modèles d’individus peut être mise en oeuvre par exécution d’algorithmes connus ou accessibles de l’Homme du métier. Par exemple, on pourra se référer au document US20170069124, qui enseigne également l’animation des modèles d’individus créés, ou encore au logiciel StyleGAN développé par NVidia.

[0027] Dans un mode de réalisation, le procédé comprend également la génération 110 de plusieurs modèles de véhicule, chaque modèle de véhicule comprenant une représentation en trois dimensions de l’intérieur d’un habitacle d’un véhicule. Ceci permet de générer des images des modèles d’individus dans les différents modèles de véhicule.

[0028] Le procédé comprend ensuite la réception 200 d’un ensemble de paramètres variables et d’une distribution de probabilité associée à chaque paramètre. Les paramètres peuvent être sélectionnés par un utilisateur. Il est entendu par « paramètre variable » que chaque paramètre peut prendre une pluralité de valeurs ou d’états. Un paramètre variable peut correspondre à une grandeur continue ou discrète.

[0029] De préférence, les paramètres reçus sont relatifs à au moins l’un de l’environnement du modèle d’individu, la pose de l’individu, c’est-à-dire l’orientation de la tête de l’individu, ou la position de l’individu relativement à son environnement, c’est-à-dire au véhicule dans lequel il se trouve, et plus particulièrement la position de la tête de l’individu par rapport au siège du véhicule sur lequel il se trouve.

[0030] En particulier, les paramètres concernant l’environnement du modèle d’individu peuvent comprendre des paramètres concernant la caméra intérieure du véhicule, dont notamment :

- la position et/ou l’orientation de la caméra,

- son niveau de contraste,

- le niveau de flou, pouvant inclure un niveau de flou associé à chaque plan de la caméra (premier plan où l’individu se trouve et arrière-plan),

- exposition de la caméra,

- niveau de bruit.

[0031] Les paramètres concernant l’environnement du modèle d’individu peuvent également comprendre l’environnement extérieur du véhicule, qui est visible au travers des vitres du véhicule pouvant apparaître sur une image acquise par une caméra intérieure, selon sa position et son orientation.

[0032] Les paramètres concernant l’environnement du modèle d’individu peuvent également comprendre l’intensité lumineuse et/ou la direction de la lumière éclairant la scène acquise par la caméra intérieure. Ces paramètres sont notamment variables en fonction de l’heure de la journée ou de la nuit, et des conditions météorologiques considérées.

[0033] La distribution de probabilité associée à chaque paramètre peut également être sélectionnée ou configurée par l’utilisateur. Les distributions de probabilités peuvent par exemple être gaussiennes ou uniformes en fonction des paramètres considérés.

[0034] Dans un mode de réalisation, le procédé peut également comprendre la réception 210 d’un mouvement ou d’une suite de mouvements que chaque modèle d’individu doit réaliser, qui peut être indiqué par l’utilisateur. Cette étape peut également être mise en oeuvre lors de l’étape 100 de génération de modèle d’avatar, si c’est l’algorithme de génération d’avatar qui présente cette fonctionnalité. Le mouvement ou la suite de mouvements à réaliser pour un individu peut être défini par une position initiale (par exemple orientation de la tête de l’individu selon trois angles), une position finale, une vitesse de mouvement entre la position initiale et la position finale. L’étape 210 peut également comprendre la réception du nombre de réalisations du mouvement dans une vidéo.

[0035] Le procédé comprend ensuite la génération 300 d’un ensemble de configurations, chaque configuration correspondant à une combinaison de valeurs ou d’états pris par chacun des paramètres variables reçus.

[0036] A titre d’exemple purement schématique, si les paramètres comprennent un niveau de luminosité, un type d’environnement du véhicule, et une position de l’individu par rapport au siège, une première configuration peut comprendre :

- un niveau de luminosité élevé,

- un environnement extérieur urbain,

- une position basse de l’individu par rapport au siège.

[0037] Une deuxième configuration peut comprendre :

- un niveau de luminosité élevé,

- un environnement extérieur rural,

- une position haute de l’individu par rapport au siège.

[0038] De plus, les configurations sont générées en faisant varier chaque paramètre selon sa distribution de probabilité associée, de sorte que l’ensemble des configurations soit représentatif de la distribution de probabilité de chaque paramètre.

[0039] L’ensemble de configurations obtenu peut par exemple prendre la forme d’un fichier de configurations, où chaque configuration est définie par la valeur ou l’état pris par chaque paramètre.

[0040] Dans un mode de réalisation, le procédé comprend la réception 220 d’un nombre N de configurations à générer, et la génération des configurations comprend donc la génération d’un total de N configurations, pour l’ensemble des paramètres variables reçus. Le nombre N peut être défini par l’utilisateur en fonction de la quantité d’images qu’il cherche à produire à l’issue du procédé, qui dépend également du nombre de modèles d’individus et du nombre de modèles de véhicule. [0041] Le procédé comprend ensuite la génération 400, pour chaque modèle d’individu, d’un ensemble d’images simulant des images du modèle d’individu acquise par une caméra intérieur du véhicule, où chaque image correspond à l’une des configurations générées. Dans un mode de réalisation, le procédé comprend la génération, pour chaque modèle d’individu, et pour chaque modèle de véhicule, d’un ensemble d’images comprenant une image pour chacune des configurations générées. On obtient donc un nombre total d’images égal au nombre N de configurations, multiplié par le nombre de modèles d’individus, ou multiplié par le nombre de modèles d’individus et le nombre de modèles de véhicule.

[0042] De plus, puisque chaque modèle d’individu comprend un ensemble de points en trois dimensions correspondant aux points caractéristiques de la tête et du visage, les positions de ces points sont connues, ce qui permet que chaque image générée comprenne également les positions desdits points caractéristiques de la tête de l’individu sur l’image. Un exemple d’une image où les positions des points caractéristiques du visage de l’individu sont mises en évidence est montré en figure 2. De cette façon, il n’est pas nécessaire de procéder à une annotation manuelle des images pour une utilisation ultérieure.

[0043] Dans le cas où un utilisateur a indiqué une suite de mouvements que chaque modèle d’individu doit réaliser, le procédé peut comprendre, pour au moins une configuration, ou pour plusieurs, voire toutes les configurations, la génération 410 d’une vidéo représentant la suite de mouvements effectué par le modèle d’individu, et la génération de l’ensemble des images qui la composent.

[0044] Enfin, le procédé comprend l’enregistrement 500, dans la mémoire 2, de l’ensemble des images (et les positions des points caractéristiques associées) et des vidéos, de manière à former une base de données riche comprenant plusieurs modèles d’individus, dans plusieurs modèles de véhicules, et avec des paramètres très variés, incluant notamment des valeurs extrêmes de paramètres.

[0045] Une fois cette base de données constituée, elle peut ensuite être utilisée directement pour l’apprentissage, ou la validation, d’un algorithme basé sur un traitement d’une image acquise par une caméra intérieure de véhicule, notamment un algorithme d’apprentissage automatique. [0046] Dans un mode de réalisation, en fonction de l’utilisation que l’on souhaite faire d’une base de données, par exemple, mais non limitativement, la validation d’un algorithme dans certaines conditions particulières, l’utilisateur peut déterminer les paramètres variables utiles à fournir pour la mise en oeuvre du procédé.

Claims

Revendications

[Revendication 1] Procédé de génération d’images de synthèse, chaque image simulant une image d’un individu acquise par une caméra intérieure de véhicule, le procédé étant mis en œuvre par un calculateur (1 ) et comprenant :

- la génération (100) d’une pluralité de modèles d’individus, chaque modèle comprenant une représentation en trois dimensions d’une tête d’un individu,

- la réception (200) d’un ensemble de paramètres variables et d’une distribution de probabilités associée à chaque paramètre, les paramètres étant relatifs à au moins l’un de l’environnement du modèle d’individu, la pose ou la position du modèle d’individu relativement à son environnement,

- la génération (300) d’un ensemble de configurations, chaque configuration correspondant à une combinaison de valeurs ou d’états pris par chaque paramètre, de telle sorte que l’ensemble des configurations soit représentatif de la distribution de probabilité de chaque paramètre,

- la génération (400), pour chaque modèle d’individu, d’un ensemble d’images simulant des images du modèle d’individu acquise par une caméra intérieure de véhicule, où chaque image correspond à une configuration générée pour un paramètre variable, et où chaque image comprend en outre les positions en trois dimensions d’un ensemble de points caractéristiques de la tête de l’individu, et

- l’enregistrement (500) de toutes les images dans une mémoire (2).

[Revendication 2] Procédé selon la revendication 1 , comprenant en outre la génération (110) de plusieurs modèles de véhicules, et la génération des images est mise en œuvre pour chaque modèle d’individu dans chaque modèle de véhicule.

[Revendication 3] Procédé selon l’une quelconque des revendications 1 ou 2, comprenant la génération (400), pour chaque modèle d’individu, d’un ensemble d’images comprenant une image pour chacune des configurations générées pour chacun des paramètres variables reçus.

[Revendication 4] Procédé selon l’une quelconque des revendications 1 à 3, comprenant en outre la réception (220) d’un nombre N de configurations par modèle d’individu, et la génération (300), pour chaque modèle d’individu, d’un ensemble de configurations comprenant un total de N configurations pour l’ensemble des paramètres variables.

[Revendication 5] Procédé selon l’une quelconque des revendications 1 à 3, comprenant la réception d’au moins un paramètre variable concernant la caméra parmi le groupe consistant en :

- position et/ou orientation de la caméra,

- niveau de contraste,

- niveau de flou,

- exposition de la caméra,

- niveau de bruit.

[Revendication 6] Procédé selon l’une quelconque des revendications 1 à 5, comprenant la réception d’au moins un paramètre variable concernant une position de l’individu par rapport à un siège du véhicule et/ou d’au moins un paramètre variable concernant l’environnement du modèle d’individu, incluant :

- intensité lumineuse et/ou direction de la lumière,

- environnement à l’extérieur du véhicule.

[Revendication 7] Procédé selon l’une quelconque des revendications précédentes, comprenant en outre :

- la réception (210), pour chaque modèle d’individu, d’au moins un mouvement effectué par le modèle d’individu,

- la génération (410), pour au moins une configuration des paramètres variables, d’une vidéo représentant le modèle d’individu effectuant le mouvement, et

- l’enregistrement (500) dans la mémoire (2) de ladite vidéo et de chaque image composant ladite vidéo.

[Revendication 8] Procédé d’apprentissage ou de validation d’un algorithme basé sur un traitement d’une image acquise par une caméra intérieure de véhicule, comprenant :

- la création d’une base de données d’images où chaque image de synthèse où chaque image simule une image d’un individu acquise par une caméra intérieure de véhicule et comprend en outre des positions de trois dimensions de points caractéristiques du visage de l’individu, par la mise en œuvre du procédé selon l’une des revendications précédentes, et

[Revendication 9] Utilisation d’une base de données d’images générées par la mise en œuvre du procédé selon l’une quelconque des revendications 1 à 7 pour l’apprentissage ou la validation d’un algorithme basé sur un traitement d’une image acquise par une caméra intérieure de véhicule.

[Revendication 10] Produit programme d’ordinateur, comprenant des instructions de code pour la mise en œuvre du procédé selon l’une quelconque des revendications précédentes, lorsqu’il est exécuté par un calculateur (1).

[Revendication 11] Dispositif de génération d’images de synthèse simulant des images d’individus acquises par une caméra intérieure de véhicule, comprenant un calculateur (1 ) et une mémoire (2), dans lequel le calculateur (1 ) est configuré pour la mise en œuvre du procédé selon l’une quelconque des revendications 1 à 7.