FR3117079A1

FR3117079A1 - Procédé et dispositif de prédiction de changement de voie de circulation d’un véhicule circulant sur une route

Info

Publication number: FR3117079A1
Application number: FR2012779A
Authority: FR
Inventors: Stephane Tam; Thomas Hannagan
Original assignee: PSA Automobiles SA
Current assignee: PSA Automobiles SA
Priority date: 2020-12-07
Filing date: 2020-12-07
Publication date: 2022-06-10

Abstract

L’invention concerne un procédé d’intelligence artificielle pour l’aide à la conduite d’un véhicule éventuellement autonome. Le procédé permet la prédiction de changements de voie de circulation de véhicules environnants circulant sur une route comprenant au moins deux voies de circulation dans un même sens de circulation. Pour ce faire, le procédé utilise un réseau de neurones récurrents. L’invention porte également sur un dispositif mettant en œuvre le procédé, sur un produit programme d’ordinateur comportant des instructions adaptées pour l’exécution des étapes du procédé et sur un support d’enregistrement lisible par un ordinateur sur lequel est enregistré un programme d’ordinateur comprenant des instructions pour l’exécution des étapes du procédé. Figure pour l’abrégé : Figure 6

Description

Procédé et dispositif de prédiction de changement de voie de circulation d’un véhicule circulant sur une route

L’invention concerne un procédé et dispositif d’aide à la conduite d’un véhicule. Plus particulièrement, elle concerne un dispositif qui permet de prédire un changement de voie de circulation d’un véhicule environnant.

Arrière-plan technologique

Le développement des technologies dans le domaine automobile permet aujourd’hui de concevoir des systèmes d’aide à la conduite de véhicules, éventuellement autonomes, qui tiennent compte de l’environnement routier dans lequel circulent ces véhicules.

Lorsqu’un véhicule circule sur une route composée de plusieurs voies de circulation dans le même sens de circulation, la sécurisation de ces systèmes d’aide à la conduite passe par une connaissance de l’environnement routier. En particulier, il est primordial que ces systèmes d’aide à la conduite anticipent des changements de voies de circulation des véhicules environnants pour prévenir d’éventuels embouteillages ou accidents. Le changement de voie de circulation demande une capacité de jugement élevée à un conducteur qui doit estimer très rapidement le comportement des autres véhicules environnants et être capable de réajuster son jugement à tout instant avant de changer réellement de voie de circulation. Cette estimation doit être rapide, fiable et évolutive selon l’évolution des conditions de circulation et du comportement des véhicules environnants.

Cette analyse n’est pas facile à automatiser car chaque véhicule circulant sur une voie de circulation peut changer de voie de circulation à tout moment, accélérer, ralentir ou maintenir sa vitesse et sa direction de circulation. De plus, une analyse erronée du comportement d’un véhicule environnant peut engendrer des réactions en chaîne des véhicules environnants et provoquer des accidents ou des embouteillages.

Ces dernières années, de nombreuses recherches ont été menées pour analyser le comportement de véhicules circulant sur une voie de circulation de manière qu’un véhicule autonome puisse évaluer s’il peut changer de voie de circulation sans procurer une quelconque gêne pour les véhicules environnants, ou encore s’il doit changer de voie de circulation pour faciliter le trafic routier.

Cette analyse du comportement des véhicules circulant sur une voie de circulation peut aussi être utilisée dans des systèmes d’aide à la conduite pour proposer à un conducteur, par exemple, de changer de voie de circulation pour faciliter le trafic ou encore pour augmenter sa sécurité.

Un axe de recherche qui connaît une forte croissance depuis ces derniers temps est l’introduction de l’intelligence artificielle sous forme de réseaux de neurones, et plus généralement, de systèmes entrainés par apprentissage automatique.

Il est connu d’utiliser des réseaux de neurones récurrents pour prédire une trajectoire, ou une intention de manœuvre d’un véhicule (CN111079590, CN110758382, CN108520155).

Il est également connu d’utiliser des réseaux de neurones dans des logiciels de conduite autonome pour prédire des courbures de la voie de circulation d’un véhicule. (https://cleantechnica.com/2019/09/07/teslas-path-prediction-improves-autopilot/, https://www.youtube.com/watch?v=Y499farGnAI).

Prédire dans un futur proche (1 à 2 secondes) la voie de circulation sur laquelle se trouvera un véhicule environnant est un problème à résoudre pour qu’un véhicule puisse changer de voie de circulation en toute sécurité.

Un objet de la présente invention est de fournir un module indépendant de prédiction de changement de voie de circulation de véhicules environnants circulant sur une route comprenant au moins deux voies de circulation dans un même sens de circulation.

Un autre objet de la présente invention est d’améliorer les systèmes d’aide à la conduite existants.

Un autre objet de la présente invention est d’améliorer la sécurité routière de véhicule autonome circulant sur des voies rapides.

Un autre objet de la présente invention est d’augmenter la sécurité routière.

Selon un premier aspect, l’invention concerne un procédé de prédiction de changement de voie de circulation d’un véhicule cible choisi parmi des véhicules environnants circulant sur une route comprenant au moins deux voies de circulation dans un même sens de circulation, ledit procédé étant mis en œuvre dans un dispositif mettant en œuvre un réseau de neurones. Le procédé comporté des étapes suivantes :

Apprentissage du réseau de neurones récurrents comportant un premier module appelé encodeur et un second module appelé décodeur, l’encodeur et le décodeur comportant chacun au moins une cellule à mémoire court terme et long terme, une entrée de l’encodeur correspondant à une entrée du réseau de neurones, une sortie du décodeur correspondant à une sortie du réseau de neurones récurrents ;
- l’entrée de l’encodeur étant alimentée par une première séquence temporelle de valeurs discrètes représentatives de données de circulation relatives à des véhicules environnants et obtenues pour une durée s’étalant d’un instant temporel t0-T à un autre instant temporel t0 avec T une période de temps ;
- une entrée du décodeur étant alimentée par des états internes de l’encodeur et par une deuxième séquence temporelle de valeurs discrètes identifiant temporellement une voie de circulation sur laquelle il a été constaté sur le terrain qu’un véhicule cible circulait pendant une durée s’étalant de l’instant temporel t0 à un instant temporel t0+T dans un environnement routier similaire à celui décrit par la première séquence temporelle ;
Obtention d’une troisième séquence temporelle de valeurs discrètes représentatives de données de circulation réelles relatives à des véhicules environnants et obtenues par au moins un capteur pour une durée s’étalant d’un instant temporel t1-T à un autre instant temporel t1 avec T une période de temps ;
Alimenter l’entrée de l’encodeur par ladite troisième séquence, l’entrée du décodeur étant alimentée par les états internes de l’encodeur et par une séquence temporelle obtenue antérieurement à partir de la sortie du décodeur ;
Obtention d’une quatrième séquence temporelle obtenue à la sortie du réseau de neurones récurrents, la quatrième séquence temporelle étant formée de valeurs discrètes identifiants temporellement une voie de circulation sur laquelle le véhicule cible, choisi parmi les véhicules environnants, pourrait circuler pendant une durée s’étalant d’un instant temporel t1+1 à un autre instant temporel t1+T+1 ;
Obtention d’une prédiction de changement de voie du véhicule cible par à partir de la quatrième séquence temporelle.

Selon un mode de réalisation, la première, respectivement la troisième, séquence temporelle est formée d’un ensemble d’éléments, chaque élément regroupant des données temporelles de circulation relatives à un des véhicules environnants, lesdites données étant obtenues pour la période de temps s’étendant de l’instant temporel t0-T, respectivement t1-T, à l’instant temporel t0, respectivement t1.

Selon un mode de réalisation, une valeur discrète identifiant temporellement une voie de circulation est un numéro.

Selon un mode de réalisation, les données de circulation relatives à un véhicule environnant sont sa position sur la route, sa vitesse et sa direction.

Selon un mode de réalisation, l’encodeur et le décodeur comporte chacun cinq cellules à mémoire court-terme et long terme.

Selon un mode de réalisation, lors de l’apprentissage du réseau de neurones, une fonction de coût de type erreur quadratique est minimisée pour déterminer des poids associés à ladite au moins une cellule à mémoire court terme et long terme.

Selon un deuxième aspect, l’invention concerne un dispositif de prédiction de changement de voie de circulation d’un véhicule cible choisi parmi des véhicules environnants circulant sur une route comprenant au moins deux voies de circulation dans un même sens de circulation comprenant des moyens pour mettre en œuvre des étapes du procédé précédent.

Selon un troisième aspect, l’invention concerne un véhicule comprenant le dispositif précédent.

Selon un quatrième aspect, l’invention concerne un produit programme d’ordinateur comportant des instructions adaptées pour l’exécution des étapes des procédés selon le premier aspect lorsque le programme d’ordinateur est exécuté par au moins un processeur.

Un tel programme d’ordinateur peut utiliser n’importe quel langage de programmation, et être sous la forme d’un code source, d’un code objet, ou d’un code intermédiaire entre un code source et un code objet, tel que dans une forme partiellement compilée, ou dans n’importe quelle autre forme souhaitable.

Selon un cinquième aspect, l’invention concerne un support d’enregistrement lisible par un ordinateur sur lequel est enregistré un programme d’ordinateur comprenant des instructions pour l’exécution des étapes du procédé selon le premier aspect de l’invention.

D’une part, le support d’enregistrement peut être n'importe quel entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une mémoire ROM, un CD-ROM ou une mémoire ROM de type circuit microélectronique, ou encore un moyen d'enregistrement magnétique ou un disque dur.

D'autre part, ce support d’enregistrement peut également être un support transmissible tel qu'un signal électrique ou optique, un tel signal pouvant être acheminé via un câble électrique ou optique, par radio classique ou hertzienne ou par faisceau laser autodirigé ou par d'autres moyens. Le programme d’ordinateur selon l'invention peut être en particulier téléchargé sur un réseau de type Internet.

Alternativement, le support d'enregistrement peut être un circuit intégré dans lequel le programme d’ordinateur est incorporé, le circuit intégré étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.

Brève description des figures

D’autres caractéristiques et avantages de l’invention ressortiront de la description des modes de réalisation non limitatifs de l’invention ci-après, en référence aux figures 1 à 7 annexées, sur lesquelles :

illustre schématiquement un réseau de neurones récurrents 100 selon un exemple de réalisation particulier et non limitatif de la présente invention ;

illustre schématiquement illustre schématiquement un réseau de neurones récurrents selon un exemple de réalisation particulier et non limitatif de la présente invention ;

illustre schématiquement une cellule C à mémoire court terme et long terme selon un exemple de réalisation particulier et non limitatif de la présente invention ;

illustre schématiquement un réseau de neurones récurrents 100 lors de la phase d’apprentissage selon un exemple de réalisation particulier et non limitatif de la présente invention ;

illustre schématiquement un réseau de neurones récurrents 100 lors de la phase d’inférence selon un exemple de réalisation particulier et non limitatif de la présente invention ;

illustre un organigramme des différentes étapes d’un procédé de prédiction de changement de voie de circulation selon un exemple de réalisation particulier et non limitatif de la présente invention ; et

illustre schématiquement un dispositif 700 mettant en œuvre le procédé selon un exemple de réalisation particulier et non limitatif de la présente invention.

Des procédés et dispositifs vont maintenant être décrits dans ce qui va suivre en référence conjointement aux figures 1 à 7.

L’invention porte sur un procédé d’intelligence artificielle pour l’aide à la conduite d’un véhicule éventuellement autonome. Le procédé permet la prédiction de changements de voie de circulation de véhicules environnants circulant sur une route comprenant au moins deux voies de circulation dans un même sens de circulation, c’est-à-dire de véhicules circulants sur la même voie de circulation ou sur des voies connexes de la voie sur laquelle circule un véhicule mettant en œuvre le procédé.

Pour ce faire, le procédé utilise un réseau de neurones récurrents.

Le réseau de neurones récurrents est prévu pour prédire temporellement une voie de circulation sur laquelle pourrait circuler dans un futur proche un véhicule cible choisi parmi des véhicules environnants. Cette prédiction est faite à partir de données de circulation réelles, relatives à des véhicules environnants et obtenues antérieurement (environ 1 à 2 secondes plus tôt) lorsque ces véhicules environnants circulaient sur certaines de ces voies de circulation.

Le procédé détermine alors une prédiction temporelle de changement de voie de circulation d’un véhicule cible à partir de cette prédiction temporelle obtenue par le réseau de neurones.

Selon l’invention, le réseau de neurones récurrents comporte un premier module appelé encodeur et un second module appelé décodeur. L’association de ce codeur et de ce décodeur conduit à des prédictions précises et donc à de faibles erreurs de prédiction comparées à l’utilisation d’un seul module. Ces faibles erreurs de prédiction se traduisent par une connaissance précise de l’environnement routier dans lequel circule un véhicule qui met en œuvre le procédé et augmente donc la sécurité de ce véhicule ainsi que celles des autres véhicules environnants lors d’un changement de voie de circulation.

Ce réseau de neurones récurrents selon l’invention ne requiert que peu de paramètres relativement à d’autres réseaux de neurones, ce qui facilite son implémentation.

L’association de l’encodeur et du décodeur permet également une certaine flexibilité comparée à l’utilisation d’un seul module. Cette flexibilité facilite, par exemple le choix de données d’apprentissage du réseau de neurones récurrents car aucune hypothèse sur ces données n’a besoin d’être introduite lors de l’apprentissage du réseau de neurones récurrents : l’encodeur s’adapte aux données entrantes d’apprentissage sans devoir considérer des hypothèses sur ces données d’apprentissage.

Par ailleurs, lors de la phase d’apprentissage, la prédiction temporelle déterminée par le décodeur tient compte à la fois d’états internes de l’encodeur mais aussi de valeurs discrètes identifiant temporellement une voie de circulation sur laquelle il a été constaté sur le terrain qu’un véhicule cible circulait. Lors de la phase d’inférence, c’est-à-dire lorsque le réseau de neurones récurrents entraîné est utilisé, ces valeurs discrètes, en entrée du décodeur, sont remplacées par une prédiction temporelle d’une voie de circulation relative au véhicule cible ; cette prédiction est obtenue antérieurement en sortie du décodeur . Ainsi, lors de la phase d’inférence, l’encodeur produit des états internes pour des données de circulation réelles relatives à des véhicules environnants et ce en fonction de ce qu’il a appris, transmet ces états internes au décodeur qui détermine alors une prédiction temporelle d’une voie de circulation sur laquelle pourrait circuler dans un futur proche le véhicule cible en tenant compte à la fois de ces états internes mais aussi de la prédiction antérieure de cette voie de circulation.

illustre schématiquement un réseau de neurones récurrents 100 selon un exemple de réalisation particulier et non limitatif de la présente invention.

Le réseau de neurones 100 comporte un premier module appelé encodeur ENC et un second module appelé décodeur DEC, suivant l’architecture dite « sequence – to – sequence », (Sutskever, Vinyals, & Le, 2014, https://arxiv.org/abs/1409.3215).

L’entrée de l’encodeur ENC correspond à l’entrée du réseau de neurones 100, la sortie du décodeur DEC correspond à la sortie du réseau de neurones récurrents 100. L’entrée du décodeur DEC est alimentée par des états internes de l’encodeur ENC

Un réseau de neurones récurrents est un réseau de neurones artificiels présentant des connexions récurrentes tel qu’illustré sur la . Il est constitué de cellules (neurones) interconnectées interagissant non-linéairement et pour lequel il existe au moins un cycle dans la structure. Les cellules sont reliées par des arcs (synapses) qui possèdent un poids W (non représentés). La sortie V d'une cellule est une combinaison non linéaire de ses entrées. «Déplié», un réseau de neurones récurrents est comparable à un réseau de neurones classiques avec des contraintes d'égalité entre les poids W du réseau.

Les techniques d'apprentissage d’un réseau de neurones récurrents sont les mêmes que pour les réseaux classiques (rétropropagation du gradient).

Néanmoins, les réseaux de neurones récurrents se heurtent au problème de disparition du gradient pour apprendre à mémoriser des évènements passés. L’utilisation de cellule à mémoire court terme et long terme (en anglais LSTM pour Long short-term memory) est une solution à ce problème (Sepp Hochreiter et Jürgen Schmidhuber, Long short-term memory". Neural Computation. 9 (8): 1735–1780.doi:10.1162/neco.1997.9.8.1735. PMID 9377276.).

Selon l’invention, l’encodeur ENC et le décodeur DEC comportent chacun au moins une cellule à mémoire court terme et long terme.

Selon un mode de réalisation, l’encodeur ENC et le décodeur DEC comporte chacun cinq cellules à mémoire court terme et long terme.

La illustre schématiquement une cellule C à mémoire court terme et long terme selon un exemple de réalisation particulier et non limitatif de la présente invention.

L'idée associée à un réseau de neurones à mémoire court terme et long terme est que chaque cellule est liée deux états internes ; l’un dit état caché ( ) et l’autre dit état de la cellule ( ) qui joue le rôle de mémoire. Le passage d’un état d’entrée d’une cellule à un instant temporel (t-1) à un état de sortie à un instant temporel suivanttse fait par transfert à gain constant et égal à 1. De cette façon les erreurs se propagent aux pas antérieurs (jusqu'à 1 000 étapes dans le passé) sans phénomène de disparition de gradient. L'état de la cellule peut être modifié à travers une porte qui autorise ou bloque la mise à jour (input gate ). De même une porte contrôle si l'état de cellule est communiqué en sortie de la cellule (output gate ). Les cellules peuvent aussi utiliser une porte permettant la remise à zéro de l'état de la cellule (forget gate ).

Selon un exemple, en considérant les valeurs initiales suivantes : et , et en considérant une fonction d’activation de ces cellules de type sigmoïde et tangente hyperbolique , les états des portes de remise à zéro, de sortie et de mise à jour ainsi que les états caché, de la cellule et de sortie sont donnés par :

Dans lesquelles o est un opérateur symbolisant le produit matriciel de Hadamard (produit terme à terme).

En variante, d’autres fonctions peuvent être utilisées.

Selon l’invention, le réseau de neurones récurrents 100 est un réseau de type « séquence à séquence » (en anglais sequence-to-sequence) : l’entrée de ce réseau de neurones récurrents est alimentée par une séquence temporelle STE de valeurs discrètes représentatives de données de circulation relatives à des véhicules environnants V_i(i=1 à N). Ces données sont obtenues pour une durée s’étalant d’un instant temporel t0-T à un autre instant temporel t0 avec T une période de temps. Par ailleurs, la sortie de ce réseau de neurones récurrents 100 est une séquence temporelle STS de valeurs discrètes identifiants temporellement une voie de circulation sur laquelle un véhicule cible V_c, choisi parmi les véhicules environnants V_i, pourrait circuler pendant une durée s’étalant d’un instant temporel t0+1 à un autre instant temporel t0+T+1.

Par la suite, des valeurs discrètes d’une séquence temporelle s’étalant d’un instant temporel t₁à un autre instant t₂sont des valeurs considérées aux instants temporels t1, t₁+ ; t_k+k* ; t2 avec et D un entier donné.

Selon un mode de réalisation, la séquence temporelle STE est formée d’un ensemble d’éléments X_i; chaque élément X_iregroupe des données de circulation relatives à un des N véhicules environnants Vi. Ces données sont obtenues pour une période de temps s’étendant de l’instant temporel t0-T à l’instant temporel t0.

Selon un mode de réalisation, les données de circulation relatives à un véhicule environnant V_isont sa position sur la route, sa vitesse et sa direction.

Lors de l’apprentissage, illustrée sur la , la séquence temporelle STE alimente l’entrée de l’encodeur ENC (l’entrée du réseau de neurones récurrents 100) et la sortie du décodeur DEC (sortie du réseau de neurones récurrents 100) est la séquence temporelle STS. Par ailleurs, l’entrée du décodeur DEC est alimentée par des états internes de l’encodeur ENC mais aussi par une séquence temporelle ST_cde valeurs discrètes identifiant temporellement une voie de circulation sur laquelle il a été constaté sur le terrain que le véhicule cible V_ccirculait pendant une durée s’étalant de l’instant temporel t0 à un instant temporel t0+T dans un environnement routier similaire à celui décrit par la séquence temporelle STE.

Selon un mode de réalisation, chaque voie de circulation est identifiée par un numéro. Par exemple, pour une route à trois voies de circulation, le numéro -1 représente la voie la plus à gauche le numéro 0 la voie de circulation centrale et le numéro 1 la voie de circulation la plus à droite.

Ainsi, lors de l’apprentissage, le réseau de neurones récurrents 100 apprend à produire une prédiction temporelle d’une voie de circulation sur laquelle pourrait circuler dans un futur proche un véhicule cible V_cpour une durée s’étalant de l’instant temporel t0+1 à l’instant temporel t0+T+1 (séquence STS) à partir, d’une part, de données de circulation relatives à des véhicules environnants V_i(i=1 à N) et obtenues pour une durée antérieure s’étalant de l’instant temporel t0-T à l’instant temporel t0 (séquence STE), et, d’autre part, de valeurs discrètes identifiant temporellement une voie de circulation sur laquelle il a été constaté sur le terrain que le véhicule cible V_ccirculait pendant une durée s’étalant de l’instant temporel t0 à un instant temporel t0+T dans un environnement routier similaire à celui décrit pas la séquence temporelle STE (séquence ST_c).

Lors de la phase d’inférence, illustrée sur la , le réseau de neurones récurrents 100 est identique au réseau de neurones récurrents 100 en phase d’apprentissage, excepté que l’entrée du décodeur DEC n’est plus alimentée par une séquence temporelle ST_c. A la place, l’entrée du décodeur DEC est alimentée par les états internes de l’encodeur ENC et par une séquence temporelle obtenue antérieurement en sortie du décodeur DEC. Ainsi, l’entrée du décodeur DEC est alimentée par sa propre sortie obtenue antérieurement (la sortie du décodeur DEC est ainsi "rebouclée" sur son entrée). Le réseau de neurones récurrents 100 est alors capable de reproduire une prédiction temporelle d’une voie de circulation sur laquelle pourrait circuler dans un futur proche un véhicule cible V_cpour une durée s’étalant d’un instant temporel t1+1 à un instant temporel t1+T+1 (séquence STS) à partir de données de circulation réelle, relatives à des véhicules environnants V_i(i=1 à N) et obtenues pour une durée antérieure s’étalant de l’instant temporel t1-T à l’instant temporel t1 (séquence STE)

Un algorithme d’apprentissage classique de réseau de neurones est utilisé pour l’apprentissage du système 100. Le principe de cet algorithme d’apprentissage est que le réseau de neurones 100 apprennent les valeurs des poids W des cellules par rétropropagation du gradient de l’erreur c’est-à-dire que l’algorithme calcule progressivement les valeurs des poids de manière à minimiser une fonction de coût pour l’encodeur ENC et pour le décodeur DEC et pour chacune de leurs cellules à mémoire court terme et long terme en partant des sorties du réseau de neurones récurrents 100.

Selon un mode de réalisation, la fonction de coût est une fonction de type erreur quadratique moyenne MSE donnée par :

où F est une fonction (non-linéaire) représentant le réseau de neurones, F(Xi) correspond aux données d’une séquence STS (sorties du réseau de neurones 100) pour des entrées X_icorrespondant aux données d’une séquence STE et Y_icorrespond à des valeurs discrètes identifiant temporellement une voie de circulation sur laquelle il a été constaté sur le terrain qu’un véhicule circulait, N est le nombre de véhicules environnants.

Cette fonction de coût est minimisée en utilisant un algorithme classique de descente de gradient tel que l’algorithme supervisé ADAM de descente de gradient (Kingma & Ba (2015) Adam: A Method for Stochastic Optimization. Proceedings of the International Conference for Learning Representations, San Diego (ICLR). Cet algorithme utilise un ensemble de paramètres qui pourront avoir, par exemple, les valeurs suivantes : taux d’apprentissage égal à 0.001, beta_1 égal à 0.9, beta_2 égal à 0.999 et epsilon égal à . Ces paramètres peuvent être ajustés ou améliorés par recherche par quadrillage ("grid search").

Le réseau de neurones récurrents 100 est avantageusement entrainé sur une base de données volumineuse, comprenant de nombreuses et variées trajectoires de véhicules sur des voies de circulation. Cette base de données peut être obtenue à partir du programme NGSIM (V. Punzo, M. T. Borzacchiello, Estimation of vehicle trajectories from observed discrete positions and +Next Generation Simulation Program (NGSIM), 2009).

L’acquisition de ces données peut aussi se faire par une ou plusieurs campagnes de roulage, en enregistrant à chaque pas de temps les positions, vitesses, et directions du véhicule implémentant l’invention ainsi que ceux des véhicules environnants. Les données seront avantageusement échantillonnées avec un pas de temps maximum de 100ms.

illustre un organigramme des différentes étapes d’un procédé prédiction de changement de voie de circulation selon un exemple de réalisation particulier et non limitatif de la présente invention.

Dans une étape 610 dite s’apprentissage, le réseau de neurones récurrents 100 est entraîné. Pour cela, l’entrée de l’encodeur ENC est alimentée par une séquence temporelle STE (dite première séquence temporelle) de valeurs discrètes représentatives de données de circulation relatives à des véhicules environnants (V_i) et obtenues pour une durée s’étalant d’un instant temporel t0-T à un autre instant temporel t0 avec T une période de temps. L’entrée du décodeur DEC est alimentée par des états internes de l’encodeur ENC et par une séquence temporelle ST_c(dite deuxième séquence temporelle) de valeurs discrètes identifiant temporellement une voie de circulation sur laquelle il a été constaté sur le terrain qu’un véhicule cible circulait pendant une durée s’étalant de l’instant temporel t0 à un instant temporel t0+T dans un environnement routier similaire à celui décrit par la première séquence temporelle.

Dans une étape 620, des données de circulation réelle relatives à des véhicules environnants (V_i) sont obtenues pour une durée s’étalant d’un instant temporel t1-T à un autre instant temporel t1 avec T une période de temps. Une troisième séquence temporelle est formée par des valeurs discrètes représentatives de ces données de circulation.

Selon un mode de réalisation, la troisième séquence temporelle est formée d’un ensemble d’éléments X_i; chaque élément X_iregroupe des données de circulation relatives à un des N véhicules environnants Vi. Ces données sont obtenues pour une période de temps s’étendant de l’instant temporel t1-T à l’instant temporel t1.

Selon un mode de réalisation, les données de circulation réelles relatives à des véhicules environnants V_isont obtenues à partir de capteurs montés sur le véhicule qui implémente le procédé.

Selon un mode de réalisation, au moins un capteur configuré pour détecter des objets localisés dans l’environnement du véhicule qui implémente le procédé, c’est-à-dire autour du véhicule qui implémente le procédé dans un rayon déterminé correspondant au champ de détection associé de chaque capteur.

Le ou les capteurs correspondent par exemple à une ou plusieurs caméra ou un ou plusieurs détecteurs de mouvement ou un ou plusieurs radars à ondes millimétriques ou à un ou plusieurs LIDARs (de l’anglais « Light Detection And Ranging », ou « Détection et estimation de la distance par la lumière » en français).

Dans une étape 630, l’entrée de l’encodeur ENC est alimentée par ladite troisième séquence temporelle. L’entrée du décodeur DEC est alimentée par les états internes de l’encodeur ENC et par une séquence temporelle obtenue antérieurement à partir de la sortie du décodeur (DEC).

Dans une étape 640, une quatrième séquence temporelle est obtenue à la sortie du réseau de neurones récurrents 100. La quatrième séquence temporelle est formée de valeurs discrètes identifiants temporellement une voie de circulation sur laquelle un véhicule cible V_c, choisi parmi les véhicules environnants V_i, pourrait circuler pendant une durée s’étalant d’un instant temporel t1+1 à un autre instant temporel t1+T+1.

Dans une étape 650, une prédiction de changement de voie du véhicule cible V_cest obtenue à partir de la quatrième séquence temporelle.

Selon un mode de réalisation de l’étape 650, un changement de voie est prédit dès que deux valeurs discrètes de la quatrième séquence temporelle sont différentes.

Selon un mode de réalisation, l’instant temporel d’un changement de voie de circulation est obtenu à partir de la position d’un changement de valeurs discrètes dans la quatrième séquence temporelle.

illustre schématiquement un dispositif selon un exemple de réalisation particulier et non limitatif de la présente invention.

Le dispositif 700 est par exemple configuré pour la mise en œuvre d’au moins une des étapes du procédé décrit en regard de la . Des exemples d’un tel dispositif 700 comprennent, sans y être limités, un équipement électronique embarqué tel qu’un ordinateur de bord d’un véhicule, un calculateur électronique tel qu’une UCE (« Unité de Commande Electronique »), un téléphone intelligent (de l’anglais « smartphone »), une tablette, un ordinateur portable. Les éléments du dispositif 700, individuellement ou en combinaison, peuvent être intégrés dans un unique circuit intégré, dans plusieurs circuits intégrés, et/ou dans des composants discrets. Le dispositif 700 peut être réalisé sous la forme de circuits électroniques ou de modules logiciels (ou informatiques) ou encore d’une combinaison de circuits électroniques et de modules logiciels. Selon différents modes de réalisation particuliers, le dispositif 700 est couplé en communication avec d’autres dispositifs ou systèmes similaires, par exemple par l’intermédiaire d’un bus de communication ou au travers de ports d’entrée / sortie dédiés.

Le dispositif 700 comprend un (ou plusieurs) processeur(s) 701 configurés pour exécuter des instructions pour la réalisation des étapes du procédé et/ou pour l’exécution des instructions du ou des logiciels embarqués dans le dispositif 700. Le processeur 710 peut inclure de la mémoire intégrée, une interface d’entrée/sortie, et différents circuits connus de l’homme du métier. Le dispositif 700 comprend en outre au moins une mémoire 702 correspondant par exemple à une mémoire volatile et/ou non volatile et/ou comprend un dispositif de stockage mémoire qui peut comprendre de la mémoire volatile et/ou non volatile, telle que EEPROM, ROM, PROM, RAM, DRAM, SRAM, flash, disque magnétique ou optique.

Le code informatique du ou des logiciels embarqués comprenant les instructions à charger et exécuter par le processeur est par exemple stocké sur la mémoire 702.

Selon un mode de réalisation particulier et non limitatif, le dispositif 700 comprend un bloc 703 d’éléments d’interface pour communiquer avec des dispositifs externes ou encore un serveur distant ou un équipement embarqué dans un autre véhicule tels que, par exemple, des capteurs, des systèmes de navigation et/ou d’aide à la conduite, ou encore un lecteur de communication en champ proche ou un récepteur radio. Les éléments d’interface du bloc 703 comprennent une ou plusieurs des interfaces suivantes :

- interface radiofréquence RF, par exemple de type Bluetooth® ou Wi-Fi®, LTE (de l’anglais « Long-Term Evolution » ou en français « Evolution à long terme »), LTE-Advanced (ou en français LTE-avancé) ;

- interface USB (de l’anglais « Universal Serial Bus » ou « Bus Universel en Série » en français) ;

- interface HDMI (de l’anglais « High Definition Multimedia Interface », ou « Interface Multimedia Haute Definition » en français) ;

- interface LIN (de l’anglais « Local Interconnect Network », ou en français « Réseau interconnecté local »).

Selon une variante, le dispositif 700 comprend une interface de communication 704 qui permet d’établir une communication avec d’autres dispositifs via un canal de communication 705. L’interface de communication 704 correspond par exemple à un transmetteur configuré pour transmettre et recevoir des informations et/ou des données via le canal de communication 705 tels que des évènements extérieurs pris en considération par le dispositif 700 pour la mise e œuvre du procédé de la . L’interface de communication 704 correspond par exemple à un réseau filaire de type CAN (de l’anglais « Controller Area Network » ou en français « Réseau de contrôleurs »), CAN FD (de l’anglais « Controller Area Network Flexible Data-Rate » ou en français « Réseau de contrôleurs à débit de données flexible »), FlexRay (selon la norme ISO 17458) ou Ethernet (selon la norme ISO/IEC 802.3).

Selon un mode de réalisation particulier supplémentaire, le dispositif 700 peut fournir des signaux de sortie à un ou plusieurs dispositifs externes, tels qu’un écran d’affichage, un ou des haut-parleurs et/ou d’autres périphériques via respectivement des interfaces de sortie non représentées.

L’invention concerne également un véhicule, par exemple automobile ou plus généralement un véhicule à moteur terrestre, comprenant le dispositif 700 de la .

Bien entendu, la présente invention ne se limite pas aux modes de réalisation et autres exemples ou variantes décrits ci-avant mais s’étend à tous modes et/ou variante de réalisation qui aurait la même portée.

Claims

Procédé de prédiction de changement de voie de circulation d’un véhicule cible choisi parmi des véhicules environnants circulant sur une route comprenant au moins deux voies de circulation dans un même sens de circulation, ledit procédé étant mis en œuvre dans un dispositif mettant en œuvre un réseau de neurones, caractérisé en ce qu’il comporte des étapes suivantes :
Apprentissage (610) du réseau de neurones récurrents comportant un premier module appelé encodeur et un second module appelé décodeur, l’encodeur et le décodeur comportant chacun au moins une cellule à mémoire court terme et long terme, une entrée de l’encodeur correspondant à une entrée du réseau de neurones, une sortie du décodeur correspondant à une sortie du réseau de neurones récurrents ;

l’entrée de l’encodeur étant alimentée par une première séquence temporelle de valeurs discrètes représentatives de données de circulation relatives à des véhicules environnants et obtenues pour une durée s’étalant d’un instant temporel t0-T à un autre instant temporel t0 avec T une période de temps ;

une entrée du décodeur étant alimentée par des états internes de l’encodeur et par une deuxième séquence temporelle de valeurs discrètes identifiant temporellement une voie de circulation sur laquelle il a été constaté sur le terrain qu’un véhicule cible circulait pendant une durée s’étalant de l’instant temporel t0 à un instant temporel t0+T dans un environnement routier similaire à celui décrit par la première séquence temporelle ;

Obtention (620) d’une troisième séquence temporelle de valeurs discrètes représentatives de données de circulation réelles relatives à des véhicules environnants et obtenues par au moins un capteur pour une durée s’étalant d’un instant temporel t1-T à un autre instant temporel t1 avec T une période de temps ;

Alimenter (630) l’entrée de l’encodeur par ladite troisième séquence, l’entrée du décodeur étant alimentée par les états internes de l’encodeur et par une séquence temporelle obtenue antérieurement à partir de la sortie du décodeur ;

Obtention (640) d’une quatrième séquence temporelle obtenue à la sortie du réseau de neurones récurrents, la quatrième séquence temporelle étant formée de valeurs discrètes identifiants temporellement une voie de circulation sur laquelle le véhicule cible, choisi parmi les véhicules environnants, pourrait circuler pendant une durée s’étalant d’un instant temporel t1+1 à un autre instant temporel t1+T+1 ;

Obtention (650) d’une prédiction de changement de voie du véhicule cible par à partir de la quatrième séquence temporelle.
Procédé selon la revendication 1, dans lequel la première, respectivement la troisième, séquence temporelle est formée d’un ensemble d’éléments, chaque élément regroupant des données temporelles de circulation relatives à un des véhicules environnants, lesdites données étant obtenues pour la période de temps s’étendant de l’instant temporel t0-T, respectivement t1-T, à l’instant temporel t0, respectivement t1.
Procédé selon l’une des revendications 1 à 2, dans lequel une valeur discrète identifiant temporellement une voie de circulation est un numéro.
Procédé selon l’une des revendications 1 à 3, dans lequel les données de circulation relatives à un véhicule environnant sont sa position sur la route, sa vitesse et sa direction.
Procédé selon l’une des revendications 1 à 4, dans lequel l’encodeur et le décodeur comporte chacun cinq cellules à mémoire court-terme et long terme.
Procédé selon l’une des revendications 1 à 5, dans lequel lors de l’apprentissage du réseau de neurones, une fonction de coût de type erreur quadratique est minimisée pour déterminer des poids associés à ladite au moins une cellule à mémoire court terme et long terme.
Dispositif (700) de prédiction de changement de voie de circulation d’un véhicule cible choisi parmi des véhicules environnants circulant sur une route comprenant au moins deux voies de circulation dans un même sens de circulation comprenant des moyens pour mettre en œuvre des étapes du procédé selon l’une des revendications 1 à 6.
Véhicule comprenant le dispositif (700) selon la revendication 7.
Produit programme d’ordinateur comportant des instructions adaptées pour l’exécution des étapes du procédé selon l’une des revendications 1 à 6, lorsque le programme d’ordinateur est exécuté par au moins un processeur.
Support d’enregistrement lisible par un ordinateur sur lequel est enregistré un programme d’ordinateur comprenant des instructions pour l’exécution des étapes du procédé selon l’une des revendications 1 à 6.