FR3088741A1 - Procede d'assistance vocale, dispositif d'assistance vocale et vehicule comprenant le dispositif d'assistance vocale - Google Patents

Procede d'assistance vocale, dispositif d'assistance vocale et vehicule comprenant le dispositif d'assistance vocale Download PDF

Info

Publication number
FR3088741A1
FR3088741A1 FR1860636A FR1860636A FR3088741A1 FR 3088741 A1 FR3088741 A1 FR 3088741A1 FR 1860636 A FR1860636 A FR 1860636A FR 1860636 A FR1860636 A FR 1860636A FR 3088741 A1 FR3088741 A1 FR 3088741A1
Authority
FR
France
Prior art keywords
voice
recognition system
user
voice recognition
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1860636A
Other languages
English (en)
Other versions
FR3088741B1 (fr
Inventor
Omar Ben Abdelaziz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Interieur Industrie SAS
Original Assignee
Faurecia Interieur Industrie SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Faurecia Interieur Industrie SAS filed Critical Faurecia Interieur Industrie SAS
Priority to FR1860636A priority Critical patent/FR3088741B1/fr
Publication of FR3088741A1 publication Critical patent/FR3088741A1/fr
Application granted granted Critical
Publication of FR3088741B1 publication Critical patent/FR3088741B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/038Control and interface arrangements therefor, e.g. drivers or device-embedded control circuitry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/038Indexing scheme relating to G06F3/038
    • G06F2203/0381Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Traffic Control Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Dispositif d'assistance vocale (1) destiné à un véhicule (100) comprenant : - un système de reconnaissance vocale (20) présentant un état actif et un état inactif, dans l'état actif le système de reconnaissance vocale (20) étant apte à capter (22) et analyser (24) une information vocale d'un utilisateur, à reconnaitre (24) une pluralité d'informations de commande, - l'unité de commande (30) destinée à commander un équipement (42, 44) en fonction de l'information de commande reconnue, - un dispositif d'activation apte à activer le système de reconnaissance vocale et comprenant : • un appareil de prise de vues (12), l'appareil de prise de vues (12) étant apte à prendre des vues de la bouche de l'utilisateur, et • une unité informatique (10) adaptée pour détecter un mouvement de lèvres de l'utilisateur et émettre un signal d'activation (11) pour placer le système de reconnaissance vocale (20) dans l'état actif.

Description

Procédé d’assistance vocale, dispositif d’assistance vocale et véhicule comprenant le dispositif d’assistance vocale
Domaine de l'invention
L’invention concerne un procédé d’assistance vocale et un dispositif d’assistance vocale, ainsi qu’un véhicule comprenant le dispositif vocal.
Contexte de l'invention
Un dispositif d’assistance vocal est destiné à apporter une assistance à un utilisateur pour exécuter une action en réponse à une commande vocale émise par l’utilisateur. Un tel dispositif peut notamment être intégré à un ordinateur, un smartphone ou un appareil. La présente invention est plus particulièrement destinée à être intégrée à une interface utilisateur embarquée dans un véhicule. Afin de transformer la commande vocale émise par l’utilisateur en action, le dispositif d’assistance vocale effectue une reconnaissance vocale, analysant la parole émise par l’utilisateur.
Le document US 2015/0109191 A1 décrit un procédé, ainsi qu’un dispositif informatique comprenant un afficheur transparent et définissant une plage de directions du regard pour activer la reconnaissance vocale. Le dispositif informatique détermine si la direction du regard de l’utilisateur est dans la plage de directions pour activer la reconnaissance vocale. En réponse, le dispositif informatique peut activer ou désactiver une interface vocale.
Si un tel procédé présente des avantages, on peut toutefois s’interroger sur le fait que l’utilisateur reste parfaitement attentif à son environnement lorsque l’utilisateur doit regarder dans une certaine direction pour activer la reconnaissance pour activer ou désactiver l’interface vocale, ce qui peut poser un problème lorsque l’utilisateur conduit un véhicule.
Exposé de l'invention
Conformément à l'invention, il est proposé un procédé d’assistance vocale, comprenant les opérations successives suivantes :
a) capturer des images d’un utilisateur et traiter les images jusqu’à détecter un mouvement de lèvres,
b) en cas de détection de mouvement de lèvres, activer un système de reconnaissance vocale,
c) capter et analyser avec le système de reconnaissance vocale une information vocale émise par l’utilisateur pour détecter la présence d’une information de commande dans l’information vocale, et
d) en cas de détection d’information de commande, commander un équipement en fonction de l’information de commande.
Ainsi, la consommation électrique est réduite, le système de reconnaissance vocale n’étant activée que lorsque l’utilisateur parle, sans générer de contrainte à l’utilisateur, notamment de contrainte susceptible d’altérer son attention. Le système de reconnaissance vocale comprend de préférence un microphone destiné à recueillir des sons, en particulier les paroles du de l’utilisateur et un dispositif d’analyse destiné à analyser l’information vocale pour identifier des mots émis par l’utilisateur.
Selon une autre caractéristique conforme à l'invention, le procédé comprend en outre de préférence les opérations suivantes ;
- détecter une commande d’inhibition, et
- ignorer l’opération b), en cas de détection de la commande d’inhibition.
Ainsi, en cas de détection de commande d’inhibition, même si un mouvement de lèvres est détecté, le système de reconnaissance vocale n’est pas activé. Autrement dit, la commande d’inhibition prime sur la détection de mouvement de lèvres. Cela permet d’éviter qu’un mouvement des lèvres de l’utilisateur active le système de reconnaissance vocale lorsque cela n’est pas approprié.
La commande d’inhibition est une commande qui permet de ne pas activer le système de reconnaissance vocale. Bien entendu, tant que l’opération b) est ignorée, les opérations c) et d) ne sont pas non plus effectuées. La détection de la commande d’inhibition pourra induire de rester à l’opération a), mais elle pourra aussi induire d’effectuer une autre opération, telle que cesser de capturer les images de l’utilisateur et de traiter les images.
Selon une caractéristique complémentaire conforme à l’invention, le procédé comprend en outre de préférence l’opération de :
- détecter une communication téléphonique et la considérer comme commande d’inhibition.
Ainsi, on évite que des expressions dites pendant une conversation avec une personne distante ne soient interprétées comme une information de commande et, à tout le moins, on réduit la consommation électrique et l’occupation de la mémoire informatique du système de reconnaissance vocale pendant une période durant laquelle la probabilité d’émission d’une commande au dispositif d’assistance vocale est faible. Bien entendu, il sera avantageusement considéré que la commande d’inhibition cesse avec la cessation de la détection de la communication téléphonique, autrement dit à l’issue, ou sensiblement à l’issue (il peut être prévu une temporisation) de la communication téléphonique.
Selon une autre caractéristique complémentaire conforme à l’invention, le procédé comprend en outre de préférence l’opération de :
- détecter la présence d’une personne autre que l’utilisateur et la considérer comme une commande d’inhibition.
En présence d’une autre personne que l’utilisateur à proximité du dispositif d’assistance vocal, il est probable qu’il s’établisse une conversation relativement longue destinée exclusivement à l’autre personne. Là encore, en n’activant pas le système de reconnaissance vocale malgré le mouvement des lèvres de l’utilisateur on réduit la probabilité de mauvaise interprétation du destinataire des expressions prononcées par l’utilisateur et on réduit la consommation électrique du dispositif d’assistance vocale.
Selon encore une autre caractéristique complémentaire conforme à l’invention, le procédé comprend en outre de préférence l’opération de :
- détecter une commande manuelle d’inhibition et considérer la commande manuelle d’inhibition comme commande d’inhibition.
Ainsi, lorsque l’utilisateur souhaite parler sans qu’il soit considéré à un moment ou un autre qu’il a émis une information de commande, l’utilisateur active la commande manuelle d’inhibition.
La commande manuelle d’inhibition pourra être considérée maintenue tant que l’utilisateur active la commande manuelle d’inhibition, ou en variante jusqu’à l’activation suivante de cette même commande d’inhibition, ou encore l’activation d’une autre commande.
La commande manuelle d’inhibition peut être constituée par l’actionnement d’un bouton physique, ou virtuel. L’actionnement d’un bouton virtuel peut être constitué par la détection (au moyen d’images, d’un capteur capacitif, d’un capteur résistif ou tout autre moyen analogue) de la présence de la main (ou plus généralement d’une partie du corps de l’utilisateur à proximité ou au contact d’une zone). La commande manuelle d’inhibition peut également être plus généralement constituée par la détection du mouvement d’une partie du corps de l’utilisateur ou d’un objet porté par l’utilisateur.
Selon une caractéristique encore complémentaire conforme à l’invention, le procédé comprend en outre de préférence l’opération de :
- détecter une commande manuelle d’activation et ignorer la commande d’inhibition.
Ainsi, pendant une conversation (téléphonique) avec une personne distante ou malgré la présence d’une personne proche ou encore pour mettre fin à l’effet de la détection d’une commande manuelle d’inhibition, l’utilisateur peut émettre une information de commande qui sera prise en compte. Par conséquent, la commande manuelle d’activation prime sur la commande d’inhibition.
La commande manuelle d’activation peut simplement permettre d’ignorer la commande d’inhibition et il est nécessaire qu’ensuite un mouvement des lèvres soit détecté pour que le système de reconnaissance vocale soit activé. Mais, selon une caractéristique complémentaire, le procédé comprend en outre de préférence, en cas de détection de commande manuelle d’activation, l’opération d’activer le système de reconnaissance vocale.
La commande manuelle d’activation peut être constituée par l’actionnement d’un bouton physique, ou virtuel. L’actionnement d’un bouton virtuel peut être constitué par la détection (au moyen d’images, d’un capteur capacitif, d’un capteur résistif ou tout autre moyen analogue) de la présence de la main (ou plus généralement d’une partie du corps de l’utilisateur à proximité ou au contact d’une zone). La commande manuelle d’activation peut également être plus généralement constituée par la détection du mouvement d’une partie du corps de l’utilisateur ou d’un objet porté par l’utilisateur.
Selon une autre caractéristique conforme à l’invention, le procédé comprend en outre entre l’opération b) et l’opération c), une opération b’) consistant à capter et analyser une information vocale émise par l’utilisateur pour détecter la présence d’une clé de commande dans l’information vocale.
L’opération b’) permet de ne pas commander l’équipement même si l’information vocale contient une information de commande, tant que l’utilisateur n’a pas émis la clé de commande dans l’information vocale. La clé de commande consiste en un mot ou une suite de mots permettant de savoir que l’utilisateur souhaite adresser ensuite une ou plusieurs informations de commande au dispositif d’assistance vocale.
Ainsi, le système de reconnaissance vocale est activé lorsque l’utilisateur parle, mais le dispositif d’assistance vocale ne commandera l’équipement qu’après réception de la commande clé. Par conséquent, cette commande clé, constituée d’un mot ou d’une suite de quelques mots permettra au système de reconnaissance vocale de déterminer si l’information vocale captée est destinée à l’utilisation du dispositif d’assistance vocale ou non (notamment dans le cas où l’information vocale captée est destinée à une personne).
Bien entendu, il pourrait être prévu que l’opération c) comprennent en outre de détecter la présence d’une clé d’arrêt dans l’information vocale et d’effectuer ensuite l’opération b), ou en variante l’opération a).
Selon une autre caractéristique conforme à l’invention, le procédé comprend en outre de préférence les opérations de commande successives d’une pluralité d’équipements en fonction de l’information de commande.
Ainsi, le contenu de l’expression vocale constituant la commande à destination du dispositif d’assistance vocale peut permettre non seulement de déterminer l’action à exécuter (par exemple mettre en fonctionnement/arrêter), mais également l’équipement à commander (radio, système de navigation, ventilation, ...).
Selon encore une autre caractéristique conforme à l’invention, le procédé comprend en outre de préférence l’opération de :
- désactiver le système de reconnaissance vocale en l’absence de détection d’information de commande pendant une durée supérieure à une période d’activité prédéterminée.
La période d’activité prédéterminée constitue un seuil au-delà duquel il est probable que l’utilisateur n’émettra pas d’information commande dans les instants qui suivent. La période d’activité est de préférence que l’ordre de 1 à 30 secondes, de préférence comprise entre 5 et 10 secondes.
Selon encore une autre caractéristique conforme à l’invention, le procédé comprend :
- après avoir effectué l’opération d), effectuer à nouveau l’opération c).
Ainsi, l’utilisateur peut émettre successivement plusieurs informations de commande afin que le dispositif d’assistance vocale effectue plusieurs commandes successives.
L’invention concerne également un dispositif d’assistance vocale destiné à un véhicule comprenant :
- un système de reconnaissance vocale présentant un état actif et un état inactif, dans l’état actif le système de reconnaissance vocale étant apte à capter et analyser une information vocale d’un utilisateur, et à reconnaître une pluralité d’informations de commande,
- une unité de commande apte à émettre un signal de commande destiné à commander un équipement en fonction de l’information de commande reconnue,
- un dispositif d’activation apte à activer le système de reconnaissance vocale et comprenant :
• un appareil de prise de vues, l’appareil de prise de vues étant apte à prendre des vues de la bouche de l’utilisateur et à transmettre des données d’images relatives aux vues prises, et • une unité informatique reliée à l’appareil de prise de vues pour recevoir les données d’images, l’unité informatique étant adaptée pour traiter lesdites données d’images, pour détecter un mouvement de lèvres de l’utilisateur et émettre un signal d’activation lorsque le mouvement de lèvres de l’utilisateur est détecté, le dispositif d’assistance vocale étant apte à placer le système de reconnaissance vocale dans l’état actif lorsque l’unité informatique émet le signal d’activation.
Ainsi, la consommation électrique du dispositif d’assistance vocale est minimisée sans générer de contrainte substantielle à l’utilisateur.
Dans divers modes de réalisation du dispositif d’assistance vocale selon l'invention, on peut éventuellement avoir recours en outre à l'une et/ou à l'autre des dispositions suivantes :
- l’appareil de prise de vues est apte à prendre des vues permettant de détecter le mouvement détecter y compris en condition de faible luminosité, en particulier l’appareil de prise de vues est une caméra infrarouge ;
- le système de reconnaissance vocale comprend un dispositif d’analyse apte à analyser l’information vocale, et l’unité informatique, le dispositif d’analyse et l’unité de commande sont intégrés dans une unique carte électronique ;
- le dispositif d’assistance vocale comprend en outre une commande manuelle d’inhibition adaptée pour inhiber l’émission du signal d’activation ;
- le dispositif d’assistance vocale comprend en outre un dispositif de détection de communication téléphonique, l’émission du signal d’activation étant inhibée lorsque le dispositif de détection de communication téléphonique détecte une communication téléphonique ;
- la commande manuelle d’inhibition comprend en outre un bouton commandant l’état actif du système de reconnaissance vocale ;
- le système de reconnaissance vocale est désactivé (placé dans l’état inactif) lorsque l’unité informatique ne détecte pas d’information de commande pendant une durée supérieure à une période d’activité prédéterminée ; et
- l’unité de commande présente un état actif et un état inactif, l’unité de commande est placée dans l’état actif lorsque le système de reconnaissance vocale reconnaît une clé de commande, et de préférence l’unité de commande est placée dans l’état inactif lorsque le système de reconnaissance vocale est dans l’état inactif.
L’invention concerne en outre un véhicule comprenant le dispositif d’assistance vocale précité et au moins un équipement, l’équipement réagissant en fonction du signal de commande.
Dans divers modes de réalisation du dispositif d’assistance vocale selon l'invention, on peut éventuellement avoir recours en outre à l'une et/ou à l'autre des dispositions suivantes :
- le système de reconnaissance vocale est adapté pour reconnaître une pluralité d’informations de commande différentes et l’unité de commande est apte à émettre une pluralité de signaux de commande incluant un premier signal de commande et un deuxième signal d’équipement, l’équipement réagissant en fonction de la pluralité de signaux de commande différents ;
- le véhicule comprend au moins un premier équipement et un deuxième équipement, le système de reconnaissance vocale est adapté pour reconnaître une pluralité d’informations de commande différentes et l’unité de commande est apte à émettre une pluralité de signaux de commande incluant un signal de commande de premier équipement et un signal de commande de deuxième équipement, et le premier équipement réagissant en fonction du signal de commande de premier équipement et le deuxième équipement réagissant en fonction du signal de commande de deuxième équipement.
Brève description des figures
D'autres caractéristiques et avantages de la présente invention apparaîtront dans la description détaillée suivante, se référant aux dessins annexés dans lesquels :
- FIG.1 illustre schématiquement un dispositif d’assistance vocale conforme à l’invention,
- FIG. 2 illustre sous forme de diagramme fonctionnel un procédé conforme à l’invention.
Description détaillée de l'invention
La figure 1 représente un véhicule 100 muni d’un dispositif d’assistance vocale 1 placé dans l’habitacle 40 du véhicule.
Le véhicule 100 comprend plusieurs équipements dont en particulier un dispositif multimédia 42 apte à diffuser de la musique ou la radio et un dispositif d’aide à la navigation 44.
L’habitacle 40 présente un siège conducteur 6 et un siège passager 8 disposés côte à côte. L’habitacle 40 est destiné à recevoir des occupants, en particulier un conducteur 2 assis sur le siège conducteur 6 et optionnellement des passagers, un passager 4 assis sur le siège passager 8 étant illustré à la figure 1.
Dans la suite de la description, le conducteur 2 est considéré être l’utilisateur du dispositif d’assistance vocale 1. En variante, il pourrait être prévu qu’au moins un des passagers, au moins le passager 4 situé à côté du conducteur puisse également utiliser le dispositif d’assistance vocale 1. Au besoin, certains dispositifs pourraient être doublés.
Le dispositif d’assistance vocale 1 comprend essentiellement une unité informatique 10, un appareil de prise de vues 12, un système de reconnaissance vocale 20 et une unité de commande 30.
Le système de reconnaissance vocale 20 comprend essentiellement un microphone 22 et un dispositif d’analyse 24. Le microphone 22 est destiné à recueillir des sons dans l’habitacle 40, en particulier les paroles du conducteur 2. Le microphone 22 transmet une information vocale au dispositif d’analyse 24 destiné à analyser l’information vocale. Dans le mode de réalisation illustré à la figure 1, le dispositif d’analyse 24 est distant du microphone 22 et de l’unité informatique 10. En variante, le dispositif d’analyse 24 pourrait être regroupé ou intégré à l’unité informatique 10. Selon une autre variante, le dispositif d’analyse 24 pourrait être regroupé ou intégré au microphone 22. Selon une autre variante, le système de reconnaissance vocale 20 pourrait comprendre en outre au moins un haut-parleur destiné à émettre des sons pour communiquer avec l’utilisateur.
Le système de reconnaissance vocale 20 présente un état actif et un état inactif, afin de réduire la consommation d’énergie électrique du dispositif d’assistance vocale 1 lorsque le conducteur 2 n’a pas usage du système de reconnaissance vocale 20. Lorsque le système de reconnaissance vocale 20 est dans l’état actif, le microphone 22 capte le son dans l’habitacle 40, en particulier la parole du conducteur 2, transmet l’information vocale au dispositif d’analyse 24 qui analyse l’information vocale afin de reconnaître une information de commande (parmi pluralité d’informations de commande préétablie) et optionnellement une clé de commande.
L’appareil de prise de vues 12 est dirigé vers le conducteur 2 afin de prendre des vues du conducteur 2, en particulier de la bouche 5 du conducteur 2. L’appareil de prise de vues 12 transmet des données d’images relatives aux vues prises à l’unité informatique 10. L’unité informatique 10 traite lesdites données d’images pour déterminer si le conducteur 2 parle, en particulier le traitement de l’unité informatique vise à détecter un mouvement de lèvres du conducteur 2. Lorsque l’unité informatique 10 détecte que le conducteur 2 parle, l’unité informatique 10 émet un signal d’activation 11 (représenté schématiquement à la figure 1) qui active le système de reconnaissance vocale 20 (le système de reconnaissance vocale est à l’état actif après réception du signal d’activation 11).
Le signal d’activation 11 peut être transmis de manière filaire ou nonfilaire de l’unité informatique vers le système de reconnaissance vocale 20. De même l’information vocale, les données d’images et plus généralement les échanges entre les différents éléments du dispositif d’assistance vocale peuvent s’effectuer de manière filaire ou non-filaire. Toutefois, pour réduire la consommation électrique, les échanges entre les différents éléments du dispositif d’assistance vocale 1 s’effectuent de préférence de manière filaire.
L’appareil de prise de vues 20 est de préférence une caméra infrarouge de manière à pouvoir obtenir des images satisfaisantes y compris en cas de faible lumière dans l’habitacle 40.
L’appareil de prise de vues 12 et l’unité informatique 10 forment un dispositif d’activation, dans la mesure où ils permettent d’activer le système de reconnaissance vocale 20.
L’unité de commande 30 est reliée en particulier au dispositif multimédia 42 et au dispositif d’aide à la navigation 44 pour agir sur le dispositif multimédia 42 et le dispositif d’aide à la navigation 44 en fonction des informations de commande détectées par le système de reconnaissance vocale 20.
Dans le mode de réalisation illustré, l’unité de commande 30 est distante du système de reconnaissance vocale 20 et de l’unité informatique 10. En variante, l’unité de de commande 30 et le système de reconnaissance vocale 20 et/ou l’unité informatique 10 pourraient être regroupés. L’unité de commande 30 pourrait même être intégrée au dispositif d’analyse 24 du système de reconnaissance vocale 20 ou à l’unité informatique 10.
Le dispositif d’assistance vocale 1 comprend en outre un détecteur de communication téléphonique 32 et un détecteur de présence 34 du passager 4 sur le siège passager 8 reliés tous les deux à l’unité informatique 10. De préférence, le véhicule 100 est équipé d’une interface apte à relier un téléphone 33 avec le dispositif multimédia système 42 pour diffuser les paroles d’un interlocuteur distant dans l’habitacle 40 lors d’une communication téléphonique utilisant le téléphone 33, et inversement capter les paroles du conducteur 2, notamment via le microphone 22 et les transmettre à l’interlocuteur. Le détecteur de communication téléphonique 32 transmet à l’unité informatique 10 un signal relatif à l’établissement d’une communication téléphonique via le téléphone 33.
Le détecteur de présence 34 est bien connu dans un véhicule et permet notamment d’alerter qu’un occupant du véhicule n’a pas verrouillé sa ceinture de sécurité.
Le dispositif d’assistance vocale 1 comprend enfin un bouton d’inhibition 36 et un bouton d’activation 38 reliés à l’unité informatique 10.
Le fonctionnement du dispositif d’assistance vocale 1 va être décrit plus précisément en relation avec le chronogramme illustré à la figure 2.
Lors de l’opération 52, par exemple lorsque le conducteur entre dans l’habitacle 40, le système de reconnaissance vocale 20 est de préférence dans l’état inactif et l’appareil de prise de vues 12 capture des images du conducteur 2 et transmet les données d’images à l’unité informatique 10.
Le test 53 consiste ensuite à déterminer si le conducteur parle en particulier à partir des données d’images et plus précisément à détecter un mouvement des lèvres du conducteur 2 à partir des données d’images transmises par l’appareil de prise de vies 12.
Lorsque le résultat du test 53 est affirmatif, il est procédé à l’opération 54, consistant à activer le système de reconnaissance vocale 20, puis capter la voix du conducteur 2 par l’intermédiaire du microphone 12 et analyser l’information vocale transmise par le microphone 12 au dispositif d’analyse 24.
Ensuite, le test 55 est optionnel et consiste à détecter une clé de commande dans l’information vocale transmise par le microphone 12 au dispositif d’analyse 24. La clé de commande consiste en un mot ou une suite de mots permettant de savoir que le conducteur 2 souhaite adresser ensuite une ou plusieurs informations de commande au dispositif d’assistance vocale 1.
Lorsque le résultat du test 55 est négatif, il est procédé à un test 65 en vue de déterminer si le temps écoulé depuis l’activation du système de reconnaissance vocale 20 à l’étape 54 est supérieur à une période d’activité prédéterminée. Lorsque le résultat du test 65 est négatif, l’opération 54 se poursuit. Lorsque le résultat du test 65 est positif, lors de l’opération 66 le système de reconnaissance vocale 20 est désactivé et il est ensuite procédé à nouveau à l’opération 52.
Lorsque le résultat du test 55 est affirmatif, il est procédé à l’opération 56, lors de laquelle la voix du conducteur 2 continue d’être captée par le microphone 12 et analysée par le dispositif d’analyse 24.
Le test 57 consiste à détecter une information de commande dans l’information vocale transmise par le microphone 12 au dispositif d’analyse 24.
Lorsque le résultat du test 57 est négatif, autrement dit lorsqu’aucune information de commande n’est détectée, il est procédé à un test 67 en vue de déterminer si le temps depuis lequel le test 57 est négatif est supérieur à une période d’attente prédéterminée. Lorsque le résultat du test 67 est négatif, l’opération 56 se poursuit. Lorsque le résultat du test 67 est positif, lors de l’opération 68 le système de reconnaissance vocale 20 est désactivé et il est ensuite procédé à nouveau à l’opération 52.
Dans le mode de réalisation illustré à la figure 2, il est prévu par simplification quatre informations de commande considérée comme une première commande d’un premier équipement, une deuxième commande du premier équipement, une première commande d’un deuxième équipement, une deuxième commande du deuxième équipement. Bien entendu, le nombre et la variété des informations de commande que le dispositif d’analyse 24 peut détecter est de préférence bien supérieure.
Si le test 57 détecte que l’information de commande émise par le conducteur 2 consiste à mettre en fonctionnement le dispositif multimédia 42, lors de l’opération 58 le dispositif de commande 30 commande la mise en fonctionnement du dispositif multimédia 42, puis il est procédé à l’opération 56. Si le test 57 détecte que l’information de commande émise par le conducteur 2 consiste à arrêter le fonctionnement du dispositif multimédia 42, lors de l’opération 60 le dispositif de commande 30 commande l’arrêt du fonctionnement du dispositif multimédia 42, puis il est procédé à l’opération 56. Si le test 57 détecte que l’information de commande émise par le conducteur 2 consiste à mettre en fonctionnement le dispositif d’aide à la navigation 44, lors de l’opération 62 le dispositif de commande 30 commande la mise en fonctionnement du dispositif d’aide à la navigation 44, puis il est procédé à l’opération 56. Si le test 57 détecte que l’information de commande émise par le conducteur 2 consiste à arrêter le fonctionnement du dispositif d’aide à la navigation 44, lors de l’opération 64 le dispositif de commande 30 commande l’arrêt du fonctionnement du dispositif d’aide à la navigation 44, puis il est procédé à l’opération 56.
D’autre part, quelle que soit l’opération en cours, si une communication téléphonique est détectée par le détecteur de communication téléphonique 32, si le détecteur de présence 34 détecte par la présence du passager 4 ou si le bouton d’inhibition 36 est actionné, le dispositif d’assistance vocale 1 est de préférence arrêté, ou du moins sont fonctionnement est tel que les informations de commande sont ignorées.
En revanche, si le bouton d’activation 38 est actionné, l’information transmise par le détecteur de communication téléphonique 32, le détecteur de 5 présence 34 et bouton d’inhibition 36 est ignorée, le dispositif d’assistance vocale 1 et en particulier le système de reconnaissance vocale 20 est activé et il est procédé à l’étape 56 en attente de la détection de l’information de commande lors du test 57.
Bien entendu l'invention n'est nullement limitée au(x) mode(s) de 10 réalisation décrit(s) à titre illustratif, non limitatif. Ainsi, après l’opération 58, le système de reconnaissance vocale 20 pourrait être désactivé et il pourrait être procédé ensuite à l’opération 52. De même, après l’opération 60, le système de reconnaissance vocale 20 pourrait être désactivé et il pourrait être procédé ensuite à l’opération 52.

Claims (11)

  1. REVENDICATIONS
    1. Procédé d’assistance vocale (1), comprenant les opérations successives suivantes :
    a) capturer des images d’un utilisateur (2) et traiter les images (52) jusqu’à détecter un mouvement de lèvres,
    b) en cas de détection de mouvement de lèvres (53), activer un système de reconnaissance vocale (20),
    c) capter (32) et analyser avec le système de reconnaissance vocale (20) une information vocale émise par l’utilisateur pour détecter la présence d’une information de commande dans l’information vocale (56), et
    d) en cas de détection d’information de commande (57), commander un équipement (42, 44) en fonction de l’information de commande (58, 60).
  2. 2 . Procédé d’activation selon la revendication 1 comprenant en outre :
    - détecter une commande d’inhibition (32, 34, 36), et
    - ignorer l’opération b), en cas de détection de la commande d’inhibition (32, 34, 36).
  3. 3. Procédé selon la revendication précédente comprenant l’opération suivante :
    - détecter une communication téléphonique (32) et considérer la détection comme commande d’inhibition.
  4. 4. Procédé selon la revendication 2 ou la revendication 3 comprenant l’opération suivante :
    - détecter (34) la présence d’une personne (4) autre que l’utilisateur (2) et considérer la détection comme une commande d’inhibition.
  5. 5. Procédé selon l’une quelconque des revendications 2 à 4 comprenant l’opération suivante :
    - détecter une commande manuelle d’inhibition (36) et considérer la commande manuelle d’inhibition comme commande d’inhibition.
  6. 6. Procédé selon l’une quelconque des revendications 2 à 5 comprenant l’opération suivante :
    - détecter une commande manuelle d’activation (38) et ignorer la commande d’inhibition.
  7. 7. Procédé selon l’une quelconque des revendications précédentes comprenant en outre entre l’opération b) et l’opération c), capter et analyser une information vocale émise par l’utilisateur jusqu’à détecter la présence d’une clé de commande dans l’information vocale (54).
  8. 8. Procédé selon l’une quelconque des revendications précédentes comprenant :
    - désactiver le système de reconnaissance vocale (66) en l’absence de détection d’information de commande pendant une durée supérieure à une période d’activité prédéterminée (65).
  9. 9. Dispositif d’assistance vocale (1) destiné à un véhicule (100) comprenant :
    - un système de reconnaissance vocale (20) présentant un état actif et un état inactif, dans l’état actif le système de reconnaissance vocale (20) étant apte à capter (22) et analyser (24) une information vocale d’un utilisateur, et à reconnaître (24) une pluralité d’informations de commande,
    - une unité de commande (30) apte à émettre un signal de commande destiné à commander un équipement (42, 44) en fonction de l’information de commande reconnue,
    - un dispositif d’activation apte à activer le système de reconnaissance vocale et comprenant :
    • un appareil de prise de vues (12), l’appareil de prise de vues (12) étant apte à prendre des vues de la bouche de l’utilisateur et à transmettre des données d’images relatives aux vues prises, et • une unité informatique (10) reliée à l’appareil de prise de vues (12) pour recevoir les données d’images, l’unité informatique (10) étant adaptée pour traiter lesdites données d’images, pour détecter un mouvement de lèvres de l’utilisateur et émettre un signal d’activation (11) lorsque le mouvement de lèvres de l’utilisateur est détecté, le dispositif d’assistance vocale étant apte à placer le système de reconnaissance vocale (20) dans l’état actif lorsque l’unité informatique (10) émet le signal d’activation (11).
  10. 10. Dispositif d’assistance vocale selon la revendication 9, dans lequel l’appareil de prise de vues est une caméra infrarouge.
    5 il. Dispositif d’assistance vocale selon la revendication 9 ou la revendication 10, dans lequel :
    - le système de reconnaissance vocale (20) comprend un dispositif d’analyse (24) apte à analyser l’information vocale, et
    - l’unité informatique (10), le dispositif d’analyse (24) et l’unité de 10 commande (30) sont intégrés dans une unique carte électronique.
  11. 12. Véhicule comprenant un dispositif d’assistance vocale selon l’une quelconque des revendications 9 à 11 et au moins un équipement, l’équipement réagissant en fonction du signal de commande.
FR1860636A 2018-11-16 2018-11-16 Procede d'assistance vocale, dispositif d'assistance vocale et vehicule comprenant le dispositif d'assistance vocale Active FR3088741B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1860636A FR3088741B1 (fr) 2018-11-16 2018-11-16 Procede d'assistance vocale, dispositif d'assistance vocale et vehicule comprenant le dispositif d'assistance vocale

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1860636A FR3088741B1 (fr) 2018-11-16 2018-11-16 Procede d'assistance vocale, dispositif d'assistance vocale et vehicule comprenant le dispositif d'assistance vocale

Publications (2)

Publication Number Publication Date
FR3088741A1 true FR3088741A1 (fr) 2020-05-22
FR3088741B1 FR3088741B1 (fr) 2021-03-05

Family

ID=66286403

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1860636A Active FR3088741B1 (fr) 2018-11-16 2018-11-16 Procede d'assistance vocale, dispositif d'assistance vocale et vehicule comprenant le dispositif d'assistance vocale

Country Status (1)

Country Link
FR (1) FR3088741B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160853A (zh) * 2021-03-31 2021-07-23 深圳鱼亮科技有限公司 一种基于实时人脸辅助的语音端点检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120304067A1 (en) * 2011-05-25 2012-11-29 Samsung Electronics Co., Ltd. Apparatus and method for controlling user interface using sound recognition
US20140214415A1 (en) * 2013-01-25 2014-07-31 Microsoft Corporation Using visual cues to disambiguate speech inputs
US20150109191A1 (en) 2012-02-16 2015-04-23 Google Inc. Speech Recognition
US20150161992A1 (en) * 2012-07-09 2015-06-11 Lg Electronics Inc. Speech recognition apparatus and method
US20170193996A1 (en) * 2013-05-24 2017-07-06 Google Technology Holdings LLC Method and Apparatus for Using Image Data to Aid Voice Recognition

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120304067A1 (en) * 2011-05-25 2012-11-29 Samsung Electronics Co., Ltd. Apparatus and method for controlling user interface using sound recognition
US20150109191A1 (en) 2012-02-16 2015-04-23 Google Inc. Speech Recognition
US20150161992A1 (en) * 2012-07-09 2015-06-11 Lg Electronics Inc. Speech recognition apparatus and method
US20140214415A1 (en) * 2013-01-25 2014-07-31 Microsoft Corporation Using visual cues to disambiguate speech inputs
US20170193996A1 (en) * 2013-05-24 2017-07-06 Google Technology Holdings LLC Method and Apparatus for Using Image Data to Aid Voice Recognition

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113160853A (zh) * 2021-03-31 2021-07-23 深圳鱼亮科技有限公司 一种基于实时人脸辅助的语音端点检测方法

Also Published As

Publication number Publication date
FR3088741B1 (fr) 2021-03-05

Similar Documents

Publication Publication Date Title
US10410634B2 (en) Ear-borne audio device conversation recording and compressed data transmission
US20130288744A1 (en) Cell Phone Security, Safety, Augmentation Systems, and Associated Methods
KR20180071426A (ko) 디지털 어시스턴트를 위한 음성 트리거
WO2017093439A1 (fr) Dispositif de commande vocale d'un appareil de capture d'images
KR20160055915A (ko) 음성 보조 기능을 활성화하는 검출 임계값을 조정하는 방법 및 장치
US11250117B2 (en) Methods and systems for fingerprint sensor triggered voice interaction in an electronic device
US20090167516A1 (en) Look-away detecting device, method and program
US11437031B2 (en) Activating speech recognition based on hand patterns detected using plurality of filters
EP1257146A2 (fr) Procédé et sytème de traitement de son
FR3088741A1 (fr) Procede d'assistance vocale, dispositif d'assistance vocale et vehicule comprenant le dispositif d'assistance vocale
EP3729420B1 (fr) Dispositif et procede d'assistance vocale
US9998577B1 (en) Method and apparatus for managing noise levels using push-to-talk event activated vibration microphone
US9148501B2 (en) Systems and methods for hands-off control of a mobile communication device
US20190327555A1 (en) Audio pickup and play circuit and system, and method for switching audio pickup and play
FR3032575A1 (fr) Procede de communication d'un message vocal comprenant une etape d'affichage d'une transcription du message vocal et d'un identifiant d'un appelant prealablement determine et dispositif pour sa mise en oeuvre
US10997975B2 (en) Enhanced vehicle key
US20160150065A1 (en) Transmission of data pertaining to use of speaker phone function and people present during telephonic communication
FR3097364A1 (fr) Architecture de traitement de signal pour détecter un mot-clé d’activation dans un signal audio, procédé de gestion d’un assistant numérique personnel l’utilisant, et véhicule automobile l’incorporant
EP3554102A1 (fr) Procédé d' établissement automatique d'une connexion sans fil entre un terminal mobile et un calculateur multimédia d'un véhicule
US11735159B2 (en) Voice output device and voice output method
FR3095884A1 (fr) Procédé et système pour gérer une fonctionnalité de surveillance fournie par un assistant personnel virtuel d’un véhicule automobile
CN115002598B (zh) 耳机模式控制方法、耳机设备、头戴式设备及存储介质
US11423670B2 (en) Vehicle occupant detection system
EP4062401B1 (fr) Dispositif pour mettre en oeuvre un assistant personnel virtuel dans un véhicule automobile avec contrôle par la voix d'un utilisateur, et véhicule automobile l'incorporant
US20220319502A1 (en) Determining whether an acoustic event originated inside or outside a vehicle

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20200522

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6