FR3044784A1 - Dispositif de commande vocale d'un appareil de capture d'images - Google Patents

Dispositif de commande vocale d'un appareil de capture d'images Download PDF

Info

Publication number
FR3044784A1
FR3044784A1 FR1561701A FR1561701A FR3044784A1 FR 3044784 A1 FR3044784 A1 FR 3044784A1 FR 1561701 A FR1561701 A FR 1561701A FR 1561701 A FR1561701 A FR 1561701A FR 3044784 A1 FR3044784 A1 FR 3044784A1
Authority
FR
France
Prior art keywords
user
instruction
image capture
voice
control device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1561701A
Other languages
English (en)
Other versions
FR3044784B1 (fr
Inventor
Sebastien Ricarde
Cedric Michon
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to FR1561701A priority Critical patent/FR3044784B1/fr
Priority to PCT/EP2016/079504 priority patent/WO2017093439A1/fr
Publication of FR3044784A1 publication Critical patent/FR3044784A1/fr
Application granted granted Critical
Publication of FR3044784B1 publication Critical patent/FR3044784B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Studio Devices (AREA)

Abstract

La présente invention concerne un dispositif de commande (1) d'un appareil de capture d'images (100), caractérisé en ce qu'il comprend : • une entrée (E1) pour recevoir une instruction vocale donnée par un utilisateur (2), et une sortie (S1) pour fournir ladite instruction vocale sous la forme d'une instruction de commande à l'appareil de capture d'images (100), • une entrée (E2) pour recevoir un retour d'information de l'appareil de capture d'images (100), et une sortie (S2) pour fournir ledit retour d'information sous la forme d'une réponse vocale à l'utilisateur (2). Le dispositif de commande (1) est tout particulièrement, mais non exclusivement, adapté à la pratique sportive, en particulier à la pratique de sports extrêmes nécessitant une attention visuelle permanente de l'utilisateur sur son environnement.

Description

DISPOSITIF DE COMMANDE VOCALE D’UN APPAREIL DE CAPTURE D’IMAGES [Domaine technique de l’inventionl [0001] L’invention concerne un dispositif de commande vocale d’un appareil de capture d’images de type appareil photo ou caméra vidéo par exemple. Plus particulièrement, le dispositif de commande selon l’invention permet à l’utilisateur de dialoguer vocalement avec un appareil de capture d’images, de sorte que le dispositif de commande sert d’interface de dialogue vocal entre l’utilisateur et l’appareil de capture d’images.
[Art antérieur] [0002] Les appareils de capture d’images, de type appareil photos ou caméra par exemple, tendent à évoluer vers une simplification de leur utilisation, notamment en réduisant le nombre de boutons associés à des fonctions diverses de l’appareil. C’est dans ce but que des appareils de capture d’images à reconnaissance vocale ont été développés. L’utilisateur peut donner une instruction à l’appareil, comme par exemple prendre une photo ou démarrer l’enregistrement d’une vidéo, afin que l’appareil exécute la fonction de l’appareil correspondant à l’instruction de l’utilisateur, et ce sans qu’il soit nécessaire à l’utilisateur de naviguer manuellement dans des menus plus ou moins complexes au moyen notamment de boutons ou d’icônes tactiles prévus sur le boîtier de l’appareil, ou qui s’affichent sur un écran tactile prévu à cet effet.
[0003] Ce processus de reconnaissance vocale appliqué aux appareils de capture d’images est illustré dans le document EP 1 014 338. L’utilisateur donne une instruction vocale à l’appareil, puis par un procédé de traitement du signal et ultérieurement de comparaison des informations du signal traité à des informations préenregistrées dans la mémoire de l’appareil et permettant de le faire fonctionner, ledit appareil exécute la fonction correspondant à l’instruction donnée par l’utilisateur.
[0004] Ce type d’appareil de capture d’images présente cependant l’inconvénient de ne pas informer l’utilisateur en retour, si bien que l’utilisateur ne sait pas si l’instruction a été exécutée ou non. Afin de résoudre ce problème, le document US 5,027,149 propose un appareil de capture d’images à reconnaissance vocale dont les instructions sont données à l’appareil par l’utilisateur puis traitées et exécutées de manière similaire aux appareil décrits précédemment, mais qui en outre permet de faire un retour à l’utilisateur quant à l’exécution de la fonction correspondant à l’instruction de l’utilisateur, ce retour consistant en l’affichage sur l’écran de l’appareil d’un symbole caractéristique de la fonction exécutée.
[0005] Si l’utilisateur à un accès limité ou qu’il ne peut pas accéder à l’écran de l’appareil ou plus généralement à l’appareil lui-même, il lui est difficile voire impossible de vérifier qu’une instruction qu’il a donnée à l’appareil a bien été exécutée, ou même préalablement à cela, de donner une instruction audit appareil.
[0006] Cet aspect déjà contraignant pour une utilisation simple de l’appareil de capture d’images, peut s’avérer dangereux voire rédhibitoire dans le cas particulier des sports extrêmes où l’utilisateur porte généralement l’appareil de prise d’images au niveau de sa tête et donc ne peut pas regarder l’écran de l’appareil. Dès lors, pour donner une instruction, il est amené à appuyer sur le bouton correspondant sans le voir, situation déjà difficile qui devient encore plus contraignante lorsque l’utilisateur porte des gants qu’il doit alors retirer, ou à crier pour que l’instruction soit comprise par l’appareil. De même, pour s’assurer de l’exécution de l’instruction, il est souvent amené à s’arrêter pour retirer et inspecter l’appareil, ou à demander à une autre personne ce qui nécessite qu’il soit accompagné.
[Problème technique] [0007] L’invention a donc pour but de remédier aux inconvénients de l’art antérieur en proposant un dispositif de commande d’un appareil de capture d’images, tel qu’un appareil photo ou une caméra vidéo par exemple, permettant à un utilisateur de donner une instruction à l’appareil de capture d’images et de recevoir un retour dudit appareil l’informant sans équivoque et sans prise de risque de l’état d’exécution de l’instruction pendant la pratique d’une activité ne permettant pas une vérification visuelle de l’appareil de capture d’images.
[0008] L’invention vise également à proposer un dispositif de commande d’un appareil de capture d’images permettant d’éviter tout contact physique ou visuel entre l’utilisateur et l’appareil de capture d’images lorsque l’utilisateur donne une instruction et lorsqu’il vérifie l’exécution de l’instruction par ledit appareil de capture d’images. Le dispositif de commande selon l’invention a notamment pour but d’éviter que l’utilisateur ne doive prendre en main ou regarder l’écran de l’appareil de capture d’images pour donner une instruction et pour vérifier l’exécution de l’instruction par ledit appareil.
[0009] L’invention vise en outre à proposer un dispositif de commande d’un appareil de capture d’images permettant de renseigner précisément l’utilisateur sur le type de fonction exécutée par ledit appareil de capture d’images.
[Brève description de l’inventionl [0010] A cet effet, l’invention a pour objet un dispositif de commande d’un appareil de capture d’images, principalement caractérisé en ce qu’il comprend : • une entrée (E-ι) pour recevoir une instruction vocale donnée par un utilisateur, et une sortie (Si) pour fournir ladite instruction vocale sous la forme d’une instruction de commande à l’appareil de capture d’images, • une entrée (E2) pour recevoir un retour d’information de l’appareil de capture d’images, et une sortie (S2) pour fournir ledit retour d’information sous la forme d’une réponse vocale à l’utilisateur.
[0011] Selon d’autres caractéristiques optionnelles du dispositif : - Le dispositif comprend un moyen de mémorisation, et un ou plusieurs module(s) de reconnaissance vocale permettant de comparer l’instruction vocale de l’utilisateur à une ou plusieurs instruction(s) préenregistrée(s) dans le moyen de mémorisation du dispositif de commande ; - Il comprend également une unité de commande apte à générer une instruction de commande pour l’appareil de capture d’images lorsque l’instruction vocale de l’utilisateur correspond à au moins une instruction préenregistrée ; - Il comprend en outre un système de configuration piloté par l’unité de commande, permettant de régler les paramètres de fonctionnement du dispositif de commande et de l’appareil de capture d’images à partir d’une ou plusieurs instruction(s) vocale(s) de l’utilisateur ; - Le dispositif comprend plusieurs niveaux de configuration, chaque niveau consistant en une pluralité de paramètres réglables, de sorte que les paramètres d’un niveau donné sont liés aux paramètres du niveau précédent et précisent lesdits paramètres du niveau précédent ; - Le dispositif se présente avantageusement sous la forme d’un boîtier portatif muni d’un microphone et d’une oreillette, filaires ou sans fils. Ce boîtier est de préférence apte à se fixer au casque de l’utilisateur. De manière davantage préférée, le dispositif se présente sous la forme d’un kit main libre fixé à l’oreille de l’utilisateur ; - Le dispositif est connecté à l’appareil de capture d’images par une liaison sans fil grâce à un module de communication choisi de préférence parmi : les modules utilisant le standard de communication Bluetooth, les modules Wi-Fi, ou encore des modules utilisant les ondes radiofréquence ou infrarouge ; - Le dispositif comprend une batterie rechargeable permettant de l’alimenter en énergie électrique ; - Le dispositif selon l’invention s’applique tout particulièrement à la commande d’un appareil de capture d’images fixé au casque de l’utilisateur.
[0012] D’autres avantages et caractéristiques de l’invention apparaîtront à la lecture de la description suivante donnée à titre d’exemple illustratif et non limitatif, en référence aux Figures annexées qui représentent : • La Figure 1, un organigramme des différents éléments du dispositif de commande selon l’invention, • La Figure 2, un organigramme fonctionnel illustrant le fonctionnement du dispositif de commande selon l’invention.
[Description détaillée de l’inventionl [0013] L’invention concerne un dispositif de commande 1 d’un appareil de capture d’images 100. Par «appareil de capture d’images», on désigne tout appareil permettant de capturer une image sur un support physique ou numérique. Un appareil de capture d’images au sens de l’invention désigne tout particulièrement un appareil photographique ou une caméra.
[0014] Le dispositif de commande 1 selon l’invention joue le rôle d’une interface de dialogue vocal entre l’utilisateur 2 et l’appareil de capture d’images 100, en ce qu’il permet de recevoir une instruction vocale de la part de l’utilisateur concernant la réalisation de la capture d’image, de transmettre cette instruction à l’appareil de capture d’images sous la forme d’une commande fonctionnelle exécutée par ledit appareil, puis de faire un retour à l’utilisateur sous la forme d’une réponse vocale, afin d’informer ce dernier de l’exécution de la fonction correspondant à l’instruction vocale donnée initialement. L’utilisateur peut dès lors savoir si la fonction correspondant à son instruction a été réalisée, si elle est en cours de réalisation, ou encore si elle n’a pas pu être exécutée pour une quelconque raison. Il peut également être informé le cas échéant que son instruction vocale n’a pas été reconnue par le dispositif de commande.
[0015] L’invention permet ainsi à l’utilisateur 2 de dialoguer vocalement avec le dispositif de commande 1, et par extension avec l’appareil de capture d’images 100. Ce dialogue est « vocal » en ce qu’il consiste en des instructions et des informations orales sous la forme d’un ou de plusieurs mots de langage. Ce langage comprend notamment toute langue parlée connue, telle que l’anglais, le français, ou le chinois par exemple.
[0016] Le dispositif de commande 1 se présente avantageusement sous la forme d’un boîtier portatif muni d’un microphone 10 et d’une oreillette 21, de préférence un boîtier portatif étanche. On préférera tout particulièrement un boîtier apte à se fixer au bras de l’utilisateur 2 à la manière d’un bracelet, ou à son oreille à la manière d’un kit main libre ou à un casque, et dont le microphone est situé au voisinage de la bouche de l’utilisateur. Selon une variante de réalisation, le dispositif de commande 1 peut être totalement intégré à un casque, comme élément constitutif de ce dernier, afin d’améliorer le niveau de confort et de sécurité de l’utilisateur. Il peut être mis en fonctionnement ou arrêté grâce à un bouton ON/OFF, et comprend avantageusement un élément lumineux, tel qu’une LED par exemple, allumé lorsque le dispositif de commande est en fonctionnement, et éteint lorsqu’il est arrêté.
[0017] Le dispositif de commande 1 est connecté à l’appareil de capture d’images 100 par une liaison filaire ou sans fil, par l’intermédiaire d’un module de communication 18. Dans l’optique d’une commande à distance de l’appareil de capture d’images par le dispositif de commande, on choisira de préférence une liaison sans fil, le module de communication étant choisi préférentiellement parmi les modules utilisant le standard de communication Bluetooth, les modules Wi-Fi, ou encore des modules utilisant les ondes radiofréquence ou infrarouge, selon les caractéristiques de l’appareil de capture d’images. Le module de communication permet en particulier de recevoir des mises à jour logicielles d’un ordinateur, ou de tout dispositif informatique équivalent, connecté au dispositif de commande.
[0018] Le dispositif de commande 1 comprend une unité de commande 14, se présentant de préférence sous la forme d’un microcontrôleur, permettant de piloter l’ensemble des éléments du dispositif de contrôle, parmi lesquels des moyens pour générer un signal à partir d’une l’instruction vocale de l’utilisateur, et pour traiter ledit signal, préalablement à sa transmission à l’unité de commande 14 et à l’appareil de capture d’images 100. Ces moyens comprennent un circuit de silencieux 11, un convertisseur analogique-numérique 12, un processeur de signal numérique 13, « Digital Signal Processor (DSP) » en anglais, et un ou plusieurs module(s) de reconnaissance vocale 16. Le dispositif de commande 1 comprend également un moyen de mémorisation telle qu’une mémoire volatile de type RAM par exemple. De préférence, le moyen de mémorisation comprend un moyen de mémorisation 15 de l’unité de commande avec lequel communique l’unité de commande 14, et un moyen de mémorisation 17 du module de reconnaissance vocale avec lequel communique le module de reconnaissance vocale 16.
[0019] L’unité de commande 14 transmet le signal ainsi traité et reconnu par le module de reconnaissance vocale 16 à l’appareil de capture d’images sous la forme d’une instruction de commande. Une fois la fonction correspondante exécutée par l’appareil de capture d’images, l’unité de commande reçoit un retour d’informations dudit appareil et génère un signal de retour contenant les informations vocales à fournir à l’utilisateur.
[0020] Le dispositif de commande 1 comprend également des moyens pour traiter le signal de retour et transmettre ledit signal de retour sous la forme d’une réponse vocale à l’utilisateur. Ces moyens comprennent un convertisseur numérique analogique 19, un amplificateur audio 20, et une sortie audio, telle qu’une oreillette 21 par exemple.
[0021] Le module de reconnaissance vocale 16 peut être autonome ou piloté par l’unité de commande 14. Il permet de développer des applications pour la reconnaissance vocale. Il permet notamment de comparer l’instruction vocale de l’utilisateur à des instructions préenregistrées, qui sont stockées dans le moyen de mémorisation 15,17 du dispositif de commande, et de préférence dans son moyen de mémorisation 17.
[0022] Le module de reconnaissance vocale 16 est programmé de manière classique au moyen d’un ordinateur muni d’un logiciel adapté et connecté via le module de communication 18 à l’unité de commande 14. La programmation du module de reconnaissance vocale consiste à enregistrer, par le biais du logiciel, des instructions vocales dans le moyen de mémorisation 17 du module. La programmation du module de reconnaissance vocale est réalisée par défaut par le constructeur lors de la fabrication du dispositif de commande 1. Le moyen de mémorisation 17 comprend alors des instructions préenregistrées par le fabricant. L’utilisateur peut par la suite modifier ces instructions pour en enregistrer de nouvelles en programmant lui-même le module de reconnaissance vocale 16. Il peut à cette fin utiliser le système de configuration 22 décrit plus en détail dans la suite du présent texte.
[0023] Par ailleurs, le module de reconnaissance vocale 16 peut permettre une reconnaissance vocale de l’utilisateur de type « mono-locuteur » ou « multi-locuteur ».
[0024] Dans le cas d’une reconnaissance vocale de type « mono-locuteur », la reconnaissance vocale est établie lorsque l’instruction donnée par un utilisateur correspond à au moins une instruction préenregistrée par ce même utilisateur. Par extension, il est possible de prévoir que plusieurs utilisateurs préenregistrent chacun une ou plusieurs instructions. De manière analogue, la reconnaissance vocale est établie lorsque l’instruction donnée par un des utilisateurs correspond à au moins une instruction préenregistrée par ce même utilisateur.
[0025] La reconnaissance vocale mono-locuteur permet notamment de sécuriser le dispositif de commande 1 en restreignant le nombre d’utilisateurs pouvant s’en servir. Cette application permet également d’éviter qu’une fonction de l’appareil de capture d’images 100 ne soit exécutée lorsqu’un tiers donne par inadvertance une instruction au dispositif de commande.
[0026] Afin que la voix de l’utilisateur soit reconnue spécifiquement lorsqu’il donne une instruction au dispositif de commande 1, le module de reconnaissance vocale comprend une fonction d’apprentissage de la voix que l’utilisateur peut activer. Lorsque l’utilisateur donne une instruction au dispositif de commande et que la fonction d’apprentissage de la voix est activée, son profil de voix devient de plus en plus détaillé au fur et à mesure des instructions vocales qu’il donne audit dispositif. Ainsi, la voix de l’utilisateur est mieux comprise par le dispositif de commande et ce dernier peut fonctionner de manière optimale même dans un milieu bruyant. L’apprentissage de la voix peut se faire au fur et à mesure de l’utilisation du dispositif de commande, ou de manière accélérée par des répétitions successives d’une instruction sur un temps défini.
[0027] Dans le cas d’une reconnaissance vocale de type « multi-locuteur », la reconnaissance vocale est établie lorsque l’instruction donnée par un utilisateur correspond à au moins une instruction préenregistrée, sans distinction d’utilisateur.
[0028] L’utilisateur 2 peut choisir que la reconnaissance vocale soit de type monolocuteur ou multi-locuteur grâce au système de configuration 22. Il peut aussi choisir, par l’intermédiaire du système de configuration 22, lorsque la reconnaissance vocale est de type mono-locuteur, que la fonction d’apprentissage de la voix soit active ou non. Il peut aussi paramétrer via le système de configuration le nombre de répétitions successives d’une instruction par exemple, lorsque l’apprentissage de la voix est réalisé de manière accélérée.
[0029] Le dispositif de commande 1 fonctionne de préférence avec une batterie 23, qui peut être rechargée à l’aide d’un cordon permettant de brancher le dispositif de commande à une source d’énergie électrique. Un système de contrôle de charge peut être incorporé au dispositif de commande, de manière à alerter l’unité de commande 14 lorsque la charge de la batterie passe en-dessous d’un seuil prédéterminé. Le dispositif de commande 1 délivrera à son tour, par le biais de l’unité de commande 14, une réponse vocale à l’utilisateur l’informant de la charge critique de la batterie.
[0030] Dans la suite du présent texte et par mesure de simplification, la Figure 2 qui représente un organigramme fonctionnel illustrant le fonctionnement du dispositif de commande selon l’invention est décrite simultanément à la Figure 1.
[0031] Dans un premier temps, l’utilisateur donne une instruction vocale (Ei, étape 200) au dispositif de commande 1 par l’intermédiaire du microphone 10. Le microphone capte cette instruction vocale et génère un signal analogique Sai (étape 201) . Simultanément à l’instruction de l’utilisateur, le microphone 10 capte tous les sons ambiants, qui ne sont pas destinés à être traités par le dispositif de commande 1. Un circuit de silencieux 11, aussi appelé « squelch circuit » en anglais, est prévu à la sortie du microphone 10 et permet de supprimer le signal en sortie du microphone en l’absence du signal correspondant à l’instruction de l’utilisateur, ou lorsque ce dernier est de trop faible amplitude. L’amplitude minimale de référence prévue par le circuit de silencieux 11 pour le passage du signal correspondant à l’instruction de l’utilisateur est connue et réglée par le constructeur lors de la fabrication du dispositif de commande 1. Le circuit silencieux 11 permet d’éviter au dispositif d’analyser en permanence tous les sons captés par le microphone 10, et réduit ainsi la consommation énergétique du dispositif de commande 1.
[0032] A l’étape 202, le signal analogique Sai est converti en signal numérique Sni par le convertisseur analogique-numérique 12. Cette étape de conversion comprend classiquement une étape de filtrage et une étape d’échantillonnage du signal analogique. Le signal numérique Sni est alors traité par le processeur de signal numérique 13, aussi appelé « Digital Signal Processor (DSP) en anglais, qui isole la voix de l’utilisateur et supprime le bruit de fond afin que le signal Sni puisse être utilisé ultérieurement de manière optimale par le module de reconnaissance vocale 16. Le bruit de fond peut être par exemple le bruit d’un moteur, du vent, ou encore d’une cascade. Le processeur de signal numérique 13 se base classiquement sur un algorithme de dé-bruitage, selon une méthode bien connue de l’homme du métier. On citera à titre d’exemple la méthode de soustraction spectrale pour réaliser la suppression du bruit de fond.
[0033] Le signal Sni est ensuite reçu par le module de reconnaissance vocale 16. Ce dernier compare, à l’étape 203, le signal Sni correspondant à l’instruction de l’utilisateur, au signal Se correspondant à une instruction préenregistrée, stockée dans son moyen de mémorisation 17.
[0034] Selon un mode de fonctionnement courant, le module de reconnaissance vocale 16 réalise une série de transformées du domaine de fréquence à partir du signal Sni qu’il reçoit de l’unité de commande 16, afin de générer des trames ou motifs de reconnaissance (généralement désignées en anglais par « récognition patterns ») qu’il compare avec les trames ou motifs des instructions préenregistrées. Cette étape consiste classiquement en une série de transformées de Fourier.
[0035] Selon un premier cas (O), si le signal Sni de l’instruction vocale correspond au signal Se d’au moins une instruction préenregistrée, l’unité de commande 14 génère un signal de commande Sc correspondant à l’instruction préenregistrée reconnue (étape 204), puis transmet ledit signal de commande Sc, par le biais du module de communication 18, à l’appareil de capture d’images qui exécute alors la commande correspondante (Si, étape 205).
[0036] L’appareil de capture d’images exécute la commande puis envoie un retour d’information à l’unité de commande 14 (E2, étape 206) via le module de communication 18 renseignant cette dernière sur l’exécution de la commande. Le retour d’informations peut signaler que la commande a été exécutée, qu’elle est en cours d’exécution, ou encore qu’elle n’a pas pu être exécutée, selon la nature de l’instruction de l’utilisateur.
[0037] A partir du retour d’information, l’unité de commande 14 génère un signal numérique Sn2 (étape 207) préenregistré dans le moyen de mémorisation 15 de l’unité de commande, contenant les informations d’exécution de la commande à fournir à l’utilisateur 2. Ce signal numérique S^est converti en signal analogique Sa2 par le convertisseur numérique-analogique 19 à l’étape 208.
[0038] Le signal analogique Sa2 en sortie du convertisseur numérique-analogique 19 est ensuite amplifié par l’amplificateur audio 20 puis communiqué à l’utilisateur sous la forme d’une réponse vocale par l’oreillette 21 (S2, étape 209). L’utilisateur peut ajuster le volume sonore de l’oreillette à l’aide d’un bouton prévu à cet effet sur ladite oreillette.
[0039] La réponse vocale informe l’utilisateur 2 que son instruction a été exécutée, ou qu’elle est en cours d’exécution, ou encore qu’elle n’a pas pu être exécutée par l’appareil de capture d’images. Par exemple, si l’utilisateur souhaite augmenter la résolution de l’image, il peut donner l’instruction « Résolution supérieure ». La réponse vocale qu’il reçoit peut être « Résolution image augmentée » pour lui indiquer que la résolution de l’image est passée au niveau supérieur, ou « Résolution en cours » pour lui indiquer que la résolution est en train d’être augmentée (en particulier lorsque l’augmentation du niveau de résolution est importante), ou encore « Résolution au maximum » pour lui indiquer que la résolution n’a pas pu être modifiée car elle est déjà à son niveau maximal. De manière analogue, si l’utilisateur souhaite commencer à enregistrer une vidéo, il peut donner l’instruction « vidéo ». La réponse vocale qu’il reçoit peut être « Film débuté » pour lui indiquer que l’appareil de capture d’images a commencé l’enregistrement d’une vidéo, ou « Une vidéo est en cours d’exécution » pour lui indiquer que l’appareil de capture d’images est déjà en train d’enregistrer une vidéo.
[0040] Selon un deuxième cas (N), si le signal Sni de l’instruction vocale ne correspond pas au signal Se d’au moins une instruction préenregistrée, alors le module de reconnaissance vocale 16 en informe l’unité de contrôle 14 qui génère un signal numérique Sn3 (étape 210) qui est converti en signal analogique Sa3 par le convertisseur numérique-analogique 19 (étape 211), puis amplifié par l’amplificateur audio 20, avant d’être délivré à l’utilisateur sous forme d’une réponse vocale (étape 212) à l’utilisateur 2. La réponse vocale peut être par exemple « instruction inconnue » et informe l’utilisateur que son instruction n’est pas reconnue, et qu’ainsi aucune commande n’a été transmise par l’unité de commande 14 à l’appareil de capture d’images 100, ni exécutée parce dernier.
[0041] Il s’agit par exemple d’une situation où l’instruction vocale n’a pas été préalablement enregistrée. Ce deuxième cas inclut également la situation où le signal Sni issu de l’instruction vocale d’un utilisateur prédéterminé ne correspond pas au signal Se d’une instruction préenregistrée par ce même utilisateur prédéterminé, lorsque la reconnaissance vocale est de type mono-locuteur.
[0042] Bien évidemment, l’utilisateur peut choisir de ne pas recevoir de réponse vocale dans le deuxième cas (N) en choisissant les paramètres correspondants dans le système de configuration 22. Il peut en effet être désagréable à l’utilisation de recevoir un message de type « instruction inconnue » alors que l’utilisateur discute simplement avec une autre personne.
[0043] Quelques exemples non limitatifs d’instructions vocales et de réponses vocales associées sont listés ci-dessous : - « Allumer » permet d’allumer/de mettre en fonctionnement l’appareil de capture d’images 100 lorsque ce dernier est éteint. «Appareil de capture d’images allumé » confirme sa mise en fonctionnement. - «Eteindre» permet d’éteindre/d’arrêter l’appareil de capture d’images 100 lorsque ce dernier est allumé. « Appareil de capture d’images éteint » confirme l’arrêt. L’appareil de capture d’images peut être automatiquement éteint par le dispositif de commande 1 après un certain délai de non utilisation. Ce délai est fixé par le constructeur lors de la fabrication du dispositif de commande 1, mais peut être modifié en utilisant le système de configuration 22 décrit dans la suite. - « Photo » commande à l’appareil de capture d’images 100 de prendre une photo. « Photo prise » confirme la prise de la photo. - «Vidéo» commande à l’appareil de capture d’images 100 de démarrer l’enregistrement d’un film. « Film débuté » confirme le début de l’enregistrement. - «Stop» commande à l’appareil de capture d’images 100 d’arrêter l’enregistrement du film. « Film terminé » confirme l’arrêt de l’enregistrement. - « Balise » commande à l’appareil de capture d’images 100 d’insérer une balise vidéo pendant l’enregistrement d’un film pour retrouver plus facilement un passage choisi de du film. « Balise insérée » confirme l’insertion de la balise. - « Rafale » commande à l’appareil de capture d’images 100 de prendre une rafale de photos. « Rafale terminée » confirme la prise de la rafale de photos. - « Batterie » permet d’interroger l’appareil de capture d’images 100 sur l’état de la batterie et connaître l’autonomie restante. «Batterie à 15% » indique à l’utilisateur le pourcentage restant de 15%. « 1 heure restante, recharger la batterie » indique à l’utilisateur qu’il doit recharger la batterie du fait d’une autonomie restante faible. - « Mémoire » permet d’interroger l’appareil de capture d’images 100 sur le taux de remplissage de sa mémoire, et en particulier l’espace de stockage restant avant que sa mémoire soit remplie. « 1.2 Giga octets disponible » indique à l’utilisateur qu’il à l’utilisateur 1.2 Giga octet de mémoire libre. - «Localiser» commande à l’appareil de capture d’images 100 d’activer un signal sonore afin de faciliter sa localisation en cas de perte. - « Connecter » commande au dispositif de commande 1 de rechercher un appareil de capture d’images 100 ou un ordinateur, et de réaliser la connexion/le jumelage avec celui-ci. « Aucun appareil connecté » informe l’utilisateur qu’aucun appareil n’a été trouvé et/ou qu’aucune connexion n’est possible. « Appareil de capture d’images connecté » informe l’utilisateur que le dispositif de commande est connecté à un appareil de capture d’images. - « Configurer » permet à l’utilisateur 2 d’accéder au menu de configuration du dispositif de commande 1. « Menu Configurer » confirme à l’utilisateur qu’il se trouve dans le menu de configuration du dispositif de commande.
[0044] Selon une première caractéristique, le système de configuration 22 permet de régler les différents paramètres de fonctionnement du dispositif de commande 1 et de l’appareil de capture d’images 100. Il permet avantageusement de programmer le module de reconnaissance vocale 16. L’utilisateur 2 peut accéder au système de configuration en prononçant l’instruction vocale correspondante, par exemple « Configurer », ou en appuyant sur un bouton prévu à cet effet sur le dispositif de commande 1.
[0045] Selon une deuxième caractéristique, le système de configuration 22 permet de guider l’utilisateur afin qu’il puisse donner une instruction vocale correspondant à une instruction préenregistrée et donc reconnaissable par le dispositif de commande 1, pour que l’appareil de capture d’images 100 exécute la fonction correspondante. Cette caractéristique est particulièrement utile notamment dans le cas où l’utilisateur 2 ne connaît pas, ou ne se rappelle plus de l’instruction à donner au dispositif de commande. On précisera que l’utilisation du système de configuration 22 n’est pas impérative. Si l’utilisateur connaît l’instruction vocale correspondant au réglage souhaité, et que l’instruction préenregistrée correspondante est stockée dans la mémoire du dispositif de commande, l’utilisateur peut simplement prononcer cette l’instruction vocale.
[0046] A cette fin, le système de configuration 22 fonctionne de préférence selon un mode « pas à pas » comprenant plusieurs niveaux de configuration, chaque niveau étant plus précis que le précédent. La description suivante présente le cas où le système de configuration propose deux niveaux de configuration.
[0047] Lorsque l’utilisateur active le système de configuration, celui-ci propose oralement plusieurs paramètres réglables de niveau 1 dits « paramètres primaires ». Les instructions correspondantes comprennent par exemple : - ai) « Pour changer la résolution des photos ou des vidéo, dites : Résolution ». - bi) « Pour changer l’angle de vue, dites : Angle de vue ». - c-ι) « Pour connecter le dispositif à un appareil de capture d’images, dites : Connecter ». - d-ι) « Pour configurer le mode rafale, dites : Mode rafale ». - e-ι) « Pour utiliser l’application d’apprentissage de la voix, dites : Apprentissage ».
[0048] Une fois que l’utilisateur a prononcé une instruction correspondant à un paramètre réglable de niveau 1, le système de configuration propose oralement plusieurs paramètres réglables de niveau 2 dits « paramètres secondaires » liés respectivement aux paramètres primaires a-i), b-ι), c-i), d-ι), et e-ι) de niveau 1 décrits précédemment : - a2) « Pour changer la résolution des photos, dites : Photo ». - b2) « Préciser la valeur numérique de l’angle de vue ». - C2) « Pour confirmer la connexion à l’appareil, dites : Confirmer ». - d2) « Indiquer le nombre d’itérations dans une rafale ». - e2) « Indiquer le nombre d’utilisateur(s) ».
[0049] De manière avantageuse, le système de configuration peut proposer à l’utilisateur d’enregistrer ces paramètres en tant que paramètres « par défaut » du dispositif de commande 1 et de l’appareil de capture d’images 100, dans le moyen de mémorisation 15 de l’unité de commande, en donnant l’instruction correspondante, par exemple « Enregistrer ».
[0050] Ces paramètres par défaut peuvent s’appliquer à chaque nouvelle mise en fonctionnement du dispositif de commande 1, ou suite à une instruction vocale de l’utilisateur pour la mise en place de ces paramètres, telle que « Réglages par défaut » par exemple. Lorsque l’utilisateur 2 met le dispositif de commande 1 en fonctionnement ou donne l’instruction vocale concernant les réglages par défaut, l’unité de commande 14 paramètre automatiquement les éléments du dispositif de commande 1 et de l’appareil de capture d’images 100, en accord avec les réglages par défaut.
[0051] Lorsqu’un ou plusieurs paramètres ont été réglés, le système de configuration 22 le signale à l’unité de commande 14 qui génère un signal aboutissant à une réponse vocale pour l’utilisateur 2, qui est ainsi informé du réglage effectué.
[0052] Le dispositif de commande qui vient d’être décrit est tout particulièrement, mais non exclusivement, adapté à la pratique sportive, en particulier à la pratique de sports extrêmes nécessitant une attention visuelle permanente de l’utilisateur sur son environnement. Parmi ces sports on peut citer par exemple : le canyoning, l’escalade, le ski, le saut en parachute ou en parapente, la conduite d’engins motorisés tels qu’une automobile, une moto, ou encore un quad.

Claims (10)

  1. REVENDICATIONS
    1. Dispositif de commande (1) d’un appareil de capture d’images (100), caractérisé en ce qu’il comprend : • une entrée (E-ι) pour recevoir une instruction vocale donnée par un utilisateur (2), et une sortie (Si) pour fournir ladite instruction vocale sous la forme d’une instruction de commande à l’appareil de capture d’images (100), • une entrée (E2) pour recevoir un retour d’information de l’appareil de capture d’images (100), et une sortie (S2) pour fournir ledit retour d’information sous la forme d’une réponse vocale à l’utilisateur (2).
  2. 2. Dispositif selon la revendication 1, caractérisé en ce qu’il comprend un moyen de mémorisation (15,17), et un ou plusieurs module(s) de reconnaissance vocale (16) permettant de comparer l’instruction vocale de l’utilisateur à une ou plusieurs instruction(s) préenregistrée(s) dans le moyen de mémorisation (15,17) du dispositif de commande (1)
  3. 3. Dispositif selon la revendication 2, caractérisé en ce qu’il comprend une unité de commande (14) apte à générer une instruction de commande pour l’appareil de capture d’images (100) lorsque l’instruction vocale de l’utilisateur correspond à au moins une instruction préenregistrée.
  4. 4. Dispositif selon la revendication 3, caractérisé en ce qu’il comprend un système de configuration (22) piloté par l’unité de commande (14), permettant de régler les paramètres de fonctionnement du dispositif de commande (1) et de l’appareil de capture d’images à partir d’une ou plusieurs instruction(s) vocale(s) de l’utilisateur.
  5. 5. Dispositif selon la revendication 4, caractérisé en ce qu’il comprend plusieurs niveaux de configuration, chaque niveau consistant en une pluralité de paramètres réglables, de sorte que les paramètres d’un niveau donné sont liés aux paramètres du niveau précédent et précisent lesdits paramètres du niveau précédent.
  6. 6. Dispositif selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il se présente sous la forme d’un boîtier portatif muni d’un microphone (10) et d’une oreillette (21).
  7. 7. Dispositif selon la revendication 6, caractérisé en ce que le boîtier est apte à se fixer au casque de l'utilisateur.
  8. 8. Dispositif selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il est connecté à l’appareil de capture d’images (100) par une liaison sans fil grâce à un module de communication choisi parmi : les modules utilisant le standard de communication Bluetooth, les modules Wi-Fi, ou encore des modules utilisant les ondes radiofréquence ou infrarouge
  9. 9. Dispositif selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comprend une batterie rechargeable permettant de l’alimenter en énergie électrique.
  10. 10. Utilisation du dispositif (1) selon les revendications 1 à 9, pour commander un appareil de capture d’images (100) fixé au casque de l’utilisateur.
FR1561701A 2015-12-02 2015-12-02 Dispositif de commande vocale d'un appareil de capture d'images Active FR3044784B1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR1561701A FR3044784B1 (fr) 2015-12-02 2015-12-02 Dispositif de commande vocale d'un appareil de capture d'images
PCT/EP2016/079504 WO2017093439A1 (fr) 2015-12-02 2016-12-01 Dispositif de commande vocale d'un appareil de capture d'images

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1561701A FR3044784B1 (fr) 2015-12-02 2015-12-02 Dispositif de commande vocale d'un appareil de capture d'images
FR1561701 2015-12-02

Publications (2)

Publication Number Publication Date
FR3044784A1 true FR3044784A1 (fr) 2017-06-09
FR3044784B1 FR3044784B1 (fr) 2019-08-02

Family

ID=55236714

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1561701A Active FR3044784B1 (fr) 2015-12-02 2015-12-02 Dispositif de commande vocale d'un appareil de capture d'images

Country Status (2)

Country Link
FR (1) FR3044784B1 (fr)
WO (1) WO2017093439A1 (fr)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11099540B2 (en) 2017-09-15 2021-08-24 Kohler Co. User identity in household appliances
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US11093554B2 (en) 2017-09-15 2021-08-17 Kohler Co. Feedback for water consuming appliance
US10887125B2 (en) 2017-09-15 2021-01-05 Kohler Co. Bathroom speaker
US10448762B2 (en) 2017-09-15 2019-10-22 Kohler Co. Mirror
CN109284987A (zh) * 2018-12-07 2019-01-29 国网安徽省电力有限公司黄山供电公司 一种交接班智能记录系统
CN111726642B (zh) * 2019-03-19 2023-05-30 北京京东尚科信息技术有限公司 直播方法、装置和计算机可读存储介质
CN112241663B (zh) * 2019-07-18 2023-07-25 上汽通用汽车有限公司 一种对多个车载资源进行调配的装置以及系统
CN113034114A (zh) * 2021-04-01 2021-06-25 苏州惟信易量智能科技有限公司 一种基于可穿戴设备的流程控制系统及方法
CN113052561A (zh) * 2021-04-01 2021-06-29 苏州惟信易量智能科技有限公司 一种基于可穿戴设备的流程控制系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110173539A1 (en) * 2010-01-13 2011-07-14 Apple Inc. Adaptive audio feedback system and method
EP2750363A1 (fr) * 2012-12-31 2014-07-02 LG Electronics, Inc. Terminal mobile

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110173539A1 (en) * 2010-01-13 2011-07-14 Apple Inc. Adaptive audio feedback system and method
EP2750363A1 (fr) * 2012-12-31 2014-07-02 LG Electronics, Inc. Terminal mobile

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "Review: Sena Prism Bluetooth motorcycle action camera", 16 April 2015 (2015-04-16), XP055294859, Retrieved from the Internet <URL:http://newatlas.com/sena-prism-bluetooth-camera-review/37032/> [retrieved on 20160810] *
SENA: "User's Guide Motorcycle Bluetooth Communication System", 21 November 2014 (2014-11-21), XP055294882, Retrieved from the Internet <URL:http://www.sena.com/wp-content/uploads/2014/11/UsersGuide_Sena_20S_v1.3_en_20141121.pdf> [retrieved on 20160810] *
WWW SENA COM: "User's Guide PRISM", 5 December 2014 (2014-12-05), XP055294852, Retrieved from the Internet <URL:http://www.sena.com/wp-content/uploads/2014/12/UsersGuide_Sena_PRISM_v1.0.0.0_en_20141205.pdf> [retrieved on 20160810] *

Also Published As

Publication number Publication date
FR3044784B1 (fr) 2019-08-02
WO2017093439A1 (fr) 2017-06-08

Similar Documents

Publication Publication Date Title
FR3044784B1 (fr) Dispositif de commande vocale d&#39;un appareil de capture d&#39;images
KR102570480B1 (ko) 오디오 신호 처리 방법 및 이를 지원하는 전자 장치
CN108231073B (zh) 语音控制装置、系统及控制方法
KR102405171B1 (ko) 촬상장치 및 그 제어방법
US10448139B2 (en) Selective sound field environment processing system and method
RU2695104C2 (ru) Способ и аппарат для регулирования угла съемки камеры
US10405081B2 (en) Intelligent wireless headset system
KR101937708B1 (ko) 카메라 제어 시스템과 이를 포함하는 단말기 및 카메라 제어 방법
US20120326834A1 (en) Systems and methods for automated adjustment of device settings
US11451704B2 (en) Image capturing apparatus, method for controlling the same, and storage medium
US11184550B2 (en) Image capturing apparatus capable of automatically searching for an object and control method thereof, and storage medium
KR102475999B1 (ko) 화상 처리장치 및 그 제어방법
US20210225391A1 (en) Systems and methods for processing audio based on changes in active speaker
KR102499203B1 (ko) 신뢰도에 기반하여 객체를 인식하는 전자 장치 및 방법
FR2972592A1 (fr) Lampe led dotee d&#39;un dispositif de faisceau a geometrie variable
JP2015011634A (ja) 電子機器、電子機器の制御方法、及び電子機器の制御プログラム
EP2402839A2 (fr) Système et procédé d&#39;indexation de contenu affiché sur un dispositif électronique
US20220368825A1 (en) Image capturing apparatus, method for controlling the same, and storage medium
EP3149968B1 (fr) Procédé d&#39;aide au suivi d&#39;une conversation pour personne malentendante
EP3274809A1 (fr) Procédé de commande, dispositif de commande, système et véhicule automobile comprenant un tel dispositif de commande
JP6064736B2 (ja) 情報記憶装置および情報記憶プログラム
US11875791B2 (en) Systems and methods for emphasizing a user&#39;s name
JP5168375B2 (ja) 撮像装置、撮像方法及びプログラム
EP4344610A2 (fr) Systeme de mesure audiometrique a distance et procedes associes pour l etablissement d&#39;un profil auditif et le reglage des protheses auditives a l&#39;aide d&#39;un tel systeme
WO2017207286A1 (fr) Combine audio micro/casque comprenant des moyens de detection d&#39;activite vocale multiples a classifieur supervise

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20170609

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7

PLFP Fee payment

Year of fee payment: 8