FR2810125A1 - Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client - Google Patents

Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client Download PDF

Info

Publication number
FR2810125A1
FR2810125A1 FR0007359A FR0007359A FR2810125A1 FR 2810125 A1 FR2810125 A1 FR 2810125A1 FR 0007359 A FR0007359 A FR 0007359A FR 0007359 A FR0007359 A FR 0007359A FR 2810125 A1 FR2810125 A1 FR 2810125A1
Authority
FR
France
Prior art keywords
voice
sep
dictionary
page
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0007359A
Other languages
English (en)
Other versions
FR2810125B1 (fr
Inventor
Bruno Gachie
Anselme Dewavrin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INTERACTIVE SPEECH TECHNOLOGIE
Original Assignee
INTERACTIVE SPEECH TECHNOLOGIE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INTERACTIVE SPEECH TECHNOLOGIE filed Critical INTERACTIVE SPEECH TECHNOLOGIE
Priority to FR0007359A priority Critical patent/FR2810125B1/fr
Priority to US09/756,418 priority patent/US20020010585A1/en
Priority to AU2001262476A priority patent/AU2001262476A1/en
Priority to PCT/FR2001/001560 priority patent/WO2001095087A1/fr
Publication of FR2810125A1 publication Critical patent/FR2810125A1/fr
Application granted granted Critical
Publication of FR2810125B1 publication Critical patent/FR2810125B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/0012Details of application programming interfaces [API] for telephone networks; Arrangements which combine a telephonic communication equipment and a computer, i.e. computer telephony integration [CPI] arrangements
    • H04M7/0018Computer Telephony Resource Boards

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

Le système permet la commande vocale d'une page destinée à être visualisée sur un dispositif client (2), qui d'une part peut échanger des données avec un serveur (1) distant via un réseau de télécommunication (3), et qui d'autre part comprend des moyens (11, 12) permettant l'enregistrement d'une commande vocale prononcée par un utilisateur, et des moyens de reconnaissance vocale permettant, à partir d'une commande vocale enregistrée, de déterminer et de commander automatiquement l'exécution d'une action associée à cette commande vocale. Le serveur (1) comporte en mémoire, en lien avec ladite page (page (1). htm,...), au moins un dictionnaire (page (1). ias,... ) d'un ou plusieurs liens vocaux comprenant pour chaque lien vocal au moins un enregistrement audio de la commande vocale; le dispositif client est apte à télécharger en mémoire chaque dictionnaire associé à la page, et les moyens de reconnaissance vocale du dispositif client (2) comportent un programme de reconnaissance vocale (E) qui est conçu pour réaliser une comparaison de l'enregistrement audio correspondant à la commande vocale avec le ou les enregistrements audio de chaque dictionnaire associé à la page.

Description

SYSTEME <B>DE COMMANDE VOCALE D'UNE PAGE</B> STOCKEE <B>SUR</B> <B>SERVEUR ET</B> TELECHARGEABLE <B>EN VUE DE SA VISUALISATION</B> <B>SUR UN DISPOSITIF CLIENT</B> présente invention concerne la commande vocale de pages accessibles sur un serveur via un réseau de télécommunication, et plus particulièrement de pages hypertextes. Elle trouve principalement, mais exclusivement, son application à la navigation hypertexte commande vocale sur un réseau de télécommunication de type Internet. Dans le présent texte, le terme serveur désigne d'une maniere genérale tout système informatique dans lequel sont stockées données et qui est consultable à distance via un réseau télécommunication.
Le terme page désigne tout document prévu pour être affiché un écran et stocké sur un site serveur à une adresse donnée.
Le terme dispositif client désigne d'une manière générale tout dispositf informatique apte à envoyer des requêtes à un site serveur pour ce dernier lui envoie en retour les données objets de la requête, et en particulier un page déterminée, par exemple identifiée dans la requête son adresse sur le serveur.
Le terme réseau de télécommunication désigne d'une manière générale tout moyen de communication permettant l'échange de donnees à distance entre un site serveur et un dispositif client ; il peut s'agir réseau local (LAN) tel que l'intranet d'une entreprise ou encore réseau longue distance (WAN) tel que par exemple le réseau Internet, ou encore d'un ensemble de réseaux de type différents et interconnectés.
Pour simplifier l'envoi à distance de pages entre un serveur et un dispositf client connecté à ce serveur via un réseau de telécommunication, on utilise couramment des systèmes de navigation hypertexte, qui permettent de naviguer parmi un ensemble de pages reliées les unes aux autres par des liens encore appelés liens hypertextes hyper-liens. En pratique, dans un système de navigation hypertexte, une page hypertexte contient en plus du texte de base devant être affiché à l'écran, caractères ou séquences de caractères particuliers qui peuvent faire non partie intégrante du texte de base, et qui constituent les liens hypertextes de la page. Lorsque que ces liens hypertextes font partie intégrante du texte de base de la page, ils sont differenciés des autres caracteres de la page de base, par exemple en étant soulignés et/ou visualisés dans une autre couleur, etc. Pour la gestion de la navigation hypertexte, le dispositif client est de manière usuelle équipé d'un logiciel de navigation, encore appelé navigateur. Lors la sélection par un utilisateur d'un lien hypertexte dans la page cours de visualisation, logiciel de navigation dans un premier temps établit et envoie automatiquement une requête au serveur, permettant à ce dernier d'envoyer la page attachée au lien hypertexte qui a été sélectionné, et dans un second temps affiche à l'écran la nouvelle page qui lui est envoyée par serveur.
Afin de faciliter l'activation des liens hypertextes dans un système de navigation hypertexte, on a déjà proposé des système d'activation par commande vocale, dans lesquels le lien hypertexte est prononcé par l'utilisateur, est reconnu automatiquement par un système de reconnaissance vocale. Ces systèmes d'activation vocale remplacent avantageusement les systèmes d'activation manuelle traditionnels (clavier/souris), et deviennent même indispensables dans toutes les applications ou il n'est pas envisageable ou souhaité de mettre ceuvre un outil manuel tel qu'un clavier ou une souris. Un exemple de ce type d'application est la navigation vocale sur le réseau mondial internet au moyen de teléphones portables WAP.
A jour, tous les systèmes d'activation vocale de liens dans une page hypertexte sont essentiellement basés sur une analyse automatique ( parsing de la page hypertexte, sur une détection automatique les liens présents dans la page, et sur la génération automatique de phonèmes ' partir de chaque lien détecté. Plus particulièrement dans le brevet US-A- 6,029,135 , on décrit un système de navigation hypertexte par commande vocale qui peut être mis en oeuvre selon deux variantes : une première variante dite run time et une seconde variante dite off line . Dans la variante off line il est enseigné de faire générer par le producteur de pages hypertextes, des <I>données supplémentaires </I> pour la commande vocale de ces pages, lesquelles données supplémentaires sont téléchargées avec page hypertexte depuis le serveur. Ces<I> données supplémentaires</I> sont utilisées par le client pour effectuer la reconnaissance vocale des mots prononcés par un utilisateur via un microphone, l'intelligence de reconnaissance vocale étant localisée au niveau du client. Dans l'unique mode de réalisation décrit, les<I> données supplémentaires</I> sont constituées par un dictionnaire de phonèmes, associé à un modèle de probabilité. Le dictionnaire de phonèmes et le modèle de probabilité associé sont générés automatiquement à partir de la page par analyse automatique du contenu du document et extraction automatique des liens présents dans le document. A cet effet, un logiciel spécifique appelé <I> manager </I> est utilisé.
Les solutions de l'art antérieur et en particulier celle retenue dans brevet US-A- 6,029,135 présentent l'inconvénient majeur d'être basées une reconnaissance phonétique, ce qui d'une part complique la reconnaissance vocale, et est une source importante d'erreur , et ce qui d'autre part impose la mise en #uvre d'un logiciel complexe manager ) permettant la traduction automatique de chaque mot sous forme de phonèmes, et l'élaboration automatique de modèle de probabilité pour la mise en oeuvre de la reconnaissance phonétique. Le logiciel de traduction phonétique est d'autant plus complexe si l'on souhaite par exemple intégrer différentes prononciations d'un mot, pour tenir compte de la langue. Egalement, ce type de solution présente l'inconvénient d'être dépendant d'une langue pour la transcription automatique du texte de la commande vers sa traduction en phonétique. Pour les raisons ci-dessus, ces solutions sont à ce jour relativement onéreuses, sont réservées à des systèmes de navigation professionnels très spécialisés, et sont donc peu adaptées à des applications dites grand public. La présente invention a pour principal objet un système qui permet la commande vocale d'une page qui est destinée à être visualisée sur un dispositif client apte à échanger des données avec un serveur distant via un reseau de télécommunication, et qui pallie les inconvénients précites des systèmes existants. Par commande vocale d'une page, on vise seulement l'activation vocale de liens associés à la page, mais également et plus généralement l'activation par la voix de toute commande associée à page visualisée, la commande n'étant pas nécessairement matérialisée par un mot visualisé sur l'écran du dispositif client mais pouvant être cachée. L'exécution de la commande associée à une page peut être de nature variée et n'est pas limitative de l'invention ( activation lien hypertexte renvoyant sur une nouvelle page du serveur, commande de périphériques du dispositif client tel que par exemple une imprimante, ouverture ou fermeture de fenêtres sur le dispositif client, déconnexion du dispositif client, connexion du dispositif client sur un nouveau serveur etc... ).
De manière connue, notamment par le brevet US-A- 6,029,135, le dispositif client comprend des moyens tels qu'un microphone et un carte d'acquisition audio, permettant l'enregistrement d'une commande vocale prononcée par un utilisateur, et des moyens de reconnaissance vocale permettant, à partir d'une commande vocale enregistrée, de déterminer et de commander automatiquement l'exécution une action associée à cette commande.
De manière caractéristique et essentielle selon l'invention, le serveur comporte en mémoire en lien avec ladite page au moins un dictionnaire d'un ou plusieurs liens vocaux comprenant pour chaque lien vocal au moins un enregistrement audio de la commande vocale; le dispositif client est apte à télécharger en mémoire chaque dictionnaire associé à la page, et les moyens de reconnaissance vocale du dispositif client comportent un programme de reconnaissance vocale qui est conçu pour réaliser une comparaison de l'enregistrement audio correspondant à commande vocale avec le ou les enregistrements audio de chaque dictionnaire associé à la page. D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lumière de la description ci-après d'un exemple particulier de réalisation, laquelle description est donnée à titre d'exemple non limitatif et en référence aux dessins annexés sur lesquels - la figure 1 est une représentation schématique principaux éléments composant un système de commande vocale conforme à l'invention, - la figure 2 représente les principales étapes d'un programme d'aide à la création d'un dictionnaire de liens vocaux caracteristiques de l'invention, et de mise en relation du dictionnaire créé avec page d'un serveur, en vue de la commande vocale de cette page, - les figures 3 à 6 sont des exemples de fenêtres générées par le programme d'aide à la création de dictionnaires, - la figure 7 illustre les principales étapes mises en oeuvre par un dispositif client dans la phase de téléchargement d'un dictionnaire associé à une page fournie par un serveur, - la figure 8 illustre les principales étapes mises en #uvre par le programme de reconnaissance vocale exécuté en local le dispositif client. En référence à la figure 1, dans un exemple particulier de réalisation, l'invention met en oeuvre un serveur informatique , sur lequel peuvent se connecter un ou plusieurs dispositifs clients ' un réseau télécommunication 3. Plus particulièrement, dans l'exemple illustré, le serveur informatique 1 héberge de manière usuelle un ou plusieurs sites web, et les dispositifs clients sont conçus pour se connecter sur le serveur via le réseau mondial Internet, et pour échanger des données avec ce serveur selon le protocole de communication IP usuel.
Chaque site web hébergé par le serveur 1 est constitué d'une pluralité de pages html matérialisées par des fichiers au format .htm (figure 1 / pagel.htm, etc...) et reliés entre elles par des hyper-liens. Ces pages sont stockées de manière usuelle dans une unité mémoire 4 accessible en lecture et écriture par l'unité de traitement 5 du serveur 1. Outre l'unité mémoire 4 et l'unité de traitement 5, le serveur 1 comporte egalement de manière usuelle des moyens d'entréelsortie comprenant moins un clavier permettant à un administrateur du serveur de saisir des données et/ou commandes, et au moins un écran permettant la visualisation des données du serveur, et notamment la visualisation des pages d'un site. Pour la gestion de l'échange de données avec un client 2 via le réseau 3, l'unité de traitement 5 comporte en mémoire vive un logiciel serveur A connu en soit, et permettant notamment l'envoi à un client 2 connecté au serveur 1 du ou des fichiers correspondant à la requête du client.
Un dispositif client 2 comporte de manière connue unité de traitement 7 apte à être connectée via une interface de communication au réseau 3, et connectée également à des moyens d'entrée/sorties 8, dont au moins un écran pour la visualisation de chaque page html envoyée par le serveur 1. L'unité de traitement met en ceuvre logiciel de navigation B connu en soit, encore appelé navigateur (par exemple le logiciel de navigation commercialisé sous la marque déposée Netscape ).
L'invention, dont les moyens nouveaux vont à présent être détaillés à la lumière d'un exemple particulier de réalisation, n'est pas limitée à une application de type Intemet, mas peut d'une manière plus générale être appliquée à toute architecture client/serveur indépendamment type de réseau de télécommunication et du protocole d'échange de données utilisés. Egalement, le dispositif client peut indifféremment être un poste fixe, ou comprendre une unité mobile tel qu'un téléphone portable, de type WAP, permettant un accès au réseau de télécommunication L'invention repose de manière essentielle sur la mise oeuvre, pour chaque page du serveur à laquelle on souhaite associer une fonction de commande vocale, d'au moins un dictionnaire liens vocaux, qui est stocké en mémoire du serveur 1 en lien avec ladite page, et qui présente la particularité de contenir pour chaque commande vocale, au moins un enregistrement audio, de préférence sous forme compressée, de la commande vocale. Dans l'exemple illustré sur figure 1, à chaque page html est associé en mémoire un unique dictionnaire matérialisé par un fichier comportant le même nom que la page mais avec une extension différente arbitrairement désignée Jas dans la suite de la présente description. Ainsi, à la page html matérialisée par fichier page 1 est associé, en mémoire du serveur 1, le fichier dictionnaire page1 ' , etc... Dans une autre variante, il est envisageable d'associer plusieurs dictionnaires à une même page.
Pour permettre la construction des fichiers dictionnaires Jas), le serveur est équipé d'un microphone 9 connecté à une carte d'acquisition audio 10 (connue en soit), qui d'une manière générale permet de transformer le signal analogique délivré par le microphone 9 en une information de type numérique. Cette carte d'acquisition audio 10 communique avec l'unité de traitement 5 du serveur 1, et permet à ce dernier d'effectuer l'acquisition via le microphone 9 d'enregistrements vocaux sous forme numérique. L'unité de traitement 5 est en outre apte à exécuter logiciel C spécifique de l'invention, dont une variante sera décrite ci après, et qui permet d'assister le créateur d'un site web dans la construction des dictionnaires de liens vocaux.
manière similaire, afin de permettre l'acquisition par l'unité de traitement 7 d'un dispositif client 2 d'une commande vocale prononcée par l'utilisateur, ledit dispositif client 2 est également équipé d'un microphone 11 et d'une carte d'acquisition audio 12. Tel que cela sera explique de manière plus détaillée ultérieurement, la reconnaissance vocale automatique d'une commande vocale prononcée par l'utilisateur dispositif client 2, en liaison avec une page en cours de visualisation l'écran du dispositif client 2, est réalisée en local l'unité de traitement 7 du dispositif client 2, après téléchargement du fichier dictionnaire associé à la page en cours de visualisation. <U>Spécifications d'un Fichiers Dictionnaire</U> Cias) Dans un exemple de réalisation, un fichier dictionnaire contient un ou plusieurs liens vocaux enregistrés les uns à la suite des autres, chaque lien vocal possédant plusieurs attributs concaténés 1. le nom (qui correspond au mot phonétique de la commande vocale qui doit être prononcé par l'utilisateur pour activer le lien) ; 2. le type 3. l'adresse (plus communément appelée URL) permettant localiser sur le serveur la ressource associée à la commande vocale ; 4. la cible ( c'est-à-dire le nom de la fenêtre dans la quelle doit d'afficher la nouvelle page) ; 5. un enregistrement audio ( encore appelé modèle acoustique) masculin 6. un enregistrement audio ( encore appelé modèle acoustique) féminin L'attribut type d'un lien vocal est utilisé notamment pour spécifier - qu'il s'agit bien d'un lien vocal et pour le différencier exemple des hyper lien d'une page html sans possibilité de commande vocale, - s'il s'agit d'un lien dont le nom apparaît dans le texte de la page associée , - si ce lien doit être caché ou si au contraire le nom lien peut être affiché sur l'écran du dispositif client 2 dans une fenêtre spécifique contenant pour l'utilisateur les noms de tous les liens (non cachés) qu'il peut activer par la voix. Plus particulièrement, à titre d'exemple , en langage C<B>"</B>, un lien vocal peut être transcrit de la manière suivante
Figure img00090001
Information <SEP> type <SEP> C <SEP> Taille <SEP> en <SEP> Taille <SEP> maximale <SEP> Valeurs
<tb> octets <SEP> permises
<tb> <I>Type <SEP> de <SEP> lien</I> <SEP> DWORD <SEP> 4 <SEP> 4 <SEP> plus <SEP> bas
<tb> <I>Taille <SEP> du <SEP> nom</I> <SEP> short <SEP> 2 <SEP> 2 <SEP> nombre <SEP> positif
<tb> <I>Nom</I> <SEP> chars <SEP> taille <SEP> du <SEP> nom <SEP> 200 <SEP> caractères
<tb> ANSI
<tb> <I>Taille <SEP> du <SEP> lien <SEP> URL</I> <SEP> short <SEP> 2 <SEP> 2 <SEP> nombre <SEP> positif
<tb> <I>URL</I> <SEP> chars <SEP> taille <SEP> du <SEP> lien <SEP> URL <SEP> 2048 <SEP> caractères
<tb> ANSI
<tb> <I>Taille <SEP> de <SEP> la <SEP> cible</I> <SEP> short <SEP> 2 <SEP> 2 <SEP> nombre <SEP> positif
<tb> <I>Cible</I> <SEP> chars <SEP> taille <SEP> de <SEP> la <SEP> cible <SEP> 200 <SEP> caractères
<tb> ANSI
<tb> <I>Taille <SEP> modèle</I> <SEP> short <SEP> 2 <SEP> 2 <SEP> nombre <SEP> positif
<tb> <I>acoustique <SEP> masculin</I>
<tb> <I>Modèle <SEP> acoustique</I> <SEP> chars <SEP> taille <SEP> du <SEP> modèle <SEP> 2048
<tb> <I>masculin</I>
<tb> <I>Taille <SEP> modèle</I> <SEP> short <SEP> 2 <SEP> 2 <SEP> nombre <SEP> positif
<tb> <I>acoustique <SEP> féminin</I>
<tb> <I>Modèle <SEP> acoustique</I> <SEP> chars <SEP> taille <SEP> du <SEP> modèle <SEP> 2048
<tb> <I>féminin</I> <U>Programme de construction d'un fichier Dictionnaire (figure 2)</U> principales étapes du programme de création d'un fichier dictionnaire vont à présent être expliquées en référence principalement à la figure 2. Dans l'exemple de la figure 1, ce programme est exécuté par l'unité de traitement 5 du serveur, après que l'administrateur du serveur ait choisi l'option correspondante permettant le lancement du programme. Néanmoins, dans une autre application, ce programme pourra avantageusement être mis à la disposition du créateur d'un site web, en étant mis en couvre sur une machine différente du serveur, les fichiers dictionnaires (Jas) créés à l'aide de ce programme ainsi que les pages du sites étant ensuite téléchargés dans l'unité mémoire 4 du serveur 2.
référence à la figure 2, la création d'un fichier dictionnaire page (m).ias associé à une page html commence (étape 201) par l'ouverture fichier page (m).htm de la page, suivie d'une extraction automatique hyper liens présents dans la page (étape 202) et de la création fichier dictionnaire page(m).ias avec ouverture d'une fenêtre visualisation et de modification et/ou saisie de liens vocaux de ce dictionnaire (fenêtre Dictionnaire / étape 203). On a représenté sur figure 3, un exemple de fenêtre créée à l'issue de l'étape 203. Dans exemple, ont été détectés et extraits automatiquement de la page(m) trois hyper liens, et pour chacun des ces hyper-liens a été créé automatiquement dans le dictionnaire associé page(m).ias, un lien vocal dont l'attribut adresse contient l'adresse URL de l'hyper lien correspondant retrouvé automatiquement dans le fichier page (m).htm.
A partir de cette première fenêtre (figure 3), il est possible soit sélectionner dans la fenêtre de la figure 3 un lien existant dans dictionnaire ( étape 204), soit de créer un nouveau lien vocal dans dictionnaire (étape 205) en sélectionnant la commande appropriée dans un menu géré par la fenêtre de la figure 3.
II convient ici de souligner que la fonction de création d'un nouveau lien vocal permet avantageusement de créer une commande vocale, ne correspond pas nécessairement à un hyper lien présent dans la page, et par même offre la possibilité de programmer des commandes vocales variées, et qui plus est des commandes cachées. Egalement, l'étape precitée d'extraction automatique (étape 202) est facultative, et se justifie que par un soucis de faciliter et d'accélérer la création dictionnaire, en évitant à l'utilisateur de devoir créer manuellement dans le dictionnaire les liens vocaux correspondant à des hyper-liens de page et de devoir saisir les adresses URL correspondantes.
En cas de sélection d'un lien vocal existant ou de création d'un nouveau lien vocal, le programme ouvre une deuxième fenêtre propriétés du lien du type de celle illustrée sur la figure 4 (étape 206), qui permet à l'utilisateur de saisir et/ou modifier les attributs précedemment décrit d'un lien vocal. En particulier, dans cette fenêtre l'utilisateur a la possibilité de sélectionner un premier bouton d'action Enreg pour l'enregistrement d'une commande vocale par une voix masculine et un second bouton d'action Enreg pour l'enregistrement d'une commande vocale par une voix féminine. Lorsque l'utilisateur sélectionne l'un des boutons d'action précités, le programme exécute automatiquement un module d'acquisition d'un enregistrement audio. Ce module, une fois lancé permet l'acquisition via microphone 9 d'un enregistrement audio sous forme numérique de la commande vocale ( voix masculine ou féminine selon le cas) pendant un laps de temps donné contrôlé, et à l'issue de ce laps de temps réalise une compression automatique de cet enregistrement par tout procédé connu de compression de données, puis sauvegarde cet enregistrement audio compressé dans le fichier dictionnaire page(m).ias Une fois que l'utilisateur a validé que toutes les propriétés d'un lien vocal ont été saisies ou modifiées, le programme ferme la fenêtre propriétés du lien correspondante (étape 207), et une fois tous les liens vocaux du dictionnaire page (m).ias ont été créés de manière complète, l'utilisateur commande la fermeture de la fenêtre Dictionnaire , et par là-même la fermeture du dictionnaire page ias (étape 208). La figure 5 illustre un exemple de fenêtre propriete du lien pour le lien vocal Supérieur mise à jour avant fermeture de la fenêtre ; la figure 6 illustre un exemple de fenêtre Dictionnaire mise à jour avant fermeture du dictionnaire page (m).ias.
Une fois un dictionnaire page(m).ias complètement creé, le programme crée automatiquement (étape 209) un lien entre page
Figure img00120001
(fichier <SEP> page(m).htm <SEP> ) <SEP> et <SEP> le <SEP> dictionnaire <SEP> associé <SEP> (fichier <SEP> page(m).ias). <SEP> et
<tb> ferme <SEP> le <SEP> fichier <SEP> dictionnaire <SEP> (page(m).ias). <SEP> Dans <SEP> une <SEP> variante <SEP> de
<tb> réalisation, <SEP> ce <SEP> lien <SEP> est <SEP> créé <SEP> par <SEP> insertion <SEP> du <SEP> nom <SEP> (page(m).ias) <SEP> du
<tb> dictionnaire <SEP> associé <SEP> dans <SEP> le <SEP> fichier <SEP> (page(m).htm) <SEP> de <SEP> la <SEP> page. <SEP> exemple
<tb> d'implémentation <SEP> du <SEP> fichier <SEP> page(m).htm <SEP> est <SEP> donné <SEP> ci-dessous
<tb> < html>
<tb> < head>
<tb> < TITLE> <SEP> ( <SEP> titre <SEP> du <SEP> fichier <SEP> de <SEP> la <SEP> page <SEP> html) <SEP> < ITITLE>
<tb> < /head>
<tb> < body>
<tb> < a <SEP> href <SEP> = <SEP> < "suivante. <SEP> htm"> <SEP> Suivante < /a> < br>
<tb> < a <SEP> href <SEP> = <SEP> < 'precedente.htm"> <SEP> Précédente < /a> < br>
<tb> < a <SEP> href <SEP> = <SEP> < "superieur.htm"> <SEP> Supérieur < la> < br>
<tb> < p> < embed <SEP> src="page(m).ias" <SEP> pluginspage="" <SEP> type=<B>"</B> <SEP> application/x NavigationByVoice" <SEP> width="120" <SEP> heigth="50"> < /embed> < /p>
<tb> < /body>
<tb> < /html>
<tb> La <SEP> phase <SEP> de <SEP> transmission <SEP> d'un <SEP> dictionnaire <SEP> entre <SEP> le <SEP> serveur <SEP> 1 <SEP> et <SEP> un
<tb> dispositif <SEP> client <SEP> 2 <SEP> ainsi <SEP> que <SEP> la <SEP> phase <SEP> de <SEP> reconnaissance <SEP> vocale <SEP> vont <SEP> à
<tb> présent <SEP> être <SEP> détaillées <SEP> en <SEP> référence <SEP> aux <SEP> figures <SEP> 1, <SEP> 7 <SEP> et <SEP> 8.
<tb>
<U>Transmission <SEP> d'un <SEP> dictionnaires <SEP> (. <SEP> ias)</U>
<tb> Initialement <SEP> à <SEP> l'aide <SEP> du <SEP> programme <SEP> navigateur <SEP> (B), <SEP> le <SEP> dispositif <SEP> client <SEP> 2
<tb> demande <SEP> au <SEP> serveur <SEP> 1 <SEP> de <SEP> lui <SEP> envoyer <SEP> une <SEP> page <SEP> html <SEP> ( <SEP> exemple <SEP> le fichier page(m).htm) De manière usuelle, le navigateur (B) analyse le fichier page(m).htm et affiche sur l'écran le contenu de la page au fur et à mesure où il reçoit les données afférentes à cette page ( figure 7/ étape 701). Au cours de l'analyse automatique du fichier page(m).htm lorsque le navigateur détecte l'information selon laquelle un dictionnaire est attaché à cette page ( détection de src="page(m).ias" dans le fichier), il charge un module d'extension D (figure 1) stocké en mémoire vive du dispositif client (étape 702), et parallèlement lance un programme de reconnaissance vocale également stocké en mémoire vive, pour cas ou ce programme n'aurait pas déjà été lancé ( ce qui est le cas par exemple la premiere fois où au cours d'une session une page (.htm) avec dictionnaire (Jas) attaché est reçue par le dispositif client 2).
navigateur envoie ensuite une requête au serveur 1 (étape 703) afin celui ci lui transmette le fichier dictionnaire page(m) ' identifié dans fichier page(m).htm.
Après réception par le dispositif client 2 du fichier dictionnaire page(m).ias, le navigateur (B) du dispositif client 2 envoie le fichier dictionnaire au module d'extension (D) (étape 705).
Ce module d'extension (D) crée à son tour un lien entre le fichier dictionnaire page(m).ias et le programme de reconnaissance vocale (E) (étape 706). Ensuite (étape 707), le module d'extension (D) analyse le contenu du fichier dictionnaire page(m).ias et affiche à l'écran pour l'utilisateur, par exemple dans une nouvelle fenêtre, les noms (attribut nom ) de tous les liens vocaux du fichier dictionnaire page(m).ias, pour lesquels la valeur de l'attribut type autorise une visualisation (commandes vocales non cachées). (étape 706). <U>Reconnaissance vocale</U> Cette fonction est assurée par le programme de reconnaissance vocale (E), à partir d'une commande vocale entrée par l'utilisateur au moyen microphone 11 et par comparaison avec le ou les fichiers dictionnaires avec lequel un lien a été établi. II convient ici de souligner que programme de reconnaissance vocale peut être lancé avec simultanément plusieurs module d'extension actifs.
Plus particulièrement, en référence à la figure 8, une fois lancé programme de reconnaissance vocale (E) est dans l'attente de détection d'un son par le microphone 11. Lorsque l'utilisateur du dispositif client prononce une commande à la voix, celle-ci est enregistrée automatiquement sous forme numérique ( étape 801), et le programme reconnaissance vocal effectue une compression de cette enregistrement, en appliquant même méthode de compression que celle utilisée programme de création de dictionnaires. Ensuite (étape 803), programme reconnaissance vocale (E) effectue automatiquement comparaison des données numériques correspondant à l'enregistrement audio compressé avec les données numériques chaque enregistrement audio compressé (modèles acoustiques masculins et féminins) du fichier dictionnaire page (m).ias. (ou d'une manière générale de tous les fichiers dictionnaires pour lesquels un lien avec programme de reconnaissance vocale est actif), en vue d'en déduire automatiquement le lien vocal du dictionnaire correspondant à commande prononcée par l'utilisateur.
Plus particulièrement, dans une variante de réalisation l'invention chaque comparaison des enregistrements audio compresses est mise en couvre selon la méthode DTW (Dynamic Time Warping), donne pour résultat une note de reconnaissance caractérisant similitude entre les enregistrements. Seule la note la plus élevée ensuite retenue par le programme de reconnaissance vocale, comparée avec un seuil détection prédéterminé en dessous duquel il est considéré que le prononcé n'a pas été reconnu comme une commande vocale. Si note la plus élevée résultant des comparaisons précitées est supérieure à ce seuil, le programme de reconnaissance vocale reconnaît automatiquement le lien vocal correspondant à cette note comme étant la commande vocale prononcée par l'utilisateur.
De manière avantageuse selon l'invention, la reconnaissance vocale étant basée une comparaison d'enregistrements audio numériques (enregistrements audios des liens vocaux d'un dictionnaire Jas et de l'enregistrement audio de la commande vocale prononcée par l'utilisateur), on simplifie et on fiabilise très largement la reconnaissance vocale, comparativement ' des systèmes de reconnaissance de type phonétique tel que celui ' en oeuvre dans le brevet US-A- 6,029,135. Egalement, on s'affranchit toute dépendance à une langue particulière.
Après reconnaissance d'un lien vocal, le programme de reconnaissance vocale envoie au navigateur (B) (étape 804) l'action qui est associée à ce lien vocal qui est codée dans le dictionnaire, c'est-à- dire dans l'exemple particulier décrit précédemment l'adresse URL de ce lien vocal.
Si l'action associée correspond au chargement et à l'affichage d'une nouvelle page identifiée par son adresse URL, le navigateur (B), avant l'envoi de la requete appropriée au serveur , décharge la page en cours de visualisation ( page(m).htm ) ainsi que le module d'extension qui lui est associé, lequel module d'extension avant déchargement casse le lien établi entre le programme de reconnaissance vocale (E) et le fichier dictionnaire page(m).* Ensuite les étapes de fonctionnement sont reprises à l'étape (701) precitée.
Dans l'exemple particulier de réalisation qui a été décrit, chaque lien vocal est caractérisé une adresse (URL), qui est communiquée au navigateur du dispositif client lorsque ce lien vocal a été reconnu par le programme de reconnaissance vocal, ce qui permet ensuite au navigateur de dialoguer avec le serveur afin que ce dernier envoie au dispositif client la ressource correspondant à cette adresse, et par exemple une nouvelle page. Ceci n'est toutefois limitatif de l'invention. On peut généraliser l'utilisation de cet attribut adresse d'un lien vocal pour coder d'une manière générale l'action est associée à la commande vocale définie par le lien vocal, et qui doit être automatiquement exécutée lors de la reconnaissance automatique d'un lien vocal par le programme de reconnaissance vocale. Ainsi, cette action codée dans l'attribut adresse , peut non seulement être une adresse localisant une ressource stockée sur le serveur 1, mais pourrait également être une adresse localisant une ressource (données, programme exécutable, ... ) stockée en local au niveau du dispositif client 2, ou un code de commande d'une action executable par le dispositif client tel que par exemple, et de manière non limitative, la commande d'un périphérique en local au niveau du dispositif client (impression d'un document, ouverture ou fermeture d'une fenêtre sur l'écran du dispositif client, arrêt de la communication avec le serveur et éventuellement mise en communication avec un nouveau serveur dont l'adresse serait spécifiée dans l'attribut adresse , déconnexion définitive du dispositif client par rapport au réseau de télécommunication 3, etc...).

Claims (10)

REVENDICATIONS
1. Systeme pour la commande vocale d'une page destinée à être visualisée sur un dispositif client (2), qui d'une part peut échanger des données avec un serveur (1) distant via un réseau de télécommunication (3), et qui d'autre part comprend moyens (11 2) permettant l'enregistrement d'une commande vocale prononcée par utilisateur, et des moyens de reconnaissance vocale permettant, à partir d'une commande vocale enregistrée, de déterminer et de commander automatiquement l'exécution d'une action associee à cette commande vocale, caractérisé en ce que le serveur (1) comporte en mémoire, en lien avec ladite page, au moins un dictionnaire d'un ou plusieurs liens vocaux comprenant pour chaque lien vocal au moins un enregistrement audio de la commande vocale, en ce que le dispositif client apte à télécharger en mémoire chaque dictionnaire associé à la page, et en ce que les moyens de reconnaissance vocale du dispositif client (2) comportent un programme de reconnaissance vocale (E) qui est conçu pour réaliser une comparaison de l'enregistrement audio correspondant à la commande vocale avec le ou les enregistrements audio de chaque dictionnaire associé à page.
2. Système selon la revendication 1 caractérisé en ce qu' lien vocal comporte plusieurs enregistrements audio de la commande vocale, dont au moins un enregistrement d'une voix féminine et un enregistrement d'une voix masculine.
3. Système selon la revendication 1 ou 2 caractérisé en ce que la page du serveur (1) comporte une information identifiant le ou les dictionnaires associés, et en ce que le dispositif client (2) est conçu d'une part pour détecter cette information lors de la visualisation de la page, et d'autre part en cas de détection de cette information pour envoyer une requête au serveur (1) afin que ce dernier lui envoie le dictionnaire identifié par cette information.
4. Système selon l'une des revendications 1 à 3 caractérisé en que chaque lien vocal d'un dictionnaire comporte une adresse permettant de localiser une ressource.
5. Système selon l'une des revendications 1 à 4 caractérisé en que chaque lien vocal d'un dictionnaire comporte un nom de la commande vocale, et en ce que le dispositif client est conçu, après réception dictionnaire, pour lire et afficher les noms de tout ou partie liens vocaux de ce dictionnaire.
6. Système selon la revendication 5 caractérisé en ce que le chaque lien vocal d'un dictionnaire comporte un attribut ( type ) permettant spécifier si une commande vocale doit être cachée ou non, en que dispositif client (2) est conçu, après réception d'un dictionnaire, pour lire et afficher les noms uniquement des liens vocaux dont la valeur de l'attribut type autorise la visualisation.
7. Serveur de données comportant une unité de traitement (5) unité mémoire (4) qui est accessible au moins en lecture par l'unité de traitement (5), et dans laquelle sont stockées une pluralité de pages destinées à être visualisées sur un dispositif client (2) après téléchargement via un réseau de télécommunication (3), caractérisé en ce l'unité mémoire (4) comporte en lien avec chaque page au moins dictionnaire d'un ou plusieurs liens vocaux, chaque lien, vocal comportant au moins un enregistrement audio d'une commande vocale.
8. Serveur selon la revendication 7 caractérisé en ce que chaque page du serveur comporte une information identifiant le ou les dictionnaires associés.
9. Serveur selon la revendication 7 ou 8 caractérisé en ce que chaque lien vocal comporte une adresse permettant de localiser une ressource, de préférence dans l'unité mémoire (4) du serveur (1).
10. Dispositif client (2) qui d'une part est apte à échanger des données avec un serveur (1) distant et à télécharger et visualiser des pages de données stockees en mémoire du serveur (1), et qui d'autre part comprend des moyens (11,12) permettant l'enregistrement d'une commande vocale prononcée par un utilisateur, et des moyens de reconnaissance vocale permettant, à partir d'une commande vocale enregistrée, déterminer et de commander automatiquement l'exécution action associée à cette commande, caractérisé en ce que le dispositif client (2) est conçu pour télécharger en mémoire depuis le serveur (1) un dictionnaire qui est associé à une page visualisée et qui contient un ou plusieurs liens vocaux, chaque lien vocal comprenant au moins un enregistrement audio d'une commande vocale, et en ce que les moyens de reconnaissance vocale du dispositif client (2) comportent un programme de reconnaissance vocale (E) qui est conçu pour réaliser une comparaison de l'enregistrement audio correspondant à la commande vocale prononcée par un utilisateur avec le ou les enregistrements audio de chaque dictionnaire qui a été téléchargé.
FR0007359A 2000-06-08 2000-06-08 Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client Expired - Fee Related FR2810125B1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
FR0007359A FR2810125B1 (fr) 2000-06-08 2000-06-08 Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client
US09/756,418 US20020010585A1 (en) 2000-06-08 2001-01-08 System for the voice control of a page stored on a server and downloadable for viewing on a client device
AU2001262476A AU2001262476A1 (en) 2000-06-08 2001-05-21 Voice-operated system for controlling a page stored on a server and capable of being downloaded for display on client device
PCT/FR2001/001560 WO2001095087A1 (fr) 2000-06-08 2001-05-21 Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0007359A FR2810125B1 (fr) 2000-06-08 2000-06-08 Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client

Publications (2)

Publication Number Publication Date
FR2810125A1 true FR2810125A1 (fr) 2001-12-14
FR2810125B1 FR2810125B1 (fr) 2004-04-30

Family

ID=8851103

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0007359A Expired - Fee Related FR2810125B1 (fr) 2000-06-08 2000-06-08 Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client

Country Status (4)

Country Link
US (1) US20020010585A1 (fr)
AU (1) AU2001262476A1 (fr)
FR (1) FR2810125B1 (fr)
WO (1) WO2001095087A1 (fr)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE391986T1 (de) 2000-11-23 2008-04-15 Ibm Sprachnavigation in webanwendungen
EP1209660B1 (fr) * 2000-11-23 2008-04-09 International Business Machines Corporation Navigation vocale dans des applications sur internet
US6728681B2 (en) * 2001-01-05 2004-04-27 Charles L. Whitham Interactive multimedia book
US9374451B2 (en) * 2002-02-04 2016-06-21 Nokia Technologies Oy System and method for multimodal short-cuts to digital services
FR2836249A1 (fr) * 2002-02-18 2003-08-22 Converge Online Procede de synchronisation des interactions multimodales dans la presentation d'un contenu multimodal sur un support multimodal
US8611919B2 (en) * 2002-05-23 2013-12-17 Wounder Gmbh., Llc System, method, and computer program product for providing location based services and mobile e-commerce
US7277697B2 (en) * 2003-05-23 2007-10-02 Adesh Desai Method and system for establishing a teleconference over a telephony network
US9202467B2 (en) * 2003-06-06 2015-12-01 The Trustees Of Columbia University In The City Of New York System and method for voice activating web pages
US20050277410A1 (en) * 2004-06-10 2005-12-15 Sony Corporation And Sony Electronics, Inc. Automated voice link initiation
US8768711B2 (en) * 2004-06-17 2014-07-01 Nuance Communications, Inc. Method and apparatus for voice-enabling an application
US20080080678A1 (en) * 2006-09-29 2008-04-03 Motorola, Inc. Method and system for personalized voice dialogue
DE102007042582A1 (de) * 2007-09-07 2009-03-12 Audi Ag Verfahren zum Entwickeln einer Dialogstruktur für ein künstliches Sprachsystem
US8453058B1 (en) 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
TWI619115B (zh) * 2014-12-30 2018-03-21 鴻海精密工業股份有限公司 會議記錄裝置及其自動生成會議記錄的方法
US20170374529A1 (en) * 2016-06-23 2017-12-28 Diane Walker Speech Recognition Telecommunications System with Distributable Units

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5355433A (en) * 1990-03-26 1994-10-11 Ricoh Company, Ltd. Standard pattern comparing system for eliminating duplicative data entries for different applications program dictionaries, especially suitable for use in voice recognition systems
EP0847179A2 (fr) * 1996-12-04 1998-06-10 AT&T Corp. Système et méthode d'interface vocale aux informations hyperliées
WO1999048088A1 (fr) * 1998-03-20 1999-09-23 Inroad, Inc. Navigateur web a commande vocale

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4440598C1 (de) * 1994-11-14 1996-05-23 Siemens Ag Durch gesprochene Worte steuerbares Hypertext-Navigationssystem, Hypertext-Dokument für dieses Navigationssystem und Verfahren zur Erzeugung eines derartigen Dokuments
US6188985B1 (en) * 1997-01-06 2001-02-13 Texas Instruments Incorporated Wireless voice-activated device for control of a processor-based host system
US6101472A (en) * 1997-04-16 2000-08-08 International Business Machines Corporation Data processing system and method for navigating a network using a voice command
US6157705A (en) * 1997-12-05 2000-12-05 E*Trade Group, Inc. Voice control of a server
US6636831B1 (en) * 1999-04-09 2003-10-21 Inroad, Inc. System and process for voice-controlled information retrieval

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5355433A (en) * 1990-03-26 1994-10-11 Ricoh Company, Ltd. Standard pattern comparing system for eliminating duplicative data entries for different applications program dictionaries, especially suitable for use in voice recognition systems
EP0847179A2 (fr) * 1996-12-04 1998-06-10 AT&T Corp. Système et méthode d'interface vocale aux informations hyperliées
WO1999048088A1 (fr) * 1998-03-20 1999-09-23 Inroad, Inc. Navigateur web a commande vocale

Also Published As

Publication number Publication date
AU2001262476A1 (en) 2001-12-17
FR2810125B1 (fr) 2004-04-30
US20020010585A1 (en) 2002-01-24
WO2001095087A1 (fr) 2001-12-13

Similar Documents

Publication Publication Date Title
FR2810125A1 (fr) Systeme de commande vocale d&#39;une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client
EP3053162B1 (fr) Procede de dialogue entre une machine, telle qu&#39;un robot humanoïde, et un interlocuteur humain, produit programme d&#39;ordinateur et robot humanoïde pour la mise en oeuvre d&#39;un tel procede
EP1404094B1 (fr) Système de téléchargement de contenu multimédia et procédé associé
EP0974221A1 (fr) Dispositif de commande vocale pour radiotelephone, notamment pour utilisation dans un vehicule automobile
EP1585110B1 (fr) Système d&#39;application vocale
US20020165719A1 (en) Servers for web enabled speech recognition
US20030009517A1 (en) Web enabled recognition architecture
US20020178182A1 (en) Markup language extensions for web enabled recognition
CA2345661A1 (fr) Navigateur interactif et systemes interactifs
CA2213591A1 (fr) Systeme et methode d&#39;interfacage vocal utilisant des informations hyperlien
FR2923928A1 (fr) Systeme d&#39;interpretation simultanee automatique.
WO2013178741A1 (fr) Systeme et procede pour generer des comportements contextuels d&#39;un robot mobile executes en temps reel
US7068308B2 (en) Removable media host executables
EP1285435B1 (fr) Analyse syntaxique et semantique de commandes vocales
EP2419823A1 (fr) Procede d&#39;assistance au developpement ou a l&#39;utilisation d&#39;un systeme complexe
EP2164237A1 (fr) Procédé et système de communication pour l&#39;affichage d&#39;un lien vers un service à partir d&#39;une expression énoncée en cours de conversation
FR2554267A1 (fr) Appareil commande par la parole
CN111316622A (zh) 录音方法与装置
EP3032410A1 (fr) Procédé de fourniture d&#39;un service informatique et système informatique pour la mise en oeuvre du procédé
FR2884380A1 (fr) Procede et systeme de generation automatique de composants pour la conception de services vocaux.
JP2022100498A (ja) 情報処理装置、制御方法、プログラム
FR2883684A1 (fr) Procede et dispositif d&#39;appairage radio dynamique entre un peripherique et un point d&#39;acces a un reseau partage.
EP4198971A1 (fr) Method for selecting voice contents recorded in a database, according to their veracity factor
CN115730048A (zh) 一种会话处理方法、装置、电子设备及可读存储介质
FR3130422A1 (fr) Procédé de sélection de contenus vocaux en- registrés dans une base de données, en fonction de leur facteur de véracité.

Legal Events

Date Code Title Description
ST Notification of lapse