ES2369660T3 - Sistema de descarga de contenido multimedia y procedimiento asociado. - Google Patents

Sistema de descarga de contenido multimedia y procedimiento asociado. Download PDF

Info

Publication number
ES2369660T3
ES2369660T3 ES03292368T ES03292368T ES2369660T3 ES 2369660 T3 ES2369660 T3 ES 2369660T3 ES 03292368 T ES03292368 T ES 03292368T ES 03292368 T ES03292368 T ES 03292368T ES 2369660 T3 ES2369660 T3 ES 2369660T3
Authority
ES
Spain
Prior art keywords
terminal
proposition
request
user
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03292368T
Other languages
English (en)
Inventor
Jean-Philippe Fournier
Georges Passet
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bouygues Telecom SA
Original Assignee
Bouygues Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bouygues Telecom SA filed Critical Bouygues Telecom SA
Application granted granted Critical
Publication of ES2369660T3 publication Critical patent/ES2369660T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72445User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting Internet browser applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/38Displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2207/00Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place
    • H04M2207/18Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place wireless networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/64Details of telephonic subscriber devices file transfer between terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Abstract

Sistema de descarga de contenido multimedia hacia un terminal móvil (50; 60, 70) a través de una red de telefonía móvil (10), comprendiendo dicho sistema un dispositivo de reconocimiento de voz (40), y una base de datos (30) conectada a la red (10) y que contiene archivos multimedia, siendo adecuado el dispositivo de reconocimiento de voz (40) para recibir una petición de voz procedente de un usuario y transmitida por el terminal (50; 60, 70), siendo adecuado el dispositivo de reconocimiento de voz (40) para interpretar la petición que recibe y para devolver al terminal (50; 60, 70) una o varias proposiciones de interpretación designando uno o más archivos contenidos en la base de datos (30), de modo que el terminal puede devolver una proposición seleccionada por el usuario, lo cual provoca la descarga de un archivo multimedia correspondiente a la proposición seleccionada de la base de datos (30) hacia el terminal (50; 60, 70) a través de la red de telefonía móvil (10), transmitiéndose la petición de voz y la o las proposiciones de interpretación en forma de paquetes de datos a través de un canal de datos.

Description

Sistema de descarga de contenido multimedia y procedimiento asociado.
La presente invención se refiere al campo de la navegación en Internet o cualquier otra red (GSM, GPRS, UMTS) cualquiera que sea el protocolo utilizado (WAP, I-Mode, etc.) gracias a un terminal móvil o un ordenador.
Se conocen unos sistemas que permiten acceder a sitios de Internet en los que el usuario se conecta a un servidor que le permite establecer un contacto con otros servidores y obtener información.
El documento WO 01/69928 describe un sistema de descarga que comprende dos modos de realización distintos. En un primer modo de realización, se descarga un contenido a través de una red hacia un televisor. En un segundo modo de realización, se descarga un contenido a través de una red de telefonía móvil en un terminal móvil. Las peticiones de voz se transmiten en lenguaje natural del usuario en forma de datos de voz y se devuelve una lista de proposiciones en la pantalla de la televisión.
El documento US nº 6.101.473 describe un sistema de navegación que comprende un servidor web, un terminal informático de tipo PC que incluye un navegador web y un dispositivo de reconocimiento de voz que acopla el servidor con una red de telefonía convencional (de tipo por cable). El dispositivo de reconocimiento de voz es adecuado para interpretar una orden de voz de navegación emitida por el usuario desde su estación telefónica conectada a la red de telefonía convencional y para controlar el servidor web en función de esta interpretación. El servidor web es adecuado para devolver datos gráficos hacia el terminal informático, en función de la orden de voz emitida por el usuario. Este sistema de navegación permite que un usuario navegue por Internet formulando órdenes de navegación o de descarga en lenguaje natural a partir de su teléfono fijo.
Gracias a sistemas de este tipo, el usuario puede descargar contenido multimedia hacia su terminal informático formulando verbalmente su petición desde su estación telefónica fija.
Un inconveniente de estos sistemas es que se basan en la utilización en paralelo de un terminal informático y de un teléfono fijo y que comprenden unos medios de funcionamiento relativamente complejos.
Otro inconveniente de estos sistemas es que el dispositivo de reconocimiento de voz no siempre realiza una interpretación correcta de las peticiones del usuario. En particular, cuando el usuario se encuentra en un entorno ruidoso, puede perturbarse su voz y puede verse alterado el contenido de su petición.
De ello resulta que el contenido multimedia que recibe no corresponde al que ha pedido.
Este inconveniente es particularmente molesto en el caso en el que el usuario ordena la descarga de una película, de una secuencia de vídeo o sonora (emisión de radio o de televisión), de una animación, de un programa, etc.
En efecto, la descarga de archivos puede resultar relativamente larga y por tanto costosa para el usuario.
Por otro lado, la descarga de contenido puede formar parte de un servicio de pago.
Por ello, es deseable que las peticiones del usuario se interpreten correctamente para evitar cualquier descarga inútil.
Para ello, la invención propone un sistema de descarga de contenido multimedia hacia un terminal móvil según la reivindicación 1.
Este sistema permite ventajosamente que el usuario verifique que su petición se ha interpretado correctamente antes de confirmar la descarga de un archivo. Este sistema evita por tanto cualquier descarga inútil.
Este sistema se aplica a terminales tales como teléfonos móviles equipados con navegadores de Internet, ordenadores conectados a, o que integran, un terminal de conexión a la red móvil, agendas electrónicas, asistentes personales, etc. adecuados para intercambiar información a través de la red de telefonía móvil y para recibir archivos de datos.
Estos terminales permiten navegar por Internet, descargar datos, utilizar medios específicos de selección que comprenden por ejemplo una pantalla táctil y un lápiz.
Utilizando terminales de este tipo, el usuario confirma su petición de manera sencilla y rápida antes de que se efectúe la descarga del contenido multimedia correspondiente.
En una forma de realización de la invención, el dispositivo de reconocimiento de voz es adecuado para generar y transmitir al terminal una lista que contiene varias proposiciones de interpretación más probables.
Las proposiciones pueden transmitirse al terminal en forma de hipervínculos en relación con archivos multimedia contenidos en la base de datos, pudiendo activar el usuario el vínculo correspondiente a su petición.
De manera ventajosa, al estar las proposiciones asociadas a probabilidades de correspondencia con la petición del usuario, pueden clasificarse según su orden de probabilidad.
Esta disposición permite disminuir aún más el tiempo necesario para que el usuario elija el contenido que desea descargar.
De manera ventajosa, el sistema puede comprender unos medios para registrar la petición de voz.
De manera ventajosa, el terminal es un terminal móvil que presenta un canal de datos.
En una forma de realización de la invención, el sistema comprende unos medios para activar o desactivar el modo de funcionamiento con devolución de proposición(es) de interpretación al terminal y:
-
en el caso en el que este modo de funcionamiento está activado, el dispositivo de reconocimiento de voz es adecuado para devolver al terminal una o varias proposiciones de interpretación,
-
en el caso en el que este modo de funcionamiento está desactivado, el dispositivo de reconocimiento de voz es adecuado para transmitir directamente una interpretación a un servidor de acceso a la base de datos.
De manera ventajosa, el terminal comprende unos medios para medir un parámetro relativo a la calidad de la red y, en función de este parámetro, activar o desactivar el modo de funcionamiento con devolución de proposición(es).
Alternativamente, los medios para activar o desactivar el modo de funcionamiento con devolución de proposición(es) al terminal pueden ser acciondaos por un usuario del terminal.
La invención se refiere asimismo a un procedimiento de descarga de contenido multimedia hacia un terminal según la reivindicación 9.
La señal de petición de voz es una señal de datos.
En una forma de realización de la invención, las proposiciones se devuelven desde la base de datos al terminal en forma de un mensaje de texto.
En otra forma de realización de la invención, las proposiciones se devuelven desde la base de datos al terminal en forma de un mensaje de voz transmitido como archivo de sonido o mediante streaming de audio.
De manera ventajosa, las proposiciones se presentan por el terminal en un orden decreciente de probabilidad de correspondencia con la petición.
En una forma de realización de la invención, se selecciona una proposición situando un cursor sobre esta proposición, y después pulsando una tecla de validación de un teclado asociado al terminal.
En el caso en el que el teléfono está dotado de una pantalla táctil (que permite la introducción de información mediante simple presión o desplazamiento del dedo por la pantalla), se selecciona una proposición situando un lápiz sobre la pantalla táctil al nivel de la proposición en cuestión.
En otra forma de realización de la invención, se selecciona una proposición haciendo que se desplacen las proposiciones hasta la que se desea seleccionar, y después pulsando una tecla de validación de un teclado asociado al terminal.
En otra forma de realización de la invención más, se selecciona una proposición pulsando una tecla de un teclado asociado al terminal que identifica la proposición.
En otra forma de realización más, se selecciona una proposición enunciando verbalmente una referencia que identifica esta proposición.
Cuando no se selecciona ninguna de las proposiciones, se renueva la operación de procesamiento de la petición por el dispositivo de reconocimiento de voz eliminando las proposiciones no seleccionadas de una lista de expresiones que puede comprender el dispositivo de reconocimiento de voz.
Habiendo registrado previamente la petición de voz, esta nueva operación de procesamiento puede realizarse a partir de la petición inicial registrada.
Alternativamente, esta nueva operación de procesamiento puede realizarse sobre una nueva petición.
Cuando no se selecciona ninguna de las proposiciones, la nueva petición puede formularse en modo de texto o gráfico.
En una forma de realización de la invención, se activa previamente un modo de funcionamiento con devolución de proposición(es) al terminal.
Otras características y ventajas se pondrán más claramente de manifiesto a partir de la siguiente descripción, que es meramente ilustrativa y no limitativa y que debe leerse con respecto a la figura 1 adjunta, que es una representación esquemática de un sistema de descarga según un modo de realización de la invención.
En la figura 1, el sistema de descarga utiliza una red de telefonía móvil 10. Este sistema comprende un servidor de acceso 20 conectado a la red de telefonía móvil 10. Este servidor de acceso 20 también está conectado a una base de datos 30 que contiene un conjunto de archivos multimedia y a un dispositivo de reconocimiento y de síntesis de voz 40.
Los usuarios pueden utilizar el sistema de descarga por medio de un terminal adecuado para intercambiar información a través de la red de telefonía móvil 10 y para recibir archivos de datos. Puede tratarse, por ejemplo, de un teléfono móvil 50 equipado con un navegador de Internet web o WAP, o incluso de un ordenador 60 conectado a,
o que integra, un terminal 70 de conexión a la red 10 móvil. El terminal es adecuado, en particular, para recibir e interpretar páginas HTML. Es adecuado para visualizar hipervínculos e hipermedios activables por el usuario.
El terminal también puede presentarse en forma de una agenda electrónica o asistente personal. Estos aparatos comprenden generalmente una pantalla táctil y un lápiz que permiten al usuario escribir sobre la pantalla o seleccionar órdenes.
El usuario de un teléfono móvil 50 que esté buscando un contenido multimedia puede conectarse al servidor 20 navegando por Internet (utilizando el protocolo WAP, I-Mode u otro) u ordenando el acceso directo a este servidor
20. El teléfono móvil 50 comprende un canal de datos y eventualmente un canal de voz.
Una página HTML se visualiza en la pantalla del teléfono móvil 50 indicando al usuario que puede buscar un contenido formulando una petición verbal. Este contenido puede estar constituido por un archivo que contiene una película, una secuencia de vídeo o sonora (emisión de radio o de televisión, música), una animación, un programa, etc.
Por ejemplo, si el usuario desea descargar una película, pronuncia el título de esta película. Su petición se transmite al servidor de acceso 20 en forma de un mensaje de voz o en forma de paquetes de datos. En este último caso, el teléfono móvil 50 convierte la señal de voz del usuario en datos. El servidor de acceso 20 registra la petición y la transmite al dispositivo de reconocimiento de voz 40. El dispositivo de reconocimiento de voz 40 recibe e interpreta la petición del usuario.
Según un primer modo de funcionamiento “sin ayuda”, el dispositivo de reconocimiento de voz 40 devuelve al servidor de acceso 20 la interpretación más probable de la petición del usuario. El servidor de acceso 20 ordena entonces la descarga del archivo correspondiente a la elección del usuario de la base de datos 30 hacia el teléfono móvil 50.
Según un segundo modo de funcionamiento “con ayuda” el dispositivo de reconocimiento de voz 40 devuelve al servidor de acceso 20 un conjunto de proposiciones de interpretación de la petición del usuario. Estas proposiciones corresponden a títulos de películas disponibles en la base de datos 30. Cada una de estas proposiciones está asociada a una probabilidad de correspondencia con la petición del usuario.
Según una primera variante de este sistema, el servidor de acceso 20 transmite al teléfono móvil 50 el conjunto de proposiciones a través del canal de datos en forma de un mensaje de texto que se visualiza en la pantalla del teléfono 50. Estas proposiciones están asociadas a probabilidades de correspondencia con la petición del usuario y se visualizan en la pantalla en orden decreciente de probabilidades.
El usuario del terminal verifica que su petición se encuentra entre las proposiciones que se visualizan en su pantalla.
El usuario puede seleccionar una de las proposiciones desplazando un cursor sobre la proposición que le interesa o designándola con un lápiz o haciendo que se desplacen las proposiciones, validando después su elección pulsando una tecla de validación de su teclado.
Alternativamente, puede hacerse referencia a las proposiciones mediante números.
En este caso, el usuario puede seleccionar una de las proposiciones marcando el número de la proposición que le interese y validando su elección pulsando una tecla de validación de su teclado.
También puede enunciar verbalmente el número de la proposición que le interese.
El teléfono móvil 50 devuelve al servidor de acceso 20 la proposición seleccionada. El servidor de acceso 20 ordena la descarga del archivo correspondiente a la elección del usuario de la base de datos 30 hacia el teléfono móvil 50.
Ventajosamente, las proposiciones pueden ser devueltas por el servidor de acceso 20 al teléfono móvil 50 en forma de hipervínculos en relación con archivos de contenidos multimedia de la base de datos 30. El usuario puede activar el vínculo que le interese. El teléfono móvil 50 está entonces directamente en relación con la base de datos para la descarga del archivo seleccionado.
Este archivo puede descargarse en forma comprimida. En este caso, este archivo podrá ser leído por un software de descompresión (un lector de contenido). Un software de este tipo puede estar incluido por ejemplo en el teléfono móvil 50.
El servidor de acceso 20 registra datos referentes a la operación de descarga y la identidad del teléfono móvil 50 en un registro. Este registro servirá para facturar el servicio de descarga al usuario. Por ejemplo, este servicio podrá trasladarse directamente a su factura de teléfono o descontarse de su suscripción.
En el caso en el que ninguna de las proposiciones corresponda a su petición, el usuario tiene la posibilidad de seleccionar la proposición “ninguna de estas proposiciones”. El teléfono móvil 50 devuelve al servidor de acceso 20 una información que indica que el usuario no está satisfecho con las proposiciones que se le han dado. El servidor de acceso 20 envía de nuevo al dispositivo de reconocimiento de voz la petición del usuario que ha registrado. El dispositivo de reconocimiento de voz procede a un nuevo reconocimiento basándose en este registro, eliminando las proposiciones de interpretación que el usuario no ha seleccionado.
Esta eliminación consiste en eliminar de una lista de expresiones que puede comprender el dispositivo de reconocimiento de voz, las proposiciones no seleccionadas por el usuario.
Según una segunda variante de este sistema, el servidor de acceso transmite al teléfono móvil 50 el conjunto de las proposiciones en forma de un mensaje de voz. Este mensaje puede ser transportado por el canal de voz o el canal de datos. En los dos casos, puede descargarse hacia el teléfono móvil en forma de un archivo de sonido o incluso ser transmitido mediante “streaming de audio” (envío y lectura en tiempo real de datos de audio comprimidos). Al igual que antes, estas proposiciones se enuncian de la más probable a la menos probable. El usuario selecciona una de las proposiciones pulsando una tecla del terminal correspondiente a la proposición que desea seleccionar.
Alternativamente, las diferentes proposiciones pueden enunciarse sucesivamente y el usuario accede a la proposición siguiente o valida la proposición que acaba de enunciarse pulsando determinadas teclas de su teclado.
Todavía alternativamente, el usuario selecciona una proposición enunciando verbalmente una referencia que identifica esta proposición. Las proposiciones pueden estar asociadas, por ejemplo, a letras o a números. El usuario enuncia entonces el número o la letra de la proposición que le interese.
Según una tercera variante de este sistema, el servidor de acceso 20 transmite el conjunto de las proposiciones a través del canal de datos en forma de datos así como un mensaje de voz asociado. Las proposiciones se visualizan en la pantalla del teléfono móvil 50 mientras que el terminal móvil 50 lee el mensaje de voz. El mensaje de voz puede consistir en la lista de las proposiciones visualizadas o cualquier otra indicación a la atención del usuario. Puede tratarse de un mensaje del tipo: “Seleccione una de las proposiciones visualizadas haciendo clic en la que corresponda a su petición”. El mensaje de voz puede generarse en el interior de la red (por ejemplo, el dispositivo de reconocimiento de voz 40 comprende un módulo de síntesis de voz) o por el propio teléfono 50.
En las tres variantes expuestas anteriormente, el sistema de descarga permite al usuario formular verbalmente sus peticiones y obtener simultáneamente una devolución gráfica. La transmisión y la visualización de proposiciones pueden realizarse mientras no está establecida ninguna comunicación telefónica entre el terminal 50 y la red 10. Se desprende de ello que el canal de voz no está abierto permanentemente.
Cuando después de varias tentativas, el reconocimiento de voz no ha tenido éxito, el servidor de acceso 20 propone al usuario introducir su petición utilizando el teclado del terminal 50 o deletrear la o las palabras correspondientes a su petición. En el caso en el que el usuario deletrea la o las palabras correspondientes a su petición, el dispositivo de reconocimiento de voz 40 pasa a modo de reconocimiento alfanumérico.
El modo de funcionamiento del dispositivo “con ayuda” no está necesariamente activado permanentemente. Concretamente, en el caso en el que la conexión entre el terminal 50 y la red 10 es de buena calidad, las peticiones de los usuarios generalmente se transmiten y se interpretan correctamente por el dispositivo de reconocimiento de voz 40. El teléfono móvil 50 puede comprender unos medios para medir un parámetro relativo a la calidad de la conexión terminal/red y, en función del resultado de esta medición, activar o desactivar el modo de funcionamiento “con ayuda” del sistema de descarga.
5 Esta activación o desactivación del modo de funcionamiento “con ayuda” también puede realizarla el propio usuario.
Naturalmente, el sistema descrito anteriormente se puede realizar con un ordenador 60 en lugar del teléfono móvil
50. En este caso, el ordenador 60 debe conectarse a, o estar integrado en, un terminal 70 de conexión a la red 10 móvil así como a unos medios de captura de sonido.
10 Este sistema también se puede realizar con una agenda electrónica o un asistente personal que puedan conectarse a una red de telefonía móvil.
Determinadas agendas u ordenadores comprenden una pantalla táctil de reconocimiento de escritura. Si la petición
15 del usuario se interpreta mal por el dispositivo de reconocimiento de voz, el usuario puede escribir su petición en la pantalla táctil.
Se entenderá que el sistema de descarga de contenido descrito anteriormente se puede realizar con cualquier equipo que permita acceder a una red de telefonía móvil.

Claims (22)

  1. REIVINDICACIONES
    1.
    Sistema de descarga de contenido multimedia hacia un terminal móvil (50; 60, 70) a través de una red de telefonía móvil (10), comprendiendo dicho sistema un dispositivo de reconocimiento de voz (40), y una base de datos (30) conectada a la red (10) y que contiene archivos multimedia, siendo adecuado el dispositivo de reconocimiento de voz (40) para recibir una petición de voz procedente de un usuario y transmitida por el terminal (50; 60, 70), siendo adecuado el dispositivo de reconocimiento de voz (40) para interpretar la petición que recibe y para devolver al terminal (50; 60, 70) una o varias proposiciones de interpretación designando uno o más archivos contenidos en la base de datos (30), de modo que el terminal puede devolver una proposición seleccionada por el usuario, lo cual provoca la descarga de un archivo multimedia correspondiente a la proposición seleccionada de la base de datos (30) hacia el terminal (50; 60, 70) a través de la red de telefonía móvil (10), transmitiéndose la petición de voz y la o las proposiciones de interpretación en forma de paquetes de datos a través de un canal de datos.
  2. 2.
    Sistema según la reivindicación 1, en el que el dispositivo de reconocimiento de voz (40) es adecuado para generar y transmitir al terminal (50; 60, 70) una lista que contiene varias proposiciones de interpretación más probables.
  3. 3.
    Sistema según la reivindicación 2, en el que, al estar las proposiciones asociadas a probabilidades de correspondencia con la petición del usuario, las proposiciones de la lista de proposiciones se clasifican según su orden de probabilidad.
  4. 4.
    Sistema según una de las reivindicaciones 1 a 3, en el que las proposiciones se transmiten al terminal (50; 60, 70) en forma de hipervínculos en relación con archivos multimedia contenidos en la base de datos (30), pudiendo activar el usuario el vínculo correspondiente a su petición.
  5. 5.
    Sistema según una de las reivindicaciones anteriores, que comprende unos medios para registrar la petición de voz.
  6. 6.
    Sistema según una de las reivindicaciones anteriores, que comprende unos medios para activar o desactivar el modo de funcionamiento con devolución de proposición(es) de interpretación al terminal (50; 60, 70) y:
    -
    en el caso en el que este modo de funcionamiento está activado, el dispositivo de reconocimiento de voz (40) es adecuado para devolver al terminal (50; 60, 70) una o varias proposiciones de interpretación,
    -
    en el caso en el que este modo de funcionamiento está desactivado, el dispositivo de reconocimiento de voz es adecuado para transmitir directamente una interpretación a un servidor de acceso (50) a la base de datos.
  7. 7.
    Sistema según la reivindicación 6, en el que el terminal (50; 60, 70) comprende unos medios para medir un parámetro relativo a la calidad de la red y, en función de este parámetro, activar o desactivar el modo de funcionamiento con devolución de proposición(es).
  8. 8.
    Sistema según la reivindicación 6, en el que los medios para activar o desactivar el modo de funcionamiento con devolución de proposición(es) al terminal (50; 60, 70) pueden ser accionados por un usuario del terminal (50; 60, 70).
  9. 9.
    Procedimiento de descarga de contenido multimedia hacia un terminal móvil (50; 60, 70) a través de una red de telefonía móvil (10), que comprende las etapas siguientes:
    -
    un usuario transmite desde un terminal (50; 60, 70) a través de la red de telefonía móvil (10) una petición de voz a un dispositivo de reconocimiento de voz (40),
    -
    el dispositivo de reconocimiento de voz (40) procesa la petición y devuelve al terminal (50; 60, 70) una o varias proposiciones de interpretación que designa(n) uno o más archivos multimedia contenidos en una base de datos
    (30) conectada a la red (10),
    -
    el usuario selecciona la proposición correspondiente a la petición de voz, lo cual provoca la descarga de un archivo multimedia correspondiente a la proposición seleccionada de la base de datos (30) hacia el terminal (50; 60, 70) a través de la red de telefonía móvil (10),
    transmitiéndose la petición de voz y la o las proposiciones de interpretación en forma de paquetes de datos a través de un canal de datos.
  10. 10.
    Procedimiento según la reivindicación 9, en el que las proposiciones se devuelven desde la base de datos (30) al terminal (50; 60, 70) en forma de un mensaje de texto.
  11. 11.
    Procedimiento según la reivindicación 9, en el que las proposiciones se devuelven desde la base de datos (30) al terminal (50; 60, 70) en forma de un mensaje de voz transmitido como archivo de sonido o mediante streaming de audio.
  12. 12.
    Procedimiento según una de las reivindicaciones 9 a 11, en el que las proposiciones se presentan por el terminal (50; 60, 70) según un orden decreciente de probabilidad de correspondencia con la petición.
  13. 13.
    Procedimiento según la reivindicación 10, en el que el usuario selecciona una proposición situando un cursor sobre esta proposición, y después pulsando una tecla de validación de un teclado asociado al terminal (50; 60, 70).
  14. 14.
    Procedimiento según una de las reivindicaciones 9 a 12, en el que el usuario selecciona una proposición haciendo que se desplacen las proposiciones hasta la que se desea seleccionar, y pulsando después una tecla de validación de un teclado asociado al terminal (50; 60, 70).
  15. 15.
    Procedimiento según una de las reivindicaciones 9 a 11, en el que el usuario selecciona una proposición pulsando una tecla de un teclado asociado al terminal (50; 60, 70) que identifica esta proposición.
  16. 16.
    Procedimiento según una de las reivindicaciones 9 a 12, en el que el usuario selecciona una proposición enunciando verbalmente una referencia que identifica esta proposición.
  17. 17.
    Procedimiento según una de las reivindicaciones 9 a 12, en el que el usuario selecciona una proposición situando un lápiz sobre una pantalla táctil asociada al terminal, al nivel de la proposición considerada.
  18. 18.
    Procedimiento según una de las reivindicaciones 9 a 17, en el que cuando no se selecciona ninguna de las proposiciones, se renueva la operación de procesamiento de la petición por el dispositivo de reconocimiento de voz
    (40) eliminando las proposiciones no seleccionadas de una lista de expresiones que puede comprender el dispositivo de reconocimiento de voz (40).
  19. 19.
    Procedimiento según la reivindicación 18, en el que, habiendo registrado previamente la petición de voz, esta nueva operación de procesamiento se realiza a partir de la petición inicial registrada.
  20. 20.
    Procedimiento según la reivindicación 18, en el que esta nueva operación de procesamiento se realiza sobre una nueva petición.
  21. 21.
    Procedimiento según la reivindicación 20, en el que, cuando no se selecciona ninguna de las proposiciones, la nueva petición se formula en modo de texto o gráfico.
  22. 22.
    Procedimiento según una de las reivindicaciones 9 a 21, en el que se activa previamente un modo de funcionamiento con devolución de proposición(es) al terminal (50; 60, 70).
ES03292368T 2002-09-26 2003-09-26 Sistema de descarga de contenido multimedia y procedimiento asociado. Expired - Lifetime ES2369660T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0211946 2002-09-26
FR0211946A FR2845233B1 (fr) 2002-09-26 2002-09-26 Systeme de telechargement de contenu multimedia et procede associe

Publications (1)

Publication Number Publication Date
ES2369660T3 true ES2369660T3 (es) 2011-12-02

Family

ID=31971009

Family Applications (1)

Application Number Title Priority Date Filing Date
ES03292368T Expired - Lifetime ES2369660T3 (es) 2002-09-26 2003-09-26 Sistema de descarga de contenido multimedia y procedimiento asociado.

Country Status (7)

Country Link
US (1) US7519397B2 (es)
EP (1) EP1404094B1 (es)
AT (1) ATE521191T1 (es)
CA (1) CA2442893A1 (es)
ES (1) ES2369660T3 (es)
FR (1) FR2845233B1 (es)
PL (1) PL362454A1 (es)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US20060104515A1 (en) * 2004-07-19 2006-05-18 King Martin T Automatic modification of WEB pages
US20060136629A1 (en) * 2004-08-18 2006-06-22 King Martin T Scanner having connected and unconnected operational behaviors
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
WO2008028674A2 (en) 2006-09-08 2008-03-13 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US8499028B2 (en) * 2005-02-23 2013-07-30 International Business Machines Corporation Dynamic extensible lightweight access to web services for pervasive devices
US9998585B2 (en) * 2005-10-05 2018-06-12 SITO Mobile R&D IP, LLC Content selection and delivery of complementary information
KR100699351B1 (ko) 2006-06-30 2007-03-23 주식회사 엘지텔레콤 푸쉬형 서비스와 결합된 플래시 컨텐츠를 제공하는 통신단말기 및 방법
US8638363B2 (en) 2009-02-18 2014-01-28 Google Inc. Automatically capturing information, such as capturing information using a document-aware device
WO2010105245A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US11146629B2 (en) * 2014-09-26 2021-10-12 Red Hat, Inc. Process transfer between servers
CN106973322A (zh) * 2015-12-09 2017-07-21 财团法人工业技术研究院 多媒体内容跨屏幕同步装置与方法以及播放装置与伺服器
JP7332272B2 (ja) * 2018-01-05 2023-08-23 株式会社Kddiエボルバ 注文受付装置、注文受付方法、及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2143980A1 (en) * 1994-04-06 1995-10-07 Raziel Haimi-Cohen User display in speech recognition system
US5594779A (en) * 1995-01-12 1997-01-14 Bell Atlantic Mobile audio program selection system using public switched telephone network
US6345250B1 (en) * 1998-02-24 2002-02-05 International Business Machines Corp. Developing voice response applications from pre-recorded voice and stored text-to-speech prompts
WO2001069928A2 (en) 2000-03-13 2001-09-20 Sri International Navigating network-based electronic multimedia content
US20020107695A1 (en) * 2001-02-08 2002-08-08 Roth Daniel L. Feedback for unrecognized speech
US6996393B2 (en) * 2001-08-31 2006-02-07 Nokia Corporation Mobile content delivery system
US6965770B2 (en) * 2001-09-13 2005-11-15 Nokia Corporation Dynamic content delivery responsive to user requests
US6754335B1 (en) * 2001-09-27 2004-06-22 Cisco Technology, Inc. Call center with location queuing and dispatching

Also Published As

Publication number Publication date
US7519397B2 (en) 2009-04-14
EP1404094B1 (fr) 2011-08-17
CA2442893A1 (fr) 2004-03-26
ATE521191T1 (de) 2011-09-15
FR2845233B1 (fr) 2005-08-26
FR2845233A1 (fr) 2004-04-02
EP1404094A1 (fr) 2004-03-31
US20040121815A1 (en) 2004-06-24
PL362454A1 (en) 2004-04-05

Similar Documents

Publication Publication Date Title
ES2369660T3 (es) Sistema de descarga de contenido multimedia y procedimiento asociado.
CN1617558B (zh) 顺序多模输入
US7966003B2 (en) Disambiguating ambiguous characters
CN101199122A (zh) 使用语言模块扩展通配符
CN100576171C (zh) 步进式标记语言与面向对象开发工具组合使用的系统和方法
CN102577334A (zh) 用于自动预测性选择网络浏览器的输入法的方法和装置
CN1855223B (zh) 音频字体输出设备、字体数据库和语言输入前端处理器
Popovici et al. Mobile application for news access and virtual community interactive services
WO2007049569A1 (ja) 情報検索システム及びサーバ装置
JP4503464B2 (ja) コンテンツ中継サーバ、コンテンツ配信システム及びコンテンツ中継方法
Roto Search on mobile phones
KR20050100794A (ko) 이동 통신 단말기에 개인홈피 정보를 제공하는 방법 및 그시스템
ES2295114T3 (es) Aparato de servicios de telecomunicaciones.
SE522047C2 (sv) Metod att navigera på websidor med hjälp av en hyperlänkdatabas
KR100702789B1 (ko) 멀티모달 플랫폼을 이용한 모바일 서비스 시스템 및 그 방법
KR20040098912A (ko) 휴대전화를 이용한 외국어학습 시스템 및 방법
JP4483212B2 (ja) 通信電子機器、辞書ゲームプログラム
KR101506437B1 (ko) Rss 기반 콘텐츠의 내용에 나오는 단어와 상기 단어에 대한 사용자 인터페이스를 제공하는 장치 및 그 방법
JP2007179319A (ja) 電子書籍情報処理装置、方法、及びコンピュータプログラム
KR20050109019A (ko) 모바일 컨텐츠 제공 시스템 및 그 방법
KR20050045631A (ko) Rfid 기술을 이용한 모바일 p2p 중개서비스 방법 및시스템
JP4501501B2 (ja) 情報表示制御装置、電子辞書プログラム
KR20060017300A (ko) 정보제공 시스템 및 정보제공방법
JP4539097B2 (ja) 文章読み上げシステム及び方法
KR20040082816A (ko) 무선 네트워크 상의 다국어 지원 방법 및 시스템