ES2307565T3 - Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva. - Google Patents

Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva. Download PDF

Info

Publication number
ES2307565T3
ES2307565T3 ES01271959T ES01271959T ES2307565T3 ES 2307565 T3 ES2307565 T3 ES 2307565T3 ES 01271959 T ES01271959 T ES 01271959T ES 01271959 T ES01271959 T ES 01271959T ES 2307565 T3 ES2307565 T3 ES 2307565T3
Authority
ES
Spain
Prior art keywords
voice
information
oriented
internet
asr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES01271959T
Other languages
English (en)
Inventor
Nathalie Amann
Laurent Strullu
Laurent Hue
Romaric Petion
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Application granted granted Critical
Publication of ES2307565T3 publication Critical patent/ES2307565T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/15Synchronised browsing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Configuración de comunicaciones - con un servidor web (SER(HTML,XML), que puede conectarse con una plataforma multimedia (VOX (TTS, ASR)) y un aparato terminal de Internet (PC), transmitiéndose en el marco de un enlace con Internet, al menos parcialmente, informaciones de página web orientadas a voz (i(xml)) a la plataforma multimedia (VOX(TTS,ASR)) e informaciones de página web orientadas a pantalla (i(html)) al aparato terminal de Internet (PC), - con al menos un agente de voz (Avox) en la plataforma multimedia (VOX(TTS,ASR)) y en el aparato terminal de Internet (PC), para el intercambio directo de comunicación de informaciones de voz (ivox), - con al menos un agente de comunicaciones (Asig) en el aparato terminal de Internet (PC) para la influencia mutua de funciones de procesamiento de las informaciones de página web orientadas a voz (i(xml)) y para la sincronización de las informaciones de página web orientadas a voz y de las orientadas a pantalla (i(xlm,i (html)) mediante la transmisión de informaciones de control y de datos (isig, idat).

Description

Configuración de comunicaciones y procedimiento para sistemas de comunicaciones con función de voz interactiva.
Desde hace algún tiempo existen crecientes esfuerzos para posibilitar, junto al acceso a informaciones sobre soporte de datos orientadas a pantalla, a un acceso orientado a voz. Un escenario típico de un tal acceso es por ejemplo la representación visual del contenido de una web a través del que pueda navegarse con órdenes de voz.
El enlace de entradas y salidas orientadas a voz y orientadas a pantalla, exige adicionalmente a los correspondientes dispositivos para entrada y salida, por ejemplo teclado, pantalla, micrófono y altavoz, un procesamiento y conversión adecuados de las informaciones trasportadas. Sobre todo, el procesamiento de la información de voz exige un coste considerable. Funciones como la conversión de texto en voz y el reconocimiento de voz, son muy costosas en cuanto a los recursos necesarios en espacio de memoria y potencia de ordenador. Por ello se implementan las funciones intensivas en recursos usualmente sólo de forma limitada en aparatos terminales.
La invención tiene como base el problema de posibilitar un acceso orientado a voz a informaciones sobre soportes de datos que no esté sometido a las limitaciones usuales de los recursos.
El problema se resuelve mediante una configuración de comunicaciones según la reivindicación 5 y una plataforma multimedia según la reivindicación 7 y un procedimiento según la reivindicación 9.
En el artículo "Mejorando la accesibilidad de la web mediante el Vox Portal (portal de voz) y una HTML dinámica alojada en Web <-> convertidor VoxML" (Computer Networks, Elsevier, Ámsterdam, Holanda, vol. 33, 06-2000) se da a conocer una configuración de comunicaciones con un servidor web que puede conectarse con una plataforma multimedia y un aparato terminal de Internet, con al menos un agente de voz en la plataforma multimedia y en el aparato terminal de Internet para el intercambio directo de comunicaciones de informaciones de voz, con al menos un agente de comunicaciones en el aparato terminal de Internet, para la influencia mutua de informaciones de procesamiento de las informaciones orientadas a voz de la página web.
En la configuración de comunicaciones correspondiente a la invención o bien el procedimiento correspondiente a la invención, está previsto en la plataforma multimedia y en el aparato terminal de Internet un agente de voz para el intercambio directo de comunicaciones de informaciones de voz. Además, está previsto un agente de comunicaciones en el aparato terminal de Internet para la influencia mutua de funciones de procesamiento de las informaciones de la página web orientadas a voz y para la sincronización de las informaciones de la página web orientadas a voz y de las orientadas a pantalla mediante la transmisión de informaciones de control y de datos; reivindicaciones 1 y 9. La configuración de comunicaciones y el procedimiento tienen la ventaja de que la plataforma multimedia asume funciones del procesamiento de la voz que precisan de muchos recursos y con ello pueden realizarse el procesamiento de la voz y un acceso orientado a voz a informaciones del página web independientemente de la potencia del aparato terminal de Internet.
Con la ayuda de la configuración de comunicaciones correspondiente a la invención o bien del procedimiento correspondiente a la invención, puede influirse sobre el procesamiento de las informaciones de voz en la plataforma multimedia, la salida de las informaciones de voz procesadas en el aparato terminal de Internet PC y la transmisión y el inicio de nuevas informaciones de la página web mediante el intercambio de informaciones de control. Las informaciones de voz convertidas pueden intercambiarse directamente entre en aparato terminal de Internet y la plataforma multimedia; reivindicaciones 2 y 10. Mediante el intercambio directo de informaciones de control e informaciones de voz convertidas, queda asegurado un procesamiento eficiente de la información; un punto importante para la interacción orientada a voz y la navegación en el acceso a informaciones de la página web.
Para tener en cuenta las distintas exigencias en la transmisión de informaciones de voz y datos, pueden estar previstas para la transmisión de informaciones de voz y la de informaciones de datos y de control previstas para la sincronización mutua entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX (TTS, ASR)) canales de transmisión separados; reivindicaciones 3 y 11. Los canales de transmisión pueden entonces estar realizados por ejemplo mediante un enlace basado en el protocolo TCP/IP, un enlace que funciona según el Asynchron Transfer Modus (modo de transferencia asíncrono) o bien un enlace basado en el estándar bluetooth; reivindicaciones 4 y 12. Los canales de transmisión separados o bien las diversas realizaciones, pueden presentar ventajas en la optimización de la calidad de transmisión y en el reparto de los recursos.
Otro aspecto esencial de la invención es el aparato terminal de Internet, que está dotado de un browser o navegador para procesar e interpretar informaciones de la página web que son transmitidas por un servidor de web a través de Internet, con un agente de voz para el intercambio directo de comunicaciones de informaciones de voz con una plataforma multimedia y con al menos un agente de comunicaciones para influir sobre las funciones de procesamiento de las informaciones de la página web orientadas a voz en la plataforma multimedia y para la sincronización del procesamiento de las informaciones de la página web orientadas a voz y orientadas a pantalla mediante la transmisión de informaciones de control y de datos; reivindicación 5. El equipamiento del aparato terminal de Internet correspondiente a la invención posee la ventaja de asegurar el procesamiento de informaciones de página web orientadas a voz y la comunicación con la plataforma multimedia, sin que tengan que implementarse estructuras de programa o bien funciones que cuestan muchos recursos sobre el aparato terminal de Internet.
Otro aspecto importante es la plataforma multimedia correspondiente a la invención, que está dotada con un browser o navegador de voz para procesar e interpretar informaciones de página web orientadas a voz que han de transmitirse desde un servidor web a través de Internet, con un agente de voz para el intercambio directo de comunicaciones de informaciones de voz con un aparato terminal de Internet PC y con medios para sincronizar las informaciones de voz intercambiadas con el aparato terminal de Internet con las informaciones de página web orientadas a voz transmitidas por el servidor de web; reivindicación 7. Además puede preverse un programa para el reconocimiento de voz y/o un programa para la conversión de texto en voz; reivindicaciones 8 y 13. La plataforma multimedia correspondiente a la invención puede así asumir etapas del procesamiento que precisan de muchos recursos, como reconocimiento de voz y la conversión de texto en voz. Puede ser ventajoso por ejemplo en estas funciones de procesamiento que para el procesamiento de la información de la página web combinada orientada a pantalla y orientada a voz se recurra a bancos de datos dispuestos bien en la plataforma multimedia o en servidores www accesibles a través de Internet; reivindicación 14. Por ejemplo, el reconocimiento de voz de un conjunto de idiomas distintos exige considerables recursos de memoria. Para descargar la configuración de comunicaciones, puede ser ventajosa la utilización de recursos externos sobre servidores www o bien bancos de datos.
A continuación se describirá más en detalle en base a un ejemplo de ejecución la configuración de comunicaciones correspondiente a la invención y el procedimiento correspondiente a la invención. Se muestra en
figura 1: una ejecución de la configuración correspondiente a la invención y
figura 2: una posible realización de un acceso a informaciones de página web con ayuda de una orden de voz.
Al respecto, las mismas denominaciones corresponden a los mismos elementos.
La figura 1 muestra una plataforma multimedia (VOX(TTS,ASR) realizada por ejemplo mediante un ordenador, que está conectada con un aparato terminal de Internet PC mediante un canal de transmisión para informaciones de voz ivox y un canal de transmisión para informaciones de datos y de control idat e isig. Para ello está equipada la plataforma multimedia (VOX(TTS,ASR) en cada caso con las correspondientes unidades de conexión -no representado- para la conexión a Internet (INT). Los canales de transmisión están realizados por ejemplo según el TCP/IP (combinación de protocolo entre el Transmissión Control Protocol (TCP), protocolo de control de la transmisión y el Internet Protocol (IP), protocolo de Internet) o bien el protocolo H.323 (estándar para la transmisión de voz a través de Internet). En una forma constructiva preferente, la plataforma multimedia está posicionada en la proximidad espacial al servidor de acceso del ofertante de servicios de Internet -no representado- mediante el que el aparato terminal de Internet PC se conecta con Internet INT. En este posicionado el tramo de transmisión es relativamente corto, con lo que la calidad de la voz de las informaciones de voz ivox intercambiadas entre el aparato terminal de Internet PC y la plataforma multimedia (VOX(TTS,ASR) puede comprobarse y controlarse. Al respecto no se conducen las informaciones de voz ivox a través de ningún enlace muy ramificado, como por ejemplo grandes tramos de Internet INT, cuya calidad escapa al control del ofertante de servicios de Internet. La plataforma multimedia VOX(TTS,ASR) y el aparato terminal de Internet PC están dotados de respectivos agentes de voz Avox para el control del intercambio de informaciones de voz ivox. El aparato terminal de Internet PC está dotado además de un agente de comunicaciones Asig, que permite la transmisión de informaciones de control isig o de datos a procesar idat. Para procesar e interpretar informaciones de página web, está dotado el aparato terminal de Internet de un browser BRhtml. La plataforma multimedia VOX(TTS,ASR) está dotada para el procesamiento de las informaciones de voz ivox de programas para el reconocimiento de voz ASR y para la conversión de texto en voz TTS y con un browser de voz BRxlm para procesar e interpretar informaciones de página web orientadas a voz i(xml).
El aparato terminal de Internet PC y la plataforma multimedia VOX(TTS,ASR) pueden conectarse mediante el establecimiento de un enlace iniciado por el aparato terminal de Internet PC a través de Internet (INT) con un servidor web SER(HTML,XML). Desde el servidor web SER(HTML,XML) se transmiten informaciones de página web combinadas orientadas a pantalla y orientadas a voz i(html,xml). Actualmente están compuestas tales informaciones de página web i(html,xml) combinadas orientadas a pantalla y orientadas a voz por partes o bien códigos fuente separados orientados a pantalla i(html) y orientados a voz i(xml), que pueden ser llamados separadamente y transmitidos separadamente. Las partes de las informaciones de página web i(xml) orientadas a voz están programadas predominantemente en un lenguaje XML (extensible markup language, lenguaje de etiquetado extensible), que apoya aplicaciones de voz, por ejemplo VoxML^{TM}, VoiceXML^{TM} o DialogML^{TM}.
La parte orientada a pantalla i(html) puede estar confeccionada por ejemplo en la técnica de programación html (hypertext markup language, lenguaje de etiquetado de hipertexto) y contiene por lo general referencias a la parte orientada a voz i(xml) que permiten cambiar del procesamiento de la parte orientada a pantalla i(html) al procesamiento de la parte orientada a voz i(xml). Mediante el browser BRhtml instalado en el aparato terminal de Internet PC, no sólo se procesa e interpreta la parte orientada a pantalla i(html), sino que también se interpretan las referencias a la parte orientada a voz i(xml) y dado el caso se inicia la transición de informaciones de control isig y/o datos idat para la transición al procesamiento o la emisión de informaciones de voz ivox. Por esta razón en la literatura de habla inglesa se utiliza también el concepto parser en lugar de browser. Se realizan esfuerzos tendentes a reunir ambas partes en un código fuente. En este caso ha de adaptarse la configuración correspondiente a la invención en el sentido de que bien el aparato terminal de Internet PC y la plataforma multimedia VOX(html,xml) estén dotados de browsers que pueden procesar e interpretar los mismos códigos fuente que reúnen informaciones de página web orientadas a pantalla y orientadas a voz, o bien sólo esté previsto un browser en el aparato terminal de Internet PC que dado el caso se ve complementado por un agente de comunicaciones adicional Asig en la plataforma multimedia VOX(HTML,XML).
En el arranque del procedimiento correspondiente a la invención, se transmite la parte orientada a pantalla i(html) desde las informaciones de página web orientadas a pantalla y a voz i(html,xml) puestas a disposición en un servidor World Wide Web SER(HTML,XML) a un aparato terminal de Internet PC. Desde el aparato terminal de Internet PC se envía, a través de un canal de transmisión para informaciones de control isig y datos idat, un mensaje que anuncia el comienzo de la sesión de Internet y transmite la dirección de la parte orientada a voz i(xml) de las informaciones de página web i(html,xml) orientadas a pantalla y orientadas a voz. Desde el servidor www SER(HTML,XML) se transmite entonces a continuación la parte orientada a voz a una plataforma multimedia VOX(TTS,ASR). El procesamiento e interpretación de la parte orientada a pantalla i(html) y de la parte orientada a voz i(xml) por parte de un browser BRhtml del aparato terminal de Internet PC o bien de un browser de voz BRxml de la plataforma multimedia VOX(TTS,ASR), se sincroniza mediante el intercambio de informaciones de control isig. Las informaciones de voz ivox se intercambian a través de un canal de transmisión previsto para ello directamente mediante agentes de voz Avox, por ejemplo para ser procesadas mediante un programa para el reconocimiento de voz ASR o para ser emitidas con dispositivos previstos para ello en el aparato terminal de Internet PC, por ejemplo altavoces. A modo de ejemplo se representa en la figura 2 una posible realización del arranque de nuevas informaciones de página web combinadas orientadas a pantalla y orientadas a voz i(html,xml), durante una sesión de Internet mediante una orden de voz ivox(nr(url)). Al respecto se supone que a través del medio de salida orientado a pantalla se indica una lista l(url) de tales informaciones de página web de las que puede ser elegida.
A continuación se representan las distintas etapas de la realización. Allí se indican las etapas de procesamiento en las que un programa de ordenador procesa datos, mediante flechas anchas y la transmisión de datos o informaciones mediante flechas dotadas de líneas.
a.
Durante una sesión de Internet muestra el aparato terminal de Internet PC con ayuda del browser BRhtml, por ejemplo sobre una pantalla, una lista l(url) de informaciones de página web i(html,xml) combinadas orientadas a pantalla y a voz.
b.
Mediante una orden de voz ivox(nr(url)) se elige una inscripción en la lista l(url). La identificación de la inscripción elegida se realiza por ejemplo mediante su número nr. La orden de voz ivox(nr(url)) se transmite con ayuda del agente de voz Avox a la plataforma multimedia VOX(TTS,ASR).
c.
Sobre la plataforma multimedia VOX(TTS,ASR) convierte el programa para el reconocimiento de voz ASR la orden de voz ivox(nr(url)) en una información de texto nr(url).
d.
La información de texto nr(url) se transmite mediante el canal para la transmisión de informaciones de datos y control al aparato terminal de Internet PC.
e.
El browser BRhtml del aparato terminal de Internet PC identifica en base a la formación de texto nr(url) la dirección url de las informaciones de página web deseadas y accede a las mismas a través de Internet (INT). Una información de página web i(html) se transmite a continuación al aparato terminal de Internet PC.
El procedimiento correspondiente a la invención y las configuraciones correspondientes a la invención no quedan limitados al ejemplo de ejecución, sino que pueden utilizarse para el siguiente procesamiento y conversión de informaciones orientadas a voz en informaciones orientadas a pantalla y a la inversa, por ejemplo para conversiones de voz, reconocimiento de voz, navegación mediante informaciones de página web mediante órdenes de voz, introducción y emisión de voz, etc., teniendo que dotarse o complementarse la plataforma multimedia VOX(TTS,ASR) con los correspondientes programas y funciones de procesamiento de datos y programas y funciones de conversión.

Claims (14)

1. Configuración de comunicaciones
-
con un servidor web (SER(HTML,XML), que puede conectarse con una plataforma multimedia (VOX(TTS, ASR)) y un aparato terminal de Internet (PC), transmitiéndose en el marco de un enlace con Internet, al menos parcialmente, informaciones de página web orientadas a voz (i(xml)) a la plataforma multimedia (VOX(TTS,ASR)) e informaciones de página web orientadas a pantalla (i(html)) al aparato terminal de Internet (PC),
-
con al menos un agente de voz (Avox) en la plataforma multimedia (VOX(TTS,ASR)) y en el aparato terminal de Internet (PC), para el intercambio directo de comunicación de informaciones de voz (ivox),
-
con al menos un agente de comunicaciones (Asig) en el aparato terminal de Internet (PC) para la influencia mutua de funciones de procesamiento de las informaciones de página web orientadas a voz (i(xml)) y para la sincronización de las informaciones de página web orientadas a voz y de las orientadas a pantalla (i(xlm,i(html)) mediante la transmisión de informaciones de control y de datos (isig, idat).
2. Configuración de comunicaciones según la reivindicación 1,
caracterizada porque
-
el procesamiento de las informaciones de voz (ivox) en la plataforma multimedia (VOX(TTS,ASR)), la emisión de las informaciones de voz (ivox) procesadas en el aparato terminal de Internet PC y la transmisión y el arranque de nuevas informaciones de página web, pueden verse influidas mediante el intercambio de informaciones de control (isig) y
-
las informaciones de voz (idat) convertidas pueden intercambiarse directamente entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS, ASR)).
3. Configuración de comunicaciones según una de las reivindicaciones 1 ó 2,
caracterizada porque
para la transmisión de las informaciones de voz (ivox) y de las informaciones de datos y de control (idat, isig) previstas para la sincronización mutua entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS,ASR)), están previstos canales de transmisión separados.
4. Sistema de comunicaciones según una de las reivindicaciones 1 a 3,
caracterizado porque
uno de los canales de transmisión está realizado mediante un enlace basado en el protocolo TCP/IP, un enlace que funciona según el Asynchron Transfer Modus (modo de transferencia asíncrono) o un enlace basado en el estándar bluetooth.
5. Aparato terminal de Internet
-
con un navegador o browser (BRhtml) para el procesamiento e interpretación de informaciones de página web que son trasmitidas desde un servidor web (SER(HTML,XML)) a través de Internet (INT),
-
con un agente de voz (Avox) para el intercambio directo de comunicaciones de informaciones de voz (ivox) con una plataforma multimedia (VOX(TTS,ASR)) y
-
con al menos un agente de comunicaciones (Asig) para influir sobre funciones de procesamiento de las informaciones de página web orientadas a voz (i(xlm)) en la plataforma multimedia (VOX(TTS,ASR)) y para la sincronización del procesamiento de las informaciones de página web orientadas a voz y de las orientadas a pantalla (i(xlm), i(html)) mediante la transmisión de informaciones de control y de datos (isig, idat).
6. Aparato terminal de Internet según la reivindicación 5,
caracterizado porque
-
la emisión de las informaciones de voz (ivox) procesadas y la transmisión y el arranque de nuevas informaciones de página web, pueden verse influidas mediante el intercambio de informaciones de control (isig) y
-
porque las informaciones de voz (idat) convertidas pueden intercambiarse directamente entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS,ASR)).
7. Plataforma multimedia
-
con un browser o navegador de voz (BRxml) para procesar e interpretar informaciones de página web orientas a voz (i(xml)), que son trasmitidas desde un servidor web (SER(HTML,XML) a través de Internet (INT),
-
con un agente de voz (Avox) para el intercambio directo de comunicaciones de informaciones de voz (ivox) con un aparato terminal de Internet PC,
-
con medios para sincronizar las informaciones de voz (ivox) intercambiadas con el aparato terminal de Internet (PC) con las informaciones de página web orientadas a voz (i(xlm)) transmitidas por el servidor web (SER(HTML,XML).
8. Plataforma multimedia según la reivindicación 7,
caracterizada porque
está previsto un programa para el reconocimiento de voz (ASR) y/o un programa para la conversión de texto en voz (TTS).
9. Procedimiento para procesar informaciones de página web combinadas orientadas a pantalla y orientadas a voz (i(html,xml)), de las que al menos la parte orientada a pantalla (i(html) se transmite a un aparato terminal de Internet (PC) y al menos la parte orientada a voz (i(xml)) a una plataforma multimedia (VOX,(TTS,ASR) desde un servidor web (SER,(HTML,XML) en el marco de un enlace de Internet,
-
en el que al menos la parte orientada a pantalla (i(html) es procesada e interpretada por un browser (BRhtml) del aparato terminal de Internet (PC),
-
en el que al menos la parte orientada a voz (i(xml)) es procesada e interpretada por un browser de voz (BRhtml) de la plataforma multimedia (VOX(TTS,ASR)),
-
en el que las informaciones de voz (ivox) transmitidas, a procesar o procesadas, se intercambian directamente con ayuda de en cada caso un agente de voz (Avox) entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS, ASR),
-
en el que entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS,ASR) se transmiten informaciones de control y de datos (isig, idat) para influir sobre funciones de procesamiento de las informaciones de página web orientadas a voz (i(xml)) en la plataforma multimedia (VOX(TTS,ASR)) y para la sincronización del procesamiento de las informaciones de página web orientadas a voz y orientadas a pantalla (i(xlm), i(html).
10. Procedimiento según la reivindicación 9,
caracterizado
-
porque se influye sobre el procesamiento de las informaciones de voz (ivox) en la plataforma multimedia (VOX(TTS,ASR), la salida de las informaciones de voz (ivox) procesadas en el aparato terminal de Internet PC y la transmisión y el arranque de nuevas informaciones de página web mediante el intercambio de informaciones de control (isig) y
-
porque las informaciones de voz convertidas (idat) se intercambian directamente entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS, ASR).
11. Procedimiento según una de las reivindicaciones 9 ó 10,
caracterizado porque
las informaciones de voz (ivox) y las informaciones de datos y de control (idat, isig) previstas para la sincronización mutua se transmiten entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS,ASR)) a través de canales de transmisión separados.
12. Procedimiento según una de las reivindicaciones 9 a 11,
caracterizado porque
las informaciones de voz (ivox) y/o las informaciones de datos y control (idat, isig) previstas para la sincronización mutua se transmiten a través de un canal de transmisión basado en el protocolo TCP/IP, uno que funciona según el Asynchron Transfer Modus (modo de transferencia asíncrono) o uno basado en el estándar bluetooth.
13. Procedimiento según una de las reivindicaciones 9 a 12,
caracterizado porque
en la plataforma multimedia (VOX(TTS,ASR) están realizadas partes del procesamiento de las informaciones de página web combinadas orientadas a pantalla y a voz (i(html,xml) mediante un distintivo de voz (ASR) y/o una conversión de texto en voz (TTS).
14. Procedimiento según una de las reivindicaciones 9 a 13,
caracterizado porque
en el procesamiento de las informaciones combinadas orientadas a pantalla y a voz (i(html,xml) se recurre a bancos de datos dispuestos bien en la plataforma multimedia (VOX(TTS,ASR) o bien en servidores WWW a los que puede llegarse mediante Internet (INT).
ES01271959T 2000-12-22 2001-11-21 Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva. Expired - Lifetime ES2307565T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10064661A DE10064661A1 (de) 2000-12-22 2000-12-22 Kommunikationsanordnung und Verfahren für Kommunikationssysteme mit interaktiver Sprachfunktion
DE10064661 2000-12-22

Publications (1)

Publication Number Publication Date
ES2307565T3 true ES2307565T3 (es) 2008-12-01

Family

ID=7668731

Family Applications (1)

Application Number Title Priority Date Filing Date
ES01271959T Expired - Lifetime ES2307565T3 (es) 2000-12-22 2001-11-21 Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva.

Country Status (7)

Country Link
US (1) US7734727B2 (es)
EP (1) EP1344370B1 (es)
CN (1) CN1489856B (es)
BR (1) BR0116476A (es)
DE (2) DE10064661A1 (es)
ES (1) ES2307565T3 (es)
WO (1) WO2002052810A1 (es)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030125953A1 (en) * 2001-12-28 2003-07-03 Dipanshu Sharma Information retrieval system including voice browser and data conversion server
US20030145062A1 (en) * 2002-01-14 2003-07-31 Dipanshu Sharma Data conversion server for voice browsing system
US20060168095A1 (en) * 2002-01-22 2006-07-27 Dipanshu Sharma Multi-modal information delivery system
US8024194B2 (en) * 2004-12-08 2011-09-20 Nuance Communications, Inc. Dynamic switching between local and remote speech rendering
US7548977B2 (en) * 2005-02-11 2009-06-16 International Business Machines Corporation Client / server application task allocation based upon client resources
DE102007048260A1 (de) 2007-10-08 2009-04-09 Robert Bosch Gmbh Statoranordnung sowie Stator für eine elektrische Maschine
CN101599062B (zh) * 2008-06-06 2011-06-15 佛山市顺德区顺达电脑厂有限公司 检索方法及系统
CN101840219B (zh) * 2009-09-30 2012-09-19 浙江大学 面向湿地公园的安全防范集成系统及方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953392A (en) * 1996-03-01 1999-09-14 Netphonic Communications, Inc. Method and apparatus for telephonically accessing and navigating the internet
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
US6282511B1 (en) * 1996-12-04 2001-08-28 At&T Voiced interface with hyperlinked information
US6018710A (en) * 1996-12-13 2000-01-25 Siemens Corporate Research, Inc. Web-based interactive radio environment: WIRE
JPH10271223A (ja) * 1997-02-18 1998-10-09 Lucent Technol Inc ウェブ情報へのアクセス提供装置及び方法
US6269336B1 (en) * 1998-07-24 2001-07-31 Motorola, Inc. Voice browser for interactive services and methods thereof
IL142366A0 (en) * 1998-10-02 2002-03-10 Ibm Conversational browser and conversational systems
DE19856357A1 (de) * 1998-12-07 2000-06-29 Michael Kraewing Verfahren zur Reduzierung der Inhalte von Webseiten und deren Aufbereitung für Bildtelefone und Mobilgeräte mit Sprachbedienung
CN1120608C (zh) * 1999-04-15 2003-09-03 无敌科技(西安)有限公司 互联网的即时语音及文字传呼方法
CN1372668A (zh) 1999-07-02 2002-10-02 皇家菲利浦电子有限公司 用户简档驱动语音映射到url
US6738803B1 (en) * 1999-09-03 2004-05-18 Cisco Technology, Inc. Proxy browser providing voice enabled web application audio control for telephony devices
FI19992720A (fi) 1999-12-17 2001-06-18 Nokia Networks Oy Datapuhelun reititys IP-yhteyksillä
US6745163B1 (en) * 2000-09-27 2004-06-01 International Business Machines Corporation Method and system for synchronizing audio and visual presentation in a multi-modal content renderer
US6983250B2 (en) * 2000-10-25 2006-01-03 Nms Communications Corporation Method and system for enabling a user to obtain information from a text-based web site in audio form

Also Published As

Publication number Publication date
EP1344370B1 (de) 2008-07-30
EP1344370A1 (de) 2003-09-17
US20040078442A1 (en) 2004-04-22
CN1489856B (zh) 2011-06-08
DE10064661A1 (de) 2002-07-11
US7734727B2 (en) 2010-06-08
BR0116476A (pt) 2004-01-06
CN1489856A (zh) 2004-04-14
WO2002052810A1 (de) 2002-07-04
DE50114180D1 (de) 2008-09-11

Similar Documents

Publication Publication Date Title
CN101207586B (zh) 用于实时自动通信的方法和系统
US7562352B2 (en) Data format conversion method and equipment, and controller management system using data format conversion equipment
US7151763B2 (en) Retrieving voice-based content in conjunction with wireless application protocol browsing
ES2307565T3 (es) Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva.
CN102185901B (zh) 一种客户端报文转换方法
US20060168095A1 (en) Multi-modal information delivery system
KR100607841B1 (ko) 단말장치 및 단말장치의 입력 기기 자동 재구성 방법
US20030187656A1 (en) Method for the computer-supported transformation of structured documents
JP2003515208A (ja) プログラマブルコントローラがリモートコンピュータとの通信を行えるようにするための方法及びシステム
WO2003062958A3 (en) Communication system
CN103294474A (zh) 浏览器操作同步方法和进行浏览器操作同步的装置
CN103533129A (zh) 实时的语音翻译通信方法、系统及所适用的通讯设备
CN100531431C (zh) 一种实现本地维护终端维护远端射频终端的装置
JP2001125862A (ja) マークアップフローを別々のスクリーン表示に分割する方法及び装置
CN100539622C (zh) 具有集成的tcap和isup接口的语音浏览器
KR20010069606A (ko) Html 문서를 무선 인터넷에서 사용되는 언어로전환하는 방법 및 그 시스템
WO2015056976A1 (ko) Ars 서비스 제공 방법 및 장치
CN100595719C (zh) 多模态同步的方法和装置
JP2001350682A (ja) 音声ドメインによるインターネット接続媒介システムと媒介装置及びその媒介方法、並びに音声ドメインのデータベース生成方法
FI110225B (fi) Menetelmä interaktiivisten palveluiden tuottamiseksi
WO2001035235A1 (en) System and method for accessing web content using limited display devices
KR20000061007A (ko) 웹을 이용한 원격 네트워크관리시스템의 실시간 제어방법
KR100349342B1 (ko) 음성 인식/합성을 이용한 대화형 자연어 인식 교정 시스템및 방법
KR20020042106A (ko) 모듈화된 구조와 음성웹 방식을 이용한 ars 웹호스팅시스템 및 그 운영 방법
KR100570817B1 (ko) 단말에 인터넷 서비스를 제공하는 장치 및 그 방법