ES2307565T3 - Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva. - Google Patents
Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva. Download PDFInfo
- Publication number
- ES2307565T3 ES2307565T3 ES01271959T ES01271959T ES2307565T3 ES 2307565 T3 ES2307565 T3 ES 2307565T3 ES 01271959 T ES01271959 T ES 01271959T ES 01271959 T ES01271959 T ES 01271959T ES 2307565 T3 ES2307565 T3 ES 2307565T3
- Authority
- ES
- Spain
- Prior art keywords
- voice
- information
- oriented
- internet
- asr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/15—Synchronised browsing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1101—Session protocols
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/30—Definitions, standards or architectural aspects of layered protocol stacks
- H04L69/32—Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
- H04L69/322—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
- H04L69/329—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
Abstract
Configuración de comunicaciones - con un servidor web (SER(HTML,XML), que puede conectarse con una plataforma multimedia (VOX (TTS, ASR)) y un aparato terminal de Internet (PC), transmitiéndose en el marco de un enlace con Internet, al menos parcialmente, informaciones de página web orientadas a voz (i(xml)) a la plataforma multimedia (VOX(TTS,ASR)) e informaciones de página web orientadas a pantalla (i(html)) al aparato terminal de Internet (PC), - con al menos un agente de voz (Avox) en la plataforma multimedia (VOX(TTS,ASR)) y en el aparato terminal de Internet (PC), para el intercambio directo de comunicación de informaciones de voz (ivox), - con al menos un agente de comunicaciones (Asig) en el aparato terminal de Internet (PC) para la influencia mutua de funciones de procesamiento de las informaciones de página web orientadas a voz (i(xml)) y para la sincronización de las informaciones de página web orientadas a voz y de las orientadas a pantalla (i(xlm,i (html)) mediante la transmisión de informaciones de control y de datos (isig, idat).
Description
Configuración de comunicaciones y procedimiento
para sistemas de comunicaciones con función de voz interactiva.
Desde hace algún tiempo existen crecientes
esfuerzos para posibilitar, junto al acceso a informaciones sobre
soporte de datos orientadas a pantalla, a un acceso orientado a voz.
Un escenario típico de un tal acceso es por ejemplo la
representación visual del contenido de una web a través del que
pueda navegarse con órdenes de voz.
El enlace de entradas y salidas orientadas a voz
y orientadas a pantalla, exige adicionalmente a los correspondientes
dispositivos para entrada y salida, por ejemplo teclado, pantalla,
micrófono y altavoz, un procesamiento y conversión adecuados de las
informaciones trasportadas. Sobre todo, el procesamiento de la
información de voz exige un coste considerable. Funciones como la
conversión de texto en voz y el reconocimiento de voz, son muy
costosas en cuanto a los recursos necesarios en espacio de memoria y
potencia de ordenador. Por ello se implementan las funciones
intensivas en recursos usualmente sólo de forma limitada en aparatos
terminales.
La invención tiene como base el problema de
posibilitar un acceso orientado a voz a informaciones sobre soportes
de datos que no esté sometido a las limitaciones usuales de los
recursos.
El problema se resuelve mediante una
configuración de comunicaciones según la reivindicación 5 y una
plataforma multimedia según la reivindicación 7 y un procedimiento
según la reivindicación 9.
En el artículo "Mejorando la accesibilidad de
la web mediante el Vox Portal (portal de voz) y una HTML dinámica
alojada en Web <-> convertidor VoxML" (Computer Networks,
Elsevier, Ámsterdam, Holanda, vol. 33, 06-2000) se
da a conocer una configuración de comunicaciones con un servidor web
que puede conectarse con una plataforma multimedia y un aparato
terminal de Internet, con al menos un agente de voz en la plataforma
multimedia y en el aparato terminal de Internet para el intercambio
directo de comunicaciones de informaciones de voz, con al menos un
agente de comunicaciones en el aparato terminal de Internet, para la
influencia mutua de informaciones de procesamiento de las
informaciones orientadas a voz de la página web.
En la configuración de comunicaciones
correspondiente a la invención o bien el procedimiento
correspondiente a la invención, está previsto en la plataforma
multimedia y en el aparato terminal de Internet un agente de voz
para el intercambio directo de comunicaciones de informaciones de
voz. Además, está previsto un agente de comunicaciones en el
aparato terminal de Internet para la influencia mutua de funciones
de procesamiento de las informaciones de la página web orientadas a
voz y para la sincronización de las informaciones de la página web
orientadas a voz y de las orientadas a pantalla mediante la
transmisión de informaciones de control y de datos;
reivindicaciones 1 y 9. La configuración de comunicaciones y el
procedimiento tienen la ventaja de que la plataforma multimedia
asume funciones del procesamiento de la voz que precisan de muchos
recursos y con ello pueden realizarse el procesamiento de la voz y
un acceso orientado a voz a informaciones del página web
independientemente de la potencia del aparato terminal de
Internet.
Con la ayuda de la configuración de
comunicaciones correspondiente a la invención o bien del
procedimiento correspondiente a la invención, puede influirse sobre
el procesamiento de las informaciones de voz en la plataforma
multimedia, la salida de las informaciones de voz procesadas en el
aparato terminal de Internet PC y la transmisión y el inicio de
nuevas informaciones de la página web mediante el intercambio de
informaciones de control. Las informaciones de voz convertidas
pueden intercambiarse directamente entre en aparato terminal de
Internet y la plataforma multimedia; reivindicaciones 2 y 10.
Mediante el intercambio directo de informaciones de control e
informaciones de voz convertidas, queda asegurado un procesamiento
eficiente de la información; un punto importante para la
interacción orientada a voz y la navegación en el acceso a
informaciones de la página web.
Para tener en cuenta las distintas exigencias en
la transmisión de informaciones de voz y datos, pueden estar
previstas para la transmisión de informaciones de voz y la de
informaciones de datos y de control previstas para la
sincronización mutua entre el aparato terminal de Internet (PC) y la
plataforma multimedia (VOX (TTS, ASR)) canales de transmisión
separados; reivindicaciones 3 y 11. Los canales de transmisión
pueden entonces estar realizados por ejemplo mediante un enlace
basado en el protocolo TCP/IP, un enlace que funciona según el
Asynchron Transfer Modus (modo de transferencia asíncrono) o bien un
enlace basado en el estándar bluetooth; reivindicaciones 4 y 12.
Los canales de transmisión separados o bien las diversas
realizaciones, pueden presentar ventajas en la optimización de la
calidad de transmisión y en el reparto de los recursos.
Otro aspecto esencial de la invención es el
aparato terminal de Internet, que está dotado de un browser o
navegador para procesar e interpretar informaciones de la página web
que son transmitidas por un servidor de web a través de Internet,
con un agente de voz para el intercambio directo de comunicaciones
de informaciones de voz con una plataforma multimedia y con al
menos un agente de comunicaciones para influir sobre las funciones
de procesamiento de las informaciones de la página web orientadas a
voz en la plataforma multimedia y para la sincronización del
procesamiento de las informaciones de la página web orientadas a voz
y orientadas a pantalla mediante la transmisión de informaciones de
control y de datos; reivindicación 5. El equipamiento del aparato
terminal de Internet correspondiente a la invención posee la ventaja
de asegurar el procesamiento de informaciones de página web
orientadas a voz y la comunicación con la plataforma multimedia, sin
que tengan que implementarse estructuras de programa o bien
funciones que cuestan muchos recursos sobre el aparato terminal de
Internet.
Otro aspecto importante es la plataforma
multimedia correspondiente a la invención, que está dotada con un
browser o navegador de voz para procesar e interpretar informaciones
de página web orientadas a voz que han de transmitirse desde un
servidor web a través de Internet, con un agente de voz para el
intercambio directo de comunicaciones de informaciones de voz con
un aparato terminal de Internet PC y con medios para sincronizar
las informaciones de voz intercambiadas con el aparato terminal de
Internet con las informaciones de página web orientadas a voz
transmitidas por el servidor de web; reivindicación 7. Además puede
preverse un programa para el reconocimiento de voz y/o un programa
para la conversión de texto en voz; reivindicaciones 8 y 13. La
plataforma multimedia correspondiente a la invención puede así
asumir etapas del procesamiento que precisan de muchos recursos,
como reconocimiento de voz y la conversión de texto en voz. Puede
ser ventajoso por ejemplo en estas funciones de procesamiento que
para el procesamiento de la información de la página web combinada
orientada a pantalla y orientada a voz se recurra a bancos de datos
dispuestos bien en la plataforma multimedia o en servidores www
accesibles a través de Internet; reivindicación 14. Por ejemplo, el
reconocimiento de voz de un conjunto de idiomas distintos exige
considerables recursos de memoria. Para descargar la configuración
de comunicaciones, puede ser ventajosa la utilización de recursos
externos sobre servidores www o bien bancos de datos.
A continuación se describirá más en detalle en
base a un ejemplo de ejecución la configuración de comunicaciones
correspondiente a la invención y el procedimiento correspondiente a
la invención. Se muestra en
figura 1: una ejecución de la configuración
correspondiente a la invención y
figura 2: una posible realización de un acceso a
informaciones de página web con ayuda de una orden de voz.
Al respecto, las mismas denominaciones
corresponden a los mismos elementos.
La figura 1 muestra una plataforma multimedia
(VOX(TTS,ASR) realizada por ejemplo mediante un ordenador,
que está conectada con un aparato terminal de Internet PC mediante
un canal de transmisión para informaciones de voz ivox y un canal
de transmisión para informaciones de datos y de control idat e isig.
Para ello está equipada la plataforma multimedia
(VOX(TTS,ASR) en cada caso con las correspondientes unidades
de conexión -no representado- para la conexión a Internet (INT).
Los canales de transmisión están realizados por ejemplo según el
TCP/IP (combinación de protocolo entre el Transmissión Control
Protocol (TCP), protocolo de control de la transmisión y el
Internet Protocol (IP), protocolo de Internet) o bien el protocolo
H.323 (estándar para la transmisión de voz a través de Internet).
En una forma constructiva preferente, la plataforma multimedia está
posicionada en la proximidad espacial al servidor de acceso del
ofertante de servicios de Internet -no representado- mediante el que
el aparato terminal de Internet PC se conecta con Internet INT. En
este posicionado el tramo de transmisión es relativamente corto,
con lo que la calidad de la voz de las informaciones de voz ivox
intercambiadas entre el aparato terminal de Internet PC y la
plataforma multimedia (VOX(TTS,ASR) puede comprobarse y
controlarse. Al respecto no se conducen las informaciones de voz
ivox a través de ningún enlace muy ramificado, como por ejemplo
grandes tramos de Internet INT, cuya calidad escapa al control del
ofertante de servicios de Internet. La plataforma multimedia
VOX(TTS,ASR) y el aparato terminal de Internet PC están
dotados de respectivos agentes de voz Avox para el control del
intercambio de informaciones de voz ivox. El aparato terminal de
Internet PC está dotado además de un agente de comunicaciones Asig,
que permite la transmisión de informaciones de control isig o de
datos a procesar idat. Para procesar e interpretar informaciones de
página web, está dotado el aparato terminal de Internet de un
browser BRhtml. La plataforma multimedia VOX(TTS,ASR) está
dotada para el procesamiento de las informaciones de voz ivox de
programas para el reconocimiento de voz ASR y para la conversión de
texto en voz TTS y con un browser de voz BRxlm para procesar e
interpretar informaciones de página web orientadas a voz
i(xml).
El aparato terminal de Internet PC y la
plataforma multimedia VOX(TTS,ASR) pueden conectarse mediante
el establecimiento de un enlace iniciado por el aparato terminal de
Internet PC a través de Internet (INT) con un servidor web
SER(HTML,XML). Desde el servidor web SER(HTML,XML) se
transmiten informaciones de página web combinadas orientadas a
pantalla y orientadas a voz i(html,xml). Actualmente están
compuestas tales informaciones de página web i(html,xml)
combinadas orientadas a pantalla y orientadas a voz por partes o
bien códigos fuente separados orientados a pantalla i(html)
y orientados a voz i(xml), que pueden ser llamados
separadamente y transmitidos separadamente. Las partes de las
informaciones de página web i(xml) orientadas a voz están
programadas predominantemente en un lenguaje XML (extensible markup
language, lenguaje de etiquetado extensible), que apoya aplicaciones
de voz, por ejemplo VoxML^{TM}, VoiceXML^{TM} o
DialogML^{TM}.
La parte orientada a pantalla i(html)
puede estar confeccionada por ejemplo en la técnica de programación
html (hypertext markup language, lenguaje de etiquetado de
hipertexto) y contiene por lo general referencias a la parte
orientada a voz i(xml) que permiten cambiar del procesamiento
de la parte orientada a pantalla i(html) al procesamiento de
la parte orientada a voz i(xml). Mediante el browser BRhtml
instalado en el aparato terminal de Internet PC, no sólo se procesa
e interpreta la parte orientada a pantalla i(html), sino que
también se interpretan las referencias a la parte orientada a voz
i(xml) y dado el caso se inicia la transición de
informaciones de control isig y/o datos idat para la transición al
procesamiento o la emisión de informaciones de voz ivox. Por esta
razón en la literatura de habla inglesa se utiliza también el
concepto parser en lugar de browser. Se realizan esfuerzos
tendentes a reunir ambas partes en un código fuente. En este caso ha
de adaptarse la configuración correspondiente a la invención en el
sentido de que bien el aparato terminal de Internet PC y la
plataforma multimedia VOX(html,xml) estén dotados de browsers
que pueden procesar e interpretar los mismos códigos fuente que
reúnen informaciones de página web orientadas a pantalla y
orientadas a voz, o bien sólo esté previsto un browser en el
aparato terminal de Internet PC que dado el caso se ve complementado
por un agente de comunicaciones adicional Asig en la plataforma
multimedia VOX(HTML,XML).
En el arranque del procedimiento correspondiente
a la invención, se transmite la parte orientada a pantalla
i(html) desde las informaciones de página web orientadas a
pantalla y a voz i(html,xml) puestas a disposición en un
servidor World Wide Web SER(HTML,XML) a un aparato terminal
de Internet PC. Desde el aparato terminal de Internet PC se envía,
a través de un canal de transmisión para informaciones de control
isig y datos idat, un mensaje que anuncia el comienzo de la sesión
de Internet y transmite la dirección de la parte orientada a voz
i(xml) de las informaciones de página web i(html,xml)
orientadas a pantalla y orientadas a voz. Desde el servidor www
SER(HTML,XML) se transmite entonces a continuación la parte
orientada a voz a una plataforma multimedia VOX(TTS,ASR). El
procesamiento e interpretación de la parte orientada a pantalla
i(html) y de la parte orientada a voz i(xml) por
parte de un browser BRhtml del aparato terminal de Internet PC o
bien de un browser de voz BRxml de la plataforma multimedia
VOX(TTS,ASR), se sincroniza mediante el intercambio de
informaciones de control isig. Las informaciones de voz ivox se
intercambian a través de un canal de transmisión previsto para ello
directamente mediante agentes de voz Avox, por ejemplo para ser
procesadas mediante un programa para el reconocimiento de voz ASR o
para ser emitidas con dispositivos previstos para ello en el
aparato terminal de Internet PC, por ejemplo altavoces. A modo de
ejemplo se representa en la figura 2 una posible realización del
arranque de nuevas informaciones de página web combinadas orientadas
a pantalla y orientadas a voz i(html,xml), durante una
sesión de Internet mediante una orden de voz
ivox(nr(url)). Al respecto se supone que a través del
medio de salida orientado a pantalla se indica una lista
l(url) de tales informaciones de página web de las que puede
ser elegida.
A continuación se representan las distintas
etapas de la realización. Allí se indican las etapas de
procesamiento en las que un programa de ordenador procesa datos,
mediante flechas anchas y la transmisión de datos o informaciones
mediante flechas dotadas de líneas.
- a.
- Durante una sesión de Internet muestra el aparato terminal de Internet PC con ayuda del browser BRhtml, por ejemplo sobre una pantalla, una lista l(url) de informaciones de página web i(html,xml) combinadas orientadas a pantalla y a voz.
- b.
- Mediante una orden de voz ivox(nr(url)) se elige una inscripción en la lista l(url). La identificación de la inscripción elegida se realiza por ejemplo mediante su número nr. La orden de voz ivox(nr(url)) se transmite con ayuda del agente de voz Avox a la plataforma multimedia VOX(TTS,ASR).
- c.
- Sobre la plataforma multimedia VOX(TTS,ASR) convierte el programa para el reconocimiento de voz ASR la orden de voz ivox(nr(url)) en una información de texto nr(url).
- d.
- La información de texto nr(url) se transmite mediante el canal para la transmisión de informaciones de datos y control al aparato terminal de Internet PC.
- e.
- El browser BRhtml del aparato terminal de Internet PC identifica en base a la formación de texto nr(url) la dirección url de las informaciones de página web deseadas y accede a las mismas a través de Internet (INT). Una información de página web i(html) se transmite a continuación al aparato terminal de Internet PC.
El procedimiento correspondiente a la invención
y las configuraciones correspondientes a la invención no quedan
limitados al ejemplo de ejecución, sino que pueden utilizarse para
el siguiente procesamiento y conversión de informaciones orientadas
a voz en informaciones orientadas a pantalla y a la inversa, por
ejemplo para conversiones de voz, reconocimiento de voz, navegación
mediante informaciones de página web mediante órdenes de voz,
introducción y emisión de voz, etc., teniendo que dotarse o
complementarse la plataforma multimedia VOX(TTS,ASR) con los
correspondientes programas y funciones de procesamiento de datos y
programas y funciones de conversión.
Claims (14)
1. Configuración de comunicaciones
- -
- con un servidor web (SER(HTML,XML), que puede conectarse con una plataforma multimedia (VOX(TTS, ASR)) y un aparato terminal de Internet (PC), transmitiéndose en el marco de un enlace con Internet, al menos parcialmente, informaciones de página web orientadas a voz (i(xml)) a la plataforma multimedia (VOX(TTS,ASR)) e informaciones de página web orientadas a pantalla (i(html)) al aparato terminal de Internet (PC),
- -
- con al menos un agente de voz (Avox) en la plataforma multimedia (VOX(TTS,ASR)) y en el aparato terminal de Internet (PC), para el intercambio directo de comunicación de informaciones de voz (ivox),
- -
- con al menos un agente de comunicaciones (Asig) en el aparato terminal de Internet (PC) para la influencia mutua de funciones de procesamiento de las informaciones de página web orientadas a voz (i(xml)) y para la sincronización de las informaciones de página web orientadas a voz y de las orientadas a pantalla (i(xlm,i(html)) mediante la transmisión de informaciones de control y de datos (isig, idat).
2. Configuración de comunicaciones según la
reivindicación 1,
caracterizada porque
- -
- el procesamiento de las informaciones de voz (ivox) en la plataforma multimedia (VOX(TTS,ASR)), la emisión de las informaciones de voz (ivox) procesadas en el aparato terminal de Internet PC y la transmisión y el arranque de nuevas informaciones de página web, pueden verse influidas mediante el intercambio de informaciones de control (isig) y
- -
- las informaciones de voz (idat) convertidas pueden intercambiarse directamente entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS, ASR)).
3. Configuración de comunicaciones según una de
las reivindicaciones 1 ó 2,
caracterizada porque
para la transmisión de las informaciones de voz
(ivox) y de las informaciones de datos y de control (idat, isig)
previstas para la sincronización mutua entre el aparato terminal de
Internet (PC) y la plataforma multimedia (VOX(TTS,ASR)),
están previstos canales de transmisión separados.
4. Sistema de comunicaciones según una de las
reivindicaciones 1 a 3,
caracterizado porque
uno de los canales de transmisión está realizado
mediante un enlace basado en el protocolo TCP/IP, un enlace que
funciona según el Asynchron Transfer Modus (modo de transferencia
asíncrono) o un enlace basado en el estándar bluetooth.
5. Aparato terminal de Internet
- -
- con un navegador o browser (BRhtml) para el procesamiento e interpretación de informaciones de página web que son trasmitidas desde un servidor web (SER(HTML,XML)) a través de Internet (INT),
- -
- con un agente de voz (Avox) para el intercambio directo de comunicaciones de informaciones de voz (ivox) con una plataforma multimedia (VOX(TTS,ASR)) y
- -
- con al menos un agente de comunicaciones (Asig) para influir sobre funciones de procesamiento de las informaciones de página web orientadas a voz (i(xlm)) en la plataforma multimedia (VOX(TTS,ASR)) y para la sincronización del procesamiento de las informaciones de página web orientadas a voz y de las orientadas a pantalla (i(xlm), i(html)) mediante la transmisión de informaciones de control y de datos (isig, idat).
6. Aparato terminal de Internet según la
reivindicación 5,
caracterizado porque
- -
- la emisión de las informaciones de voz (ivox) procesadas y la transmisión y el arranque de nuevas informaciones de página web, pueden verse influidas mediante el intercambio de informaciones de control (isig) y
- -
- porque las informaciones de voz (idat) convertidas pueden intercambiarse directamente entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS,ASR)).
7. Plataforma multimedia
- -
- con un browser o navegador de voz (BRxml) para procesar e interpretar informaciones de página web orientas a voz (i(xml)), que son trasmitidas desde un servidor web (SER(HTML,XML) a través de Internet (INT),
- -
- con un agente de voz (Avox) para el intercambio directo de comunicaciones de informaciones de voz (ivox) con un aparato terminal de Internet PC,
- -
- con medios para sincronizar las informaciones de voz (ivox) intercambiadas con el aparato terminal de Internet (PC) con las informaciones de página web orientadas a voz (i(xlm)) transmitidas por el servidor web (SER(HTML,XML).
8. Plataforma multimedia según la reivindicación
7,
caracterizada porque
está previsto un programa para el reconocimiento
de voz (ASR) y/o un programa para la conversión de texto en voz
(TTS).
9. Procedimiento para procesar informaciones de
página web combinadas orientadas a pantalla y orientadas a voz
(i(html,xml)), de las que al menos la parte orientada a
pantalla (i(html) se transmite a un aparato terminal de
Internet (PC) y al menos la parte orientada a voz (i(xml)) a
una plataforma multimedia (VOX,(TTS,ASR) desde un servidor web
(SER,(HTML,XML) en el marco de un enlace de Internet,
- -
- en el que al menos la parte orientada a pantalla (i(html) es procesada e interpretada por un browser (BRhtml) del aparato terminal de Internet (PC),
- -
- en el que al menos la parte orientada a voz (i(xml)) es procesada e interpretada por un browser de voz (BRhtml) de la plataforma multimedia (VOX(TTS,ASR)),
- -
- en el que las informaciones de voz (ivox) transmitidas, a procesar o procesadas, se intercambian directamente con ayuda de en cada caso un agente de voz (Avox) entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS, ASR),
- -
- en el que entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS,ASR) se transmiten informaciones de control y de datos (isig, idat) para influir sobre funciones de procesamiento de las informaciones de página web orientadas a voz (i(xml)) en la plataforma multimedia (VOX(TTS,ASR)) y para la sincronización del procesamiento de las informaciones de página web orientadas a voz y orientadas a pantalla (i(xlm), i(html).
10. Procedimiento según la reivindicación 9,
caracterizado
- -
- porque se influye sobre el procesamiento de las informaciones de voz (ivox) en la plataforma multimedia (VOX(TTS,ASR), la salida de las informaciones de voz (ivox) procesadas en el aparato terminal de Internet PC y la transmisión y el arranque de nuevas informaciones de página web mediante el intercambio de informaciones de control (isig) y
- -
- porque las informaciones de voz convertidas (idat) se intercambian directamente entre el aparato terminal de Internet (PC) y la plataforma multimedia (VOX(TTS, ASR).
11. Procedimiento según una de las
reivindicaciones 9 ó 10,
caracterizado porque
las informaciones de voz (ivox) y las
informaciones de datos y de control (idat, isig) previstas para la
sincronización mutua se transmiten entre el aparato terminal de
Internet (PC) y la plataforma multimedia (VOX(TTS,ASR)) a
través de canales de transmisión separados.
12. Procedimiento según una de las
reivindicaciones 9 a 11,
caracterizado porque
las informaciones de voz (ivox) y/o las
informaciones de datos y control (idat, isig) previstas para la
sincronización mutua se transmiten a través de un canal de
transmisión basado en el protocolo TCP/IP, uno que funciona según
el Asynchron Transfer Modus (modo de transferencia asíncrono) o uno
basado en el estándar bluetooth.
13. Procedimiento según una de las
reivindicaciones 9 a 12,
caracterizado porque
en la plataforma multimedia (VOX(TTS,ASR)
están realizadas partes del procesamiento de las informaciones de
página web combinadas orientadas a pantalla y a voz
(i(html,xml) mediante un distintivo de voz (ASR) y/o una
conversión de texto en voz (TTS).
14. Procedimiento según una de las
reivindicaciones 9 a 13,
caracterizado porque
en el procesamiento de las informaciones
combinadas orientadas a pantalla y a voz (i(html,xml) se
recurre a bancos de datos dispuestos bien en la plataforma
multimedia (VOX(TTS,ASR) o bien en servidores WWW a los que
puede llegarse mediante Internet (INT).
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10064661A DE10064661A1 (de) | 2000-12-22 | 2000-12-22 | Kommunikationsanordnung und Verfahren für Kommunikationssysteme mit interaktiver Sprachfunktion |
DE10064661 | 2000-12-22 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2307565T3 true ES2307565T3 (es) | 2008-12-01 |
Family
ID=7668731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES01271959T Expired - Lifetime ES2307565T3 (es) | 2000-12-22 | 2001-11-21 | Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva. |
Country Status (7)
Country | Link |
---|---|
US (1) | US7734727B2 (es) |
EP (1) | EP1344370B1 (es) |
CN (1) | CN1489856B (es) |
BR (1) | BR0116476A (es) |
DE (2) | DE10064661A1 (es) |
ES (1) | ES2307565T3 (es) |
WO (1) | WO2002052810A1 (es) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030125953A1 (en) * | 2001-12-28 | 2003-07-03 | Dipanshu Sharma | Information retrieval system including voice browser and data conversion server |
US20030145062A1 (en) * | 2002-01-14 | 2003-07-31 | Dipanshu Sharma | Data conversion server for voice browsing system |
US20060168095A1 (en) * | 2002-01-22 | 2006-07-27 | Dipanshu Sharma | Multi-modal information delivery system |
US8024194B2 (en) * | 2004-12-08 | 2011-09-20 | Nuance Communications, Inc. | Dynamic switching between local and remote speech rendering |
US7548977B2 (en) * | 2005-02-11 | 2009-06-16 | International Business Machines Corporation | Client / server application task allocation based upon client resources |
DE102007048260A1 (de) | 2007-10-08 | 2009-04-09 | Robert Bosch Gmbh | Statoranordnung sowie Stator für eine elektrische Maschine |
CN101599062B (zh) * | 2008-06-06 | 2011-06-15 | 佛山市顺德区顺达电脑厂有限公司 | 检索方法及系统 |
CN101840219B (zh) * | 2009-09-30 | 2012-09-19 | 浙江大学 | 面向湿地公园的安全防范集成系统及方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5953392A (en) * | 1996-03-01 | 1999-09-14 | Netphonic Communications, Inc. | Method and apparatus for telephonically accessing and navigating the internet |
US5915001A (en) * | 1996-11-14 | 1999-06-22 | Vois Corporation | System and method for providing and using universally accessible voice and speech data files |
US6282511B1 (en) * | 1996-12-04 | 2001-08-28 | At&T | Voiced interface with hyperlinked information |
US6018710A (en) * | 1996-12-13 | 2000-01-25 | Siemens Corporate Research, Inc. | Web-based interactive radio environment: WIRE |
JPH10271223A (ja) * | 1997-02-18 | 1998-10-09 | Lucent Technol Inc | ウェブ情報へのアクセス提供装置及び方法 |
US6269336B1 (en) * | 1998-07-24 | 2001-07-31 | Motorola, Inc. | Voice browser for interactive services and methods thereof |
IL142366A0 (en) * | 1998-10-02 | 2002-03-10 | Ibm | Conversational browser and conversational systems |
DE19856357A1 (de) * | 1998-12-07 | 2000-06-29 | Michael Kraewing | Verfahren zur Reduzierung der Inhalte von Webseiten und deren Aufbereitung für Bildtelefone und Mobilgeräte mit Sprachbedienung |
CN1120608C (zh) * | 1999-04-15 | 2003-09-03 | 无敌科技(西安)有限公司 | 互联网的即时语音及文字传呼方法 |
CN1372668A (zh) | 1999-07-02 | 2002-10-02 | 皇家菲利浦电子有限公司 | 用户简档驱动语音映射到url |
US6738803B1 (en) * | 1999-09-03 | 2004-05-18 | Cisco Technology, Inc. | Proxy browser providing voice enabled web application audio control for telephony devices |
FI19992720A (fi) | 1999-12-17 | 2001-06-18 | Nokia Networks Oy | Datapuhelun reititys IP-yhteyksillä |
US6745163B1 (en) * | 2000-09-27 | 2004-06-01 | International Business Machines Corporation | Method and system for synchronizing audio and visual presentation in a multi-modal content renderer |
US6983250B2 (en) * | 2000-10-25 | 2006-01-03 | Nms Communications Corporation | Method and system for enabling a user to obtain information from a text-based web site in audio form |
-
2000
- 2000-12-22 DE DE10064661A patent/DE10064661A1/de not_active Withdrawn
-
2001
- 2001-11-21 BR BR0116476-7A patent/BR0116476A/pt not_active IP Right Cessation
- 2001-11-21 US US10/451,268 patent/US7734727B2/en not_active Expired - Fee Related
- 2001-11-21 EP EP01271959A patent/EP1344370B1/de not_active Expired - Lifetime
- 2001-11-21 CN CN018226728A patent/CN1489856B/zh not_active Expired - Fee Related
- 2001-11-21 WO PCT/DE2001/004373 patent/WO2002052810A1/de active IP Right Grant
- 2001-11-21 DE DE50114180T patent/DE50114180D1/de not_active Expired - Lifetime
- 2001-11-21 ES ES01271959T patent/ES2307565T3/es not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1344370B1 (de) | 2008-07-30 |
EP1344370A1 (de) | 2003-09-17 |
US20040078442A1 (en) | 2004-04-22 |
CN1489856B (zh) | 2011-06-08 |
DE10064661A1 (de) | 2002-07-11 |
US7734727B2 (en) | 2010-06-08 |
BR0116476A (pt) | 2004-01-06 |
CN1489856A (zh) | 2004-04-14 |
WO2002052810A1 (de) | 2002-07-04 |
DE50114180D1 (de) | 2008-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101207586B (zh) | 用于实时自动通信的方法和系统 | |
US7562352B2 (en) | Data format conversion method and equipment, and controller management system using data format conversion equipment | |
US7151763B2 (en) | Retrieving voice-based content in conjunction with wireless application protocol browsing | |
ES2307565T3 (es) | Configuracion de comunicaciones y procedimiento para sistemas de comunicaciones con funcion de voz interactiva. | |
CN102185901B (zh) | 一种客户端报文转换方法 | |
US20060168095A1 (en) | Multi-modal information delivery system | |
KR100607841B1 (ko) | 단말장치 및 단말장치의 입력 기기 자동 재구성 방법 | |
US20030187656A1 (en) | Method for the computer-supported transformation of structured documents | |
JP2003515208A (ja) | プログラマブルコントローラがリモートコンピュータとの通信を行えるようにするための方法及びシステム | |
WO2003062958A3 (en) | Communication system | |
CN103294474A (zh) | 浏览器操作同步方法和进行浏览器操作同步的装置 | |
CN103533129A (zh) | 实时的语音翻译通信方法、系统及所适用的通讯设备 | |
CN100531431C (zh) | 一种实现本地维护终端维护远端射频终端的装置 | |
JP2001125862A (ja) | マークアップフローを別々のスクリーン表示に分割する方法及び装置 | |
CN100539622C (zh) | 具有集成的tcap和isup接口的语音浏览器 | |
KR20010069606A (ko) | Html 문서를 무선 인터넷에서 사용되는 언어로전환하는 방법 및 그 시스템 | |
WO2015056976A1 (ko) | Ars 서비스 제공 방법 및 장치 | |
CN100595719C (zh) | 多模态同步的方法和装置 | |
JP2001350682A (ja) | 音声ドメインによるインターネット接続媒介システムと媒介装置及びその媒介方法、並びに音声ドメインのデータベース生成方法 | |
FI110225B (fi) | Menetelmä interaktiivisten palveluiden tuottamiseksi | |
WO2001035235A1 (en) | System and method for accessing web content using limited display devices | |
KR20000061007A (ko) | 웹을 이용한 원격 네트워크관리시스템의 실시간 제어방법 | |
KR100349342B1 (ko) | 음성 인식/합성을 이용한 대화형 자연어 인식 교정 시스템및 방법 | |
KR20020042106A (ko) | 모듈화된 구조와 음성웹 방식을 이용한 ars 웹호스팅시스템 및 그 운영 방법 | |
KR100570817B1 (ko) | 단말에 인터넷 서비스를 제공하는 장치 및 그 방법 |