CN1489856B - 具有交互式语音功能的通信系统用的通信装置和方法以及多媒体平台 - Google Patents

具有交互式语音功能的通信系统用的通信装置和方法以及多媒体平台 Download PDF

Info

Publication number
CN1489856B
CN1489856B CN018226728A CN01822672A CN1489856B CN 1489856 B CN1489856 B CN 1489856B CN 018226728 A CN018226728 A CN 018226728A CN 01822672 A CN01822672 A CN 01822672A CN 1489856 B CN1489856 B CN 1489856B
Authority
CN
China
Prior art keywords
voice
towards
terminal equipment
asr
tts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN018226728A
Other languages
English (en)
Other versions
CN1489856A (zh
Inventor
N·阿曼
L·斯特鲁卢
L·于埃
R·佩蒂翁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN1489856A publication Critical patent/CN1489856A/zh
Application granted granted Critical
Publication of CN1489856B publication Critical patent/CN1489856B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/15Synchronised browsing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1101Session protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及组合的面向显示屏和面向语音的网页信息(i(html,xml))的处理。此时,在因特网终端设备(PC)中处理面向显示屏的网页信息(i(html)),和在多媒体平台(VOX)中处理面向语音的网页信息(i(xml))。为了同步网页信息的被分布到所述因特网终端设备和多媒体平台上的处理,借助语音代理(Avox)交换语音信息(ivox),和借助通信代理(Asig)交换控制信息(isig)和数据(idat)。此时动态地减轻了所述多媒体平台的负荷。

Description

具有交互式语音功能的通信系统用的通信装置和方法以及多媒体平台
技术领域
本发明涉及具有交互式语音功能的通信系统用的通信装置和方法以及多媒体平台。
背景技术
很久以来除了面向显示屏地访问数据载体上的信息之外,越来越多地在努力实现面向语音的访问。这种访问的一种典型的系统结构譬如是万维网内容的视觉显示,在该万维网内容之间可以用语音指令来导航。
除了用于输入和输出的相应装置,譬如键盘、显示屏、拾音器和扬声器之外,面向语音和面向显示屏的输入和输出的通信连接还要求适当地处理和转换所传输的信息。语音信息的处理首先要求可观的工作量。在对存储位置和计算能力上所需的资源方面,象将文本转换成语音和语音识别那样的功能是很费事的。因此通常仅以有限的形式在终端设备上实现资源耗费庞大的功能。
发明内容
本发明所基于的问题是实现面向语音地访问数据载体上的信息,该访问不受通常的资源限制。
利用因特网终端设备、和多媒体平台、以及用于处理组合的面向显示屏和面向语音的网页信息的方法,所述的问题可以通过通信装置来解决。
所述因特网终端设备,具有一个用于处理和解释面向显示屏的网页信息的浏览器,这些网页信息是由网络服务器通过所述的因特网传送的,所述面向显示屏的网页信息含有对面向语音的网页信息的指示,这些指示允许从面向显示屏的网页信息的处理转换到面向语音的网页信息的处理,具有一个用于直接与多媒体平台进行语音信息通信交换的语音代理,和具有至少一个通信代理,用于通过向多媒体平台和因特网终端设备传送控制和数据信息来在多媒体平台和因特网终端设备之间同步面向语音和面向显示屏的网页信息的处理。
所述多媒体平台具有一个用于处理和解释面向语音的网页信息的语音浏览器,这些网页信息是由网络服务器通过因特网传送的,具有一个用于直接与因特网终端设备PC进行语音信息通信交换的语音代理,具有用于将跟所述因特网终端设备所交换的语音信息与由所述网络服务器所传送的面向语音的网页信息进行同步的设备并且所述媒体平台安排有语音识别用的程序和/或用于将文本转换成语音的程序,所述语音识别用的程序用于将语音指令转换成文本信息。
所述用于处理组合的面向显示屏和面向语音的网页信息的方法,在这些网页信息中,至少面向显示屏的部分被网络服务器在因特网通信连接的范围内传送给因特网终端设备,和至少面向语音的部分被传送给多媒体平台,其中,直接所述因特网终端设备和多媒体平台借助各自一个语音代理在所述因特网终端设备和多媒体平台之间交换所传送的、要处理的或已处理的语音信息,其中,在所述因特网终端设备和多媒体平台之间传送控制和数据信息,这些控制和数据信息用于在所述多媒体平台中影响面向语音的网页信息的处理功能,以及用于在多媒体平台和因特网终端设备之间同步面向语音和面向显示屏的网页信息的处理,并且其中所述面向显示屏的网页信息含有对面向语音的网页信息的指示,这些指示允许从面向显示屏的网页信息的处理转换到面向语音的网页信息的处理。
所述通信装置具有:一个可以与多媒体平台和因特网终端设备相连接的网络服务器,其中,在因特网通信连接的范围内至少部分地将面向语音的网页信息传送到所述的多媒体平台上,并将面向显示屏的网页信息传送到所述的因特网终端设备上,所述面向显示屏的网页信息含有对面向语音的网页信息的指示,这些指示允许从面向显示屏的网页信息的处理转换到面向语音的网页信息的处理,具有位于所述多媒体平台中的至少一个语音代理和位于所述因特网终端设备中的至少一个语音代理,以用于语音信息在因特网终端设备与多媒体平台之间的直接通信交换,具有位于所述因特网终端设备中的至少一个通信代理,用于通过向多媒体平台和因特网终端设备传送控制和数据信息来在多媒体平台和因特网终端设备之间同步面向语音和面向显示屏的网页信息。
在本发明通信装置或本发明方法中,在多媒体平台中和在因特网终端设备中安排了用于语音信息的直接通信交换的语音代理。此外,在因特网终端设备中安排了通信代理,用于交替地影响面向语音的网页信息的处理功能,以及用于通过传送控制和数据信息来同步面向语音和面向显示屏的网页信息。所述的通信装置和方法具有如下的优点,由多媒体平台来承担耗费资源庞大的语音处理功能,并因此可以与因特网终端设备的效率无关地来实现语音处理和面向语音地访问网页信息。借助本发明通信装置或本发明方法可以通过控制信息的交换来影响多媒体平台中的语音信息的处理、因特网终端设备PC中的所处理语音信息的输出、和新网页信息的传送和起动。可以直接在因特网终端设备和多媒体平台之间交换已转换的语音信息。通过直接交换控制信息和已转换的语音信息,保障了有效的信息处理;这是访问网页信息时进行面向语音的交互作用和导航的重点。
为了顾及传输语音信息和数据时的不同要求,对于语音信息的传送和为交替同步所规定的数据和控制信息的传送,可以在因特网终端设备(PC)与多媒体平台(VOX(TTS,ASR))之间安排单独的传输信道。此时,譬如可以通过基于TCP/IP协议的通信连接、按异步传输方式作用的通信连接、或基于蓝牙标准的通信连接来实现所述的传输信道。在优化传输质量和资源分配时,分开的传输信道或不同的实现方案可能具有优点。
本发明的另一方面是因特网终端设备,该因特网终端设备装备了用于处理和解释由网络服务器通过因特网所传送的网页信息的浏览器、用于直接与多媒体平台语音信息进行通信交换的语音代理、以及至少一个通信代理,该通信代理用于在多媒体平台中影响面向语音的网页信息的处理功能,并用于通过传送控制和数据信息来同步面向语音和面向显示屏的网页信息的处理。本发明因特网终端设备的所述装备具有如下的优点,保障了面向语音的网页信息的处理和与多媒体平台的通信,而不必在因特网终端设备上实施资源耗费庞大的程序结构或功能。
本发明多媒体平台是一个其它的重要方面,该多媒体平台装备了用于处理和解释由网络服务器通过因特网所传送的面向语音的网页信息的语音浏览器、用于直接与因特网终端设备PC进行语音信息通信交换的语音代理、以及用于将跟因特网终端设备所交换的语音信息与由网络服务器所传送的面向语音的网页信息同步的设备-权利要求7。此外还可以安排语音识别用的程序和/或用于将文本转换成语音的程序。本发明多媒体平台因此可以承担象语音识别和将文本转换成语音那样的耗费资源较大的处理步骤。譬如在这些处理功能中可能有利的是,为了处理组合的面向显示屏和面向语音的网页信息而动用要么在多媒体平台中的数据库,要么在通过因特网可以联系上的WWW服务器中所布置的数据库。譬如许多不同语音的语音识别要求可观的存储器资源。为了减轻通信装置的负担,利用WWW服务器或数据库上的外部资源可能是有利的。
以下借助实施例详述本发明通信装置和本发明方法。
附图说明
图1展示本发明装置的一个实施方案,以及
图2展示借助语音指令访问网页信息的一个可能的实现方案。
在此,相同的名称表示相同的元件。
具体实施方式
附图1展示譬如由计算机实现的多媒体平台VOX(TTS,ASR),该多媒体平台通过语音信息ivox的传输信道以及数据和控制信息idat和isig的传输信道与因特网终端设备PC相连接。多媒体平台VOX(TTS,ASR)为此分别装备了与因特网(INT)连接用的-未示出的-相应的连接设备。譬如按TCP/IP(传输控制协议(TCP)和因特网协议(IP)的协议组合),或按H.323协议(通过因特网传输语音的标准)实现了所述的传输信道。在一个优选的实施方案中,多媒体平台是定位于-未示出的-因特网业务提供者的接入服务器的空间上的近处的,通过该接入服务器将因特网终端设备PC与因特网INT相连接。传输线路在这种定位时是比较短的,因而可以检查和控制在因特网终端设备PC和多媒体平台VOX(TTS,ASR)之间所交换的语音信息ivox的语音质量。此时,不将语音信息ivox引导通过譬如象因特网INT的较大线路那样的广泛分岔的通信连接,这些通信连接的质量不受因特网业务提供者的控制。多媒体平台VOX(TTS,ASR)和因特网终端设备PC分别配备了一个用于控制语音信息ivox交换的语音代理Avox。此外,因特网终端设备PC还装备了通信代理Asig,该通信代理允许传送控制信息isig和要处理的数据idat。为了处理和解释网页信息,因特网终端设备配备了浏览器BRhtml。为了处理语音信息ivox,多媒体平台VOX(TTS,ASR)装备了语音识别ASR用的程序和用于将文本转换成语音TTS的程序,并装备了用于处理和解释面向语音的网页信息i(xml)的语音浏览器BRxlm。
因特网终端设备PC和多媒体平台VOX(TTS,ASR)通过由因特网终端设备PC引入的通信连接建立可以经越因特网(INT)与网络服务器SER(HTML,XML)相连接。由所述的网络服务器SER(HTML,XML)传送组合的面向显示屏和面向语音的网页信息i(html,xml)。当今,这种组合的面向显示屏和面向语音的网页信息i(html,xml)由分开的面向显示屏i(html)和面向语音i(xml)的部分或源代码组成,可以单独调用和单独传送这些部分或源代码。主要以XNL(extensiblemarkup language,可扩充标记语言)语言来编程网页信息的面向语音的部分i(xml),该语言支持语音应用,譬如VoxMLTM、VoiceXMLTM、或DialogMLtm
面向显示屏的部分i(html)譬如可以用html(hypertext markuplanguage(超文本标记语言))编程技术来建立,并通常含有对面向语音部分i(xml)的指示,这些指示允许从面向显示屏部分i(html)的处理转换到面向语音部分i(xml)的处理。通过安装在因特网终端设备PC上的浏览器BRhtml不仅处理和解释面向显示屏的部分i(html),而且也解释对面向语音部分i(xml)的指示,并必要时为了向处理的过渡或语音信息ivox的输出而启动传送控制信息isig和/或数据idat。出于此原因在英语的文献中也采用概念parser(分析程序)来代替browser(浏览器)。人们努力在一种源代码中统一所述的两个部分。在此情况下如下来匹配本发明装置,即:要么给因特网终端设备PC和多媒体平台VOX(html,xml)配备浏览器,这些浏览器可以处理和解释所述的统一了面向显示屏和面向语音的网页信息的同一种源代码;要么在因特网终端设备PC中仅安排一个浏览器,必要时通过多媒体平台VOX(HTML,XML)中的附加的通信代理Asig来补充该浏览器。
在起动本发明方法时,将万维网服务器SER(HTML,XML)上所提供的面向显示屏和面向语音的网页信息i(html,xml)中的面向显示屏部分i(html)传送到因特网终端设备PC上。由所述的因特网终端设备PC通过控制信息isig和数据idat用的传输信道发送一个消息,该消息预告因特网会议的开始,并传送面向显示屏和面向语音的网页信息i(html,xml)中的面向语音的部分i(xml)的地址。于是随后由所述WWW服务器SER(HTML,XML)传输面向语音的部分到多媒体平台VOX(TTS,ASR)上。通过交换控制信息isig来同步通过因特网终端设备PC的浏览器BRhtml或通过多媒体平台VOX(TTS,ASR)的语音浏览器BRxlm所进行的面向显示屏部分i(html)和面向语音部分i(xml)的处理。借助语音代理Avox通过为此所规定的传输信道直接交换语音信息ivox,譬如以便用语音识别ASR的程序来处理,或用在因特网终端设备PC中为此所安排的装置、譬如扬声器来进行输出。在附图2中示范性地示出了,在因特网会议期间借助语音指令i-vox(nr(url))起动新组合的面向显示屏和面向语音的网页信息i(html,xml)的一个可能实现方案。在此假设,通过面向显示屏的输出媒体说明了这种网页信息的列表1(url),从这些网页信息中可以选择。
以下示出了所述实现方案的各个步骤。此时,通过方框箭头来说明计算机程序在其中处理数据的处理步骤,和通过用实线配备的箭头来说明数据或信息的传送。
a.在因特网会议期间,因特网终端设备PC借助浏览器BRhtml譬如在显示屏上显示组合的面向显示屏和面向语音的网页信息i(html,xml)的一个列表1(url)。
b.借助语音指令ivox(nr(url))选出列表1(url)上的录入项。譬如通过录入项的号码nr进行所选出录入项的识别。借助语音代理Avox将语音指令ivox(nr(url))传送到多媒体平台VOX(TTS,ASR)上。
c.在多媒体平台VOX(TTS,ASR)上,用于语音识别ASP的程序将语音指令ivox(nr(url))转换成文本信息nr(url)。
d.通过传输数据和控制信息用的信道将所述的文本信息nr(url)传送到因特网终端设备PC上。
e.因特网终端设备PC的浏览器BRhtml借助所述文本信息nr(url)来识别所希望的网页信息的地址url,并随即通过因特网(INT)对其进行访问。随即将网页信息i(html)传送到因特网终端设备PC上。
本发明方法或本发明装置不局限于所述的实施例,而是可以被用于从面向语音的信息至面向显示屏的信息之间的其它处理和转换,以及相反的处理和转换,譬如用于语音转换、语音识别、借助语音指令导航到网页信息、语音输入和输出等等,其中,所述的多媒体平台VOX(TTS,ASR)是可以用相应的数据处理程序或功能、以及转换程序或功能来装备或补充的。

Claims (11)

1.一种通信装置,
-具有一个可以与多媒体平台(VOX(TTS,ASR))和因特网终端设备(PC)相连接的网络服务器(SER(HTML,XML)),其中,在因特网通信连接的范围内至少部分地将面向语音的网页信息(i(xml))传送到所述的多媒体平台(VOX(TTS,ASR))上,并将面向显示屏的网页信息(i(html)))传送到所述的因特网终端设备(PC)上,所述面向显示屏的网页信息(i(html)))含有对面向语音的网页信息(i(xml))的指示,这些指示允许从面向显示屏的网页信息(i(html)))的处理转换到面向语音的网页信息(i(xml))的处理,
-具有位于所述多媒体平台(VOX(TTS,ASR))中的至少一个语音代理(Avox)和位于所述因特网终端设备(PC)中的至少一个语音代理(Avox),以用于语音信息(ivox)在因特网终端设备(PC)与多媒体平台(VOX(TTS,ASR))之间的直接通信交换,
-具有位于所述因特网终端设备(PC)中的至少一个通信代理(Asig),用于通过向多媒体平台(VOX(TTS,ASR))和因特网终端设备(PC)传送控制和数据信息(isig,idat)来在多媒体平台(VOX(TTS,ASR))和因特网终端设备(PC)之间同步面向语音和面向显示屏的网页信息(i(xml),i(html))。
2.如权利要求1所述的通信装置,其特征在于,
-通过交换控制信息(isig)影响所述多媒体平台(VOX(TTS,ASR))中的语音信息(ivox)的处理、所述因特网终端设备(PC)中的所处理语音信息(ivox)的输出、以及新的网页信息的传送和起动,和
-直接在所述因特网终端设备(PC)和多媒体平台(VOX(TTS,ASR))之间交换已在多媒体平台(VOX(TTS,ASR))中转换的语音信息(idat)。
3.如权利要求1或2之一所述的通信装置,其特征在于,对于语音信息(ivox)的和为所述同步所规定的数据和控制信息(idat,isig)的传送,在所述因特网终端设备(PC)和多媒体平台(VOX(TTS,ASR))之间安排了单独的传输信道。
4.如权利要求1至2之一所述的通信装置,其特征在于,通过基于TCP/IP协议的通信连接、按异步传输方式作用的通信连接、或基于蓝牙标准的通信连接实现了所述传输信道中的一个。
5.一种因特网终端设备,
-具有一个用于处理和解释面向显示屏的网页信息(i(html)))的浏览器(BRhtml),这些网页信息是由网络服务器(SER(HTML,XML))通过所述的因特网(INT)传送的,所述面向显示屏的网页信息(i(html)))含有对面向语音的网页信息(i(xml))的指示,这些指示允许从面向显示屏的网页信息(i(html)))的处理转换到面向语音的网页信息(i(xml))的处理,
-具有一个用于直接与多媒体平台(VOX(TTS,ASR))进行语音信息(ivox)通信交换的语音代理(Avox),和
-具有至少一个通信代理(Asig),用于通过向多媒体平台(VOX(TTS,ASR))和因特网终端设备(PC)传送控制和数据信息(isig,idat)来在多媒体平台(VOX(TTS,ASR))和因特网终端设备(PC)之间同步面向语音和面向显示屏的网页信息(i(xml),i(html))的处理。
6.按权利要求5所述的因特网终端设备,其特征在于,
-通过交换控制信息(isig)影响所处理语音信息(ivox)的输出、和新的网页信息的传送和起动,以及
-直接在所述因特网终端设备(PC)和多媒体平台(VOX(TTS,ASR))之间交换已在多媒体平台(VOX(TTS,ASR))中转换的语音信息(idat)。
7.一种多媒体平台,
-具有一个用于处理和解释面向语音的网页信息(i(xml))的语音浏览器(BRxlm),这些网页信息是由网络服务器(SER(HTML,XML))通过因特网(INT)传送的,
-具有一个用于直接与因特网终端设备PC进行语音信息(ivox)通信交换的语音代理(Avox),
-具有用于将跟所述因特网终端设备(PC)所交换的语音信息(ivox)与由所述网络服务器(SER(HTML,XML))所传送的面向语音的网页信息(i(xml))进行同步的设备并且所述媒体平台安排有语音识别(ASR)用的程序和/或用于将文本转换成语音(TTS)的程序,所述语音识别(ASR)用的程序用于将语音指令(ivox(nr(url))转换成文本信息nr(url))。
8.一种用于处理组合的面向显示屏和面向语音的网页信息(i(html,xml))的方法,在这些网页信息中,至少面向显示屏的部分(i(html))被网络服务器(SER(HTML,XML))在因特网通信连接的范围内传送给因特网终端设备(PC),和至少面向语音的部分(i(xml))被传送给多媒体平台(VOX(TTS,ASR)),
-其中,所述因特网终端设备(PC)和多媒体平台(VOX(TTS,ASR))分别直接借助一个语音代理(Avox)在所述因特网终端设备(PC)和多媒体平台(VOX(TTS,ASR))之间交换所传送的、要处理的或已处理的语音信息(ivox),
-其中,在所述因特网终端设备(PC)和多媒体平台(VOX(TTS,ASR))之间传送控制和数据信息(isig,idat),这些控制和数据信息用于在所述多媒体平台(VOX(TTS,ASR))中影响面向语音的网页信息(i(xml))的处理功能,以及用于在多媒体平台(VOX(TTS,ASR))和因特网终端设备(PC)之间同步面向语音和面向显示屏的网页信息(i(xml,html))的处理,并且
其中所述面向显示屏的网页信息(i(html)))含有对面向语音的网页信息(i(xml))的指示,这些指示允许从面向显示屏的网页信息(i(html)))的处理转换到面向语音的网页信息(i(xml))的处理。
9.如权利要求8所述的方法,其特征在于,
-通过交换控制信息(isig)来影响所述多媒体平台(VOX(TTS,ASR))中的语音信息(ivox)的处理、所述因特网终端设备(PC)中的所处理语音信息(ivox)的输出、和新的网页信息的传送和起动,以及
-直接在所述因特网终端设备(PC)和多媒体平台(VOX(TTS,ASR))之间交换已转换的语音信息(idat)。
10.如权利要求8或9之一所述的方法,其特征在于,通过单独的传输信道在所述因特网终端设备(PC)和多媒体平台(VOX(TTS,ASR))之间传送所述的语音信息(ivox)和为所述同步所规定的数据和控制信息(idat,isig)。
11.如权利要求8至9之一所述的方法,其特征在于,在处理组合的面向显示屏和面向语音的网页信息(i(html,xml))时,要么动用布置在所述多媒体平台(VOX(TTS,ASR))中的数据库,要么动用布置在通过所述因特网(INT)可联系上的WWW服务器中的数据库。
CN018226728A 2000-12-22 2001-11-21 具有交互式语音功能的通信系统用的通信装置和方法以及多媒体平台 Expired - Fee Related CN1489856B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10064661A DE10064661A1 (de) 2000-12-22 2000-12-22 Kommunikationsanordnung und Verfahren für Kommunikationssysteme mit interaktiver Sprachfunktion
DE10064661.1 2000-12-22
PCT/DE2001/004373 WO2002052810A1 (de) 2000-12-22 2001-11-21 Kommunikationsanordnung und verfahren für kommunikationssysteme mit interaktiver sprachfunktion

Publications (2)

Publication Number Publication Date
CN1489856A CN1489856A (zh) 2004-04-14
CN1489856B true CN1489856B (zh) 2011-06-08

Family

ID=7668731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN018226728A Expired - Fee Related CN1489856B (zh) 2000-12-22 2001-11-21 具有交互式语音功能的通信系统用的通信装置和方法以及多媒体平台

Country Status (7)

Country Link
US (1) US7734727B2 (zh)
EP (1) EP1344370B1 (zh)
CN (1) CN1489856B (zh)
BR (1) BR0116476A (zh)
DE (2) DE10064661A1 (zh)
ES (1) ES2307565T3 (zh)
WO (1) WO2002052810A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030125953A1 (en) * 2001-12-28 2003-07-03 Dipanshu Sharma Information retrieval system including voice browser and data conversion server
US20030145062A1 (en) * 2002-01-14 2003-07-31 Dipanshu Sharma Data conversion server for voice browsing system
US20060168095A1 (en) * 2002-01-22 2006-07-27 Dipanshu Sharma Multi-modal information delivery system
US8024194B2 (en) * 2004-12-08 2011-09-20 Nuance Communications, Inc. Dynamic switching between local and remote speech rendering
US7548977B2 (en) * 2005-02-11 2009-06-16 International Business Machines Corporation Client / server application task allocation based upon client resources
DE102007048260A1 (de) 2007-10-08 2009-04-09 Robert Bosch Gmbh Statoranordnung sowie Stator für eine elektrische Maschine
CN101599062B (zh) * 2008-06-06 2011-06-15 佛山市顺德区顺达电脑厂有限公司 检索方法及系统
CN101840219B (zh) * 2009-09-30 2012-09-19 浙江大学 面向湿地公园的安全防范集成系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997032427A1 (en) * 1996-03-01 1997-09-04 Netphonic Communications, Inc. Method and apparatus for telephonically accessing and navigating the internet
EP0859500A2 (en) * 1997-02-18 1998-08-19 Lucent Technologies Inc. Method and apparatus for browsing the Internet with a telecommunications device
DE19856357A1 (de) * 1998-12-07 2000-06-29 Michael Kraewing Verfahren zur Reduzierung der Inhalte von Webseiten und deren Aufbereitung für Bildtelefone und Mobilgeräte mit Sprachbedienung
CN1271224A (zh) * 1999-04-15 2000-10-25 英业达集团(西安)电子技术有限公司 互联网的即时语音及文字传呼方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
US6282511B1 (en) * 1996-12-04 2001-08-28 At&T Voiced interface with hyperlinked information
US6018710A (en) * 1996-12-13 2000-01-25 Siemens Corporate Research, Inc. Web-based interactive radio environment: WIRE
US6269336B1 (en) * 1998-07-24 2001-07-31 Motorola, Inc. Voice browser for interactive services and methods thereof
JP2002527800A (ja) * 1998-10-02 2002-08-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 会話ブラウザおよび会話システム
EP1196868A1 (en) 1999-07-02 2002-04-17 Scansoft, Inc. User-profile driven mapping of speech onto urls
US6738803B1 (en) * 1999-09-03 2004-05-18 Cisco Technology, Inc. Proxy browser providing voice enabled web application audio control for telephony devices
FI19992720A (fi) 1999-12-17 2001-06-18 Nokia Networks Oy Datapuhelun reititys IP-yhteyksillä
US6745163B1 (en) * 2000-09-27 2004-06-01 International Business Machines Corporation Method and system for synchronizing audio and visual presentation in a multi-modal content renderer
US6983250B2 (en) * 2000-10-25 2006-01-03 Nms Communications Corporation Method and system for enabling a user to obtain information from a text-based web site in audio form

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997032427A1 (en) * 1996-03-01 1997-09-04 Netphonic Communications, Inc. Method and apparatus for telephonically accessing and navigating the internet
EP0859500A2 (en) * 1997-02-18 1998-08-19 Lucent Technologies Inc. Method and apparatus for browsing the Internet with a telecommunications device
DE19856357A1 (de) * 1998-12-07 2000-06-29 Michael Kraewing Verfahren zur Reduzierung der Inhalte von Webseiten und deren Aufbereitung für Bildtelefone und Mobilgeräte mit Sprachbedienung
CN1271224A (zh) * 1999-04-15 2000-10-25 英业达集团(西安)电子技术有限公司 互联网的即时语音及文字传呼方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GOOSE Stuart.Enhancing Web accessibility via the Vox Portal and a Web-hosted dynamic HTML<->VoxML converter.COMPUTER NETWORKS.2000,(33),583-592. *

Also Published As

Publication number Publication date
EP1344370A1 (de) 2003-09-17
WO2002052810A1 (de) 2002-07-04
ES2307565T3 (es) 2008-12-01
BR0116476A (pt) 2004-01-06
EP1344370B1 (de) 2008-07-30
US20040078442A1 (en) 2004-04-22
DE50114180D1 (de) 2008-09-11
US7734727B2 (en) 2010-06-08
CN1489856A (zh) 2004-04-14
DE10064661A1 (de) 2002-07-11

Similar Documents

Publication Publication Date Title
US8788675B2 (en) Multi-modal communication using a session specific proxy server
US7062444B2 (en) Architecture for DSR client and server development platform
US8566103B2 (en) Multi-modal web interaction over wireless network
KR100351605B1 (ko) 통신 방법, 서버에 액세스하는 방법, 통신 시스템, 및 서버에 액세스하도록 지시하는 프로그램 코드를 포함하는 기억 매체
US5911485A (en) Predictive data entry method for a keypad
US6067579A (en) Method for reducing message translation and traffic through intermediate applications and systems in an internet application
KR100415996B1 (ko) 웹서버에 의한 html문서의 제공방법
US20060064499A1 (en) Information retrieval system including voice browser and data conversion server
MXPA04010107A (es) Entrada multimodal secuencial.
CN101103612A (zh) 普适设备对网络服务的动态可扩展轻量级接入
WO2001003011A2 (en) Cross-media information server
WO2001065355A1 (en) System and method for rapid document conversion
KR20050045817A (ko) 순차 멀티모달 입력
EP1139335B1 (en) Voice browser system
CN1489856B (zh) 具有交互式语音功能的通信系统用的通信装置和方法以及多媒体平台
WO2002093402A1 (en) Method and system for creating pervasive computing environments
KR20010039743A (ko) 흐름을 디스플레이들 내로 분할하기 위한 방법 및 장치
KR100522625B1 (ko) 대화형 인터페이스 통신시스템의 서비스 제공방법
EP1131940A1 (en) A data access system and method
KR20020079133A (ko) 웹컨텐츠 중계 및 변환장치
KR100523289B1 (ko) 대화형 인터페이스를 이용한 사용자 정황 분석방법
KR100312644B1 (ko) 단문 메시지 서비스를 휴대폰에 제공하는 인터넷 접속용 장치 및 그 방법
KR100752864B1 (ko) 웹을 통해 금융거래를 수행하는 금융 단말시스템
KR20040050764A (ko) 무선 인터넷 컨텐츠에 대한 문서 자동변환방법
KR20040046252A (ko) 이동통신 단말기를 위한 컨텐츠 선택 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110608

Termination date: 20201121

CF01 Termination of patent right due to non-payment of annual fee