CN1564123A - 网页语音接口的操作方法 - Google Patents

网页语音接口的操作方法 Download PDF

Info

Publication number
CN1564123A
CN1564123A CN 200410031317 CN200410031317A CN1564123A CN 1564123 A CN1564123 A CN 1564123A CN 200410031317 CN200410031317 CN 200410031317 CN 200410031317 A CN200410031317 A CN 200410031317A CN 1564123 A CN1564123 A CN 1564123A
Authority
CN
China
Prior art keywords
webpage
operating
interface
speech
content event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200410031317
Other languages
English (en)
Other versions
CN100424630C (zh
Inventor
王文良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Acer Inc
Original Assignee
Acer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Acer Inc filed Critical Acer Inc
Priority to CNB2004100313178A priority Critical patent/CN100424630C/zh
Publication of CN1564123A publication Critical patent/CN1564123A/zh
Application granted granted Critical
Publication of CN100424630C publication Critical patent/CN100424630C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种网页语音接口的操作方法,适用于一图形使用者接口系统,用以借助一语音命令来操控一网页,其中该网页根据多个内容事件的选择而运作,该方法包含下列步骤:接收该网页的多个内容事件的注册,因应这些内容事件的数据而别产生一相对应的对照信号,并储存于一对照表数据库中;接收该语音命令,将该语音命令转换成与该对照信号相同形式的信号,将转换所得的信号于该对照表数据库中比对出相对应的内容事件;以及选择该内容事件显示于该网页上或是执行该内容事件的指令。

Description

网页语音接口的操作方法
技术领域
本发明涉及一种操作方法,尤其是关于一种网页语音接口的操作方法。
背景技术
在传统的操作系统MS-DOS文字模式下,屏幕上显示的是单调的文字接口,使用者必须通过键盘输入指令,才能操作计算机。因此DOS时代所谓的学计算机常常和背指令划上等号,这是许多人的刻板印象,也是许多学计算机人的痛苦回忆,直到图形使用者接口系统的出现才改变了这样的情况。
所谓的图形使用者接口为Graphical User Interface,可缩写为GUI。其中GUI的系统很多,有熟知的微软Windows操作系统、苹果计算机的MacOS、UNIX底下的X Window System等PC GUI系统,Embedded领域里头也有不少的GUI系统如QNX Photon microGUI等等。
图形使用者接口是目前最主要的计算机系统与程序采用的接口,其操作环境以图形及窗口方式显示,使用者只要用鼠标进行操作,就可以看图标找到需要的指令来进行操作,其亲和性的设计可说是操作系统设计上的一大突破。
随着计算机的普及,采用语音与计算机进行交互操作是未来人机接口设计的一个发展方向,这里的语音技术包括两项内容:语音识别(speechrecognition,SR)与语音合成(speech synthesis,SS)。因为这两项技术很复杂,需要相关的语音引擎(speech engine)来支持,而许多软件厂商都出品过自己的语音合成或语音识别引擎,但是这些引擎之间并不兼容,如果一个软件要使用语音功能,开发者必须得从众多的语音引擎中挑选一个来使用,如果将来想要换一个语音引擎,就必须为新引擎重新改写程序,为了解决这个问题,微软公司推出了一组新的应用程序开发接口(API)。然而,应用程序开发接口只提供了一系列接口,它本身并不能做任何事情,以此应用程序开发接口编写的程序还需要语音引擎的支持才能运行。于是微软在此基础上推出语音软件开发工具(Speech SDK)这个开发工具,帮助软件开发者开发语音软件,并在此工具中提供了一系列语音引擎(包括SR和SS),使得软件开发人员轻而易举地就能使自己的程序能说又能听。
虽然,微软的语音软件开发工具提供ASP.NET的平台,程序开发人员可使用ASP.NET+HTML来开发网页语音应用(Web Speech Application),但是现行的语音应用并无法以内容为导向的方式来操作网页。
因此,如何开发一种可改善上述已知技术缺陷,且能提供以内容导向的方式来操作网页的语音接口的操作方法,实为目前迫切需要解决的问题。
发明内容
本发明的主要目的在于提供一种网页语音接口的操作方法,以解决传统的语音应用无法以内容为导向的方式来操作网页等缺陷。
为实现上述目的,本发明提供一种网页语音接口的操作方法,适用于一图形使用者接口系统,用以借助一语音命令来操控一网页,其中该网页根据多个内容事件的选择而运作,该方法包含下列步骤:接收该网页的多个内容事件的注册,因应这些内容事件的数据而各别产生一相对应的对照信号,并储存于一对照表数据库中;接收该语音命令,将该语音命令转换成与该对照信号相同形式的信号,将转换所得的信号于该对照表数据库中比对出相对应的内容事件;以及选择该内容事件显示于该网页上或是执行该内容事件的指令。
根据上述的操作方法,其中该网页为一超文本标记语言(HypertextMarkup Language,HTML)网页。
根据上述的操作方法,其中该语音命令借助一语音引擎(speech engine)所接收。
根据上述的操作方法,其中该网页语音接口的操作方法利用一语音软件开发工具(Speech SDK)所开发。
根据上述的操作方法,其中这些内容事件的数据包含一使用者接口识别码(user interface id)、事件形式(event type)和/或事件内容名称。
根据上述的操作方法,其中该图形使用者接口系统为一订单系统,用以借助该语音命令来操控该网页。
根据上述的操作方法,其中该图形使用者接口系统为一操作系统。
根据上述的操作方法,其中该图形使用者接口系统为一窗口(Windows)操作系统。
根据上述的操作方法,其中该图形使用者接口系统为一Mac OS操作系统或是UNIX操作系统的X窗口系统(X Window System)。
本发明结合下列图示与实施例说明,使得更深入的了解:
附图说明
图1为本发明较佳实施例的网页语音接口的操作方法的流程图。
图2为使用本发明较佳实施例的网页语音接口的操作方法的结构示意图。
图3为使用本发明较佳实施例的网页语音接口的操作方法的HTML网页示意图。
其中,附图标记说明如下:
S11~S13:网页语音接口的操作方法的软件流程步骤
20:网页语音接口的操作软件
21:HTML网页
22:语音引擎
30:HTML网页
具体实施方式
本发明为一种网页语音接口的操作方法,适用于一图形使用者接口系统,其使用微软公司的语音软件开发工具(Speech SDK)所开发的网页语音应用(Web Speech Application)软件,用以借助一语音引擎(speech engine)所接收的语音命令来操控网页的多个内容事件的选择,其中该网页以一超文本标记语言(Hypertext Markup Language,HTML)网页为佳,且HTML网页根据多个内容事件的选择而运作。
请参阅图1,其为本发明较佳实施例的网页语音接口的操作方法的流程图。首先,接收HTML网页的多个内容事件的注册,根据这些内容事件的数据而各别产生相对应的对照信号,并储存于一对照表数据库中(步骤S11)。至于,这些内容事件的数据为该内容事件所属的使用者接口识别码(userinterface id)、事件形式(event type)及/或事件内容名称等。
接着,接收由语音引擎(speech engine)所接收的语音命令,将该语音命令转换成与这些内容事件所产生的对照信号相同形式的信号,并根据语音命令转换所得的信号于该对照表数据库中搜寻并比对出与该语音命令相对应的内容事件(步骤S12)。
最后,根据该语音命令所比对的结果,选择相对应的内容事件显示于HTML网页上或是执行内容事件的指令(步骤S13)。
当然,本发明的网页语音接口的操作方法所适用的图形使用者接口系统可为一订单系统或是一操作系统,但不限定于此。且该操作系统为微软的窗口(Windows)操作系统、苹果计算机的Mac OS操作系统或是UNIX操作系统的X窗口系统(X Window System),但不限定于此。
本发明的网页语音接口的操作方法可以安装软件的形式执行于图形使用者接口系统的系统目录下,因此以网页语音接口的操作软件来代表本发明网页语音接口的操作方法的结构,用以描述本发明网页语音接口的操作方法与其它结构之间的运作方式。请参阅图2,其为使用本发明较佳实施例的网页语音接口的操作方法的结构示意图。如图2所示,网页语音接口的操作软件20与HTML网页21及语音引擎22连接,HTML网页21所包含的所有内容事件必须对网页语音接口的操作软件20进行注册,并于注册完成后将内容事件所各别对应的对照信号储存于对照表数据库中(未图标)。当使用者所发出的语音命令借助语音引擎22被接收时,网页语音接口的操作软件20必须对语音命令进行信号转换后,与存放于对照表数据库中的对照信号进行比对,进而判断出与语音命令对应的内容事件,最后操控该内容事件显示于HTML网页上或是执行内容事件的指令。
图3为使用本发明较佳实施例的网页语音接口的操作方法的HTML网页示意图。在此实施例中,网页语音接口的操作方法适用于一订单系统。如图3所示,该HTML网页30包含“产品类别”、“演出地点”、“演出年度”、“演出月份”等标的,其中产品类别的内容事件为音乐及戏剧等,演出地点的内容事件为地点1、地点2...地点N等。因此,在此HTML网页30初始化时,网页中所有的内容事件需对图2所示的网页语音接口的操作软件20进行注册,进而让使用者可借助语音命令来操控网页的显示。
请再参阅图3,以下将举例描述使用者所发出的语音命令如何造成HTML网页30图形接口的反应:
1、使用者语音命令:地点2音乐;
网页的图形接口反应:节目类别→音乐;演出地点→地点2。
2、使用者语音命令:2003年5月;
网页的图形接口反应:演出年度→2003年;演出月份→5月。
3、使用者语音命令:地点2情境夜上海;
网页的图形接口反应:演出地点→地点2;产品名称→情境夜上海。
4、使用者语音命令:开始查询→如同按下“开使查询”按钮。
由于网页中使用的图形使用者接口(GUI)一般包括:文字输入盒(TextBox)及选项(Radio button,Check Box,ComboBox)等,同时存在于一复杂网页,因此使用本发明的网页语音接口的操作方法能够辅助图形操作接口,再加上直接以内容来控制网页的图形操作接口,使用者可直接说出任何出现在图形使用者接口中的文字,当系统辨识后会直接操作适当的使用者接口(UI)组件,使其正确反应出使用者的意图。
而且,对网页设计者而言,只需在网页初使化时,增加一小段程序代码,例如Java Script or VB Script,使用本发明的网页语音接口的操作方法即可使该网页成为能够以语音内容为导向的网页(Content-oriented Speech EnabledPage)。
另外,由于使用者欲使用网页语音接口来操控网页时,需要按压一热键或是网页中的一个按钮才能触发语音引擎来接收语音命令。反之,如未按压热键或是网页中的按钮时,图形操作接口仍然可正常使用,故使用者可以任何的顺序交互使用图形接口及网页语音接口。
纵上所述,本发明的网页语音接口的操作方法具有下述优点:
1、提供使用者以内容导向的方式来操作网页。
2、提供使用者以语音操作接口来辅助图形操作接口。对使用者而言,图形操作接口仍然可正常使用,故使用者可以任何的顺序交互使用图形接口及网页语音接口。
3、对网页设计者而言,仅需作些微小修改即可。

Claims (9)

1、一种网页语音接口的操作方法,适用于一图形使用者接口系统,用以借助一语音命令来操控一网页,其中该网页根据多个内容事件的选择而运作,该方法包含下列步骤:
接收该网页的多个内容事件的注册,因应这些内容事件的数据而各别产生一相对应的对照信号,并储存于一对照表数据库中;
接收该语音命令,将该语音命令转换成与该对照信号相同形式的信号,将转换所得的信号于该对照表数据库中比对出相对应的内容事件;以及
选择该内容事件显示于该网页上或是执行该内容事件的指令。
2、如权利要求1所述的网页语音接口的操作方法,其特征在于该网页为一超文本标记语言网页。
3、如权利要求1所述的网页语音接口的操作方法,其特征在于该语音命令借助一语音引擎所接收。
4、如权利要求1所述的网页语音接口的操作方法,其特征在于该网页语音接口的操作方法利用一语音软件开发工具所开发。
5、如权利要求1所述的网页语音接口的操作方法,其特征在于这些内容事件的数据包含一使用者接口识别码、事件形式和/或事件内容名称。
6、如权利要求1所述的网页语音接口的操作方法,其特征在于该图形使用者接口系统为一订单系统,用以借助该语音命令来操控该网页。
7、如权利要求1所述的网页语音接口的操作方法,其特征在于该图形使用者接口系统为一操作系统。
8、如权利要求7所述的网页语音接口的操作方法,其特征在于该图形使用者接口系统为一窗口操作系统。
9、如权利要求7所述的网页语音接口的操作方法,其特征在于该图形使用者接口系统为一Mac OS操作系统或是UNIX操作系统的X窗口系统。
CNB2004100313178A 2004-03-26 2004-03-26 网页语音接口的操作方法 Expired - Lifetime CN100424630C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100313178A CN100424630C (zh) 2004-03-26 2004-03-26 网页语音接口的操作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100313178A CN100424630C (zh) 2004-03-26 2004-03-26 网页语音接口的操作方法

Publications (2)

Publication Number Publication Date
CN1564123A true CN1564123A (zh) 2005-01-12
CN100424630C CN100424630C (zh) 2008-10-08

Family

ID=34481256

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100313178A Expired - Lifetime CN100424630C (zh) 2004-03-26 2004-03-26 网页语音接口的操作方法

Country Status (1)

Country Link
CN (1) CN100424630C (zh)

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100444097C (zh) * 2005-06-16 2008-12-17 国际商业机器公司 在多模式浏览器中显示可用菜单选项的方法和系统
US7676371B2 (en) 2006-06-13 2010-03-09 Nuance Communications, Inc. Oral modification of an ASR lexicon of an ASR engine
US7801728B2 (en) 2007-02-26 2010-09-21 Nuance Communications, Inc. Document session replay for multimodal applications
US7809575B2 (en) 2007-02-27 2010-10-05 Nuance Communications, Inc. Enabling global grammars for a particular multimodal application
US7822608B2 (en) 2007-02-27 2010-10-26 Nuance Communications, Inc. Disambiguating a speech recognition grammar in a multimodal application
US7827033B2 (en) 2006-12-06 2010-11-02 Nuance Communications, Inc. Enabling grammars in web page frames
US7840409B2 (en) 2007-02-27 2010-11-23 Nuance Communications, Inc. Ordering recognition results produced by an automatic speech recognition engine for a multimodal application
US7848314B2 (en) 2006-05-10 2010-12-07 Nuance Communications, Inc. VOIP barge-in support for half-duplex DSR client on a full-duplex network
US7917365B2 (en) 2005-06-16 2011-03-29 Nuance Communications, Inc. Synchronizing visual and speech events in a multimodal application
CN102056021A (zh) * 2009-11-04 2011-05-11 李峰 一种基于中英文命令的人机交互系统和方法
US7945851B2 (en) 2007-03-14 2011-05-17 Nuance Communications, Inc. Enabling dynamic voiceXML in an X+V page of a multimodal application
US7957976B2 (en) 2006-09-12 2011-06-07 Nuance Communications, Inc. Establishing a multimodal advertising personality for a sponsor of a multimodal application
US8069047B2 (en) 2007-02-12 2011-11-29 Nuance Communications, Inc. Dynamically defining a VoiceXML grammar in an X+V page of a multimodal application
US8073697B2 (en) 2006-09-12 2011-12-06 International Business Machines Corporation Establishing a multimodal personality for a multimodal application
US8082148B2 (en) 2008-04-24 2011-12-20 Nuance Communications, Inc. Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise
US8086463B2 (en) 2006-09-12 2011-12-27 Nuance Communications, Inc. Dynamically generating a vocal help prompt in a multimodal application
US8090584B2 (en) 2005-06-16 2012-01-03 Nuance Communications, Inc. Modifying a grammar of a hierarchical multimodal menu in dependence upon speech command frequency
US8121837B2 (en) 2008-04-24 2012-02-21 Nuance Communications, Inc. Adjusting a speech engine for a mobile computing device based on background noise
US8145493B2 (en) 2006-09-11 2012-03-27 Nuance Communications, Inc. Establishing a preferred mode of interaction between a user and a multimodal application
US8150698B2 (en) 2007-02-26 2012-04-03 Nuance Communications, Inc. Invoking tapered prompts in a multimodal application
US8214242B2 (en) 2008-04-24 2012-07-03 International Business Machines Corporation Signaling correspondence between a meeting agenda and a meeting discussion
US8229081B2 (en) 2008-04-24 2012-07-24 International Business Machines Corporation Dynamically publishing directory information for a plurality of interactive voice response systems
US8332218B2 (en) 2006-06-13 2012-12-11 Nuance Communications, Inc. Context-based grammars for automated speech recognition
US8374874B2 (en) 2006-09-11 2013-02-12 Nuance Communications, Inc. Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction
CN102957711A (zh) * 2011-08-16 2013-03-06 广州欢网科技有限责任公司 在电视上通过语音进行网址定位的方法及系统
CN102047323B (zh) * 2008-04-07 2013-04-10 纽昂斯通讯公司 网页的自动化语音支持
WO2013155847A1 (zh) * 2012-04-19 2013-10-24 腾讯科技(深圳)有限公司 一种语音控制浏览器动作的方法、系统及浏览器
US8612230B2 (en) 2007-01-03 2013-12-17 Nuance Communications, Inc. Automatic speech recognition with a selection list
US8670987B2 (en) 2007-03-20 2014-03-11 Nuance Communications, Inc. Automatic speech recognition with dynamic grammar rules
US8706490B2 (en) 2007-03-20 2014-04-22 Nuance Communications, Inc. Indexing digitized speech with words represented in the digitized speech
US8713542B2 (en) 2007-02-27 2014-04-29 Nuance Communications, Inc. Pausing a VoiceXML dialog of a multimodal application
US8725513B2 (en) 2007-04-12 2014-05-13 Nuance Communications, Inc. Providing expressive user interaction with a multimodal application
US8781840B2 (en) 2005-09-12 2014-07-15 Nuance Communications, Inc. Retrieval and presentation of network service results for mobile device using a multimodal browser
US8788620B2 (en) 2007-04-04 2014-07-22 International Business Machines Corporation Web service support for a multimodal client processing a multimodal application
US8843376B2 (en) 2007-03-13 2014-09-23 Nuance Communications, Inc. Speech-enabled web content searching using a multimodal browser
US8862475B2 (en) 2007-04-12 2014-10-14 Nuance Communications, Inc. Speech-enabled content navigation and control of a distributed multimodal browser
US8909532B2 (en) 2007-03-23 2014-12-09 Nuance Communications, Inc. Supporting multi-lingual user interaction with a multimodal application
US8938392B2 (en) 2007-02-27 2015-01-20 Nuance Communications, Inc. Configuring a speech engine for a multimodal application based on location
US9083798B2 (en) 2004-12-22 2015-07-14 Nuance Communications, Inc. Enabling voice selection of user preferences
US9208785B2 (en) 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
US9208783B2 (en) 2007-02-27 2015-12-08 Nuance Communications, Inc. Altering behavior of a multimodal application based on location
US9349367B2 (en) 2008-04-24 2016-05-24 Nuance Communications, Inc. Records disambiguation in a multimodal application operating on a multimodal device
CN107408385A (zh) * 2015-04-22 2017-11-28 谷歌公司 开发者语音动作系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3104599A (en) * 1998-03-20 1999-10-11 Inroad, Inc. Voice controlled web browser
GB2342530A (en) * 1998-10-07 2000-04-12 Vocalis Ltd Gathering user inputs by speech recognition
KR100346150B1 (ko) * 2000-01-15 2002-08-01 배문열 전화기를 이용한 웹 페이지 데이터 입·출력시스템 및 방법
JP2002041277A (ja) * 2000-07-28 2002-02-08 Sharp Corp 情報処理装置およびWebブラウザ制御プログラムを記録した記録媒体
CN1205570C (zh) * 2001-02-15 2005-06-08 英业达股份有限公司 网页的用户自定义事件处理方法

Cited By (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9083798B2 (en) 2004-12-22 2015-07-14 Nuance Communications, Inc. Enabling voice selection of user preferences
US8055504B2 (en) 2005-06-16 2011-11-08 Nuance Communications, Inc. Synchronizing visual and speech events in a multimodal application
US8571872B2 (en) 2005-06-16 2013-10-29 Nuance Communications, Inc. Synchronizing visual and speech events in a multimodal application
CN100444097C (zh) * 2005-06-16 2008-12-17 国际商业机器公司 在多模式浏览器中显示可用菜单选项的方法和系统
US8090584B2 (en) 2005-06-16 2012-01-03 Nuance Communications, Inc. Modifying a grammar of a hierarchical multimodal menu in dependence upon speech command frequency
US7917365B2 (en) 2005-06-16 2011-03-29 Nuance Communications, Inc. Synchronizing visual and speech events in a multimodal application
US8781840B2 (en) 2005-09-12 2014-07-15 Nuance Communications, Inc. Retrieval and presentation of network service results for mobile device using a multimodal browser
US9208785B2 (en) 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
US7848314B2 (en) 2006-05-10 2010-12-07 Nuance Communications, Inc. VOIP barge-in support for half-duplex DSR client on a full-duplex network
US8332218B2 (en) 2006-06-13 2012-12-11 Nuance Communications, Inc. Context-based grammars for automated speech recognition
US8566087B2 (en) 2006-06-13 2013-10-22 Nuance Communications, Inc. Context-based grammars for automated speech recognition
US7676371B2 (en) 2006-06-13 2010-03-09 Nuance Communications, Inc. Oral modification of an ASR lexicon of an ASR engine
US8374874B2 (en) 2006-09-11 2013-02-12 Nuance Communications, Inc. Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction
US9343064B2 (en) 2006-09-11 2016-05-17 Nuance Communications, Inc. Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction
US8494858B2 (en) 2006-09-11 2013-07-23 Nuance Communications, Inc. Establishing a preferred mode of interaction between a user and a multimodal application
US8600755B2 (en) 2006-09-11 2013-12-03 Nuance Communications, Inc. Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction
US9292183B2 (en) 2006-09-11 2016-03-22 Nuance Communications, Inc. Establishing a preferred mode of interaction between a user and a multimodal application
US8145493B2 (en) 2006-09-11 2012-03-27 Nuance Communications, Inc. Establishing a preferred mode of interaction between a user and a multimodal application
US8073697B2 (en) 2006-09-12 2011-12-06 International Business Machines Corporation Establishing a multimodal personality for a multimodal application
US8086463B2 (en) 2006-09-12 2011-12-27 Nuance Communications, Inc. Dynamically generating a vocal help prompt in a multimodal application
US8706500B2 (en) 2006-09-12 2014-04-22 Nuance Communications, Inc. Establishing a multimodal personality for a multimodal application
US8239205B2 (en) 2006-09-12 2012-08-07 Nuance Communications, Inc. Establishing a multimodal advertising personality for a sponsor of a multimodal application
US7957976B2 (en) 2006-09-12 2011-06-07 Nuance Communications, Inc. Establishing a multimodal advertising personality for a sponsor of a multimodal application
US8862471B2 (en) 2006-09-12 2014-10-14 Nuance Communications, Inc. Establishing a multimodal advertising personality for a sponsor of a multimodal application
US8498873B2 (en) 2006-09-12 2013-07-30 Nuance Communications, Inc. Establishing a multimodal advertising personality for a sponsor of multimodal application
US7827033B2 (en) 2006-12-06 2010-11-02 Nuance Communications, Inc. Enabling grammars in web page frames
US8612230B2 (en) 2007-01-03 2013-12-17 Nuance Communications, Inc. Automatic speech recognition with a selection list
US8069047B2 (en) 2007-02-12 2011-11-29 Nuance Communications, Inc. Dynamically defining a VoiceXML grammar in an X+V page of a multimodal application
US8744861B2 (en) 2007-02-26 2014-06-03 Nuance Communications, Inc. Invoking tapered prompts in a multimodal application
US8150698B2 (en) 2007-02-26 2012-04-03 Nuance Communications, Inc. Invoking tapered prompts in a multimodal application
US7801728B2 (en) 2007-02-26 2010-09-21 Nuance Communications, Inc. Document session replay for multimodal applications
US8073698B2 (en) 2007-02-27 2011-12-06 Nuance Communications, Inc. Enabling global grammars for a particular multimodal application
US8713542B2 (en) 2007-02-27 2014-04-29 Nuance Communications, Inc. Pausing a VoiceXML dialog of a multimodal application
US7809575B2 (en) 2007-02-27 2010-10-05 Nuance Communications, Inc. Enabling global grammars for a particular multimodal application
US7822608B2 (en) 2007-02-27 2010-10-26 Nuance Communications, Inc. Disambiguating a speech recognition grammar in a multimodal application
US9208783B2 (en) 2007-02-27 2015-12-08 Nuance Communications, Inc. Altering behavior of a multimodal application based on location
US7840409B2 (en) 2007-02-27 2010-11-23 Nuance Communications, Inc. Ordering recognition results produced by an automatic speech recognition engine for a multimodal application
US8938392B2 (en) 2007-02-27 2015-01-20 Nuance Communications, Inc. Configuring a speech engine for a multimodal application based on location
US8843376B2 (en) 2007-03-13 2014-09-23 Nuance Communications, Inc. Speech-enabled web content searching using a multimodal browser
US7945851B2 (en) 2007-03-14 2011-05-17 Nuance Communications, Inc. Enabling dynamic voiceXML in an X+V page of a multimodal application
US8706490B2 (en) 2007-03-20 2014-04-22 Nuance Communications, Inc. Indexing digitized speech with words represented in the digitized speech
US9123337B2 (en) 2007-03-20 2015-09-01 Nuance Communications, Inc. Indexing digitized speech with words represented in the digitized speech
US8670987B2 (en) 2007-03-20 2014-03-11 Nuance Communications, Inc. Automatic speech recognition with dynamic grammar rules
US8909532B2 (en) 2007-03-23 2014-12-09 Nuance Communications, Inc. Supporting multi-lingual user interaction with a multimodal application
US8788620B2 (en) 2007-04-04 2014-07-22 International Business Machines Corporation Web service support for a multimodal client processing a multimodal application
US8725513B2 (en) 2007-04-12 2014-05-13 Nuance Communications, Inc. Providing expressive user interaction with a multimodal application
US8862475B2 (en) 2007-04-12 2014-10-14 Nuance Communications, Inc. Speech-enabled content navigation and control of a distributed multimodal browser
CN102047323B (zh) * 2008-04-07 2013-04-10 纽昂斯通讯公司 网页的自动化语音支持
US8214242B2 (en) 2008-04-24 2012-07-03 International Business Machines Corporation Signaling correspondence between a meeting agenda and a meeting discussion
US9396721B2 (en) 2008-04-24 2016-07-19 Nuance Communications, Inc. Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise
US9076454B2 (en) 2008-04-24 2015-07-07 Nuance Communications, Inc. Adjusting a speech engine for a mobile computing device based on background noise
US8082148B2 (en) 2008-04-24 2011-12-20 Nuance Communications, Inc. Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise
US8121837B2 (en) 2008-04-24 2012-02-21 Nuance Communications, Inc. Adjusting a speech engine for a mobile computing device based on background noise
US8229081B2 (en) 2008-04-24 2012-07-24 International Business Machines Corporation Dynamically publishing directory information for a plurality of interactive voice response systems
US9349367B2 (en) 2008-04-24 2016-05-24 Nuance Communications, Inc. Records disambiguation in a multimodal application operating on a multimodal device
CN102056021A (zh) * 2009-11-04 2011-05-11 李峰 一种基于中英文命令的人机交互系统和方法
CN102957711A (zh) * 2011-08-16 2013-03-06 广州欢网科技有限责任公司 在电视上通过语音进行网址定位的方法及系统
CN103377212A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 一种语音控制浏览器动作的方法、系统及浏览器
CN103377212B (zh) * 2012-04-19 2016-01-20 腾讯科技(深圳)有限公司 一种语音控制浏览器动作的方法、系统及浏览器
WO2013155847A1 (zh) * 2012-04-19 2013-10-24 腾讯科技(深圳)有限公司 一种语音控制浏览器动作的方法、系统及浏览器
CN107408385A (zh) * 2015-04-22 2017-11-28 谷歌公司 开发者语音动作系统
CN107408385B (zh) * 2015-04-22 2021-09-21 谷歌公司 开发者语音动作系统
US11657816B2 (en) 2015-04-22 2023-05-23 Google Llc Developer voice actions system

Also Published As

Publication number Publication date
CN100424630C (zh) 2008-10-08

Similar Documents

Publication Publication Date Title
CN1564123A (zh) 网页语音接口的操作方法
US20060111906A1 (en) Enabling voice click in a multimodal page
US9083798B2 (en) Enabling voice selection of user preferences
CN100421375C (zh) 数据共享系统及方法
US8515920B2 (en) Automatic relevance filtering
USRE44327E1 (en) Drag-and-drop dynamic distributed object model
US8082153B2 (en) Conversational computing via conversational virtual machine
US7487440B2 (en) Reusable voiceXML dialog components, subdialogs and beans
US7216351B1 (en) Systems and methods for synchronizing multi-modal interactions
US7548858B2 (en) System and method for selective audible rendering of data to a user based on user input
CN1881178A (zh) 在多模式应用中同步视觉和语音事件的方法和系统
CN1855009A (zh) 可搜索控制模板功能的基于任务的界面
RU2379745C2 (ru) Совместное использование пошагового языка разметки и объектно ориентированного инструментального средства разработки
EP1330707A1 (en) Method and computer program for rendering assemblies objects on user-interface to present data of application
CN1790326A (zh) 语义画布
CN1647023A (zh) 语音控制的数据输入
CN100346340C (zh) 用于使用移动终端的超链接特征来自动管理信息的方法
CN1855041A (zh) 实现虚拟语音一键通功能的方法和多模式界面
WO2007005185A2 (en) Speech application instrumentation and logging
CN1719784A (zh) 多模式对话处理方法
US7886264B1 (en) Automatic conversion for disparate data types
CN1641569A (zh) Java小应用程序下插件功能的实现方法
JP3870168B2 (ja) 無線デバイスのアクセスおよび管理のためのダイナミック・マシン合成方法
US7971186B1 (en) Automatic execution flow ordering
WO2007097526A1 (en) Method for providing hierarchical ring menu for graphic user interface and apparatus thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant