CN1564123A - 网页语音接口的操作方法 - Google Patents
网页语音接口的操作方法 Download PDFInfo
- Publication number
- CN1564123A CN1564123A CN 200410031317 CN200410031317A CN1564123A CN 1564123 A CN1564123 A CN 1564123A CN 200410031317 CN200410031317 CN 200410031317 CN 200410031317 A CN200410031317 A CN 200410031317A CN 1564123 A CN1564123 A CN 1564123A
- Authority
- CN
- China
- Prior art keywords
- webpage
- operating
- interface
- speech
- content event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种网页语音接口的操作方法,适用于一图形使用者接口系统,用以借助一语音命令来操控一网页,其中该网页根据多个内容事件的选择而运作,该方法包含下列步骤:接收该网页的多个内容事件的注册,因应这些内容事件的数据而别产生一相对应的对照信号,并储存于一对照表数据库中;接收该语音命令,将该语音命令转换成与该对照信号相同形式的信号,将转换所得的信号于该对照表数据库中比对出相对应的内容事件;以及选择该内容事件显示于该网页上或是执行该内容事件的指令。
Description
技术领域
本发明涉及一种操作方法,尤其是关于一种网页语音接口的操作方法。
背景技术
在传统的操作系统MS-DOS文字模式下,屏幕上显示的是单调的文字接口,使用者必须通过键盘输入指令,才能操作计算机。因此DOS时代所谓的学计算机常常和背指令划上等号,这是许多人的刻板印象,也是许多学计算机人的痛苦回忆,直到图形使用者接口系统的出现才改变了这样的情况。
所谓的图形使用者接口为Graphical User Interface,可缩写为GUI。其中GUI的系统很多,有熟知的微软Windows操作系统、苹果计算机的MacOS、UNIX底下的X Window System等PC GUI系统,Embedded领域里头也有不少的GUI系统如QNX Photon microGUI等等。
图形使用者接口是目前最主要的计算机系统与程序采用的接口,其操作环境以图形及窗口方式显示,使用者只要用鼠标进行操作,就可以看图标找到需要的指令来进行操作,其亲和性的设计可说是操作系统设计上的一大突破。
随着计算机的普及,采用语音与计算机进行交互操作是未来人机接口设计的一个发展方向,这里的语音技术包括两项内容:语音识别(speechrecognition,SR)与语音合成(speech synthesis,SS)。因为这两项技术很复杂,需要相关的语音引擎(speech engine)来支持,而许多软件厂商都出品过自己的语音合成或语音识别引擎,但是这些引擎之间并不兼容,如果一个软件要使用语音功能,开发者必须得从众多的语音引擎中挑选一个来使用,如果将来想要换一个语音引擎,就必须为新引擎重新改写程序,为了解决这个问题,微软公司推出了一组新的应用程序开发接口(API)。然而,应用程序开发接口只提供了一系列接口,它本身并不能做任何事情,以此应用程序开发接口编写的程序还需要语音引擎的支持才能运行。于是微软在此基础上推出语音软件开发工具(Speech SDK)这个开发工具,帮助软件开发者开发语音软件,并在此工具中提供了一系列语音引擎(包括SR和SS),使得软件开发人员轻而易举地就能使自己的程序能说又能听。
虽然,微软的语音软件开发工具提供ASP.NET的平台,程序开发人员可使用ASP.NET+HTML来开发网页语音应用(Web Speech Application),但是现行的语音应用并无法以内容为导向的方式来操作网页。
因此,如何开发一种可改善上述已知技术缺陷,且能提供以内容导向的方式来操作网页的语音接口的操作方法,实为目前迫切需要解决的问题。
发明内容
本发明的主要目的在于提供一种网页语音接口的操作方法,以解决传统的语音应用无法以内容为导向的方式来操作网页等缺陷。
为实现上述目的,本发明提供一种网页语音接口的操作方法,适用于一图形使用者接口系统,用以借助一语音命令来操控一网页,其中该网页根据多个内容事件的选择而运作,该方法包含下列步骤:接收该网页的多个内容事件的注册,因应这些内容事件的数据而各别产生一相对应的对照信号,并储存于一对照表数据库中;接收该语音命令,将该语音命令转换成与该对照信号相同形式的信号,将转换所得的信号于该对照表数据库中比对出相对应的内容事件;以及选择该内容事件显示于该网页上或是执行该内容事件的指令。
根据上述的操作方法,其中该网页为一超文本标记语言(HypertextMarkup Language,HTML)网页。
根据上述的操作方法,其中该语音命令借助一语音引擎(speech engine)所接收。
根据上述的操作方法,其中该网页语音接口的操作方法利用一语音软件开发工具(Speech SDK)所开发。
根据上述的操作方法,其中这些内容事件的数据包含一使用者接口识别码(user interface id)、事件形式(event type)和/或事件内容名称。
根据上述的操作方法,其中该图形使用者接口系统为一订单系统,用以借助该语音命令来操控该网页。
根据上述的操作方法,其中该图形使用者接口系统为一操作系统。
根据上述的操作方法,其中该图形使用者接口系统为一窗口(Windows)操作系统。
根据上述的操作方法,其中该图形使用者接口系统为一Mac OS操作系统或是UNIX操作系统的X窗口系统(X Window System)。
本发明结合下列图示与实施例说明,使得更深入的了解:
附图说明
图1为本发明较佳实施例的网页语音接口的操作方法的流程图。
图2为使用本发明较佳实施例的网页语音接口的操作方法的结构示意图。
图3为使用本发明较佳实施例的网页语音接口的操作方法的HTML网页示意图。
其中,附图标记说明如下:
S11~S13:网页语音接口的操作方法的软件流程步骤
20:网页语音接口的操作软件
21:HTML网页
22:语音引擎
30:HTML网页
具体实施方式
本发明为一种网页语音接口的操作方法,适用于一图形使用者接口系统,其使用微软公司的语音软件开发工具(Speech SDK)所开发的网页语音应用(Web Speech Application)软件,用以借助一语音引擎(speech engine)所接收的语音命令来操控网页的多个内容事件的选择,其中该网页以一超文本标记语言(Hypertext Markup Language,HTML)网页为佳,且HTML网页根据多个内容事件的选择而运作。
请参阅图1,其为本发明较佳实施例的网页语音接口的操作方法的流程图。首先,接收HTML网页的多个内容事件的注册,根据这些内容事件的数据而各别产生相对应的对照信号,并储存于一对照表数据库中(步骤S11)。至于,这些内容事件的数据为该内容事件所属的使用者接口识别码(userinterface id)、事件形式(event type)及/或事件内容名称等。
接着,接收由语音引擎(speech engine)所接收的语音命令,将该语音命令转换成与这些内容事件所产生的对照信号相同形式的信号,并根据语音命令转换所得的信号于该对照表数据库中搜寻并比对出与该语音命令相对应的内容事件(步骤S12)。
最后,根据该语音命令所比对的结果,选择相对应的内容事件显示于HTML网页上或是执行内容事件的指令(步骤S13)。
当然,本发明的网页语音接口的操作方法所适用的图形使用者接口系统可为一订单系统或是一操作系统,但不限定于此。且该操作系统为微软的窗口(Windows)操作系统、苹果计算机的Mac OS操作系统或是UNIX操作系统的X窗口系统(X Window System),但不限定于此。
本发明的网页语音接口的操作方法可以安装软件的形式执行于图形使用者接口系统的系统目录下,因此以网页语音接口的操作软件来代表本发明网页语音接口的操作方法的结构,用以描述本发明网页语音接口的操作方法与其它结构之间的运作方式。请参阅图2,其为使用本发明较佳实施例的网页语音接口的操作方法的结构示意图。如图2所示,网页语音接口的操作软件20与HTML网页21及语音引擎22连接,HTML网页21所包含的所有内容事件必须对网页语音接口的操作软件20进行注册,并于注册完成后将内容事件所各别对应的对照信号储存于对照表数据库中(未图标)。当使用者所发出的语音命令借助语音引擎22被接收时,网页语音接口的操作软件20必须对语音命令进行信号转换后,与存放于对照表数据库中的对照信号进行比对,进而判断出与语音命令对应的内容事件,最后操控该内容事件显示于HTML网页上或是执行内容事件的指令。
图3为使用本发明较佳实施例的网页语音接口的操作方法的HTML网页示意图。在此实施例中,网页语音接口的操作方法适用于一订单系统。如图3所示,该HTML网页30包含“产品类别”、“演出地点”、“演出年度”、“演出月份”等标的,其中产品类别的内容事件为音乐及戏剧等,演出地点的内容事件为地点1、地点2...地点N等。因此,在此HTML网页30初始化时,网页中所有的内容事件需对图2所示的网页语音接口的操作软件20进行注册,进而让使用者可借助语音命令来操控网页的显示。
请再参阅图3,以下将举例描述使用者所发出的语音命令如何造成HTML网页30图形接口的反应:
1、使用者语音命令:地点2音乐;
网页的图形接口反应:节目类别→音乐;演出地点→地点2。
2、使用者语音命令:2003年5月;
网页的图形接口反应:演出年度→2003年;演出月份→5月。
3、使用者语音命令:地点2情境夜上海;
网页的图形接口反应:演出地点→地点2;产品名称→情境夜上海。
4、使用者语音命令:开始查询→如同按下“开使查询”按钮。
由于网页中使用的图形使用者接口(GUI)一般包括:文字输入盒(TextBox)及选项(Radio button,Check Box,ComboBox)等,同时存在于一复杂网页,因此使用本发明的网页语音接口的操作方法能够辅助图形操作接口,再加上直接以内容来控制网页的图形操作接口,使用者可直接说出任何出现在图形使用者接口中的文字,当系统辨识后会直接操作适当的使用者接口(UI)组件,使其正确反应出使用者的意图。
而且,对网页设计者而言,只需在网页初使化时,增加一小段程序代码,例如Java Script or VB Script,使用本发明的网页语音接口的操作方法即可使该网页成为能够以语音内容为导向的网页(Content-oriented Speech EnabledPage)。
另外,由于使用者欲使用网页语音接口来操控网页时,需要按压一热键或是网页中的一个按钮才能触发语音引擎来接收语音命令。反之,如未按压热键或是网页中的按钮时,图形操作接口仍然可正常使用,故使用者可以任何的顺序交互使用图形接口及网页语音接口。
纵上所述,本发明的网页语音接口的操作方法具有下述优点:
1、提供使用者以内容导向的方式来操作网页。
2、提供使用者以语音操作接口来辅助图形操作接口。对使用者而言,图形操作接口仍然可正常使用,故使用者可以任何的顺序交互使用图形接口及网页语音接口。
3、对网页设计者而言,仅需作些微小修改即可。
Claims (9)
1、一种网页语音接口的操作方法,适用于一图形使用者接口系统,用以借助一语音命令来操控一网页,其中该网页根据多个内容事件的选择而运作,该方法包含下列步骤:
接收该网页的多个内容事件的注册,因应这些内容事件的数据而各别产生一相对应的对照信号,并储存于一对照表数据库中;
接收该语音命令,将该语音命令转换成与该对照信号相同形式的信号,将转换所得的信号于该对照表数据库中比对出相对应的内容事件;以及
选择该内容事件显示于该网页上或是执行该内容事件的指令。
2、如权利要求1所述的网页语音接口的操作方法,其特征在于该网页为一超文本标记语言网页。
3、如权利要求1所述的网页语音接口的操作方法,其特征在于该语音命令借助一语音引擎所接收。
4、如权利要求1所述的网页语音接口的操作方法,其特征在于该网页语音接口的操作方法利用一语音软件开发工具所开发。
5、如权利要求1所述的网页语音接口的操作方法,其特征在于这些内容事件的数据包含一使用者接口识别码、事件形式和/或事件内容名称。
6、如权利要求1所述的网页语音接口的操作方法,其特征在于该图形使用者接口系统为一订单系统,用以借助该语音命令来操控该网页。
7、如权利要求1所述的网页语音接口的操作方法,其特征在于该图形使用者接口系统为一操作系统。
8、如权利要求7所述的网页语音接口的操作方法,其特征在于该图形使用者接口系统为一窗口操作系统。
9、如权利要求7所述的网页语音接口的操作方法,其特征在于该图形使用者接口系统为一Mac OS操作系统或是UNIX操作系统的X窗口系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2004100313178A CN100424630C (zh) | 2004-03-26 | 2004-03-26 | 网页语音接口的操作方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2004100313178A CN100424630C (zh) | 2004-03-26 | 2004-03-26 | 网页语音接口的操作方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1564123A true CN1564123A (zh) | 2005-01-12 |
CN100424630C CN100424630C (zh) | 2008-10-08 |
Family
ID=34481256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100313178A Expired - Lifetime CN100424630C (zh) | 2004-03-26 | 2004-03-26 | 网页语音接口的操作方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100424630C (zh) |
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100444097C (zh) * | 2005-06-16 | 2008-12-17 | 国际商业机器公司 | 在多模式浏览器中显示可用菜单选项的方法和系统 |
US7676371B2 (en) | 2006-06-13 | 2010-03-09 | Nuance Communications, Inc. | Oral modification of an ASR lexicon of an ASR engine |
US7801728B2 (en) | 2007-02-26 | 2010-09-21 | Nuance Communications, Inc. | Document session replay for multimodal applications |
US7809575B2 (en) | 2007-02-27 | 2010-10-05 | Nuance Communications, Inc. | Enabling global grammars for a particular multimodal application |
US7822608B2 (en) | 2007-02-27 | 2010-10-26 | Nuance Communications, Inc. | Disambiguating a speech recognition grammar in a multimodal application |
US7827033B2 (en) | 2006-12-06 | 2010-11-02 | Nuance Communications, Inc. | Enabling grammars in web page frames |
US7840409B2 (en) | 2007-02-27 | 2010-11-23 | Nuance Communications, Inc. | Ordering recognition results produced by an automatic speech recognition engine for a multimodal application |
US7848314B2 (en) | 2006-05-10 | 2010-12-07 | Nuance Communications, Inc. | VOIP barge-in support for half-duplex DSR client on a full-duplex network |
US7917365B2 (en) | 2005-06-16 | 2011-03-29 | Nuance Communications, Inc. | Synchronizing visual and speech events in a multimodal application |
CN102056021A (zh) * | 2009-11-04 | 2011-05-11 | 李峰 | 一种基于中英文命令的人机交互系统和方法 |
US7945851B2 (en) | 2007-03-14 | 2011-05-17 | Nuance Communications, Inc. | Enabling dynamic voiceXML in an X+V page of a multimodal application |
US7957976B2 (en) | 2006-09-12 | 2011-06-07 | Nuance Communications, Inc. | Establishing a multimodal advertising personality for a sponsor of a multimodal application |
US8069047B2 (en) | 2007-02-12 | 2011-11-29 | Nuance Communications, Inc. | Dynamically defining a VoiceXML grammar in an X+V page of a multimodal application |
US8073697B2 (en) | 2006-09-12 | 2011-12-06 | International Business Machines Corporation | Establishing a multimodal personality for a multimodal application |
US8082148B2 (en) | 2008-04-24 | 2011-12-20 | Nuance Communications, Inc. | Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise |
US8086463B2 (en) | 2006-09-12 | 2011-12-27 | Nuance Communications, Inc. | Dynamically generating a vocal help prompt in a multimodal application |
US8090584B2 (en) | 2005-06-16 | 2012-01-03 | Nuance Communications, Inc. | Modifying a grammar of a hierarchical multimodal menu in dependence upon speech command frequency |
US8121837B2 (en) | 2008-04-24 | 2012-02-21 | Nuance Communications, Inc. | Adjusting a speech engine for a mobile computing device based on background noise |
US8145493B2 (en) | 2006-09-11 | 2012-03-27 | Nuance Communications, Inc. | Establishing a preferred mode of interaction between a user and a multimodal application |
US8150698B2 (en) | 2007-02-26 | 2012-04-03 | Nuance Communications, Inc. | Invoking tapered prompts in a multimodal application |
US8214242B2 (en) | 2008-04-24 | 2012-07-03 | International Business Machines Corporation | Signaling correspondence between a meeting agenda and a meeting discussion |
US8229081B2 (en) | 2008-04-24 | 2012-07-24 | International Business Machines Corporation | Dynamically publishing directory information for a plurality of interactive voice response systems |
US8332218B2 (en) | 2006-06-13 | 2012-12-11 | Nuance Communications, Inc. | Context-based grammars for automated speech recognition |
US8374874B2 (en) | 2006-09-11 | 2013-02-12 | Nuance Communications, Inc. | Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction |
CN102957711A (zh) * | 2011-08-16 | 2013-03-06 | 广州欢网科技有限责任公司 | 在电视上通过语音进行网址定位的方法及系统 |
CN102047323B (zh) * | 2008-04-07 | 2013-04-10 | 纽昂斯通讯公司 | 网页的自动化语音支持 |
WO2013155847A1 (zh) * | 2012-04-19 | 2013-10-24 | 腾讯科技(深圳)有限公司 | 一种语音控制浏览器动作的方法、系统及浏览器 |
US8612230B2 (en) | 2007-01-03 | 2013-12-17 | Nuance Communications, Inc. | Automatic speech recognition with a selection list |
US8670987B2 (en) | 2007-03-20 | 2014-03-11 | Nuance Communications, Inc. | Automatic speech recognition with dynamic grammar rules |
US8706490B2 (en) | 2007-03-20 | 2014-04-22 | Nuance Communications, Inc. | Indexing digitized speech with words represented in the digitized speech |
US8713542B2 (en) | 2007-02-27 | 2014-04-29 | Nuance Communications, Inc. | Pausing a VoiceXML dialog of a multimodal application |
US8725513B2 (en) | 2007-04-12 | 2014-05-13 | Nuance Communications, Inc. | Providing expressive user interaction with a multimodal application |
US8781840B2 (en) | 2005-09-12 | 2014-07-15 | Nuance Communications, Inc. | Retrieval and presentation of network service results for mobile device using a multimodal browser |
US8788620B2 (en) | 2007-04-04 | 2014-07-22 | International Business Machines Corporation | Web service support for a multimodal client processing a multimodal application |
US8843376B2 (en) | 2007-03-13 | 2014-09-23 | Nuance Communications, Inc. | Speech-enabled web content searching using a multimodal browser |
US8862475B2 (en) | 2007-04-12 | 2014-10-14 | Nuance Communications, Inc. | Speech-enabled content navigation and control of a distributed multimodal browser |
US8909532B2 (en) | 2007-03-23 | 2014-12-09 | Nuance Communications, Inc. | Supporting multi-lingual user interaction with a multimodal application |
US8938392B2 (en) | 2007-02-27 | 2015-01-20 | Nuance Communications, Inc. | Configuring a speech engine for a multimodal application based on location |
US9083798B2 (en) | 2004-12-22 | 2015-07-14 | Nuance Communications, Inc. | Enabling voice selection of user preferences |
US9208785B2 (en) | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
US9208783B2 (en) | 2007-02-27 | 2015-12-08 | Nuance Communications, Inc. | Altering behavior of a multimodal application based on location |
US9349367B2 (en) | 2008-04-24 | 2016-05-24 | Nuance Communications, Inc. | Records disambiguation in a multimodal application operating on a multimodal device |
CN107408385A (zh) * | 2015-04-22 | 2017-11-28 | 谷歌公司 | 开发者语音动作系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU3104599A (en) * | 1998-03-20 | 1999-10-11 | Inroad, Inc. | Voice controlled web browser |
GB2342530A (en) * | 1998-10-07 | 2000-04-12 | Vocalis Ltd | Gathering user inputs by speech recognition |
KR100346150B1 (ko) * | 2000-01-15 | 2002-08-01 | 배문열 | 전화기를 이용한 웹 페이지 데이터 입·출력시스템 및 방법 |
JP2002041277A (ja) * | 2000-07-28 | 2002-02-08 | Sharp Corp | 情報処理装置およびWebブラウザ制御プログラムを記録した記録媒体 |
CN1205570C (zh) * | 2001-02-15 | 2005-06-08 | 英业达股份有限公司 | 网页的用户自定义事件处理方法 |
-
2004
- 2004-03-26 CN CNB2004100313178A patent/CN100424630C/zh not_active Expired - Lifetime
Cited By (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9083798B2 (en) | 2004-12-22 | 2015-07-14 | Nuance Communications, Inc. | Enabling voice selection of user preferences |
US8055504B2 (en) | 2005-06-16 | 2011-11-08 | Nuance Communications, Inc. | Synchronizing visual and speech events in a multimodal application |
US8571872B2 (en) | 2005-06-16 | 2013-10-29 | Nuance Communications, Inc. | Synchronizing visual and speech events in a multimodal application |
CN100444097C (zh) * | 2005-06-16 | 2008-12-17 | 国际商业机器公司 | 在多模式浏览器中显示可用菜单选项的方法和系统 |
US8090584B2 (en) | 2005-06-16 | 2012-01-03 | Nuance Communications, Inc. | Modifying a grammar of a hierarchical multimodal menu in dependence upon speech command frequency |
US7917365B2 (en) | 2005-06-16 | 2011-03-29 | Nuance Communications, Inc. | Synchronizing visual and speech events in a multimodal application |
US8781840B2 (en) | 2005-09-12 | 2014-07-15 | Nuance Communications, Inc. | Retrieval and presentation of network service results for mobile device using a multimodal browser |
US9208785B2 (en) | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
US7848314B2 (en) | 2006-05-10 | 2010-12-07 | Nuance Communications, Inc. | VOIP barge-in support for half-duplex DSR client on a full-duplex network |
US8332218B2 (en) | 2006-06-13 | 2012-12-11 | Nuance Communications, Inc. | Context-based grammars for automated speech recognition |
US8566087B2 (en) | 2006-06-13 | 2013-10-22 | Nuance Communications, Inc. | Context-based grammars for automated speech recognition |
US7676371B2 (en) | 2006-06-13 | 2010-03-09 | Nuance Communications, Inc. | Oral modification of an ASR lexicon of an ASR engine |
US8374874B2 (en) | 2006-09-11 | 2013-02-12 | Nuance Communications, Inc. | Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction |
US9343064B2 (en) | 2006-09-11 | 2016-05-17 | Nuance Communications, Inc. | Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction |
US8494858B2 (en) | 2006-09-11 | 2013-07-23 | Nuance Communications, Inc. | Establishing a preferred mode of interaction between a user and a multimodal application |
US8600755B2 (en) | 2006-09-11 | 2013-12-03 | Nuance Communications, Inc. | Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction |
US9292183B2 (en) | 2006-09-11 | 2016-03-22 | Nuance Communications, Inc. | Establishing a preferred mode of interaction between a user and a multimodal application |
US8145493B2 (en) | 2006-09-11 | 2012-03-27 | Nuance Communications, Inc. | Establishing a preferred mode of interaction between a user and a multimodal application |
US8073697B2 (en) | 2006-09-12 | 2011-12-06 | International Business Machines Corporation | Establishing a multimodal personality for a multimodal application |
US8086463B2 (en) | 2006-09-12 | 2011-12-27 | Nuance Communications, Inc. | Dynamically generating a vocal help prompt in a multimodal application |
US8706500B2 (en) | 2006-09-12 | 2014-04-22 | Nuance Communications, Inc. | Establishing a multimodal personality for a multimodal application |
US8239205B2 (en) | 2006-09-12 | 2012-08-07 | Nuance Communications, Inc. | Establishing a multimodal advertising personality for a sponsor of a multimodal application |
US7957976B2 (en) | 2006-09-12 | 2011-06-07 | Nuance Communications, Inc. | Establishing a multimodal advertising personality for a sponsor of a multimodal application |
US8862471B2 (en) | 2006-09-12 | 2014-10-14 | Nuance Communications, Inc. | Establishing a multimodal advertising personality for a sponsor of a multimodal application |
US8498873B2 (en) | 2006-09-12 | 2013-07-30 | Nuance Communications, Inc. | Establishing a multimodal advertising personality for a sponsor of multimodal application |
US7827033B2 (en) | 2006-12-06 | 2010-11-02 | Nuance Communications, Inc. | Enabling grammars in web page frames |
US8612230B2 (en) | 2007-01-03 | 2013-12-17 | Nuance Communications, Inc. | Automatic speech recognition with a selection list |
US8069047B2 (en) | 2007-02-12 | 2011-11-29 | Nuance Communications, Inc. | Dynamically defining a VoiceXML grammar in an X+V page of a multimodal application |
US8744861B2 (en) | 2007-02-26 | 2014-06-03 | Nuance Communications, Inc. | Invoking tapered prompts in a multimodal application |
US8150698B2 (en) | 2007-02-26 | 2012-04-03 | Nuance Communications, Inc. | Invoking tapered prompts in a multimodal application |
US7801728B2 (en) | 2007-02-26 | 2010-09-21 | Nuance Communications, Inc. | Document session replay for multimodal applications |
US8073698B2 (en) | 2007-02-27 | 2011-12-06 | Nuance Communications, Inc. | Enabling global grammars for a particular multimodal application |
US8713542B2 (en) | 2007-02-27 | 2014-04-29 | Nuance Communications, Inc. | Pausing a VoiceXML dialog of a multimodal application |
US7809575B2 (en) | 2007-02-27 | 2010-10-05 | Nuance Communications, Inc. | Enabling global grammars for a particular multimodal application |
US7822608B2 (en) | 2007-02-27 | 2010-10-26 | Nuance Communications, Inc. | Disambiguating a speech recognition grammar in a multimodal application |
US9208783B2 (en) | 2007-02-27 | 2015-12-08 | Nuance Communications, Inc. | Altering behavior of a multimodal application based on location |
US7840409B2 (en) | 2007-02-27 | 2010-11-23 | Nuance Communications, Inc. | Ordering recognition results produced by an automatic speech recognition engine for a multimodal application |
US8938392B2 (en) | 2007-02-27 | 2015-01-20 | Nuance Communications, Inc. | Configuring a speech engine for a multimodal application based on location |
US8843376B2 (en) | 2007-03-13 | 2014-09-23 | Nuance Communications, Inc. | Speech-enabled web content searching using a multimodal browser |
US7945851B2 (en) | 2007-03-14 | 2011-05-17 | Nuance Communications, Inc. | Enabling dynamic voiceXML in an X+V page of a multimodal application |
US8706490B2 (en) | 2007-03-20 | 2014-04-22 | Nuance Communications, Inc. | Indexing digitized speech with words represented in the digitized speech |
US9123337B2 (en) | 2007-03-20 | 2015-09-01 | Nuance Communications, Inc. | Indexing digitized speech with words represented in the digitized speech |
US8670987B2 (en) | 2007-03-20 | 2014-03-11 | Nuance Communications, Inc. | Automatic speech recognition with dynamic grammar rules |
US8909532B2 (en) | 2007-03-23 | 2014-12-09 | Nuance Communications, Inc. | Supporting multi-lingual user interaction with a multimodal application |
US8788620B2 (en) | 2007-04-04 | 2014-07-22 | International Business Machines Corporation | Web service support for a multimodal client processing a multimodal application |
US8725513B2 (en) | 2007-04-12 | 2014-05-13 | Nuance Communications, Inc. | Providing expressive user interaction with a multimodal application |
US8862475B2 (en) | 2007-04-12 | 2014-10-14 | Nuance Communications, Inc. | Speech-enabled content navigation and control of a distributed multimodal browser |
CN102047323B (zh) * | 2008-04-07 | 2013-04-10 | 纽昂斯通讯公司 | 网页的自动化语音支持 |
US8214242B2 (en) | 2008-04-24 | 2012-07-03 | International Business Machines Corporation | Signaling correspondence between a meeting agenda and a meeting discussion |
US9396721B2 (en) | 2008-04-24 | 2016-07-19 | Nuance Communications, Inc. | Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise |
US9076454B2 (en) | 2008-04-24 | 2015-07-07 | Nuance Communications, Inc. | Adjusting a speech engine for a mobile computing device based on background noise |
US8082148B2 (en) | 2008-04-24 | 2011-12-20 | Nuance Communications, Inc. | Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise |
US8121837B2 (en) | 2008-04-24 | 2012-02-21 | Nuance Communications, Inc. | Adjusting a speech engine for a mobile computing device based on background noise |
US8229081B2 (en) | 2008-04-24 | 2012-07-24 | International Business Machines Corporation | Dynamically publishing directory information for a plurality of interactive voice response systems |
US9349367B2 (en) | 2008-04-24 | 2016-05-24 | Nuance Communications, Inc. | Records disambiguation in a multimodal application operating on a multimodal device |
CN102056021A (zh) * | 2009-11-04 | 2011-05-11 | 李峰 | 一种基于中英文命令的人机交互系统和方法 |
CN102957711A (zh) * | 2011-08-16 | 2013-03-06 | 广州欢网科技有限责任公司 | 在电视上通过语音进行网址定位的方法及系统 |
CN103377212A (zh) * | 2012-04-19 | 2013-10-30 | 腾讯科技(深圳)有限公司 | 一种语音控制浏览器动作的方法、系统及浏览器 |
CN103377212B (zh) * | 2012-04-19 | 2016-01-20 | 腾讯科技(深圳)有限公司 | 一种语音控制浏览器动作的方法、系统及浏览器 |
WO2013155847A1 (zh) * | 2012-04-19 | 2013-10-24 | 腾讯科技(深圳)有限公司 | 一种语音控制浏览器动作的方法、系统及浏览器 |
CN107408385A (zh) * | 2015-04-22 | 2017-11-28 | 谷歌公司 | 开发者语音动作系统 |
CN107408385B (zh) * | 2015-04-22 | 2021-09-21 | 谷歌公司 | 开发者语音动作系统 |
US11657816B2 (en) | 2015-04-22 | 2023-05-23 | Google Llc | Developer voice actions system |
Also Published As
Publication number | Publication date |
---|---|
CN100424630C (zh) | 2008-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1564123A (zh) | 网页语音接口的操作方法 | |
US20060111906A1 (en) | Enabling voice click in a multimodal page | |
US9083798B2 (en) | Enabling voice selection of user preferences | |
CN100421375C (zh) | 数据共享系统及方法 | |
US8515920B2 (en) | Automatic relevance filtering | |
USRE44327E1 (en) | Drag-and-drop dynamic distributed object model | |
US8082153B2 (en) | Conversational computing via conversational virtual machine | |
US7487440B2 (en) | Reusable voiceXML dialog components, subdialogs and beans | |
US7216351B1 (en) | Systems and methods for synchronizing multi-modal interactions | |
US7548858B2 (en) | System and method for selective audible rendering of data to a user based on user input | |
CN1881178A (zh) | 在多模式应用中同步视觉和语音事件的方法和系统 | |
CN1855009A (zh) | 可搜索控制模板功能的基于任务的界面 | |
RU2379745C2 (ru) | Совместное использование пошагового языка разметки и объектно ориентированного инструментального средства разработки | |
EP1330707A1 (en) | Method and computer program for rendering assemblies objects on user-interface to present data of application | |
CN1790326A (zh) | 语义画布 | |
CN1647023A (zh) | 语音控制的数据输入 | |
CN100346340C (zh) | 用于使用移动终端的超链接特征来自动管理信息的方法 | |
CN1855041A (zh) | 实现虚拟语音一键通功能的方法和多模式界面 | |
WO2007005185A2 (en) | Speech application instrumentation and logging | |
CN1719784A (zh) | 多模式对话处理方法 | |
US7886264B1 (en) | Automatic conversion for disparate data types | |
CN1641569A (zh) | Java小应用程序下插件功能的实现方法 | |
JP3870168B2 (ja) | 無線デバイスのアクセスおよび管理のためのダイナミック・マシン合成方法 | |
US7971186B1 (en) | Automatic execution flow ordering | |
WO2007097526A1 (en) | Method for providing hierarchical ring menu for graphic user interface and apparatus thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |