CN1251059C - 用于构造听写宏的方法 - Google Patents

用于构造听写宏的方法 Download PDF

Info

Publication number
CN1251059C
CN1251059C CNB991118537A CN99111853A CN1251059C CN 1251059 C CN1251059 C CN 1251059C CN B991118537 A CNB991118537 A CN B991118537A CN 99111853 A CN99111853 A CN 99111853A CN 1251059 C CN1251059 C CN 1251059C
Authority
CN
China
Prior art keywords
dictation
grand
user
text
voice application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB991118537A
Other languages
English (en)
Other versions
CN1246686A (zh
Inventor
K·A·奥特加
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1246686A publication Critical patent/CN1246686A/zh
Application granted granted Critical
Publication of CN1251059C publication Critical patent/CN1251059C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Digital Computer Display Output (AREA)
  • User Interface Of Digital Computer (AREA)
  • Stored Programmes (AREA)

Abstract

用于创建听写宏的方法,包括以下步骤:存储选出的文本串;显示图形用户接口(GUI)用来命名一个听写宏以响应用户第一命令,该GUI有一个部分用来命名所述的听写宏;为宏名称创建一个基本形式,该宏名称是响应第二用户命令在所述GUI的所述部分中输入的;将所述宏名称与所述存储的选出文本串结合作为所述听写宏。

Description

用于构造听写宏的方法
技术领域
本发明涉及语音应用领域,特别涉及到极大简化的用于构造听写宏的方法。
背景技术
听写系统的一个最重要特征是能够创建听写宏。听写宏使得用户能够创建反复使用的文本块。例如,用户可能需要创建用于其电子邮件地址或通信地址的宏。使用听写宏可以加速重复听写过程。然而,创建听写宏一般不会很容易。
在现在的语音系统中,用户必须利用听写宏功能来创建听写宏。如图4所示的图形用户界面(GUI)屏幕会显示给用户。该列表包括语音应用的识别引擎中每一个听写宏的定义。该界面屏幕还包括五个下拉菜单。用户可以从编辑菜单中选择创建宏,这样就会出现图5中表示的对话框。图5中的对话框必须被用来创建图4中的定义。可以看到,除了一个宏文本输入域、一个宏名称输入域、两个词汇类别,即所有和连续的通常听写之外,还必须能控制八个能激活的按钮图标。其中的几个按钮图标可以进一步激活其它的对话框或功能。
发明内容
新用户可能会觉得这种用法很困难。长期以来都需要一种简单的创建听写宏的方法。
根据本发明的方案,用来创建听写宏的步骤被大大简化了。在当前的优选实施方案中,用户仅仅输入或听写他或她期望在应用中看到的文本。然后用户选择该文本并发出一个声音命令如创建宏,或者选取一个类似命名的菜单项。然后系统将以简化对话框的形式为用户提供一个图形用户接口,其中的对话框仅需输入宏的名称然后激活按钮图标就可以完成整个过程。
文本到语音可以被用来为宏名称产生最初的基本形式。因此,当用户听写宏名称时,显示的文本正是所选择的文本。
根据本发明的方案,一种用来创建听写宏的方法包括以下步骤:存储选出的文本串;显示图形用户接口(GUI)用来命名一个听写宏以响应用户第一命令,所述的GUI有一个部分用来命名所述的听写宏;响应第二用户命令为在所述GUI的所述部分中输入的宏名称创建一个基本形式;并且,将所述宏名称与所述存储的选出文本串结合形成听写宏。
该方法还包括当用户说出宏名称时输出所述存储的选出文本的步骤。
显示步骤可以包括为所述GUI提供一个可激活图标用于激活所述第二用户命令。
该方法还可以包括说出所述第一和第二用户命令的步骤。
该方法还可以包括对所述存储的选出文本串进行第一听写的步骤。
根据另一个发明方案,用于在语音应用中创建听写宏的方法包括以下步骤:创建一个文本串;选择所述文本串;为所述语音应用激活第一用户命令用来创建一个听写宏;为所述听写宏命名;为所述语音应用激活第二用户命令用来为所述宏名称创建一个基本形式并将所述宏名称与所述选出文本串结合以形成所述听写宏。
该方法还可以包括通过说出所述宏名称使所述语音应用输出所述选出文本。
该方法还可以包括说出所述第一和第二用户命令的步骤。
创建步骤可以包括将字听写到语音应用中去。
根据本发明的方案,用来创建听写宏的步骤被简化了。
附图说明
图1是根据该发明方案的图形用户接口;
图2是用于参考在创建听写宏的过程中语音应用采用的方法来解释该发明方案的流程图。
图3是用于参考在创建听写宏的过程中用户采用的方法来解释该发明方案的流程图。
图4是以前技术中用于听写宏功能的显示屏幕。
图5是当从图4中显示屏幕的编辑菜单中激活创建宏命令时以前技术的显示屏幕。
具体实施方式
图1中给出了根据该发明方案的简化的图形用户接口(GUI)10。应该理解的是,对于输入宏文本来说,并不需要任何特殊的GUI或显示屏。只有少数步骤是必须的。第一步骤是在语音应用的听写或校正过程中选取文本。如果不能获得该文本,该文本将在语音应用的听写或校正过程中被听写或选择。第二步骤是激活第一用户命令来命名听写宏。第三步骤是在GUI显示屏上输入名称,如图1中所示。最后的步骤是激活第二用户命令,该命令将选出文本与名称结合起来并创建听写宏。用户命令很容易被声音命令激活。
简化的GUI10包括第一和第二部分12和20。第一部分12包括宏功能项的名称14以及一个帮助按钮图标16以及一个关闭窗口按钮图标18。第二部分20有一个小窗口22用于通过听写或键入方式输入听写宏的名称。部分20还包括小窗口22的名称24以及按钮图标28,30,32。按钮图标被用来创建听写宏,即,将小窗口22中的名称与选出文本结合,并将该组合存储成听写宏。另外可选的是,创建命令可以由声音激活。按钮30取消宏创建例程,按钮32调出帮助屏。小窗口中的名称26“My_Closing”适用于一封信的结尾部分。
语音应用实现的方法由图2中的流程图40表示。根据块42的第一步骤用来显示一个文本串以响应键盘或声音听写。因此,根据块44的步骤,用户选出的一些或全部的文本被存储为可能的听写宏文本。选出文本的使用情况并不确定,直到用户激活一个命令来创建一个听写宏,在这种情况下,例如GUI10的GUI根据块46的步骤被显示。响应GUI中宏名称的用户输入,以及创建听写宏的用户命令,语音应用根据块48的步骤创建名称的基本形式。用户命令可以通过激励一个图标或声音来激活。根据块50的步骤,一旦建立了名称的基本形式,宏名称和宏文本可以互相结合形成期望的听写宏。在任何后续的听写过程中,根据块52的步骤,只要宏名称被说出,宏文本将被显示出来。指向块52的箭头为虚线形式用来表明激活宏不是创建宏的方法的一部分。
从用户角度看的方法由图3的流程图70表示。通过输入或听写,根据块72的步骤,文本串被创建。根据块74的步骤,一些或全部的文本串被选出。根据块76的步骤,创建宏的命令很容易被声音命令激活。根据块78的步骤听写宏的名称被输入由语音应用产生的GUI某部分中,例如图1中的GUI10。根据块80的步骤,通过激活图标或声音命令,名称被接受或证实,对应于此,语音应用将宏名称与宏文本结合并将该组合存储为期望的听写宏。因此,在任何后续的听写过程中,根据块82的步骤,只要宏名称被说出宏文本将被显示出来。指向块82的箭头为虚线形式用来表明激活宏不是创建宏的方法的一部分。
在其最简单的形式中,与以前的技术相比,用户只需要输入或听写文本,如同用户期望文本显示在语音应用中一样,然后用户仅选择文本并命名宏。

Claims (11)

1、一种用于创建听写宏的方法,包括以下步骤:
存储选出的文本串;
响应用户第一命令显示用来命名一个听写宏的图形用户接口GUI,所述的GUI有一个部分用来命名所述的听写宏;
响应第二用户命令为在所述GUI的所述部分中输入的宏名称创建一个基本形式;
将所述宏名称与所述存储的选出文本串结合作为所述听写宏。
2、权利要求1的方法,还包括当所述宏名称被说出时,输出所述存储的选出文本的步骤。
3、权利要求1的方法,其中所述显示步骤包括为所述GUI提供一个可激活图标用来激活所述第二用户命令。
4、权利要求1的方法,包括说出第一和第二用户命令的步骤。
5、权利要求1的方法,包括对所述存储的选出文本串进行第一听写的步骤。
6、权利要求5的方法,包括说出第一和第二用户命令的步骤。
7、一种用来在语音应用中创建听写宏的方法,包括以下步骤:
创建一个文本串;
选择所述文本串;
为所述语音应用激活第一用户命令用来创建一个听写宏;
为所述听写宏命名;
为所述语音应用激活第二用户命令用来为所述宏名称创建一个基本形式并将所述宏名称与所述选出文本串结合以形成所述听写宏。
8、权利要求7的方法,还包括通过说出宏名称来使得所述语音应用输出所述选出文本的步骤。
9、权利要求7的方法,包括说出第一和第二用户命令的步骤。
10、权利要求9的方法,其中所述创建步骤包括将字听写进语音应用。
11、权利要求7的方法,其中所述创建步骤包括将字听写进语音应用。
CNB991118537A 1998-08-31 1999-07-30 用于构造听写宏的方法 Expired - Lifetime CN1251059C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/143767 1998-08-31
US09/143,767 1998-08-31
US09/143,767 US6263375B1 (en) 1998-08-31 1998-08-31 Method for creating dictation macros

Publications (2)

Publication Number Publication Date
CN1246686A CN1246686A (zh) 2000-03-08
CN1251059C true CN1251059C (zh) 2006-04-12

Family

ID=22505521

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991118537A Expired - Lifetime CN1251059C (zh) 1998-08-31 1999-07-30 用于构造听写宏的方法

Country Status (7)

Country Link
US (1) US6263375B1 (zh)
EP (1) EP0984354A3 (zh)
JP (1) JP3609651B2 (zh)
KR (1) KR100358632B1 (zh)
CN (1) CN1251059C (zh)
CA (1) CA2276567C (zh)
TW (1) TW440788B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020128837A1 (en) * 2001-03-12 2002-09-12 Philippe Morin Voice binding for user interface navigation system
US20040054538A1 (en) * 2002-01-03 2004-03-18 Peter Kotsinadelis My voice voice agent for use with voice portals and related products
WO2003060879A1 (de) * 2002-01-17 2003-07-24 Siemens Aktiengesellschaft Spracherkenner und betriebsverfahren für einen solchen
US7515695B1 (en) 2003-12-15 2009-04-07 Avaya Inc. Client customizable interactive voice response system
US7761843B2 (en) * 2005-07-01 2010-07-20 Ronald Ortscheid Computer source code generator
US20080034288A1 (en) * 2006-08-02 2008-02-07 International Business Machines Corporation Text-Driven Macros Integrated with a Help System of a Computer Program
US8676868B2 (en) * 2006-08-04 2014-03-18 Chacha Search, Inc Macro programming for resources
US9583096B2 (en) * 2006-08-15 2017-02-28 Nuance Communications, Inc. Enhancing environment voice macros via a stackable save/restore state of an object within an environment controlled by voice commands for control of vehicle components
US20080114604A1 (en) * 2006-11-15 2008-05-15 Motorola, Inc. Method and system for a user interface using higher order commands
US8620652B2 (en) * 2007-05-17 2013-12-31 Microsoft Corporation Speech recognition macro runtime
KR101523979B1 (ko) * 2008-10-02 2015-05-29 삼성전자주식회사 휴대 단말기 및 그 휴대 단말기에서 기능 수행 방법
US8589160B2 (en) * 2011-08-19 2013-11-19 Dolbey & Company, Inc. Systems and methods for providing an electronic dictation interface
CN103577072A (zh) * 2012-07-26 2014-02-12 中兴通讯股份有限公司 一种终端语音辅助编辑的方法及装置
US20180121215A1 (en) * 2015-04-23 2018-05-03 Fluent Systems, Inc. Dynamic and customizable user interface platform
US10089070B1 (en) * 2015-09-09 2018-10-02 Cisco Technology, Inc. Voice activated network interface
US9922648B2 (en) 2016-03-01 2018-03-20 Google Llc Developer voice actions system
KR102620705B1 (ko) 2018-10-11 2024-01-04 삼성전자주식회사 전자 장치 및 그의 동작 방법
CN109388699A (zh) 2018-10-24 2019-02-26 北京小米移动软件有限公司 输入方法、装置、设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5157384A (en) * 1989-04-28 1992-10-20 International Business Machines Corporation Advanced user interface
US5632002A (en) * 1992-12-28 1997-05-20 Kabushiki Kaisha Toshiba Speech recognition interface system suitable for window systems and speech mail systems
US5761641A (en) * 1995-07-31 1998-06-02 Microsoft Corporation Method and system for creating voice commands for inserting previously entered information
US5999933A (en) * 1995-12-14 1999-12-07 Compaq Computer Corporation Process and apparatus for collecting a data structure of a memory dump into a logical table
US5835571A (en) * 1996-06-27 1998-11-10 Mci Communications Corporation Automated telephone service interface
US5920841A (en) * 1996-07-01 1999-07-06 International Business Machines Corporation Speech supported navigation of a pointer in a graphical user interface
US5873064A (en) * 1996-11-08 1999-02-16 International Business Machines Corporation Multi-action voice macro method
US6101473A (en) * 1997-08-08 2000-08-08 Board Of Trustees, Leland Stanford Jr., University Using speech recognition to access the internet, including access via a telephone
US6078327A (en) * 1997-09-11 2000-06-20 International Business Machines Corporation Navigating applications and objects in a graphical user interface

Also Published As

Publication number Publication date
EP0984354A2 (en) 2000-03-08
KR20000016901A (ko) 2000-03-25
CN1246686A (zh) 2000-03-08
KR100358632B1 (ko) 2002-10-30
JP2000105682A (ja) 2000-04-11
US6263375B1 (en) 2001-07-17
JP3609651B2 (ja) 2005-01-12
EP0984354A3 (en) 2007-09-26
CA2276567C (en) 2006-04-11
CA2276567A1 (en) 2000-02-29
TW440788B (en) 2001-06-16

Similar Documents

Publication Publication Date Title
CN1251059C (zh) 用于构造听写宏的方法
JP3964134B2 (ja) 言語文法を作成するための方法
Klemmer et al. Suede: a wizard of oz prototyping tool for speech user interfaces
US6839669B1 (en) Performing actions identified in recognized speech
US7962344B2 (en) Depicting a speech user interface via graphical elements
Yankelovich How do users know what to say?
US8831956B2 (en) Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands
US6182046B1 (en) Managing voice commands in speech applications
KR101143034B1 (ko) 음성 명령을 명확하게 해주는 중앙집중식 방법 및 시스템
US5826064A (en) User-configurable earcon event engine
JP4651613B2 (ja) マルチメディアおよびテキストエディタを用いた音声起動メッセージ入力方法および装置
EP1091346B1 (en) Background system for audio signal recovery
US7930182B2 (en) Computer-implemented tool for creation of speech application code and associated functional specification
US6513009B1 (en) Scalable low resource dialog manager
US20030071833A1 (en) System and method for generating and presenting multi-modal applications from intent-based markup scripts
JP2009506386A (ja) 対話式ユーザチュートリアルへの、音声エンジン訓練の組込み
CA2471020A1 (en) Multi-mode interactive dialogue apparatus and method
US20050177369A1 (en) Method and system for intuitive text-to-speech synthesis customization
US20040034532A1 (en) Filter architecture for rapid enablement of voice access to data repositories
Németh et al. Spemoticons: text to speech based emotional auditory cues
JP3615309B2 (ja) データ検索装置および方法、情報記憶媒体
Parente Clique: a conversant, task-based audio display for GUI applications
WO2000026901A2 (en) Performing spoken recorded actions
Olsen Jr et al. Speech Interaction with Graphical User Interfaces.
Turunen et al. Speech application design and development

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: WEICHA COMMUNICATION CO.,LTD.

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINE CORP.

Effective date: 20090731

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090731

Address after: Massachusetts, USA

Patentee after: Nuance Communications Inc.

Address before: American New York

Patentee before: International Business Machines Corp.

CX01 Expiry of patent term

Granted publication date: 20060412

CX01 Expiry of patent term