CN1115057A - 复合输入的信息处理装置中误输入的处理方法及装置 - Google Patents

复合输入的信息处理装置中误输入的处理方法及装置 Download PDF

Info

Publication number
CN1115057A
CN1115057A CN95104565A CN95104565A CN1115057A CN 1115057 A CN1115057 A CN 1115057A CN 95104565 A CN95104565 A CN 95104565A CN 95104565 A CN95104565 A CN 95104565A CN 1115057 A CN1115057 A CN 1115057A
Authority
CN
China
Prior art keywords
candidate
input
voice
information
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN95104565A
Other languages
English (en)
Inventor
安藤春
菊池英明
畑冈信夫
松田泰昌
大条成人
长谷川司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN1115057A publication Critical patent/CN1115057A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)
  • Digital Computer Display Output (AREA)
  • Position Input By Displaying (AREA)

Abstract

用户参照显示器上显示的画面用指示或触摸笔等边指示边通过语音识别程序13、麦克风8及A/D变换装置7输入语音。对于所输入的语音的识别结果,进行识别可靠性第1级的备选所示的处理或显示,把可靠性第2级以下的多个备选所示的指令菜单显示在画面上。根据识别可靠性第1级的备选进行的处理或显示是用户的非意图处理时,或者用户误输入时(把这样的处理统称为“错误”),根据第2级以下的识别备选所显示的菜单用手指和笔等从该备选中选择正确的输入备选,再次进行伴随该备选的处理操作或显示而进行纠错。

Description

复合输入的信息处理装置中误输入的 处理方法及装置
本发明涉及搭载在微机、工作站、文字处理机等办公自动化(OA)设备的利用语音的图形编辑系统和具有显示画面的语音应用系统等的用户接口。作为输入形态不局限于语音,也包括把直接获得的输入信号暂时读入系统内部,经过识别处理后确定所指示的输入的输入装置。在本发明中,提供了在作为输入装置具有以包含语音输入在内的复合形态的输入装置的信息处理装置中非意图输入时简便的纠错处理方法。
本发明以复合地利用语音输入信息和其它输入信息的处理中错误输入的处理为对象。关于这种输入形态中的错误输入纠正处理在先有技术中尚未见到有关例子。因而,在命令的输入中,利用语音输入装置时的错误输入的纠正处理例子示出了关于纠错处理的类似技术。
以往,只在具有包括语音输入在内的多种输入装置的装置中,只用语音输入代替键盘输入。
在具有语音输入装置根据语音识别准确度进行处理的系统的例子中,有设在日铁(JR)品川车站的利用语音识别输入和触模式面板输入的售票机。在该售票机中,识别输入的声音,在准确度第1位的候选的识别准确度高时,直接实行处理。另外,当输入的语音的识别结果的准确度第1位的候选的识别准确度低时,则提示准确度第1位的候选和其它候选,由用户通过触模式面板输入从候选中选择正确的识别结果,或者再次输入正确的指示,然后进行实际的售票处理。
上述先有技术存在有这样的问题,即需要用户的确认处理和二次输入,在信息输入方面过于花费时间。此外,在输入的语音的识别可靠性低但却符合用户的意图时,也向用户请求确认输入语音的识别结果,反之则强烈要求繁杂的操作。
另外,在输入语音的错误识别的准确度高并实行完由输入语音开始的处理时,不能纠下该处理,或者必须取消全部处理而再次从头开始重新输入。
本发明的目的在于提供在使用语音输入和其它输入方法(例如,触模式面板指示输入、键盘输入、鼠标输入)复合输入操作指示的装置中,能够简便处理复合形态输入中的输入错误又不对其它输入信息产生影响的图形编辑、图象编辑等的接口。特别是要对输入装置提供非常适用于伴有使用了语音识别的语音输入的图形编辑、图象编辑等的接口。
本发明的目的还在于提供使用了复合形态的信息处理装置的输入方法及装置,该输入方法和装置例如在用语音输入和触模式面板输入复合地进行输入动作时,即使由于输入语音的错误识别动作而对装置进行了和应输入操作指令不同的处理,也能够简便且迅速地进行处理纠正。
为实现上述目的,本发明构成如下。
在信息处理装置中,至少具有:
显示信息的信息显示电路;
用户用指示手势等输入连续的位置信息的位置信息输入电路;
输入语音信息的语音信息输入电路;
存储由上述输入电路输入的位置信息及语音信息的存储电路;
存储语音标准模式或单词信息或语法信息中至少1种信息的标准模式信息存储电路;
用存储在上述标准模式信息存储电路中的语音标准模式或单词信息或语法信息中至少1种信息算出通过上述输入电路输入的语音的准确度的语音信息分析电路。
在这样构成的信息处理装置中,首先进行由语音识别结果的准确度第1位的候选所决定的处理或显示,并将第2位以下的多个语音识别结果的候选用菜单显示在画面上并且还具有,当由准确度第1位的候选的处理或显示错误时或者用户误输入时根据所显示的菜单,利用手或笔等从第2位以下的候选中选译正确的输入候选,再次进行与其相伴的处理操作或显示的纠错处理电路。
还具有当选择语音识别候选时,已存储了输入的指示信息等纠错处理电路,以使在进行纠正时不必再次输入指示信息等语音输入之外的信息。
还具有在显示的菜单中设有正确的候选时通过仅再次进行语音输入所需要的信息就能够进行纠正的纠错处理电路。
还具有再次进行语音输入时把语音识别结果第1候选和菜单上显示的第2位以下的候选与识别对象分开的电路。
还具有在实行由准确度第1位的候选所决定的处理或显示的同时把识别结果的内容显示在画面或把该内容用声音输出的功能。
在由用户用语音输入“移动”、“拷贝”等指令,进而用手和笔等指示对象物和移动位置等进行编辑的图象编辑系统中输入信息时进行根据作为语音识别第1候选的指令的操作、在菜单上显示语音识别第2候选以下的指令,并且,还具有在根据语音识别第1备选的操作是错误和用户误输入时通过存储已输入的指示信息等语音以外的信息,用手和笔等仅选择菜单所显示的语音识别候选第2位以下的多个指令再次进行伴随该指令的的处理操作或者显示这样的纠错处理电路。
在阅读和理解了下面对实施例的详细描述后,将会了解到与先有技术相比,本发明的上述和进一步的优点是十分明显的。
应用一些附图说明本发明,这些附图的目的仅是为描述本发明的权利要求和实施例,本发明并不局限于这些形式。
图1是本发明的系统结构图。
图2是显示器显示画面的一个例子。
图3是图形描绘表的一个例子。
图4是语音识别程序的结构例。
图5是显示器显示画面例。
图6是指示区域表的数据结构例。
图7是单词辞典17的数据结构例。
图8是显示器显示画面例。
图9是表示本发明处理动作概况的流程图。
〈实施例〉
下面,用附图说明本发明的实施例。这里,假定以复合形态进行输入的图形编辑系统进行说明。然而,本发明不局限于该系统,能够应用到CAD系统、图象处理系统、情报检索系统等一般系统中。
图1是表示本发明一实施例的框图。图1中,磁盘上的系统程序11、图形编辑程序12、语音识别程序13、指示区域读入程序14、信息综合程序15、语音标准模式数据16及单语辞典17,在系统起动时装入主存储器2。图2是通过被装载到主存储器2中的图形编辑程序12在显示器4上显示的一个图形编辑画面的例子。画面21上,起动图形编辑程序12,参照存储在主存储器2中的图形描绘表(图3、30),用绘图模式描画出2个圆(22)、2个三角形(23)、3个长方形(24)。
本发明中,用户指示画面上的显示物,指定1个对象物,对被指定的对象物进行用语音输入指示的编辑作业。首先,为了进行系统内的编辑处理,信息处理装置1起动主存储器2上的语音识别程序13,进而起动指示区域读入程序14。使用其详细内容后面介绍的指示区域读入程序14,通过在对应于显示器4而设置的触模式面板5上进行指示操作,能够输入位置信息。显示器4由显示控制装置6控制。
图9中示出本发明动作例的概况。下面,按顺序说明图9的各个步骤。
如图4所示,语音识别程序13由语音输入程序131、特征抽取程序132、标准模式适配程序133及辞典适配程序134构成。若起动语音识别程序13,则首先语音输入程序131起动。用户在触模式面板5上指示对象物、移动位置等的同时,以声音用麦克风8指示编辑操作(步骤901)。该图形编辑系统接受从触模式面板输入的位置信息和用语音输入的编辑命令信息,从这些信息理解用户的意图,按照用语音输入的编辑命令进行图形编辑。本实施例,如图5那样叙述了用户向麦克风发出(“把这个圆拷贝到这里”)的声音,同时在触摸式而板5上依次指示作为对象物的圆的近傍点A和拷贝位置地点B,通过起动语音输入程序131,从麦克风8输入的语音由A/D变换装置7变换为数字信号后送入到主存储器2,实施后续的外理(步骤902)。接着,起动特征抽取程序132,把对应于输入语音指示的数字信号以10ms的帧周期,变换为LPC倒频谱系数的时间系列作为特征矢量。(对于特征矢量的变换子例,有齐藤、中田《音声情报处理の基础》(オ-ム社、昭50))(步骤903)。这时,设置在主存储装置2中的缓冲存储器P置O。在指示区域读入程序14中,用户的手指或笔等触摸触接面板5时的接触座标(X、Y)经面板控制装置3读入,而每读入一组座标就把缓冲存储器P加1。进而,被读入的座标写入主存储装置2的指示区域表中。指示区域表由阵列存储器X、Y、T构成,读入的座标信息中,把X座标写入阵列存储器X[P],把Y座标写入阵列存储器Y[P],另外,把输入座标信息的时刻写入阵列存储器T[P]。该指示区域表如图6所示,由座标编号200、写入X座标的阵列存储器X201、写入Y座标的阵列存储器Y202、写入座标输入时刻的阵列存储器T构成,各个存储器按输入的顺序从座标编号“1”开始存入接触面板的手指的X座标、Y座标及输入时刻数据(步骤904)。指尖或笔等离开触模式面板5或者经过一定时间T0则终止写入动作。即使用其它方法经过一定时间也同样终止写入。
如果终止把由用户通过指示和发声而输入的座标和编辑命令写入指示区域表的动作,则标准模式匹配程序133和辞典匹配程序134起动。辞典匹配程疗134起动时被查询的单词辞典17如图7所示由单词191、单词内容192、概念编号193构成。该概念编号193是分类意义相近单词的识别编号。首先,进行从输入声得到的特征矢量与予先存储在系统内的语音标准纠模式数据,16之间的匹配。匹配的方法可以使用例如北原等《由声音输入的情报检索系统中口语受理方法的讨论》(日本音响学套、3-5-7、平3)中记述的方法。匹配的结果,输入语音被变换为文字串(步骤905)。例如,成为“この/ぇん/そ/こちぅ/ん/どこ/”。这时,每个形态成分(用“/”划开的词)都被算出准确度.标上候选的顺序。而且,通过匹配得到的文字串应用至今一直沿用的方法(例如,相泽等著《计算机的假名汉字变换》(NHK技术研究、25、5、昭48)中记述的最长一致法)进行形态成分分析,进行和单词辞典17的匹配结果,得到这样的形态成分信息(この,指示词,803)、(
Figure A9510456500121
,名词,501),(そ,格助词,804),(こちぅ名词,901)。(ん,格助词,805),(移动して、动词,301)。动词按识别准确度从高到低的顺序赋予指令序号Com[i](i=1~n)(步骤906)。本例中,“移动”为Com[1]=30l。接着,起动信息综合程序l5,例如.如北原等著《复合形态输入方式(特願平04—221234号)》中记载的那样,进行第500级的概念序号的名词和第900级的概念序号的名词的输入顺序与多个指示输入顺序之间的时间对应(步骤907)。本例中,由于物体名词
Figure A9510456500122
先于位置名词“こちぅ”输入,所以,座标编号A指示对象物,座标编号B指示移动位置。接着,进行对象物的概念序号(图7的193)和图形描绘表30中图形序号上3位的匹配。抽出候选图形。本实施例中,把所得到的画面上的候选图形抽出为图形描绘表30中的序号5011、5012。接着,具有距指示从输入声得到的物体名词位置的座标编号A(XA,YA)最近的中心座标的圆被确定为指示对象图形,该图形的轮廓闪烁。本例的情况,图5的51A对应于图3的图形序号5011,5011作为候选图形被识别。被识别的图形序号顺序以obj[1]=5011的形式存储(步骤908)。另外,已经用指示而被存储的关于对象物和拷贝位置的信息一直存储到图形编辑区域中输入下一个指示之前。接着,在作为形态成分信息的动词的识别侯选的准确度按“移动”、“复写”、“交换”的顺序排列顺序时,指令序号被输入为Com[1]=301,Com[2]=302。首先,由于识别候选的准确度最高,故根据Com[1]=301进行“移动”操作(步骤909)。被选择的圆移动到被指定位置的主存储装置2上的座标序号“B”(XB、YB3)。另外,这时如图8所示,在上述操作结果的输出显示的同时还显示所进行过的操作指令。进而,在同一画面上还以菜单显示关于准确度第2位以下的操作指令的输入声识别候选(步骤910)。还有,既可以予先限制显示个数,也可以仅显示指定的准确度以上的候选。本例中,根据从输入声识别了的动作而把操作指令特定为“移动”。然而,如果实际上用户要求“拷贝”而不是“移动”,则不是用户所希望的操作结果而成为起因于输入声音识别结果的纠错处理。因而,用户在触摸式面板5上从显示在显示画面上的操作指令第2位以下的候选菜单中选择符合自己意图的指令“拷贝”,进行良好效率的错误处理纠正(步骤911)。若从第2位以下的菜单中选择了用户意图的操作指令,则查询菜单各项目的座标区域和指示位置,选择Com[2]=302。接着,前面实行过的“移动”操作被擦除,而主存储装置2中在纠错处理时使用的指示信息是能够共同利用的信息故原样保存,在纠错处理纠正后的处理中再次被利用。根据Com[2]=302利用被保存的指示信息进行“拷贝”操作(步骤912)。错误处理纠正的结果,在主存储装置2上的座标编号“B”(XB、YB)上拷贝对象物。另一方面,显示菜单中没有指令的该候选时,如果再次用音声仅输入处理指令名,则应用除去前面显示在画面上的识别准确度第1位的候选和菜单显示的识别准确度第2位以下的候选之外的识别候选通过语音识别外理进行处理指令的输入。
如本发明这样。在复合地应用多个输入进行处理的系统中,错误处理纠正时因为能够仅对应输入想修正的内容,所以能够省去重复数据再次输入的工夫。还有,由于用语音再输入时确实地排除了不同的识别候选,故可以有效地进行识别处理。
发明总体的效果综述如下。
一旦用户用语音和其它输入方法输入信息,则上述装置就进行由语音识别结果的准确度第1位的候选决定的处理或显示,把第2位以下的多个语音识别结果以菜单显示在画面上。在基于准确度第1位的候选的处理或显示是错误时,或者在用户输入错误时,根据显示的菜单,用手指和笔等从第2位以下的候选中选择正确的候选,再次进行伴随该候选的操作处理或显示,通过进行这样实行错误处理的动作,能够简便地进行纠错处理。还有,选择语音识别候选时,具备把已经输入的指示信息等存储起来,故在纠正时没有必要再次输入指示信息等语音输入之外的信息的纠错处理电路,由此,在用户语音输入的同时还输入了语音之外的信息时就没有必要再次输入已经正确地输入了的信息,而能够仅输入出错的信息。另外,在显示的菜单中设有正确的候选时,把语音识别结果第1候选和菜单上表示的第2位以下的候选与识别对象分离,通过仅再次以语音输入所需要的信息进行纠正误识别的纠错处理,可以筛选识别候选,提高识别准确度。还有,在通过用户语音输入“移动”、“复写”等指令,进而用手指和笔等指示对象物和移动位置而进行编辑操作的图象编辑系统中,若输入信息,则按照语音识别第1候选的指令进行操作,菜单显示语音识别第2候选以下的指令,在根据语音识别第1候选进行的操作错误时或用户误输入时,通过存储已经输入的指示信息等语音之外的信息,则用手指和笔等仅选择菜单显示的语音识别候选第2位以下的多条指令,就能够进行再次实行伴随该指令的处理操作或显示这样的错误处理,使减轻纠错处理花费的工夫成为可能。进而,实行由准确度第1位的候选决定的处理或显示的同时,把确认结果的内容显示在画面上或用语音输出该内容,由于具有这样的功能,用户就能够确认识别结果。
以上参照实施例说明了本发明。显然在阅读和理解了本发明后将引起那些熟练技术的修改和替换。这里意指由包括这些修改和替换而构成的发明处在附加的权利受求及其等效的范围之内。

Claims (7)

1.利用语音的信息处理装置,
至少具有:
显示信息的显示电路;
用户用指示手势等输入连续的位置信息的位置信息电路;
输入语音信息的语音信息输入电路;
存储由上述输入电路输入的位置信息及语音信息的存储电路;
存储语音标准模式或单词信息或语法信息中至少1种信息的标准模式信息存储电路;
用存储在上述标准模式信息存储电路中的语音标准模式或单词信息或语法信息中至少1种信息计算出通过上述输入电路输入的语音的可靠性的语音信息分析电路;其特征在于:
在这样的信息处理装置中,首先进行由语音识别结果的准确度第1位的候选所决定的处理或显示,第2位以下的多个语音识别结果的候选以菜单显示在画面上,并且还具有当准确度第1位的候选次定的处理或显示是错误时,根据显示的菜单用手指和笔等从第2位以下的候选中选择正确的输入候选并再次进行伴随该候选的处理操作或显示的纠错处理电路。
2.权利要求1中记述的利用语音的信息处理装置中的纠错处理电路,特征在于:
选择语音识别候选时,由于已存储了输入的指示信息,故在纠正时没有必要再次输入指示信息等利用语音输入之外的信息。
3.权利要求1中记述的利用语音的信息处理装置中的纠错处理电路,特征在于:
在显示的菜单中没有正确的候选时,通过仅再次进行语音输入所需要的信息便能进行纠正。
4.权利要求1中记述的利用语音的信息处理装置,特征在于:
在该信息处理装置中,再次进行语音输入时,把语音识别结果第1候选和菜单表示的第2位以下的候选与识别对象分离。
5.权利要求1中记述的利用语音的信息处理装置,特征在于:
具有实行由准确度第1位的候选所决定的处理或显示的同时把识别结果的内容显示在画面上或者用声音输出该内容的功能。
6.利用语音的信息处理装置,特征在于:
在包含有权利要求1中记述的利用语音的信息处理装置,用户通过用语音输入“移动”、“复写”等指令,并进而用手指和笔等指示对象物和移动位置等而进行编辑操作的图象编辑系统中,若输入信息时,就进行由语音识别第1候选即指令所决定的操作,以菜单显示语音识别第2候选以下的指令,并且,还具有当基于语音识别第1候选的操作是错误时和用户误输入时通过存储已输入的指示信息等语音之外的信息而用手指或笔等仅选择菜单显示的语音识别候选第2位以下的多条指令,再次进行伴随被选指令的处理操作或显示的纠错处理电路。
7.复合输入的信息处理装置中误输入的纠正方法,特征在于:
直接指定所显示的对象,同时,用语音输入表示上述对象的变形和位置的变更的编辑命令;
存储该对象的位置信息;
识别上述输入语音,实行识别准确度第1位的编辑命令;
与该实行结果一起在进行上述语音识别时,显示识别准确度第2位以下的编辑命令菜单;
选择上述识别准确度第2位以下的编辑命令菜单的处理命令;
对上述位置信息实行上述处理命令。
CN95104565A 1994-04-25 1995-04-24 复合输入的信息处理装置中误输入的处理方法及装置 Pending CN1115057A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP08616894A JP3267047B2 (ja) 1994-04-25 1994-04-25 音声による情報処理装置
JP086168/94 1994-04-25

Publications (1)

Publication Number Publication Date
CN1115057A true CN1115057A (zh) 1996-01-17

Family

ID=13879233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95104565A Pending CN1115057A (zh) 1994-04-25 1995-04-24 复合输入的信息处理装置中误输入的处理方法及装置

Country Status (4)

Country Link
US (1) US5864808A (zh)
EP (1) EP0680035B1 (zh)
JP (1) JP3267047B2 (zh)
CN (1) CN1115057A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002052394A1 (en) * 2000-12-27 2002-07-04 Intel Corporation A method and system for concurrent use of two or more closely coupled communication recognition modalities
CN102105929A (zh) * 2008-07-30 2011-06-22 三菱电机株式会社 声音识别装置
CN102646016A (zh) * 2012-02-13 2012-08-22 北京百纳信息技术有限公司 显示手势语音交互统一界面的用户终端及其显示方法
CN1653486B (zh) * 2002-02-27 2013-01-02 日本电气株式会社 模式的特征选择方法、分类方法、判定方法
CN104345880A (zh) * 2013-08-08 2015-02-11 联想(北京)有限公司 一种信息处理的方法及电子设备
WO2016054885A1 (zh) * 2014-10-09 2016-04-14 中兴通讯股份有限公司 操作对象的处理方法及装置
CN106569771A (zh) * 2015-10-09 2017-04-19 百度在线网络技术(北京)有限公司 对象控制方法及装置
CN109739425A (zh) * 2018-04-19 2019-05-10 北京字节跳动网络技术有限公司 一种虚拟键盘、语音输入方法、装置及电子设备
CN110603586A (zh) * 2017-05-09 2019-12-20 苹果公司 用于校正识别错误的用户界面
CN111415412A (zh) * 2020-03-18 2020-07-14 北京山维科技股份有限公司 一种立体测图采编系统和方法
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6160536A (en) * 1995-03-27 2000-12-12 Forest; Donald K. Dwell time indication method and apparatus
US6903723B1 (en) * 1995-03-27 2005-06-07 Donald K. Forest Data entry method and apparatus
US5999895A (en) * 1995-07-24 1999-12-07 Forest; Donald K. Sound operated menu method and apparatus
US6005549A (en) * 1995-07-24 1999-12-21 Forest; Donald K. User interface method and apparatus
DE19804047C2 (de) * 1998-02-03 2000-03-16 Deutsche Telekom Mobil Verfahren und Einrichtung zur Erhöhung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen
AT414325B (de) * 1998-02-18 2007-07-15 Teamaxess Ticketing Gmbh Anordnung zum verkauf von berechtigungen
US6681031B2 (en) 1998-08-10 2004-01-20 Cybernet Systems Corporation Gesture-controlled interfaces for self-service machines and other applications
US20010008561A1 (en) * 1999-08-10 2001-07-19 Paul George V. Real-time object tracking system
US6950534B2 (en) * 1998-08-10 2005-09-27 Cybernet Systems Corporation Gesture-controlled interfaces for self-service machines and other applications
US7036094B1 (en) 1998-08-10 2006-04-25 Cybernet Systems Corporation Behavior recognition system
JP3001000B1 (ja) 1998-09-08 2000-01-17 セイコーエプソン株式会社 音声認識装置における連続単語認識方法および音声認識装置における連続単語認識処理プログラムを記録した記録媒体
JP2000163196A (ja) * 1998-09-25 2000-06-16 Sanyo Electric Co Ltd ジェスチャ認識装置及びジェスチャ認識機能を有する指示認識装置
US6233560B1 (en) * 1998-12-16 2001-05-15 International Business Machines Corporation Method and apparatus for presenting proximal feedback in voice command systems
US6321198B1 (en) * 1999-02-23 2001-11-20 Unisys Corporation Apparatus for design and simulation of dialogue
US8065155B1 (en) 1999-06-10 2011-11-22 Gazdzinski Robert F Adaptive advertising apparatus and methods
JP2002073080A (ja) * 2000-09-01 2002-03-12 Fujitsu Ten Ltd 音声対話システム
GB0029573D0 (en) * 2000-12-02 2001-01-17 Hewlett Packard Co Activation of voice-controlled apparatus
GB0031596D0 (en) * 2000-12-22 2001-02-07 Barbara Justin S A system and method for improving accuracy of signal interpretation
US6600475B2 (en) 2001-01-22 2003-07-29 Koninklijke Philips Electronics N.V. Single camera system for gesture-based input and target indication
JP2003173237A (ja) * 2001-09-28 2003-06-20 Ricoh Co Ltd 情報入出力システム、プログラム及び記憶媒体
US6791529B2 (en) 2001-12-13 2004-09-14 Koninklijke Philips Electronics N.V. UI with graphics-assisted voice control system
US20030112277A1 (en) * 2001-12-14 2003-06-19 Koninklijke Philips Electronics N.V. Input of data using a combination of data input systems
US6990639B2 (en) 2002-02-07 2006-01-24 Microsoft Corporation System and process for controlling electronic components in a ubiquitous computing environment using multimodal integration
EP1614102A4 (en) 2002-12-10 2006-12-20 Kirusa Inc VOICE ENTRY DESAMBIGUATION TECHNIQUES BASED ON THE USE OF MULTIMODAL INTERFACES
US7665041B2 (en) 2003-03-25 2010-02-16 Microsoft Corporation Architecture for controlling a computer using hand gestures
US8745541B2 (en) 2003-03-25 2014-06-03 Microsoft Corporation Architecture for controlling a computer using hand gestures
GB2402507A (en) * 2003-06-03 2004-12-08 Canon Kk A user input interpreter and a method of interpreting user input
JP4006395B2 (ja) 2003-12-11 2007-11-14 キヤノン株式会社 情報処理装置及びその制御方法、プログラム
US7427024B1 (en) 2003-12-17 2008-09-23 Gazdzinski Mark J Chattel management apparatus and methods
US20060004574A1 (en) * 2004-06-30 2006-01-05 Microsoft Corporation Semantic based validation information in a language model to detect recognition errors and improve dialog performance
WO2006083020A1 (ja) * 2005-02-04 2006-08-10 Hitachi, Ltd. 抽出された音声データを用いて応答音声を生成する音声認識システム
US10437459B2 (en) 2007-01-07 2019-10-08 Apple Inc. Multitouch data fusion
DE102007024110A1 (de) * 2007-05-22 2008-12-11 Deutsche Telekom Ag Verfahren zur Beeinflussung der Interpretation multimodaler Eingaben
DE102008051757A1 (de) 2007-11-12 2009-05-14 Volkswagen Ag Multimodale Benutzerschnittstelle eines Fahrerassistenzsystems zur Eingabe und Präsentation von Informationen
US20090210233A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Cognitive offloading: interface for storing and composing searches on and navigating unconstrained input patterns
JP5598232B2 (ja) * 2010-10-04 2014-10-01 ソニー株式会社 情報処理装置、情報処理システムおよび情報処理方法
US20120306741A1 (en) 2011-06-06 2012-12-06 Gupta Kalyan M System and Method for Enhancing Locative Response Abilities of Autonomous and Semi-Autonomous Agents
US8811938B2 (en) 2011-12-16 2014-08-19 Microsoft Corporation Providing a user interface experience based on inferred vehicle state
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9318128B1 (en) * 2013-01-08 2016-04-19 Google Inc. Methods and systems for determining instructions for applications that are recognizable by a voice interface
KR102053820B1 (ko) 2013-07-02 2019-12-09 삼성전자주식회사 서버 및 그 제어방법과, 영상처리장치 및 그 제어방법
JP2015055773A (ja) * 2013-09-12 2015-03-23 株式会社アドバンスト・メディア 情報処理装置、情報処理方法及びプログラム
US9858039B2 (en) * 2014-01-28 2018-01-02 Oracle International Corporation Voice recognition of commands extracted from user interface screen devices
CN104978964B (zh) * 2014-04-14 2019-06-04 美的集团股份有限公司 语音控制指令纠错方法和系统
WO2015199731A1 (en) * 2014-06-27 2015-12-30 Nuance Communications, Inc. System and method for allowing user intervention in a speech recognition process
KR101623856B1 (ko) 2014-10-17 2016-05-24 현대자동차주식회사 에이브이엔 장치, 차량, 및 에이브이엔 장치의 제어방법
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
CN108597511A (zh) * 2018-04-28 2018-09-28 深圳市敢为特种设备物联网技术有限公司 基于物联网的信息展示方法、控制终端及可读存储介质
JP6966979B2 (ja) 2018-06-26 2021-11-17 株式会社日立製作所 対話システムの制御方法、対話システム及びプログラム
JP7099126B2 (ja) * 2018-07-25 2022-07-12 セイコーエプソン株式会社 表示制御装置および表示制御プログラム
US11257491B2 (en) * 2018-11-29 2022-02-22 Adobe Inc. Voice interaction for image editing
JP7268449B2 (ja) * 2019-03-29 2023-05-08 京セラドキュメントソリューションズ株式会社 表示制御装置、表示制御方法、及び表示制御プログラム
JP7363075B2 (ja) * 2019-04-01 2023-10-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP6807621B1 (ja) * 2020-08-05 2021-01-06 株式会社インタラクティブソリューションズ 音声に基づいて画像を変更するためのシステム
JP7168239B2 (ja) * 2020-08-05 2022-11-09 株式会社インタラクティブソリューションズ 音声に基づいて画像を変更するためのシステム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4726065A (en) * 1984-01-26 1988-02-16 Horst Froessl Image manipulation by speech signals
US4811243A (en) * 1984-04-06 1989-03-07 Racine Marsh V Computer aided coordinate digitizing system
US4783803A (en) * 1985-11-12 1988-11-08 Dragon Systems, Inc. Speech recognition apparatus and method
US5022081A (en) * 1987-10-01 1991-06-04 Sharp Kabushiki Kaisha Information recognition system
US5027406A (en) * 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
JP3088739B2 (ja) * 1989-10-06 2000-09-18 株式会社リコー 音声認識システム
US5329609A (en) * 1990-07-31 1994-07-12 Fujitsu Limited Recognition apparatus with function of displaying plural recognition candidates
US5133011A (en) * 1990-12-26 1992-07-21 International Business Machines Corporation Method and apparatus for linear vocal control of cursor position
US5386494A (en) * 1991-12-06 1995-01-31 Apple Computer, Inc. Method and apparatus for controlling a speech recognition function using a cursor control device
KR950003390B1 (ko) * 1992-05-30 1995-04-12 정호선 음식 인식 시스템 및 이를 이용한 음성분석 데이타 추출방법
GB2267494B (en) * 1992-06-02 1995-09-20 Ciba Geigy Ag Trisamidodithionodiphosphates
JPH0668140A (ja) * 1992-08-20 1994-03-11 Hitachi Ltd 電子翻訳方式

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7533014B2 (en) 2000-12-27 2009-05-12 Intel Corporation Method and system for concurrent use of two or more closely coupled communication recognition modalities
WO2002052394A1 (en) * 2000-12-27 2002-07-04 Intel Corporation A method and system for concurrent use of two or more closely coupled communication recognition modalities
CN1653486B (zh) * 2002-02-27 2013-01-02 日本电气株式会社 模式的特征选择方法、分类方法、判定方法
CN102105929A (zh) * 2008-07-30 2011-06-22 三菱电机株式会社 声音识别装置
CN102105929B (zh) * 2008-07-30 2015-08-19 三菱电机株式会社 声音识别装置
CN102646016A (zh) * 2012-02-13 2012-08-22 北京百纳信息技术有限公司 显示手势语音交互统一界面的用户终端及其显示方法
CN102646016B (zh) * 2012-02-13 2016-03-02 百纳(武汉)信息技术有限公司 显示手势语音交互统一界面的用户终端及其显示方法
CN104345880B (zh) * 2013-08-08 2017-12-26 联想(北京)有限公司 一种信息处理的方法及电子设备
CN104345880A (zh) * 2013-08-08 2015-02-11 联想(北京)有限公司 一种信息处理的方法及电子设备
WO2016054885A1 (zh) * 2014-10-09 2016-04-14 中兴通讯股份有限公司 操作对象的处理方法及装置
CN105573534A (zh) * 2014-10-09 2016-05-11 中兴通讯股份有限公司 操作对象的处理方法及装置
CN106569771A (zh) * 2015-10-09 2017-04-19 百度在线网络技术(北京)有限公司 对象控制方法及装置
CN110603586A (zh) * 2017-05-09 2019-12-20 苹果公司 用于校正识别错误的用户界面
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
CN110603586B (zh) * 2017-05-09 2020-09-22 苹果公司 用于校正识别错误的用户界面
CN109739425A (zh) * 2018-04-19 2019-05-10 北京字节跳动网络技术有限公司 一种虚拟键盘、语音输入方法、装置及电子设备
CN109739425B (zh) * 2018-04-19 2020-02-18 北京字节跳动网络技术有限公司 一种虚拟键盘、语音输入方法、装置及电子设备
CN111415412A (zh) * 2020-03-18 2020-07-14 北京山维科技股份有限公司 一种立体测图采编系统和方法
CN111415412B (zh) * 2020-03-18 2023-08-04 北京山维科技股份有限公司 一种立体测图采编系统和方法

Also Published As

Publication number Publication date
JP3267047B2 (ja) 2002-03-18
JPH07295784A (ja) 1995-11-10
EP0680035B1 (en) 1999-09-15
EP0680035A1 (en) 1995-11-02
US5864808A (en) 1999-01-26

Similar Documents

Publication Publication Date Title
CN1115057A (zh) 复合输入的信息处理装置中误输入的处理方法及装置
EP0752129B1 (en) A method and apparatus for providing a human-machine dialog supportable by operator intervention
EP0374241B1 (en) Document annotation and manipulation in a data processing system
US5070534A (en) Simplified cad parametric macroinstruction capability including variational geometrics feature
CN1647023B (zh) 语音控制的数据输入
US6157935A (en) Remote data access and management system
US9569231B2 (en) Device, system, and method for providing interactive guidance with execution of operations
US5577164A (en) Incorrect voice command recognition prevention and recovery processing method and apparatus
EP0150296A2 (en) Electronic handwriting method and facilty
US20100205529A1 (en) Device, system, and method for creating interactive guidance with execution of operations
GB2129591A (en) Editing voice data
JPS58195957A (ja) 音声によるプログラム実行方式
JPH06131437A (ja) 複合形態による操作指示方法
US6587122B1 (en) Instruction syntax help information
US20050197841A1 (en) Voice recognition technology to capture geoscience data
US5644339A (en) Electronic information apparatus
Minker et al. Stochastically-based semantic analysis
US5790688A (en) Recognition apparatus with parallel scanning and interpreting of musical score
Bernsen et al. A dedicated task-oriented dialogue theory in support of spoken language dialogue systems design.
US5983181A (en) Method and apparatus for reading-out/collating a table document, and computer-readable recording medium with program making computer execute method stored therein
JP3243057B2 (ja) 列車ダイヤ作成装置
RU2210802C2 (ru) Система ввода и вывода данных для эвм
Aus et al. The future on-line continuous-system simulation
JPH0689158A (ja) 複合形態情報入力方法
JP4115335B2 (ja) データ入力装置、データ入力方法、データ入力プログラム、および記録媒体

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication