CN105246743B - 语音识别装置、识别结果显示装置及显示方法 - Google Patents
语音识别装置、识别结果显示装置及显示方法 Download PDFInfo
- Publication number
- CN105246743B CN105246743B CN201380076789.2A CN201380076789A CN105246743B CN 105246743 B CN105246743 B CN 105246743B CN 201380076789 A CN201380076789 A CN 201380076789A CN 105246743 B CN105246743 B CN 105246743B
- Authority
- CN
- China
- Prior art keywords
- operation button
- display
- renewal
- speech recognition
- button
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012856 packing Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims description 41
- 230000033228 biological regulation Effects 0.000 claims description 11
- 238000005096 rolling process Methods 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 5
- 238000003825 pressing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 38
- 238000012545 processing Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 7
- 101000911772 Homo sapiens Hsc70-interacting protein Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 101000710013 Homo sapiens Reversion-inducing cysteine-rich protein with Kazal motifs Proteins 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 101000661816 Homo sapiens Suppression of tumorigenicity 18 protein Proteins 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005674 electromagnetic induction Effects 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
Abstract
根据本发明的语音识别装置,在始终识别所说出的语音的情况下,若判断为用户要选择显示于画面的语音识别结果,则不进行显示部上的识别结果的显示更新,从而不会发生在用户要选择识别结果的瞬间,该识别结果消失或者变为其他识别结果的情况,因而能防止出现用户所不希望的动作,能提高用户的便利性。
Description
技术领域
本发明涉及对用户发出的语音进行识别并显示识别结果的语音识别装置、显示进行语音识别后的识别结果的识别结果显示装置及使该识别结果显示于显示装置的显示方法。
背景技术
作为语音识别方法,已知有对用户发出的语音进行识别并显示该识别结果的方法。
例如在专利文献1中揭示了以下内容:在对用户发出的语音进行识别,并显示该识别结果的语音识别装置中,若用户发话,则将作为其语音的识别结果的快捷按键显示于显示画面的左下方附近,若用户按下该快捷按键,则执行快捷功能。
现有技术文献
专利文献
专利文献1
日本专利特开2008-14818号公报
发明内容
发明所要解决的技术问题
但是,例如在专利文献1所示的现有的语音识别装置中存在以下问题:即,在显示快捷按键时,若用户重新发话,则在显示该新的识别结果的情况下,会消去之前所显示的快捷按键,之后再显示新按键,因而会出现在用户要选择所希望的识别结果的瞬间该按键发生移动或该按键消失而改变为其他的识别结果的按键的情况,从而导致发生用户所不希望发生的动作。
本发明是为了解决上述问题而完成的,其目的在于提供一种在用户要选择显示于画面的识别结果的情况下,不更新识别结果而能选择所希望的识别结果的语音识别装置、识别结果显示装置及使该识别结果显示于显示装置的显示方法。
解决技术问题所采用的技术方案
为了达成上述目的,本发明提供一种语音识别装置,该语音识别装置对用户发出的语音进行识别并显示识别结果,其特征在于,包括:语音获取部,该语音获取部检测并获取所述用户发出的语音;语音识别部,该语音识别部在所述语音识别装置起动的期间始终参照语音识别词典来识别所述语音获取部所获取的语音数据,并输出识别结果;操作按键生成部,该操作按键生成部生成操作按键,该操作按键具有对应于所述语音识别部所输出的识别结果的功能;显示部,该显示部显示所述操作按键生成部所生成的操作按键;显示控制部,该显示控制部控制所述显示部的所述操作按键的显示内容;以及操作按键显示更新停止/重新开始部,该操作按键显示更新停止/重新开始部基于所述用户是否要操作显示于所述显示部的操作按键,来对所述显示控制部输出指示所述操作按键的显示内容的更新停止及重新开始的指示信号,所述操作按键显示更新停止/重新开始部在判断为所述用户要操作显示于所述显示部的操作按键的情况下,输出指示所述操作按键的显示内容的更新停止的指示信号,所述显示控制部从所述操作按键显示更新停止/重新开始部接收到了所述操作按键的显示内容的更新停止的指示信号的情况下,对所述显示部进行指示,以使显示于所述显示部的操作按键的显示更新停止。
发明效果
根据本发明,在判断为用户要选择显示于画面的识别结果的情况下,不进行显示部上的识别结果的显示更新,从而不会发生在用户要选择识别结果的瞬间该识别结果消失或者变为其他识别结果的情况,因而能防止出现用户所不希望的动作,能提高用户的便利性。
附图说明
图1是表示实施方式1的语音识别装置的一个示例的框图。
图2是表示显示部的操作按键显示区域中显示有操作按键的画面例的图。
图3是表示操作按键显示区域中仅能显示一个操作按键的情况下的操作按键的显示更新方法的图。
图4是表示操作按键显示区域中能显示二个操作按键的情况下的操作按键的显示更新方法的图。
图5是表示操作按键显示区域中仅能显示一个操作按键的情况下的操作按键的生成及显示处理的流程图。
图6是表示操作按键显示区域中能显示多个操作按键的情况下的操作按键的生成及显示处理的流程图。
图7是表示即使在未生成操作按键的情况下也消去已显示的操作按键的处理的流程图。
图8是表示操作按键显示更新停止/重新开始部进行操作按键的显示更新停止/重新开始的指示输出的处理的流程图。
图9是表示实施方式2的语音识别装置的一个示例的框图。
图10是表示操作按键显示更新停止/重新开始部根据语音识别进行操作按键的显示更新停止/重新开始的指示输出的处理的流程图。
图11是表示通过滚动来显示从操作按键显示区域被消去的操作按键的情况下的画面例的图。
图12是表示在显示更新停止中对作为显示履历而存储的操作按键进行一览显示的画面例的图。
图13是表示实施方式3的导航系统的概要的图。
具体实施方式
下面,参照附图,对本发明的实施方式进行详细说明。
本发明涉及识别用户发出的语音的语音识别装置,在该语音识别装置起动的情况下始终对语音进行识别。在下面的实施方式中,以将本发明的语音识别装置应用于搭载在车辆等移动体的导航装置的情况为例进行说明,但也可以用于车辆以外的其他移动体用的导航装置,可以适用于导航系统的伺服器。另外,也能应用于安装于智能手机、平板电脑、移动电话等移动信息终端等的导航系统的应用等。
实施方式1.
图1是表示本发明的实施方式1的语音识别装置的一个示例的框图。该语音识别装置包括:控制部1,麦克风2、语音获取部3、语音识别词典4、语音识别部5、操作按键生成部6、显示控制部7、显示部8、操作按键显示更新停止/重新开始部9、指示输入部10、摄像机11、视线检测部12、及姿势检测部13。
麦克风2获取用户发出的语音(集声)。麦克风2例如是全方向性(或无方向性)的麦克风、将多个全方向性(或无方向性)的麦克风排列成阵列状以调整方向特性的阵列麦克风、仅在一个方向上具有方向性且无法调整方向特性的单一方向性麦克风等。
语音获取部3获取由麦克风2获取的用户发话、即输入的语音,且例如利用PCM(Pulse Code Modulation:脉冲编码调制)进行A/D(Analog/Digital:模拟/数字)转换。
语音识别部5从经过语音获取部3进行了数字化后的语音信号中检测出符合用户所说内容的语音区间,提取出该语音区间的语音数据的特征量,基于该特征量使用语音识别词典4进行识别处理,从而输出识别结果。识别处理使用例如HMM(Hidden Markov Model:隐马尔可夫模型)法之类的一般方法即可。
然而,在搭载于车载导航系统等的语音识别功能中,通常用户会对系统明确表示(指示)发话的开始。因此,可以将指示语音识别开始的按钮(以下称为“语音识别开始指示部”)显示于触摸面板或设置于方向盘。于是,在语音识别开始指示部被用户按下之后,对所发出的语音进行识别。即,语音识别开始指示部输出语音识别开始信号,若语音识别部接收该信号,则在接收该信号后从由语音获取部获取的语音数据中检测出符合用户所说内容的语音区间,由此来进行上述识别处理。
然而,本实施方式1的语音识别部5即使没有上述那样的由用户发出的语音识别开始指示,也始终对用户发话的内容进行识别。即,语音识别部5即使没有接收到语音识别开始信号,在组装有该语音识别装置的导航装置被启动的情况下,也始终反复进行以下处理,即:从语音获取部3所获取的语音数据中检测出符合用户所说内容的语音区间,提取出该语音区间的语音数据的特征量,并基于该特征量使用语音识别词典4来进行识别处理,从而输出语音识别结果。在下述的实施方式中也一样。
指示输入部10接收用户手动输入的指示,即接收用户进行的各种操作的指示。该指示可以列举出利用设置于导航装置的硬件开关、显示部8上所设定并显示的触摸开关(包含后述的操作按键)、或者识别设置于方向盘等的遥控器或单独的遥控器的指示的识别装置所作出的指示。
操作按键生成部6生成操作按键,该操作按键具有对应于语音识别部5所输出的识别结果的功能。
显示控制部7进行以下指示输出:即,将操作按键生成部6所生成的操作按键显示于显示部8,改变操作按键的显示位置,删除显示了规定时间的操作按键等,由此控制操作按键的显示更新,并且判断显示部8中的操作按键的显示更新是否为停止中。另外,管理显示于显示部8的操作按键的相关信息,例如操作按键名称、操作按键在显示部8上的显示位置等。
显示部8是一体显示型触摸面板,例如由LCD(Liquid Crystal Display:液晶显示器)和接触式传感器构成,根据来自显示控制部7的指示在画面上进行描绘。此外,触摸面板可以是使用感压方式、电磁感应方式、静电电容方式、或对上述方式进行组合的方式等中任意一种。另外,也可以使用有机EL显示器来代替LCD。
控制部1对整个语音识别装置的动作进行控制。另外,基于从指示输入部10输入的用户指示、由语音识别部5输出的识别结果,来执行各种功能。例如,若用户手动或通过语音选择显示于显示部8的操作按键(识别结果),则执行分配给所选择的操作按键的功能。
在以下说明中,语音识别部5始终从用户语音中识别例如“加油站”、“便利店”这样的设施所属的种类名(以下称为设施种类名)并输出识别结果,操作按键生成部6生成具有检索属于该识别结果的种类的设施的功能(以下称为“种类检索功能”)的操作按键。
如图2的操作按键61,62那样,该操作按键由显示控制部7显示于显示部8的规定区域(以下称为“操作按键显示区域”)。
图2是表示在显示有地图等的显示画面(显示部8)的操作按键显示区域60中显示有操作按键61、62的画面例的图。若用户选择该操作按键61或62,则控制部1执行与所选择的操作按键相对应的种类检索。设定为在语音识别部5中根据现有技术即关键词识别来识别设施种类名。
可以不利用关键词识别来识别设施种类名,而使用如下方法:利用大词汇连续语音识别来进行所有识别,对识别结果进行形态分析,以提取出设施种类名。
语音识别部5也可以识别例如艺术家名、专辑名、乐曲标题名、用于操作车载导航系统的命令等。在该情况下,分配给操作按键的功能例如可以是按照艺术家名、专辑名、乐曲标题名等检索乐曲的功能,也可以是对应于命令的功能。
此处,举出具体例来说明显示控制部7对于显示部8上的操作按键的显示更新方法的一个例子。
图3是表示操作按键显示区域60较小,仅能在该显示区域中显示一个操作按键的情况下的操作按键的显示更新方法的图。
图3(a)表示操作按键显示部60中未显示有操作按键的状态,在该状态下,若识别出例如“想去便利店”这一语音,并生成对应于“便利店”的操作按键,则显示控制部7对显示部8进行指示输出以显示操作按键61(图3(b))。
之后,若识别出“能否经过银行”这样的语音,生成对应于“银行”的操作按键,则显示控制部7对显示部8进行指示输出,以在消去之前已显示的“便利店”操作按键61之后,显示“银行”操作按键62(图3(c))。此外,即使不生成新的操作按键,显示控制部7也对显示部8进行指示输出,以在不对所显示的操作按键进行任何操作的情况下,消去从显示开始起经过了规定时间后的操作按键。
另外,作为其他的显示更新方法,说明能在操作按键显示区域60显示多个操作按键(使用图4的以下说明中,设为两个操作按键)的情况。
图4是表示操作按键显示区域60中能显示二个操作按键的情况下的操作按键的显示更新方法的图。
若在未显示有操作按键的状态下(图4(a)),与之前的例子同样地识别出“想去便利店”这一语音,并生成对应于“便利店”的操作按键,则显示控制部7对显示部8进行指示输出,以显示操作按键61(图4(b))。
之后,若识别出“能否经过银行”这样的语音,生成对应于“银行”的操作按键,则显示控制部7对显示部8进行指示输出,以追加显示操作按键62(图4(c))。此处,若进一步识别出“附近是否有停车场”这样的语音,生成与“停车场”对应的操作按键,此时,对显示部8进行指示输出,以删除显示时间最长的操作按键,此处为删除“便利店”操作按键61,将“银行”操作按键62移动到显示了“便利店”操作按键61的位置,并追加显示“停车场”操作按键63(图4(d))。
此外,即使不生成新的操作按键,显示控制部7也对显示部8进行指示输出,以在不对所显示的操作按键进行任何操作的情况下,消去从显示开始起经过了规定时间后的操作按键。图4(e)示出了以下状态:即,从显示“银行”操作按键62起,不对该“银行”操作按键62进行任何操作而经过了规定时间的情况下,删除“银行”操作按键62,将“停车场”操作按键63移动到显示了“银行”操作按键62的位置。
上述显示更新方法仅是一个例子,也可以使用其他显示更新方法。
例如,在图4中,在操作按键显示区域60中显示有操作按键时,设定为将第一个操作按键显示于操作按键显示区域60中靠近下侧的位置,但是也可以从上侧起进行显示。
另外,图4中在超过所能显示的操作按键数之前,即,在显示了第一个操作按键之后显示第二个操作按键时,如图4(c)所示,不改变第一个操作按键61的位置使其仍位于下侧,将第二个操作按键62追加显示于上侧,但是也可以使新显示的操作按键始终显示于下侧。在该情况下,在从图4(b)向图4(c)转移时,第一个“便利店”操作按键61移动到上侧,将第二个“银行”操作按键62重新显示于下侧。
此处,说明判断是否始终保持不对所显示的操作按键进行操作的状态的方法,即,说明判断用户是否要按下操作按键的方法。该判断由操作按键显示更新停止/重新开始部9来执行。
存在多种判断用户是否要按下操作按键的方法,此处设为使用以下方法中的任一种:即,使用视线检测部12来检测用户的视线以进行判断的方法;使用姿势检测部13来检测用户的规定姿势以进行判断的方法;以及由用户使用了指示输入部10来进行规定的操作以进行判断的方法。
视线检测部12解析从摄像机11获取的图像,来检测用户朝向显示部8的视线。此处,也可以使得视线检测部12检测出朝向显示部8的特定区域例如图2至图4所示的画面例的操作按键显示区域60的视线。作为检测视线的方法,可以使用公知技术,因而此处省略说明。
姿势检测部13解析从摄像机11获取的图像,检测用户要按下显示于显示部8的操作按键时的规定姿势。此处,要按下操作按键时的规定姿势中包括例如用户的手腕朝向显示部8的方向,用户的上半身朝向显示部8的方向,用户的身体向前倾斜等姿势。作为检测姿势的方法,可以使用公知技术,因而此处省略说明。
然后,在满足规定条件的情况下,即,操作按键显示更新停止/重新开始部9基于上述视线检测部12、姿势检测部13、指示输入部10的检测结果,对用户是否要按下操作按键进行判断,并在判断为用于要按下操作按键的情况下,该操作按键显示更新停止/重新开始部9对显示控制部7进行指示输出,以停止操作按键的显示更新。
此处,在满足规定条件的情况,即,判断为用户要按下操作按键的情况具体是指以下情况中的任一个:即,视线检测部12检测到用户朝向显示部8的视线的情况;姿势检测部13检测到用户要按下操作按键的规定姿势的情况;及指示输入部10接收到用户要按下操作按键的规定操作的情况,在该情况下,操作按键显示更新停止/重新开始部9对显示控制部7输出指示信号以指示停止操作按键的显示内容的更新。
所谓指示输入部10完成了规定操作的情况是指:例如遥控器的规定按键或转向开关等(显示停止的按键或开关等)被按下的情况;或者在接触式传感器是能检测用户的手指或其他物体的接近的方式,例如静电电容式等近距离传感器的情况下,是检测用户的手指等物体接近接触式传感器并进入了规定值以下的距离的情况。
此外,采用接触式传感器的情况下(具有近距离传感器),操作按键显示更新停止/重新开始部9从接触式传感器获取物体的接近信息,计算用户手指等物体与接触式传感器(近距离传感器)之间的距离,在所计算出的距离为规定值以下的情况下(或小于规定值的情况),可以进行指示输出,以停止显示更新。
此处,从接触式传感器获取所接近的物体在触摸面板上的位置信息,在该位置位于例如图2的操作按键显示区域60内且物体与触摸面板之间的距离为规定值以下的情况下(或小于规定值的情况下),可以进行指示输出,以停止显示更新。
此处为了检测物体的接近,使用来自接触式传感器的信息,但是例如采用具有红外线传感器的结构的情况下,也可以使用该传感器来计算从显示部8到物体为止的距离。
而且,操作按键显示更新停止/重新开始部9在不满足规定条件的情况下(即,判断为用户不想按下操作按钮的情况下),对显示控制部7进行指示输出,以重新开始操作按键的显示更新。
所谓不满足该情况下的规定条件具体是指以下情况中的任一个:即,视线检测部12未检测到用户朝向显示部8的视线的情况;姿势检测部13未检测到用户要按下操作按键的规定姿势的情况;及指示输入部10未接收到规定操作的情况,例如遥控器的规定按钮或转向开关等(显示重新开始的按键或开关等)未被按下的情况,用户的手指等物体与触摸面板之间的距离大于规定值的情况(或为规定值以上的情况)。
即,操作按键显示更新停止/重新开始部9在不满足上述规定条件的情况(即,判断为用户未按下操作按钮的情况)下,对显示控制部7进行指示输出,以重新开始操作按键的显示更新。
此外,在对显示控制部7进行指示输出以停止操作按键的显示更新,之后,若未对所显示的操作按键进行操作(保持未检测到操作的状态)而经过了规定时间,则也可以进行指示输出以重新开始显示更新。
此外,也可以使该规定时间根据搭载有该语音识别装置的移动体的行驶状态例如行驶速度、所行驶的道路等而发生变化。
例如,在移动体的行驶速度较快的情况下或所行驶的道路状况恶化的情况下,用户需要将注意力集中于驾驶,因而可认为其可能无法对操作按键进行操作,并将规定时间设定得较长,相反地,在移动体的行驶速度较慢的情况下或所行驶的道路状况良好的情况,可认为处于用户较易对操作按键进行操作的状况,并将规定时间设定得较短。
接着,使用图5至图8的流程图来说明实施方式1的语音识别装置的处理。
图5是例如图3所示那样表示操作按键显示区域中仅能显示一个操作按键的情况下的操作按键的生成及显示处理的流程图。
首先,语音获取部3获取由麦克风2收集的用户语音、即输入的语音,并利用PCM进行A/D转换(步骤ST01)。
接着,语音识别部5从经过语音获取部3进行了数字化后的语音信号中检测出符合用户所说内容的语音区间,提取出该语音区间的语音数据的特征量,基于该特征量并参照语音识别词典4进行识别处理,从而输出识别结果(步骤ST02)。
然后,操作按键生成部6生成操作按键,该操作按键具有对应于语音识别部5所输出的识别结果的功能(步骤ST03)。
之后,显示控制部7判断显示部8上是否有已显示的操作按键(步骤ST04)。
在存在有已显示的操作按键的情况下(步骤ST04中为“是”的情况),判断操作按键的显示更新是否为停止中(步骤ST05)。然后,在并非显示更新停止中的情况下(步骤ST05中为“否”的情况),消去已显示的操作按键,对显示部8进行指示输出以显示步骤ST03中由操作按键生成部6所生成的操作按键(步骤ST06)。
另一方面,在显示更新停止中的情况下(步骤ST05中为“是”的情况),不显示所生成的操作按键,而返回步骤ST01的处理。
此外,在步骤ST04的情况下,在不存在已显示的操作按键的情况下(步骤ST04中为“否”的情况),对显示部8进行指示输出以显示步骤ST03中由操作按键生成部6所生成的操作按键(步骤ST07)
接着,根据图6的流程图说明可在显示部8的操作按键显示区域60显示多个操作按键的情况。
图6是例如图4所示那样表示操作按键显示区域60中能显示多个(图4中为两个)操作按键的情况下的操作按键的生成及显示处理的流程图。
步骤ST11至ST13的处理与图5所示的流程图的步骤ST01至ST03相同,因而省略说明。
在步骤ST13中生成操作按键之后,显示控制部7判断显示部8的操作按键显示区域60中已显示的操作按键的个数(步骤ST14)。
然后,在已显示有规定个数(操作按键显示区域60中所能显示的最大个数)的操作按键的情况下(图中ST15中为“是”的情况下,例如为图4(c)的情况),判断操作按键的显示更新是否为停止中(步骤ST16)。
在并未显示更新中的情况下(步骤ST16中为“否”的情况),对显示部8进行指示输出,以消去操作按键显示区域60中处于显示中的操作按键中的最初所显示的第一个操作按键(图4(c)中的操作按键61),使剩下的操作按键(图4(c)中的操作按键62)的位置逐一移动(图4(d)),显示步骤ST13中由操作按键生成部6所生成的操作按键(图4(d)中的操作按键63)(步骤S17)。
另一方面,在显示更新停止中的情况下(步骤ST16中为“是”的情况),不显示所生成的操作按键,而返回步骤ST11的处理。
另外,在步骤ST15中,在所显示的操作按键少于规定个数(操作按键显示区域60中所能显示的最大个数)的情况下(步骤ST15中为“否”的情况,例如图4(b)的情况),即使操作按键显示更新停止/重新开始部9发出停止更新操作按键的显示内容的指示信号,也对显示部8进行指示输出,以显示操作按键生成部6所生成的操作按键(图4(c)的操作按键62)(步骤ST18)。
此外,在图5、图6的流程图中,也可以不进行步骤ST04、步骤ST14至ST15的判断。即,与所显示的操作按键的有无及个数无关,显示控制部7可以在显示更新停止中的情况下返回步骤ST01、ST11的处理。
图7是表示即使在未生成操作按键的情况下也消去已显示的操作按键的处理的流程图。
首先,显示控制部7对显示部8的操作按键显示区域60中所显示的操作按键判断其是否是从显示开始起经过了规定时间的操作按键(步骤ST21)。在不存在进行显示后已经过了规定时间的操作按键的情况下(步骤ST21中为“否”的情况),返回步骤ST21的处理。
另一方面,在存在有已经过了规定时间的操作按键的情况下(步骤ST21中为“是”的情况),判断操作按键的显示更新是否为停止中(步骤ST22)。在为显示更新停止中的情况下(步骤ST22中为“是”的情况),返回步骤ST21的处理。在不是显示更新停止中的情况下(步骤ST22中为“否”的情况),进行指示输出以从显示部8消去从显示开始起经过了规定时间的操作按键(步骤ST23),返回步骤ST21的处理。
图8是表示操作按键显示更新停止/重新开始部9进行操作按键的显示更新停止/重新开始的指示输出的处理的流程图。
首先,操作按键显示更新停止/重新开始部9从视线检测部12、姿势检测部13、指示输入部10获取各种信息(步骤ST31)。所谓各种信息,具体是指来自视线检测部12的视线信息、来自姿势检测部13的姿势信息、来自指示输入部10的操作信息、物体相对于触摸面板的接近/接触信息、显示更新已停止的时间中的至少一个以上。
在所获取的信息满足上述规定条件(显示更新停止的条件)的情况下(步骤ST32中为“是”的情况),对显示控制部7进行指示输出以停止显示更新(步骤ST33)。
另一方面,在不满足规定条件(显示更新停止的条件)的情况下(步骤ST32中为“否”的情况),进行指示输出以重新开始显示更新(步骤ST34)。
接着举出具体例说明动作的一个例子。
例如图3所示,在操作按键显示区域60中仅能显示一个操作按键的情况下,在未显示有操作按键的状态(图3(a)的状态)下,用户A说出“想去便利店”时,作为语音识别部5进行识别处理的识别结果输出“便利店”(图5的步骤ST01至ST02)。
然后,操作按键生成部6生成操作按键61,该操作按键61具有对应于识别结果“便利店”的功能,即检索属于设施种类“便利店”的设施的功能(步骤ST03).
此处,由于显示部8的操作按键显示区域60中未显示有操作按键(步骤ST04中为“否”的情况),因而显示控制部7对显示部8进行指示输出,以显示操作按键61(步骤ST07).其结果是,如图3(b)所示,显示操作按钮61。
接着,若用户B说出“能否经过银行”,则操作按键生成部6生成操作按键62,该操作按键62具有对应于识别结果“银行”的功能,即检索属于设施种类“银行”的设施的功能(步骤ST01至ST03)。
此时,显示部8的操作按键显示区域60中已显示有“便利店”这一操作按键61(步骤ST04中为“是”的情况),因而例如用户A要按下该“便利店”这一操作按键61,在其手指接近显示部8时,操作按键显示更新停止/重新开始部9对显示控制部7进行显示更新停止的指示输出,以停止显示更新。
其结果是,由于判定为处于操作按键的显示更新停止中(步骤ST05中为“是”的情况),因而,显示部8上不显示“银行”这一操作按键62。
另一方面,在用户A并不想按下“便利店”这一操作按键61的情况下,例如在用户A的手指未接近显示部8时,操作按键显示更新停止/重新开始部9对显示控制部7不进行显示更新停止的指示输出。
其结果是,判断为操作按键的显示更新不处于停止中(步骤ST05中为“否”的情况),因而,显示控制部7向显示部8进行指示输出,以消去“便利店”这一操作按键61,而显示“银行”这一操作按键62(步骤ST06,图3(c))。
接着,说明操作按键显示区域60中能显示多个、例如图4所示的两个的操作按键的情况下的动作。即,该情况下的操作按键显示区域60中所能显示的操作按键的最大个数(规定个数)为两个。
然后,如图4(b)所示,将已经显示且仅显示有一个“便利店”这一操作按键61的情况作为例子进行说明。在该状态下,若用户B说出“能否经过银行”,则生成“银行”这一操作按键62(图6的步骤ST11至ST13)。
此时,例如用户A想要按下“便利店”这一操作按键61,其手指接近显示部8时,操作按键显示更新停止/重新开始部9对显示控制部7进行显示更新停止的指示输出。
但是,由于显示部8上所显示的操作按键的个数为一个(步骤ST14、步骤ST15中为“否”的情况),则无论是否处于显示更新停止中,都输出指示信号以显示“银行”这一操作按键62(步骤ST18)。
其结果是,如图4(c)所示,显示“银行”这一操作按键62。
接着,在该状态下,例如用户B想要按下“银行”这一操作按键62,其手指接近显示部8时,操作按键显示更新停止/重新开始部9对显示控制部7进行显示更新停止的指示输出。
此时,例如用户A说出“附近是否有停车场”,则生成“停车场”这一操作按键63(步骤ST11至ST13)。
但是,如图4(c)所示,显示有两个(最大个数(规定个数))操作按键,且处于显示更新停止中(步骤ST15中为“是”,步骤ST16中为“是”的情况),因而显示控制部7不输出显示“停车场”这一操作按键63的指示信号(显示维持图4(c)保持不变)。
另一方面,在图4(c)所示的状态下,用户的手指未接近显示部8的情况下,操作按键显示更新停止/重新开始部9对显示控制部7进行显示更新重新开始的指示输出,因此在该情况下,对于是否处于显示更新停止中的判定(步骤ST16)的结果为否。
此时,例如用户A说出“附近是否有停车场”,则在生成“停车场”这一操作按键63之前,与上述情况相同(步骤ST11至ST13)。
但是,在该情况下,显示有两个(最大个数(规定个数))操作按键,且并非处于显示更新停止中(步骤ST15中为“是”,步骤ST16中为“否”的情况),因而显示控制部7进行指示输出,以从显示中的操作按键61、62中,消去第一个操作按键61而使剩下的操作按键62移动,显示步骤ST13中所生成的操作按键63(步骤ST17)。
其结果是,如图4(d)所示,显示“停车场”这一操作按键63。
由此,能防止现有技术中出现的下述问题:即,在例如图4(c)中用户希望检索便利店,因而在想要按下“便利店”这一操作按键61的瞬间,若因其他用户发话而将该“便利店”的操作按键61变更为“银行”的操作按键62,则导致按下不希望按下的操作按键62,即,执行检索不希望检索的“银行”的功能。
如上所述,根据本实施方式1,在根据用户的视线、姿势或规定操作,判断为用户要选择(按下)操作按键的情况下,使得停止操作按键的显示更新,在显示更新停止中,不显示根据新识别出的语音而生成的操作按键,因而,在用户要选择所希望的操作按键的时刻,不会出现该操作按键的位置发生变更、或变化为其他操作按键、或消失的情况,因而能防止用户选择所不希望的操作按键而导致误动作,能提高用户的便利性。
实施方式2.
图9是表示本发明的实施方式2的语音识别装置的一个示例的框图。对于与实施方式1中说明的相同的结构,标注同一标号并省略重复说明。在以下所示的实施方式2中,与实施方式1相比的不同点在于,具有显示更新停止表现存储部14和显示更新重新开始表现存储部15,操作按键显示更新停止/重新开始部9根据语音识别部5的语音识别来停止/重新开始显示更新。
与实施方式1相比,语音识别部5还能识别意味着“暂停”、“停止”、“更新停止”、“重新开始”、“更新重新开始”等操作按钮的显示更新的停止/重新开始的单词,并输出识别结果。显示更新停止表现存储部14中存储有意味着“暂停”、“停止”、“更新停止”等操作按键的显示更新停止的单词。
显示更新重新开始表现存储部15中存储有意味着“重新开始”、“更新重新开始”等操作按键的显示更新重新开始的单词。
操作按键显示更新停止/重新开始部9参照显示更新停止表现存储部14及显示更新重新开始表现存储部15,判断语音识别部5输出的识别结果是否表示显示更新停止表现存储部14中所存储的显示更新停止。然后,在判断为语音识别部5输出的识别结果存在于显示更新停止表现存储部14中的情况下,对显示控制部7输出停止操作按键的显示更新的指示信号,在判断为语音识别部5所输出的识别结果表示存储于显示更新重新开始表现存储部15中的显示更新重新开始的情况下,对显示控制部7输出重新开始操作按键的显示更新的指示信号。
接着,利用图10所示的流程图,对实施方式2的语音识别装置的处理进行说明。
图10是表示操作按键显示更新停止/重新开始部9根据语音识别进行操作按键的显示更新停止/重新开始的指示输出的处理的流程图。
首先,操作按键显示更新停止/重新开始部9获取语音识别部5所输出的识别结果(步骤ST41)。
接着,操作按键显示更新停止/重新开始部9对该识别结果是否存在于显示更新停止表现存储部14中进行判断(步骤ST42)。在存在于显示更新停止表现存储部14中的情况下(步骤ST42中为“是”的情况),对显示控制部7进行显示更新停止的指示输出(步骤ST43)。
另一方面,在步骤ST41中所获取的识别结果不存在于显示更新停止表现存储部14中的情况(步骤ST42中为“否”的情况),对该识别结果是否存在于显示更新重新开始表现存储部15进行判断(步骤ST44)。在存在于显示更新重新开始表现存储部15中的情况下(步骤ST44中为“是”的情况),对显示控制部7进行显示更新重新开始的指示输出(步骤ST46)。
此外,在步骤ST41中所获取的识别结果也不存在于显示更新重新开始表现存储部15中的情况下(步骤ST44中为“否”的情况),结束处理。
由此,该实施方式2与实施方式1的不同点在于,操作按键显示更新停止/重新开始部9用于指示进行操作按键的显示更新停止/重新开始的条件不取决于用户的视线、姿势、操作输入,而取决于用户的语音,但是其他动作处理及画面转移例都与实施方式1相同,因此省略图示及说明。
如上所述,根据本实施方式2,在用户说出停止操作按键的显示更新的情况下,使操作按键的显示更新停止,在显示更新停止期间,不显示根据新识别出的语音而生成的按键,因而,在用户要选择所希望的操作按键的时刻,不会出现该操作按键的位置发生变更、或变化为其他操作按键、或消失的情况,因而能防止因用户选择所不希望的操作按键而导致误动作,能提高用户的便利性。
在上述实施方式1、2中,也可以在显示控制部7从操作按键显示更新停止/重新开始部9接收到显示更新停止的指示信号的情况下,对显示部8进行指示输出,以改变已显示的操作按键的显示形态,在从操作按键显示更新停止/重新开始部9接收到显示更新重新开始的指示信号的情况下,进行使改变后的操作按钮返回原样的指示输出。此处,所谓显示形态是指例如操作按键的大小、颜色、文字的大小等。
即,也可以在显示控制部7从操作按键显示更新停止/重新开始部9接收到显示更新停止的指示信号的情况下,对显示部8进行指示输出,以改变已显示的操作按键的大小、颜色、文字的大小中的至少一者以上,在从操作按键显示更新停止/重新开始部9接收到显示更新重新开始的指示信号的情况下,进行使改变后的操作按钮返回原样的指示输出。
由此,用户能在视觉上判断操作按钮的显示更新是否处于停止中。此外,通过使操作按键比较醒目,能容易地进行选择。
另外,在上述实施方式1、2中,也可以具有对显示部8所显示的操作按键的显示履历进行存储的操作按键显示履历存储部(未图示)。在该情况下,在每次因显示更新而将操作按键从显示部8中消去时,显示控制部7都对操作按键显示履历存储部存储与该操作按键相关的信息。
然后,若在显示更新停止中,由用户对操作按键显示区域进行滚动操作,则显示控制部7进行以下控制:即,基于存储于操作按键显示履历存储部中的信息,将过去所显示的操作按键按照消去的顺序依次显示。
具体而言,例如在图4(a)的状态下,用户说出“想去便利店”、“能否经过银行”时,如图4(c)所示,显示“便利店”、“银行”的操作按键61、62。此处,若设操作按键的最大显示个数为“2”,接着用户说出“附近是否有停车场”时,消去所显示的操作按键中显示时间最久的第一个操作按键即“便利店”的操作按键61,显示“停车场”的操作按键63(图4(d))。
此时,显示控制部7将所消去的“便利店”的操作按键61的相关信息存储到操作按键显示履历存储部。然后,若在显示更新停止中用户对操作按键显示区域进行滚动操作,则显示控制部7例如基于来自接触式传感器的信号,使显示中的操作按键移动,并对显示部8进行指示输出,以基于存储于操作按键显示履历存储部中的信息,来显示过去所显示的“便利店”的操作按键61。
图11是表示通过滚动来显示从操作按键显示区域60被消去的操作按键的情况下的画面例的图。
此处,将操作按键显示区域60中所能显示的操作按键的最大个数设为“3”。图11(a)示出了以下状态:即,在显示了“便利店”的操作按键61、“银行”的操作按键62、“超市”的操作按键63之后,进一步显示“停车场”的操作按键64,从而将最初显示的“便利店”的操作按键61消去。
此时,显示控制部7将所消去的“便利店”的操作按键61的相关信息存储到操作按键显示履历存储部。然后,在显示更新停止中,例如图11(a)中的向上的箭头那样,用户向上方进行滚动操作,则显示控制部7使显示中的操作按键62~64向上方移动,并且对显示部8进行指示输出,以显示操作按键显示履历存储部中所存储的“便利店”的操作按钮61。其结果是,如图11(b)所示,对操作按键进行滚动并显示。
此外,操作按键的滚动能通过以下任一个操作来进行:即,例如在显示一体型的触摸面板上(显示部8上)进行滑动这样的触摸操作;由转向开关、遥控器的规定按键、其他手动操作用的器件等进行的操作。
另外,显示控制部7接收到显示更新停止的指示信号时,也可以进行指示输出,以使得例如图12所示那样,在该时刻所显示的操作按键的基础上,对作为显示履历进行存储的操作按键进行一览显示。即,若在例如成为图11(a)所示的状态之后,成为显示更新停止中,则不进行滚动操作,而如图12所示那样,还一并显示存储于操作按键显示履历存储部中的“便利店”的操作按键61。在该情况下,与操作按键显示区域60无关,显示所有的处于显示中这一状态下的操作按键及所存储的操作按键。
而且,显示控制部7在对操作按键显示履历存储部存储操作按键的相关信息时,在与已存储的信息为相同信息的情况下,也可不进行存储(与之前的信息合并)。
例如,在操作按键显示履历存储部中按照“便利店”、“银行”的顺序存储与操作按键相关的信息时,即使更一步获取与“便利店”的操作按键相关的信息,但由于其已存储于存储部中,因而不进行存储。
由此,能防止显示多个相同的操作按键。
另外,在上述实施方式1、2中,也可以具有存储有与操作按键生成部6所生成的操作按键相关的信息的操作按键生成履历存储部(未图示)。在该情况下,基于语音识别部5所输出的识别结果,显示控制部7向操作按键生成履历存储部存储以下操作按键的相关信息,上述操作按键是由操作按键生成部6所生成的操作按键,且由于处于显示更新停止中而未显示于显示部8。
然后,接收到显示更新重新开始的指示信号时,显示控制部7对显示部8进行指示输出,以在显示部8显示基于操作按键生成履历存储部中所存储的信息的操作按键,以代替显示部8中正在显示的操作按键。
此时,与操作按键显示区域60无关,可以进行指示输出以显示显示部8上所能显示的最大个数的操作按键,也可以进行指示输出以显示不超过最大个数的规定的个数。
具体而言,例如如图4(c)所示显示有操作按键,在显示更新为停止中的情况下,若说出“是否可去超市”,则由操作按键生成部6生成“超市”的操作按键。此处,由于显示更新为停止中,因而显示控制部7不进行将“超市”这一操作按键显示于显示部8的指示输出,而将与该操作按键相关的信息存储于操作按键生成履历存储部。
同样地,若进一步说明“附近是否有停车场”,则显示控制部7将与“停车场”的操作按键相关的信息存储到操作按键生成履历存储部。之后,若接收到显示更新重新开始的指示信号,则显示控制部7输出指示信号,以基于存储于操作按键生成履历存储部中的信息,将“超市”的操作按键和“停车场”的操作按键显示于显示部8,以代替“银行”的操作按键和“便利店”的操作按键。
另外,在上述实施方式1、2中,说明了在显示更新停止中由用户按下操作按键来对其进行选择的情况,但是也可以使得在显示更新停止中通过用户说出该操作按键的名称来选择该操作按键。
在上述实施方式1、2中,也可以采用以下结构:在显示更新停止中,朗读出显示于显示部8的操作按键的名称,在所希望的操作按键被朗读出时作出决定,从而能进行选择。在该情况下,在操作按键名称被朗读时或被朗读后的规定时间内,在用户可以通过转向开关等指示输入部来手动地进行决定操作,或在识别出“决定”、“选择”等发话语音的情况下,执行与成为朗读对象的操作按键相对应的功能。
在该情况下,具有语音合成部(未图示),该语音合成部基于字符串来生成语音;以及语音控制部(未图示),该语音控制部输出指示信号,该指示信号对扬声器等语言输出部输出由语音合成部生成的语音。然后,语音控制部接收到来自操作按键显示更新停止/重新开始部9的显示更新停止的信号,从显示控制部7获取显示于显示部8的操作按键的名称,并对语音合成部进行指示输出,以基于该名称来合成语音。语音合成部接收该指示来合成语音。然后,语音控制部对语音输出部进行指示输出,以输出语音合成部所生成的语音数据。
此外,在朗读中或朗读后的规定时间内,对于由用户手动或利用语音进行操作按键的决定操作的情况下的动作,使用公知技术即可,因而此处省略说明。
实施方式3.
在上述实施方式1、2中,以将本发明的语音识别装置适用于搭载在车辆等移动体上的导航装置的情况为例进行了说明,但是所适用的并不限于车载用导航装置,也可以是包含人、车辆、铁路、船舶或航空器等的移动体用的导航装置,也可以适用于语音识别系统的伺服器或导航系统的伺服器。另外,也能适用于例如安装于智能手机、平板电脑、移动电话等移动信息终端等的语音识别系统的应用或导航系统的应用等形式的系统。
图13是表示本发明实施方式3所涉及的导航系统的概要的图。该导航系统能具有以下各种形式:例如车载装置100协同智能电话等移动信息终端101及伺服器102中的至少一方来进行语音识别处理和导航处理,或者由智能电话等移动信息终端101及伺服器102中的至少一方来进行语音识别处理和导航处理,并使车载装置100显示识别结果、地图信息等。以下说明该导航系统的构成形态。
在实施方式1至2中,说明了图13所示的车载装置100具有本发明的语音识别装置的功能的情况,但是本实施方式3的导航系统中说明了以下情况:即,伺服器102进行语音识别处理,将该识别结果显示于车载装置100,从而提供给用户的情况;以及移动信息终端101协同伺服器102进行语音识别处理,并将该识别结果显示于车载装置100,从而提供给用户的情况。
首先,说明以下情况:伺服器102进行语音识别处理,将该识别结果显示于车载装置100的情况下,即车载装置100作为显示装置与具有语音识别功能的伺服器102相协作。
在该情况下,考虑车载装置100与伺服器102直接通信或车载装置经由移动信息终端101与伺服器102进行通信的情况。伺服器102起到上述实施方式1、2所说明的语音识别装置的作用。车载装置100作为至少具有用于将伺服器102的识别结果提供给用户的显示部8的显示装置来发挥作用。
此时,考虑以下两种情况:(1)伺服器102仅具有语音识别功能,车载装置100具有其他结构的情况,即,车载装置100作为获取识别结果并将其显示于显示部的识别结果显示装置来发挥作用的情况,(2)车载装置100仅具有语音获取功能、通信功能及显示功能,伺服器102具有其他结构的情况,即,车载装置100仅作为显示所获取的识别结果的显示装置来发挥作用的情况。
首先说明以下情况,即(1)伺服器102仅具有语音识别功能,车载装置100具有其他结构的情况,即,车载装置100作为获取识别结果并将其显示于显示部的识别结果显示装置来发挥作用的情况。
在该情况下,伺服器102是具有语音识别词典4和语音识别部5的语音识别伺服器,识别结果显示装置即车载装置100包括控制部1、语音获取部3、操作按键生成部6、显示控制部7、显示部8、操作按键显示更新停止/重新开始部9及通信功能(语音数据发送部、识别结果获取部)。
然后,通信功能中的语音数据发送部(未图示)将语音获取部3所获取的语音数据发送到伺服器102,识别结果获取部(未图示)从伺服器102获取该伺服器102中经过语音识别出的识别结果。操作按键生成部6生成操作按键,该操作按键具有对应于识别结果获取部从伺服器102所获取的识别结果的功能。对于其他功能,与实施方式1、2中的语音识别装置相同,因而省略说明。
接着,说明以下情况:即,(2)车载装置100仅具有语音获取功能、通信功能及显示功能,伺服器102具有其他结构的情况,即,车载装置100仅作为显示所获取的识别结果的显示装置来发挥作用的情况。
在该情况下,车载装置100仅具有基本的语音获取功能、通信功能和显示功能,接收伺服器102的语音识别结果并提供给用户。
即,伺服器102是具有显示部8以外的构件的语音识别装置,该语音识别装置即伺服器102对用户发出的语音进行识别并将识别结果显示于显示装置即车载装置100。
根据以上的结构,也能获得与实施方式1、2相同的作用效果。
另外,说明移动信息终端101协同伺服器102进行语音识别处理,并由车载装置100将该识别结果提供给用户的情况。
在该结构中,认为车载装置100经由移动信息终端101与伺服器102进行通信的情况,移动信息终端101的应用协同伺服器102进行语音识别处理。车载装置100作为至少具有用于将移动信息终端101和伺服器102的识别结果提供给用户的显示部8的显示装置来发挥作用。
在该情况下,车载装置100仅具有基本的语音获取功能、通信功能和显示功能,接收移动信息终端101协同伺服器102获得的语音识别结果并提供给用户。
即,利用移动信息终端101的应用将对用户发出的语音进行识别所得到的识别结果显示于显示装置即车载装置100。
根据以上的结构,也能获得与实施方式1、2相同的作用效果。
另外,本申请发明可以在其发明的范围内对各实施方式进行自由组合,或对各实施方式的任意构成要素进行变形、或省略各实施方式中的任意的构成要素。
产业上的应用
本发明的语音识别装置并不限于车载用的导航装置,也能适用于包含人、车辆、铁路、船舶或航空器等移动用的导航装置、移动的导航装置、移动的信息处理装置等,或者适用于车站信息提供系统的伺服器、智能手机、平板电脑、移动电话等移动信息终端等上所安装的导航系统的应用等。
标号说明
1 控制部
2 麦克风
3 语音获取部
4 语音识别辞典
5 语音识别部
6 操作按键生成部
7 显示控制部
8 显示部
9 操作按键显示更新停止/重新开始部
10 指示输入部
11 摄像机
12 视线检测部
13 姿势检测部
14 显示更新停止表现存储部
15 显示更新重新开始表现存储部
16 本车标记
60 操作按键显示区域
61,62,63,64 操作按键
100 车载装置
101 移动信息终端
102 伺服器。
Claims (18)
1.一种语音识别装置,
识别用户发出的语音并显示识别结果,其特征在于,包括:
语音获取部,该语音获取部检测并获取所述用户所说出的语音;
语音识别部,该语音识别部在所述语音识别装置起动的期间始终参照语音识别词典来识别所述语音获取部所获取的语音数据,并输出识别结果;
操作按键生成部,该操作按键生成部生成操作按键,该操作按键具有对应于所述语音识别部所输出的识别结果的功能;
显示部,该显示部显示所述操作按键生成部所生成的操作按键;
显示控制部,该显示控制部控制所述显示部的所述操作按键的显示内容;以及
操作按键显示更新停止/重新开始部,该操作按键显示更新停止/重新开始部基于所述用户是否要操作显示于所述显示部的操作按键,来对所述显示控制部输出指示所述操作按键的显示内容的更新停止及重新开始的指示信号,
所述操作按键显示更新停止/重新开始部在判断为所述用户要操作显示于所述显示部的操作按键的情况下,输出指示所述操作按键的显示内容的更新停止的指示信号,
所述显示控制部从所述操作按键显示更新停止/重新开始部接收到了所述操作按键的显示内容的更新停止的指示信号的情况下,对所述显示部进行指示,以使显示于所述显示部的操作按键的显示更新停止。
2.如权利要求1所述的语音识别装置,其特征在于,
还具有指示输入部,该指示输入部接收所述用户的各种操作的指示,
所述操作按键显示更新停止/重新开始部在所述指示输入部接收到规定操作的情况下,若判断为所述用户要按下所述操作按键,则输出指示所述操作按键的显示内容的更新停止的指示信号。
3.如权利要求2所述的语音识别装置,其特征在于,
所述指示输入部具有检测物体的接近的近距离传感器,
接收到所述规定操作的情况是指,基于来自所述近距离传感器的信号来计算所述近距离传感器与所述物体之间的距离,所计算出的距离为规定值以下或小于规定值的情况。
4.如权利要求1所述的语音识别装置,其特征在于,
还具有视线检测部,该视线检测部检测所述用户的视线,
所述操作按键显示更新停止/重新开始部在所述视线检测部检测到所述用户朝向所述显示部的视线的情况下,若判断为所述用户要操作所述操作按键,则输出指示所述操作按键的显示内容的更新停止的指示信号。
5.如权利要求1所述的语音识别装置,其特征在于,
还具有姿势检测部,该姿势检测部检测所述用户的姿势,
所述操作按键显示更新停止/重新开始部在所述姿势检测部检测到规定姿势的情况下,若判断为所述用户要按下所述操作按键,则输出指示所述操作按键的显示内容的更新停止的指示信号。
6.如权利要求1所述的语音识别装置,其特征在于,
在所述显示部上所显示的操作按键少于规定个数的情况下,
对于所述操作按键显示更新停止/重新开始部,即使在判断为所述用户要操作所述操作按键的情况下,也不指示所述操作按键的显示内容的更新停止。
7.如权利要求1所述的语音识别装置,其特征在于,
还具有显示更新停止表现存储部,该显示更新停止表现存储部中存储有意味着所述操作按键的显示更新停止的单词,
对于所述操作按键显示更新停止/重新开始部,在判断为所述语音识别部输出的识别结果存在于所述显示更新停止表现存储部中的情况下,输出指示所述操作按键的显示内容的更新停止的指示信号。
8.如权利要求1所述的语音识别装置,其特征在于,
对于所述操作按键显示更新停止/重新开始部,在未判断出所述用户要操作所述操作按键的情况下,输出指示所述操作按键的显示内容的更新重新开始的指示信号,
所述显示控制部对所述显示部进行指示,以使得在所述显示部的所述操作按键的更新处于停止期间、且从所述操作按键显示更新停止/重新开始部接收到所述操作按键的显示内容的更新重新开始的指示信号的情况下,重新开始所述显示部所显示的操作按键的显示更新。
9.如权利要求1所述的语音识别装置,其特征在于,
对于所述操作按键显示更新停止/重新开始部,在输出了停止所述操作按键的显示内容的更新的指示信号之后、不对该操作按键进行操作而经过了规定时间的情况下,重新开始所述操作按键的显示内容的更新。
10.如权利要求9所述的语音识别装置,其特征在于,
所述语音识别装置搭载于移动体,
所述操作按键显示更新停止/重新开始部根据所述移动体的行驶状态来改变所述规定时间。
11.如权利要求1所述的语音识别装置,其特征在于,
所述显示控制部在从所述操作按键显示更新停止/重新开始部接收到了所述操作按键的显示内容的更新停止的指示信号的情况下,改变显示于所述显示部的操作按键的显示形态。
12.如权利要求11所述的语音识别装置,其特征在于,
所述显示形态是指所述操作按键的大小、颜色、文字大小中的至少一个以上。
13.如权利要求1所述的语音识别装置,其特征在于,
还包括操作按键显示履历存储部,该操作按键显示履历存储部中存储所述显示部上显示的操作按键的显示履历,
所述显示控制部在每次因所述操作按键的显示更新而从所述显示部消去所述操作按键时,将与所消去的操作按键相关的信息存储于所述操作按键显示履历存储部中,并且若在所述操作按键的显示更新停止中对所述操作按键进行滚动操作,则对所述显示部进行指示以显示存储于所述操作按键显示履历存储部中的操作按键。
14.如权利要求1所述的语音识别装置,其特征在于,
还包括操作按键显示履历存储部,该操作按键显示履历存储部中存储所述显示部上显示的操作按键的显示履历,
所述显示控制部在每次因所述操作按键的显示更新而从所述显示部消去所述操作按键时,将与所消去的操作按键相关的信息存储于所述操作按键显示履历存储部,并且若处于所述操作按键的显示更新停止中,对所述显示部进行指示以对存储于所述操作按键显示履历存储部中的操作按键进行一览显示。
15.如权利要求1所述的语音识别装置,其特征在于,
还具有操作按键生成履历存储部,该操作按键生成履历存储部中存储有所述操作按键生成部所生成的操作按键的相关信息,
所述显示控制部指示所述操作按键生成履历存储部存储与以下操作按键相关的信息:即,由所述操作按键生成部所生成的、且因处于所述操作按键的更新停止期间而未显示于所述显示部的操作按键,并且在接收到所述操作按键的重新开始显示更新的指示信号时,所述显示控制部进行指示输出,以在所述显示部上显示基于存储于所述操作按键生成履历存储部中的信息的操作按键,来代替所述显示部上正在显示的操作按键。
16.一种识别结果显示装置,
显示对用户发出的语音进行识别的识别结果,其特征在于,包括:
语音获取部,该语音获取部检测并获取用户所说出的语音;
识别结果获取部,该识别结果获取部在所述识别结果显示装置起动的期间始终将所述语音获取部所获取的语音数据发送到语音识别伺服器,并获取该伺服器中进行了语音识别的识别结果;
操作按键生成部,该操作按键生成部生成操作按键,该操作按键具有对应于所述识别结果获取部所获取的识别结果的功能;
显示部,该显示部显示所述操作按键生成部所生成的操作按键;
显示控制部,该显示控制部控制所述显示部的所述操作按键的显示内容;以及
操作按键显示更新停止/重新开始部,该操作按键显示更新停止/重新开始部基于所述用户是否要操作显示于所述显示部的操作按键,来对所述显示控制部输出指示所述操作按键的显示内容的更新停止及重新开始的指示信号,
所述操作按键显示更新停止/重新开始部在判断为所述用户要操作显示于所述显示部的操作按键的情况下,输出指示所述操作按键的显示内容的更新停止的指示信号,
所述显示控制部在从所述操作按键显示更新停止/重新开始部接收到了所述操作按键的显示内容的更新停止的指示信号的情况下,对所述显示部进行指示,以使显示于所述显示部的操作按键的显示更新停止。
17.一种语音识别装置,
识别用户发出的语音并将识别结果显示于显示装置,其特征在于,包括:
语音识别部,该语音识别部在所述语音识别装置起动的期间始终参照语音识别词典来识别所述用户发出的语音,并输出识别结果;
操作按键生成部,该操作按键生成部生成操作按键,该操作按键具有对应于所述语音识别部所输出的识别结果的功能;
显示控制部,该显示控制部对将所述操作按键生成部所生成的操作按键显示于所述显示装置时的显示内容进行控制;以及
操作按键显示更新停止/重新开始部,该操作按键显示更新停止/重新开始部基于所述用户是否要操作显示于所述显示装置的操作按键,来对所述显示控制部输出指示所述操作按键的显示内容的更新停止及重新开始的指示信号,
对于所述操作按键显示更新停止/重新开始部,在判断出所述用户要操作所述操作按键的情况下,输出指示所述操作按键的显示内容的更新停止的指示信号,
所述显示控制部在从所述操作按键显示更新停止/重新开始部接收到了所述操作按键的显示内容的更新停止的指示信号的情况下,对所述显示装置进行指示,以使显示于所述显示装置的操作按键的显示更新停止。
18.一种显示方法,
是语音识别装置识别用户发出的语音并将识别结果并显示于显示装置的方法,其特征在于,包括:
语音识别部在所述语音识别装置起动的期间始终参照语音识别词典来识别所述用户发出的语音,并输出识别结果的步骤;
操作按键生成部生成具有对应于所述语音识别部所输出的识别结果的功能的操作按键的步骤;
操作按键显示更新停止/重新开始部在判断为所述用户要操作显示于所述显示装置的操作按键的情况下,输出指示所述操作按键的显示内容的更新停止的指示信号的步骤;以及
所述显示控制部在从所述操作按键显示更新停止/重新开始部接收到了所述操作按键的显示内容的更新停止的指示信号的情况下,对所述显示装置进行指示,以使显示于所述显示装置的操作按键的显示更新停止的步骤。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/064072 WO2014188512A1 (ja) | 2013-05-21 | 2013-05-21 | 音声認識装置、認識結果表示装置および表示方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105246743A CN105246743A (zh) | 2016-01-13 |
CN105246743B true CN105246743B (zh) | 2017-03-29 |
Family
ID=51933102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380076789.2A Expired - Fee Related CN105246743B (zh) | 2013-05-21 | 2013-05-21 | 语音识别装置、识别结果显示装置及显示方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9767799B2 (zh) |
JP (1) | JP5762660B2 (zh) |
CN (1) | CN105246743B (zh) |
DE (1) | DE112013007103T5 (zh) |
WO (1) | WO2014188512A1 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9786296B2 (en) * | 2013-07-08 | 2017-10-10 | Qualcomm Incorporated | Method and apparatus for assigning keyword model to voice operated function |
EP3154052A4 (en) * | 2014-06-03 | 2018-01-10 | Sony Corporation | Information processing device, information processing method, and program |
KR102301880B1 (ko) * | 2014-10-14 | 2021-09-14 | 삼성전자 주식회사 | 전자 장치 및 이의 음성 대화 방법 |
US9741342B2 (en) * | 2014-11-26 | 2017-08-22 | Panasonic Intellectual Property Corporation Of America | Method and apparatus for recognizing speech by lip reading |
WO2016103465A1 (ja) * | 2014-12-26 | 2016-06-30 | 三菱電機株式会社 | 音声認識システム |
JP6477123B2 (ja) * | 2015-03-25 | 2019-03-06 | 株式会社デンソー | 操作システム |
JP6739907B2 (ja) * | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
JP2018194873A (ja) * | 2015-10-05 | 2018-12-06 | パイオニア株式会社 | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 |
US9858927B2 (en) * | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
US9898250B1 (en) * | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
JP6690484B2 (ja) * | 2016-09-15 | 2020-04-28 | 富士通株式会社 | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 |
KR102068182B1 (ko) * | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102552486B1 (ko) * | 2017-11-02 | 2023-07-06 | 현대자동차주식회사 | 차량의 음성인식 장치 및 방법 |
JP2019105756A (ja) * | 2017-12-13 | 2019-06-27 | トヨタ自動車株式会社 | 車載音声出力装置 |
WO2019123770A1 (ja) * | 2017-12-20 | 2019-06-27 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7069795B2 (ja) * | 2018-02-15 | 2022-05-18 | 京セラドキュメントソリューションズ株式会社 | 電子機器 |
JP7281683B2 (ja) * | 2018-02-22 | 2023-05-26 | パナソニックIpマネジメント株式会社 | 音声制御情報出力システム、音声制御情報出力方法およびプログラム |
JP7192220B2 (ja) * | 2018-03-05 | 2022-12-20 | コニカミノルタ株式会社 | 画像処理装置、情報処理装置及びプログラム |
EP3590036B1 (en) * | 2018-05-07 | 2022-10-26 | Google LLC | Determining whether to automatically resume first automated assistant session upon cessation of interrupting second session |
JP7266418B2 (ja) * | 2019-02-14 | 2023-04-28 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN113067769B (zh) * | 2021-03-31 | 2023-03-10 | 百度在线网络技术(北京)有限公司 | 路由器重启方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008014818A (ja) * | 2006-07-06 | 2008-01-24 | Denso Corp | 作動制御装置、プログラム |
CN101158584A (zh) * | 2007-11-15 | 2008-04-09 | 熊猫电子集团有限公司 | 车载gps的语音目的地导航实现方法 |
CN103038816A (zh) * | 2010-10-01 | 2013-04-10 | 三菱电机株式会社 | 声音识别装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE391986T1 (de) * | 2000-11-23 | 2008-04-15 | Ibm | Sprachnavigation in webanwendungen |
US20030191629A1 (en) * | 2002-02-04 | 2003-10-09 | Shinichi Yoshizawa | Interface apparatus and task control method for assisting in the operation of a device using recognition technology |
JP2005311883A (ja) | 2004-04-23 | 2005-11-04 | Alpine Electronics Inc | 電話帳システム及び電話装置 |
JP4028581B2 (ja) | 2004-12-24 | 2007-12-26 | 株式会社ナビタイムジャパン | 先導経路案内システム、携帯型経路先導案内装置およびプログラム |
JP2009116769A (ja) * | 2007-11-09 | 2009-05-28 | Sony Corp | 入力装置、入力装置の制御方法、及びプログラム |
JP2010205130A (ja) * | 2009-03-05 | 2010-09-16 | Denso Corp | 制御装置 |
KR101639383B1 (ko) * | 2009-11-12 | 2016-07-22 | 삼성전자주식회사 | 근접 터치 동작 감지 장치 및 방법 |
US9223461B1 (en) * | 2010-12-08 | 2015-12-29 | Wendell Brown | Graphical user interface |
US8898592B2 (en) * | 2011-06-30 | 2014-11-25 | International Business Machines Corporation | Grouping expanded and collapsed rows in a tree structure |
US9075514B1 (en) * | 2012-12-13 | 2015-07-07 | Amazon Technologies, Inc. | Interface selection element display |
JP5921722B2 (ja) * | 2013-01-09 | 2016-05-24 | 三菱電機株式会社 | 音声認識装置および表示方法 |
HK1186912A2 (en) * | 2013-01-25 | 2014-03-21 | Zhipei Wang | Remote control system and device |
KR20140110452A (ko) * | 2013-03-08 | 2014-09-17 | 삼성전자주식회사 | 전자장치에서 근접 터치를 이용한 사용자 인터페이스 제어 방법 및 장치 |
JP2014203208A (ja) * | 2013-04-03 | 2014-10-27 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
JP6330565B2 (ja) * | 2014-08-08 | 2018-05-30 | 富士通株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
-
2013
- 2013-05-21 JP JP2015515343A patent/JP5762660B2/ja not_active Expired - Fee Related
- 2013-05-21 DE DE112013007103.7T patent/DE112013007103T5/de not_active Withdrawn
- 2013-05-21 CN CN201380076789.2A patent/CN105246743B/zh not_active Expired - Fee Related
- 2013-05-21 WO PCT/JP2013/064072 patent/WO2014188512A1/ja active Application Filing
- 2013-05-21 US US14/777,180 patent/US9767799B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008014818A (ja) * | 2006-07-06 | 2008-01-24 | Denso Corp | 作動制御装置、プログラム |
CN101158584A (zh) * | 2007-11-15 | 2008-04-09 | 熊猫电子集团有限公司 | 车载gps的语音目的地导航实现方法 |
CN103038816A (zh) * | 2010-10-01 | 2013-04-10 | 三菱电机株式会社 | 声音识别装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5762660B2 (ja) | 2015-08-12 |
US20160035352A1 (en) | 2016-02-04 |
DE112013007103T5 (de) | 2016-03-03 |
JPWO2014188512A1 (ja) | 2017-02-23 |
CN105246743A (zh) | 2016-01-13 |
US9767799B2 (en) | 2017-09-19 |
WO2014188512A1 (ja) | 2014-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105246743B (zh) | 语音识别装置、识别结果显示装置及显示方法 | |
CN104919278B (zh) | 语音识别装置及显示方法 | |
JP5893217B2 (ja) | 音声認識装置および表示方法 | |
CN100529670C (zh) | 用于模拟引导路径的导航器及其工作方法 | |
CN106030697B (zh) | 车载控制装置及车载控制方法 | |
CN104428766B (zh) | 语音识别装置 | |
CN101855521A (zh) | 用于信息的输入和展示的驾驶员辅助系统的多形态的用户接口 | |
CN105637323B (zh) | 导航用服务器、导航系统以及导航方法 | |
CN102918359A (zh) | 导航或地图绘制设备和方法 | |
CN104071096B (zh) | 输入装置、输入方法及输入程序 | |
CN105702270A (zh) | 音乐播放方法和装置 | |
CN106716407A (zh) | 车辆用设备控制装置、控制内容检索方法 | |
WO2014068788A1 (ja) | 音声認識装置 | |
JP6214297B2 (ja) | ナビゲーション装置および方法 | |
WO2006120929A1 (ja) | 楽曲選択装置および楽曲選択方法 | |
JP5005491B2 (ja) | 車載機、その出力態様設定方法 | |
CN101033977B (zh) | 导航仪的语音导航方法 | |
JP6522009B2 (ja) | 音声認識システム | |
JP2004037125A (ja) | ナビゲーションにおける周辺情報提示装置及び方法並びに提示用プログラム | |
CN114383623A (zh) | 导航装置 | |
JPH09113287A (ja) | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 | |
JPWO2013069060A1 (ja) | ナビゲーション装置、方法およびプログラム | |
JP2020067712A (ja) | 表示制御装置、表示システム、表示制御方法及び表示制御プログラム | |
JP2011118007A (ja) | 地図表示装置、地図表示方法、地図表示プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170329 |