CN101589428B - 车载用声音识别装置 - Google Patents

车载用声音识别装置 Download PDF

Info

Publication number
CN101589428B
CN101589428B CN200780048703XA CN200780048703A CN101589428B CN 101589428 B CN101589428 B CN 101589428B CN 200780048703X A CN200780048703X A CN 200780048703XA CN 200780048703 A CN200780048703 A CN 200780048703A CN 101589428 B CN101589428 B CN 101589428B
Authority
CN
China
Prior art keywords
understanding
user
detection unit
vocabulary level
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200780048703XA
Other languages
English (en)
Other versions
CN101589428A (zh
Inventor
住吉悠希
铃木忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nexgen Control Systems LLC
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN101589428A publication Critical patent/CN101589428A/zh
Application granted granted Critical
Publication of CN101589428B publication Critical patent/CN101589428B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

车载用声音识别装置(1)包括:获取输入声音的声音输入部(10);对获取的输入声音进行声音识别的声音识别部(12);基于声音识别的结果利用声音或者画面进行引导的引导信息输出部(13(14));以及识别词汇理解度判定部(20),该识别词汇理解度判定部(20)根据在声音识别部(12)所进行的声音识别中被监视的对用户操作的超时次数与修订次数,判定用户对于引导的识别词汇理解度,变更引导信息输出部(13(14))所进行的引导。

Description

车载用声音识别装置
技术领域
本发明涉及可以根据用户的识别词汇理解度来变更声音导航或字幕引导的车载用声音识别装置。
背景技术
随着声音识别技术的进步,声音识别装置也被引入车载导航系统。据此,即使在车辆行驶中,用户例如也只需说出地址的声音,就可以准确地且安全地检索全国的多达数万所设施。另外,也可以进行目的地导航等、对用户进行的系统操作进行声音引导,可以进行双向的对话。
在上述的声音识别装置中,以往已知一种装置,该装置根据对用户引导的次数或用户的反应时间来判定用户对操作的习惯程度,在对系统操作的习惯程度高于规定的级别时,加快声音引导的速度,并简化引导的信息(例如参照专利文献1)。
另外,还已知一种车载用声音识别装置,该装置判定作为对于用户的驾驶负载的大小的车速信息、方向盘的转向角信息、车辆的进退,基于判定的驾驶负载级别,变更对用户的自动声音引导(例如参照专利文献2)。
专利文献1:
日本专利特开2001-22370号公报
专利文献2:
日本专利特开2004-348657号公报
根据上述的专利文献1所披露的技术,可以根据用户对系统操作的习惯程度来自动变更声音引导,但问题是对于没有理解识别词汇的用户无法进行适当的声音引导。
另外,根据专利文献2所披露的技术,可以基于用户的驾驶负载级别来变更声音自动响应的方法,但问题是:由于没有判定每个用户的识别词汇理解度,因此,例如在用户没听懂(没听见)引导而不能理解可发声的词汇的状况下,不能对该用户进行适当的声音引导。
本发明为解决上述的问题而作,其目的在于得到一种车载用声音识别装置,该装置在即使用户没听懂、或者没听见引导而不能理解可发声的词汇的状况下,通过使引导内容变化,使其易于听懂、或者能够听懂,使用户能够掌握可发声的词汇。
发明内容
本发明所涉及的车载用声音识别装置包括:获取输入声音的声音输入部;对上述获取的输入声音进行声音识别的声音识别部;基于上述声音识别的结果进行引导的引导信息输出部;以及引导内容决定部,该引导内容决定部根据在上述声音识别部所进行的声音识别中被监视的对用户操作的超时次数或者修订次数、或者超时次数和修订次数这两者,判定用户对上述引导的识别词汇理解度,从而变更上述引导。
根据本发明,即使在用户没听懂、或者没听见引导而不能理解可发声的词汇的状况下,通过使引导变化,使其易于听懂、或者能够听懂,可以使用户能够掌握可发声的词汇。
附图说明
图1是表示本发明的实施方式1所涉及的车载用声音识别装置的结构的方框图。
图2是为了说明本发明的实施方式1所涉及的车载用声音识别装置的基本动作而引用的流程图。
图3是为了说明本发明的实施方式2所涉及的车载用声音识别装置的动作而引用的流程图。
图4是为了说明本发明的实施方式3所涉及的车载用声音识别装置的动作而引用的流程图。
图5是为了说明本发明的实施方式4所涉及的车载用声音识别装置的动作而引用的流程图。
图6是为了说明本发明的实施方式5所涉及的车载用声音识别装置的动作而引用的流程图。
图7是表示本发明的实施方式1、2所涉及的车载用声音识别装置使用的数据表的一个例子的图。
图8是表示本发明的实施方式3所涉及的车载用声音识别装置使用的数据表的一个例子的图。
图9是表示本发明的实施方式4所涉及的车载用声音识别装置使用的数据表的一个例子的图。
图10是表示本发明的实施方式5所涉及的车载用声音识别装置使用的数据表的一个例子的图。
具体实施方式
下面,为了更详细说明本发明,参照附图说明用于实施本发明的最佳方式。
实施方式1
图1是表示本发明的实施方式1所涉及的车载用声音识别装置的结构的方框图。
图1中,与本发明的实施方式1所涉及的车载用声音识别装置1连接有:以手动操作输入命令等数据的遥控器或触摸面板等2;收集用户为进行声音输入的发声内容的麦克风3;显示图像或字幕的显示监视器4;进行声音输出的扬声器5;各种传感器类(此处为测量车辆的目前位置的GPS(GlobalPositioning System,全球定位系统))6;测定加速度的G传感器7;以及从外部传感器获取车辆速度或方向盘转向角等信息的车内LAN(Local AreaNetwork,本地网)8。
另外,车载用声音识别装置1包括作为控制中枢的控制部11,由:按键输入部9;声音输入部10;声音识别部12;声音输出部13;画面输出部14;超时次数计数部15;修订操作次数计数部16;行驶状况判定部17;驾驶操作状态判定部18;用户状态判定部19;识别词汇理解度判定部20;引导内容决定部21;以及按键按下判定部22构成。
按键输入部9受理从遥控器或触摸面板2输入的命令,向控制部11提供。声音输入部10受理由麦克风3收集的声音命令,向控制部11提供。声音识别部12进行声音识别,将识别结果向控制部11提交。声音识别部12所进行的声音识别结果由声音输出部13以声音、或者由画面输出部14以图像向用户呈现。
超时次数计数部15对声音操作中的超时次数进行计数,另外,修订操作次数计数部16对声音操作中的修订操作次数进行计数,分别向控制部11提供。行驶状况判定部17判定车辆是正在停车中或者驾驶中的行驶状况,另外,驾驶状态判定部18获取车的进退、方向盘的转向等驾驶状况,分别向控制部11提供。
另外,用户状态判定部19例如根据安装在方向盘的传感器获取的用户的出汗、心跳数、视线、语调等信息,判定用户的心理状态,向控制部11提供。
识别词汇理解度判定部20在控制部11的控制下,分别从超时次数计数部15、修订操作次数计数部16、行驶状况判定部17、驾驶操作状态判定部18、用户状态判定部19获取信息,判定表示用户对可声音识别的词汇的理解程度如何的识别词汇理解度,向控制部11提供。另外,引导内容决定部21在控制部11的控制下,基于由识别词汇理解度判定部20输出的用户的识别词汇理解度,变更对用户输出的声音导航、或者字幕等所涉及的引导。
另外,按键按下判定部22判定用户按下遥控器2的按键时的按压力、或者按键按下时间,向控制部11提供。
控制部11例如由微型计算机构成,为了进行与从按键输入部9或声音输入部10受理的命令对应的处理,向上述的各控制块12~21输出命令。另外,此处将声音输出部13和画面输出部14总称为引导信息输出部。
图2是为了说明本发明的实施方式1所涉及的车载用声音识别装置的基本动作而引用的流程图。
下面,参照图2所示的流程图,详细说明图1所示的实施方式1所涉及的车载用声音识别装置的动作。
控制部11始终监视来自按键输入部9的按键输入,首先,判定是否有通过手动操作进行的按下发声按键(步骤ST201)。在按下发声按键时(步骤ST201“是”),根据下面说明的已定的步骤执行声音识别处理。
此处,由于以按下发声按键为契机开始声音识别处理,因此控制部11监视发声按键的按下操作,但在声音输入开始被定义为其他操作时,监视该操作。在按下发声按键时,超时次数计数部15将超时次数设定为0(初始化)(步骤ST202),且修订操作次数计数部16将修订操作次数设定为0(初始化)(步骤ST203)。
接下来,在控制部11的控制下,在识别词汇理解度判定部20中,判定用户对于识别词汇的理解度。具体而言,识别词汇理解度判定部20例如内置图7所示的识别词汇理解度判定信息作为列表数据,通过参照该列表数据,根据超时次数与修订次数来判定用户对识别词汇的理解度(步骤ST204)。另外,此处,识别词汇理解度判定部20是假设根据超时次数和修订次数来判定用户对识别词汇的理解度,但也可以根据超时次数和修订次数中的任意一个进行判定。
即,由于在步骤ST202和步骤ST203中超时次数及修订操作次数都为“0”,因此根据图6所示的列表数据,判定理解度为“10”,基于该判定的用户的识别词汇理解度,决定在引导内容决定部21中引导的内容(步骤ST205)。接下来,引导内容决定部21起动声音输出部13或者画面输出部14,使声音导航或者字幕显示,将引导呈现给用户(步骤ST206)。此处,呈现的引导的内容会后述。
接下来,声音识别部12对为了引导而输入的声音进行声音识别处理(步骤ST207),在规定时间内没有用户进行的声音输入、检测到超时的时候(步骤ST208“是”),超时次数计数部15将超时次数更新而进行+1(步骤ST209),返回根据识别词汇理解度判定信息进行用户的识别词汇判定的步骤ST204的处理。如图6所示,随着超时次数和修订操作次数增多,识别词汇理解度成为较低的值。
另外,在未检测到超时的时候(步骤ST208“否”),控制部11起动声音输出部13或者画面输出部14,将声音识别部12所进行的声音识别结果呈现给用户(步骤ST210)。
控制部11监视识别结果呈现后按键输入部9所进行的按键输入,判定修订按键是否被按下(步骤ST211)。在按下修订按键时(步骤ST211“是”),修订操作次数计数部16将修订操作次数更新而进行+1(步骤ST212),返回进行用户的识别词汇理解度判定的步骤ST204的处理。在未操作修订按键时(步骤ST211“否”),控制部11判定是否必须继续呈现引导(步骤ST213)。另外,此处说明了通过按键按下进行修订操作的情况,但在修订操作被定义为其他方法时,控制部11监视该操作。
在有继续引导时(步骤ST213“是”),车载用声音识别装置1返回初始化超时次数的步骤ST202。若没有继续引导(步骤ST213“否”),则结束声音识别处理。
根据上述的实施方式1,是基于声音识别处理中的超时次数或者修订次数、或者这两者,判定用户的识别词汇理解度,而变更引导,从而可以呈现用户能够理解可声音识别的词汇的引导。
实施方式2
在上述的实施方式1中,是基于声音识别处理中的超时次数和修订次数、或者这两者,判定用户的识别词汇理解度,但在下面说明的实施方式2中,按键按下判定部22监视遥控器按键按下时的按压力或者按下时间、或者这两者,根据其按压力或者按下时间、或者这两者,对修订次数的计数加权,使其反映判定的识别词汇理解度。
例如在该方法中,按键按下判定部22在用户使劲按下按键时,进行加权,使判定为理解度较低,识别词汇理解度判定部20考虑其权重,判定理解度,变更引导。关于按下时间也一样。此时,识别词汇理解度判定部20与实施方式1一样,参照图7所示的储存有识别词汇理解度判定信息的数据表。下面,参照图2所示的基本动作、以及图3所示的流程图,详细说明实施方式2所涉及的车载用声音识别装置的动作。
图2所示的基本动作的从步骤ST201到步骤ST211的处理与实施方式1一样。车载用声音识别装置1在步骤ST211的处理中,在判定修订按键被按下时(步骤ST211“是”),执行图3所示的步骤ST214以后的处理。
图3的流程图中,在步骤ST214中,按键按下判定部22判定用户按下配置在遥控器/触摸面板2上的修订按键时的按下压力(强度)。按下压力可以由安装在修订按键下的、例如压电传感器获取。此处,修订操作次数计数部16例如根据按键按下的强度对修订操作次数加权进行计数,使得判定为使劲按下修订按键时,修订操作次数+2;较轻按下时,修订操作次数+1(步骤ST215),返回进行识别词汇理解度判定处理的图2所示的基本动作的步骤ST204的处理。另外,按键按下的强弱的判定是按键按下判定部22通过与标准按下压力进行比较而判定的。
根据上述的实施方式2,识别词汇理解度判定部20使得从按键按下判定部22输出的按键按压力反映在用户对引导的识别词汇理解度的判定中,从而可以对用户呈现适当的引导。
实施方式3
在上述的实施方式1、2中,识别词汇理解度判定部20是基于声音识别时的超时次数和修订次数、或者这两者,判定用户的识别词汇理解度,但在下面说明的实施方式3中,还考虑由行驶状况判定部17判定的车辆的行驶状况,进行用户的识别词汇理解度判定,对用户呈现适当的引导。
例如,在停车中出现超时的时候,识别词汇理解度判定部20判定为,尽管停车中与行驶中相比噪声较小,易于听懂引导,但由于出现超时,因此用户没有理解可识别的词汇,据此,使引导变更。行驶状况的判定使用分别由GPS6或G传感器7获取的车辆的目前位置、加速度信息、或者通过车内LAN8而获取的车速、转向角等信息。
下面,参照图2所示的基本动作以及图4所示的流程图,详细说明实施方式3所涉及的车载用声音识别装置的动作。
图2中作为基本动作表示的从步骤ST201到ST206的处理与上述的实施方式1、2一样。车载用声音识别装置1在步骤ST206中向用户呈现引导后,前进至图4的流程图所示的步骤ST216的处理。在步骤ST216中,行驶状况判定部17监视GPS6或G传感器7等的信息,判定车辆是行驶中还是停车中,向控制部11提供,返回执行图2所示的声音识别处理的基本动作步骤ST207的处理。
此处,识别词汇理解度判定部20例如内置图8所示的识别词汇理解度判定信息作为列表数据。因此,识别词汇理解度判定部20在超时或修订操作后对用户进行引导时,通过参照上述的数据表,根据超时次数或者修订操作次数或者这两者、以及行驶状况,判定用户的识别词汇理解度(步骤ST204)。
例如,在超时次数为1次、修订操作次数为0次、行驶状况为停车中时,根据图8所示的数据表,理解度成为“4”。此处,考虑到尽管处于停车中但用户不能发声,将用户的识别词汇的理解度设定得较低。在步骤ST205中,基于在步骤ST204中判定的理解度,引导内容决定部21根据用户的理解度来变更引导的内容。此处,由于在步骤ST204中判定的识别词汇理解度比较低,因此变更引导内容,使引导更易于理解地呈现。关于引导内容会后述。
根据上述的实施方式3,识别词汇理解度判定部20使得从行驶状况判定部17输出的车辆的行驶状况反映在用户对声音引导的识别词汇理解度的判定中,从而可以呈现与行驶状态相适应的引导。
实施方式4
下面说明的实施方式4中包括判定用户的驾驶状态的驾驶操作状态判定部18,在声音识别时进行超时或修订操作的情况下,识别词汇理解度判定部20考虑驾驶状况,进行识别词汇理解度判定。
例如,在为了使车辆后退(倒车)而超时的时候,识别词汇理解度判定部20考虑后退驾驶时发出声音比较困难,因此将用户的理解度设定为普通(不低),进行引导。下面,参照图2所示的基本动作以及图5所示的流程图,详细说明实施方式4所涉及的车载用声音识别装置的动作。
图2中作为基本动作表示的从步骤ST201到ST206的处理与上述的实施方式1、2、3一样。车载用声音识别装置1在步骤ST206中向用户呈现引导后,前进至图5所示的步骤ST217的处理。
在步骤ST217中,驾驶操作状态判定部18获取作为驾驶的操作状态的关于车辆的倒车信息(是否使车辆后退)或方向盘的转向角的信息等。另外,驾驶操作状态假设利用的是可通过车内LAN8等获取的车速等的信息。驾驶操作状态判定部18在步骤ST217中获取驾驶操作状态后,返回图2所示的基本动作的步骤ST207的处理。
此处,识别词汇理解度判定部20例如内置图9所示的识别词汇理解度判定信息作为数据表。然后,在超时或修订操作后对用户进行引导时,在步骤ST204中,识别词汇理解度判定单元20根据超时次数或者修订操作次数或者这两者、以及驾驶操作状态,判定用户的识别词汇理解度。例如,超时次数为1次、修订操作次数为0次、驾驶操作状态表示倒车,方向盘大幅旋转(转向角大)时,根据图9所示的数据表,识别词汇理解度为“10”。此处,虽然发生超时,但考虑到用户使车后退,精力集中在操纵方向盘上,将理解度设定得比较高。
在步骤ST205中,基于在步骤ST204中判定的识别词汇理解度,引导内容决定部21根据用户的识别词汇理解度来变更引导的内容。例如,由于在步骤ST204中判定的理解度比较高,因此不进行使引导易于理解的处理。
根据上述的实施方式4,识别词汇理解度判定部20使得从驾驶操作状态判定部18输出的车辆的驾驶操作状态反映在用户对引导的识别词汇理解度的判定中,从而可以进行与驾驶操作状态相适应的引导。
实施方式5
在下面说明的实施方式5中,例如还包括通过由设置在方向盘等的传感器类检测的信号、判定用户的心理状态的用户状态判定部19,在声音识别时超时或修订操作的情况下,识别词汇理解度判定部20考虑用户的状态,判定理解度。
识别词汇理解度判定部20例如在心跳数上升时进行不习惯声音操作等的判定,用户的识别词汇理解度设为较低,使引导变更。此处,用户的状态考虑监测出汗、心跳数、视线、或者利用用户声音输入时的语调。下面,参照图2所示的基本动作以及图6所示的流程图,详细说明实施方式5所涉及的车载用声音识别装置的动作。
图2中作为基本动作表示的从步骤ST201到ST206的处理与上述的实施方式1、2一样。车载用声音识别装置1在步骤ST206中向用户呈现引导后,前进至图6所示的步骤ST218的处理。
在步骤ST218中,用户状态判定部19通过监测用户的出汗或心跳数或视线,获取用户的心理状态。然后,声音识别处理部12对在步骤ST219中对为了引导而输入的声音进行识别处理,前进至步骤ST220的处理。在步骤ST220中,用户状态判定部19获取用户进行声音输入时的语调,返回图2的基本动作步骤ST208的处理。
此处,识别词汇理解度判定部20内置图10所示的识别词汇理解度判定信息作为数据表。然后,在超时或修订操作后对用户进行引导时,在步骤ST204中,识别词汇理解度判定单元20根据超时次数或者修订操作次数或者这两者、以及用户状态,判定用户的识别词汇理解度。
例如,在判定为超时次数为1次、修订操作次数为0次、作为用户状态有出汗、心跳数较高、视线不确定、语调较弱时,通过参照上述的数据表,理解度为“1”。此处,超时虽然是1次,但认为用户没有理解发声词汇而处于迷惑的状态,将理解度设定得较低。在步骤ST205中,基于在步骤ST204中判定的识别词汇理解度,引导内容决定部21根据用户的理解度来变更引导的内容。此处,由于在步骤ST204中判定的理解度比较低,因此变更引导内容,使引导更易于理解地呈现。关于引导的变化会后述。
根据上述的实施方式5,识别词汇理解度判定部20使得从用户状态判定部19输出的关于用户的心理状态的信息反映在用户对引导的识别词汇理解度的判定中,从而可以进行与用户的心理状态相适应的引导。
下面,说明上述的实施方式1~5中的引导的变更方法。引导内容的变更是引导内容决定部21基于由识别词汇理解度判定部20输出的用户的识别词汇理解度而判定的。变更的引导内容经由控制部11利用声音输出部13(扬声器5)或者画面输出部14(显示监视器4)以声音或者图像输出。
引导内容决定部21在用户的识别词汇理解度较低时,详细设定引导,使用户可以掌握发声词汇。关于详细的引导,可以使用预先准备多条消息进行切换、或者动态生成等方法。作为变更方法的例子,例如在图2所示的基本动作的步骤ST206中,声音输出部13或者画面输出部14呈现“请
Figure G200780048703XD00101
说出接下去 地址”,但由于超时或修订操作而返回步骤ST204的处理,在步骤ST204中判定为用户的理解度较低时,该引导会变更为“请说出市区町村或者门牌号码”。再进一步,由于超时或误识别所导致的修订操作而再次返回步骤ST204的处理,在步骤ST204中判定为用户的理解度较低时,考虑声音输出部13或者画面输出部14会呈现“请说出三田市三轮2丁目等”。
另外,在用户的识别词汇理解度较低时,考虑引导内容决定部21将引导的速度设定为比较慢的级别,使用户掌握发声词汇。此时,引导内容决定部21预先设定引导的速度的级别,在图2的基本动作的步骤ST205中判定为理解度较低时,引导内容决定部21需要重新设定速度的级别。
另外,在用户的识别词汇理解度较低时,通过在引导开始时用声音或者图像或者这两者提示注意,进行处理以将用户的注意力引向引导,可以使用户从该引导内容掌握发声词汇。这是引导内容决定部21预先在引导开始时准备鸣叫音(蜂鸣声)等,在图2所示的基本动作的步骤ST205中,只在发出鸣叫音的情况下进行设定。此时,在引导开始时的鸣叫音也可以准备多种,根据识别词汇理解度而分别使用。
另外,在用户的理解度较低时,还考虑将表示引导内容中的可发声词汇的部分的音量增大,使用户掌握发声词汇。此时,引导内容决定部21预先具有表示引导内容的发声词汇的部分作为信息,另外,可以设定音量的级别。
在图2所示的基本动作的步骤ST205中,需要利用引导内容决定部21重新设定引导中可发声部分的声音的级别(设定使音量增大;或者可发声的词汇的音量不变,除此之外的部分的音量降低)。
另外,在用户的识别词汇理解度较低时,也可以变更图像显示所进行的引导的显示形态。例如,将引导中表示可发声的词汇的部分的字符增大、使其为粗体字、改变颜色来强调显示等。通过这样控制画面输出部14,使图像显示容易看清,从而使用户掌握发声词汇。另外,画面输出部14也可以预先准备显示形态变更后的字符串,或者动态地生成字符串。
作为变更方法的例子,在图2所示的基本动作的步骤ST206中,是在画面上显示“请说出地址或者设施”,但由于超时或修订操作而返回步骤ST204的处理,在步骤ST204中判定为用户的理解度较低时,也可以考虑画面输出部14将引导显示的“请说出地址或者设施”进行强调显示。
另外,在用户的理解度较低时,也可以通过将上述的引导变更方法组合,使用户掌握发声词汇。作为变更方法的例子,在图2的基本动作的步骤ST206中,是呈现“请在哔的一声后说话”,但由于超时或修订操作而返回步骤ST204的处理,在步骤ST204中判定为用户的理解度较低时,使得用声音进行的引导成为蜂鸣声+“请说出地址或者设施”。另外,也可以将图像显示变更为“请说出地址或者设施”。
如以上说明所示,本发明的实施方式1~5所涉及的车载用声音识别装置1中,识别词汇理解度判定部20是根据在声音识别部12进行的声音识别处理中被监视的、至少对用户操作的超时次数或者修订次数、或者这两者,判定用户对引导的识别词汇理解度,控制引导内容决定部21,变更引导信息输出部(声音输出部13或者画面输出部14)所进行的引导,此时,根据用户的识别词汇理解度,变更声音或者图像显示所进行的引导,或者变更引导声音的速度,或者变更引导的显示形态,从而可以对用户进行适当的引导。
另外,通过在引导开始时以蜂鸣声告知、或者将表示来自车载用声音识别装置1的引导所包含的发声词汇的部分的音量增大,从而可以对由于没听见或者没听懂引导而识别词汇理解度较低的用户唤起对来自车载用声音识别装置1的引导的注意,且可以进行适当的引导。
另外,构成上述的车载用声音识别装置1的各方框9~21分别具有的功能,是通过控制部11读出储存在车载用声音识别装置1中内置的未图示的存储器的各程序并执行而达到的,不是仅仅指在控制部11内实体上与其他方框区别开而内置的模块,只是为了简化说明而分为各处理部进行表现的。另外,上述的各方框的功能可以都通过软件实现,或者其至少一部分由硬件实现。另外,此时,图6~图10所示的数据表配置在上述的未图示的存储器中,是预先录入的。
工业上的实用性
如上所述,本发明所涉及的车载用声音识别装置,由于通过使声音引导内容变化,使用户易于听懂引导,能够掌握可发声的词汇,所以适用于车载导航系统等。

Claims (10)

1.一种车载用声音识别装置,其特征在于,包括:
获取输入声音的声音输入部;
对所述获取的输入声音进行声音识别的声音识别部;
对声音操作中的超时次数进行计数的超时次数计数部;
对声音操作中的订正操作次数进行计数的订正操作次数计数部;
识别词汇理解度判定部,该识别词汇理解度判定部根据由所述超时次数计数部进行计数得到的超时次数、或者由所述订正操作次数计数部进行计数得到的订正操作次数、或者超时次数和订正操作次数这两者,判定用户的识别词汇理解度;
引导内容决定部,该引导内容决定部根据所述识别词汇理解度判定部进行判定得到的识别词汇理解度,决定引导内容,当由于根据所决定的内容而输出引导之后的超时次数或者订正操作次数增加而导致识别词汇理解度降低时,通过变更所决定的所述引导内容,从而决定新的引导内容;以及
引导信息输出部,该引导信息输出部输出基于所述引导内容决定部所决定的内容的引导。
2.如权利要求1所述的车载用声音识别装置,其特征在于,包括按键按下判定部,该按键按下判定部判定通过按键操作来进行修订输入时的按键按压力,
所述识别词汇理解度判定部使得从所述按键按下判定部输出的按键按压力、或者按下时间反映在对所述识别词汇理解度的判定中。
3.如权利要求1所述的车载用声音识别装置,其特征在于,包括行驶状况判定部,该行驶状况判定部利用由传感器检测的信号来判定车辆的行驶状况,
所述识别词汇理解度判定部使得从所述行驶状况判定部输出的车辆的行驶状况反映在对所述识别词汇理解度的判定中。
4.如权利要求1所述的车载用声音识别装置,其特征在于,包括驾驶操作状态判定部,该驾驶操作状态判定部利用由传感器检测的信号来判定车辆的驾驶操作状态,
所述识别词汇理解度判定部使得从所述驾驶操作状态判定部输出的车辆的驾驶操作状态反映在对所述识别词汇理解度的判定中。
5.如权利要求1所述的车载用声音识别装置,其特征在于,包括用户状态判定部,该用户状态判定部利用由传感器检测的信号来判定用户的心理状态,
所述识别词汇理解度判定部使得从所述用户状态判定部输出的用户的心理状态反映在对所述识别词汇理解度的判定中。
6.如权利要求1所述的车载用声音识别装置,其特征在于,
所述引导信息输出部根据由所述识别词汇理解度判定部判定的用户的识别词汇理解度,变更所述引导的内容。
7.如权利要求1所述的车载用声音识别装置,其特征在于,
所述引导信息输出部根据由所述识别词汇理解度判定部判定的用户的识别词汇理解度,使所述引导的速度可变。
8.如权利要求1所述的车载用声音识别装置,其特征在于,
所述引导信息输出部根据由所述识别词汇理解度判定部判定的用户的识别词汇理解度,在所述引导开始时通过声音或者显示、或者声音和显示进行告知。
9.如权利要求1所述的车载用声音识别装置,其特征在于,
所述引导信息输出部基于由所述识别词汇理解度判定部判定的用户的识别词汇理解度,使表示所述引导所包含的发声词汇的部分的音量可变。
10.如权利要求1所述的车载用声音识别装置,其特征在于,
所述引导信息输出部基于由所述识别词汇理解度判定部判定的用户的识别词汇理解度,使画面显示的显示形态变化。
CN200780048703XA 2006-12-28 2007-09-27 车载用声音识别装置 Active CN101589428B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP355785/2006 2006-12-28
JP2006355785 2006-12-28
PCT/JP2007/068851 WO2008084575A1 (ja) 2006-12-28 2007-09-27 車載用音声認識装置

Publications (2)

Publication Number Publication Date
CN101589428A CN101589428A (zh) 2009-11-25
CN101589428B true CN101589428B (zh) 2012-07-04

Family

ID=39608473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780048703XA Active CN101589428B (zh) 2006-12-28 2007-09-27 车载用声音识别装置

Country Status (5)

Country Link
US (1) US8315868B2 (zh)
JP (2) JP5137853B2 (zh)
CN (1) CN101589428B (zh)
DE (1) DE112007003024B4 (zh)
WO (1) WO2008084575A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180060430A1 (en) * 2009-05-27 2018-03-01 Hon Hai Precision Industry Co., Ltd. Voice command processing method and electronic device utilizing the same
JP5161188B2 (ja) * 2009-10-16 2013-03-13 株式会社コナミデジタルエンタテインメント 情報処理装置、処理方法、ならびに、プログラム
JP5569365B2 (ja) * 2010-11-30 2014-08-13 アイシン・エィ・ダブリュ株式会社 案内装置、案内方法、及び案内プログラム
WO2013038440A1 (ja) * 2011-09-13 2013-03-21 三菱電機株式会社 ナビゲーション装置
US9256396B2 (en) * 2011-10-10 2016-02-09 Microsoft Technology Licensing, Llc Speech recognition for context switching
WO2014006690A1 (ja) * 2012-07-03 2014-01-09 三菱電機株式会社 音声認識装置
KR102056177B1 (ko) * 2013-02-22 2020-01-22 삼성전자 주식회사 음성 대화 서비스 제공 방법 및 이동 단말
US20160092160A1 (en) * 2014-09-26 2016-03-31 Intel Corporation User adaptive interfaces
WO2017179101A1 (ja) 2016-04-11 2017-10-19 三菱電機株式会社 応答生成装置、対話制御システムおよび応答生成方法
US10205890B2 (en) * 2016-07-25 2019-02-12 Ford Global Technologies, Llc Systems, methods, and devices for rendering in-vehicle media content based on vehicle sensor data
WO2018067639A1 (en) 2016-10-05 2018-04-12 Gentex Corporation Vehicle-based remote control system and method
CN106782558A (zh) * 2016-12-27 2017-05-31 重庆峰创科技有限公司 一种带有图像理解的智能语音车载交互系统
US10708725B2 (en) * 2017-02-03 2020-07-07 T-Mobile Usa, Inc. Automated text-to-speech conversion, such as driving mode voice memo
JP6988438B2 (ja) * 2017-12-20 2022-01-05 トヨタ自動車株式会社 車載制御装置、制御装置、制御方法、制御プログラム、及び発話応答方法
US11150923B2 (en) 2019-09-16 2021-10-19 Samsung Electronics Co., Ltd. Electronic apparatus and method for providing manual thereof
CN110706700B (zh) * 2019-09-29 2022-06-14 深圳市元征科技股份有限公司 一种车内骚扰预防报警方法及装置、服务器、存储介质
CN112509585A (zh) * 2020-12-22 2021-03-16 北京百度网讯科技有限公司 车载设备的语音处理方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1573730A (zh) * 2003-05-26 2005-02-02 日产自动车株式会社 车用信息提供方法和车用信息提供设备
CN1811341A (zh) * 2005-01-27 2006-08-02 乐金电子(惠州)有限公司 车载导航装置及其工作方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09510313A (ja) * 1995-01-04 1997-10-14 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 一般消費製品用の音声作動制御システム
JPH1020884A (ja) 1996-07-04 1998-01-23 Nec Corp 音声対話装置
JP2000194386A (ja) * 1998-12-24 2000-07-14 Omron Corp 音声認識応答装置及び方法
JP2001022370A (ja) 1999-07-12 2001-01-26 Fujitsu Ten Ltd 音声案内装置
JP2001125591A (ja) * 1999-10-27 2001-05-11 Fujitsu Ten Ltd 音声対話システム
JP4320880B2 (ja) * 1999-12-08 2009-08-26 株式会社デンソー 音声認識装置及び車載ナビゲーションシステム
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
WO2004023455A2 (en) * 2002-09-06 2004-03-18 Voice Signal Technologies, Inc. Methods, systems, and programming for performing speech recognition
JP2003108191A (ja) * 2001-10-01 2003-04-11 Toyota Central Res & Dev Lab Inc 音声対話装置
EP1502079A2 (en) * 2002-04-30 2005-02-02 Telmap Ltd. Dynamic navigation system
JP4304952B2 (ja) * 2002-10-07 2009-07-29 三菱電機株式会社 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
JP2005077372A (ja) * 2003-09-03 2005-03-24 Denso Corp 音声認識装置、ナビゲーション装置及びプログラム
JP2005084589A (ja) * 2003-09-11 2005-03-31 Nissan Motor Co Ltd 音声認識装置
JP2005084590A (ja) * 2003-09-11 2005-03-31 Nissan Motor Co Ltd 音声認識装置
JP4634156B2 (ja) * 2005-01-07 2011-02-16 パナソニック株式会社 音声対話方法および音声対話装置
US20060235694A1 (en) * 2005-04-14 2006-10-19 International Business Machines Corporation Integrating conversational speech into Web browsers
JP4560463B2 (ja) * 2005-09-13 2010-10-13 キヤノン株式会社 データ処理装置、データ処理方法及びコンピュータプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1573730A (zh) * 2003-05-26 2005-02-02 日产自动车株式会社 车用信息提供方法和车用信息提供设备
CN1811341A (zh) * 2005-01-27 2006-08-02 乐金电子(惠州)有限公司 车载导航装置及其工作方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JP特开2003-108191A 2003.04.11
JP特开2005-84589A 2005.03.31
JP特开2005-84590A 2005.03.31
JP特开2006-189730A 2006.07.20
JP特开平10-20884A 1998.01.23

Also Published As

Publication number Publication date
JP2012027487A (ja) 2012-02-09
JP5137853B2 (ja) 2013-02-06
CN101589428A (zh) 2009-11-25
DE112007003024T5 (de) 2009-10-08
WO2008084575A1 (ja) 2008-07-17
DE112007003024B4 (de) 2013-09-12
US20100049515A1 (en) 2010-02-25
US8315868B2 (en) 2012-11-20
JPWO2008084575A1 (ja) 2010-04-30

Similar Documents

Publication Publication Date Title
CN101589428B (zh) 车载用声音识别装置
JP3919210B2 (ja) 音声入力案内方法及び装置
US7617108B2 (en) Vehicle mounted control apparatus
US8818816B2 (en) Voice recognition device
JP4304952B2 (ja) 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
JP5925313B2 (ja) 音声認識装置
KR101999182B1 (ko) 사용자 단말 장치 및 그의 제어 방법
CN106796786A (zh) 语音识别系统
KR20060070280A (ko) 손 제스처 인식을 이용한 사용자 인터페이스 장치 및 그방법
JP4715805B2 (ja) 車載情報検索装置
US20030065515A1 (en) Information processing system and method operable with voice input command
CN104603871B (zh) 用于运行车辆用的语音控制的信息系统的方法和设备
KR20210032875A (ko) 음성 정보 처리 방법, 장치, 프로그램 및 저장 매체
KR101755308B1 (ko) 음성 인식 모듈, 그를 가지는 단말기 및 차량
CN110956967A (zh) 基于声纹识别的车辆控制方法与车辆
JP2004170708A (ja) ウィンドウ表示システム、ウィンドウ表示装置、ウィンドウ表示方法およびプログラム
JP2000029486A (ja) 音声認識システムおよび方法
JP5446540B2 (ja) 情報検索装置、制御方法及びプログラム
CN113593556A (zh) 一种车载语音操作系统人机互动方法及装置
US20070281627A1 (en) Media-assisted application for a computing device
JPH11325945A (ja) 車載用ナビゲーション装置
JP2006178898A (ja) 地点検索装置
JP4412102B2 (ja) ナビゲーション装置
JP2020030739A5 (zh)
US11929081B2 (en) Electronic apparatus and controlling method thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210308

Address after: Delaware, USA

Patentee after: NexGen Control Systems Inc.

Address before: Tokyo, Japan

Patentee before: Mitsubishi Electric Corp.