CN103403798B

CN103403798B - 声音识别装置及导航装置

Info

Publication number: CN103403798B
Application number: CN201180068906.1A
Authority: CN
Inventors: 丸田裕三
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2011-04-08
Filing date: 2011-04-08
Publication date: 2016-09-28
Anticipated expiration: 2031-04-08
Also published as: CN103403798A; JPWO2012137263A1; US20130253933A1; US9230538B2; WO2012137263A1; DE112011105136B4; DE112011105136T5; JP5709980B2

Abstract

一种声音识别装置包括：车辆状态检测部（7），该车辆状态检测部（7）对搭载声音识别装置（100）的车辆的车辆状态进行检测；识别参数设定部（10），该识别参数设定部（10）对声响数据匹配部（5）识别被输入到麦克风（1）中的声音时的识别参数进行设定，其中，所述声响数据匹配部（5）将经过音响分析部（3）转换后的音响特征量与保存在识别词典保存部（4）中的识别词典进行对照，从而对输入到麦克风（1）中的声音进行识别；以及控制部（9），该控制部（9）在由车辆状态检测部（7）所检测出的车辆状态满足规定条件时，指示识别参数设定部（10）来改变识别参数。

Description

声音识别装置及导航装置

技术领域

本发明涉及一种根据使用环境来进行声音识别的声音识别装置以及搭载有该装置的导航装置。

背景技术

以往提出有根据声音识别装置的使用环境来对用于声音识别的阈值等进行调整的技术。例如，在专利文献1中提出了如下的声音识别装置：将车辆的当前车速与基准值相比较，来判断周围是处于安静环境下还是处于噪声环境下，并基于该判断结果来改变用于在安静环境下及噪声环境下对声音的区间进行检测的阈值（检测水平），将噪声环境下的阈值设定得比安静环境下的阈值要大，由此解决了对音频声音的残差分量的水平变动或微小的声音等反应敏感而导致声音区间的误检测的问题。

现有技术文献

专利文献

专利文献1：日本专利特开2002－41073号公报

发明内容

发明所要解决的技术问题

然而，在上述专利文献1中，仅基于说话人的声音以及噪声的信息来设定用于对声音的区间进行检测的阈值，因此存在如下问题：阈值的设定未必适用于声音识别装置的使用环境，从而无法得到正确的识别结果。

本发明为了解决上述问题而完成，其目的在于，得到一种将表示说话人的声音及噪声以外的声音识别装置的使用环境的信息也考虑在内、以对用于声音识别的阈值进行调整的声音识别装置。

解决技术问题所采用的技术方案

本发明所涉及的声音识别装置包括：车辆状态检测部，该车辆状态检测部对搭载该声音识别装置的车辆的车辆状态进行检测；音频输出检测部，该音频输出检测部对从音频装置输出的声音信号的音量进行检测，所述音频装置设置在搭载有声音识别装置的车辆内；增益设定部，该增益设定部对集音部的声音获取增益进行设定；识别参数设定部，该识别参数设定部对声响对照部识别被输入到集音部中的声音时的识别参数进行设定，其中，所述声响对照部将经过声响分析部转换后的声响特征量与保存在识别词典保存部中的识别词典进行对照，从而对输入到集音部中的声音进行识别；以及控制部，该控制部在由车辆状态检测部所检测出的车辆状态以及由所述音频输出检测部所检测出的声音信号的音量满足规定条件时，指示识别参数设定部来改变识别参数。

发明效果

根据本发明，能够根据用户的驾驶状况来设定用于声音识别的阈值，从而能够提高声音识别性能。

附图说明

图1是表示实施方式1所涉及的声音识别装置的结构的框图。

图2是表示实施方式1所涉及的声音识别装置的参数表的一个示例的图。

图3是表示实施方式1所涉及的声音识别装置的动作的流程图。

图4是表示实施方式1所涉及的声音识别装置的数据获取处理以及识别参数设定处理的说明图。

图5是表示实施方式2所涉及的声音识别装置的结构的框图。

图6是表示实施方式2所涉及的声音识别装置的动作的流程图。

图7是表示实施方式3所涉及的声音识别装置的结构的框图。

图8是表示实施方式3所涉及的声音识别装置的动作的流程图。

图9是表示使用了实施方式3所涉及的声音识别装置的导航装置的结构的框图。

实施方式

下面，为了对本发明进行更加详细的说明，参照附图对本发明的实施方式进行说明。

实施方式1

图1是表示本发明的实施方式1所涉及的声音识别装置的结构的框图。

实施方式1的声音识别装置100包括：麦克风1、声音处理部2、声响分析部3、识别词典保存部4、声响数据匹配部5、增益设定部6、车辆状态检测部7、识别参数保存部8、控制部9、以及识别参数设定部10。

麦克风1获取所输入的声音。声音处理部2将利用麦克风1所获取的模拟信号的声音转换成数字信号。声响分析部3对经声音处理部2转换成数字信号的声音信号进行分析，并将声响特征转换成以时间序列表示的声响特征数据。识别词典保存部4保存有将识别词汇与声响特征数据相对应的识别词典。声响数据匹配部5将声响特征数据与识别词典相对照，从而输出最确切的声音识别结果。增益设定部6对输入到麦克风1中的音量进行调整。车辆状态检测部7与车辆网络（未图示）相连，获取车辆的车速或方向盘旋转角度等车辆信息。另外，车辆状态检测部7包括保存所获取到的车辆信息的存储部7a。识别参数保存部8保存有参数表，该参数表对识别参数的种类和值进行定义。此外，在后面对参数表进行详细叙述。

控制部9参照由车辆状态检测部7所获取到的车辆信息，来判断车辆处于正常运行状态还是异常运行状态。这里，正常运行状态是指车速稳定、未进行紧急的方向盘操作等的状态。具体而言，是指以固定的速度在高速公路上行驶的情况等。另一方面，异常运行状态是指频繁地对车辆进行加减速，或者大幅度地旋转方向盘的情况等。具体而言，是指车辆进入路口、左转或右转的情况等。控制部9保存有对车辆信息、例如车速或方向盘旋转角度的阈值进行设定的判断表，基于由车辆状态检测部7所获取到的车辆信息是否在阈值以上来判断车辆处于正常运行状态还是异常运行状态。另外，控制部9参照保存在识别参数保存部8中的参数表来获取与车辆的运行状态相对应的参数值。

识别参数设定部10将由控制部9所获取到的参数值设定到声响数据匹配部5中。作为所设定的识别参数，例如对用于检测说话声音开始的声音功率阈值、或用于检测说话结束的无声时间（超时时间）等进行设定。

下面，对识别参数进行详细的说明。

识别参数是为了提高声音识别的识别精度而设定或更改的数值或数值的组合。作为识别参数设定部10对声响数据匹配部5所设定的识别参数，例如有用于检测说话声音开始的声音功率阈值、或用于检测说话结束的无声时间（超时时间）、在声音识别处理过程中应保持的最大单词数、通过语言模型和声响模型来对各得分的平衡进行调整的加权数等。

参数表中，对于上述声音功率检测阈值、超时时间以及麦克风增益值等各识别参数，保存有车辆处于正常运行状态时所设定的值、以及车辆处于异常运行状态时所设定的值。

在使用图2的参数表的情况下，例如在控制部9中判断为车辆处于正常运行状态的情况下，将声音功率检测阈值设定为40dB，在判断为车辆处于异常运行状态的情况下，将声音功率检测阈值设定为60dB。另外，在车辆处于正常运行状态的情况下，将超时时间设定为3秒这一较短的值，在车辆处于异常运行状态的情况下，将超时时间设定为8秒等较长的值。此外，可以适当地对图2所示的识别参数的种类以及各参数值进行改变。

接下来，参照图3及图4，对声音识别装置100的动作进行说明。图3是表示实施方式1所涉及的声音识别装置的动作的流程图，图4是表示车辆信息的获取以及超时时间的说明图。此外，在图3的流程图中，示出了以下结构：即，对作为车辆信息而获取到的车速的时间变化进行分析，在判断为突然起动或突然加速较多的情况下，判断为用户正专注于驾驶，将向麦克风1输入声音的超时时间设定得较长。

车辆状态检测部7利用车内网络持续获得车辆的车速，并将所获取到的车速信息存储到存储部7a中（步骤ST1）。图4中的A表示在步骤ST1中获取车辆的车速。

另一方面，控制部9经由操作输入部（未图示）等来判断用户是否输入了声音识别开始指示（步骤ST2）。在未输入声音识别开始指示的情况下（步骤ＳＴ2：否），返回到步骤ST1的处理。另一方面，在输入了声音识别开始指示的情况下（步骤ＳＴ2：是），控制部9从存储在车辆状态检测部7的存储部7ａ中的车速信息中获取规定时间内的车速信息，并判断所获取到的车速信息的变化是否在阈值以上（步骤ＳＴ3）。这里，利用图4对由控制部9所获取到的规定时间内的车辆信息进行说明。图4中，地点Ｏ是输入声音识别开始指示的地点，期间Ｂ是从地点Ｏ倒退规定时间（例如5秒）后的期间，获取该期间Ｂ的车速信息，用于判断车速信息的变化是否在阈值以上。

在车速的变化在阈值以上时（步骤ST3：是），判断为车辆处于突然起动、突然停止、或突然加速的异常运行状态，参照参数表来获取处于异常运行状态时的超时时间的参数值，并通知识别参数设定部10（步骤ST4）。识别参数设定部10将步骤ST4中通知到的处于异常运行状态下的参数值设定为声响数据匹配部5的超时时间（步骤ST5）。步骤ST5的超时时间是图4中的C，预测用户正专注于驾驶操作、到发声之前需要一定的时间，并将超时时间设定为较长的8秒。

在车速的变化小于阈值的情况下（步骤ST3：否），控制部9进一步获取存储在车辆状态检测部7的存储部7ａ中的车速信息，并判断车速的变化小于阈值的状态是否持续了规定时间以上（步骤ST6）。在步骤ST6中，在对车速的变化小于阈值的状态持续了规定时间以上的判断中，使用图4的期间D的车速信息。在车速的变化小于阈值的状态未持续规定时间以上时（步骤ST6：否），判断为车辆还未恢复到正常运行状态，并前进至步骤ST4。

另一方面，在车速的变化小于阈值的状态持续了规定时间以上时（步骤ST6：是），判断为车辆恢复到正常运行状态，控制部9参照参数表来获取处于正常运行状态时的超时时间的参数值，并通知识别参数设定部10（步骤ST7）。识别参数设定部10将步骤ST7中所通知的处于正常运行状态下的参数值设定为声响数据匹配部5的超时时间（步骤ST8）。步骤ST8的超时时间是图4中的期间E，预测用户将在短时间内发声，并将超时时间设定为较短的3秒。

接下来，麦克风1获取由用户发出的命令所指定的声音（步骤ST9）。声音处理部2将在步骤ST9中所获取到的声音进行数字化（步骤ST10），声响分析部3对在步骤ST10中经数字化后的声音信号进行分析，并将该声音信号转换成声响特征数据（步骤ST11）。声响数据匹配部5使用在步骤ST5或步骤ST8中所设定的参数值，并将在步骤ST11中经转换后的声响特征数据与识别词典进行对照，来计算出最确切的识别结果，作为声音识别结果来输出（步骤ST12），由此结束处理。

此外，在图3的流程图中示出了对声响数据匹配部5设定超时时间的结构，但也可以采用以下结构：即，在上述结构的基础上，使识别参数设定部10输出停止信号，以指示声音处理部2在所设定的超时时间内停止获取模拟信号，从而停止获取声音信号。由此，能够减小声音识别装置100的功耗。

如上所述，根据本实施方式1，采用包括识别参数保存部8以及控制部9的结构，因此，能根据用户的运行状况来改变超时时间，即使在用户正专注于驾驶操作而要一定时间后才会说话的情况下，也能够不超时地进行声音识别处理，其中，所述参数保存部8保存有根据车辆处于正常运行状态还是异常运行状态而设定有不同的设定值的参数表，所述控制部9在车速的时间变化在阈值以上时，判断为车辆处于异常运行状态，从参数表中获取异常运行状态下的声音识别的超时时间，并通过识别参数设定部10对声响数据匹配部5进行设定。

另外，根据该实施方式1，由于具有以下结构：即，在车速的变化小于阈值的状态持续了规定时间以上时，控制部9判断为车辆处于正常运行状态，并设定处于正常运行状态下的超时时间，因此，能够将在将声音识别的超时时间设定得较长时所可能产生的噪声的误检测以及误识别抑制到最小程度，从而能抑制识别性能变差。

此外，可以对上述实施方式1中示出的期间B至期间D的时间作适当改变。另外，以各期间的开始地点作为输入了声音识别开始指示的地点O进行了说明，但是也可以对该各个期间的开始地点作适当改变。

实施方式2

如今，一般在车辆内设置声音装置，在收听音频（音乐）的同时进行驾驶动作。由此，在播放音频的情况下，用户根据说话之前的音频的输出音量来改变说话声音的大小。例如，在音频的输出音量较大时，用户倾向于用更大的声音来说话。因此，在该实施方式2中，将示出以下结构：即，即使在音频的输出音量较大、用户用比通常更大的声音来说话的情况下，也能维持声音识别性能。

图5是表示本发明的实施方式2所涉及的声音识别装置的结构的框图。

图5中，包括音频输出检测部11，以替代图1所示的车辆状态检测部7。此外，在下面对与实施方式1所涉及的声音识别装置的结构要素相同或相当的部分标注与在实施方式1中使用的标号相同的标号，并省略或简化说明。

音频输出检测部11检测出来自设置在车内的音频装置（未图示）的音频的输出音量，并作为音量信息输出至控制部9。此外，作为从音频中获取音量信息的结构，可以直接从所连接的音频装置中获取音量值等信息，也可以利用不同于麦克风1的麦克风（未图示）来收集在车内所播放的音频，并计算出音量信息。另外，音频输出检测部11包括保存所获取到的音量信息的存储部11a。

控制部9参照由音频输出检测部11所检测到的音量信息，来判断车辆处于正常运行状态还是异常运行状态。该实施方式2中的正常运行状态是指音频的输出音量小于阈值、且不影响用户的说话音量的状态。另一方面，异常运行状态是指音频的输出音量在阈值以上、且影响到用户的说话音量的状态。控制部9具有对音频的输出音量的阈值进行了设定的判断表，基于由音频输出检测部11所检测到的音量信息是否在阈值以上来判断车辆处于正常运行状态还是异常运行状态。另外，控制部9参照保存在识别参数保存部8中的参数表，来获取与车辆的运行状态相对应的参数值。增益设定部6将由控制部9所获取到的参数值设定到麦克风1中。作为所设定的识别参数，例如可以是麦克风1的麦克风增益值等。

以上述实施方式1中示出的图2的参数表为例，对麦克风增益值进行说明。在判断为车辆处于正常运行状态（在音频的输出音量小于阈值时）的情况下，将麦克风增益设定为10dB，在车辆处于异常运行状态的情况下（在音频的输出音量在阈值以上时），根据刚要输入声音识别开始指示前的音频的输出音量，将麦克风增益设定为较小的值。具体而言，在先前的音频的输出音量为60dBA的情况下，将麦克风增益值设定为5dB。另外，在先前的音频的输出音量为更大的100dBA的情况下，能够判断用户的说话声会进一步变大，因此，将麦克风增益值设定为3dB。

接下来，参照图6所示的流程图对实施方式2所涉及的声音识别装置的动作进行说明。此外，对与实施方式1所涉及的声音识别装置相同的步骤标注与在图3中所使用的标号相同的标号，并省略或简化说明。

另外，在图6的流程图中，示出了以下结构：即，在检测出音频的输出音量、并且该输出音量较大时，判断用户会用较大的声音来说话，从而减小设定于增益设定部6的麦克风增益值。

另外，在用户输入声音识别开始指示之前或输入之后，为了排除音频的输出声音的影响以维持声音识别性能，一般使音频进行静音（中止），但也可以例如利用噪声消除等已知技术来进行声音识别，而不将音频设定成静音。此外，在图6的流程图中，以将音频设定成静音的情况为例进行说明。这基于以下倾向：无论是否将音频设定成静音，在先前的音频输出音量较大的情况下，用户都会用更大的声音来说话。

音频输出检测部11对车内的音频的输出音量进行检测，将所检测出的输出音量信息存储到存储部11a中（步骤ST21）。另一方面，控制部9判断是否输入了声音识别开始指示以及静音的设定指示（步骤ST22）。在未输入声音识别开始指示以及静音的设定指示的情况下（步骤ST22：否），返回到步骤ST21的处理。另一方面，在输入了声音识别开始指示以及静音设定指示的情况下（步骤ST22：是），控制部9在存储于音频输出检测部11的存储部11ａ中的输出音量中、判断出刚要输入声音识别开始指示之前的输出音量是否在阈值以上（步骤ST23）。

在刚要输入声音识别开始指示之前的输出音量在阈值以上的情况下（步骤ST23：是），判断为车辆处于异常运行状态，参照参数表来获取与刚要输入静音设定指示之前的输出音量相对应的麦克风增益值，并通知增益设定部6 （步骤ST24）。增益设定部6将步骤ST24中通知的处于异常运行状态下的参数值设定为麦克风1的麦克风增益（例如5dB）（步骤ST25）。

在刚要输入声音识别开始指示之前的输出音量小于阈值的情况下（步骤ST23：否），进一步判断输出音量小于阈值的状态是否持续了规定时间以上（步骤ST26）。在输出音量小于阈值的状态未持续规定时间以上时（步骤ST26：否），判断为用户有可能仍然在受音频的输出音量影响的状态下说话，并前进至步骤ST24的处理。

另一方面，在输出音量小于阈值的状态持续了规定时间以上时（步骤ST26：是），判断为用户在未受到音频的输出音量影响的状态下说话，控制部9参照参数表来获取处于正常运行状态下的麦克风增益值，并通知增益设定部6（步骤ST27）。增益设定部6将步骤ST27中通知的处于正常运行状态下的参数值设定为麦克风1的麦克风增益（例如10dB）（步骤ST28）。之后的处理与实施方式1中示出的步骤ST9至步骤ST12的处理相同。

此外，在上述步骤ST26中判断输出音量小于阈值的状态是否持续了规定时间以上时的判断时间是例如在实施方式1的图4中所示出的期间D、即从输入了声音识别开始指示的地点O倒退规定期间后的期间。此外，从地点O倒退的时间可以作适当改变。

如上所述，根据本实施方式2，采用包括识别参数保存部8以及控制部9的结构，因此，即使当用户在受到音频的输出音量影响的状态下说话时，也能够将增益保持为恰当的值，从而能够抑制识别性能的下降，其中，所述参数保存部8保存有根据车辆处于正常运行状态还是处于异常运行状态来设定不同的设定值的参数表，所述控制部9在音频的输出音量在阈值以上时判断为车辆处于异常运行状态，从参数表中获取异常运行状态下的麦克风增益值，并通过增益设定部6对麦克风1的麦克风增益进行设定。

此外，在上述实施方式2中，示出了基于音频的输出音量来设定麦克风增益的结构，但也可以采用以下结构：即，对从音频装置中输出的音频进行频率分析，基于具有接近于人声的频率的输出信号的输出强度来设定麦克风增益值。由此，只要对影响用户说话且具有接近于人声的频率的音频信号的信号强度进行确认即可，从而能高效地抑制识别性能的下降。

此外，在上述实施方式2中，示出了在输入声音识别开始指示的前后、将音频设定成静音的结构的示例，但在不设定成静音的情况下，也可以通过如下结构来进行声音识别处理。例如，在车辆的驾驶座附近以及副驾驶座附近设置两个集音单元（未图示）。由于音频在车内均匀地播放，因此，音频将输入到两个集音单元中。另一方面，驾驶员的说话声仅输入至驾驶座附近的集音单元。因此，将输入至两个集音单元中的声音进行差分后得到的声音作为驾驶员的说话声，以用于声音识别处理中。此外，也可以利用不同的方法来区别音频与用户的说话声音。

实施方式3

上述实施方式1及实施方式2中，示出了根据车辆状态或音频的输出音量来设定识别参数的值的结构，在本实施方式3中，示出了根据车辆状态来停止声音识别处理的结构。

图7是表示实施方式3所涉及的声音识别装置的结构的框图。图7中，包括声音识别停止处理部12，以替代图1中所示的识别参数设定部10。此外，在下面对与实施方式1所涉及的声音识别装置的结构要素相同或相当的部分标注与在实施方式1中所使用的标号相同的标号，并省略或简化说明。

车辆状态检测部7除了检测出实施方式1中示出的车速以外，还检测出方向盘的旋转角度、方向盘的旋转速度、转向灯的开启/关闭状态、以及根据使用了GPS信号的当前位置信息而得到的车辆的前进方向和进入路口等的车辆状态。此外，使用了GPS信号的当前位置信息可以在车辆状态检测部7内计算得出，也可以从外部获取得到。控制部9基于车辆状态检测部7的检测结果，判断是否处于用户应专心驾驶的情况，在判断为处于应专心驾驶的情况时，输出停止声音识别的指示。声音识别停止处理部12基于从控制部9所输入的停止声音识别的指示，对声音处理部2、声响分析部3以及声响数据匹配部5输出停止信号，从而停止与声音识别相关的处理。此外，还通过外部扬声器（未图示）或外部显示器（未图示）来发出表示停止进行声音识别的意思的声音输出或显示输出。

接下来，参照图8的流程图对实施方式3所涉及的声音识别装置100的动作进行说明。此外，在图8的流程图中，示出以下情况的示例：即，将方向盘的旋转角度作为车辆信息来进行检测，并且在该方向盘的旋转角度较大的情况下，判断用户应当专心于方向盘操作，从而停止声音识别处理。

车辆状态检测部7利用车内网络持续地获得车辆的方向盘旋转角度，并将所获取到的旋转角度信息存储到存储器部7a中（步骤ST31）。

另一方面，控制部9判断是否输入了声音识别开始指示（步骤ST32）。在未输入声音识别开始指示的情况下（步骤ST32：否），返回到步骤ST31的处理。另一方面，在输入了声音识别开始指示的情况下（步骤ST32：是），控制部9判断在存储于车辆状态检测部7的存储部7ａ中的方向盘旋转角度中、输入了声音识别开始指示的时刻的方向盘旋转角度是否在阈值以上（步骤ST33）。

在方向盘旋转角度在阈值以上的情况下（步骤ST33：是），控制部9判断为车辆正行驶于弯道等、从而应当专心于方向盘操作，并对声音识别停止处理部12输出停止声音识别的指示（步骤ST34）。声音识别停止处理部12根据在步骤ST34中输入的停止指示，对声音处理部2、声响分析部3以及声响数据匹配部5输出停止信号，从而停止与声音识别相关的处理，并且从外部的扬声器（未图示）输出例如“现在无法使用声音识别。请专心驾驶。”这样的应答消息，或者将该应答消息显示于显示器（未图示）（步骤ST35）。

在方向盘旋转角度小于阈值的情况下（步骤ST33：否），控制部9进一步获取存储在车辆状态检测部7的存储部7a中的方向盘旋转角度，并判断方向盘旋转角度小于阈值的状态是否持续了规定时间以上（步骤ST36）。在方向盘旋转角度小于阈值的车辆状态未持续规定时间以上时（步骤ST36：否），判断为还未脱离应专心于方向盘操作的状态，并前进至步骤ST34的处理。另一方面，在方向盘旋转角度小于阈值的车辆状态持续了规定时间以上时（步骤ST36：是），判断为已脱离应专心于方向盘操作的状态，并前进至步骤ST9的处理。步骤ST9之后的处理与实施方式1相同。

此外，在上述步骤ST34以及ST35中示出了停止与声音识别相关的处理、并输出应答消息的结构，但也可以采用以下结构：即，控制部9使声音识别开始指示的操作输入的接收动作无效，并进一步将表示无效的意思通知到声音识别停止处理部12，声音识别停止处理部12显示警告、或发出警报声。

另外，在上述步骤ST36中判断为方向盘旋转角度小于阈值的车辆状态是否持续了规定时间以上时的时间是例如实施方式1的图4中所示出的期间D，即从输入了声音识别开始指示的地点O倒退规定期间后的期间。此外，从地点O倒退的时间可以作适当改变。

另外，在上述图8的流程图中示出了以下结构：即，作为车辆信息对方向盘的旋转角度进行检测，在旋转角度较大的情况下，判断为车辆的前进方向有较大的变化，从而停止与声音识别相关的处理，但也可以基于方向盘的旋转角度以外的各种车辆信息来对声音识别处理的实施或停止进行控制。

具体而言，可以将方向盘的旋转速度作为车辆信息来进行检测，在从输入声音识别开始指示起倒退规定期间后的期间的旋转速度的平均速度比阈值大时，判断为车辆的前进方向有较大的变化，从而停止与声音识别相关的处理。另外，根据转向灯的开启/关闭状态也同样能够掌握车辆的前进方向的变化。基于转向灯有无点亮动作或转向灯动作声等，来对转向灯的开启/关闭状态进行检测。另外，在使用GPS信号来获取车辆的前进方向、并且过去的一定期间的前进方向与当前的前进方向之间的差值在一定值以上时，判断为车辆的前进方向有较大的变化，从而停止与声音识别相关的处理。

另外，也可以利用已知的白线检测法，根据在车道变更等时所产生的、道路上的白线的延伸方向与车辆的前进方向之间的差异，来掌握车辆的前进方向的变化，或者利用进入已知的路口的检测方法来判断车辆进入路口，从而掌握车辆的前进方向的变化。此外，还可以参照地图信息等来判断进入路口。地图信息可以存储在设置于声音识别装置100内的存储区域（未图示），也可以从外部装置获取。另外，也可以将上述的方向盘的旋转角度、方向盘的旋转速度、转向灯的开启/关闭状态、车辆的前进方向的变化以及车辆进入路口的信号进行组合，来使控制部9对车辆的前进方向的变化进行判断。

如上所述，根据本实施方式3，包括：控制部9，该控制部9基于由车辆状态检测部7检测出的车辆状态，来判断是否处于用户应当专心驾驶的状况，并输出停止声音识别的指示；以及声音识别停止处理部12，该声音识别停止处理部12基于从控制部9所输出的停止声音识别的指示来输出停止信号，因此，能根据用户的驾驶状况来停止声音识别处理。由此，能够进行确保用户安全驾驶的声音识别处理。

此外，在上述实施方式3中示出了根据车辆状态来停止声音识别的开始的结构，但也可以采用以下结构：即，即使在麦克风1、声音处理部2、声响分析部3以及声响数据匹配部5中正在进行声音识别处理，也能够基于车辆状态来停止声音识别处理。

此外，在上述实施方式3中，示出了车辆状态检测部7获取车辆状态的结构，但也可以对车辆状态检测部7设置视频分析单元（未图示），从而使该视频分析单元对由设置于外部的摄像头等所获取到的视频进行分析，计算出经分析后的视频的变化率，当视频的变化率在阈值以上的情况下，判断为车辆的前进方向会发生较大的变化。另外，也可以采用以下结构：即，在所分析的视频中出现了特定的标识（特定的图像）时，判断为车辆会有较大的变化。

另外，如图9所示，也可以构成搭载有声音识别装置100的导航装置200。此外，图9中，示出了使用具有实施方式3所示结构的声音识别装置100的框图，但也可以使用实施方式1及实施方式2中示出的声音识别装置100来构成导航装置200。

导航装置200包括声音识别装置100，并且还包括：位置信息获取部21，该位置信息获取部21获取本车的当前位置，以起到导航功能；地图数据存储部22，该地图数据存储部22存储地图数据；路径引导部23，该路径引导部23使用当前位置及地图数据来进行路径搜索，以生成路径引导信息；以及输出部24，该输出部24显示所生成的路径引导信息，或者利用声音将该路径引导信息提示给用户。

在用户对目的地或经由地进行声音输入的情况下，声音识别装置100使麦克风1获取该声音输入以作为说话声，并通过上述实施方式1至实施方式3中示出的任意一个声音识别处理来进行声音识别，并将声音识别结果输出至路径引导部23。路径引导部23基于所输入的声音识别结果，进一步利用从位置信息获取部21所输入的本车位置信息以及存储在地图数据存储部22中的地图数据来进行路径搜索，并从输出部24输出路径引导信息。

另外，也可以采用以下结构：即，在将声音识别装置100搭载到导航装置200的情况下，从位置信息获取部21中获取当前位置信息，并对车辆的前进方向、进入路口等的车辆状态进行检测。同样地，也可以采用以下结构：即，参照存储在地图数据存储部22中的地图数据，判断本车进入路口。

由此，通过将声音识别装置100搭载到导航装置上，从而能够利用由与车辆的运行状态相适应的声音识别处理而得到的声音识别结果，来进行路径引导，从而能够提供一种帮助用户安全驾驶的导航装置。另外，还能够利用识别性能较高的识别结果来进行路径搜索。

此外，本申请发明可以在该发明的范围内对各实施方式进行自由组合，或对各实施方式的任意构成要素进行变形，或在各实施方式中省略任意的构成要素。

工业上的实用性

本发明所涉及的声音识别装置能够用于提高移动体内的声音识别处理的识别精度，并且还能用于帮助用户安全驾驶。

标号说明

1麦克风

2声音处理部

3声响分析部

4识别词典保存部

5声响数据匹配部

6增益设定部

7车辆状态检测部

8识别参数保存部

9控制部

10识别参数设定部

11音频输出检测部

12声音识别停止处理部

7a,11a存储部

21位置信息获取部

22地图数据存储部

23路径引导部

24输出部

100声音识别装置

200导航装置

Claims

1.一种声音识别装置，包括：

集音部，该集音部获取所输入的声音；

声音处理部，该声音处理部对由所述集音部获取到的声音进行数字信号处理；

声响分析部，该声响分析部对经所述声音处理部处理后的声音信号进行声响分析，并将声响特征转换成以时间序列表示的声响特征量；

识别词典，该识别词典记载有经所述声响分析部转换后的声响特征量与识别词汇之间的对应关系；以及

声响对照部，该声响对照部将所述声响特征量与所述识别词典进行对照，以识别出输入至所述集音部中的声音，

所述声音识别装置的特征在于，包括：

车辆状态检测部，该车辆状态检测部对搭载所述声音识别装置的车辆的车辆状态进行检测；

音频输出检测部，该音频输出检测部对从音频装置输出的声音信号的音量进行检测，所述音频装置设置在搭载有所述声音识别装置的车辆内；

增益设定部，该增益设定部对所述集音部的声音获取增益进行设定；

识别参数设定部，该识别参数设定部对所述声响对照部识别被输入至所述集音部中的声音时的识别参数进行设定；以及

控制部，该控制部在由所述车辆状态检测部所检测出的车辆状态或由所述音频输出检测部所检测出的声音信号的音量从接收到指示开始声音识别处理的操作输入的时刻起持续了倒退规定时间的期间而满足规定条件的情况下，指示所述识别参数设定部来改变识别参数。

2.一种声音识别装置，包括：

集音部，该集音部获取所输入的声音；

所述声音识别装置的特征在于，包括：

识别参数设定部，该识别参数设定部对由所述声响对照部识别输入至所述集音部中的声音时的识别参数进行设定；

声音识别停止处理部，该声音识别停止处理部在收到停止声音识别处理的指示时，使所述声音处理部、所述声响分析部以及所述声响对照部之中的至少一个的声音识别处理停止；以及

控制部，该控制部在由所述车辆状态检测部所检测出的车辆状态或由所述音频输出检测部所检测出的声音信号的音量从接收到指示开始声音识别处理的操作输入的时刻起持续了倒退规定时间的期间而满足规定条件的情况下，指示所述识别参数设定部来改变识别参数，或者指示所述声音识别停止处理部来停止声音识别处理。

3.如权利要求1或2所述的声音识别装置，其特征在于，

在车速的变化小于阈值、且从接收到所述操作输入的时刻起倒退规定时间的期间所述车速的变化持续小于阈值的情况下，所述控制部将所述识别参数恢复至规定值。

4.如权利要求2所述声音识别装置，其特征在于，

所述控制部在所述车辆状态不满足规定的条件、且从接收到声音识别开始处理的操作输入的时刻起倒退规定时间的期间持续地不满足所述规定条件的情况下，解除停止所述声音识别处理的指示。

5.如权利要求3所述声音识别装置，其特征在于，

在所述声音信号的音量小于阈值、且从接收到所述操作输入的时刻起倒退规定时间的期间所述声音信号的音量持续小于阈值的情况下，所述控制部使所述声音获取增益恢复成规定值。

6.如权利要求1或2所述的声音识别装置，其特征在于，

所述车辆状态检测部检测所述车辆的车速，

若所述控制部接收到指示声音识别处理开始的操作输入，则在从接收到该操作输入的时刻起倒退规定时间的期间所述车辆状态检测部所检测出的车速的变化在阈值以上的情况下，指示所述识别参数设定部来改变识别参数。

7.如权利要求1或2所述的声音识别装置，其特征在于，

所述控制部在车速的变化在阈值以上的情况下，将所述识别参数之中的、检测声音输入结束的超时时间设定成比规定值要长的值。

8.如权利要求1或2所述的声音识别装置，其特征在于，

在所述音频输出检测部所检测出的声音信号的音量在阈值以上的情况下，所述控制部对所述增益设定部发出指示，以将声音获取增益设定成比规定值要小的值。

9.如权利要求1或2所述的声音识别装置，其特征在于，

若所述控制部接收到指示声音识别处理开始的操作输入，则判断刚要接收该操作输入之前的声音信号的音量是否在阈值以上。

10.如权利要求2所述声音识别装置，其特征在于，

所述车辆状态检测部检测所述车辆的方向盘的旋转角度或旋转速度，

在由所述车辆状态检测部所获取到的方向盘的旋转角度或旋转速度在阈值以上的情况下，所述控制部指示停止声音识别处理。

11.如权利要求2所述声音识别装置，其特征在于，

所述车辆状态检测部获取所述车辆的转向灯的点亮信息，

在所述转向灯点亮的情况下，所述控制部指示停止声音识别处理。

12.如权利要求2所述声音识别装置，其特征在于，

所述车辆状态检测部获取所述车辆的前进方向信息，

所述控制部参照由所述车辆状态检测部所获取到的前进方向信息，在过去的车辆的前进方向与当前的车辆的前进方向之间的差异在阈值以上的情况下，指示停止声音识别处理。

13.如权利要求2所述声音识别装置，其特征在于，

所述车辆状态检测部获取所述车辆的前进方向信息以及道路上的白线信息，

所述控制部参照由所述车辆状态检测部所获取到的前进方向信息以及白线信息，在车辆的前进方向与白线的延伸方向之间的差异在阈值以上的情况下，指示停止声音识别处理。

14.如权利要求2所述声音识别装置，其特征在于，

所述控制部参照地图信息以及所述车辆的当前位置信息，在所述车辆正在进入路口的情况下，指示停止声音识别处理。

15.如权利要求2所述声音识别装置，其特征在于，

所述控制部在对所述声音识别停止处理部指示停止声音识别处理的情况下，使指示声音识别开始的操作输入的接收动作无效。

16.如权利要求15所述声音识别装置，其特征在于，

所述声音识别停止处理部通过显示或声音来通知所述控制部使指示声音识别开始的操作输入的接收动作无效的意思。

17.一种导航装置，其特征在于，

所述导航装置搭载有如权利要求1或2所述的声音识别装置，并且还包括：

位置信息获取部，该位置信息获取部获取所述车辆的当前位置；

地图数据存储部，该地图数据存储部存储地图数据；

路径引导部，该路径引导部基于在所述声音识别装置中经声音识别处理后的声音输入信息，并使用保存在所述地图数据存储部中的地图数据以及由所述位置信息获取部所获取到的所述车辆的当前位置，来引导所述车辆的路径；以及

输出部，该输出部对所述路径引导部的路径引导进行显示或声音输出。